JP2015203918A - Image processor, image processing method and program - Google Patents

Image processor, image processing method and program Download PDF

Info

Publication number
JP2015203918A
JP2015203918A JP2014082020A JP2014082020A JP2015203918A JP 2015203918 A JP2015203918 A JP 2015203918A JP 2014082020 A JP2014082020 A JP 2014082020A JP 2014082020 A JP2014082020 A JP 2014082020A JP 2015203918 A JP2015203918 A JP 2015203918A
Authority
JP
Japan
Prior art keywords
print
image
information
data
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014082020A
Other languages
Japanese (ja)
Inventor
秀一 竹中
Shuichi Takenaka
秀一 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014082020A priority Critical patent/JP2015203918A/en
Publication of JP2015203918A publication Critical patent/JP2015203918A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve the problem that the consumption of a holding area of raster image data becomes huge when a system is operated for a long term because a conventionally used source document data retrieval method is configured to hold the whole raster image data during printing.SOLUTION: Print layout information used during printing and a drawing object required to form the layout are divided into partial drawing objects to be held. During source document data retrieval, a print layout is applied to the partial drawing objects to reconstruct drawing contents of a printing time. During retrieving an image coincident with a scan image of a printed matter, retrieval processing which does not need a raster image of a printing time is achieved by making the reconstructed drawing contents a retrieval object.

Description

本発明は画像の検索を行う画像処理装置、画像処理方法、プログラムに関する。   The present invention relates to an image processing apparatus, an image processing method, and a program for searching for an image.

印刷物から印刷元の文書データを検索する技術がある。特許文献1では、印刷時に生成したラスター画像データとその特徴量を抽出して保持しておき、画像検索に使用している。検索対象となる印刷物がスキャンされるとスキャン画像の特徴量を抽出し、保持していたラスター画像データの特徴量との類似度を比較する。類似度が高いものを元文書データであると判定し、検索結果を出している。印刷時のラスター画像データを対象とした特徴量を画像検索に用いる為、印刷用に特化したレイアウトに変換して印刷した場合など、元文書データとレイアウトが異なる場合であっても、元文書データの検索を可能としている。   There is a technique for retrieving document data of a printing source from a printed material. In Patent Document 1, raster image data generated at the time of printing and its feature amount are extracted and stored, and used for image search. When the printed matter to be searched is scanned, the feature amount of the scanned image is extracted, and the similarity with the feature amount of the raster image data held is compared. A document having a high similarity is determined to be original document data, and a search result is output. Even if the layout is different from the original document data, such as when printing after converting to a layout specialized for printing, because the feature quantity for raster image data at the time of printing is used for image search, the original document The data can be searched.

特開2001−256256号公報JP 2001-256256 A

しかし、特許文献1の技術は、印刷ジョブを処理する度に、ラスター画像データとその特徴量を全て保持しておく必要がある為、印刷ジョブの増加に従い、必要となるラスター画像データとその特徴量の保持領域も増加する。片面印刷したものを両面で再印刷するとき、用紙サイズを変えて再印刷した場合など、印刷物の描画内容としてはほとんど変更がない場合でも、ラスター画像データとその特徴量を保持する。そのため、保持領域の消費に無駄が多く、長期的にシステムを保守することを想定するケースでは、あまり好ましい形態ではない。   However, since the technique of Patent Document 1 needs to retain all raster image data and its feature values every time a print job is processed, the required raster image data and its features as the number of print jobs increases. The amount holding area also increases. Raster image data and its feature values are retained even when there is almost no change in the drawing content of the printed matter, such as when reprinting one side printed on both sides when reprinting with different paper sizes. Therefore, the consumption of the holding area is wasteful, and this is not a preferable mode in the case where it is assumed that the system is maintained for a long time.

上記課題を解決する本発明の画像処理装置は、以下に示す構成を備える。   The image processing apparatus of the present invention that solves the above problems has the following configuration.

印刷レイアウト情報を生成する生成手段と、印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成する手段と、前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持手段と、入力された画像と類似する画像を検索する場合、前記保持手段によって保持された前記印刷情報データを検索する検索手段とを有する。   Generation means for generating print layout information, means for generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects, and storing the print layout information and the partial drawing object in association with each other as print information data And holding means for searching for the print information data held by the holding means when searching for an image similar to the input image.

本発明によれば、検索時に必要とする情報の保持領域を必要としない、効率的な文書データの検索が可能となる。   According to the present invention, it is possible to efficiently search for document data that does not require a storage area for information required for searching.

システムの構成図System configuration diagram 画像形成装置のハードウェアブロック図Hardware block diagram of image forming apparatus ファイルサーバーのハードウェアブロック図Hardware block diagram of file server 画像形成装置のソフトウェアモジュール図Software module diagram of image forming device ファイルサーバーのソフトウェアモジュール図Software module diagram of file server 元文書データ検索結果画面Original document data search result screen 文書データのPC上での表示画面Display screen of document data on PC PC表示からの印刷結果Print result from PC display 文書データのモバイル端末上での表示画面Display screen of document data on mobile terminal 文書データのデータ構造Data structure of document data ページ概念のない文書データの印刷結果の例Example of print result of document data without page concept ページ概念のない文書データへの印刷レイアウトの例Example of print layout for document data without page concept 印刷情報データテーブルPrint information data table 部分描画オブジェクトテーブルPartial drawing object table 部分描画オブジェクトの保持形態の例Example of retention mode for partially drawn objects 画像形成装置の印刷処理のフローチャートFlow chart of printing process of image forming apparatus ファイルサーバーの印刷情報データ保管処理のフローチャートFlow chart of print information data storage processing of file server 画像形成装置の印刷物の元文書データ検索処理のフローチャートFlowchart of original document data search processing of printed matter of image forming apparatus ファイルサーバーの元文書データ検索処理のフローチャートFlow chart of original document data search processing of file server

以下、本発明を実施するための最良の形態について図面を用いて説明する。   The best mode for carrying out the present invention will be described below with reference to the drawings.

[実施例1]
<システム構成図>
まず、図1を用いて本発明におけるシステムの構成の一例を説明する。本実施例に係るシステムは、ファイルサーバー101、画像形成装置(画像処理装置)102を有する。ファイルサーバー101は、複数の画像形成装置102とネットワーク103で接続されている。
[Example 1]
<System configuration diagram>
First, an example of a system configuration according to the present invention will be described with reference to FIG. The system according to this embodiment includes a file server 101 and an image forming apparatus (image processing apparatus) 102. The file server 101 is connected to a plurality of image forming apparatuses 102 via a network 103.

ファイルサーバー101は本実施例のシステムの適用対象となる文書データを管理しており、印刷時に画像形成装置102より送信される印刷情報データと文書データを関連付けして保持している。また、画像形成装置102から送信されてくる印刷物のスキャン画像から画像検索を行い、印刷元の元文書データを検索する機能を有している。画像検索時は過去に画像形成装置102より受信した印刷情報データを使用して検索処理を行う。画像検索処理の詳細については図19を使用して後ほど詳しく説明する。   The file server 101 manages document data to be applied to the system of the present embodiment, and associates and holds print information data and document data transmitted from the image forming apparatus 102 during printing. Further, it has a function of searching for an original document data of a printing source by performing an image search from a scanned image of a printed matter transmitted from the image forming apparatus 102. At the time of image search, search processing is performed using print information data received from the image forming apparatus 102 in the past. Details of the image search processing will be described later in detail with reference to FIG.

画像形成装置(画像処理装置)102は、スキャン、FAX、プリント、コピーなどの様々な機能を有する複合機、またはプリント機能のみを有するプリンタである。画像形成装置102は、印刷時に使用した印刷設定から印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトを印刷情報データとしてファイルサーバー101に送信する。印刷情報データの詳細については図13を用いて後ほど詳しく説明する。また画像形成装置102は、印刷物をスキャンしてファイルサーバー101に送信し、元文書データの検索要求を出すことができる。文書データを印刷するデバイスと、印刷物をスキャンして元文書データの検索要求を出すデバイスは、異なるデバイスからでも実行することが可能である。また、本実施例で述べる、ファイルサーバー101の機能を画像形成装置102のコントローラー内に持たせ、画像形成装置102内部のみで構成する形態をとってもよい。画像形成装置102内部のみで構成する形態をとった場合であっても、ネットワーク103を介して複数の画像形成装置102が接続され、同機能を実行させてもよい。   An image forming apparatus (image processing apparatus) 102 is a multifunction peripheral having various functions such as scanning, FAX, printing, copying, or a printer having only a printing function. The image forming apparatus 102 transmits print layout information from the print settings used at the time of printing and a partial drawing object included in document data necessary for configuring the layout to the file server 101 as print information data. Details of the print information data will be described later in detail with reference to FIG. Further, the image forming apparatus 102 can scan a printed matter and transmit it to the file server 101 to issue a search request for original document data. A device that prints document data and a device that scans a printed matter and issues a search request for original document data can be executed from different devices. In addition, the function of the file server 101 described in the present embodiment may be provided in the controller of the image forming apparatus 102 and configured only in the image forming apparatus 102. Even in a case where only the image forming apparatus 102 is configured, a plurality of image forming apparatuses 102 may be connected via the network 103 to execute the same function.

ネットワーク103はWANやLANで構成される無線、または有線のネットワークである。   The network 103 is a wireless or wired network composed of a WAN or a LAN.

情報処理装置104はユーザが使用するクライアントPC、または近年普及しつつあるモバイル端末である。情報処理装置104はネットワーク103を介して画像102へ印刷ジョブの投入、ファイルサーバー101へ文書データを送信することができる。情報処理装置104はネットワーク103を介して複数接続することができ、ファイルサーバー101へ送信された文書データは接続されている情報処理装置104の間で共有することができる。   The information processing apparatus 104 is a client PC used by a user or a mobile terminal that is becoming popular in recent years. The information processing apparatus 104 can input a print job to the image 102 and transmit document data to the file server 101 via the network 103. A plurality of information processing apparatuses 104 can be connected via the network 103, and document data transmitted to the file server 101 can be shared between the connected information processing apparatuses 104.

<画像形成装置のハードウェアブロック図>
図2は本実施例の画象形成装置102の構成を説明するハードウェアブロック図である。なお、図2では画象形成装置単体の構成のみを示しているが、この画像形成装置102には図1に示すファイルサーバー101や情報処理装置104などの装置がネットワーク103を通じて無線または有線で接続される。印刷ジョブは主にネットワーク103に接続されている情報処理装置104からネットワーク103やUSBに代表されるインターフェースを経由して画象形成装置102に転送される。
<Hardware block diagram of image forming apparatus>
FIG. 2 is a hardware block diagram illustrating the configuration of the image forming apparatus 102 of the present embodiment. FIG. 2 shows only the configuration of the image forming apparatus alone, but the image forming apparatus 102 is connected to devices such as the file server 101 and the information processing apparatus 104 shown in FIG. Is done. A print job is mainly transferred from the information processing apparatus 104 connected to the network 103 to the image forming apparatus 102 via an interface represented by the network 103 or USB.

図2において、200はコントローラユニットで、画像信号やデバイス情報の入出力を制御する。中央演算装置201は補助記憶装置203に記憶されたプログラムを主記憶装置202に読み出し、実行する。さらに、システムバス212に接続される各デバイスを中央演算装置201が統括的に制御する。また、中央演算装置201は並列処理を実現するために、ハードウェアとしてプロセッサを複数有するマルチプロセッサシステムを採用してもよい。また、マイクロプロセッサとして、複数のプロセッサコアを備えているものでもよい。ハイパースレッディングのようなプロセッサ内のレジスタやパイプラインの空き時間を有効利用して1つのプロセッサをあたかも複数のプロセッサであるかのように見せる技術が利用出来るものを用いても良い。ネットワーク103を介して接続させる情報処理装置104上に多くの処理を分離実行させる構成も可能である。主記憶装置202は、中央演算装置201の主メモリ、ワークメモリとして機能する。補助記憶装置203は大容量データを一時的あるいは長期的に保持する目的でも使用される。RIP204は中間プリントデータをラスタイメージに展開する専用ハードウェアである。RIP204は中央演算装置201により主記憶装置202上に生成された中間プリントデータを高速かつ、中央演算装置201の実行と並列に、処理するものである。Network205はネットワーク103に接続し、プリンタ外部とのプリントデータやデバイス情報の入出力を担う。あるいはNetwork205を介して主記憶装置203にプログラムをインストールすることもできる。スキャン装置I/F206はスキャン装置209とのインターフェース部で、スキャン装置209から送受信するスキャン画像を主記憶装置202または、補助記憶装置203に保存する役割を担う。操作部I/F207は操作部210とのインターフェース部で、操作部210に表示する画像データを操作部210に対して出力する。また、操作部210から本装置のユーザが入力した情報を、中央演算装置201に伝える役割をする。操作部210は、出力器として液晶パネルと音源を備え、入力器としてタッチパネルとハードキー、マイクを備えるものである。コントローラユニット200はデバイスI/F208を介して、プリンタエンジン211に接続される。デバイスI/F208は中央演算装置201の指示に基づき、画像信号の送出、デバイス動作指示、デバイス情報の受信を行う。プリンタエンジン211はコントローラユニット200からの画像信号を媒体上に出力する出力機であり、電子写真方式、インクジェット方式の何れでも構わない。また、システムバス212に対し、CDやDVDなどの可搬型ディスク記録媒体に対するディスクドライブ、フラッシュメモリなどの可搬型の不揮発性記録媒体に対するメモリリーダライタなどが接続されてもよい。また、本実施例の処理内容が記述されたプログラムが前記可搬型記憶媒体を経由して、補助記憶装置203に保存され、画像形成装置にインストールすることもできる。   In FIG. 2, a controller unit 200 controls input / output of image signals and device information. The central processing unit 201 reads the program stored in the auxiliary storage device 203 to the main storage device 202 and executes it. Further, the central processing unit 201 controls each device connected to the system bus 212 in an integrated manner. The central processing unit 201 may employ a multiprocessor system having a plurality of processors as hardware in order to realize parallel processing. Further, the microprocessor may include a plurality of processor cores. It is also possible to use a technique that can use a technique for making one processor appear as if it is a plurality of processors by effectively utilizing registers and pipeline idle time in the processor such as hyperthreading. A configuration in which many processes are separated and executed on the information processing apparatus 104 connected via the network 103 is also possible. The main storage device 202 functions as the main memory and work memory of the central processing unit 201. The auxiliary storage device 203 is also used for the purpose of holding large-capacity data temporarily or for a long time. The RIP 204 is dedicated hardware for expanding intermediate print data into a raster image. The RIP 204 processes the intermediate print data generated on the main storage device 202 by the central processing unit 201 at high speed and in parallel with the execution of the central processing unit 201. A network 205 is connected to the network 103 and performs input / output of print data and device information to / from the outside of the printer. Alternatively, the program can be installed in the main storage device 203 via the network 205. The scanning apparatus I / F 206 is an interface unit with the scanning apparatus 209, and plays a role of storing the scanned image transmitted / received from the scanning apparatus 209 in the main storage device 202 or the auxiliary storage device 203. An operation unit I / F 207 is an interface unit with the operation unit 210 and outputs image data to be displayed on the operation unit 210 to the operation unit 210. Also, it plays a role of transmitting information input by the user of the apparatus from the operation unit 210 to the central processing unit 201. The operation unit 210 includes a liquid crystal panel and a sound source as an output device, and includes a touch panel, hard keys, and a microphone as input devices. The controller unit 200 is connected to the printer engine 211 via the device I / F 208. The device I / F 208 transmits an image signal, instructs a device operation, and receives device information based on an instruction from the central processing unit 201. The printer engine 211 is an output device that outputs an image signal from the controller unit 200 onto a medium, and may be either an electrophotographic system or an inkjet system. Further, a disk drive for a portable disk recording medium such as a CD or a DVD, a memory reader / writer for a portable non-volatile recording medium such as a flash memory, or the like may be connected to the system bus 212. In addition, a program describing the processing contents of this embodiment can be stored in the auxiliary storage device 203 via the portable storage medium and installed in the image forming apparatus.

<ファイルサーバーのハードウェアブロック図>
図3は本実施例のファイルサーバー101の構成を説明するハードウェアブロック図である。ファイルサーバー101において、本実施例の処理内容が記述されたプログラムが、補助記憶装置304に保存され、ファイルサーバー101にインストールされる。中央演算装置301は補助記憶装置304に記憶されたプログラムを主記憶装置302に読み出し、実行する。さらに、システムバス305に接続される各デバイスを中央演算装置301が統括的に制御する。主記憶装置302は、中央演算装置301の主メモリ、ワークメモリとして機能する。Network303はネットワーク103に接続し、ファイルサーバー101外部との文書データや印刷情報データなどの情報の入出力を担う。また、Network303を介して補助記憶装置304にプログラムをインストールすることもできる。補助記憶装置304にはオペレーティングシステムと本実施例の処理内容が記述された制御プログラムの本体が格納される。本実施例における文書データ管理機能の対象となる文書データ、画像検索機能で用いられる印刷情報データもこの領域に保持される。システムバス305に対しては、CDやDVDなどの可搬型ディスク記録媒体に対するディスクドライブ、フラッシュメモリなどの可搬型の不揮発性記録媒体に対するメモリリーダライタなどが接続されてもよい。実施例の処理内容が記述されたプログラムが前記可搬型記憶媒体を経由して、補助記憶装置304に保存され、ファイルサーバー101にインストールすることもできる。
<Hardware block diagram of file server>
FIG. 3 is a hardware block diagram illustrating the configuration of the file server 101 of this embodiment. In the file server 101, a program describing the processing contents of this embodiment is stored in the auxiliary storage device 304 and installed in the file server 101. The central processing unit 301 reads the program stored in the auxiliary storage device 304 to the main storage device 302 and executes it. Further, the central processing unit 301 comprehensively controls each device connected to the system bus 305. The main storage device 302 functions as the main memory and work memory of the central processing unit 301. A network 303 is connected to the network 103 and inputs / outputs information such as document data and print information data from / to the outside of the file server 101. A program can also be installed in the auxiliary storage device 304 via the network 303. The auxiliary storage device 304 stores the operating system and the main body of the control program in which the processing contents of this embodiment are described. Document data that is a target of the document data management function in this embodiment and print information data used in the image search function are also held in this area. To the system bus 305, a disk drive for a portable disk recording medium such as a CD or a DVD, a memory reader / writer for a portable nonvolatile recording medium such as a flash memory, or the like may be connected. A program in which the processing content of the embodiment is described can be stored in the auxiliary storage device 304 via the portable storage medium and can be installed in the file server 101.

<画像形成装置のソフトウェアモジュール図>
図4は本実施例における画像形成装置102のソフトウェアモジュール構成図である。図4に記載した各ソフトウェアモジュールは、プログラムとして補助記憶装置203に格納され、主記憶装置202にロードされ中央演算装置201により実行されるものである。送信部401はNetwork205より後述する印刷情報データ生成部405により生成された印刷情報データ、スキャン画像の送信、印刷データや画像検索結果を受信する。データ解釈部402は制御部403を介して送受信部401より受信される印刷データを読み込み、ドキュメント内の描画情報を解釈する。このデータ解釈処理の結果として抽出した描画情報は制御部403を介してレンダラ404に送られ、レンダリング処理に使用される。制御部403は本実施例における印刷データの受信、データ解釈、画像のレンダリング、印刷情報データ生成、印刷物のスキャン、スキャン画像の送信、検索結果の受信までの各種処理の制御の全般を司る。レンダラ404はデータ解釈部402から送られてきた描画情報からRIP204を使用してビットマップイメージを生成する。生成されたビットマップイメージはデバイスI/F208を介してプリンタエンジンに送られ、印刷用紙に対する画像形成処理が実行される。印刷情報データ生成部405は印刷時の印刷情報を印刷情報データとして生成する。印刷情報データには、印刷時に使用した印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトから構成される。印刷情報データの詳細については図13を用いて後ほど詳しく説明する。
<Software module diagram of image forming apparatus>
FIG. 4 is a software module configuration diagram of the image forming apparatus 102 according to the present exemplary embodiment. Each software module described in FIG. 4 is stored in the auxiliary storage device 203 as a program, loaded into the main storage device 202, and executed by the central processing unit 201. A transmission unit 401 receives print information data, scan image transmission, print data, and image search results generated by a print information data generation unit 405 (to be described later) from the network 205. The data interpretation unit 402 reads print data received from the transmission / reception unit 401 via the control unit 403, and interprets drawing information in the document. The drawing information extracted as a result of the data interpretation process is sent to the renderer 404 via the control unit 403 and used for the rendering process. The control unit 403 is responsible for overall control of various processes from reception of print data, data interpretation, image rendering, print information data generation, printed matter scan, scan image transmission, and search result reception in this embodiment. The renderer 404 uses the RIP 204 from the drawing information sent from the data interpretation unit 402 to generate a bitmap image. The generated bitmap image is sent to the printer engine via the device I / F 208, and an image forming process is performed on the printing paper. A print information data generation unit 405 generates print information at the time of printing as print information data. The print information data includes print layout information used at the time of printing and a partial drawing object included in document data necessary for configuring the layout. Details of the print information data will be described later in detail with reference to FIG.

<ファイルサーバーのソフトウェアモジュール図>
図5は本実施例におけるファイルサーバー101のソフトウェアモジュール構成図である。図5に記載した各ソフトウェアモジュールは、図3におけるプログラムとして補助記憶装置304に格納され、主記憶装置302にロードされ中央演算装置301により実行されるものである。送受信部501はNetwork303より画像形成装置102から送信される印刷情報データやスキャン画像、報処理装置104から送信される文書データの受信、後述する画像検索処理の検索結果を画像形成装置101へ送信する。文書データ管理部502は、補助記憶装置304を用いて、本実施例のシステムの管理対象とする複数の文書データを保持している。制御部503は本実施例で行われるスキャン画像や印刷情報データ、文書データの受信、保存、画像検索処理、検索結果の送信の各種処理の制御の全般を司る。印刷情報データ管理部504は、補助記憶装置304を用いて、画像形成装置102から送信される印刷情報データを保持している。なお、この印刷情報データは印刷時に印刷対象となった文書データと関連付けられた形態で保持されている。関連付けされる文書データは文書データ管理部502に保持されているものが対象となる。詳細は図13を用いて後ほど詳しく説明する。文書データ検索部505は、制御部503を介して文書データ管理部502にて管理されている文書データの中から、文書データの検索を行う。送受信部501を介して画像形成装置102からスキャン画像を受信し、印刷情報データ管理部504で管理されている印刷情報データから印刷時の描画内容を再構築し、画像検索を行う。画像検索によりスキャン画像と特徴量が一致する文書データを抽出し、検索結果を画像形成装置102へ送信する。
<Software module diagram of file server>
FIG. 5 is a software module configuration diagram of the file server 101 in this embodiment. Each software module described in FIG. 5 is stored in the auxiliary storage device 304 as a program in FIG. 3, loaded into the main storage device 302, and executed by the central processing unit 301. The transmission / reception unit 501 receives print information data and scan images transmitted from the image forming apparatus 102 from the network 303, receives document data transmitted from the report processing apparatus 104, and transmits a search result of an image search process described later to the image forming apparatus 101. . The document data management unit 502 uses the auxiliary storage device 304 to hold a plurality of document data to be managed by the system of this embodiment. The control unit 503 is responsible for overall control of various processes such as reception and storage of scanned images, print information data, and document data, image search processing, and search result transmission performed in this embodiment. The print information data management unit 504 holds print information data transmitted from the image forming apparatus 102 using the auxiliary storage device 304. Note that this print information data is held in a form associated with the document data to be printed at the time of printing. The associated document data is the one held in the document data management unit 502. Details will be described later in detail with reference to FIG. The document data search unit 505 searches for document data from the document data managed by the document data management unit 502 via the control unit 503. A scan image is received from the image forming apparatus 102 via the transmission / reception unit 501, the drawing contents at the time of printing are reconstructed from the print information data managed by the print information data management unit 504, and an image search is performed. Document data whose feature amount matches the scanned image is extracted by image search, and the search result is transmitted to the image forming apparatus 102.

<元文書データ検索結果画面>
図6は画像形成装置102の操作部210に表示される。印刷物のスキャン画像から元文書データを検索実行した結果を表示している画面である。ファイルサーバー101から文書データの検索処理結果を、画像形成装置102が受信すると、この画面が表示される。
<Original document data search result screen>
FIG. 6 is displayed on the operation unit 210 of the image forming apparatus 102. It is a screen displaying the result of searching and executing original document data from a scanned image of a printed matter. When the image forming apparatus 102 receives a search result of document data from the file server 101, this screen is displayed.

図6(A)は元文書データの検索結果として、該当する文書データが検出された場合の検索結果画面を示している。ポップアップ601には、ファイル名フォーム602、印刷レイアウト設定フォーム603、印刷ボタン604、詳細設定ボタン605、Cancelボタン606が含まれる。ファイル名フォーム602には、検出された文書データのファイル名が表示される。本実施例では、スキャン画像と文書データとの類似度が最も高い文書データを1ファイル選択し、検索結果として表示するとしているが、類似度が近いものから一覧で表示する形態をとるとしてもよい。印刷レイアウト設定フォーム603は検出された文書データからスキャンされた印刷物に印刷した時の印刷レイアウト設定が表示される。印刷レイアウトに関係する印刷設定は様々なものがあるが、本実施例では印刷レイアウト情報に任意の名前をつけることができ、その印刷レイアウト情報の名前を表示するとしている。ここで言う、印刷レイアウト情報の詳細については図12を用いて後ほど詳しく説明する。印刷ボタン604は、検出された文書データを再度印刷する場合に選択するボタンである。詳細選択ボタン605は、より詳細な印刷設定の確認と変更が可能な画面へ遷移する場合に選択するボタンである。スキャンした印刷物がどのような印刷設定で出力されたのか確認したい場合や、印刷ボタン604を選択して再印刷する際に特定の印刷設定だけを変更したい場合に選択する。Cancelボタン606は元文書データの検索結果を確認し、特に何も処理をしないで終了したい時に選択するボタンである。   FIG. 6A shows a search result screen when corresponding document data is detected as a search result of the original document data. The pop-up 601 includes a file name form 602, a print layout setting form 603, a print button 604, a detail setting button 605, and a Cancel button 606. The file name form 602 displays the file name of the detected document data. In this embodiment, the document data having the highest similarity between the scanned image and the document data is selected as one file and displayed as a search result. . A print layout setting form 603 displays a print layout setting when printing is performed on a printed matter scanned from the detected document data. Although there are various print settings related to the print layout, in this embodiment, an arbitrary name can be assigned to the print layout information, and the name of the print layout information is displayed. Details of the print layout information described here will be described later in detail with reference to FIG. A print button 604 is a button that is selected when the detected document data is printed again. The detail selection button 605 is a button that is selected when a transition is made to a screen where more detailed print settings can be confirmed and changed. This is selected when it is desired to confirm what print settings the scanned printed material is output, or when only specific print settings are to be changed when the print button 604 is selected and reprinting is performed. The Cancel button 606 is a button that is used to confirm the search result of the original document data and to finish without performing any particular processing.

図6(B)は元文書データの検索結果として、該当する文書データが検出されなかった場合に表示される検索結果画面を示している。ポップアップ701には検索結果として該当する文書データが見つからなかったことを通知する文言とともに、OKボタン702が含まれる。OKボタン702が選択されるとポップアップ701は閉じられ、通常のジョブ待機画面に移行する。   FIG. 6B shows a search result screen displayed when the corresponding document data is not detected as the search result of the original document data. The pop-up 701 includes an OK button 702 together with a word that notifies that the corresponding document data is not found as a search result. When the OK button 702 is selected, the pop-up 701 is closed and the normal job standby screen is displayed.

<文書データのPC上での表示画面>
図7は本実施例が対象としている文書データをPC上で表示したときの表示画面を示している。本実施例では、多くのWebサイトなどで使用されているHTMLとCSSを用いたドキュメント形式から構成される文書データを対象とする。このドキュメント形式では、HTMLには文書データの基本構造とコンテンツ要素の情報のみをもたせ、CSSではHTMLで定義された情報をどのようにレイアウトして表示するかが定義される。
<Display screen of document data on PC>
FIG. 7 shows a display screen when the document data targeted by this embodiment is displayed on the PC. In the present embodiment, document data composed of a document format using HTML and CSS used in many websites is targeted. In this document format, HTML has only the basic structure of document data and information on content elements, and CSS defines how information defined in HTML is laid out and displayed.

図7(A)および(B)において、コンテンツフォーム801、802は、これらHTMLで定義されたコンテンツ要素を表示しており、ユーザのスクロール操作により、表示内容が遷移する。コンテンツフォーム801、802以外の領域は、ユーザのスクロール操作と関係なく、表示内容は遷移しない。図7(A)の状態からロールダウンすると、図7(B)へ遷移する。図7(B)の状態からロールアップすると、図7(A)へ遷移する。   7A and 7B, the content forms 801 and 802 display content elements defined in HTML, and the display contents are changed by the user's scrolling operation. In areas other than the content forms 801 and 802, the display content does not change regardless of the user's scroll operation. When rolling down from the state of FIG. 7A, the state transitions to FIG. When rolling up from the state of FIG. 7B, the state transitions to FIG.

<PC表示からの印刷結果>
図8は本実施例が対象としている文書データをPCから印刷指示したときの印刷結果の一例を示している。本実施例が対象としているHTMLとCSSを用いたドキュメント形式の文書データは、一般的に印刷時にPC上で表示している表示内容に応じて、印刷結果は異なるものになる。これは、HTMLとCSSを用いたドキュメント形式にはページの概念が無く、各ページで固定に描画結果を指定することができないためである。ページ概念の無いドキュメントをどのように印刷物の物理座標にレイアウトしていくかは、それぞれの画像形成装置102のプリンタドライバのアルゴリズムに依存する。
<Print result from PC display>
FIG. 8 shows an example of the print result when the document data targeted by the present embodiment is instructed from the PC. Document data in the document format using HTML and CSS targeted by this embodiment generally has different print results depending on the display contents displayed on the PC at the time of printing. This is because the document format using HTML and CSS does not have the concept of a page, and the rendering result cannot be specified fixedly on each page. How a document without a page concept is laid out in physical coordinates of a printed matter depends on the algorithm of the printer driver of each image forming apparatus 102.

図8の例では、PC上で表示される描画内容をPCのメインメモリ上に展開し、印刷指示時はこのメインメモリに展開されている描画内容をそのまま印刷するようにレイアウト処理した場合の例を示している。図8(A)は、図7(A)の状態で印刷指示したときに印字される印刷結果であり、印字領域901には図7(A)のコンテンツフォーム801の描画内容が印字される。図8(B)は、図7(B)の状態で印刷指示したときに印字される印刷結果であり、こちらも印字領域902には図7(B)のコンテンツフォーム802の描画内容が印字される。PC上でコンテンツフォーム801、802に何が描画されているかによって、印字領域901、902が切り替わる。HTMLでコンテンツ要素として描画オブジェクトが定義されていても、PC上で表示されていない場合は、描画オブジェクト対象外とされ、印字されない。   In the example of FIG. 8, the drawing contents displayed on the PC are expanded on the main memory of the PC, and the layout processing is performed so that the drawing contents expanded on the main memory are printed as they are when a print instruction is issued. Is shown. FIG. 8A shows a print result that is printed when a print instruction is given in the state of FIG. 7A, and the drawing content of the content form 801 of FIG. FIG. 8B shows a print result printed when a print instruction is given in the state of FIG. 7B. The drawing content of the content form 802 of FIG. 7B is also printed in the print area 902. The The print areas 901 and 902 are switched depending on what is drawn on the content forms 801 and 802 on the PC. Even if a drawing object is defined as a content element in HTML, if it is not displayed on the PC, it is excluded from the drawing object and is not printed.

近年ではこれらページ概念のないドキュメント形式で、タブレットや多機能携帯電話(スマートフォン)などのモバイル端末の表示環境にも対応したWebサイトが増加している。これらのWebサイトでは、PC用、モバイル端末用でそれぞれ定義した複数CSSを用意し、表示端末に応じて選択的にCSSを切り替えて使用することで、表示端末に最適なレイアウト表示を実現している。   In recent years, an increasing number of websites are compatible with the display environment of mobile terminals such as tablets and multi-function mobile phones (smartphones) in a document format without these page concepts. In these websites, multiple CSSs defined for PC and mobile terminals are prepared, and the CSS is selectively switched according to the display terminal, thereby realizing the optimal layout display for the display terminal. Yes.

<文書データのモバイル端末上での表示画面>
図9はこれらモバイル端末の表示環境に対応したHTMLとCSSを用いた文書データをモバイル端末上で表示したときの表示画面を示している。モバイル端末は表示領域がPCよりも狭いため、縦長のレイアウトになり、ユーザのスクロール操作により全体の描画内容が遷移する。図9(A)の状態からロールダウンすると、図9(B)、図9(C)へと描画内容が遷移する。また、図9(C)の状態からロールアップすると、図9(B)、図9(A)へと描画内容が遷移する。全体としては図9(D)に示すような縦長の描画内容をスクロール表示している形になる。
<Display screen of document data on mobile terminal>
FIG. 9 shows a display screen when document data using HTML and CSS corresponding to the display environment of these mobile terminals is displayed on the mobile terminal. Since the display area of the mobile terminal is narrower than that of the PC, the mobile terminal has a vertically long layout, and the entire drawing content is changed by the user's scroll operation. When rolling down from the state of FIG. 9A, the drawing contents transition to FIG. 9B and FIG. 9C. Further, when the roll-up is performed from the state of FIG. 9C, the drawing content transitions to FIGS. 9B and 9A. As a whole, the vertically drawn content as shown in FIG. 9D is scroll-displayed.

<文書データのデータ構造>
図10を用いて、これらPCとモバイル端末の表示環境に対応したHTMLとCSSを用いたドキュメント形式の文書データのデータ構造について、より詳細に説明する。
<Data structure of document data>
The data structure of document data in document format using HTML and CSS corresponding to the display environment of these PCs and mobile terminals will be described in more detail with reference to FIG.

図10(A)はHTMLデータ構造の概要を示している。基本構造領域1001には、Webサイトの基本構造をヘッダ情報として定義する。ページタイトルの他に、使用する文字コード、ページの概要、ブックマーク時の表示文字列、埋め込み広告の定義などが書かれる。また、PC、モバイル端末の表示環境によって、どのCSSを読み込むか切り替えの定義も、この基本構造領域1001に記述する。コンテンツ要素1002、1003、1004には、それぞれWebサイトで表示するコンテンツ内容を定義する。ここには文字列やグラフィック、写真などの画像を定義する、またはユーザの操作に応じて表示内容を動的に切り替えるJavaScript(登録商標)を定義することができる。本実施例では、コンテンツ要素1002にはWebサイトのタイトル情報が、コンテンツ要素1003にはWebサイトのメニュー情報が、コンテンツ要素1004には記事文章、画像情報が定義されているものとする。   FIG. 10A shows an outline of the HTML data structure. In the basic structure area 1001, the basic structure of the Web site is defined as header information. In addition to the page title, the character code to be used, the outline of the page, the display character string at the time of bookmarking, the definition of the embedded advertisement, etc. are written. In addition, the definition of switching which CSS is read according to the display environment of the PC or mobile terminal is also described in this basic structure area 1001. The content elements 1002, 1003, and 1004 define content contents to be displayed on the Web site, respectively. Here, it is possible to define an image such as a character string, a graphic, or a photograph, or JavaScript (registered trademark) that dynamically switches display contents in accordance with a user operation. In this embodiment, it is assumed that the content element 1002 defines Web site title information, the content element 1003 defines Web site menu information, and the content element 1004 defines article text and image information.

図10(B)はPC用のCSSのデータ構造の概要を示している。CSSはHTMLで定義された基本構造とコンテンツ要素の情報をどのようにレイアウトするかが定義される。図10(B)には、コンテンツ領域1101、1102、1103、1104が定義され、それぞれの領域で個別にレイアウトを定義することができる。例えば表示領域の幅と高さ、座標値、背景色やフォントサイズ、ユーザ操作に応じた表示内容の振る舞いなどが定義できる。コンテンツ領域にはそれぞれHTMLのコンテンツ要素が割り当てられ、定義されたレイアウトがコンテンツ領域毎に適用される。図7の例に当てはめると、コンテンツ領域1101にはWebサイトのタイトル情報であるコンテンツ要素1002が、コンテンツ領域1102にはWebサイトのメニュー情報であるコンテンツ要素1103が割り当てられる。コンテンツ領域1103には記事文章、画像情報であるコンテンツ要素1004が、コンテンツ領域1104には埋め込み広告情報が基本構造領域1001から割り当てられる。   FIG. 10B shows an outline of the CSS data structure for PC. CSS defines how to lay out the basic structure and content element information defined in HTML. In FIG. 10B, content areas 1101, 1102, 1103, and 1104 are defined, and a layout can be individually defined in each area. For example, the width and height of the display area, coordinate values, background color and font size, behavior of display contents according to user operations, and the like can be defined. An HTML content element is assigned to each content area, and a defined layout is applied to each content area. In the example of FIG. 7, a content element 1002 that is website title information is assigned to the content area 1101, and a content element 1103 that is website menu information is assigned to the content area 1102. Content elements 1004 that are article text and image information are assigned to the content area 1103, and embedded advertisement information is assigned to the content area 1104 from the basic structure area 1001.

図10(C)はモバイル端末用のCSSのデータ構造の概要を示している。こちらも同様にコンテンツ領域1201、1202、1203、1204が定義され、それぞれの領域で個別にレイアウトを定義されている。こちらもHTMLで定義されている基本構造とコンテンツ要素の情報をどのようにレイアウトし、モバイル端末の表示環境に適した表示を実現するかがCSSに定義されている。図9の例に当てはめると、コンテンツ領域1201にはWebサイトのタイトル情報であるコンテンツ要素1002が、コンテンツ要素1202にWebサイトのメニュー情報であるコンテンツ要素1003が割り当てられている。コンテンツ領域1203には記事文書、画像情報であるコンテンツ要素1004が、コンテンツ領域1204には埋め込み広告情報が基本構造1001から割り当てられる。   FIG. 10C shows an outline of the CSS data structure for the mobile terminal. Similarly, content areas 1201, 1202, 1203, and 1204 are defined, and a layout is individually defined in each area. Also here, CSS defines how to lay out the basic structure and content element information defined in HTML and realize display suitable for the display environment of the mobile terminal. In the example of FIG. 9, a content element 1002 that is Web site title information is assigned to the content area 1201, and a content element 1003 that is Web site menu information is assigned to the content element 1202. Content elements 1004 that are article documents and image information are assigned to the content area 1203, and embedded advertisement information is assigned to the content area 1204 from the basic structure 1001.

PCとモバイル端末の表示環境に対応したHTMLとCSSを用いたドキュメント形式では、図10(B)、(C)で説明したCSSをそれぞれ、文書データを読み込む段階で表示環境に応じて切り替えてレイアウトを変えている。   In the document format using HTML and CSS corresponding to the display environment of the PC and mobile terminal, the CSS described in FIGS. 10B and 10C is switched according to the display environment at the stage of reading the document data. Is changing.

<ページ概念のない文書データへの特殊な印刷レイアウト>
図7から図10を用いて説明した、Webサイトで使用されるHTMLとCSSを用いたドキュメント形式は、前述の通りページ概念がないため、印刷する場合は印刷物の物理座標へレイアウトするための独自のレイアウトアルゴリズムが適用される。この独自のレイアウトアルゴリズムについては様々なものが検討・開発されており、図11、図12にはその一例を示している。
<Special print layout for document data without page concept>
As described above, the document format using HTML and CSS used on the website described with reference to FIGS. 7 to 10 does not have a page concept. Therefore, when printing, it is unique for laying out the physical coordinates of the printed matter. The layout algorithm is applied. Various kinds of unique layout algorithms have been studied and developed, and examples thereof are shown in FIGS.

図11(A)は図9および図10(C)で説明したモバイル端末用のレイアウトを用いたレイアウトアルゴリズムを適用して印刷した時の印刷結果を示している。ここでは、モバイル端末の表示環境用にCSSで定義された縦長の描画内容を印刷物の縦幅の長さで短冊状に区切り、横に並べてレイアウトしている。このレイアウト構造は図12(A)に示す印刷レイアウト情報に定義されており、本実施例ではモバイル端末レイアウトと名前を付ける。コンテンツ領域1301にはWebページのタイトル情報であるコンテンツ要素1002の描画内容が印字される。コンテンツ領域1302にはWebページのメニュー情報であるコンテンツ要素1003の描画内容が印字される。コンテンツ領域1303には記事文書、画像情報であるコンテンツ要素1004の描画内容が印字される。コンテンツ領域1304には基本構造1001で定義されている埋め込み広告情報の描画内容が印字される。このレイアウトでは縦幅の描画内容を1枚の印刷物に収めて印刷するため、印刷ページ数が少なく、モバイル端末と描画内容が同じで、情報も集約した印刷結果を得ることができる。   FIG. 11A shows a printing result when printing is performed by applying the layout algorithm using the mobile terminal layout described in FIGS. 9 and 10C. Here, the vertically drawn content defined by CSS for the display environment of the mobile terminal is divided into strips by the length of the vertical width of the printed matter and arranged horizontally. This layout structure is defined in the print layout information shown in FIG. 12A. In this embodiment, the layout structure is named mobile terminal layout. In the content area 1301, the drawing content of the content element 1002 that is title information of the Web page is printed. In the content area 1302, the drawing content of the content element 1003, which is menu information of the Web page, is printed. In the content area 1303, the drawing content of the content element 1004 which is an article document and image information is printed. In the content area 1304, the contents of the embedded advertisement information defined in the basic structure 1001 are printed. In this layout, the drawing content of the vertical width is printed in a single printed matter, so that the number of print pages is small, the drawing content is the same as that of the mobile terminal, and a print result in which information is collected can be obtained.

図11(B)は図8および図9(A)(B)で説明したPC用のレイアウトに少し手を加えたレイアウトアルゴリズムを適用した時の印刷結果の例を示している。ここでは、HTMLで定義されている基本構造、コンテンツ要素の情報から、描画オブジェクトを全て1枚の印刷物に印字できるようにレイアウトを組み替える。このレイアウト構造は図12(B)に示す印刷レイアウト情報に定義されており、本実施例では集約PCレイアウトと名前を付ける。コンテンツ領域1401にはWebサイトのタイトル情報であるコンテンツ要素1002の描画内容が印字される。コンテンツ領域1402にはWebサイトのメニュー情報であるコンテンツ要素1003の描画内容が印字される。コンテンツ領域1403には記事文書、画像情報であるコンテンツ要素1004の描画内容が印字される。コンテンツ領域1404には基本構造1001で定義されている埋め込み広告情報の描画内容が印字される。このレイアウトでは図7に示されるPC用CSSではコンテンツフィールド801をスクロール操作して表示していた、記事文書、画像情報を、レイアウトを変更して一枚の印刷物に集約して印刷できるようにしたものである。PCの表示とは異なる印刷結果となってしまうが、HTMLで定義されているコンテンツ要素全ての情報を一枚の印刷物にまとめることができる。   FIG. 11B shows an example of a printing result when a layout algorithm that is a little modified to the PC layout described in FIGS. 8 and 9A and 9B is applied. Here, the layout is rearranged so that all the drawing objects can be printed on one printed matter from the basic structure and content element information defined in HTML. This layout structure is defined in the print layout information shown in FIG. 12B. In this embodiment, the layout structure is named as an aggregate PC layout. In the content area 1401, the drawing content of the content element 1002 that is the title information of the Web site is printed. In the content area 1402, the drawing content of the content element 1003 that is menu information of the Web site is printed. In the content area 1403, the drawing content of the content element 1004, which is an article document and image information, is printed. In the content area 1404, the drawing content of the embedded advertisement information defined in the basic structure 1001 is printed. In this layout, the content document 801 displayed by scrolling the content field 801 in the PC-use CSS shown in FIG. 7 can be printed on a single printed matter by changing the layout. Is. Although the print result is different from the display on the PC, information on all the content elements defined in HTML can be combined into a single printed matter.

図11(C)は図8および図9(A)(B)で説明したPC用のレイアウトに対して大幅に手を加えたレイアウトアルゴリズムを適用した時の印刷結果の例を示している。ここでは、HTMLで定義されている基本構造、コンテンツ要素の情報から、印刷時のトナー消費量が少ない描画オブジェクトのみを印字するようにレイアウトを組み替える。このレイアウト構造は図12(C)に示す印刷レイアウト情報に定義されており、本実施例では消費トナー削減レイアウトと名前を付ける。コンテンツ領域1501にはWebサイトのタイトル情報であるコンテンツ要素1002の描画内容が、消費トナーが少ない形態で印字される。コンテンツ領域1502にはWebサイトのメニュー情報であるコンテンツ要素1003の描画内容が、消費トナーが少ない形態で印字される。コンテンツ領域1503には記事文書、画像情報であるコンテンツ要素1004の描画内容が、消費トナーが少ない形態で印字される。このレイアウトでは印刷時の消費トナーを少なくするため、トナー使用量が多い描画オブジェクトに対しては、トナー使用量が少なくなるように間引きを行う。例えば、図12(C)のコンテンツ領域1501において、タイトル情報はトナー使用量を少なくするため、背景を描画せず、モノクロで印字する。コンテンツ領域1503においても、背景は描画せず、またトナー使用量の多い、写真などの画像描画オブジェクトは印刷せず、文字はベクターグラフィックのみを描画オブジェクトとして印字するようにしている。こちらもPCの表示とは異なる印刷結果となってしまうが、文書データの必要な情報のみを印刷したい時などに、トナー使用量を抑えた印刷結果を得ることができる。   FIG. 11C shows an example of a print result when a layout algorithm that has been greatly modified is applied to the PC layout described with reference to FIGS. 8 and 9A and 9B. Here, the layout is rearranged so as to print only drawing objects with a small amount of toner consumption during printing, based on the basic structure and content element information defined in HTML. This layout structure is defined in the print layout information shown in FIG. 12C, and is named “consumed toner reduction layout” in this embodiment. In the content area 1501, the drawing content of the content element 1002, which is the title information of the website, is printed in a form that consumes less toner. In the content area 1502, the drawing content of the content element 1003 that is the menu information of the website is printed in a form that consumes less toner. In the content area 1503, the drawing content of the content element 1004, which is an article document and image information, is printed in a form with less toner consumption. In this layout, in order to reduce toner consumption at the time of printing, thinning is performed for a drawing object having a large amount of toner usage so that the amount of toner usage is reduced. For example, in the content area 1501 in FIG. 12C, the title information is printed in monochrome without drawing the background in order to reduce the amount of toner used. Also in the content area 1503, the background is not drawn, and an image drawing object such as a photograph that consumes a large amount of toner is not printed, and only a vector graphic is printed as a drawing object. This also results in a printing result different from the display on the PC, but when only the necessary information of the document data is to be printed, a printing result with a reduced toner usage can be obtained.

<元文書データ検索処理の概要>
本発明は、印刷時に生成したラスター画像データとその特徴量を全印刷ジョブ分保持するのではなく、印刷時に使用した印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトを保持することにより、保持領域の消費量を抑える。つまり、ラスター画像をそのまま保持するのではなく、印刷レイアウトで使用された描画オブジェクトの単位で分割して部分ラスター画像、またはベクターデータ、フォント情報で部分描画オブジェクトとして保持する。ページ概念のない文書データには様々な印刷レイアウトを適用することが可能であるが、異なる印刷レイアウトであっても、使用する部分描画オブジェクトが同じものである場合は、該当する部分描画オブジェクトを使いまわすことができる。よって、この部分ラスター画像、ベクターデータ、フォント情報を異なる印刷レイアウト間で部分描画オブジェクトとして使いまわすことで、保存領域消費量の削減を図っている。以下、図13から図19を用いて、本発明の元文書データ検索処理の詳細を説明する。
<Outline of original document data search processing>
The present invention does not hold the raster image data generated at the time of printing and its feature values for all print jobs, but holds the print layout information used at the time of printing and the partial drawing objects necessary for configuring the layout. This reduces the consumption of the holding area. That is, the raster image is not held as it is, but is divided in units of drawing objects used in the print layout and is held as a partial drawing object by partial raster image, vector data, or font information. Various print layouts can be applied to document data without a page concept. However, if the same partial drawing object is used even if the print layout is different, the corresponding partial drawing object is used. Can be turned. Therefore, by using these partial raster images, vector data, and font information as partial drawing objects between different print layouts, the storage area consumption is reduced. Hereinafter, the details of the original document data search processing of the present invention will be described with reference to FIGS.

尚、本発明は印刷物の検索対象となる元文書データとしては、HTMLとCSSを用いたWebサイト上の文書データ以外に、一般的なオフィスドキュメントのドキュメント形式に対しても適用対象とすることが可能である。一般的なオフィスドキュメントはページ概念があり、レイアウト構造をデータ構成として保持している為、ページ概念の無い文書データのように印刷レイアウトを定義する必要がない。しかし、本実施例のように印刷レイアウト情報を別途生成し、そのレイアウトを構成するために必要な部分描画オブジェクト情報を保持しておけば、ページ概念のないドキュメント形式であっても適用することができる。   Note that the present invention may be applied to document formats of general office documents as well as document data on websites using HTML and CSS as original document data to be searched for printed matter. Is possible. Since a general office document has a page concept and holds a layout structure as a data structure, it is not necessary to define a print layout unlike document data without a page concept. However, as long as print layout information is separately generated and partial drawing object information necessary for configuring the layout is held as in the present embodiment, it can be applied to a document format without a page concept. it can.

<印刷情報データテーブル>
図13は印刷情報データテーブルを示している。印刷情報データテーブルは画像形成装置102が情報処理装置104から送信された印刷ジョブを印刷処理した際に印刷情報データ生成部405において生成し、ファイルサーバー101に送信する。ファイルサーバー101は送信された印刷情報データテーブルを受信し、印刷情報データ管理部504により補助記憶装置304に保持さる。印刷情報データテーブルは印刷ジョブID、印刷時に使用した文書データ情報とページ番号、印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクト情報を保持している。印刷ジョブIDはシステムによって割り当てられる、印刷ジョブを一意に識別するための識別子である。文書データ情報は、印刷ジョブ投入された元文書データの情報である。ページ番号は印刷対象のページの文書データにおける論理ページ番号である。部分描画オブジェクト情報は印刷レイアウト情報を適用した場合に構成要素となる部分描画オブジェクト情報である。印刷レイアウト情報は文書データを印刷した時の印刷レイアウト情報である。本実施例では、図8に例示したPCレイアウトと、図11に例示したモバイル端末レイアウト、集約PCレイアウト、消費トナー削減レイアウトが存在するものとしている。
<Print information data table>
FIG. 13 shows a print information data table. The print information data table is generated by the print information data generation unit 405 when the image forming apparatus 102 prints a print job transmitted from the information processing apparatus 104, and is transmitted to the file server 101. The file server 101 receives the transmitted print information data table and holds it in the auxiliary storage device 304 by the print information data management unit 504. The print information data table holds a print job ID, document data information and page number used at the time of printing, print layout information, and partial drawing object information included in the document data necessary for configuring the layout. The print job ID is an identifier assigned by the system for uniquely identifying the print job. The document data information is information on the original document data that has been submitted to the print job. The page number is a logical page number in the document data of the page to be printed. The partial drawing object information is partial drawing object information that is a component when the print layout information is applied. The print layout information is print layout information when document data is printed. In this embodiment, it is assumed that the PC layout illustrated in FIG. 8, the mobile terminal layout, the aggregate PC layout, and the consumed toner reduction layout illustrated in FIG. 11 exist.

<部分描画オブジェクトテーブル>
次に図14を用いて、部分描画オブジェクトテーブルの説明をする。部分描画オブジェクトテーブルは印刷情報データテーブルで保持されている印刷レイアウトにおいて、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトの情報を保持している。本発明は、印刷ジョブで生成したラスター画像をそのまま保持するのではなく、印刷レイアウトを構成する描画オブジェクトの単位で分割して部分ラスター画像、ベクターデータ、フォント情報で部分描画オブジェクトとして保持する。そして、画像検索時にこれら部分描画オブジェクトである部分ラスター画像、ベクターデータ、フォント情報に印刷レイアウトを適用することで、印刷時の描画内容を再構築する。異なる印刷レイアウト情報が使われている場合でも、そのレイアウトを構成するために必要に部分描画オブジェクトが同じであれば、その部分描画オブジェクトを使いまわして、描画内容を再構築する。よって、異なるレイアウト間で同じ部分描画オブジェクトを使用していても、重複して保持領域に保持しない。従って、部分描画オブジェクトテーブルは画像形成装置102が印刷ジョブを処理するタイミングで更新されるが、既にファイルサーバー101で保持されている部分描画オブジェクトは、部分描画オブジェクトテーブルに追加されない。新規に印刷ジョブで使用された部分描画オブジェクトのみを追加していく。
<Partial drawing object table>
Next, the partial drawing object table will be described with reference to FIG. The partial drawing object table holds information on partial drawing objects included in document data necessary for configuring the layout in the print layout held in the print information data table. In the present invention, a raster image generated by a print job is not held as it is, but is divided into units of drawing objects constituting a print layout and held as a partial drawing object with partial raster images, vector data, and font information. Then, the drawing content at the time of printing is reconstructed by applying the print layout to the partial raster image, vector data, and font information which are these partial drawing objects at the time of image search. Even when different print layout information is used, if the partial drawing objects are the same as necessary to configure the layout, the partial drawing objects are reused to reconstruct the drawing contents. Therefore, even if the same partial drawing object is used between different layouts, it is not redundantly held in the holding area. Accordingly, the partial drawing object table is updated at the timing when the image forming apparatus 102 processes the print job, but the partial drawing object already held in the file server 101 is not added to the partial drawing object table. Only the partial drawing objects newly used in the print job are added.

部分描画オブジェクトテーブルは描画オブジェクトID、描画オブジェクト属性、部分描画オブジェクト名の情報を持っている。描画オブジェクトIDはシステムにより割り振られる部分描画オブジェクトを一意に識別可能な識別子である。描画オブジェクト属性は、対象となる部分描画オブジェクトがテキスト文章か、ベクター形式のグラフィックか、写真などの画像データかの属性情報を持っている。本実施例では、テキスト文章であれば「Text」属性を、グラフィックであれば「Graphic」属性を、画像データであれば「Image」属性を持たせることとしている。部分描画オブジェクト名はシステムによって付けられる対象となる部分描画オブジェクトの名前である。本実施例ではオブジェクトの名前は部分描画オブジェクトの保持形式によって切り替えるものとしている。部分描画オブジェクトは保持形態として、部分ラスター画像形式、ベクターデータ形式、フォント形式を取ることができる。写真などの画像データは部分ラスター画像形式で、解像度は画像データ自体の解像度が出力解像度より低い場合は、画像データの解像度のままで、逆に出力解像度より高い場合は出力解像度に設定してレンダリングを行い、部分ラスター画像として保持する。グラフィックはベクターデータ形式で保持する。テキスト文章はフォント形式、部分ラスター画像形式どちらの形式で保持してもよいが、データサイズを小さくする場合は、フォント形式で持たせる方が望ましい。画像形成装置102に内蔵していないダウンロードフォントを使用した場合は部分ラスター画像形式で持たせる。   The partial drawing object table has information on drawing object IDs, drawing object attributes, and partial drawing object names. The drawing object ID is an identifier that can uniquely identify a partial drawing object allocated by the system. The drawing object attribute has attribute information indicating whether the target partial drawing object is a text sentence, a vector format graphic, or image data such as a photograph. In the present embodiment, a “Text” attribute is assigned to a text sentence, a “Graphic” attribute is assigned to a graphic, and an “Image” attribute is assigned to image data. The partial drawing object name is the name of the partial drawing object to be assigned by the system. In this embodiment, the name of the object is switched according to the retention format of the partial drawing object. A partial drawing object can take a partial raster image format, a vector data format, or a font format as a holding form. Image data such as photos is in a partial raster image format, and if the resolution of the image data itself is lower than the output resolution, the image data remains the same as the resolution of the image data. And hold as a partial raster image. Graphics are stored in vector data format. The text sentence may be held in either a font format or a partial raster image format. However, when the data size is to be reduced, it is desirable to have the text sentence in the font format. When a download font that is not built in the image forming apparatus 102 is used, it is provided in a partial raster image format.

<部分描画オブジェクトの保持形態>
図15は図7から図11で例示したWebサイトの文書データにおける、レイアウトを構成する部分描画オブジェクトである部分ラスター画像、ベクターデータ、フォント情報を示している。図15(A)は図14の部分描画オブジェクトテーブルにおいて、描画オブジェクト属性が「Image」である部分描画オブジェクトの部分ラスター画像を示している。図15(B)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Graphic」である部分描画オブジェクトのベクターデータを示している。ベクターデータであるため、部分ラスター画像よりもデータサイズが小さい。図15(C)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Text」であり、かつ部分描画オブジェクトの保持形式が部分ラスター画像形式であるものを示している。Bitmap−01_01とBitmap−01_02は図10(A)に示すHTMLのデータ構造で定義されているWebサイトのタイトル情報であるコンテンツ要素1002が対応している。同じコンテンツ要素1002が対応しているが、適用した印刷レイアウトが異なるため、生成される部分ラスター画像が異なるものとなっている。Bitmap−01_02は消費トナー削減レイアウトを適用した為、背景は描画せず、枠組みとテキストのみの部分ラスター画像となっている。図15(D)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Text」であり、かつ部分描画オブジェクトの保持形式がフォント形式であるものの保持形態の一例を示している。本実施例ではフォント形式の保持形態として、文字列と使用フォント名を指定して保持している。この図15(D)は図10(A)に示すHTMLのデータ構造で定義されているコンテンツ要素で記事文書をフォント形式で保持した場合を例示している。図15(D)は図15(C)と描画オブジェクト属性が同じ「Text」属性だが、図15(D)は画像形成装置102のコントローラーに内蔵しているフォントを使用しているため、フォント形式で保持している。描画内容を再構築する場合はフォント形式で指定しているフォントをコントローラー内蔵フォントから読み込むことで描画内容を再現できる。一方、図15(C)はWebサイトのタイトル部分であり、特別なフォントが使用されているため、コントローラー内蔵フォントにないフォントを使用している。よって、部分ベクター画像として保持し、描画内容再構築時に使用する。
<Retention form of partial drawing object>
FIG. 15 shows partial raster images, vector data, and font information, which are partial drawing objects constituting the layout, in the document data of the Web site exemplified in FIGS. FIG. 15A shows a partial raster image of a partial drawing object whose drawing object attribute is “Image” in the partial drawing object table of FIG. FIG. 15B shows vector data of a partial drawing object whose drawing object attribute is “Graphic” in the object table of FIG. Since it is vector data, the data size is smaller than that of the partial raster image. FIG. 15C shows the object table of FIG. 14 in which the drawing object attribute is “Text” and the holding format of the partial drawing object is the partial raster image format. Bitmap-01_01 and Bitmap-01_02 correspond to the content element 1002 which is the title information of the Web site defined by the HTML data structure shown in FIG. Although the same content element 1002 corresponds, since the applied print layout is different, the generated partial raster images are different. Since Bitmap-01_02 has applied the toner consumption reduction layout, the background is not drawn, and a partial raster image with only a frame and text is provided. FIG. 15D shows an example of a holding form in the object table of FIG. 14 where the drawing object attribute is “Text” and the holding form of the partial drawing object is a font form. In this embodiment, a character string and a font name to be used are designated and held as a font form holding form. FIG. 15D illustrates a case where an article document is held in a font format with content elements defined in the HTML data structure shown in FIG. FIG. 15D shows the “Text” attribute having the same drawing object attribute as FIG. 15C, but FIG. 15D uses the font built in the controller of the image forming apparatus 102, so the font format Is holding in. When reconstructing the drawing contents, the drawing contents can be reproduced by reading the font specified in the font format from the controller built-in font. On the other hand, FIG. 15C shows the title part of the Web site, and a special font is used, and therefore a font not included in the controller built-in font is used. Therefore, it is stored as a partial vector image and used when reconstructing the drawing content.

印刷物の元文書データ検索時には、これら図15(A)、(B)、(C)、(D)に示される部分描画オブジェクトを図12に示される印刷レイアウトそれぞれに適用させることで、文書データ印刷時の描画内容を再構築する。   When retrieving the original document data of the printed matter, the partial drawing objects shown in FIGS. 15A, 15B, 15C, and 15D are applied to the print layouts shown in FIG. Reconstruct the drawing contents of the time.

<画像形成装置の印刷処理のフロー>
次に図16を用いて、画像形成装置102における印刷処理を説明する。画像形成装置102は文書データの印刷時に、印刷物の元文書データ検索処理のために、印刷情報データを生成する。印刷情報データは、印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトにより構成される。部分描画オブジェクトは部分ラスター画像、ベクターデータ、フォント情報などの形態をとることができる。生成された印刷情報データはファイルサーバー101へ送信され、印刷情報データ管理部に格納される。図1のネットワーク102を介して非図示の情報処理装置から画像形成装置102へ印刷ジョブが投入されると、本処理が開始される。
<Flow of print processing of image forming apparatus>
Next, a printing process in the image forming apparatus 102 will be described with reference to FIG. When printing the document data, the image forming apparatus 102 generates print information data for the original document data search process of the printed matter. The print information data is composed of print layout information and partial drawing objects necessary for configuring the layout. The partial drawing object can take the form of a partial raster image, vector data, font information, and the like. The generated print information data is transmitted to the file server 101 and stored in the print information data management unit. When a print job is input from the information processing apparatus (not shown) to the image forming apparatus 102 via the network 102 in FIG. 1, this processing is started.

まず、S1001において、中央演算装置201は、ネットワーク103を介して情報処理装置104より印刷データを受信する。次に、S1002において、中央演算装置201は、ネットワーク103を介して情報処理装置104より印刷設定を受信する。印刷設定には図12に示される印刷レイアウトの指定も含まれる。   First, in step S <b> 1001, the central processing unit 201 receives print data from the information processing apparatus 104 via the network 103. In step S <b> 1002, the central processing unit 201 receives print settings from the information processing apparatus 104 via the network 103. The print setting includes designation of a print layout shown in FIG.

次に、S1003において、中央演算装置201は、印刷処理を実行する。次に、S1004において、中央演算装置201は、印刷時の印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトとして部分ラスター画像、ベクターデータ、フォント情報を生成し、印刷情報データとしてまとめる。   Next, in S1003, the central processing unit 201 executes print processing. In step S <b> 1004, the central processing unit 201 generates print raster information at the time of printing and partial raster images, vector data, and font information as partial drawing objects necessary for configuring the layout. To summarize.

次に、S1005において、中央演算装置201は、S1004において生成した印刷情報データをファイルサーバー101に送信する。以上の処理により、画像形成装置102における印刷処理が実施される。   In step S <b> 1005, the central processing unit 201 transmits the print information data generated in step S <b> 1004 to the file server 101. Through the above processing, the printing processing in the image forming apparatus 102 is performed.

<ファイルサーバーの印刷情報データ保管処理のフロー>
次に図17を用いて、ファイルサーバー101における印刷情報データ保管処理を説明する。ファイルサーバー101では、画像形成装置102から印刷情報データを受信すると、図13に示される印刷情報データテーブルと、部分描画オブジェクトテーブルを更新する。重複保持を避ける為、印刷情報データテーブルと部分描画オブジェクトテーブルは、内容が同一である場合は各テーブルに情報を追加しない。受信した印刷情報テーブルに含まれる印刷レイアウト情報と部分描画オブジェクトも、印刷情報データ管理部に保持されるが、こちらも重複するデータが既に存在する場合は保持しないようにする。図16のS1005において、図1のネットワーク102を介して画像形成装置102からファイルサーバー101へ印刷情報データが送信されると、本処理が開始される。
<Flow of print information data storage processing on file server>
Next, print information data storage processing in the file server 101 will be described with reference to FIG. When the print information data is received from the image forming apparatus 102, the file server 101 updates the print information data table and the partial drawing object table shown in FIG. In order to avoid duplication, the print information data table and the partial drawing object table do not add information to each table when the contents are the same. The print layout information and the partial drawing object included in the received print information table are also held in the print information data management unit. However, if duplicate data already exists, it is not held. In S1005 in FIG. 16, when print information data is transmitted from the image forming apparatus 102 to the file server 101 via the network 102 in FIG. 1, this processing is started.

まず、S2001において、中央演算装置301は、ネットワーク103を介して画像形成装置102より印刷情報データを受信する。次に、S2002において、中央演算装置301は、印刷情報データテーブル管理部504で保持している印刷情報データテーブルを参照する。   First, in S2001, the central processing unit 301 receives print information data from the image forming apparatus 102 via the network 103. In step S <b> 2002, the central processing unit 301 refers to the print information data table held in the print information data table management unit 504.

次に、S2003において、中央演算装置301は、S2001において受信した印刷情報データが印刷情報データテーブルに既に存在するか判定する。本発明では、長期にシステムを運用する際に、印刷情報データの保持領域を効率的に使用するため、保持領域に重複するデータが存在する場合は保存しない。よってここでは、受信した印刷情報データが既にシステムの保持領域に存在する情報であるかを判定し、印刷情報データをシステムに保存すべきかどうかを判定している。印刷情報データが印刷情報データテーブルに既に存在する場合は、処理を終了する。印刷情報データが印刷データテーブルに存在しない場合はS2004へ進む。   In step S2003, the central processing unit 301 determines whether the print information data received in step S2001 already exists in the print information data table. In the present invention, when the system is operated for a long period of time, the print information data holding area is efficiently used. Therefore, if there is overlapping data in the holding area, the print information data is not saved. Therefore, here, it is determined whether the received print information data is information that already exists in the holding area of the system, and it is determined whether the print information data should be stored in the system. If the print information data already exists in the print information data table, the process ends. If the print information data does not exist in the print data table, the process proceeds to S2004.

次に、S2004において、中央演算装置301は、印刷情報データに含まれる印刷レイアウト情報と部分描画オブジェクトを、補助記憶装置304へ保存する。また、同時に印刷情報データテーブルと部分描画オブジェクトデータテーブルも更新する。   Next, in S2004, the central processing unit 301 stores the print layout information and the partial drawing object included in the print information data in the auxiliary storage device 304. At the same time, the print information data table and the partial drawing object data table are updated.

以上の処理により、ファイルサーバー101における印刷情報データ保管処理が実施される。   Through the above process, the print information data storage process in the file server 101 is performed.

<画像形成装置の印刷物の元文書データ検索処理のフロー>
次に図18を用いて、画像形成装置102における印刷物の元文書データ検索処理を説明する。本実施例では画像形成装置102の元文書データ検索処理において、画像検索処理は画像形成装置102上では行わず、ファイルサーバー101上で行う。画像形成装置102は、印刷物をスキャンし、取得したスキャン画像をファイルサーバー101へ送信する。ファイルサーバー101でスキャン画像と一致する元文書データの画像検索処理が実行され、検索結果が画像形成装置102へ送信される。画像形成装置102はファイルサーバー101から送信される検索結果を受信し、操作部210へ表示する。図2に示す画像形成装置102のスキャン装置209を用いて、ユーザが印刷物をスキャン指示すると、本処理が開始される。
<Flow of Original Document Data Retrieval Process of Printed Material of Image Forming Apparatus>
Next, an original document data search process for a printed matter in the image forming apparatus 102 will be described with reference to FIG. In this embodiment, in the original document data search process of the image forming apparatus 102, the image search process is not performed on the image forming apparatus 102 but is performed on the file server 101. The image forming apparatus 102 scans the printed matter and transmits the acquired scanned image to the file server 101. The image search processing of the original document data that matches the scanned image is executed in the file server 101, and the search result is transmitted to the image forming apparatus 102. The image forming apparatus 102 receives the search result transmitted from the file server 101 and displays it on the operation unit 210. When the user instructs to scan the printed matter using the scanning device 209 of the image forming apparatus 102 shown in FIG. 2, this processing is started.

まず、S3001において、中央演算装置201は、スキャン装置209を用いて、印刷物のスキャン画像を取得する。次に、S3002において、中央演算装置201は、ファイルサーバー101へスキャン画像を送信する。スキャン画像送信後は、ファイルサーバー101から検索結果を受信するまで、待機状態となる。ファイルサーバー101から検索結果から送信されると、本処理を再開する。   First, in step S <b> 3001, the central processing unit 201 uses the scanning device 209 to obtain a scanned image of a printed matter. In step S <b> 3002, the central processing unit 201 transmits the scanned image to the file server 101. After the scan image is transmitted, the process waits until a search result is received from the file server 101. When it is transmitted from the search result from the file server 101, this processing is resumed.

次に、S3003において、中央演算装置201は、ファイルサーバー101から送信される検索結果を受信する。次に、S3004において、中央演算装置201は、受信した検索結果を操作部210に表示する。   In step S <b> 3003, the central processing unit 201 receives a search result transmitted from the file server 101. Next, in S3004, the central processing unit 201 displays the received search result on the operation unit 210.

以上の処理により、画像形成装置102における印刷物スキャン処理が実施される。   Through the above processing, the printed material scan processing in the image forming apparatus 102 is performed.

<ファイルサーバーの元文書データ検索処理のフロー>
次に図19を用いて、ファイルサーバー101における元文書データ検索処理を説明する。ファイルサーバー101における元文書データ検索処理は、まず画像形成装置102から送信されるスキャン画像を受信し、特徴量を抽出する。抽出した特徴量から、印刷時に設定された印刷レイアウトを判別する。描画オブジェクトの配置位置など、印刷レイアウトの特徴量にはそれぞれある程度の傾向がある。そのためスキャン画像からの印刷レイアウトの判別には、画像形成装置102から印刷可能な印刷レイアウトの特徴量の傾向と、スキャン画像の特徴量の傾向の類似度から判別する。スキャン画像の印刷レイアウトが判別されると、図13に示される印刷情報データテーブルから、該当する印刷レイアウト情報を持つ印刷情報データを抽出し、絞り込みを行う。そして、印刷情報データが持つ部分描画オブジェクト情報から、該当する部分描画オブジェクトを読み込み、印刷レイアウトを部分描画オブジェクトに適用することで、印刷時の描画内容を再構築する。描画内容の再構築結果に対して特徴量を算出し、スキャン画像の特徴量と比較する。一致した場合は該当する元文書データ情報を検査結果として画像形成装置102へ送信する。一致しない場合は、再度レイアウト絞り込み処理に戻り再検索を行う。元文書データ検索処理が繰り返し行われ、印刷情報データテーブルの全データに対して検索処理を行っても、スキャン画像の特徴量と一致するものが見つからない場合、該当データなしとして検索結果を画像形成装置102に送信する。印刷情報データから図18のS3002において、画像形成装置102からスキャン画像が送信されると、本処理が開始される。
<Flow of original document data search processing on file server>
Next, the original document data search process in the file server 101 will be described with reference to FIG. In the original document data search process in the file server 101, first, a scan image transmitted from the image forming apparatus 102 is received, and a feature amount is extracted. A print layout set at the time of printing is determined from the extracted feature amount. Each feature amount of the print layout, such as the arrangement position of the drawing object, has a certain tendency. For this reason, the print layout from the scanned image is determined based on the similarity between the print layout feature quantity printable from the image forming apparatus 102 and the scan image feature quantity trend. When the print layout of the scanned image is determined, print information data having the corresponding print layout information is extracted from the print information data table shown in FIG. 13 and narrowed down. Then, by reading the corresponding partial drawing object from the partial drawing object information included in the print information data and applying the print layout to the partial drawing object, the drawing contents at the time of printing are reconstructed. A feature amount is calculated for the reconstructed result of the drawing content and compared with the feature amount of the scanned image. If they match, the corresponding original document data information is transmitted to the image forming apparatus 102 as an inspection result. If they do not match, return to the layout narrowing process again and perform a search again. If the original document data search process is repeated, and all the data in the print information data table is searched, if no match is found with the scan image feature amount, the search result is imaged as no corresponding data. To device 102. When a scan image is transmitted from the image forming apparatus 102 in S3002 of FIG. 18 from the print information data, this processing is started.

まず、S4001において、中央演算装置301は、ネットワーク103を介して画像形成装置102よりスキャン画像を受信する。   In step S <b> 4001, the central processing unit 301 receives a scanned image from the image forming apparatus 102 via the network 103.

次に、S4002において、中央演算装置301は、S4001にて受信したスキャン画像から特徴量を抽出し、印刷時に適用された印刷レイアウトを判別する。本システムを長期に運用すると、印刷情報データテーブルが保持する情報量は増加する。印刷情報データテーブルが保持する全ての印刷情報データに対して検索処理を実施すると、運用期間に比例して印刷情報データが増加し、検索結果の算出時間も増加してしまう。そこで、ここではスキャン画像の特徴量の傾向を抽出し、画像形成装置102が印刷可能な印刷レイアウトで、特徴量の傾向の類似度が高いものを検出する。検索時は、この類似度が高い印刷レイアウトと同じ印刷レイアウト情報をもつ印刷情報データのみを検索対象とすることで、検索処理を効率化している。   In step S4002, the central processing unit 301 extracts feature amounts from the scanned image received in step S4001, and determines a print layout applied at the time of printing. When this system is operated for a long time, the amount of information held in the print information data table increases. If search processing is performed on all print information data held in the print information data table, the print information data increases in proportion to the operation period, and the search result calculation time also increases. Therefore, here, the tendency of the feature amount of the scanned image is extracted, and a print layout that can be printed by the image forming apparatus 102 is detected that has a high similarity in feature amount tendency. When searching, only the print information data having the same print layout information as the print layout having a high degree of similarity is set as a search target, so that the search process is made efficient.

次に、S4003において、中央演算装置301は、印刷情報データ管理部504で管理している印刷情報データテーブルを参照する。   In step S <b> 4003, the central processing unit 301 refers to the print information data table managed by the print information data management unit 504.

次に、S4004において、中央演算装置301は、参照している印刷情報データテーブルに、S4002で抽出した印刷レイアウト情報が含まれる印刷情報データが存在するか判定する。印刷情報データが存在する場合は、該当する印刷情報データを読み込み、S4005へ進む。印刷情報データが存在しない場合は、S4002へ戻り、処理を繰り返す。印刷情報データが存在する場合においては、該当する印刷情報データが複数ある場合は、該当印刷情報データ全てを読み込む。その場合S4005からS4008までの処理は、S4008において再構築した描画内容の特徴量がスキャン画像の特徴量と一致するまで、印刷情報データの数だけ繰り返される。   In step S <b> 4004, the central processing unit 301 determines whether print information data including the print layout information extracted in step S <b> 4002 exists in the reference print information data table. If the print information data exists, the corresponding print information data is read, and the process proceeds to S4005. If there is no print information data, the process returns to S4002 to repeat the process. When print information data exists, if there are a plurality of corresponding print information data, all the corresponding print information data is read. In this case, the processing from S4005 to S4008 is repeated by the number of print information data until the feature amount of the drawing content reconstructed in S4008 matches the feature amount of the scanned image.

次に、S4005において、中央演算装置301は、S4004で読み込んだS4002で抽出した印刷レイアウト情報が含まれる印刷情報データで、検索対象となっていない印刷情報データが存在するか判定する。検索対象となっていない印刷情報データが存在する場合は、S4006へ進む。検索対象となっていない印刷情報データが存在しない場合、S4010へ進む。   Next, in S4005, the central processing unit 301 determines whether there is print information data that is not a search target in the print information data including the print layout information extracted in S4002 read in S4004. If there is print information data that is not a search target, the process advances to step S4006. If there is no print information data that is not a search target, the process advances to step S4010.

次に、S4006において、中央演算装置301は、S4002で抽出した印刷レイアウト情報が含まれる印刷情報データで使用している部分描画オブジェクトを読み込む。次に、S4007において、中央演算装置301はS4006において読み込んだ部分描画オブジェクトに対して、S4002で抽出した印刷レイアウトを適用して、印刷時の描画内容を再構築する。   In step S4006, the central processing unit 301 reads a partial drawing object used in the print information data including the print layout information extracted in step S4002. In step S4007, the central processing unit 301 applies the print layout extracted in step S4002 to the partial drawing object read in step S4006 to reconstruct the drawing contents at the time of printing.

次に、S4008において、中央演算装置301は、S4009において再構築した印刷時の描画内容の特徴量とスキャン画像の特徴量を抽出し、一致するか判定する。一致する場合は、S4009へ進む。一致しない場合は、S4005へ戻り、処理を繰り返す。   In step S4008, the central processing unit 301 extracts the feature amount of the drawing content at the time of printing reconstructed in step S4009 and the feature amount of the scanned image, and determines whether or not they match. If they match, the process proceeds to S4009. If not, the process returns to S4005 and repeats the process.

次に、S4009において、中央演算装置301は、印刷情報データに含まれる文書データ情報を画像形成装置102へ送信する。S4008において再構築された描画内容の特徴量がスキャン画像の特徴量と一致したということは、印刷情報データに含まれる文書データ情報はスキャンされた出力物の元文書データであると判断できる。よって、ここでは、印刷情報データに含まれる文書データ情報が印刷物の元文書データであるとして検索結果を画像形成装置102へ送信している。   In step S <b> 4009, the central processing unit 301 transmits document data information included in the print information data to the image forming apparatus 102. If the feature amount of the drawing content reconstructed in S4008 matches the feature amount of the scanned image, it can be determined that the document data information included in the print information data is the original document data of the scanned output. Therefore, here, the search result is transmitted to the image forming apparatus 102 on the assumption that the document data information included in the print information data is the original document data of the printed matter.

S4010において、中央演算装置301は、印刷情報データテーブルに含まれる全印刷情報データテーブルに対して検索処理が実行されたか、判定する。全印刷情報データテーブルに対してまだ検索処理が実行されていない場合、S4002へ戻り、処理を繰り返す。全印刷情報データテーブルに対して検索処理が実行されている場合は、S4011へ進む。   In step S4010, the central processing unit 301 determines whether search processing has been executed for all print information data tables included in the print information data table. If the search process has not been executed for all print information data tables, the process returns to S4002 to repeat the process. If the search process has been executed for all print information data tables, the process advances to step S4011.

S4011では、印刷情報データテーブルに含まれる全印刷情報データに対して検索処理を実行しても、スキャン画像の元文書データが検出できなかったことになるので、中央演算装置301は、該当データなしとして検索結果を画像形成装置102へ送信する。   In S4011, since the original document data of the scanned image cannot be detected even if the search process is executed for all the print information data included in the print information data table, the central processing unit 301 has no corresponding data. As a result, the search result is transmitted to the image forming apparatus 102.

以上の処理により、ファイルサーバー101における元文書データ検索処理が実施される。   With the above processing, the original document data search processing in the file server 101 is performed.

以上、これまで説明した本発明によれば、長期にシステムを運用した場合でも、検索情報データの保持領域を逼迫しない、効率的な印刷物のスキャン画像からの元文書データ検索が可能となる。   As described above, according to the present invention described so far, even when the system is operated for a long period of time, it is possible to efficiently retrieve original document data from a scanned image of a printed matter without constraining the search information data holding area.

また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。   The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.

Claims (6)

印刷レイアウト情報を生成する生成手段と、
印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成する手段と、
前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持手段と、
入力された画像と類似する画像を検索する場合、前記保持手段によって保持された前記印刷情報データを検索する検索手段とを
有することを特徴とする画像処理装置。
Generating means for generating print layout information;
Means for generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects;
Holding means for holding the print layout information and the partial drawing object in association as print information data;
An image processing apparatus comprising: search means for searching for the print information data held by the holding means when searching for an image similar to the input image.
前記入力された画像は、印刷された印刷物を読み取り得られたスキャン画像であることを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the input image is a scanned image obtained by reading a printed material. さらに、前記検索手段の検索結果を通知する通知手段を有することを請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, further comprising notification means for notifying a search result of the search means. 前記部分描画オブジェクトは、保持形態としてラスター画像、ベクターデータ、フォント情報の形態を選択的にとることを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the partial drawing object selectively takes a form of a raster image, vector data, or font information as a holding form. 印刷レイアウト情報を生成する生成ステップと、
印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成するステップと、
前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持ステップと、
入力された画像と類似する画像を検索する場合、前記保持ステップによって保持された前記印刷情報データを検索する検索ステップとを
有することを特徴とする画像処理方法。
A generation step for generating print layout information;
Generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects;
A holding step of associating the print layout information with the partial drawing object and holding the information as print information data;
An image processing method comprising: a search step of searching the print information data held by the holding step when searching for an image similar to the input image.
コンピュータを請求項1乃至4のいずれか一項に記載の情報処理装置として機能させるためのプログラム。   The program for functioning a computer as an information processing apparatus as described in any one of Claims 1 thru | or 4.
JP2014082020A 2014-04-11 2014-04-11 Image processor, image processing method and program Pending JP2015203918A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014082020A JP2015203918A (en) 2014-04-11 2014-04-11 Image processor, image processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014082020A JP2015203918A (en) 2014-04-11 2014-04-11 Image processor, image processing method and program

Publications (1)

Publication Number Publication Date
JP2015203918A true JP2015203918A (en) 2015-11-16

Family

ID=54597365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014082020A Pending JP2015203918A (en) 2014-04-11 2014-04-11 Image processor, image processing method and program

Country Status (1)

Country Link
JP (1) JP2015203918A (en)

Similar Documents

Publication Publication Date Title
US9135528B2 (en) Information processing apparatus, job processing method in information processing apparatus, and storage medium
US20100091322A1 (en) Image forming apparatus and method thereof
US20140168684A1 (en) Imaging forming apparatus and method
US20130057884A1 (en) Information processing apparatus, computer program, and control method
KR20150020089A (en) Information processing apparatus, information processing method, processing apparatus, and storage medium
JP5754904B2 (en) Printing apparatus, printing apparatus control method, and program
US9030702B2 (en) Client apparatus, printing system, and display method for converting printing formats, generating preview images, and displaying preview images
JP2019067361A (en) Information processing apparatus, communication system, image forming method, and program
JP2009154324A (en) Image forming apparatus, program, and data processing method
JP2015203918A (en) Image processor, image processing method and program
JP5929689B2 (en) Preview image generation apparatus, preview image generation method, and computer program
JP2015106384A (en) Information processor and control method thereof, and program
JP4433044B2 (en) Image forming apparatus, program, and data processing method
JP2008257628A (en) Information processing device, document combining program, and recording medium
US9348547B2 (en) Document distribution server and document distribution method
JP6221543B2 (en) Program, information processing apparatus, information processing system, and image processing system
JP4661832B2 (en) Print control device and printer driver program
JP2014130430A (en) Information processing apparatus, printing system, and program
JP5701234B2 (en) Image forming apparatus and character drawing program
JP2014032436A (en) Image processing device, image processing method, image forming device, program and recording medium
JP2015032250A (en) Handwriting input terminal, handwritten data storage control program, and handwritten data storage control method
JP2012226678A (en) Information processor, image processing device, image forming device, and program
JP2014061648A (en) Control device for printing
JP2013196554A (en) Program, information processor, and recording medium
JP2006195818A (en) Image processing apparatus and its method, and image processing system