JP2015203918A - Image processor, image processing method and program - Google Patents
Image processor, image processing method and program Download PDFInfo
- Publication number
- JP2015203918A JP2015203918A JP2014082020A JP2014082020A JP2015203918A JP 2015203918 A JP2015203918 A JP 2015203918A JP 2014082020 A JP2014082020 A JP 2014082020A JP 2014082020 A JP2014082020 A JP 2014082020A JP 2015203918 A JP2015203918 A JP 2015203918A
- Authority
- JP
- Japan
- Prior art keywords
- image
- information
- data
- layout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は画像の検索を行う画像処理装置、画像処理方法、プログラムに関する。 The present invention relates to an image processing apparatus, an image processing method, and a program for searching for an image.
印刷物から印刷元の文書データを検索する技術がある。特許文献1では、印刷時に生成したラスター画像データとその特徴量を抽出して保持しておき、画像検索に使用している。検索対象となる印刷物がスキャンされるとスキャン画像の特徴量を抽出し、保持していたラスター画像データの特徴量との類似度を比較する。類似度が高いものを元文書データであると判定し、検索結果を出している。印刷時のラスター画像データを対象とした特徴量を画像検索に用いる為、印刷用に特化したレイアウトに変換して印刷した場合など、元文書データとレイアウトが異なる場合であっても、元文書データの検索を可能としている。
There is a technique for retrieving document data of a printing source from a printed material. In
しかし、特許文献1の技術は、印刷ジョブを処理する度に、ラスター画像データとその特徴量を全て保持しておく必要がある為、印刷ジョブの増加に従い、必要となるラスター画像データとその特徴量の保持領域も増加する。片面印刷したものを両面で再印刷するとき、用紙サイズを変えて再印刷した場合など、印刷物の描画内容としてはほとんど変更がない場合でも、ラスター画像データとその特徴量を保持する。そのため、保持領域の消費に無駄が多く、長期的にシステムを保守することを想定するケースでは、あまり好ましい形態ではない。
However, since the technique of
上記課題を解決する本発明の画像処理装置は、以下に示す構成を備える。 The image processing apparatus of the present invention that solves the above problems has the following configuration.
印刷レイアウト情報を生成する生成手段と、印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成する手段と、前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持手段と、入力された画像と類似する画像を検索する場合、前記保持手段によって保持された前記印刷情報データを検索する検索手段とを有する。 Generation means for generating print layout information, means for generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects, and storing the print layout information and the partial drawing object in association with each other as print information data And holding means for searching for the print information data held by the holding means when searching for an image similar to the input image.
本発明によれば、検索時に必要とする情報の保持領域を必要としない、効率的な文書データの検索が可能となる。 According to the present invention, it is possible to efficiently search for document data that does not require a storage area for information required for searching.
以下、本発明を実施するための最良の形態について図面を用いて説明する。 The best mode for carrying out the present invention will be described below with reference to the drawings.
[実施例1]
<システム構成図>
まず、図1を用いて本発明におけるシステムの構成の一例を説明する。本実施例に係るシステムは、ファイルサーバー101、画像形成装置(画像処理装置)102を有する。ファイルサーバー101は、複数の画像形成装置102とネットワーク103で接続されている。
[Example 1]
<System configuration diagram>
First, an example of a system configuration according to the present invention will be described with reference to FIG. The system according to this embodiment includes a
ファイルサーバー101は本実施例のシステムの適用対象となる文書データを管理しており、印刷時に画像形成装置102より送信される印刷情報データと文書データを関連付けして保持している。また、画像形成装置102から送信されてくる印刷物のスキャン画像から画像検索を行い、印刷元の元文書データを検索する機能を有している。画像検索時は過去に画像形成装置102より受信した印刷情報データを使用して検索処理を行う。画像検索処理の詳細については図19を使用して後ほど詳しく説明する。
The
画像形成装置(画像処理装置)102は、スキャン、FAX、プリント、コピーなどの様々な機能を有する複合機、またはプリント機能のみを有するプリンタである。画像形成装置102は、印刷時に使用した印刷設定から印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトを印刷情報データとしてファイルサーバー101に送信する。印刷情報データの詳細については図13を用いて後ほど詳しく説明する。また画像形成装置102は、印刷物をスキャンしてファイルサーバー101に送信し、元文書データの検索要求を出すことができる。文書データを印刷するデバイスと、印刷物をスキャンして元文書データの検索要求を出すデバイスは、異なるデバイスからでも実行することが可能である。また、本実施例で述べる、ファイルサーバー101の機能を画像形成装置102のコントローラー内に持たせ、画像形成装置102内部のみで構成する形態をとってもよい。画像形成装置102内部のみで構成する形態をとった場合であっても、ネットワーク103を介して複数の画像形成装置102が接続され、同機能を実行させてもよい。
An image forming apparatus (image processing apparatus) 102 is a multifunction peripheral having various functions such as scanning, FAX, printing, copying, or a printer having only a printing function. The
ネットワーク103はWANやLANで構成される無線、または有線のネットワークである。
The
情報処理装置104はユーザが使用するクライアントPC、または近年普及しつつあるモバイル端末である。情報処理装置104はネットワーク103を介して画像102へ印刷ジョブの投入、ファイルサーバー101へ文書データを送信することができる。情報処理装置104はネットワーク103を介して複数接続することができ、ファイルサーバー101へ送信された文書データは接続されている情報処理装置104の間で共有することができる。
The
<画像形成装置のハードウェアブロック図>
図2は本実施例の画象形成装置102の構成を説明するハードウェアブロック図である。なお、図2では画象形成装置単体の構成のみを示しているが、この画像形成装置102には図1に示すファイルサーバー101や情報処理装置104などの装置がネットワーク103を通じて無線または有線で接続される。印刷ジョブは主にネットワーク103に接続されている情報処理装置104からネットワーク103やUSBに代表されるインターフェースを経由して画象形成装置102に転送される。
<Hardware block diagram of image forming apparatus>
FIG. 2 is a hardware block diagram illustrating the configuration of the
図2において、200はコントローラユニットで、画像信号やデバイス情報の入出力を制御する。中央演算装置201は補助記憶装置203に記憶されたプログラムを主記憶装置202に読み出し、実行する。さらに、システムバス212に接続される各デバイスを中央演算装置201が統括的に制御する。また、中央演算装置201は並列処理を実現するために、ハードウェアとしてプロセッサを複数有するマルチプロセッサシステムを採用してもよい。また、マイクロプロセッサとして、複数のプロセッサコアを備えているものでもよい。ハイパースレッディングのようなプロセッサ内のレジスタやパイプラインの空き時間を有効利用して1つのプロセッサをあたかも複数のプロセッサであるかのように見せる技術が利用出来るものを用いても良い。ネットワーク103を介して接続させる情報処理装置104上に多くの処理を分離実行させる構成も可能である。主記憶装置202は、中央演算装置201の主メモリ、ワークメモリとして機能する。補助記憶装置203は大容量データを一時的あるいは長期的に保持する目的でも使用される。RIP204は中間プリントデータをラスタイメージに展開する専用ハードウェアである。RIP204は中央演算装置201により主記憶装置202上に生成された中間プリントデータを高速かつ、中央演算装置201の実行と並列に、処理するものである。Network205はネットワーク103に接続し、プリンタ外部とのプリントデータやデバイス情報の入出力を担う。あるいはNetwork205を介して主記憶装置203にプログラムをインストールすることもできる。スキャン装置I/F206はスキャン装置209とのインターフェース部で、スキャン装置209から送受信するスキャン画像を主記憶装置202または、補助記憶装置203に保存する役割を担う。操作部I/F207は操作部210とのインターフェース部で、操作部210に表示する画像データを操作部210に対して出力する。また、操作部210から本装置のユーザが入力した情報を、中央演算装置201に伝える役割をする。操作部210は、出力器として液晶パネルと音源を備え、入力器としてタッチパネルとハードキー、マイクを備えるものである。コントローラユニット200はデバイスI/F208を介して、プリンタエンジン211に接続される。デバイスI/F208は中央演算装置201の指示に基づき、画像信号の送出、デバイス動作指示、デバイス情報の受信を行う。プリンタエンジン211はコントローラユニット200からの画像信号を媒体上に出力する出力機であり、電子写真方式、インクジェット方式の何れでも構わない。また、システムバス212に対し、CDやDVDなどの可搬型ディスク記録媒体に対するディスクドライブ、フラッシュメモリなどの可搬型の不揮発性記録媒体に対するメモリリーダライタなどが接続されてもよい。また、本実施例の処理内容が記述されたプログラムが前記可搬型記憶媒体を経由して、補助記憶装置203に保存され、画像形成装置にインストールすることもできる。
In FIG. 2, a
<ファイルサーバーのハードウェアブロック図>
図3は本実施例のファイルサーバー101の構成を説明するハードウェアブロック図である。ファイルサーバー101において、本実施例の処理内容が記述されたプログラムが、補助記憶装置304に保存され、ファイルサーバー101にインストールされる。中央演算装置301は補助記憶装置304に記憶されたプログラムを主記憶装置302に読み出し、実行する。さらに、システムバス305に接続される各デバイスを中央演算装置301が統括的に制御する。主記憶装置302は、中央演算装置301の主メモリ、ワークメモリとして機能する。Network303はネットワーク103に接続し、ファイルサーバー101外部との文書データや印刷情報データなどの情報の入出力を担う。また、Network303を介して補助記憶装置304にプログラムをインストールすることもできる。補助記憶装置304にはオペレーティングシステムと本実施例の処理内容が記述された制御プログラムの本体が格納される。本実施例における文書データ管理機能の対象となる文書データ、画像検索機能で用いられる印刷情報データもこの領域に保持される。システムバス305に対しては、CDやDVDなどの可搬型ディスク記録媒体に対するディスクドライブ、フラッシュメモリなどの可搬型の不揮発性記録媒体に対するメモリリーダライタなどが接続されてもよい。実施例の処理内容が記述されたプログラムが前記可搬型記憶媒体を経由して、補助記憶装置304に保存され、ファイルサーバー101にインストールすることもできる。
<Hardware block diagram of file server>
FIG. 3 is a hardware block diagram illustrating the configuration of the
<画像形成装置のソフトウェアモジュール図>
図4は本実施例における画像形成装置102のソフトウェアモジュール構成図である。図4に記載した各ソフトウェアモジュールは、プログラムとして補助記憶装置203に格納され、主記憶装置202にロードされ中央演算装置201により実行されるものである。送信部401はNetwork205より後述する印刷情報データ生成部405により生成された印刷情報データ、スキャン画像の送信、印刷データや画像検索結果を受信する。データ解釈部402は制御部403を介して送受信部401より受信される印刷データを読み込み、ドキュメント内の描画情報を解釈する。このデータ解釈処理の結果として抽出した描画情報は制御部403を介してレンダラ404に送られ、レンダリング処理に使用される。制御部403は本実施例における印刷データの受信、データ解釈、画像のレンダリング、印刷情報データ生成、印刷物のスキャン、スキャン画像の送信、検索結果の受信までの各種処理の制御の全般を司る。レンダラ404はデータ解釈部402から送られてきた描画情報からRIP204を使用してビットマップイメージを生成する。生成されたビットマップイメージはデバイスI/F208を介してプリンタエンジンに送られ、印刷用紙に対する画像形成処理が実行される。印刷情報データ生成部405は印刷時の印刷情報を印刷情報データとして生成する。印刷情報データには、印刷時に使用した印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトから構成される。印刷情報データの詳細については図13を用いて後ほど詳しく説明する。
<Software module diagram of image forming apparatus>
FIG. 4 is a software module configuration diagram of the
<ファイルサーバーのソフトウェアモジュール図>
図5は本実施例におけるファイルサーバー101のソフトウェアモジュール構成図である。図5に記載した各ソフトウェアモジュールは、図3におけるプログラムとして補助記憶装置304に格納され、主記憶装置302にロードされ中央演算装置301により実行されるものである。送受信部501はNetwork303より画像形成装置102から送信される印刷情報データやスキャン画像、報処理装置104から送信される文書データの受信、後述する画像検索処理の検索結果を画像形成装置101へ送信する。文書データ管理部502は、補助記憶装置304を用いて、本実施例のシステムの管理対象とする複数の文書データを保持している。制御部503は本実施例で行われるスキャン画像や印刷情報データ、文書データの受信、保存、画像検索処理、検索結果の送信の各種処理の制御の全般を司る。印刷情報データ管理部504は、補助記憶装置304を用いて、画像形成装置102から送信される印刷情報データを保持している。なお、この印刷情報データは印刷時に印刷対象となった文書データと関連付けられた形態で保持されている。関連付けされる文書データは文書データ管理部502に保持されているものが対象となる。詳細は図13を用いて後ほど詳しく説明する。文書データ検索部505は、制御部503を介して文書データ管理部502にて管理されている文書データの中から、文書データの検索を行う。送受信部501を介して画像形成装置102からスキャン画像を受信し、印刷情報データ管理部504で管理されている印刷情報データから印刷時の描画内容を再構築し、画像検索を行う。画像検索によりスキャン画像と特徴量が一致する文書データを抽出し、検索結果を画像形成装置102へ送信する。
<Software module diagram of file server>
FIG. 5 is a software module configuration diagram of the
<元文書データ検索結果画面>
図6は画像形成装置102の操作部210に表示される。印刷物のスキャン画像から元文書データを検索実行した結果を表示している画面である。ファイルサーバー101から文書データの検索処理結果を、画像形成装置102が受信すると、この画面が表示される。
<Original document data search result screen>
FIG. 6 is displayed on the
図6(A)は元文書データの検索結果として、該当する文書データが検出された場合の検索結果画面を示している。ポップアップ601には、ファイル名フォーム602、印刷レイアウト設定フォーム603、印刷ボタン604、詳細設定ボタン605、Cancelボタン606が含まれる。ファイル名フォーム602には、検出された文書データのファイル名が表示される。本実施例では、スキャン画像と文書データとの類似度が最も高い文書データを1ファイル選択し、検索結果として表示するとしているが、類似度が近いものから一覧で表示する形態をとるとしてもよい。印刷レイアウト設定フォーム603は検出された文書データからスキャンされた印刷物に印刷した時の印刷レイアウト設定が表示される。印刷レイアウトに関係する印刷設定は様々なものがあるが、本実施例では印刷レイアウト情報に任意の名前をつけることができ、その印刷レイアウト情報の名前を表示するとしている。ここで言う、印刷レイアウト情報の詳細については図12を用いて後ほど詳しく説明する。印刷ボタン604は、検出された文書データを再度印刷する場合に選択するボタンである。詳細選択ボタン605は、より詳細な印刷設定の確認と変更が可能な画面へ遷移する場合に選択するボタンである。スキャンした印刷物がどのような印刷設定で出力されたのか確認したい場合や、印刷ボタン604を選択して再印刷する際に特定の印刷設定だけを変更したい場合に選択する。Cancelボタン606は元文書データの検索結果を確認し、特に何も処理をしないで終了したい時に選択するボタンである。
FIG. 6A shows a search result screen when corresponding document data is detected as a search result of the original document data. The pop-
図6(B)は元文書データの検索結果として、該当する文書データが検出されなかった場合に表示される検索結果画面を示している。ポップアップ701には検索結果として該当する文書データが見つからなかったことを通知する文言とともに、OKボタン702が含まれる。OKボタン702が選択されるとポップアップ701は閉じられ、通常のジョブ待機画面に移行する。
FIG. 6B shows a search result screen displayed when the corresponding document data is not detected as the search result of the original document data. The pop-
<文書データのPC上での表示画面>
図7は本実施例が対象としている文書データをPC上で表示したときの表示画面を示している。本実施例では、多くのWebサイトなどで使用されているHTMLとCSSを用いたドキュメント形式から構成される文書データを対象とする。このドキュメント形式では、HTMLには文書データの基本構造とコンテンツ要素の情報のみをもたせ、CSSではHTMLで定義された情報をどのようにレイアウトして表示するかが定義される。
<Display screen of document data on PC>
FIG. 7 shows a display screen when the document data targeted by this embodiment is displayed on the PC. In the present embodiment, document data composed of a document format using HTML and CSS used in many websites is targeted. In this document format, HTML has only the basic structure of document data and information on content elements, and CSS defines how information defined in HTML is laid out and displayed.
図7(A)および(B)において、コンテンツフォーム801、802は、これらHTMLで定義されたコンテンツ要素を表示しており、ユーザのスクロール操作により、表示内容が遷移する。コンテンツフォーム801、802以外の領域は、ユーザのスクロール操作と関係なく、表示内容は遷移しない。図7(A)の状態からロールダウンすると、図7(B)へ遷移する。図7(B)の状態からロールアップすると、図7(A)へ遷移する。 7A and 7B, the content forms 801 and 802 display content elements defined in HTML, and the display contents are changed by the user's scrolling operation. In areas other than the content forms 801 and 802, the display content does not change regardless of the user's scroll operation. When rolling down from the state of FIG. 7A, the state transitions to FIG. When rolling up from the state of FIG. 7B, the state transitions to FIG.
<PC表示からの印刷結果>
図8は本実施例が対象としている文書データをPCから印刷指示したときの印刷結果の一例を示している。本実施例が対象としているHTMLとCSSを用いたドキュメント形式の文書データは、一般的に印刷時にPC上で表示している表示内容に応じて、印刷結果は異なるものになる。これは、HTMLとCSSを用いたドキュメント形式にはページの概念が無く、各ページで固定に描画結果を指定することができないためである。ページ概念の無いドキュメントをどのように印刷物の物理座標にレイアウトしていくかは、それぞれの画像形成装置102のプリンタドライバのアルゴリズムに依存する。
<Print result from PC display>
FIG. 8 shows an example of the print result when the document data targeted by the present embodiment is instructed from the PC. Document data in the document format using HTML and CSS targeted by this embodiment generally has different print results depending on the display contents displayed on the PC at the time of printing. This is because the document format using HTML and CSS does not have the concept of a page, and the rendering result cannot be specified fixedly on each page. How a document without a page concept is laid out in physical coordinates of a printed matter depends on the algorithm of the printer driver of each
図8の例では、PC上で表示される描画内容をPCのメインメモリ上に展開し、印刷指示時はこのメインメモリに展開されている描画内容をそのまま印刷するようにレイアウト処理した場合の例を示している。図8(A)は、図7(A)の状態で印刷指示したときに印字される印刷結果であり、印字領域901には図7(A)のコンテンツフォーム801の描画内容が印字される。図8(B)は、図7(B)の状態で印刷指示したときに印字される印刷結果であり、こちらも印字領域902には図7(B)のコンテンツフォーム802の描画内容が印字される。PC上でコンテンツフォーム801、802に何が描画されているかによって、印字領域901、902が切り替わる。HTMLでコンテンツ要素として描画オブジェクトが定義されていても、PC上で表示されていない場合は、描画オブジェクト対象外とされ、印字されない。
In the example of FIG. 8, the drawing contents displayed on the PC are expanded on the main memory of the PC, and the layout processing is performed so that the drawing contents expanded on the main memory are printed as they are when a print instruction is issued. Is shown. FIG. 8A shows a print result that is printed when a print instruction is given in the state of FIG. 7A, and the drawing content of the
近年ではこれらページ概念のないドキュメント形式で、タブレットや多機能携帯電話(スマートフォン)などのモバイル端末の表示環境にも対応したWebサイトが増加している。これらのWebサイトでは、PC用、モバイル端末用でそれぞれ定義した複数CSSを用意し、表示端末に応じて選択的にCSSを切り替えて使用することで、表示端末に最適なレイアウト表示を実現している。 In recent years, an increasing number of websites are compatible with the display environment of mobile terminals such as tablets and multi-function mobile phones (smartphones) in a document format without these page concepts. In these websites, multiple CSSs defined for PC and mobile terminals are prepared, and the CSS is selectively switched according to the display terminal, thereby realizing the optimal layout display for the display terminal. Yes.
<文書データのモバイル端末上での表示画面>
図9はこれらモバイル端末の表示環境に対応したHTMLとCSSを用いた文書データをモバイル端末上で表示したときの表示画面を示している。モバイル端末は表示領域がPCよりも狭いため、縦長のレイアウトになり、ユーザのスクロール操作により全体の描画内容が遷移する。図9(A)の状態からロールダウンすると、図9(B)、図9(C)へと描画内容が遷移する。また、図9(C)の状態からロールアップすると、図9(B)、図9(A)へと描画内容が遷移する。全体としては図9(D)に示すような縦長の描画内容をスクロール表示している形になる。
<Display screen of document data on mobile terminal>
FIG. 9 shows a display screen when document data using HTML and CSS corresponding to the display environment of these mobile terminals is displayed on the mobile terminal. Since the display area of the mobile terminal is narrower than that of the PC, the mobile terminal has a vertically long layout, and the entire drawing content is changed by the user's scroll operation. When rolling down from the state of FIG. 9A, the drawing contents transition to FIG. 9B and FIG. 9C. Further, when the roll-up is performed from the state of FIG. 9C, the drawing content transitions to FIGS. 9B and 9A. As a whole, the vertically drawn content as shown in FIG. 9D is scroll-displayed.
<文書データのデータ構造>
図10を用いて、これらPCとモバイル端末の表示環境に対応したHTMLとCSSを用いたドキュメント形式の文書データのデータ構造について、より詳細に説明する。
<Data structure of document data>
The data structure of document data in document format using HTML and CSS corresponding to the display environment of these PCs and mobile terminals will be described in more detail with reference to FIG.
図10(A)はHTMLデータ構造の概要を示している。基本構造領域1001には、Webサイトの基本構造をヘッダ情報として定義する。ページタイトルの他に、使用する文字コード、ページの概要、ブックマーク時の表示文字列、埋め込み広告の定義などが書かれる。また、PC、モバイル端末の表示環境によって、どのCSSを読み込むか切り替えの定義も、この基本構造領域1001に記述する。コンテンツ要素1002、1003、1004には、それぞれWebサイトで表示するコンテンツ内容を定義する。ここには文字列やグラフィック、写真などの画像を定義する、またはユーザの操作に応じて表示内容を動的に切り替えるJavaScript(登録商標)を定義することができる。本実施例では、コンテンツ要素1002にはWebサイトのタイトル情報が、コンテンツ要素1003にはWebサイトのメニュー情報が、コンテンツ要素1004には記事文章、画像情報が定義されているものとする。
FIG. 10A shows an outline of the HTML data structure. In the
図10(B)はPC用のCSSのデータ構造の概要を示している。CSSはHTMLで定義された基本構造とコンテンツ要素の情報をどのようにレイアウトするかが定義される。図10(B)には、コンテンツ領域1101、1102、1103、1104が定義され、それぞれの領域で個別にレイアウトを定義することができる。例えば表示領域の幅と高さ、座標値、背景色やフォントサイズ、ユーザ操作に応じた表示内容の振る舞いなどが定義できる。コンテンツ領域にはそれぞれHTMLのコンテンツ要素が割り当てられ、定義されたレイアウトがコンテンツ領域毎に適用される。図7の例に当てはめると、コンテンツ領域1101にはWebサイトのタイトル情報であるコンテンツ要素1002が、コンテンツ領域1102にはWebサイトのメニュー情報であるコンテンツ要素1103が割り当てられる。コンテンツ領域1103には記事文章、画像情報であるコンテンツ要素1004が、コンテンツ領域1104には埋め込み広告情報が基本構造領域1001から割り当てられる。
FIG. 10B shows an outline of the CSS data structure for PC. CSS defines how to lay out the basic structure and content element information defined in HTML. In FIG. 10B,
図10(C)はモバイル端末用のCSSのデータ構造の概要を示している。こちらも同様にコンテンツ領域1201、1202、1203、1204が定義され、それぞれの領域で個別にレイアウトを定義されている。こちらもHTMLで定義されている基本構造とコンテンツ要素の情報をどのようにレイアウトし、モバイル端末の表示環境に適した表示を実現するかがCSSに定義されている。図9の例に当てはめると、コンテンツ領域1201にはWebサイトのタイトル情報であるコンテンツ要素1002が、コンテンツ要素1202にWebサイトのメニュー情報であるコンテンツ要素1003が割り当てられている。コンテンツ領域1203には記事文書、画像情報であるコンテンツ要素1004が、コンテンツ領域1204には埋め込み広告情報が基本構造1001から割り当てられる。
FIG. 10C shows an outline of the CSS data structure for the mobile terminal. Similarly,
PCとモバイル端末の表示環境に対応したHTMLとCSSを用いたドキュメント形式では、図10(B)、(C)で説明したCSSをそれぞれ、文書データを読み込む段階で表示環境に応じて切り替えてレイアウトを変えている。 In the document format using HTML and CSS corresponding to the display environment of the PC and mobile terminal, the CSS described in FIGS. 10B and 10C is switched according to the display environment at the stage of reading the document data. Is changing.
<ページ概念のない文書データへの特殊な印刷レイアウト>
図7から図10を用いて説明した、Webサイトで使用されるHTMLとCSSを用いたドキュメント形式は、前述の通りページ概念がないため、印刷する場合は印刷物の物理座標へレイアウトするための独自のレイアウトアルゴリズムが適用される。この独自のレイアウトアルゴリズムについては様々なものが検討・開発されており、図11、図12にはその一例を示している。
<Special print layout for document data without page concept>
As described above, the document format using HTML and CSS used on the website described with reference to FIGS. 7 to 10 does not have a page concept. Therefore, when printing, it is unique for laying out the physical coordinates of the printed matter. The layout algorithm is applied. Various kinds of unique layout algorithms have been studied and developed, and examples thereof are shown in FIGS.
図11(A)は図9および図10(C)で説明したモバイル端末用のレイアウトを用いたレイアウトアルゴリズムを適用して印刷した時の印刷結果を示している。ここでは、モバイル端末の表示環境用にCSSで定義された縦長の描画内容を印刷物の縦幅の長さで短冊状に区切り、横に並べてレイアウトしている。このレイアウト構造は図12(A)に示す印刷レイアウト情報に定義されており、本実施例ではモバイル端末レイアウトと名前を付ける。コンテンツ領域1301にはWebページのタイトル情報であるコンテンツ要素1002の描画内容が印字される。コンテンツ領域1302にはWebページのメニュー情報であるコンテンツ要素1003の描画内容が印字される。コンテンツ領域1303には記事文書、画像情報であるコンテンツ要素1004の描画内容が印字される。コンテンツ領域1304には基本構造1001で定義されている埋め込み広告情報の描画内容が印字される。このレイアウトでは縦幅の描画内容を1枚の印刷物に収めて印刷するため、印刷ページ数が少なく、モバイル端末と描画内容が同じで、情報も集約した印刷結果を得ることができる。
FIG. 11A shows a printing result when printing is performed by applying the layout algorithm using the mobile terminal layout described in FIGS. 9 and 10C. Here, the vertically drawn content defined by CSS for the display environment of the mobile terminal is divided into strips by the length of the vertical width of the printed matter and arranged horizontally. This layout structure is defined in the print layout information shown in FIG. 12A. In this embodiment, the layout structure is named mobile terminal layout. In the
図11(B)は図8および図9(A)(B)で説明したPC用のレイアウトに少し手を加えたレイアウトアルゴリズムを適用した時の印刷結果の例を示している。ここでは、HTMLで定義されている基本構造、コンテンツ要素の情報から、描画オブジェクトを全て1枚の印刷物に印字できるようにレイアウトを組み替える。このレイアウト構造は図12(B)に示す印刷レイアウト情報に定義されており、本実施例では集約PCレイアウトと名前を付ける。コンテンツ領域1401にはWebサイトのタイトル情報であるコンテンツ要素1002の描画内容が印字される。コンテンツ領域1402にはWebサイトのメニュー情報であるコンテンツ要素1003の描画内容が印字される。コンテンツ領域1403には記事文書、画像情報であるコンテンツ要素1004の描画内容が印字される。コンテンツ領域1404には基本構造1001で定義されている埋め込み広告情報の描画内容が印字される。このレイアウトでは図7に示されるPC用CSSではコンテンツフィールド801をスクロール操作して表示していた、記事文書、画像情報を、レイアウトを変更して一枚の印刷物に集約して印刷できるようにしたものである。PCの表示とは異なる印刷結果となってしまうが、HTMLで定義されているコンテンツ要素全ての情報を一枚の印刷物にまとめることができる。
FIG. 11B shows an example of a printing result when a layout algorithm that is a little modified to the PC layout described in FIGS. 8 and 9A and 9B is applied. Here, the layout is rearranged so that all the drawing objects can be printed on one printed matter from the basic structure and content element information defined in HTML. This layout structure is defined in the print layout information shown in FIG. 12B. In this embodiment, the layout structure is named as an aggregate PC layout. In the
図11(C)は図8および図9(A)(B)で説明したPC用のレイアウトに対して大幅に手を加えたレイアウトアルゴリズムを適用した時の印刷結果の例を示している。ここでは、HTMLで定義されている基本構造、コンテンツ要素の情報から、印刷時のトナー消費量が少ない描画オブジェクトのみを印字するようにレイアウトを組み替える。このレイアウト構造は図12(C)に示す印刷レイアウト情報に定義されており、本実施例では消費トナー削減レイアウトと名前を付ける。コンテンツ領域1501にはWebサイトのタイトル情報であるコンテンツ要素1002の描画内容が、消費トナーが少ない形態で印字される。コンテンツ領域1502にはWebサイトのメニュー情報であるコンテンツ要素1003の描画内容が、消費トナーが少ない形態で印字される。コンテンツ領域1503には記事文書、画像情報であるコンテンツ要素1004の描画内容が、消費トナーが少ない形態で印字される。このレイアウトでは印刷時の消費トナーを少なくするため、トナー使用量が多い描画オブジェクトに対しては、トナー使用量が少なくなるように間引きを行う。例えば、図12(C)のコンテンツ領域1501において、タイトル情報はトナー使用量を少なくするため、背景を描画せず、モノクロで印字する。コンテンツ領域1503においても、背景は描画せず、またトナー使用量の多い、写真などの画像描画オブジェクトは印刷せず、文字はベクターグラフィックのみを描画オブジェクトとして印字するようにしている。こちらもPCの表示とは異なる印刷結果となってしまうが、文書データの必要な情報のみを印刷したい時などに、トナー使用量を抑えた印刷結果を得ることができる。
FIG. 11C shows an example of a print result when a layout algorithm that has been greatly modified is applied to the PC layout described with reference to FIGS. 8 and 9A and 9B. Here, the layout is rearranged so as to print only drawing objects with a small amount of toner consumption during printing, based on the basic structure and content element information defined in HTML. This layout structure is defined in the print layout information shown in FIG. 12C, and is named “consumed toner reduction layout” in this embodiment. In the
<元文書データ検索処理の概要>
本発明は、印刷時に生成したラスター画像データとその特徴量を全印刷ジョブ分保持するのではなく、印刷時に使用した印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトを保持することにより、保持領域の消費量を抑える。つまり、ラスター画像をそのまま保持するのではなく、印刷レイアウトで使用された描画オブジェクトの単位で分割して部分ラスター画像、またはベクターデータ、フォント情報で部分描画オブジェクトとして保持する。ページ概念のない文書データには様々な印刷レイアウトを適用することが可能であるが、異なる印刷レイアウトであっても、使用する部分描画オブジェクトが同じものである場合は、該当する部分描画オブジェクトを使いまわすことができる。よって、この部分ラスター画像、ベクターデータ、フォント情報を異なる印刷レイアウト間で部分描画オブジェクトとして使いまわすことで、保存領域消費量の削減を図っている。以下、図13から図19を用いて、本発明の元文書データ検索処理の詳細を説明する。
<Outline of original document data search processing>
The present invention does not hold the raster image data generated at the time of printing and its feature values for all print jobs, but holds the print layout information used at the time of printing and the partial drawing objects necessary for configuring the layout. This reduces the consumption of the holding area. That is, the raster image is not held as it is, but is divided in units of drawing objects used in the print layout and is held as a partial drawing object by partial raster image, vector data, or font information. Various print layouts can be applied to document data without a page concept. However, if the same partial drawing object is used even if the print layout is different, the corresponding partial drawing object is used. Can be turned. Therefore, by using these partial raster images, vector data, and font information as partial drawing objects between different print layouts, the storage area consumption is reduced. Hereinafter, the details of the original document data search processing of the present invention will be described with reference to FIGS.
尚、本発明は印刷物の検索対象となる元文書データとしては、HTMLとCSSを用いたWebサイト上の文書データ以外に、一般的なオフィスドキュメントのドキュメント形式に対しても適用対象とすることが可能である。一般的なオフィスドキュメントはページ概念があり、レイアウト構造をデータ構成として保持している為、ページ概念の無い文書データのように印刷レイアウトを定義する必要がない。しかし、本実施例のように印刷レイアウト情報を別途生成し、そのレイアウトを構成するために必要な部分描画オブジェクト情報を保持しておけば、ページ概念のないドキュメント形式であっても適用することができる。 Note that the present invention may be applied to document formats of general office documents as well as document data on websites using HTML and CSS as original document data to be searched for printed matter. Is possible. Since a general office document has a page concept and holds a layout structure as a data structure, it is not necessary to define a print layout unlike document data without a page concept. However, as long as print layout information is separately generated and partial drawing object information necessary for configuring the layout is held as in the present embodiment, it can be applied to a document format without a page concept. it can.
<印刷情報データテーブル>
図13は印刷情報データテーブルを示している。印刷情報データテーブルは画像形成装置102が情報処理装置104から送信された印刷ジョブを印刷処理した際に印刷情報データ生成部405において生成し、ファイルサーバー101に送信する。ファイルサーバー101は送信された印刷情報データテーブルを受信し、印刷情報データ管理部504により補助記憶装置304に保持さる。印刷情報データテーブルは印刷ジョブID、印刷時に使用した文書データ情報とページ番号、印刷レイアウト情報と、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクト情報を保持している。印刷ジョブIDはシステムによって割り当てられる、印刷ジョブを一意に識別するための識別子である。文書データ情報は、印刷ジョブ投入された元文書データの情報である。ページ番号は印刷対象のページの文書データにおける論理ページ番号である。部分描画オブジェクト情報は印刷レイアウト情報を適用した場合に構成要素となる部分描画オブジェクト情報である。印刷レイアウト情報は文書データを印刷した時の印刷レイアウト情報である。本実施例では、図8に例示したPCレイアウトと、図11に例示したモバイル端末レイアウト、集約PCレイアウト、消費トナー削減レイアウトが存在するものとしている。
<Print information data table>
FIG. 13 shows a print information data table. The print information data table is generated by the print information
<部分描画オブジェクトテーブル>
次に図14を用いて、部分描画オブジェクトテーブルの説明をする。部分描画オブジェクトテーブルは印刷情報データテーブルで保持されている印刷レイアウトにおいて、そのレイアウトを構成するために必要となる文書データに含まれる部分描画オブジェクトの情報を保持している。本発明は、印刷ジョブで生成したラスター画像をそのまま保持するのではなく、印刷レイアウトを構成する描画オブジェクトの単位で分割して部分ラスター画像、ベクターデータ、フォント情報で部分描画オブジェクトとして保持する。そして、画像検索時にこれら部分描画オブジェクトである部分ラスター画像、ベクターデータ、フォント情報に印刷レイアウトを適用することで、印刷時の描画内容を再構築する。異なる印刷レイアウト情報が使われている場合でも、そのレイアウトを構成するために必要に部分描画オブジェクトが同じであれば、その部分描画オブジェクトを使いまわして、描画内容を再構築する。よって、異なるレイアウト間で同じ部分描画オブジェクトを使用していても、重複して保持領域に保持しない。従って、部分描画オブジェクトテーブルは画像形成装置102が印刷ジョブを処理するタイミングで更新されるが、既にファイルサーバー101で保持されている部分描画オブジェクトは、部分描画オブジェクトテーブルに追加されない。新規に印刷ジョブで使用された部分描画オブジェクトのみを追加していく。
<Partial drawing object table>
Next, the partial drawing object table will be described with reference to FIG. The partial drawing object table holds information on partial drawing objects included in document data necessary for configuring the layout in the print layout held in the print information data table. In the present invention, a raster image generated by a print job is not held as it is, but is divided into units of drawing objects constituting a print layout and held as a partial drawing object with partial raster images, vector data, and font information. Then, the drawing content at the time of printing is reconstructed by applying the print layout to the partial raster image, vector data, and font information which are these partial drawing objects at the time of image search. Even when different print layout information is used, if the partial drawing objects are the same as necessary to configure the layout, the partial drawing objects are reused to reconstruct the drawing contents. Therefore, even if the same partial drawing object is used between different layouts, it is not redundantly held in the holding area. Accordingly, the partial drawing object table is updated at the timing when the
部分描画オブジェクトテーブルは描画オブジェクトID、描画オブジェクト属性、部分描画オブジェクト名の情報を持っている。描画オブジェクトIDはシステムにより割り振られる部分描画オブジェクトを一意に識別可能な識別子である。描画オブジェクト属性は、対象となる部分描画オブジェクトがテキスト文章か、ベクター形式のグラフィックか、写真などの画像データかの属性情報を持っている。本実施例では、テキスト文章であれば「Text」属性を、グラフィックであれば「Graphic」属性を、画像データであれば「Image」属性を持たせることとしている。部分描画オブジェクト名はシステムによって付けられる対象となる部分描画オブジェクトの名前である。本実施例ではオブジェクトの名前は部分描画オブジェクトの保持形式によって切り替えるものとしている。部分描画オブジェクトは保持形態として、部分ラスター画像形式、ベクターデータ形式、フォント形式を取ることができる。写真などの画像データは部分ラスター画像形式で、解像度は画像データ自体の解像度が出力解像度より低い場合は、画像データの解像度のままで、逆に出力解像度より高い場合は出力解像度に設定してレンダリングを行い、部分ラスター画像として保持する。グラフィックはベクターデータ形式で保持する。テキスト文章はフォント形式、部分ラスター画像形式どちらの形式で保持してもよいが、データサイズを小さくする場合は、フォント形式で持たせる方が望ましい。画像形成装置102に内蔵していないダウンロードフォントを使用した場合は部分ラスター画像形式で持たせる。
The partial drawing object table has information on drawing object IDs, drawing object attributes, and partial drawing object names. The drawing object ID is an identifier that can uniquely identify a partial drawing object allocated by the system. The drawing object attribute has attribute information indicating whether the target partial drawing object is a text sentence, a vector format graphic, or image data such as a photograph. In the present embodiment, a “Text” attribute is assigned to a text sentence, a “Graphic” attribute is assigned to a graphic, and an “Image” attribute is assigned to image data. The partial drawing object name is the name of the partial drawing object to be assigned by the system. In this embodiment, the name of the object is switched according to the retention format of the partial drawing object. A partial drawing object can take a partial raster image format, a vector data format, or a font format as a holding form. Image data such as photos is in a partial raster image format, and if the resolution of the image data itself is lower than the output resolution, the image data remains the same as the resolution of the image data. And hold as a partial raster image. Graphics are stored in vector data format. The text sentence may be held in either a font format or a partial raster image format. However, when the data size is to be reduced, it is desirable to have the text sentence in the font format. When a download font that is not built in the
<部分描画オブジェクトの保持形態>
図15は図7から図11で例示したWebサイトの文書データにおける、レイアウトを構成する部分描画オブジェクトである部分ラスター画像、ベクターデータ、フォント情報を示している。図15(A)は図14の部分描画オブジェクトテーブルにおいて、描画オブジェクト属性が「Image」である部分描画オブジェクトの部分ラスター画像を示している。図15(B)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Graphic」である部分描画オブジェクトのベクターデータを示している。ベクターデータであるため、部分ラスター画像よりもデータサイズが小さい。図15(C)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Text」であり、かつ部分描画オブジェクトの保持形式が部分ラスター画像形式であるものを示している。Bitmap−01_01とBitmap−01_02は図10(A)に示すHTMLのデータ構造で定義されているWebサイトのタイトル情報であるコンテンツ要素1002が対応している。同じコンテンツ要素1002が対応しているが、適用した印刷レイアウトが異なるため、生成される部分ラスター画像が異なるものとなっている。Bitmap−01_02は消費トナー削減レイアウトを適用した為、背景は描画せず、枠組みとテキストのみの部分ラスター画像となっている。図15(D)は図14のオブジェクトテーブルにおいて、描画オブジェクト属性が「Text」であり、かつ部分描画オブジェクトの保持形式がフォント形式であるものの保持形態の一例を示している。本実施例ではフォント形式の保持形態として、文字列と使用フォント名を指定して保持している。この図15(D)は図10(A)に示すHTMLのデータ構造で定義されているコンテンツ要素で記事文書をフォント形式で保持した場合を例示している。図15(D)は図15(C)と描画オブジェクト属性が同じ「Text」属性だが、図15(D)は画像形成装置102のコントローラーに内蔵しているフォントを使用しているため、フォント形式で保持している。描画内容を再構築する場合はフォント形式で指定しているフォントをコントローラー内蔵フォントから読み込むことで描画内容を再現できる。一方、図15(C)はWebサイトのタイトル部分であり、特別なフォントが使用されているため、コントローラー内蔵フォントにないフォントを使用している。よって、部分ベクター画像として保持し、描画内容再構築時に使用する。
<Retention form of partial drawing object>
FIG. 15 shows partial raster images, vector data, and font information, which are partial drawing objects constituting the layout, in the document data of the Web site exemplified in FIGS. FIG. 15A shows a partial raster image of a partial drawing object whose drawing object attribute is “Image” in the partial drawing object table of FIG. FIG. 15B shows vector data of a partial drawing object whose drawing object attribute is “Graphic” in the object table of FIG. Since it is vector data, the data size is smaller than that of the partial raster image. FIG. 15C shows the object table of FIG. 14 in which the drawing object attribute is “Text” and the holding format of the partial drawing object is the partial raster image format. Bitmap-01_01 and Bitmap-01_02 correspond to the
印刷物の元文書データ検索時には、これら図15(A)、(B)、(C)、(D)に示される部分描画オブジェクトを図12に示される印刷レイアウトそれぞれに適用させることで、文書データ印刷時の描画内容を再構築する。 When retrieving the original document data of the printed matter, the partial drawing objects shown in FIGS. 15A, 15B, 15C, and 15D are applied to the print layouts shown in FIG. Reconstruct the drawing contents of the time.
<画像形成装置の印刷処理のフロー>
次に図16を用いて、画像形成装置102における印刷処理を説明する。画像形成装置102は文書データの印刷時に、印刷物の元文書データ検索処理のために、印刷情報データを生成する。印刷情報データは、印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトにより構成される。部分描画オブジェクトは部分ラスター画像、ベクターデータ、フォント情報などの形態をとることができる。生成された印刷情報データはファイルサーバー101へ送信され、印刷情報データ管理部に格納される。図1のネットワーク102を介して非図示の情報処理装置から画像形成装置102へ印刷ジョブが投入されると、本処理が開始される。
<Flow of print processing of image forming apparatus>
Next, a printing process in the
まず、S1001において、中央演算装置201は、ネットワーク103を介して情報処理装置104より印刷データを受信する。次に、S1002において、中央演算装置201は、ネットワーク103を介して情報処理装置104より印刷設定を受信する。印刷設定には図12に示される印刷レイアウトの指定も含まれる。
First, in step S <b> 1001, the
次に、S1003において、中央演算装置201は、印刷処理を実行する。次に、S1004において、中央演算装置201は、印刷時の印刷レイアウト情報と、そのレイアウトを構成するために必要な部分描画オブジェクトとして部分ラスター画像、ベクターデータ、フォント情報を生成し、印刷情報データとしてまとめる。
Next, in S1003, the
次に、S1005において、中央演算装置201は、S1004において生成した印刷情報データをファイルサーバー101に送信する。以上の処理により、画像形成装置102における印刷処理が実施される。
In step S <b> 1005, the
<ファイルサーバーの印刷情報データ保管処理のフロー>
次に図17を用いて、ファイルサーバー101における印刷情報データ保管処理を説明する。ファイルサーバー101では、画像形成装置102から印刷情報データを受信すると、図13に示される印刷情報データテーブルと、部分描画オブジェクトテーブルを更新する。重複保持を避ける為、印刷情報データテーブルと部分描画オブジェクトテーブルは、内容が同一である場合は各テーブルに情報を追加しない。受信した印刷情報テーブルに含まれる印刷レイアウト情報と部分描画オブジェクトも、印刷情報データ管理部に保持されるが、こちらも重複するデータが既に存在する場合は保持しないようにする。図16のS1005において、図1のネットワーク102を介して画像形成装置102からファイルサーバー101へ印刷情報データが送信されると、本処理が開始される。
<Flow of print information data storage processing on file server>
Next, print information data storage processing in the
まず、S2001において、中央演算装置301は、ネットワーク103を介して画像形成装置102より印刷情報データを受信する。次に、S2002において、中央演算装置301は、印刷情報データテーブル管理部504で保持している印刷情報データテーブルを参照する。
First, in S2001, the
次に、S2003において、中央演算装置301は、S2001において受信した印刷情報データが印刷情報データテーブルに既に存在するか判定する。本発明では、長期にシステムを運用する際に、印刷情報データの保持領域を効率的に使用するため、保持領域に重複するデータが存在する場合は保存しない。よってここでは、受信した印刷情報データが既にシステムの保持領域に存在する情報であるかを判定し、印刷情報データをシステムに保存すべきかどうかを判定している。印刷情報データが印刷情報データテーブルに既に存在する場合は、処理を終了する。印刷情報データが印刷データテーブルに存在しない場合はS2004へ進む。
In step S2003, the
次に、S2004において、中央演算装置301は、印刷情報データに含まれる印刷レイアウト情報と部分描画オブジェクトを、補助記憶装置304へ保存する。また、同時に印刷情報データテーブルと部分描画オブジェクトデータテーブルも更新する。
Next, in S2004, the
以上の処理により、ファイルサーバー101における印刷情報データ保管処理が実施される。
Through the above process, the print information data storage process in the
<画像形成装置の印刷物の元文書データ検索処理のフロー>
次に図18を用いて、画像形成装置102における印刷物の元文書データ検索処理を説明する。本実施例では画像形成装置102の元文書データ検索処理において、画像検索処理は画像形成装置102上では行わず、ファイルサーバー101上で行う。画像形成装置102は、印刷物をスキャンし、取得したスキャン画像をファイルサーバー101へ送信する。ファイルサーバー101でスキャン画像と一致する元文書データの画像検索処理が実行され、検索結果が画像形成装置102へ送信される。画像形成装置102はファイルサーバー101から送信される検索結果を受信し、操作部210へ表示する。図2に示す画像形成装置102のスキャン装置209を用いて、ユーザが印刷物をスキャン指示すると、本処理が開始される。
<Flow of Original Document Data Retrieval Process of Printed Material of Image Forming Apparatus>
Next, an original document data search process for a printed matter in the
まず、S3001において、中央演算装置201は、スキャン装置209を用いて、印刷物のスキャン画像を取得する。次に、S3002において、中央演算装置201は、ファイルサーバー101へスキャン画像を送信する。スキャン画像送信後は、ファイルサーバー101から検索結果を受信するまで、待機状態となる。ファイルサーバー101から検索結果から送信されると、本処理を再開する。
First, in step S <b> 3001, the
次に、S3003において、中央演算装置201は、ファイルサーバー101から送信される検索結果を受信する。次に、S3004において、中央演算装置201は、受信した検索結果を操作部210に表示する。
In step S <b> 3003, the
以上の処理により、画像形成装置102における印刷物スキャン処理が実施される。
Through the above processing, the printed material scan processing in the
<ファイルサーバーの元文書データ検索処理のフロー>
次に図19を用いて、ファイルサーバー101における元文書データ検索処理を説明する。ファイルサーバー101における元文書データ検索処理は、まず画像形成装置102から送信されるスキャン画像を受信し、特徴量を抽出する。抽出した特徴量から、印刷時に設定された印刷レイアウトを判別する。描画オブジェクトの配置位置など、印刷レイアウトの特徴量にはそれぞれある程度の傾向がある。そのためスキャン画像からの印刷レイアウトの判別には、画像形成装置102から印刷可能な印刷レイアウトの特徴量の傾向と、スキャン画像の特徴量の傾向の類似度から判別する。スキャン画像の印刷レイアウトが判別されると、図13に示される印刷情報データテーブルから、該当する印刷レイアウト情報を持つ印刷情報データを抽出し、絞り込みを行う。そして、印刷情報データが持つ部分描画オブジェクト情報から、該当する部分描画オブジェクトを読み込み、印刷レイアウトを部分描画オブジェクトに適用することで、印刷時の描画内容を再構築する。描画内容の再構築結果に対して特徴量を算出し、スキャン画像の特徴量と比較する。一致した場合は該当する元文書データ情報を検査結果として画像形成装置102へ送信する。一致しない場合は、再度レイアウト絞り込み処理に戻り再検索を行う。元文書データ検索処理が繰り返し行われ、印刷情報データテーブルの全データに対して検索処理を行っても、スキャン画像の特徴量と一致するものが見つからない場合、該当データなしとして検索結果を画像形成装置102に送信する。印刷情報データから図18のS3002において、画像形成装置102からスキャン画像が送信されると、本処理が開始される。
<Flow of original document data search processing on file server>
Next, the original document data search process in the
まず、S4001において、中央演算装置301は、ネットワーク103を介して画像形成装置102よりスキャン画像を受信する。
In step S <b> 4001, the
次に、S4002において、中央演算装置301は、S4001にて受信したスキャン画像から特徴量を抽出し、印刷時に適用された印刷レイアウトを判別する。本システムを長期に運用すると、印刷情報データテーブルが保持する情報量は増加する。印刷情報データテーブルが保持する全ての印刷情報データに対して検索処理を実施すると、運用期間に比例して印刷情報データが増加し、検索結果の算出時間も増加してしまう。そこで、ここではスキャン画像の特徴量の傾向を抽出し、画像形成装置102が印刷可能な印刷レイアウトで、特徴量の傾向の類似度が高いものを検出する。検索時は、この類似度が高い印刷レイアウトと同じ印刷レイアウト情報をもつ印刷情報データのみを検索対象とすることで、検索処理を効率化している。
In step S4002, the
次に、S4003において、中央演算装置301は、印刷情報データ管理部504で管理している印刷情報データテーブルを参照する。
In step S <b> 4003, the
次に、S4004において、中央演算装置301は、参照している印刷情報データテーブルに、S4002で抽出した印刷レイアウト情報が含まれる印刷情報データが存在するか判定する。印刷情報データが存在する場合は、該当する印刷情報データを読み込み、S4005へ進む。印刷情報データが存在しない場合は、S4002へ戻り、処理を繰り返す。印刷情報データが存在する場合においては、該当する印刷情報データが複数ある場合は、該当印刷情報データ全てを読み込む。その場合S4005からS4008までの処理は、S4008において再構築した描画内容の特徴量がスキャン画像の特徴量と一致するまで、印刷情報データの数だけ繰り返される。
In step S <b> 4004, the
次に、S4005において、中央演算装置301は、S4004で読み込んだS4002で抽出した印刷レイアウト情報が含まれる印刷情報データで、検索対象となっていない印刷情報データが存在するか判定する。検索対象となっていない印刷情報データが存在する場合は、S4006へ進む。検索対象となっていない印刷情報データが存在しない場合、S4010へ進む。
Next, in S4005, the
次に、S4006において、中央演算装置301は、S4002で抽出した印刷レイアウト情報が含まれる印刷情報データで使用している部分描画オブジェクトを読み込む。次に、S4007において、中央演算装置301はS4006において読み込んだ部分描画オブジェクトに対して、S4002で抽出した印刷レイアウトを適用して、印刷時の描画内容を再構築する。
In step S4006, the
次に、S4008において、中央演算装置301は、S4009において再構築した印刷時の描画内容の特徴量とスキャン画像の特徴量を抽出し、一致するか判定する。一致する場合は、S4009へ進む。一致しない場合は、S4005へ戻り、処理を繰り返す。
In step S4008, the
次に、S4009において、中央演算装置301は、印刷情報データに含まれる文書データ情報を画像形成装置102へ送信する。S4008において再構築された描画内容の特徴量がスキャン画像の特徴量と一致したということは、印刷情報データに含まれる文書データ情報はスキャンされた出力物の元文書データであると判断できる。よって、ここでは、印刷情報データに含まれる文書データ情報が印刷物の元文書データであるとして検索結果を画像形成装置102へ送信している。
In step S <b> 4009, the
S4010において、中央演算装置301は、印刷情報データテーブルに含まれる全印刷情報データテーブルに対して検索処理が実行されたか、判定する。全印刷情報データテーブルに対してまだ検索処理が実行されていない場合、S4002へ戻り、処理を繰り返す。全印刷情報データテーブルに対して検索処理が実行されている場合は、S4011へ進む。
In step S4010, the
S4011では、印刷情報データテーブルに含まれる全印刷情報データに対して検索処理を実行しても、スキャン画像の元文書データが検出できなかったことになるので、中央演算装置301は、該当データなしとして検索結果を画像形成装置102へ送信する。
In S4011, since the original document data of the scanned image cannot be detected even if the search process is executed for all the print information data included in the print information data table, the
以上の処理により、ファイルサーバー101における元文書データ検索処理が実施される。
With the above processing, the original document data search processing in the
以上、これまで説明した本発明によれば、長期にシステムを運用した場合でも、検索情報データの保持領域を逼迫しない、効率的な印刷物のスキャン画像からの元文書データ検索が可能となる。 As described above, according to the present invention described so far, even when the system is operated for a long period of time, it is possible to efficiently retrieve original document data from a scanned image of a printed matter without constraining the search information data holding area.
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。 The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.
Claims (6)
印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成する手段と、
前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持手段と、
入力された画像と類似する画像を検索する場合、前記保持手段によって保持された前記印刷情報データを検索する検索手段とを
有することを特徴とする画像処理装置。 Generating means for generating print layout information;
Means for generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects;
Holding means for holding the print layout information and the partial drawing object in association as print information data;
An image processing apparatus comprising: search means for searching for the print information data held by the holding means when searching for an image similar to the input image.
印刷対象の描画内容を描画オブジェクトの単位で分割して部分描画オブジェクトを生成するステップと、
前記印刷レイアウト情報と前記部分描画オブジェクトを関連付けて印刷情報データとして保持する保持ステップと、
入力された画像と類似する画像を検索する場合、前記保持ステップによって保持された前記印刷情報データを検索する検索ステップとを
有することを特徴とする画像処理方法。 A generation step for generating print layout information;
Generating a partial drawing object by dividing the drawing content to be printed in units of drawing objects;
A holding step of associating the print layout information with the partial drawing object and holding the information as print information data;
An image processing method comprising: a search step of searching the print information data held by the holding step when searching for an image similar to the input image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014082020A JP2015203918A (en) | 2014-04-11 | 2014-04-11 | Image processor, image processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014082020A JP2015203918A (en) | 2014-04-11 | 2014-04-11 | Image processor, image processing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015203918A true JP2015203918A (en) | 2015-11-16 |
Family
ID=54597365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014082020A Pending JP2015203918A (en) | 2014-04-11 | 2014-04-11 | Image processor, image processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015203918A (en) |
-
2014
- 2014-04-11 JP JP2014082020A patent/JP2015203918A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9135528B2 (en) | Information processing apparatus, job processing method in information processing apparatus, and storage medium | |
US20100091322A1 (en) | Image forming apparatus and method thereof | |
US20140168684A1 (en) | Imaging forming apparatus and method | |
US20130057884A1 (en) | Information processing apparatus, computer program, and control method | |
KR20150020089A (en) | Information processing apparatus, information processing method, processing apparatus, and storage medium | |
JP5754904B2 (en) | Printing apparatus, printing apparatus control method, and program | |
US9030702B2 (en) | Client apparatus, printing system, and display method for converting printing formats, generating preview images, and displaying preview images | |
JP2019067361A (en) | Information processing apparatus, communication system, image forming method, and program | |
JP2009154324A (en) | Image forming apparatus, program, and data processing method | |
JP2015203918A (en) | Image processor, image processing method and program | |
JP5929689B2 (en) | Preview image generation apparatus, preview image generation method, and computer program | |
JP2015106384A (en) | Information processor and control method thereof, and program | |
JP4433044B2 (en) | Image forming apparatus, program, and data processing method | |
JP2008257628A (en) | Information processing device, document combining program, and recording medium | |
US9348547B2 (en) | Document distribution server and document distribution method | |
JP6221543B2 (en) | Program, information processing apparatus, information processing system, and image processing system | |
JP4661832B2 (en) | Print control device and printer driver program | |
JP2014130430A (en) | Information processing apparatus, printing system, and program | |
JP5701234B2 (en) | Image forming apparatus and character drawing program | |
JP2014032436A (en) | Image processing device, image processing method, image forming device, program and recording medium | |
JP2015032250A (en) | Handwriting input terminal, handwritten data storage control program, and handwritten data storage control method | |
JP2012226678A (en) | Information processor, image processing device, image forming device, and program | |
JP2014061648A (en) | Control device for printing | |
JP2013196554A (en) | Program, information processor, and recording medium | |
JP2006195818A (en) | Image processing apparatus and its method, and image processing system |