JP2016024527A - 情報処理装置、プログラム、及び自動ページ差し替え方法 - Google Patents

情報処理装置、プログラム、及び自動ページ差し替え方法 Download PDF

Info

Publication number
JP2016024527A
JP2016024527A JP2014146578A JP2014146578A JP2016024527A JP 2016024527 A JP2016024527 A JP 2016024527A JP 2014146578 A JP2014146578 A JP 2014146578A JP 2014146578 A JP2014146578 A JP 2014146578A JP 2016024527 A JP2016024527 A JP 2016024527A
Authority
JP
Japan
Prior art keywords
page
document data
unit
search
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014146578A
Other languages
English (en)
Other versions
JP2016024527A5 (ja
JP6150766B2 (ja
Inventor
寛 松本
Hiroshi Matsumoto
寛 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2014146578A priority Critical patent/JP6150766B2/ja
Priority to US14/739,584 priority patent/US9569146B2/en
Publication of JP2016024527A publication Critical patent/JP2016024527A/ja
Publication of JP2016024527A5 publication Critical patent/JP2016024527A5/ja
Application granted granted Critical
Publication of JP6150766B2 publication Critical patent/JP6150766B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1204Improving or facilitating administration, e.g. print management resulting in reduced user or operator actions, e.g. presetting, automatic actions, using hardware token storing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1244Job translation or job parsing, e.g. page banding
    • G06F3/1247Job translation or job parsing, e.g. page banding by conversion to printer ready format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のページを有する電子原稿の一部のページを差し替える場合のオペレータの作業負担を軽減することができる情報処理装置、プログラム、及び自動ページ差し替え方法を提供する。
【解決手段】情報処理装置(10)は、ページ記述言語で表される第一の文書データ(40)における複数のページの中から第二の文書データ(50)が示す修正後のページに対応する修正前のページを特定する検索処理を行う検索部(20)と、特定された修正前のページを修正後のページと差し替える差替部(22)とを備える。検索部(20)は複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、修正後のページのオブジェクト構造を解析することにより、検索処理に利用する一種類のオブジェクト種別を決定し、一種類のオブジェクト種別に属するオブジェクトの対比により検索処理を行う。
【選択図】図1

Description

本発明は情報処理装置、プログラム、及び自動ページ差し替え方法に係り、特に、印刷用の電子原稿である文書データを取り扱う情報処理技術に関する。
近時、印刷用の原稿はコンピュータ上で作成され、電子データとして取り扱われる(特許文献1、2)。印刷用の電子原稿のデータ形式として、ページ記述言語(PDL;page description language)で記述された文書データが広く利用されている。PDLで記述された電子文書を「PDL文書」といい、PDL文書のデータを「PDLデータ」という。
PDLデータは、文字や画像などのオブジェクトを基に、ページ毎の印刷内容を表現するデータである。PDLデータは、プリンタやプレートセッタ等の出力機の解像度等に依存しないベクトルデータである。PDLデータは、ラスタイメージプロセッサ(RIP;Raster Image Processor)によってラスタライズ処理することにより、ページイメージを構成する文字や画像などのオブジェクトを画素の集合として表すラスタイメージデータに変換される。ラスタイメージデータは、ページ内の画素をデジタル形式に符号化したデータである。プリンタはラスタイメージデータに基づいて印刷を行い、プレートセッタはラスタイメージデータに基づいて製版を行う。
特開2009−295164号公報 特開2003−76996号公報
印刷用の電子原稿は、通常、複数回の改訂や修正が行われて、最終的な原稿に仕上げられる。特に、雑誌やカタログ、写真集など複数のページを有する印刷物の電子原稿は、編集作業や校閲作業の段階等において、一部のページだけを修正して、修正したページをページ単位で差し替えることがある。複数のページを有するドキュメントの一部のページを修正して、差し替えることを「ページ差し替え」と呼ぶ。「ドキュメント」とは、電子文書を意味しており、ここではPDL文書を示す。
従来の入稿システムにおいてページ差し替えを行う場合、オペレータは、電子原稿における複数のページの中から、差し替え対象である差し替え先のページ番号を指定する必要がある。オペレータが差し替え先ページのページ番号を指定すると、指定した差し替え先ページの内容を、新たに入稿された修正後のページである差し替え元ページと差し替える処理が行われる。「差し替え先ページ」は、差し替え対象となる被差し替えページであり、「修正前のページ」である。「差し替え元ページ」は、被差し替えページの内容に変更が加えられた「修正後のページ」である。
しかしながら、オペレータが差し替え先のページ番号を把握していない場合、複数のページの中から差し替え先のページを探し出さなければならない。オペレータが複数のページの内容をそれぞれ確認しながら、差し替え先のページを見つけることは作業負担が大きく、時間もかかる。
また、差し替え先のページ番号が分かっている場合であっても、次に示す少なくとも三段階の操作が必要であり、オペレータの作業負担が大きく、効率が悪い。
[1]ページ番号の指定、[2]差し替え先ページの確認、[3]差し替え元ページの選択。
本発明はこのような事情に鑑みてなされたものであり、ページ差し替えに伴うオペレータの作業負担を軽減することができる情報処理装置、プログラム、及びに自動ページ差し替え方法を提供することを目的とする。
課題を解決するために、次の発明態様を提供する。
第1態様に係る情報処理装置は、複数のページを有する第一の文書データが記憶される記憶部と、複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得部と、第一の文書データにおける複数のページの中から、修正後のページに対応する修正前のページを特定する検索処理を行う検索部と、検索部により特定された第一の文書データにおける修正前のページを、第二の文書データに含まれた修正後のページと差し替える差替部と、を備え、第一の文書データ及び第二の文書データはそれぞれページ記述言語で表され、検索部は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、第二の文書データに含まれた修正後のページのオブジェクト構造を解析することにより、検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定部と、修正後のページに含まれているオブジェクトのうち、オブジェクト種別決定部によって決定された一種類のオブジェクト種別に属するオブジェクトと、第一の文書データにおける複数のページのそれぞれに含まれているオブジェクトのうち、一種類のオブジェクト種別に属するオブジェクトと、を対比することにより検索処理を行うオブジェクト種別検索処理部と、を含む、情報処理装置である。
第1態様によれば、第一の文書データにおける複数のページのうち、一部のページについて、ページの内容が修正された修正後のページが第二の文書データとして取得される。修正後のページに対して、差し替え先のページが指定されていなくても、修正後のページのオブジェクト構造を解析して、第一の文書データにおける複数のページの中から、修正後のページに対応する修正前のページが自動的に特定され、ページ差し替えの処理が行われる。このため、ページ差し替えに伴うオペレータの作業負担が軽減される。また、複数のオブジェクト種別のうち、一種類のオブジェクト種のみを用いて検索処理を行うため、検索の演算量が比較的少なく、短時間で検索結果を得ることができる。
第2態様として、第1態様の情報処理装置において、優先順位を指定するユーザー操作を受け付ける操作部と、複数のオブジェクト種別に対して、操作部から指定された優先順位を設定する優先順位設定部と、を備える構成とすることができる。
検索に用いるオブジェクト種別の優先度を示す優先順位は予め定められている構成としてもよいし、操作部を通じてユーザーが優先順位を指定することができる構成とすることも可能である。
第3態様として、第1態様又は第2態様の情報処理装置において、複数のオブジェクト種別のそれぞれについて、同じオブジェクト種別に属するオブジェクトの単位でオブジェクト同士の類似度を評価する類似度評価部を備える構成とすることができる。
第一の文書データにおける複数のページの中から、修正後のページに対応する修正前のページを探し出すために、オブジェクトの類似度を計算して類似ページを特定する構成とすることができる。
第4態様として、第1態様から第3態様のいずれか一態様の情報処理装置において、複数のオブジェクト種別は、文字と、画像と、図形と、を含む構成とすることができる。
「文字」は「テキスト」と同義である。オブジェクト種別における「画像」とは、いわゆる「デジタル写真」を示しており、画素毎に階調を示すデジタル信号値を有するデジタル画像を意味している。「デジタル画像」は「電子画像」又は「電子写真」と同義である。「図形」は「画像」と区別されるカテゴリーであり、描画ツール等を用いて作成された線画や模様、又はこれらと色の組み合わせになどの図案をいう。「図形」には、手書きによる線画や、線画と色塗りとの組み合わせが含まれ、「色塗り」にグラデーションも含む。「図形」という用語は、「イラストレーション」或いは「グラフィック」という用語で置き換えることもできる。
第5態様として、第4態様の情報処理装置において、優先順位が初期設定として予め定められており、初期設定において文字の優先順位が最も高く、次に画像、画像の次に図形の順に優先順位が設定されている構成とすることができる。
文字による検索は、画像による検索や図形による検索に比べて、高速かつ正確な類似度の判定が可能である。したがって、文字による検索の優先順位を最上位に設定しておくことが好ましい。また、図形による検索は、図形オブジェクトの領域をビットマップ形式の画像データに変換してから、図形の画像同士を対比する処理を行うことが想定される。このため、図形による検索はデータ変換の処理時間を要し、画像による検索に比べて時間がかかる。したがって、図形による検索の優先順位は、画像による検索の優先順位よりも優先度を低くすることが好ましい。
第6態様として、第4態様又は第5態様の情報処理装置において、オブジェクト種別決定部は、第二の文書データについてページ単位でオブジェクト構造を解析する解析部を有し、解析部は、文字数が第一の閾値以上である文字列の文字オブジェクトが存在するか否かを判定する文字数判定部と、画素数が第二の閾値以上である画像オブジェクトが存在するか否かを判定する画素数判定部と、を備える構成とすることができる。
文字による検索を行う場合に、第一の閾値以上の文字数を有する文字列のみについて類似度を判定することにより、検索の確実性を向上させることができる。
また、画像による検索を行う場合に、第二の閾値以上の画素数を有する画像のみについて類似度を判定することにより、より正確な類似度判定が可能となる。
第7態様として、第4態様から第6態様のいずれか一態様の情報処理装置において、第一の文書データ及び第二の文書データのうち少なくとも一方の文書データのページから、少なくとも図形のオブジェクトを含む領域のビットマップを生成し、かつ、図形のオブジェクトに対応するビットマップ領域を抽出する図形領域抽出部を備える構成とすることができる。
図形のオブジェクトを比較する場合には、ビットマップ形式の画像に変換した図形の画像として比較することが好ましい。
第8態様として、第1態様から第7態様のいずれか一態様の情報処理装置において、第一の文書データにおける修正前のページと修正後のページとのそれぞれのページの内容を表示させる表示部と、差替部によるページの差し替え処理の対象となる修正後のページと、修正後のページに対して検索部により特定された第一の文書データにおける修正前のページと、をそれぞれページ記述言語によるページ記述データのオブジェクトのまま比較することにより、修正後のページに含まれるオブジェクトと修正前のページに含まれるオブジェクトとの差異を検出する差異検出部と、差異検出部によって検出された差異の情報を表示部に表示させる制御を行う表示制御部と、を備える構成とすることができる。
第8態様によれば、修正前のページと修正後のページを表示部の画面上で比較して、変更箇所を確認することができる。第8態様によれば、オブジェクトの属性情報の差異も検出できるため、属性の変更内容についても確認することができる。また、第8態様によれば、オブジェクトの内容に関して、実際に変更した箇所のみの検出が可能である。更に、オブジェクト種別を限定するなど、観点を指定した比較が可能である。
第9態様の情報処理装置は、第8態様の情報処理装置において、表示部に差異の情報を表示させる場合の表示モードとして、修正後のページと修正前のページとを並べて表示する第一のモードと、修正後のページと修正前のページとを切り替えて表示する第二のモードと、修正後のページと修正前のページとの差異を強調して表示する第三のモードと、のうち少なくとも二つのモードを含む複数のモードを有する構成とすることができる。
第10態様として、第8態様又は第9態様の情報処理装置において、表示制御部は、差異検出部によって差異が検出されたオブジェクトの箇所にアイコンを表示させ、かつ、差異検出部によって差異が検出された差異の大きさに応じて、アイコンの形態を変更する構成とすることができる。
第11態様に係るプログラムは、コンピュータに、複数のページを有する第一の文書データが記憶される記憶機能と、複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得機能と、第一の文書データにおける複数のページの中から、修正後のページに対応する修正前のページを特定する検索処理を行う検索機能と、検索機能により特定された第一の文書データにおける修正前のページを、第二の文書データに含まれた修正後のページと差し替える差替機能と、を実現させるためのプログラムであり、第一の文書データ及び第二の文書データはそれぞれページ記述言語で表され、検索機能は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、第二の文書データに含まれた修正後のページのオブジェクト構造を解析することにより、検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定機能と、修正後のページに含まれているオブジェクトのうち、オブジェクト種別決定機能によって決定された一種類のオブジェクト種別に属するオブジェクトと、第一の文書データにおける複数のページのそれぞれに含まれているオブジェクトのうち、一種類のオブジェクト種別に属するオブジェクトと、を対比することにより検索処理を行うオブジェクト種別検索処理機能と、を含む、プログラムである。
第11態様のプログラムについて、第2態様から第10態様で特定した情報処理装置の特定事項と同様の事項を適宜組み合わせることができる。その場合、情報処理装置において特定される処理や機能を担う手段としての処理部や機能部は、これに対応する処理や動作を行うプログラムの「機能」の要素として把握することができる。
第12態様の自動ページ差し替え方法は、複数のページを有する第一の文書データが記憶される記憶工程と、複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得工程と、第一の文書データにおける複数のページの中から、修正後のページに対応する修正前のページを特定する検索処理を行う検索工程と、検索工程により特定された第一の文書データにおける修正前のページを、第二の文書データに含まれた修正後のページと差し替える差替工程と、を備え、第一の文書データ及び第二の文書データはそれぞれページ記述言語で表され、検索工程は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、第二の文書データに含まれた修正後のページのオブジェクト構造を解析することにより、検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定工程と、修正後のページに含まれているオブジェクトのうち、オブジェクト種別決定工程によって決定された一種類のオブジェクト種別に属するオブジェクトと、第一の文書データにおける複数のページのそれぞれに含まれているオブジェクトのうち、一種類のオブジェクト種別に属するオブジェクトと、を対比することにより検索処理を行うオブジェクト種別検索処理工程と、を含む、自動ページ差し替え方法である。
第12態様の自動ページ差し替え方法において、第2態様から第10態様で特定した情報処理装置の特定事項と同様の事項を適宜組み合わせることができる。その場合、情報処理装置において特定される処理や機能を担う手段としての処理部や機能部は、これに対応する処理や動作の「工程(ステップ)」の要素として把握することができる。
本発明によれば、印刷用の原稿のページ差し替えに伴うオペレータの作業負担を軽減することができる。
図1は本発明の実施形態に係る情報処理装置の構成を示したブロック図である。 図2はオブジェクト構造解析部の詳細構成を示したブロック図である。 図3は本実施形態で実現される自動ページ差し替え機能の概要を示す説明図である。 図4は本実施形態による自動ページ差し替え方法の手順を示したフローチャートである。 図5は検索処理の内容を示したフローチャートである。 図6は検索処理の具体的な例を示すフローチャートである。 図7はデジタル検版の機能を有する情報処理装置の要部構成を示すブロック図である。 図8は「並べて表示」の表示モードによる比較画面のGUI(Graphical User Interface)の一例を示す図である。 図9は文字オブジェクトに関する詳細比較画面の一例を示す図である。 図10は画像の詳細比較画面の一例を示す図である。 図11は全てのオブジェクト種別に共通するオブジェクト比較方法の説明図である。 図12(A)は文字列の内容を比較する例の説明図であり、図12(B)は文字列のアピアランスを比較する例の説明図である。 図13は図形領域を抽出する手順の説明図であり、図13(A)はPDLページの例を示し、図13(B)は文字と画像のオブジェクトを除去してビットマップに変換された画像の例を示し、図13(C)は図13(B)のビットマップから図形領域を抽出した例を示している。
以下、添付図面に従って本発明の実施形態について詳細に説明する。
図1は本発明の実施形態に係る情報処理装置10の構成を示したブロック図である。情報処理装置10は、第一の文書データ記憶部12と、データ取得部14と、第二の文書データ記憶部16と、優先順位設定部18と、検索部20と、ページ差替処理部22と、を備える。また、情報処理装置10は、ビットマップ変換部26と、図形領域抽出部28と、差異検出部30と、表示制御部32と、ユーザーインターフェース(User Interface;UI)制御部34と、操作部36と、表示部38と、を備える。
情報処理装置10は、コンピュータのハードウェアとソフトウェアとの組み合わせによって実現することができる。ソフトウェアという用語はプログラムと同義である。「コンピュータ」には、デスクトップ型、ノート型、又は、タブレット型など、各種形態のコンピュータが含まれる。情報処理装置10は、一台のコンピュータで実現することも可能であるし、複数台のコンピュータで機能を分担して実現することもできる。情報処理装置10は、サーバの一機能として実現してもよいし、クライアント端末の一機能として実現してもよい。
また、情報処理装置10の機能は、DTP(Desk Top Publishing)装置の一機能として、又はRIP(Raster Image Processor)装置の一機能として実現することができる。DTP装置は、印刷しようとする画像内容を示す電子原稿を生成する装置である。DTP装置は、文字、画像、図形などの様々な種類の画像部品を編集し、印刷面上にレイアウトする作業を行うために用いられる。DTP装置は、電子原稿の作成機能のほか、電子原稿の編集や校閲などを行う機能を備える構成とすることができる。
RIP装置は、ページ記述言語(PDL:Page Description Language)で表されている電子原稿のデータをラスタライズ処理して印刷用のビットマップ画像のデータに変換する手段として機能する。RIP装置は、電子原稿としての文書データを印刷装置で出力可能なラスターイメージ形式のデータに変換する処理を行う。
情報処理装置10は、DTP装置の機能とRIP装置の機能とを統合した印刷データ処理装置や印刷管理装置、或いは、コンピュータシステムなどの形態によって実現することも可能である。
第一の文書データ記憶部12は、印刷用の電子原稿である第一の文書データ40を記憶しておく手段である。第一の文書データ40は、複数のページを有する文書データであり、一つのファイルの中に複数のページのデータを含んだマルチページの電子文書である。電子文書とは、電子的なデータからなる文書である。「文書」は「ドキュメント」と同義である。第一の文書データ40は、ページ記述言語(PDL:Page Description Language)で表されている。
第一の文書データ40は、データ取得部14を通じて外部から取り込むことができる。また、情報処理装置10が原稿作成機能又は原稿編集機能を有している場合、第一の文書データ40は、情報処理装置10の原稿作成機能又は原稿編集機能によって作成されたものとすることができる。
第一の文書データ記憶部12は、情報処理装置10に内蔵された内部記憶装置であってもよいし、情報処理装置10に接続される外部記憶装置であってもよく、又は、これらの組み合わせであってもよい。「接続される」とは、情報の伝達が可能な関係をいい、接触接続、非接触接続を問わない。接続は、例えば、対応する端子同士の接触接続、有線接続、無線接続、光通信接続、又はこれらの適宜の組み合わせを包含する用語である。また、接続には、図示せぬ電気通信回線を介して接続されるネットワーク接続の形態も含まれる。
第一の文書データ記憶部12は、ハードディスクドライブ(HDD;Hard Disc Drive)、ソリッドステートドライブ(SSD;Solid State Drive)、RAM(Random Access Memory)、光ディスク、若しくは、メモリカード、又はこれらの適宜の組み合わせなど、各種形態の記憶装置によって構成することができる。
データ取得部14は、第二の文書データ50を取り込むことができるインターフェース部である。第二の文書データ50は、第一の文書データ40における複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ文書の電子データである。
ここでは説明を簡単にするために、第一の文書データ40における複数のページのうち、特定の一ページのみを修正して差し替える例を説明する。この場合、修正後のページを示す第二の文書データ50は、一つのページだけの文書データである。ただし、発明の実施に際しては、第二の文書データ50は、複数のページを有する電子文書ファイルとすることができる。即ち、第一の文書データ40における複数のページのうち、二つ以上のページを差し替えることも可能であり、その場合、第二の文書データ50は、修正後のページである二つ以上のページを含む文書ファイルとなる。
第二の文書データ50は、第一の文書データ40と同様に、ページ記述言語で表されている。ページ記述言語で記述された文書データを「ページ記述データ」又は「PDLデータ」という。PDLデータに含まれた一つ又は複数のページのそれぞれを「PDLページ」という。PDLページのページ単位のデータを「ページデータ」という。
ページ記述言語の一例として、例えば、アドビシステムズ社のポストスクリプト(PostScript)を挙げることができる。また、ページ記述用のフォーマットであるPDF(Portable Document Format)は、PostScriptを拡張したファイルフォーマットである。PDFファイルは、ページ記述言語で記述された文書データの一形態に該当する。
第一の文書データ40は、例えば、PDF(Portable Document Format)のマルチページファイル形式の電子文書とすることができる。また、第二の文書データ50もPDFのファイル形式で入稿することができる。
データ取得部14は、外部から又は装置内の他の信号処理部から第二の文書データ50を取り込むデータ入力端子で構成することができる。データ取得部14として、有線又は無線の通信インターフェース部を採用してもよいし、メモリカードなどの外部記憶媒体の読み書きを行うメディアインターフェース部を採用してもよく、若しくは、これら態様の適宜の組み合わせであってもよい。データ取得部14は、第二の文書データ50に限らず、第一の文書データ40その他の各種のデータを取り込む手段として機能し得る。
第二の文書データ記憶部16は、データ取得部14を介して取得された第二の文書データ50を記憶する手段である。第二の文書データ記憶部16と第一の文書データ記憶部12とは、それぞれ別々の記憶装置として構成してもよいし、同一の記憶装置における記憶領域を分けた構成でもよい。
優先順位設定部18は、PDLデータに用いられる複数のオブジェクト種別に対して、検索の優先順位を設定する手段である。PDLデータに使用できるオブジェクトの種類として、文字、画像、線画、スムーズシェードの四種類がある。本例では、オブジェクト種別の分類として「文字」、「画像」及び「図形」の三種類に分類する。オブジェクト種別における「図形」には、線画のオブジェクトとスムーズシェードのオブジェクトとが含まれる。
PDLページは、文字、画像、及び図形の三種類のオブジェクト種別のうち、少なくとも一つのオブジェクト種別のオブジェクトを含むことができる。文字のオブジェクトを「文字オブジェクト」、画像のオブジェクトを「画像オブジェクト」、図形のオブジェクトを「図形オブジェクト」という。
PDLページは、複数のオブジェクト種別のオブジェクトを組み合わせた絵柄のページ内容とすることができる。PDLデータは、ページ内に配置されるオブジェクトを特定するオブジェクト情報と、オブジェクトの配置位置を特定するレイアウト情報とを含む。オブジェクト情報には、オブジェクトの属性に関する情報が含まれる。
優先順位設定部18は、予め定められている固定の優先順位を初期設定(デフォルト値)として有している。例えば、デフォルトでは、「文字」の優先順位が最も高く、次に「画像」、「画像」の次に「図形」の順で優先順位が定められている。
優先順位の設定は、操作部36からのユーザー操作により変更可能である。即ち、ユーザーであるオペレータは操作部36を操作して優先順位を指定することができる。優先順位設定部18は、操作部36からの指示にしたがい、優先順位の設定を変更することができる。優先順位設定部18は、優先順位の情報を検索部20に提供する。
検索部20は、第一の文書データ40における複数のページの中から、第二の文書データ50に係る修正後のページに対応する修正前のページを特定する検索処理を行う処理部である。検索部20は、複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、第二の文書データ50に含まれた修正後のページのオブジェクト構造を解析することにより、検索処理に利用する一種類のオブジェクト種別を決定する。
検索部20は、オブジェクト種別決定部60を有する。オブジェクト種別決定部60は、オブジェクト構造解析部62と、検索用オブジェクト種別判断部64とを備える。オブジェクト構造解析部62は「解析部」の一形態に相当する。
オブジェクト構造解析部62は、PDLデータである第二の文書データ50のオブジェクト構造を解析する処理部である。オブジェクト構造解析部62は、優先順位設定部18により定められた優先順位にしたがい、第二の文書データ50のPDLページに含まれるオブジェクトの解析を行う。
検索用オブジェクト種別判断部64は、オブジェクト構造解析部62の解析結果を基に、検索処理の検索キーとして用いるオブジェクトのオブジェクト種別を一種類だけ定める。
検索部20は、オブジェクト種別検索処理部70を有する。オブジェクト種別検索処理部70は、検索用オブジェクト種別判断部64によって定められた一種類のオブジェクト種別に属するオブジェクトの観点で検索処理を行う。オブジェクト種別検索処理部70は、文字オブジェクト検索部72と、文字オブジェクト類似度評価部73と、画像オブジェクト検索部74と、画像オブジェクト類似度評価部75と、図形オブジェクト検索部76と、図形オブジェクト類似度評価部77と、を備える。文字オブジェクト類似度評価部73、画像オブジェクト類似度評価部75及び図形オブジェクト類似度評価部77の組み合わせが「類似度評価部」の一形態に相当する。
文字オブジェクト検索部72は、第二の文書データ50におけるPDLページに含まれた文字オブジェクトを検索キーとして用い、第一の文書データ40における複数のページの中から、第二の文書データ50に対応する修正前のページを探し出す処理を行う。検索キーとして用いる文字オブジェクトは一つであってもよいし、複数であってもよい。複数の文字オブジェクトを検索キーとして用いることにより、検索の精度を高めることができる。
文字オブジェクト類似度評価部73は、検索キーである文字オブジェクトと、第一の文書データのページに含まれている文字オブジェクトとを比較して、類似度を評価する演算部である。文字オブジェクト類似度評価部73は、第二の文書データ50における同一ページ内に検索キーとして利用できる条件を満たす複数の文字オブジェクトが含まれている場合に、これら複数の文字オブジェクトについて、それぞれ類似度を計算し、複数の文字オブジェクトの類似度を総合してページ全体の類似度を評価する。
文字オブジェクト検索部72は、文字オブジェクト類似度評価部73による評価結果を基に、第一の文書データ40の中から第二の文書データ50に係る修正後のページと類似するページを探し出し、類似するページを「修正前のページ」として特定する。「類似するページ」は、類似度の評価において類似の程度が最も高いページである。
画像オブジェクト検索部74は、第二の文書データ50におけるPDLページに含まれた画像オブジェクトを検索キーとして、第一の文書データ40における複数のページの中から、第二の文書データ50に対応する修正前のページを探し出す処理を行う。
画像オブジェクト類似度評価部75は、検索キーである画像オブジェクトと、第一の文書データのページに含まれている画像オブジェクトとを比較して、類似度を評価する演算部である。画像オブジェクト類似度評価部75は、第二の文書データ50における同一ページ内に検索キーとして利用できる条件を満たす複数の画像オブジェクトが含まれている場合に、これら複数の画像オブジェクトについて、それぞれ類似度を計算し、複数の画像オブジェクトの類似度を総合してページ全体の類似度を評価する。
画像オブジェクト検索部74は、画像オブジェクト類似度評価部75による評価結果を基に、第一の文書データ40の中から第二の文書データ50に係る修正後のページと類似するページを探し出し、類似するページを「修正前のページ」として特定する。
図形オブジェクト検索部76は、第二の文書データ50におけるPDLページに含まれた図形オブジェクトを検索キーとして、第一の文書データ40における複数のページの中から、第二の文書データ50に対応する修正前のページを探し出す処理を行う。
図形オブジェクト類似度評価部77は、検索キーである図形オブジェクトと、第一の文書データのページに含まれている図形オブジェクトとを比較して、類似度を評価する演算部である。
図形オブジェクトを比較する際には、図形オブジェクトの領域をビットマップに変換してから比較を行う。ビットマップ変換部26はPDLページのデータをビットマップ形式の画像データに変換する処理を行う。ビットマップ形式の画像データを「ビットマップデータ」といい、ビットマップデータで表される画像を「ビットマップ画像」という。図形領域抽出部28は、ビットマップデータの中から図形オブジェクトの部分に対応する図形領域を抽出する処理を行う。ビットマップ変換部26と図形領域抽出部28との組み合わせが「図形領域抽出部」の一形態に相当する。
図形オブジェクト類似度評価部77は、図形領域抽出部28によって抽出された図形領域のビットマップ画像同士を比較して、類似度を評価する。図形領域のビットマップ画像同士の類似度を評価する方法については、画像オブジェクトの類似度を評価する方法と同様である。図形オブジェクト類似度評価部77は、第二の文書データ50における同一ページ内に検索キーとして利用できる条件を満たす複数の図形オブジェクトが含まれている場合に、これら複数の図形オブジェクトについて、それぞれ類似度を計算し、複数の図形オブジェクトの類似度を総合してページ全体の類似度を評価する。
図形オブジェクト検索部76は、図形オブジェクト類似度評価部77による評価結果を基に、第一の文書データ40の中から第二の文書データ50に係る修正後のページと類似するページを探し出し、類似するページを「修正前のページ」として特定する。
ページ差替処理部22は、検索部20により特定された第一の文書データ40における修正前のページを、第二の文書データ50に係る修正後のページと差し替えるページ差し替え処理を行う。ページ差し替え処理は、結果的に修正後のページの内容に変更されていればよく、修正前のページのデータ全体を修正後のページのデータで完全に書き換える場合に限らず、修正前のページのデータにおける修正後のページのデータとの共通部分は元のデータを活用し、修正箇所に係る相違点である差異部分の一部のデータを書き換える場合も含む。ページ差替処理部22は「差替部」の一形態に相当する。
ページ差替処理部22によってページ差し替え処理が行われると、第一の文書データ記憶部12に、ページ差し替え処理後の第一の文書データ40が記憶される。ページ差し替え処理後の第一の文書データ40を保存する際には、ページ差し替え前のファイルを上書き保存する構成であってもよいし、ページ差し替え前のファイルを残して、ページ差し替え処理後の第一の文書データ40を保存する構成であってもよい。
差異検出部30は、ページ差替処理部22によるページの差し替え処理の対象となる修正後のページと、第一の文書データにおける修正前のページと、をそれぞれページ記述言語によるページ記述データのオブジェクトのまま比較することにより、修正後のページに含まれるオブジェクトと修正前のページに含まれるオブジェクトの差異を検出する処理部である。
表示制御部32は、表示部38の画面表示を制御する。即ち、表示制御部32は、表示部38に各種の情報を表示させる表示制御を行う。表示制御部32は、差異検出部30によって検出された差異の情報を表示部38に表示させる制御を行う。
ユーザーインターフェース(UI;User Interface)制御部34は、操作部36からの入力処理と、表示部38への出力処理を制御する。表示部38には、液晶ディスプレイや有機EL(Organic Electro-Luminescence)ディスプレイなどの表示デバイスを用いることができる。表示部38は、画面上での表示を通じてオペレータに情報を提供する手段である。操作部36は、ユーザー操作を受け付ける入力装置である。操作部36は、キーボード、マウス、タッチパネル、トラックボールなど、各種の入力装置を採用することができ、これらの適宜の組み合わせであってもよい。オペレータは、操作部36を使って各種情報の入力を行うことができる。
図2はオブジェクト構造解析部62の詳細構成を示したブロック図である。オブジェクト構造解析部62は、文字数閾値設定部82と、文字数判定部83と、画像オブジェクトの画素数閾値設定部84と、画像オブジェクトの画素数判定部85と、図形領域の画素数閾値設定部86と、図形領域の画素数判定部87と、ビットマップ変換部88と、図形領域抽出部89と、を備える。
文字数閾値設定部82は、文字による検索を行うか否かの判定基準となる文字数に関する閾値を設定する。この文字数に関する閾値を「文字数閾値」という。文字数閾値は、文字オブジェクトによる検索を行うことができる文字列の文字数の下限値を規定する値である。つまり、文字数閾値以上の文字数であるという条件を満たす文字オブジェクトを検索キーとして利用することができる。文字数閾値は、「第一の閾値」に相当する。
文字数閾値は、予めプログラムによって初期設定値が定められている。また、このような初期設定値による文字数閾値の設定に代えて、又は、これと組み合わせて、操作部36からのユーザー操作に基づいて、文字数閾値を所望の値に設定したり、変更したりすることができる。
文字数判定部83は、修正後のページの中に、文字数閾値以上の文字列からなる文字オブジェクトが存在するか否かを判断する。
画像オブジェクトの画素数閾値設定部84は、画像による検索を行うか否かの判定基準となる画素数に関する閾値を設定する。この画像オブジェクトの画素数に関する閾値を「画像オブジェクトの画素数閾値」という。画像オブジェクトの画素数閾値は、画像オブジェクトによる検索を行う場合に要求される画像オブジェクトの画素数の下限値を規定する値である。つまり、画像オブジェクトの画素数閾値以上の画素数であるという条件を満たす画像オブジェクトを検索キーとして利用することができる。画像オブジェクトの画素数閾値は、「第二の閾値」に相当する。
画像オブジェクトの画素数閾値は、予めプログラムによって初期設定値が定められている。また、このような初期設定値による画像オブジェクトの画素数閾値の設定に代えて、又は、これと組み合わせて、操作部36からのユーザー操作に基づいて、画像オブジェクトの画素数閾値を所望の値に設定したり、変更したりすることができる。
画像オブジェクトの画素数判定部85は、修正後のページの中に、画像オブジェクトの画素数閾値以上の画素数を有する画像オブジェクトが存在するか否かを判断する。
図形領域の画素数閾値設定部86は、図形による検索を行うか否かの判定基準となる画素数に関する閾値を設定する。図形領域の画素数に関する閾値を「図形領域の画素数閾値」という。図形領域の画素数閾値は、図形による検索を行う場合に要求される図形領域の画素数の下限値を規定する値である。つまり、図形領域の画素数閾値以上の画素数であるという条件を満たす図形オブジェクトを検索キーとして利用することができる。
図形領域の画素数閾値は、予めプログラムによって初期設定値が定められている。また、このような初期設定値による図形領域の画素数閾値の設定に代えて、又は、これと組み合わせて、操作部36からのユーザー操作に基づいて、図形領域の画素数閾値を所望の値に設定したり、変更したりすることができる。
図形領域の画素数判定部87は、修正後のページの中に、図形領域の画素数閾値以上の画素数の図形領域が存在するか否かを判断する。
ビットマップ変換部88は、修正後のページのPDLデータをビットマップ形式の画像データに変換する処理を行う。図形領域抽出部89は、ビットマップ変換部88によって生成されたビットマップデータの中から図形オブジェクトの部分に対応するビットマップ領域である図形領域を抽出する処理を行う。
図2に示したビットマップ変換部88と図形領域抽出部89とは、図1で説明したビットマップ変換部26と図形領域抽出部28とそれぞれ別々の構成であってもよいし、同一の構成を兼用してもよい。ビットマップ変換部26と図形領域抽出部28の組み合わせ、及びビットマップ変換部88と図形領域抽出部89の組み合わせは、第一の文書データ40及び第二の文書データ50のうち少なくとも一方の文書データのページから、少なくとも図形のオブジェクトを含む領域のビットマップを生成し、かつ、図形のオブジェクトに対応するビットマップ領域を抽出する役割を果たす。
図2に示したオブジェクト構造解析部62は、図1で説明した優先順位設定部18で定められた優先順位にしたがって、文字数判定部83、画像オブジェクトの画素数判定部85及び図形領域の画素数判定部87による判定を段階的に行う。
例えば、検索の優先順位が高い方から、文字、画像、図形の順に優先順位が定められている場合、まず、文字数判定部83により、第一の閾値である文字数閾値以上の文字列からなる文字オブジェクトが存在するか否かが判定される。修正後のページの中に文字数閾値以上の文字列からなる文字オブジェクトが存在している場合は、文字数判定部83から、文字数閾値以上の文字列という条件を満たす文字オブジェクトが存在することを示す判定情報が検索用オブジェクト種別判断部64(図1参照)に通知される。検索用オブジェクト種別判断部64は、文字数判定部83から得られる判定情報に基づき、検索に用いる一種類のオブジェクト種別として「文字」のオブジェクト種別を決定する。この場合、文字よりも優先順位が低い画像に関する画像オブジェクトの画素数判定部85と、図形に関する図形領域の画素数判定部87と、による判定処理は省略することができる。
修正後のページの中に文字数閾値以上の文字列からなる文字オブジェクトが存在していない場合は、画像オブジェクトの画素数判定部85により、第二の閾値である画像オブジェクトの画素数閾値以上の画素数を有する画像オブジェクトが存在するか否かが判定される。修正後のページの中に画像オブジェクトの画素数閾値以上の画素数を有する画像オブジェクトが存在している場合は、画像オブジェクトの画素数判定部85から、画像オブジェクトの画素数閾値以上の画素数という条件を満たす画像オブジェクトが存在することを示す判定情報が検索用オブジェクト種別判断部64(図1参照)に通知される。検索用オブジェクト種別判断部64は、画像オブジェクトの画素数判定部85から得られる判定情報に基づき、検索に用いる一種類のオブジェクト種別として「画像」のオブジェクト種別を決定する。この場合、画像よりも優先順位が低い図形に関する図形オブジェクトの画素数判定部87による判定処理は省略することができる。
また、修正後のページの中に文字数閾値以上の文字列からなる文字オブジェクトが存在せず、かつ、画像オブジェクトの画素数閾値以上の画素数を有する画像オブジェクトが存在していない場合は、必然的に図形による検索を行うことになる。
したがって、図形の優先順位が最も低い順位に設定されている場合は、図形オブジェクトの画素数判定部87による判定処理は省略することができる。図形の優先順位が最下位に固定される構成の場合、図形領域の画素数閾値設定部86と図形領域の画素数判定部87とを省略した構成とすることができる。
図3は本実施形態で実現される自動ページ差し替え機能の概要を示す説明図である。「ページ差し替え」とは、複数のページを有する電子文書(ドキュメント)の中の一部のページを修正して、ページ単位で差し替えることをいう。
本実施形態では、ページ差し替え前の電子文書の中の一つのページ42に関する修正後のページ52の内容を示す電子文書が入稿される。「ページ差し替え前の電子文書」は、図1で説明した第一の文書データ40に相当し、第一の文書データ記憶部12に格納されている。図3に示した「修正後のページ52」は、図1で説明した第二の文書データ50に相当する。
図3では、修正後のページ52は、ページ差し替え前の電子文書の中の第2ページ目(ページ番号=2)のページ42の内容を修正した電子文書として描かれている。第2ページ目のページ42が「修正前のページ」に該当する。オペレータは、差し替え先のページを指定せずに、修正後のページ52の電子文書を入稿する。
修正後のページ52が入稿されると、ページ差し替え前の電子文書の中から、修正後のページ52に対応した修正前のページ(ここでは第2ページ目のページ42)を自動的に認識し、修正前のページ(符号42)を修正後のページ52に差し替える処理が行われる。
入稿された修正後のページ52に対応する修正前のページ42を自動的に認識し、ページを差し替える機能が「自動ページ差し替え機能」である。
図4は本実施形態による自動ページ差し替え方法の手順を示したフローチャートである。図4のステップS12からステップS18に示した各工程は、情報処理装置10(図1参照)による処理の実行を通じて実施される。
まず、複数のページを有する第一の文書データ40が第一の文書データ記憶部12に記憶される(図4のステップS12)。ステップS12は、「記憶工程」の一形態に相当する。また、第一の文書データ40を第一の文書データ記憶部12に記憶する機能が「記憶機能」の一形態に相当する。
次いで、情報処理装置10(図1参照)は、修正後のページを含む第二の文書データ50を取得する(図4のステップS14)。ステップS14は、「データ取得工程」の一形態に相当する。また、第二の文書データ50を取得する機能が「データ取得機能」の一形態に相当する。
次いで、検索部20(図1参照)は、第一の文書データ40から、修正後のページに対応する修正前のページを特定する検索処理を行う(図4のステップS16)。ステップS16は「検索工程」の一形態に相当する。また、ステップS16に示した検索処理を行う機能が「検索機能」の一形態に相当する。
次いで、ページ差替処理部22(図1参照)は、検索工程(図4のステップS16)により特定された第一の文書データ40の修正前のページを、修正後のページと差し替えるページ差し替えの処理を行う(図4のステップS18)。ステップS18は「差替工程」の一形態に相当する。また、ページ差し替えの処理を行う機能が「差替機能」の一形態に相当する。なお、図4において、ステップS12とステップS14の順序は入れ替えることが可能である。
図5は図4のステップS16に示した検索処理の内容を示したフローチャートである。
図5に示したように、検索処理は、オブジェクト種別に対する検索の優先順位を特定する工程(ステップS22)と、修正後のページのオブジェクト構造を解析する工程(ステップS24)と、複数のオブジェクト種別の中から、検索処理に利用する一種類のオブジェクト種別を決定する工程(ステップS26)と、決定された一種類のオブジェクト種別に属するオブジェクトによって検索を行う工程(ステップS28)と、を含む。
ステップS22は、図1で説明した優先順位設定部18による優先順位の設定に従う。図5のステップS24は、図1及び図2で説明したオブジェクト構造解析部62によって行われる。定められた検索の優先順位にしたがって、優先順位の高いオブジェクト種別の順に、修正後のページの中に、検索キーとして利用できる条件を満たすオブジェクトが存在するか否かの判断が行われる。
図5のステップS26では、ステップS24による解析結果を基に、検索処理に利用する一種類のオブジェクト種別が決定される。ステップS26の工程が「オブジェクト種別決定工程」の一形態に相当する。また、オブジェクト種別を決定する機能が「オブジェクト種別決定機能」の一形態に相当する。
ステップS28では、ステップS26で決定された一種類のオブジェクト種別に属するオブジェクトを検索キーとして、検索を行う。ステップS28の工程が「オブジェクト種別検索処理工程」の一形態に相当する。また、一種類のオブジェクト種別に属するオブジェクトによって検索処理を行う機能が「オブジェクト種別検索処理機能」の一形態に相当する。
図6は検索処理の具体的な例を示すフローチャートである。ここでは、検索の優先順位が文字、画像、図形の順に定められている場合を例に説明する。
まず、入稿された修正後のページに対して、文字数が第一の閾値以上となる文字オブジェクトが存在するか否かの判断を行う(ステップS32)。修正後のページの中に第一の閾値以上の文字数を有する文字列のオブジェクトが存在している場合には、ステップS32でYes判定となり、文字による検索を行う(ステップS33)。
文字による検索(ステップS33)の工程では、第一の閾値以上の文字数を有する文字列の文字オブジェクトを検索キーとして、第一の文書データ40における複数のページの中から、検索キーの文字オブジェクトと類似する文字オブジェクトを含む類似ページを探し出す処理を行う。ここでいう「類似ページ」が、修正後のページに対応する「修正前のページ」として特定される。
第一の閾値以上の文字数を有する文字列のオブジェクトだけ類似度を判定することで、検索の確実性を向上させることができる。
文字による検索は、画像や図形と比較して、高速かつ正確な類似度判定が可能である。したがって、優先順位の設定に関しては、文字の優先順位を最も高い順位に設定することが好ましい。
ステップS32において、修正後のページの中に第一の閾値以上の文字数を有する文字列のオブジェクトが存在していない場合には、ステップS32でNo判定となり、ステップS34に進む。
ステップS34では、修正後のページの中に第二の閾値以上の画素数を有する画像オブジェクトが存在しているか否かの判断を行う。修正後のページの中に第二の閾値以上の画素数を有する画像オブジェクトが存在している場合には、ステップS34でYes判定となり、画像による検索を行う(ステップS35)。
画像による検索(ステップS35)の工程では、第二の閾値以上の画素数を有する画像オブジェクトを検索キーとして、第一の文書データ40における複数のページの中から、検索キーの画像オブジェクトと類似する画像オブジェクトを含む類似ページを探し出す処理を行う。
第二の閾値以上の画素数を有する画像オブジェクトのみについて、比較することで、正確に類似度を判定することができる。
ステップS34において、修正後のページの中に第二の閾値以上の画素数を有する画像オブジェクトが存在していない場合には、ステップS34でNo判定となり、ステップS37に進む。
ステップS37では、図形による検索を行う。図形による検索(ステップS37)は、図形オブジェクトの部分をビットマップ形式の画像データに変換した上で、つまり、RIPによって画像化した上で、ビットマップ画像として類似度を判定する。
図形による検索では、RIP処理を要するため、文字による検索(ステップS33)や画像による検索(ステップS35)に比べて、処理時間を要する。したがって、図形による検索は、画像による検索よりも優先順位を低く設定することが好ましい。
次に、情報処理装置10におけるデジタル検版の機能について説明する。
デジタル検版とは、二つのページをモニタ上で比較し、変更箇所を確認することをいう。従来のデジタル検版は、PDLページの全体をRIP処理し、修正前のページと修正後のページのビットマップ同士を比較する方法が採用されていた。しかしながら、このような従来のデジタル検版の方法では、変更箇所は検出できるが、PDLオブジェクトの属性の変更内容を確認できないという欠点がある。「PDLオブジェクトの属性の変更内容」の一例として、例えば、RGB画像がCMYK画像に変更されたこと、などがある。従来のデジタル検版の方法では、画像オブジェクトの表色系(色空間)が変更されても、差異として把握することが困難であった。
また、従来のデジタル検版の方法では、ページ全体をRIP処理してページ全体のビットマップ画像として比較されるため、ページ内におけるオブジェクトの僅かな変更箇所が、ビットマップ画像では大きな差異として検出されてしまう場合がある。
例えば、文字の挿入や削除によって文字列に改行が発生するなどして、文字列全体がずれてしまった場合には、その全体が差異として検出されてしまう。
このような課題に対して、本実施形態では、対比する二つのページについて、PDLのオブジェクトのままデジタル検版を行う。本実施形態のデジタル検版方法によれば、変更箇所の検出に加え、PDLのオブジェクトとして、属性がどのように変更されたのかを認識することができる。また、文字の挿入や削除など、僅かな変更によって全体がずれても、真に変更した箇所のみの検出が可能である。更に、本実施形態のデジタル検版方法によれば、オブジェクト種別の観点を指定した比較が可能である。例えば、文字のみの比較、或いは、画像のみの比較というように、オブジェクト種別を限定した比較が可能である。
図7は、デジタル検版の機能を有する情報処理装置10の要部構成を示すブロック図である。図7において、図1で説明した要素と同一の要素には同一の符号を付し、その説明は省略する。
差異検出部30は、文字オブジェクト比較処理部92と、画像オブジェクト比較処理部94と、図形オブジェクト比較処理部96と、を備える。また、情報処理装置10は、表示モード決定部98を備える。
差異検出部30は、第一の文書データ記憶部12から修正前のページ102のデータを取り込み、かつ、第二の文書データ記憶部16から修正後のページ104のデータを取り込み、両ページを比較することにより、両ページの差異を検出する処理を行う。差異検出部30は、ページ内に含まれる全オブジェクトについて、それぞれ差異の有無を判断し、オブジェクト毎に差異の情報を生成することができる。
文字オブジェクト比較処理部92は、修正前のページ102と修正後のページ104とをPDLのオブジェクトのまま比較して、文字オブジェクトの差異情報112を生成する。文字オブジェクトの差異情報112は、修正前のページ102に含まれる文字オブジェクトと、修正後のページ104に含まれる文字オブジェクトの差異、つまり相違点を示す情報である。文字オブジェクトの差異情報112には、文字列の内容としての差異を示す情報、アピアランスの差異を示す情報、及び、フォントなどの属性の差異を示す情報を含めることができる。
画像オブジェクト比較処理部94は、修正前のページ102と修正後のページ104とをPDLのオブジェクトのまま比較して、画像オブジェクトの差異情報114を生成する。画像オブジェクトの差異情報114は、修正前のページ102に含まれる画像オブジェクトと、修正後のページ104に含まれる画像オブジェクトの差異、つまり相違点を示す情報である。画像オブジェクトの差異情報114には、画像の内容としての差異を示す情報、及び、画像サイズなどの属性の差異を示す情報を含めることができる。画像の属性には、画像サイズの他に、解像度、圧縮方式、及び、色空間などを含めることができる。
図形オブジェクト比較処理部96は、修正前のページ102と修正後のページ104とを比較して、図形オブジェクトの差異情報116を生成する。図形オブジェクトの比較に際しては、ビットマップ画像に変換したデータ同士を比較する。
表示モード決定部98は、デジタル検版の機能において、修正前のページ102と修正後のページ104とを表示部38の画面に表示させる際の表示モードを特定する。本例の情報処理装置10は、デジタル検版の表示モードとして、「並べて表示」、「切り替えて表示」、「差分強調表示」の三種類の表示モードを有している。
「並べて表示」のモードは、修正後のページ104と修正前のページ102とを一画面に同時に並べて表示する表示形態である。「切り替えて表示」のモードは、修正後のページ104と修正前のページ102とを交互に切り替えて表示する表示形態である。「切り替えて表示」の表示の切り替えは自動的に又はユーザー操作に応動して行われる。二つのページを自動的に切り替え表示させる場合、表示の切り替えの時間間隔の設定は、ユーザーが任意に指定又は選択することができる構成が好ましい。
「差分強調表示」のモードは、修正後のページ104と修正前のページ102との差分を視覚的に強調して表示する表示形態である。「差分」は「差異」と同義である。強調表示の方法として、例えば、ハイライト表示、点滅表示、若しくは、拡大表示、又はこれらの適宜の組み合わせを採用することができる。
「並べて表示」のモードは「第一のモード」に相当し、「切り替えて表示」のモードは「第二のモード」に相当し、「差分強調表示」のモードは「第三のモード」に相当する。表示モードは少なくとも一種類あればよいが、好ましくは、上記の三種類から選択される少なくとも二つの表示モードを含む複数の表示モードを有する構成とするのが望ましい。
表示モード決定部98は、操作部36からのユーザー操作に応じて表示モードを設定することができる。また、表示モード決定部98は、三種類の表示モードの中から、デフォルトの表示モードを自動的に決定する処理を行う。デフォルトの表示モードは、対比される二つのページの差分の大きさに応じて自動的に変更される。例えば、二つのページの相違点を比較的に容易に把握できる程度にページ間の差分が大きい場合は「並べて表示」のモードに設定される。また、二つのページの相違点が一見しただけでは分かりにくい程度にページ間の差分が小さい場合には「差分強調表示」のモードに設定される。また、表示モード決定部98により決定されたデフォルトの表示モードは、操作部36からのユーザー操作によって変更することができる。
図8は、「並べて表示」の表示モードによる比較画面のGUI(Graphical User Interface)の例である。表示ウインドウ120は、表示モード選択欄122と、文字のオブジェクト種別指定ボタン124と、画像のオブジェクト種別指定ボタン126と、図形のオブジェクト種別指定ボタン128と、を備える。「ボタン」という用語はGUIボタンを意味している。なお、GUIボタンについて「押す」という表現には、クリックする、タッチする、或いは、マウスオーバーなど、ボタンに対応した指令の入力を行う動作が含まれる。
表示モード選択欄122は、モード種別表示ボックス130とプルダウンボタン132とを有する。モード種別表示ボックス130は、現在選択されている表示モードの種類を示すモード種別の情報が提示される表示欄である。プルダウンボタン132は、表示モードの選択候補を表示させるボタンである。プルダウンボタン132を押すと、表示モードの選択候補を含んだ図示せぬプルダウンメニューが表示される。オペレータは、プルダウンメニューの中から表示モードを選択する操作を行うことにより、表示モードを変更することができる。
「並べて表示」の表示モードの場合、図8に示すように、修正前のページ102の印刷画像内容と、修正後のページ104の印刷画像内容とが画面上に、同時に並べて表示される。図8において表示ウインドウ120の左側の領域が修正前のページ102のイメージを表示する修正前ページ表示領域142であり、右側の領域が修正後のページ104のイメージを表示する修正後ページ表示領域144である。なお、修正前ページ表示領域142と修正後ページ表示領域144の左右の関係を入れ替えて表示する形態も可能である。また、修正前のページ102と修正後のページ104を上下に並べて表示させる形態も可能である。
修正後のページ104について、修正前のページ102と比較してオブジェクトの差異が検出されると、差異があるオブジェクトの場所にアイコン152、154、156が表示される。アイコン152、154、156のいずれかを押すと、差異(差分)の詳細な情報を表示する詳細表示が行われる。
アイコン152、154、156は、オブジェクトの差異(差分)の大きさに応じて、表示形態が変更される。アイコンの表示形態を変更する例として、アイコンの色を変更する態様、或いは、アイコンの図柄自体を変更する態様、又はこれらの組み合わせなどがある。例えば、差分の程度に応じて、アイコンの色を「青色」、「黄色」、「赤色」に切り替える態様とすることができる。差分が相対的に小さい変更箇所について「青色」のアイコンを表示し、差分が相対的に大きい変更箇所について「赤色」のアイコンを表示し、中間的なレベルの差分の変更箇所について「黄色」のアイコンを表示するという態様がある。また、逆に、差分が小さいほど相違点がわかり難いため、差分の小さい変更箇所について、オペレータに注意を喚起するための強調色として「赤色」のアイコンを表示するという態様も可能である。
文字のオブジェクト種別指定ボタン124と、画像のオブジェクト種別指定ボタン126と、図形のオブジェクト種別指定ボタン128とは、比較するオブジェクト種別の観点を指定するためのGUIボタンである。文字のオブジェクト種別指定ボタン124は、文字のオブジェクトに限定した比較を行う際に操作されるボタンである。文字のオブジェクト種別指定ボタン124が押されると、文字オブジェクトのみについての比較が可能となる。
画像のオブジェクト種別指定ボタン126は、画像のオブジェクトに限定した比較を行う際に操作されるボタンである。画像のオブジェクト種別指定ボタン126が押されると、画像オブジェクトのみについての比較が可能となる。
図形のオブジェクト種別指定ボタン128は、図形のオブジェクトに限定した比較を行う際に操作されるボタンである。図形のオブジェクト種別指定ボタン128が押されると、図形オブジェクトのみについての比較が可能となる。
図9は文字オブジェクトに関する詳細比較画面の一例である。図8で説明したアイコン152をクリック又はマウスオーバーすると、アイコン152に対応した文字オブジェクトに関する差分の詳細情報を表示する画面として、図9に示すような文字詳細比較ウインドウ160が表示される。
文字詳細比較ウインドウ160は、修正前文字列表示領域162と、修正後文字列表示領域164と、属性比較表示領域166とを含む。修正前文字列表示領域162は、修正前のページ102(図8参照)に含まれた文字オブジェクトの文字列を表示する表示欄である。修正後文字列表示領域164は、修正後のページ104(図8参照)に含まれた文字オブジェクトの文字列を表示する表示欄である。本例では、修正前文字列表示領域162と修正後文字列表示領域164は上下に並べて配置されている。ただし、修正前文字列表示領域162と修正後文字列表示領域164の上下の配置関係を入れ替える態様や、左右に並べて配置する態様なども可能である。
修正前文字列表示領域162に示される修正前の文字列と、修正後文字列表示領域164に表示される修正後の文字列とを比較して、相違している文字列の部分、つまり差異の部分がハイライト表示される。ハイライト表示により、相違点が強調され、オペレータに注意を喚起することができる。
属性比較表示領域166は、修正前と修正後とで文字種の違いに関する情報を比較表示する領域である。文字種の違いとして、ここではフォント名と、フォントサイズの情報を表示させている。図9には示されていないが、文字種の違いに関する他の情報として、文字の色、太字、斜字のうち少なくとも一つの情報を表示させることができる。
このような文字詳細比較ウインドウ160による比較表示により、修正前後の文字オブジェクトの相違点をオペレータが確認しやすいものとなっている。
図10は画像の詳細比較画面の一例である。図8で説明したアイコン154をクリック又はマウスオーバーすると、アイコン154に対応した画像オブジェクトに関する差分の詳細情報を表示する画面として、図10に示すような画像詳細比較ウインドウ170が表示される。
画像詳細比較ウインドウ170は、修正前画像表示領域172と、修正後画像表示領域174と、属性比較表示領域176と、警告表示領域178とを含む。
修正前画像表示領域172は、修正前のページ102(図8参照)に含まれた画像オブジェクトを表示する表示欄である。修正後画像表示領域174は、修正後のページ104(図8参照)に含まれた画像オブジェクトを表示する表示欄である。本例では、修正前画像表示領域172と修正後画像表示領域174は左右に並べて配置されている。ただし、修正前画像表示領域172と修正後画像表示領域174の左右の配置関係を入れ替える態様や、上下に並べて配置する態様なども可能である。
属性比較表示領域176は、修正前と修正後とで画像オブジェクトの属性の違いに関する情報を比較表示する領域である。画像オブジェクトの属性の違いとして、ここでは画像形式、解像度、及び表色系の情報を表示させている。
警告表示領域178は、オペレータに対して注意を喚起するメッセージを表示する表示欄である。
このような画像詳細比較ウインドウ170による比較表示により、修正前後の画像オブジェクトの相違点をオペレータが確認しやすいものとなっている。
図10は画像オブジェクトの詳細比較表示の例であるが、図形オブジェクトの詳細比較表示についても図10と同様の詳細比較表示を採用することができる。
[オブジェクトの比較方法について]
ここで、オブジェクトの比較方法について説明する。第一の文書データ40(図1参照)における複数のページの中から、第二の文書データ50に係る修正後のページに対応する「修正前のページ」を検索する場合、次に示すルール1,2にしたがってオブジェクトの比較を行い、類似するページを発見する。
[ルール1]対比される二つのページ間で、ページ内に配置されるオブジェクトの座標が最も近い同じオブジェクト種別のオブジェクト同士を比較し、オブジェクト同士の類似度を算出する。
[ルール2]対比される二つのPDLページのうち、同じオブジェクト種別のオブジェクトの数が多い方のページについて、同じオブジェクト種別の全オブジェクトについてルール1にしたがって類似度を算出し、算出された各オブジェクトの類似度を足し合わせた値をページ全体の類似度とする。
図11に示す具体例を用いてルール1及びルール2に基づく比較方法を説明する。図11の左側に示したページ[1]と右側に示したページ[2]とが、対比される二つのページである。
ページ[1]が第一の文書データ40に含まれたページであり、ページ[2]が第二の文書データ50に含まれたページであると理解してもよいし、逆に、ページ[1]が第二の文書データ50に含まれたページであり、ページ[2]が第一の文書データ40に含まれたページであると理解してもよい。
ページ[1]は、A,B,C,Dで示した4つのオブジェクトを有している。ページ[2]は、E,F,Gで示した3つのオブジェクトを有している。ここでは説明を簡単にするために、AからGの各記号で示した各オブジェクトは、すべて同じオブジェクト種別に属するものであるとする。例えば、AからGの各記号で示した各オブジェクトは、すべて「文字」のオブジェクトであるとする。また、AからGの各記号で示した各オブジェクトは、オブジェクト種別に対応して定められた「文字数閾値」、「画像オブジェクトの画素数閾値」、又は「図形領域の画素数閾値」に対して、閾値以上となる条件を満たすものであるとする。
ページ[1]に配置されるオブジェクトAに注目すると、ページ[2]に配置されるオブジェクトEからGのうち、ページ[1]におけるオブジェクトAの座標に最も近い同じオブジェクト種別のオブジェクトはオブジェクトEである。ページ上におけるオブジェクトの座標は、オブジェクトの配置位置を示す。
オブジェクトAとオブジェクトEの組み合わせは、各ページにおける座標が最も近い同じオブジェクト種別のオブジェクト同士に該当する。
同様に、オブジェクトBとオブジェクトEの組み合わせ、オブジェクトCとオブジェクトFの組み合わせ、オブジェクトDとオブジェクトGの組み合わせ、のそれぞれが各ページにおける座標が最も近い同じオブジェクト種別のオブジェクト同士に該当する。
ルール1にしたがい、オブジェクトAとオブジェクトEを比較して類似度SAEを算出する。
また、ルール2にしたがい、同様に、オブジェクトBとオブジェクトEを比較して類似度SBEを算出し、かつ、オブジェクトCとオブジェクトFを比較して類似度SCFを算出し、かつ、オブジェクトDとオブジェクトGを比較して類似度SDGを算出する。
そして、これら算出された類似度SAE、SBE、SCF、SDGを足し合わせた値「SAE+SBE+SCF+SDG」をページ全体の類似度とする。ページ全体の類似度をSで表す場合、「S=SAE+SBE+SCF+SDG」である。
AからGの各記号で示した各オブジェクトが、すべて「画像」のオブジェクトである場合、或いは、すべて「図形」のオブジェクトである場合についても同様である。
[オブジェクト種別毎の比較方法について]
次に、オブジェクト種別毎の比較方法について説明する。
<文字列の比較方法について>
文字列の比較方法としては、文字列の内容比較と、文字列のアピアランス比較とがある。
文字列の内容比較とは、文字列そのものがどれだけ変更されたかを比較することを意味する。図12(A)に例を示す。図12(A)の左側に示した文字列「ABCDE」と、右側に示した文字列「ABDCE」とを比較すると、左側の文字列の一部である「CD」の部分が、右側の文字列では「DC」に変更されている。このように文字列そのものがどれだけ変更されたかを比較することが「文字列の内容比較」である。
文字列の内容を比較する場合、対比される二つの文字列の類似度を評価する方法として、例えば、レーベンシュタイン距離(Levenshtein Diatance)、或いは、ジャロ−ウィンクラー距離(Jaro-Winkler Diatance)に代表される、一般的な類似度の評価指標を用いることができる。
レーベンシュタイン距離は、文字の挿入、削除、置換のそれぞれの回数を、二つの文字列の「距離」として算出するものである。
例えば、対比される二つの文字列として「Kitten」と「Sitting」を例に説明すると、「Kitten」なる文字列から「Sitting」の文字列を得るには次の操作を要する。
[1]「K」を「S」に置換→Sitten
[2]「e」を「i」に置換→Sittin
[3]「g」を挿入→Sitting
したがって、レーベンシュタイン距離は「3」である。なお、挿入、削除、及び置換のそれぞれの操作について、重み付けを与えることも可能であり、重みを加味した「距離」の計算を行っても良い。また、挿入、削除、及び置換の三つの操作に加えて、「並べ替えの回数」を考慮したDamerau-Levenshtein距離を採用することもできる。
これに対し、文字列のアピアランス比較とは、文字列におけるフォント、文字サイズ、太字、若しくは傍線、又はこれらの適宜の組み合わせの観点がどれだけ変更されたかを比較することを意味する。「太字」とは、文字列を太字にするか否かの観点である。「傍線」とは、下線や囲み線の有無や線種の観点である。
図12(B)は、「下線の追加」の例が示されている。図12(B)の左側の文字列「ABCDE」に対して、右側の文字列は、文字列の内容に変更はなく、下線が追加されている。このような変更は「アピアランス」の違いとして評価される。
文字列の内容比較に加え、アピアランスの違いを考慮して、文字列の類似度を算出する。アピアランスの要素には、フォントと、グラフィックス状態と、が含まれる。フォントは、文字の形状に関する要素であり、タイプ(Type)、フォント名(Font name)、及びフォントファミリ(Font family)の分類がある。グラフィックス状態は色の要素を含む。グラフィックス状態は、色(Color)とオーバープリント(Overprint)の要素を含む。
文字オブジェクトには、オブジェクトの属性情報として、フォントやグラフィックス状態に関する情報が付されている。オブジェクトの属性情報を利用して、文字列の類似度を算出することができる。
<画像の比較方法について>
画像を比較する観点として、画像内容の比較、画像サイズの比較、並びに、色空間の考慮を挙げることができる。画像内容の比較には、画像内における「被写体の形状の比較」と「色の比較」とがある。被写体の形状の比較は、二つの画像の特徴点を比較することにより行う。特徴点の抽出アルゴリズムとして、ORB(Oriented FAST and Rotated BRIEF)を用いることができる。ORBは、画像間におけるスケール変化、ノイズ重畳、回転変化、又は明度変化など、ある程度の画像の変化を吸収することができるという利点がある。また、ORBは、グレースケールに変換して計算するため、色の要素は考慮されない。ORBは、スケール変化、つまり画像の拡縮の変化に強い、ノイズに強い、回転に強い、及び、明度変化に強い、という利点がある。「強い」という表現は、画像間に変化があっても、特徴点の抽出を精度良く行うことができる、という意味である。
なお、画像の特徴点を抽出するアルゴリズムとして、ORBに限らず、SIFT(Scale-Invariant Feature Transform)やSURF(Speeded Up Robust Features)に代表される公知のアルゴリズムを採用することも可能である。ただし、ORBは、SIFTやSURFに比べて処理速度が高速であり、かつ、パテントフリーであるという利点がある。本実施形態における情報処理装置10ではORBが採用される。なお、ORBはOpenCV(Open Source Computer Vision Library)に実装されている。
「画像の色の比較」方法として、例えば、画像データをLab値に変換し、ヒストグラムを比較する方法を採用することができる。Lab値とはCIE1976(L*,a*,b*) 色空間で表される色である。ヒストグラムを比較するアルゴリズムとして、例えば、ヒストグラムの相関(Correlation)を計算する方法、共通部分(Intersection)を計算する方法、ピアソンのカイ二乗検定を適用する方法、バタチャリヤ(Bhattacharyya)距離を計算する方法など、公知の手法を採用することができる。
<図形の比較方法について>
図形のオブジェクトについては、図形をビットマップに変換して比較する。図形の比較に際しては、次の手順1から4に従う。
[手順1]まず、PDLページ内から文字オブジェクトと画像オブジェクトとを取り除く。
[手順2]その後、手順1で画像オブジェクトと文字オブジェクトとを取り除いたページの全体をビットマップに変換する。
図13(A)は、PDLページの例である。図13(A)に示したPDLページ200は、符号212と214で示した文字オブジェクトと、符号222で示した画像オブジェクトと、符号232と234で示した図形オブジェクトとを含んでいる。
図13(B)は、手順2によりビットマップ化されたページの例である。図13(A)に示したPDLページ200から文字オブジェクト212、214及び画像オブジェクト222を取り除いて、ページ全体をビットマップに変換すると、図13(B)に示すようなビットマップ画像240が得られる。ビットマップ画像240には、図13(A)に示した図形オブジェクト232、234のそれぞれに対応した図形画像242、244が含まれている。
[手順3]手順2で得られたページのビットマップ画像240から、図形画像242、244の領域を抽出する。
図13(C)は、手順3によってビットマップ画像240から抽出された図形領域252、254を示している。ビットマップ画像240から図形領域252、254を抽出する場合には、例えば、ビットマップ画像240の中から色塗りのある領域を抽出する。色塗りのある領域を抽出する際には、色塗りのある画素の領域がある程度離れていても、同じ一つのまとまりのある図形として認識することが好ましい。
[手順4]手順3によって抽出した図形領域を画像として比較する。
図1で説明したビットマップ変換部26と図形領域抽出部28との組み合わせによって手順1から3が行われる。また、図2で説明したビットマップ変換部88と図形領域抽出部89との組み合わせによって手順1から3が行われる。
そして、図1で説明した図形オブジェクト検索部76及び図形オブジェクト類似度評価部77によって手順4が行われる。
<コンピュータを情報処理装置として機能させるプログラムについて>
上述の実施形態で説明した自動ページ差し替え機能及び/又はデジタル検版機能を実現する情報処理装置として、コンピュータを機能させるためのプログラムをCD−ROM(Compact Disc Read-Only Memory)や磁気ディスクその他のコンピュータ可読媒体(有体物たる非一時的な情報記憶媒体)に記録し、該情報記憶媒体を通じて当該プログラムを提供することが可能である。このような情報記憶媒体にプログラムを記憶させて提供する態様に代えて、インターネットなどの電気通信回線を利用してプログラム信号をダウンロードサービスとして提供することも可能である。
このプログラムをコンピュータに組み込むことにより、コンピュータに自動ページ差し替え機能及び/又はデジタル検版機能を実現させることができる。
また、本実施形態で説明した自動ページ差し替え機能及び/又はデジタル検版機能を実現するためのプログラムの一部又は全部を印刷システムのホストコンピュータに組み込む態様や、画像出力装置としてのプリンタやプレートセッタなどの中央演算処理装置(CPU;Central Processing Unit)の動作プログラムとして適用する態様なども可能である。
<システム構成例について>
図1で説明した情報処理装置10は、各部の構成が一つの装置に一体的に搭載された一体型の装置で構成されていてもよいし、個々の機能部や処理部として複数の装置が組み合わされた、機能分散型の分離型のシステムで構成されていてもよい。
例えば、第一の文書データ記憶部12として機能する装置と、検索部20として機能する装置と、をそれぞれ別々の装置で構成することができる。また、ページ差替処理部22と、差異検出部30とをそれぞれ別々の装置で構成することができる。
また、例えば、図1に示した第一の文書データ記憶部12と第二の文書データ記憶部16はネットワーク上のデータ保存用サーバとし、優先順位設定部18、検索部20、ページ差替処理部22、ビットマップ変換部26、図形領域抽出部28、差異検出部30、表示制御部32、UI制御部34、操作部36及び表示部38を原稿制作会社や印刷会社のクライアント端末とすることができる。或いはまた、検索部20の機能をネットワーク上のサーバで提供する形態も可能である。
<変形例1>
第二の文書データ50が複数ページの修正後のページを含む場合に、各ページについてそれぞれ、上述した方法と同様の手法で検索処理とページ差し替えの処理が行われる。
<変形例2>
図7から図10で説明したデジタル検版機能は、自動ページ差し替え機能とは独立した機能として利用することができる。即ち、デジタル検版機能によって対比される二つのページは、入稿された修正後のページ104と、自動ページ差し替え機能によって検索された修正前のページ102とに限らず、任意に選択された二つのページとすることができる。例えば、入稿された修正後のページ104と、予め把握されている差し替え先のページ番号のページとを比較して変更箇所を確認することができる。
<実施形態の利点>
本発明の実施形態によれば、差し替え先のページを指定しなくても、修正後のページを含む第二の文書データを入稿するだけで自動的にページ差し替えが行われるため、オペレータの作業負担が軽減される。
印刷業界は分業化が進み、印刷物を企画する企画会社(つまり、印刷物の依頼者)、原稿制作会社のデザイナーやスタッフ、印刷会社のスタッフなど、複数の人が原稿の編集や確認等に関与することが多い。このため、修正したページを作成した作成者と、ページ差し替えの作業や確認などを行うオペレータとが必ずしも同一人物であるとは限らない。修正されたページの文書データのみが入稿された場合、オペレータは差し替え先のページを把握できない場合がある。この点、本実施形態によれば、入稿された修正後のページに対応する修正前のページが自動的に検索されてページ差し替えが行われるため、作業の効率化を図ることができる。
また、本実施形態で説明したデジタル検版の機能によれば、修正前のページと、修正後のページとをオブジェクト単位で変更箇所を容易に確認することができる。これにより、意図した正しい修正が行われているか否かを細かくチェックすることが可能である。
以上説明した本発明の実施形態は、本発明の趣旨を逸脱しない範囲で、適宜構成要件を変更、追加、削除することが可能である。本発明は以上説明した実施形態に限定されるものではなく、本発明の技術的思想内で当該分野の通常の知識を有するものにより、多くの変形が可能である。
10…情報処理装置、12…第一の文書データ記憶部、14…データ取得部、16…第二の文書データ記憶部、18…優先順位設定部、20…検索部、22…ページ差替処理部、26…ビットマップ変換部、28…図形領域抽出部、30…差異検出部、32…表示制御部、36…操作部、38…表示部、40…第一の文書データ、42…修正前のページ、50…第二の文書データ、52…修正後のページ、60…オブジェクト種別決定部、62…オブジェクト構造解析部、64…検索用オブジェクト種別判断部、70…オブジェクト種別検索処理部、72…文字オブジェクト検索部、73…文字オブジェクト類似度評価部、74…画像オブジェクト検索部、75…画像オブジェクト類似度評価部、76…図形オブジェクト検索部、77…図形オブジェクト類似度評価部、82…文字数閾値設定部、83…文字数判定部、84…画素数閾値設定部、85…画素数判定部、86…画素数閾値設定部、87…画素数判定部、88…ビットマップ変換部、89…図形領域抽出部、92…文字オブジェクト比較処理部、94…画像オブジェクト比較処理部、96…図形オブジェクト比較処理部、98…表示モード決定部、102…修正前のページ、104…修正後のページ、152,154,156…アイコン

Claims (12)

  1. 複数のページを有する第一の文書データが記憶される記憶部と、
    前記複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得部と、
    前記第一の文書データにおける前記複数のページの中から、前記修正後のページに対応する修正前のページを特定する検索処理を行う検索部と、
    前記検索部により特定された前記第一の文書データにおける前記修正前のページを、前記第二の文書データに含まれた前記修正後のページと差し替える差替部と、
    を備え、
    前記第一の文書データ及び前記第二の文書データはそれぞれページ記述言語で表され、
    前記検索部は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、前記第二の文書データに含まれた前記修正後のページのオブジェクト構造を解析することにより、前記検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定部と、
    前記修正後のページに含まれているオブジェクトのうち、前記オブジェクト種別決定部によって決定された前記一種類のオブジェクト種別に属するオブジェクトと、前記第一の文書データにおける前記複数のページのそれぞれに含まれているオブジェクトのうち、前記一種類のオブジェクト種別に属するオブジェクトと、を対比することにより前記検索処理を行うオブジェクト種別検索処理部と、
    を含む、情報処理装置。
  2. 前記優先順位を指定するユーザー操作を受け付ける操作部と、
    前記複数のオブジェクト種別に対して、前記操作部から指定された優先順位を設定する優先順位設定部と、
    を備える、請求項1に記載の情報処理装置。
  3. 前記複数のオブジェクト種別のそれぞれについて、同じオブジェクト種別に属するオブジェクトの単位でオブジェクト同士の類似度を評価する類似度評価部を備える、請求項1又は2に記載の情報処理装置。
  4. 前記複数のオブジェクト種別は、文字と、画像と、図形と、を含む、請求項1から3のいずれか一項に記載の情報処理装置。
  5. 前記優先順位が初期設定として予め定められており、前記初期設定において文字の優先順位が最も高く、次に画像、画像の次に図形の順に優先順位が設定されている、請求項4に記載の情報処理装置。
  6. 前記オブジェクト種別決定部は、前記第二の文書データについてページ単位でオブジェクト構造を解析する解析部を有し、
    前記解析部は、文字数が第一の閾値以上である文字列の文字オブジェクトが存在するか否かを判定する文字数判定部と、
    画素数が第二の閾値以上である画像オブジェクトが存在するか否かを判定する画素数判定部と、
    を備える、請求項4又は5に記載の情報処理装置。
  7. 前記第一の文書データ及び前記第二の文書データのうち少なくとも一方の文書データのページから、少なくとも図形のオブジェクトを含む領域のビットマップを生成し、かつ、前記図形のオブジェクトに対応するビットマップ領域を抽出する図形領域抽出部を備える、請求項4から6のいずれか一項に記載の情報処理装置。
  8. 前記第一の文書データにおける前記修正前のページと前記修正後のページとのそれぞれのページの内容を表示させる表示部と、
    前記差替部によるページの差し替え処理の対象となる前記修正後のページと、前記修正後のページに対して前記検索部により特定された前記第一の文書データにおける前記修正前のページと、をそれぞれページ記述言語によるページ記述データのオブジェクトのまま比較することにより、前記修正後のページに含まれるオブジェクトと前記修正前のページに含まれるオブジェクトとの差異を検出する差異検出部と、
    前記差異検出部によって検出された差異の情報を表示部に表示させる制御を行う表示制御部と、
    を備える、請求項1から7のいずれか一項に記載の情報処理装置。
  9. 前記表示部に前記差異の情報を表示させる場合の表示モードとして、前記修正後のページと前記修正前のページとを並べて表示する第一のモードと、前記修正後のページと前記修正前のページとを切り替えて表示する第二のモードと、前記修正後のページと前記修正前のページとの差異を強調して表示する第三のモードと、のうち少なくとも二つのモードを含む複数のモードを有する、請求項8に記載の情報処理装置。
  10. 前記表示制御部は、前記差異検出部によって差異が検出されたオブジェクトの箇所にアイコンを表示させ、かつ、前記差異検出部によって差異が検出された差異の大きさに応じて、前記アイコンの形態を変更する、請求項8又は9に記載の情報処理装置。
  11. コンピュータに、
    複数のページを有する第一の文書データが記憶される記憶機能と、
    前記複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得機能と、
    前記第一の文書データにおける前記複数のページの中から、前記修正後のページに対応する修正前のページを特定する検索処理を行う検索機能と、
    前記検索機能により特定された前記第一の文書データにおける前記修正前のページを、前記第二の文書データに含まれた前記修正後のページと差し替える差替機能と、を実現させるためのプログラムであり、
    前記第一の文書データ及び前記第二の文書データはそれぞれページ記述言語で表され、 前記検索機能は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、前記第二の文書データに含まれた前記修正後のページのオブジェクト構造を解析することにより、前記検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定機能と、
    前記修正後のページに含まれているオブジェクトのうち、前記オブジェクト種別決定機能によって決定された前記一種類のオブジェクト種別に属するオブジェクトと、前記第一の文書データにおける前記複数のページのそれぞれに含まれているオブジェクトのうち、前記一種類のオブジェクト種別に属するオブジェクトと、を対比することにより前記検索処理を行うオブジェクト種別検索処理機能と、
    を含む、プログラム。
  12. 複数のページを有する第一の文書データが記憶される記憶工程と、
    前記複数のページの一部と差し替えられる修正後のページを少なくとも一つ含んだ第二の文書データを取得するデータ取得工程と、
    前記第一の文書データにおける複数のページの中から、前記修正後のページに対応する修正前のページを特定する検索処理を行う検索工程と、
    前記検索工程により特定された前記第一の文書データにおける前記修正前のページを、前記第二の文書データに含まれた前記修正後のページと差し替える差替工程と、を備え、
    前記第一の文書データ及び前記第二の文書データはそれぞれページ記述言語で表され、
    前記検索工程は、ページ記述言語で用いられるオブジェクトの種類を分類した複数のオブジェクト種別に対して定められた検索の優先順位に基づき、かつ、前記第二の文書データに含まれた前記修正後のページのオブジェクト構造を解析することにより、前記検索処理に利用する一種類のオブジェクト種別を決定するオブジェクト種別決定工程と、
    前記修正後のページに含まれているオブジェクトのうち、前記オブジェクト種別決定工程によって決定された前記一種類のオブジェクト種別に属するオブジェクトと、前記第一の文書データにおける前記複数のページのそれぞれに含まれているオブジェクトのうち、前記一種類のオブジェクト種別に属するオブジェクトと、を対比することにより前記検索処理を行うオブジェクト種別検索処理工程と、
    を含む、自動ページ差し替え方法。
JP2014146578A 2014-07-17 2014-07-17 情報処理装置、プログラム、及び自動ページ差し替え方法 Active JP6150766B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014146578A JP6150766B2 (ja) 2014-07-17 2014-07-17 情報処理装置、プログラム、及び自動ページ差し替え方法
US14/739,584 US9569146B2 (en) 2014-07-17 2015-06-15 Information processor and automatic page replacement method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014146578A JP6150766B2 (ja) 2014-07-17 2014-07-17 情報処理装置、プログラム、及び自動ページ差し替え方法

Publications (3)

Publication Number Publication Date
JP2016024527A true JP2016024527A (ja) 2016-02-08
JP2016024527A5 JP2016024527A5 (ja) 2016-03-17
JP6150766B2 JP6150766B2 (ja) 2017-06-21

Family

ID=55074614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014146578A Active JP6150766B2 (ja) 2014-07-17 2014-07-17 情報処理装置、プログラム、及び自動ページ差し替え方法

Country Status (2)

Country Link
US (1) US9569146B2 (ja)
JP (1) JP6150766B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156517A (ja) * 2017-03-21 2018-10-04 富士ゼロックス株式会社 情報処理装置
JP7480599B2 (ja) 2020-06-10 2024-05-10 コニカミノルタ株式会社 画像検査装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015158729A (ja) * 2014-02-21 2015-09-03 東芝テック株式会社 情報提供装置、及び、情報提供プログラム
US10652403B2 (en) 2017-01-10 2020-05-12 Datamax-O'neil Corporation Printer script autocorrect
CN110276738B (zh) * 2019-06-28 2023-07-28 上海工程技术大学 一种bmp图像的roi替换处理方法
JP2022124648A (ja) * 2021-02-16 2022-08-26 株式会社リコー プログラム、方法、情報処理装置、および情報処理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268638A (ja) * 2005-03-25 2006-10-05 Shigenori Tanaka 文書差分検出装置
JP2006304276A (ja) * 2005-03-23 2006-11-02 Canon Inc 印刷装置、印刷方法、プログラム、記憶媒体
JP2007079616A (ja) * 2005-09-09 2007-03-29 Canon Inc 情報検索装置、情報検索装置の制御方法、及び制御プログラム
JP2008539479A (ja) * 2005-04-26 2008-11-13 コダック グラフィック コミュニケーションズ カナダ カンパニー 図形要素を含む文書の比較
JP2009140478A (ja) * 2007-11-15 2009-06-25 Canon Inc 画像処理装置及び画像処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003076996A (ja) 2001-08-31 2003-03-14 Fuji Photo Film Co Ltd データ処理装置およびデータ処理プログラム
US20040158655A1 (en) * 2003-02-12 2004-08-12 Karl Heinz Kremer Automatic insertion of special pages into black & white digital printing jobs
EP1705895A1 (en) * 2005-03-23 2006-09-27 Canon Kabushiki Kaisha Printing apparatus, image processing apparatus, and related control method
US8073256B2 (en) 2007-11-15 2011-12-06 Canon Kabushiki Kaisha Image processing apparatus and method therefor
US20090307264A1 (en) 2008-06-05 2009-12-10 Kabushiki Kaisha Toshiba Object acquisition device, object management system, and object management method
EP2614448A1 (en) * 2010-09-09 2013-07-17 Sony Ericsson Mobile Communications AB Annotating e-books/e-magazines with application results
JP5789621B2 (ja) * 2013-01-30 2015-10-07 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006304276A (ja) * 2005-03-23 2006-11-02 Canon Inc 印刷装置、印刷方法、プログラム、記憶媒体
JP2006268638A (ja) * 2005-03-25 2006-10-05 Shigenori Tanaka 文書差分検出装置
JP2008539479A (ja) * 2005-04-26 2008-11-13 コダック グラフィック コミュニケーションズ カナダ カンパニー 図形要素を含む文書の比較
JP2007079616A (ja) * 2005-09-09 2007-03-29 Canon Inc 情報検索装置、情報検索装置の制御方法、及び制御プログラム
JP2009140478A (ja) * 2007-11-15 2009-06-25 Canon Inc 画像処理装置及び画像処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156517A (ja) * 2017-03-21 2018-10-04 富士ゼロックス株式会社 情報処理装置
JP7480599B2 (ja) 2020-06-10 2024-05-10 コニカミノルタ株式会社 画像検査装置

Also Published As

Publication number Publication date
JP6150766B2 (ja) 2017-06-21
US9569146B2 (en) 2017-02-14
US20160019006A1 (en) 2016-01-21

Similar Documents

Publication Publication Date Title
JP6122814B2 (ja) 情報処理装置、プログラム、及びデジタル検版方法
JP6150766B2 (ja) 情報処理装置、プログラム、及び自動ページ差し替え方法
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
CN107979709B (zh) 图像处理装置、系统、控制方法和计算机可读介质
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US20130198173A1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2010003218A (ja) 文書レビュー支援装置及び方法、並びにプログラム及び記憶媒体
JP6780380B2 (ja) 画像処理装置及びプログラム
JP6614045B2 (ja) 画像形成装置、プログラム及び情報処理システム
JP6234417B2 (ja) 情報処理装置及びその制御方法とプログラム
JP5330714B2 (ja) 検索支援装置、および検索支援プログラム
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP5645481B2 (ja) 装置、方法、及びプログラム
JP6503850B2 (ja) 範囲指定プログラム、範囲指定方法および範囲指定装置
US20240185628A1 (en) Client terminal, control method for client terminal, and storage medium
US20230306190A1 (en) Information processing system, non-transitory computer readable medium storing program, and information processing method
US11606469B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP7401344B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
JP7178445B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US11782990B2 (en) Document processing apparatus and non-transitory computer readable medium
JP2013083862A (ja) 画像処理装置及び画像処理システム
US20240095985A1 (en) Image processing apparatus, image processing method, and storage medium
JP7268316B2 (ja) 情報処理装置及びプログラム
JP7317886B2 (ja) 情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160923

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170403

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170501

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170523

R150 Certificate of patent or registration of utility model

Ref document number: 6150766

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250