JP5349481B2 - ページ記述言語の並行処理 - Google Patents

ページ記述言語の並行処理 Download PDF

Info

Publication number
JP5349481B2
JP5349481B2 JP2010525808A JP2010525808A JP5349481B2 JP 5349481 B2 JP5349481 B2 JP 5349481B2 JP 2010525808 A JP2010525808 A JP 2010525808A JP 2010525808 A JP2010525808 A JP 2010525808A JP 5349481 B2 JP5349481 B2 JP 5349481B2
Authority
JP
Japan
Prior art keywords
page
job
pdl
postscript
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010525808A
Other languages
English (en)
Other versions
JP2010541041A5 (ja
JP2010541041A (ja
Inventor
ボリス アロンシュタム
レオニド カイン
Original Assignee
イーストマン コダック カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン コダック カンパニー filed Critical イーストマン コダック カンパニー
Publication of JP2010541041A publication Critical patent/JP2010541041A/ja
Publication of JP2010541041A5 publication Critical patent/JP2010541041A5/ja
Application granted granted Critical
Publication of JP5349481B2 publication Critical patent/JP5349481B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1211Improving printing performance
    • G06F3/1212Improving printing performance achieving reduced delay between job submission and print start
    • G06F3/1214Improving printing performance achieving reduced delay between job submission and print start at the submitting node
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1244Job translation or job parsing, e.g. page banding
    • G06F3/1248Job translation or job parsing, e.g. page banding by printer language recognition, e.g. PDL, PCL, PDF
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1284Local printer device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Record Information Processing For Printing (AREA)

Description

本発明は、印刷システム、ディスプレイシステム、PDL解析システム、およびPDL変換に必要とされるページ記述言語(PDL)データの効率的な処理方法および装置に関する。
ポストスクリプト(登録商標)言語は当業者によく知られている。ポストスクリプトは、印刷ジョブにおいてページの記述に用いるコマンドの豊富な組を含むページ記述言語(PDL)である。ポストスクリプトと他のPDL、例えばIPDS、PDF、PCL、PPMLの主な違いは、ポストスクリプトがプログラミング言語である点である。これにより、ページコンテンツを表す際の表現力および柔軟性が向上するが、柔軟性の代償は高い。一般のポストスクリプトジョブでページを解釈するのは容易でない。ページを正しく解釈したりポストスクリプトジョブの有意味な変換を実行したりするためにポストスクリプトのインタプリタ(解釈機能)が必要である。Adobe社のコンフィギュラブル・ポストスクリプトインタプリタ(CPSI)はポストスクリプトインタプリタの一例であり、ポストスクリプトジョブを処理してビットマップを生成する。AdobeDistillerはポストスクリプトインタプリタの別の例あり、ポストスクリプトジョブを処理してビットマップではなくPDFファイルを生成する。
1984年にポストスクリプトが登場して以来、世界中の技術者は、ポストスクリプト言語における公知の限界を克服すべく多くの技術を実現してきた。これらの限界として以下のものがある。
a)プリンタに合わせた速度でのポストスクリプトジョブの実行を阻害する速度限界。
b)複数の中央演算処理装置(CPU)でページを並行処理するために必要とされるように、ポストスクリプトを別個の独立したページに分割できないこと。
c)選択的なページ範囲の再印刷で必要とされるように、選択されたページを効率的に印刷できないこと。
以下に開示する本発明並びに、具体的な性能問題および実施おけるに共通的な傾向を理解するために、典型的なポストスクリプトインタプリタの説明が必要である。ポストスクリプトジョブの処理は、(多くの場合重なり合う)二つの段階、すなわち解釈段階および出力段階からなる。
−ポストスクリプトはインタプリタ言語である。任意の種類のインタプリタ(例:Perl、Java(登録商標))と同様に、解釈を実行する間にポストスクリプトジョブが構文解析されて内部ジョブ構造が生成される。この内部ジョブ構造は、高レベルまたは低レベルのグラフィカルオブジェクトのリンクされたリスト(または木)、ジョブ内のページを記述する複合状態、または他の任意の独自の表現形式であってよい。
−出力段階において、内部ジョブ構造が処理されて必要な出力が作成される。印刷システムの場合、ページがレンダリングされてラスタ(例:生のビットマップ)が生成され、通常はプリンタに送られる。AdobeDistillerの場合、PDFファイルが生成される。他の形式(例:AFP/IPDS)もまた同様の方法を用いて生成することができる。
従来、解釈は軽負荷の処理と考えられていた一方で、レンダリングは生成されるデータの量に応じて重負荷の処理と考えられていた。テキストおよびグラフィックを含むポストスクリプトページの典型的なソースデータは100KB以下である。600×600dpiCMYKでレンダリングされた場合、典型的な未処理ビットマップページは100MB以下、すなわちソースデータより1000倍大きい。
上述の理由により、ポストスクリプト言語が登場して以来、技術者はレンダリングをスキップすべく「ヌル(Null)デバイスへの書き込み」技術を用いてきた。この技術は、Adobe社「ポストスクリプト言語リファレンスマニュアル」("PostScript Language Reference Manual")の全バージョンに記述されている。この技術によれば、ヌルデバイスを設定し、次いで実デバイスを再立ち上げしてレンダリングを再開することによりページのレンダリングをスキップすることができる。ヌルデバイス方式は通常、解釈のオーバーヘッドを更に減らすために複数のポストスクリプトオペレータ(例:show、image等)の再定義により強化される。このヌルデバイス方式を用いて、ページを解釈してレンダリングをスキップすることにより、ページをスキップすることができる。このようなスキップの仕組みを用いて、当業者は図1に示すようにページの並行処理を実施できる。
図1に4個のプロセッサを示す。この方式において、4個のプロセッサの各々が全体的なポストスクリプトジョブ11を受け取り、各プロセッサは一部のページをスキップして他のページを処理する。例えば、第1のプロセッサ12はページ1、5、9...を処理する一方、第2のプロセッサ13はページ2、6、10...を処理し、第3のプロセッサ14はページ3、7、11....を処理し、第4のプロセッサ15はページ4、8、...12を処理する。明らかに、この単純な負荷バランシングアルゴリズムは、各プロセッサの現在の負荷、ページの複雑さ、および他の特徴を考慮に入れて改善できる。このような負荷バランシングの考察は後の図面全てに適用できる。
この方式から得られる利点は容易に分かる。単一CPUシステムがジョブ全体を処理するのに100秒かかるものと仮定する。更に、解釈はレンダリングより4倍速いと仮定する(これはかなり合理的な仮定である)。これらの仮定によれば、解釈は20秒で済む一方、レンダリングには80秒かかる。図1を再び参照するに、各プロセッサは、同じ20秒を解釈に費やす(各プロセッサがジョブ全体を解釈する必要がある)が、レンダリングには20秒しか費やさない(各プロセッサはページの4分の1しかレンダリングする必要がない)。この場合、ジョブ全体は40秒で処理される。これにより2.5倍の性能向上(100/40=2.5)が達成される。
図2に8個のプロセッサを示す。処理は、別個のプロセッサを用いて解釈とレンダリングに分割される。インタプリタ22は、解釈されたポストスクリプトストリームをレンダラ(レンダリング機能)26へ受け渡すことにより、(上述のページパラレリズム(並列処理)に加え)パイプラインパラレリズムを実現する。上述の数を用いて、解釈段階とレンダリング段階がパイプライン化されている(並行して動作する)ことを考慮すれば、ジョブ全体は約20秒で処理される。これにより5倍の性能向上(100/20=5)が達成される。
図2に示す方法は、初期の印刷方式を用いていた時代のように解釈時間がレンダリング時間に比べて重要でなかった場合には全く充分であった。しかし1984年以降、解釈とレンダリングのバランスは以下の要因により大幅に変化している。
a)各社は高速化を目指して、極めて効率的なレンダリングシステムおよび独自のハードウェアソリューションを提供することにより、レンダリング技術に相当の投資を行なってきた。
b)マルチCPUシステムが極めて安価になった。主流のCPU技術において現行の汎用CPUは独立CPUとして動作する複数の処理コアを含んでいるのが最新の傾向である。近い将来、8コア、16コア、および32コアのCPUの出現が期待される。
c)今日、ますます多くのジョブが、重負荷の解釈処理を必要とする極めて複雑なグラフィックスおよび膨大な画像を含んでいる。
d)印刷速度が大幅に向上しており、100ppm(ページ/分)を超え、更には1000ppmにも達している。
上述の要因の結果、各プロセッサがポストスクリプトジョブ全体を解釈するヌルデバイスへのレンダリングでは、高いエンジン速度を実現するには不十分となる。換言すれば、本質的に逐次的処理である解釈は印刷システムのボトルネックになる。例えば、各インタプリタはジョブの解釈に同じく20秒を費やす必要があるため、図2にプロセッサを追加しても性能は向上しない。
図2における複数のインタプリタが各ジョブを複製することを理解すれば、当業者は図3に示すように解釈を切り離して別個のプロセッサに移すことができる。この図において、集中型解釈実行プロセッサ32はポストスクリプトジョブ11を解釈して、独立ページ33を含むいくつかの内部ジョブ構造(ディスプレイリスト)を生成する。独立ページ33のディスプレイリストは、個々のレンダリングプロセッサ34へ送られる。図2に示す方式と比較して、本方式の主な利点は、同じ性能を実現するのに5個のCPUしか必要としない点である。更に、集中型解釈実行プロセッサ32としてより強力なCPUを用いることにより、解釈のボトルネックをいくぶん緩和することができる。
この方式の重大な短所はその複雑さにある。すなわち、ポストスクリプトプロセッサを、別個のノードで動作している独立したインタプリタとレンダラとに分離するのは複雑な手順である。これには大幅なコード変更を要し、ソースコードがその変更を実行する必要がある。しかしこの方式の主な短所は、依然としてインタプリタがボトルネックであることである。上の例で提案された数にレンダリングプロセッサ34の数を増やしても性能は向上しない。
これまで見てきたように、ボトルネックとしてのインタプリタを除去することによりシステムの全体的な速度を高める方法および装置を提供することが望ましい。更に、インタ
プリタの変更を必要としない方法および装置を提供することが望ましい。
集中型解釈方式の公知バリエーションとして図4に示すPDF方式がある。この方式では、PS/PDFコンバータ42によりポストスクリプト(PS)ジョブ11がPDFに変換される。生成されたPDF43はPDFディストリビュータ(分配機能)44により複数のプロセッサ45に分配される。ポストスクリプトをPDFに変換すべく利用可能な多くのユーティリティが存在する。AdobeDistillerは恐らく最もよく知られているであろう。
また、PDFジョブ43をプロセッサ45に分配する多くの方式がある。
a)全てのプロセッサにPDFファイル全体を受け渡すことができる。各プロセッサはどのページをレンダリングすべきかが指示される。
b)PDFジョブを一連の単一ページPDFファイルに変換することができる。これらの単一ページPDFファイルをプロセッサへ受け渡すことができるため、各プロセッサはレンダリングが必要なPDFページだけを受け取る。
c)PDFを一連の単一ページポストスクリプトファイルに変換することができる。これらの単一ページポストスクリプトファイルをプロセッサへ受け渡すことができるため、各プロセッサはレンダリングが必要なポストスクリプトページだけを受け取る。
d)単一のPDFまたはポストスクリプトのページではなく、ページチャンク(複数ページからなる塊)を生成して必要なプロセッサに分配することができるため、単一ページの潜在的なリソースオーバーヘッドが減る。そのバリエーションとして、ジョブ全体をプロセッサの数に等しい個数の部分(本例では4個の部分)に分割することができる。
これらのPDF方式は、実行可能な方法であって当業界では公知である。同時に、これらには上で議論した「集中型解釈」方式と同じ主要な短所がある。すなわち、PS/PDFコンバータがポストスクリプトインタプリタであるため、当該コンバータがボトルネックとなる。更に、PDFへの変換によりかなりの余分なオーバーヘッドがコンバータに追加されるため、更により大きいボトルネックが生じることが知られている。このボトルネックのため、プロセッサを追加してもシステムの性能が向上しない。
再び図4を参照するに、ポストスクリプトからPDFへの変換ではない、他の変換が可能である。例えば、ポストスクリプトからポストスクリプトへ、ポストスクリプトからAFPへ、またはポストスクリプトからXPSへの変換である。しかし、このようなコンバータは全てポストスクリプトインタプリタのインスタンスであるため、それら全てに上で議論した「集中型解釈」方式および「PDF方式」と同じ重大な短所がある。すなわち、コンバータがボトルネックになるため、プロセッサを追加してもシステムの性能が向上しない。
これまで見てきたように、ボトルネックとなるインタプリタを除外することによりシステムの全体的な速度を上げる方法および装置を提供することが望ましい。更に、ポストスクリプトからPDFその他の言語への変換を回避する方法および装置を提供することが望ましい。
ポストスクリプトジョブの構造化されていない性質に関する問題を認識した上で、Adobe社は既に1986年に「Adobe文書構造化規約仕様バージョン1」(DSC仕様)を発行している。最も良く知られているDSC仕様バージョン3.0は1992年に発表された。この仕様には「並行印刷」と名付けられた独立したセクションがある。これは、ページの並行印刷がDSC準拠ポストスクリプトジョブの意図の一つであることを示している。
DSC仕様は、PSリソースの構文解析が簡単に行なえてページを再配置できるようにするタグの組を定義する。同仕様は更に、プロデューサ(生成機能)が「%!PS−Adobe3.0」を出力したならば、このポストスクリプトファイルがDSC準拠であることを保証することを義務付ける。残念ながら現実には、ほぼ全ての主要なポストスクリプトプロデューサが「%!PS−Adobe3.0」を挿入しているものの、これらのファイルがDSC準拠であることは稀である。
上記にもかかわらず、実行すれば分かるように、DSCコメントおよびプロデューサ固有のパターンを探して構文解析することにより、ポストスクリプトジョブの巨大な集合をうまく独立ページに分割することができる。この処理は複雑であるが、1988年以降複数の企業がこの方式をうまく活用している。例えば、Creo社(Preps(登録商標))およびFatukh等、多くの企業がこの方式を利用してページ面付け(組付け:imposition)を実行したが、これは並行印刷の実行より大幅に複雑な処理である。これらの企業は、複数の主要なベンダーが生成したポストスクリプトをページから独立したポストスクリプトに変換できただけでなく、異なるアプリケーションが生成した複数のポストスクリプトジョブを組み合わせて1個の面付けされたポストスクリプトジョブにすることも可能であったため、更に高レベルのページ独立性が実現された。
同時に、印刷システムは面付けとは異なる要件を義務付ける。
a)印刷システムがポストスクリプト面付けソフトウェアより信頼性が高いと期待されている。面付けシステムよりもはるかに大きいポストスクリプトジョブの組を処理して、DSCおよびパターン認識方法を用いて処理できないジョブに関して充実した報告を行なうことが期待される。
b)印刷システムは面付けソフトウェアよりも極めて高速でなければならない。
これまで見てきたように、既存のDSCに基づくシステムよりも大幅に信頼性が高く且つ早い方法および装置を提供することが望ましい。
図5にジョブ並行方式を示す。これはページ並行方式に付随する複雑さおよび非効率性の多くを解決する。この方式では、複数のプロセッサ55が複数のポストスクリプトジョブ51を並行して処理する。別個に解釈および分割するための固有のオーバーヘッドが無いため、この方式は短いジョブを含む巨大な集合に対して極めて効率的である。一つジョブの印刷が終了した時点で別のジョブが処理されて印刷の準備ができている。同時に、この方式は巨大なジョブに適していない。
a)第1のジョブは複数のプロセッサが存在する利点を享受できない。
b)ジョブプロセッサがページ記憶領域を使い切り、プリンタが先行ジョブを印刷するのを待ちながら長時間アイドル状態に陥る恐れがある。
この状況は、Creo社VPSまたは他のポストスクリプト方言で表された可変データ印刷(VDP)ジョブ等の極めて長いポストスクリプトジョブにより悪化する。そのようなジョブは1個が100,000ページ以上を含んでいて何日間も動作することがある。この場合、ジョブ並行方式では結果的に、1個のプロセッサしか使われない一方で、残りのプロセッサをアイドリング状態に陥ってしまう。
DSC準拠に戻ると、非DSC準拠ポストスクリプトにおける主な問題は、ジョブ構造およびページ相互依存の欠落にある。
a)ジョブ構造の欠落とは、ポストスクリプトジョブにおける厳密且つ容易に識別可能な境界の欠如を意味する。
b)ページ相互依存とは、各ページが、複数ページにわたり有効と思われる識別困難なリソースを含み得ることを意味する。
従って、ポストスクリプトのプロデューサが何故全てのリソースをジョブヘッダへ移さないかとの疑問が生じるだろう。その答えは、ジョブ生成が2回のパス(ジョブデータの処理)、すなわち解析パスおよび出力パスを必要とするからである。
a)解析を実行する間、要求されたリソースを求めてページ全体が解析される。
b)出力パスを実行する間、リソースがジョブヘッダセクションに書き込まれる。それが終わらなければ独立したページを書き込むことができない。
アプリケーションによる高速なページ生成は、プリンタがページを処理するのと同程度に重要であり、また過去においてページ独立性がポストスクリプトプロデューサにとって必要条件ではなかったことを考えれば、ポストスクリプトジョブにおいてページが相互に依存する理由は明らかある。
PPML等、最新のPDLの導入により状況が若干変化している。PPMLはXMLベースのVDP言語であり、すなわち高速印刷を実現すべく特別に設計されたことを意味する。PPMLは、多く主要な文書作成企業並びに全ての主だったプリンタコントローラメーカーが参加している標準委員会であるPODiにより設計された。ジョブ構造に関して、PPMLは必須XMLタグを義務付けることによりこの問題を解決している。同標準は下記を規定している。
a)1個のPPMLジョブは複数の文書の集合からなる。
b)1個の文書の集合は複数の文書からなる。
c)1個の文書は複数のページからなる。
ページ構造に関する限り、PPMLはページ相互依存の問題を解決しない。ポストスクリプトページと同様に、PPMLページは、複数ページにわたり有効と思われるリソースを含んでいてよい。これは、PPMLページを極めて高速に出力することでデータのパス(読み込んで処理すること)を2回行うことを回避する必要に直面していた全てのPODiメンバーの意思に基づく決定であった。その結果、PPMLページはリソースおよびデータを以下のようにインターリーブする。
BeginPage
data, resource, resource, data, data...
EndPage
ポストスクリプトとの唯一の顕著な違いは、リソースが容易に識別可能であるという点である。PPMLジョブ構造を理解することにより、本発明の理解だけでなく既存の特許を理解しやすくなる。
米国特許第5,652,711号明細書 国際公開第04/107259号 米国特許第6,817,791号明細書
Adobe文書構造化規約仕様バージョン1 Adobeポストスクリプト言語リファレンスマニュアル Adobe文書構造化規約仕様
当分野における他の従来技術として以下がある。
1.Agfa社、米国特許第5,652,711号(Vennekens)
2.Electronic For Imaging社、WO出願第04/110759号
3.Xerox社、米国特許第6,817,791号(Klassen)
米国特許第5,652,711号はポストスクリプトを含む全てのPDLに応用可能な幅広い特許である。同特許は、PDLデータストリームを並行処理する方法を記述している。これは、データコマンドおよび制御コマンドの組合せとしての印刷ジョブを定義するPDLデータストリームを考慮している。データコマンドがテキスト、グラフィック、および画像のように出力装置により再生する必要があるデータを記述するのに対し、制御コマンドはデータをどのように再現するかを記述するものであり、フォント記述、ページセクション、フォームおよびオーバレイを含んでいてよい。各々の生成された独立データストリームセグメントは、単一のページまたは領域に含まれる画像を記述するデータコマンドを含み、またデータコマンドをどのように解釈すべきかを指示する制御コマンドも含んでいる。
PDLデータストリームは主プロセスへ送られ、ここでPDLデータストリームは独立したデータストリーム部分に分割され、独立したデータストリーム部分は複数のサブプロセスにより中間データストリーム部分に変換される。セグメントの独立性を実現するために各セグメントは、先行する全ての制御コマンドからなる当該セグメントの「変換状態」を知らなければならない。
本方法は、PDLストリームに関する完全な知識を必要とし、ストリームを解釈することによってのみ実現できる。解釈がボトルネックであることを理解した上で、この発明の一実施形態はこの解釈を複数のサブプロセスに分配する。変換状態の変化に遭遇したサブプロセスは全てこの変化を主プロセスに報告する。複数のサブプロセスにより生じた状態を同期させる特別な技術を用いる。
米国特許第5,652,711号に記述されている発明の複雑さは別として、同特許はセグメントを作成する仕組みを開示していない。例えば、ポストスクリプトの場合、「データコマンド」および「制御コマンド」が言及されていない。ほぼ全てのグラフィック演算子がインタプリタの状態を変える。残念ながら、同特許ではポストスクリプト演算子からデータ/制御コマンドへのマッピングが行なえない。
WO第04/107259号明細書もまた、ポストスクリプトを含む全てのPDLに適用できる幅広い特許である。その目的はページの相互依存性を克服することである。他の多くの公知技術と同様に、各ページはセグメントに分割されている。新規な点は、各々の生成されたセグメントが2個の新規ファイル、すなわち大域データファイルおよびセグメントデータファイルにより表される点である。ページをスキップするためには大域ファイルを実行する必要がある。ページを印刷するためにはセグメントデータファイルを実行する必要がある。
残念ながら、WO第04/107259号明細書は、セグメントを識別する仕組みを開示していない。また、当該特許は大域データファイルおよびセグメントを構成するセグメントデータファイルを生成する仕組みも記述していない。当該特許の記述から、その本発明が「グラフィックオブジェクト」を認識および抽出可能であることを考慮し、且つDSCおよびDSC関連特許を参照していない点を考慮すれば、インタプリタに基づく方式が示唆されており、従って上述のようにシステムの全体的なスループットが制限されるものと仮定することができる。
米国特許第6,817,791号には、ポストスクリプトジョブを独立したページに分割することが記述されている。ポストスクリプトジョブはリソース(当該特許文献の表現では、イディオム)を求めて解析され、次いでリソースが抽出されて印刷ジョブのヘッダに再配置される。次いでヘッダを各ページの先頭に置く(プレフィックスする)ことにより、当該ページに全ての必要なリソースが含まれるようにして、他のページから独立させる。各ヘッダ(ページに添付された)は当該ページに先行する全てのリソースを含んでいるが、当該ページのリソースは含んでいない。
同特許から分かるように、この結果、各ページに巨大ヘッダが添付される。この問題を回避すべく、米国特許第6,817,791号は「チャンク」という概念を導入し、ジョブを独立したページに分割するのではなく、ジョブを独立したチャンクに分割する。この方式では、ヘッダのオーバーヘッドはチャンク内の多数のページに均等化される(分割してならされる)。チャンクは、1ページと同程度に小さくても、またはジョブ全体と同程度に大きくてもよい。チャンク同士は独立しているため任意の順序で処理可能であり、複数の処理ノードへ分配して並行処理を行なうことができるため、これをチャンク並行性と呼ぶ。
チャンク並行性に関して、このチャンク並行性がどのように他の公知のチャンク並行性を用いる方式と異なるかは不明確である。例えば、既に1992年に公表されていた「Adobe文書構造規約仕様バージョン3」はチャンク並行性について以下のように言及している。
「例えば、ユーザは、ある文書の最初の100のページを5台の別々のプリンタで並行して印刷すること要求する。文書マネージャはその文書を各々20ページからなる5個のセクションに分割し、各のセクションに対して当初のプロローグおよび文書設定を複製する。」
更に、同特許は非DSC準拠ジョブを逆に印刷する最適化された方式を示唆している。
「若干効率的な方式として、文書全体にわたり1回パス(データを読み込んで処理すること)を実行してヘッダに含まれる筈だったが含まれていない内容を見つけてヘッダに追加し、次いで当該ヘッダを1回だけ出力し、続いて全部のページを逆の順序で印刷する。」
当業者は、記述されている方式が殆ど機能しないことを知っている。その理由は、各ページが先行ページから伝播されて「ヘッダ」内では指定できない「setfont」その他のポストスクリプト演算子を含んでいるからである、残念ながら、この最適化さていない方式は、各ページにヘッダを追加することに関連して重大な効率面での理由のため、使用できない。結論として、同特許を用いて効率的な逆印刷をどのように実行するかは明確でない。
しかし、米国特許第6,817,791号における主な問題は、リソースヘッダを各ページの先頭に配置する際のオーバーヘッドである。このオーバーヘッドにより、結果的に、ページ並行性を利用したテキスト処理方式の性能が最適化されない恐れがある。代替的なチャンク方式は結果的に、ロードバランシングが最適化されない(チャンクが大き過ぎる場合)か、ヘッダオーバーヘッドが膨大になる(チャンクが小さ過ぎる場合)恐れがあり、ページの複雑さ、ジョブサイズ、システム内のリソース、現在のシステム負荷、および他の要因に従い最適なチャンクサイズを推定する複雑な方法を発明する必要が生じる。
これまで見てきたように、以下を実行する方法および装置を提供することが望ましい。
1.ヘッダオーバーヘッドの累積を回避する、
2.ページ並行性を利用して上述のチャンクサイズ推定の複雑さを回避する、
3.効率的な範囲指定印刷を実現する、
4.信頼性の高い逆印刷を実現する。
本発明は、上述および他の問題を解決するものである。
本発明は、ページ独立性を欠くPDLデータストリーム(ジョブ)の効率的な処理を行なう方法および装置を提供する。本システムは効率的に1つのジョブを、複数のページ、データ、および複数のリソースへと編成する。編成されたジョブは、以下の利点を有する。
1.編成されたジョブは当初のジョブの高レベル構造を提供する。この構造は、ジョブ解析、レポーティング、プリフライト、面付け(imposition)判定その他の処理に役立つ。
2.編成されたジョブは、効率的なページ並行処理を行なうために複数のPDLプロセッサへ受け渡すことができる。
3.選択されたページまたはページ範囲を効率的に印刷することができる。
4.ページを効率的に再配置してページの逆順印刷および他のシーケンスを実現することができる。
編成されたジョブは以下の特性を有する。
1.編成されたジョブは、当初のジョブのデータおよびリソースを再配置しない。
2.編成されたジョブはワークフロー、記憶、性能その他のニーズを満たすべく、複数の形式を用いて効率的にパッケージングできる。
3.最も効率的なパッケージングは、編成されたジョブを、ポインタまたはオフセットを用いて当初のポストスクリプトジョブのセグメントを指示する、ディレクトリに似た別個の外部構造として表すことにより実現され、これにより当初のジョブが保持され、変更されたジョブを書き込むオーバーヘッドを回避することができる。
ポストスクリプトジョブの場合、本発明はDSC処理およびテキスト構文解析を用いる。
ヌルデバイスを用いたページの並行処理を示す模式図である。 ヌルデバイスを用いたページの2段階パイプライン並行処理を示す模式図である。 ディスプレイリストに基づく集中型解釈を示す模式図である。 ページ並行性を得るためのPDF方式を示す模式図である。 ジョブ並行方式を示す模式図である。 一般的な処理を示す模式図である。 リソースのリソース記憶装置への分割を示す模式図である。 オーガナイザ(編成機能)の構成要素を示す模式図である。
本発明の詳細な説明により当業者は、本発明を完全に発現させて実装することができる一方、実装者が可能な最高の性能を実現する際の創造性および必要なプロデューサ(製作者)の全てを最も効率的に扱える能力を限定するものではない。
本発明は一実施形態に関して記述されているが、本発明を当該実施形態に限定することは意図していない点を理解されたい。逆に、添付の請求項が対応する全ての代替物、変更、および等価物が包含されるものとする。
ポストスクリプトジョブおよびポストスクリプトに基づくVDPジョブに対し複数のプロセッサを用いて可能な最高速度を得ることは複雑なタスクであり、そのためのうまい「数学的解決法」は存在しない。上述の理由により、本発明は当分野で広範な経験により検証されているいくつかの結論に基づいている。
1.ページの並行印刷はページ独立性を必要としない。ページの並行印刷は、明示的な「リソースマーキング(リソースの印付け)」と共に「ページの分離」だけを必要とする。ページディストリビュータは、ページをレンダリングするプロセッサへ当該ページ全体を受け渡すか、または当該ページに定義されたリソースだけを当該ページをレンダリングしない他のプロセッサへ受け渡す必要がある。上述の理由により、ページから独立しないように設計されているPPMLは、効率的なページ並行性の実現に理想的に適している。
2.ジョブ並行性を用いて短いジョブを最も効率的に処理することができる。短いジョブの定義はシステム、プロセッサの数、プリンタ速度、予想されるジョブの複雑さ等に依存する。いくつかのシステムにおいて、短いジョブは最大4ページまで含んでいるものと定義され、他のいくつかのシステムでは短いジョブは最大100ページまたはそれ以上を含んでいるものと定義される。
3.リソースの集中度(濃度)は、中間サイズまたは大規模サイズのポストスクリプトジョブ内で急激に低下する。すなわち、大部分のリソースは、第1ページの前に、または第1ページ内で定義される。第2ページは通常、第1ページより少ないリソースを含んでいる。第3ページは通常、第2ページより更に少ないリソースを含んでいる。ジョブが500ページを含んでいる場合、250ページ目に何らかのリソースが含まれている可能性は低い。100,000を超える文書を含む典型的なポストスクリプトに基づくVDPジョブの場合、最初の100文書を過ぎて何らかのリソースが存在する可能性は極めて低い。
上の結論によれば、本発明の主な目的は、複数の処理ノードへ効率的に分配すべくジョブ内のページ、文書およびリソースに効率的にマーキング(印付け)を行うことによりジョブを編成(organize)することである。図6を参照するに、ページを編成する構成要素はジョブオーガナイザ62であり、ポストスクリプトジョブ11を受信して、編成されたジョブ63を生成する。編成されたジョブを複数のPDLプロセッサ65に分配する構成要素はディストリビュータ64と呼ばれている。
本発明の一態様は、オーガナイザがジョブを再配置する必要がなく、全てのデータおよびリソースを所定の位置に保つことができる。これが、本発明が他の発明とは異なる点であって、結果的にこれまでにない分割および並行処理の速度が得られる。実際、本発明の一実施形態において、編成されたジョブは当初(オリジナル)のジョブのセクションへの参照(ディレクトリ)リストとして表される。この言明を理解および評価するために、編成されたジョブの可能な編成およびパッケージを考慮されたい。
編成されたジョブは、結果的に生じる多くのセグメントとして表される。これらのセグメントは、メタデータを用いてジョブ構造を定義し、且つジョブデータを含んでいる。各セグメントはタグにより定義され、以下の7種のタグが必要である。
BeginJob
EndJob
BeginDoc
EndDoc
BeginPage
EndPage
Data
純粋なポストスクリプトジョブ(文書の表記(notion of docs)を含んでいない)の場合、次の5種のタグだけが必要である。
BeginJob
EndJob
BeginPage
EndPage
Data
2ページを含んでいる1個の文書を含む編成されたジョブの簡単な例は以下のタグを含んでいる。
BeginJob
Data
BeginDoc
BeginPage
Data
EndPage
Data
BeginPage
Data
EndPage
EndDoc
EndJob
編成されたジョブの正式な記述は以下の通りである。
job = BeginJob, [doc | Data]*, EndJob
doc = BeginDoc, [page | Data]*, EndDoc
page = BeginPage, [Data]*, EndPage
上の記述の言語的記述は以下の通りである。
−ジョブはBeginJobおよびEndJobタグによりカプセル化されており、複数のdocおよびDataセグメントを含んでいる。
−Doc(またはVPS用語でいうところのブックレット(Booklet))はBeginDocおよびEndDocタグによりカプセル化されており、複数のページおよびデータセグメントを含んでいる。
−ページはBeginPageおよびEndPageタグによりカプセル化されており、複数のDataセグメントを含んでいる。
PPMLと同様に、データも明示的な範囲を含んでいてよい。範囲とは、ページ、ドキュメント、ジョブ、およびグローバルであってよい。リソースは、現在の範囲よりも高次の範囲を有するデータとして定義される。例えば、データがページ内で定義されていてジョブ範囲を有する場合、それはリソースである。リソースの従来の定義(ポストスクリプト、PPML、および他のPDLのリソース定義と同一)は既知とする。編成されたジョブは、文書の並行分配だけでなくページの並行分配にも適している。
ディストリビュータは、以下の規則に従いページの並行処理のために編成されたジョブを発行する。
−範囲がグローバル、ジョブおよびドキュメントであるデータは、当該ジョブを処理すべく指定された全てのプロセッサに分配される。
−範囲が所与ページのページであるデータは、1個のプロセッサ、すなわち当該ページを処理すべく指定されたプロセッサだけに分配される。
ディストリビュータは、以下の規則に従い文書の並行処理のために編成されたジョブを割り当てる。
−範囲がグローバルおよびジョブであるデータは、当該ジョブを処理すべく指定された全てのプロセッサに分配される。
−範囲が所与のドキュメントのドキュメントおよびページであるデータは、1個のプロセッサ、すなわち当該ドキュメントを処理すべく指定されたプロセッサだけに分配される。
編成されたジョブは、システムの記憶および性能必要を満たすようにパッケージングできる。
−編成されたジョブはXMLを用いてパッケージングできる。各セグメントは、XML構造として表される。これは、(バイナリデータに関して知られるあらゆる問題と共に)PPMLと同様である。
−より効率的なパッケージングは各セグメントのタグおよび長さの形式を用いる。これは公知の形式(例えばTAR形式)と同様であり、効率的なバイナリ表現を可能にする。
−更により効率的なパッケージングは、タグを含んでいてポインタまたはオフセットを用いて当初のポストスクリプトジョブのセグメントを指すディレクトリと同様の別個の外部構造として表される。これにより、本発明の一実施形態においてジョブ全体が保持されるという本発明の請求項の一つが正当化される。これは、ポストスクリプトジョブ変換の領域において公知の技術ではなく、本発明の結果としてのみ利用可能な独特の表現である。
いくつかの実施において、共有リソース記憶装置75に存在する共通リソース74の全てまたは一部を保持することがより有益であることがわかる。記憶装置は図7に示すように、オーガナイザ62、ディストリビュータ64、プロセッサ66、および他のシステムノードの間で共有されている。
例えば、いくつかのシステムは共有リソース記憶装置75に大域VDPオブジェクトを格納することに利点がある一方、他のシステムは共有リソース記憶装置75に再使用可能な全てのVDPを格納することに利点があり、また他のシステムは共通リソース記憶装置75に全てまたは一部のポストスクリプトリソースを格納することに利点がある。そのようにする利点は、リソースを中心部に保存して、編成されたジョブのサイズを減らすことにある。いくつかのシステムでは、編成されたジョブから上述の格納されたリソースを除去すべく編成されたジョブを生成することに利点がある一方、いくつかのシステムでは、当初のジョブを指す効率的な外部構造として編成されたジョブを表現することに利点がある。いずれにせよ、編成された表現が生成された際に、本発明が当初のジョブのデータ/リソースを再配置しない点を理解することが重要である。
大域範囲を有するリソースに関するいくつかの考察が以下に続く。PPMLと同様に、大域範囲を用いて、ジョブの間で大域リソースを定義して維持する。これが大域範囲の主な且つ従来の目的である。しかし、本発明の一実施形態では、大域範囲を用いて非保護ポストスクリプトジョブ、すなわちポストスクリプトインタプリタの永続的状態を変えるジョブ)を表現する。上述の分配論理を用いて、各ノードは、全てのデータを受け取る(大域範囲を有するため)。「showpage」演算子を無効にする(さもなければ各ノードが全部のページを印刷してしまう)ために、多くの公知の技術(showpageの再定義、ヌルデバイスの確立等)を用いることができる。非保護ジョブを扱う当該実施形態を提示したことにより、非保護ポストスクリプトジョブを扱う本発明に依存する他の方法が可能である。
編成されたジョブの高いストリーミング性を認識されたい。すなわち、ページのセグメントを、それらが印付けされた(しかもページが編成される前に行なわれる場合が最も多い)直後にプロセッサに分配することができる。ジョブの編成および分配には当該ジョブに対して1回のパス(ジョブデータを読み込んで処理すること)を実行するだけで済む。
本発明の好適な実施形態はジョブ内のリソースを再配置せず、それらが見つかった場所に保持するにもかかわらず、リソースを再配置して、編成されたジョブ内の他の場所またはジョブの外側(図7に示すように)へ移しても本発明の趣旨が変わらない点を理解されたい。
例えば、本発明の一実施形態がリソースを、当該リソースが見つかったページから(美観その他の理由により)当該ページの先頭へ移すことがある。これにより当該実施形態の効率が若干低下する恐れがあるものの、ページ独立性を求めるいくつかのアプリケーションが行なう全てのリソースをヘッダに累積して当該ヘッダを各ページの先頭に置くことよりもはるかに効率的である。
編成されたジョブにより効率的なページスキップが可能になるため、本発明により、複数ページを並行してページ範囲処理を効率的に実行できるようになる。
ジョブ内のページを再配置または逆転させることはより複雑な手順である。並行ページ印刷における他の発明は、WO第04/107259号のようにこの問題に対処しないか、または米国特許第6,817,791号のようにファイルの重要な部分で失敗するような極めて限られた解決策しか提供しない。説明のために、ページ再配置の最悪の場合である逆印刷に着目する。逆印刷は以下の技術により実現される。
1.ジョブを編成するために完全なパス(ジョブデータを読み込んで処理すること)を実行する。これにより、ページ境界およびリソースが印付けされる。
2.上述のパスを行なう間、ページ間に残るグラフィック状態に影響を及ぼすプロデューサ固有の全てのイディオムを集めて各ページに関連付ける。そのようなイディオムの例として、Windows(登録商標)ドライバにより生成される「fontnameJi」コマンドがある。このコマンドは、フォントを「fontname」に設定する。これがリソースの収集および累積とは非常に異なる点に注意されたい。例えば、Windows(登録商標)ドライバの場合、各ページは、最後の「Ji」コマンドだけをページに関連付ければよい(リソースの場合のように先行する全ての「Ji」コマンドである必要がない)。その結果、関連付けられた状態は極めて小さくなる(通常、数百バイト以下と測定される)。
3.全てのリソースを実行する。これにより適切なポストスクリプト仮想メモリ(VM)状態が生成される。
4.ページをコマンドの処理ノードに逆順で分配する。ページを分配する前に、グラフィック状態の必要な部分を設定する小さいヘッダを追加する。
上述の方式は極めて広範な印刷ジョブで機能する。
本発明のこれらおよび他の目的、特徴、および利点は、本発明の例示的な実施形態を図示および記述する以下の詳細説明を添付図面と合わせて精査することにより当業者には明らかになろう。
オーガナイザは、ストリーミング方式で当初のジョブを構文解析して、これを解析し、非DSC準拠性を補償して(非DSC準拠性を打ち消して)、効率的な分配に適した良好な編成済みジョブを複数の処理ノードに出力する。多くの異なるプロデューサにより生成された多くのジョブをうまく編成するために、本発明の好適な実施形態は図8に示す構成要素を含んでいる。本発明の特性を変えることなく、これらの構成要素の名称を変更し、構成要素の役割を再配置し、構成要素を複数の下位要素に分割し、いくつかの構成要素を除去することができる。
構文解析は、行単位、トークン単位、および他の粒度で行なうことができるが、説明の便宜上、以下では行単位の構文解析に言及する。当初のジョブにおける各々の行は、ストリーミング方式で解析される。ある行が「%%」から始まる場合、これはDSC行の候補である。これが本当にDSC行である可能性を高めるには簡単な処理を追加すれば十分である。行がDSC行であると誤って認識されても(例えば、バイナリデータ内の行は正しいDSC行のように見える場合がある)、問題ではない。これが予想される正しいDSCに合致する確率は無視できる(広範囲なテストにおいて遭遇しない)。DSC行は重要であり、汎用DSC処理の実行。ジョブプロデューサの識別、ジョブの構造の識別、および時にはリソースの検出にも役立つ。
上述のように、大部分のポストスクリプトジョブは非DSC準拠である。しかし通常は、各々のプロデューサは、プロデューサに固有の予測可能な仕方でDSC準拠性を破る。これは、各々のプロデューサが有限プログラムであるため、限定された数の出力パターンしか生成しない可能性があるためである。効率的な並行処理のためにポストスクリプトジョブを編成するには、オーガナイザはこの非DSC準拠性を補償する必要がある。これは、ジョブデータを解析することによりなされる。非DSC準拠性を正しく且つ効率的に補償するために、オーガナイザはプロデューサ(「クリエイタ」としても知られる)を識別する必要がある。
ワードプロデューサについて若干の説明が必要である。プロデューサはXyzSoftであると言うだけでは一般に不十分である。Windows(登録商標)ドライバを使用するXyzSoft、またはLaserWriterドライバを使用するXyzSoft、あるいはネイティブコード生成を使用するXyzSoftであると更に明示することが必要である。通常、これらの出力の全ては大幅に異なっている。XyzSoftのバージョンおよびWindows(登録商標)ドライバ等のバージョンを特定することが必要な場合もある。上述の理由により、プロデューサを識別する際にアプリケーション名、ドライバ名、バージョン等を含む完全な識別情報が必要になる。
このため、組み合せの数が膨大になる。この組み合せ爆発を減らす一方法は、一般に(常にではないが)、使用するドライバによらずXyzSoftパターンが同一であるという事実を利用するものである。上述の理由により、XyzSoftパターン、Windows(登録商標)パターン、LaserWriter8パターン等を別々に解析する構成要素の別々の組を有することが推奨される。そのような特定の構成要素を「プロデューサプロセッサ」と呼ぶ。(ジョブをレンダリングする複数のプロセッサと混同しないこと。)
プロデューサという用語に関して、アプリケーション/ドライバの組み合せについて述べる方がより正確である。プロデューサチェイン(連鎖)という用語を用いる方が更によく、これはネイティブプロデューサの異なるケースに対応できる。
−純粋なドライバ(連鎖内の要素の数は1に等しい)
−ネイティブアプリケーション(連鎖内の要素の数は1に等しい)
−アプリケーション/ドライバの組み合せ(連鎖内の要素の数は2に等しい)
−連鎖内のプロデューサの数が2より多いいくつかのケース(例:LaserWriter8ドライバを使用するQuarkXPressを使用するCreoDarwin。これは3要素プロデューサチェインを構成する)。
<全体的な処理フロー>
スナップショットにおいて、オーガナイザは行単位でポストスクリプトジョブを構文解析する。開始時点ではプロデューサチェインは空である(プロデューサは未知)。汎用DSC処理82が用いられる。
ある時点でオーガナイザ81はプロデューサチェインの第1要素を検出する。更なる議論のため、これがLaserWriter8ドライバであると仮定する。その時点以降、各行はLaserWriter8プロセッサ(プロデューサプロセッサのインスタンス)へ送られる。
LaserWriter8プロセッサは各行の高速解析を実行する。通常、関心対象でない行を除外するために行の始めおよび行の終わりで数バイトを解析すれば充分である。
大多数の行はプロデューサプロセッサの関心対象外である。しかし、潜在的に行が関心対称になり得る場合、より精緻な処理が実行される。リソーススニファ(探知機能)85により行がリソースパターンであると認識された場合、プロデューサプロセッサはプロデューサプロセッサに固有の論理を起動してリソースに印付けを行う。このプロデューサプロセッサ固有の論理には、リソースの始まりを見つけるための逆方向探索およびリソースの終わりを見つけるための順方向探索が含まれている。リソースが見つかればプロセッサはオーガナイザにリソースの開始位置および終了位置を通知する。オーガナイザは、上述のパッケージングスキームに従いリソースに印を付けて、自身の位置を当該リソースの直後まで前進させる。これにより当該リソースの処理が完了する。
プロデューサプロセッサが行を認識しない場合、効率的に戻る。オーガナイザは次いで、後述する汎用DSCプロセッサ論理を用いて行を処理する。
この方式の強みは、各プロデューサプロセッサが必要に応じて汎用DSCプロセッサのデフォルト動作を上書きできる一方、同時に汎用DSCプロセッサの能力に依存して大多数の行を処理する点である。このように、各プロデューサプロセッサは、特定の非DSC準拠性を補償するために必要な最も少ない数のコード行で実装することができる。より準拠度の高いプロデューサは、より簡単なプロデューサプロセッサとしてインプリメントされる。
引き続き上例を参照するに、オーガナイザはアプリケーションを検出する(前の段階でドライバLaserWriter8が検出された)。具体的に、これがAdobeAcrobatとする。オーガナイザは、これをプロデューサチェインの第2要素としてインストールする。この時点以降、オーガナイザはプロデューサチェイン内の各プロデューサプロセッサに各行を提供する。
−オーガナイザは、AdobeAcrobatに行を提供する。
−当該行が拒絶された場合、オーガナイザは当該行をLaserWriter8に提供する。
−当該行が拒絶された場合、オーガナイザは汎用DSCプロセッサを用いてこれを処理する。
<汎用DSCプロセッサ>
図8において、汎用DSCプロセッサ82は「Adobe文書構造規約仕様」に定義された汎用DSC処理フローの役割を果たす。
DSC準拠性に頼ることはできないものの、上述の「汎用処理フロー」に見られるように、汎用DSCプロセッサは極めて重要な構成要素である。オーガナイザのデフォルト動作を実行して、各プロデューサプロセッサをなるべく小さくし且つインプリメントを容易にする。汎用DSCプロセッサは、ジョブヘッダの解析、ジョブのプロローグ解析、ジョブデフォルト値の解析、リソースの解析、手続きセットの解析、ページ境界の探索、ジョブトレーラの探索、および「Adobe文書構造規約仕様」に記述された汎用DSC処理に必要とされる他の多くの他の動作を実行する。また、並行処理用のジョブを編成するために厳密には必要とされない他のインプリメント(実装)に固有の機能を実行することがある。
<クリエイタスニファ>
クリエイタスニファ83は、プロデューサチェインを識別する役割を果たす。上述のように、単一のクリエイタまたは単一のプロデューサだけではなく、複数のプロデューサからなる生成チェインについて議論する方がより正確である。%%CreatorDSCを使用するのは一般に信頼性が高くない。最も信頼性の高い方式は、ProcSets、すなわち特定のプロデューサに必要なポストスクリプトプロシージャを定義するポストスクリプトジョブ内の特別なセクションを解析することである。このように、ジョブがLaserWriter8ドライバにより生成された場合、オーガナイザはある時点でLaserWriter8ProcSetsに遭遇する。ジョブがAdobeAcrobatアプリケーションにより生成された場合、オーガナイザはある時点でAdobeAcrobatProcSetsに遭遇する。仮想的な例において、XyzSoftにより生成されたが、XyzSoftProcSetsが存在しない場合、単にXyzSoftが当該ジョブで特定のXyzSoftリソースを一切使用しないことを意味するだけであり、従ってXyzSoftパターンを解析する必要がない。プロデューサのバラエティを考慮すれば、プロデューサを決定する際に%%CreatorDSCおよび他のDSCを解析することは、ある場合には依然として有益である。
<ページデータスニファ>
ページデータスニファ84は、ページ全体をリソースとしてマーキングすべきか否かを決定する役割を果たす。明らかに、この論理はプロデューサごとに異なる。
経験的に知られているように、例えば複数のポストスクリプト面付けパッケージにおいて、所与のプロデューサに対して当該プロデューサが使用するリソースを検出および抽出するコンポーネントを常に実装することができる。多くの場合これは簡単でないことが分かっている。長時間にわたる試行錯誤が必要である。ポストスクリプト面付けアプリケーション、およびページ独立性を追求する他の方式の場合、他に現実的なオプションが存在せず、リソースを検出して抽出しなければならない。上述の理由により、そのようなアプリケーションは一般に以下の二つの方式を採用する。1)複数のプロデューサを扱うために相当な努力を払う、2)対応するプロデューサの数を制限する。
ページ独立性を追求しない本発明は、自由に使える他のオプションを有する。実施例が示すように、ページ上のリソースの存在を認識する方がそれらを抽出または印付けするよりも大幅に容易である。上述の理由により、本発明の実装者は、ある場合において当該ページに対する高速パス(データを読み込んで処理すること)を実行し、リソースが見つかったならばページ全体をリソースとしての印付けすることを選択できる。上で述べた「リソースの集中度はジョブ内で急激に低下する」との言明を考慮すれば、本発明のこの部分のため、極めて短時間で本発明を極めて合理的にインプリメントすることができる。明らかに、本発明のより精緻な実施形態は、上述のショートカットを控えめに用いて、最も重要なプロデューサに対してリソース印付けを実施する。
<リソーススニファ>
リソーススニファ85は、リソースを認識および印付けする役割を果たす。リソース探知については上で述べた。実装者は、上述のリソースページのショートカットを使用しない限り、殆どの時間を製品固有のリソーススニファの実装に費やすことを覚悟しなければならない。複数の面付け実装を考慮すると、当業者は本発明を効率的に実装するために必要なリソース探知を実装することができる。
<画像スニファ>
画像スニファ86は、画像の境界を検出して画像を効率的にスキップする役割を果たす。画像は極めて膨大になり得るため、認識して効率的にスキップすることが有益である。明らかに、DSC規約に従い画像をスキップするために汎用DSCプロセッサ82ロジックを用いている。このロジックは、非DSC準拠に対応するためにプロデューサ固有のパターン認識ロジックにより拡張する必要がある。
<EPSスニファ>
EPSスニファ87は、ポストスクリプトジョブ内のカプセル化されたポストスクリプト(EPS)境界を検出してEPSを効率的にスキップする役割を果たす。残念ながら、いくつかのプロデューサは、EPSフラグメントの埋め込みにDSC機構を使用しない。リソースの構文解析からEPSの認識およびEPSのスキップに失敗すれば、結果的に不正確な構文解析(例:余分なページの生成、結果的にリソース衝突を引き起こす余分なリソースの印付け)が生じる恐れがある。上述の理由により、EPS探知のために特別なプロデューサ固有のパターン認識ロジックが必要である。
<グラフィック状態スニファ>
グラフィック状態スニファ88は、持続的なグラフィック状態に影響を及ぼす全てのプロデューサ固有のイディオムを収集する役割を果たす。このプロデューサ固有のスニファは、ページをまたがって持続するグラフィック状態に影響を及ぼす全てのプロデューサ固有のイディオムを収集して上述のように各ページに関連付けるために必要である。そのようなイディオムの例として、ページをまたがって持続するポストスクリプト「setfont」コマンドのエイリアスである、Windows(登録商標)ドライバにより生成された「fontnameJi」コマンドである。
<補遺>
実施の形態は、以下のような側面を含んでいる。
(1)ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブを編成する方法であって、前記編成されたジョブはページ独立である必要がなく、複数のプロセッサにより効率的に分割および処理可能であって、
PDLジョブに対して構文解析パスを1回実行するステップと、
PDLジョブプロデューサを検出するステップと、
前記PDLジョブ内の共通リソースを検出して印付けするステップと、
前記PDLジョブ内のページ境界を検出して印付けするステップと、
オリジナルの前記PDLジョブについての前記検出を行うステップ群に従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、編成された表現を生成するステップとを含む方法。
(2)ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブの順序替えのための方法であって、
PDLジョブに対して構文解析パスを1回実行するステップと、
PDLジョブプロデューサを検出するステップと、
前記PDLジョブ内の共通リソースを検出して印付けするステップと、
前記PDLジョブ内のページ境界を検出して印付けするステップと、
各ページのグラフィック状態を規定するコマンドを記録するステップと、
オリジナルの前記PDLジョブについての前記検出を行うステップ群に従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、編成された表現を生成するステップと、
前記リソースを実行するステップと、
グラフィック状態コマンドを、順序替えして送出される前記ページ群の先頭に置くステップとを含む方法。
(3)並べ替えがページ反転である、(2)に記載の方法。
(4)前記PDLジョブがポストスクリプトジョブである、(1)に記載の方法。
(5)印付けが前記PDLジョブ内で行なわれる、(1)に記載の方法。
(6)印付けが、前記編成された表現から前記PDLジョブのセクションを指示することにより行なわれる、(1)に記載の方法。
(7)編成された表現から小さいフォームファクタが得られる、(1)に記載の方法。
(8)ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブの順序替えのための装置であって、
PDLジョブに対して構文解析パスを1回実行する手段と、
PDLジョブプロデューサを検出する手段と、
前記PDLジョブ内の共通リソースを検出する手段および印付けする手段と、
前記PDLジョブ内のページ境界を検出して印付けする手段と、
各ページのグラフィック状態を規定するコマンドを記録する手段と、
オリジナルの前記PDLジョブについての前記検出を行う各手段に従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、編成された表現を生成する手段と、
前記リソースを実行する手段と、
グラフィック状態コマンドを前記ページ群の先頭に置く手段と、
前記ページ群を順序替えして送出する手段とを含む装置。
(9)前記ページ群を順序替えして送出する手段がページ反転の手段である、(8)に記載の装置。
(10)前記PDLジョブがポストスクリプトジョブである、(8)に記載の装置。
(11)マーキングが前記PDLジョブ内で行なわれる、(8)に記載の装置。
(12)マーキングが、前記編成された表現から前記PDLジョブのセクションを指示することにより行なわれる、(8)に記載の装置。
(13)ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブを順序替えする装置であって、
PDLジョブに対して構文解析パスを1回実行するプロセッサと、
PDLジョブプロデューサを検出するクリエイタスニファと、
前記PDLジョブ内の共通リソースを検出および印付けするリソーススニファと、
前記PDLジョブ内のページ境界を検出して印付けするデータスニファと、
各ページのグラフィック状態を規定するコマンドを記録するプロセッサと、
オリジナルの前記PDLジョブ内の前記検出ステップに従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、編成された表現を生成するプロセッサと、
前記リソースを実行するプロセッサと、
グラフィック状態コマンドを前記ページの先頭に置くプロセッサと、
前記ページを順序替えして送出するプロセッサと、
を備える装置。
11 ポストスクリプトジョブ、12 第1プロセッサ、13 第2プロセッサ、14 第3プロセッサ、15 第4プロセッサ、22 インタプリタ、26 レンダラ、32 集中型解釈実行プロセッサ、33 独立ページ、34 レンダリングプロセッサ、42 ポストスクリプト/PDFコンバータ、43 PDFジョブ、44 PDFディストリビュータ、45 複数のプロセッサ、51 複数のポストスクリプトジョブ、55 複数のプロセッサ、62 ジョブオーガナイザ、63 編成されたジョブ、64 ディストリビュータ、65 複数のPDLプロセッサ、66 プロセッサ、74 共通リソース、75 共有リソース記憶装置、81 オーガナイザ、82 汎用DSCプロセッサ、83 クリエイタスニファ、84 ページデータスニファ、85 リソーススニファ、86 画像スニファ、87 EPSスニファ、88 グラフィック状態スニファ。

Claims (3)

  1. ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブを編成する方法であって、前記編成されたジョブはページ独立である必要がなく、複数のプロセッサにより効率的に分割および処理可能であって、
    PDLジョブに対して構文解析パスを1回実行するステップと、
    PDLジョブプロデューサを検出するステップと、
    前記PDLジョブ内の共通リソースを検出して印付けするステップと、
    前記PDLジョブ内のページ境界を検出して印付けするステップと、
    オリジナルの前記PDLジョブについての前記検出を行うステップ群に従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、前記共通リソースの印及び前記ページ境界の印を含む編成された表現を生成するステップとを含む方法。
  2. ページ独立性を欠くページ記述言語(PDL)で記述された印刷ジョブの順序替えのための方法であって、
    PDLジョブに対して構文解析パスを1回実行するステップと、
    PDLジョブプロデューサを検出するステップと、
    前記PDLジョブ内の共通リソースを検出して印付けするステップと、
    前記PDLジョブ内のページ境界を検出して印付けするステップと、
    各ページのグラフィック状態を規定するコマンドを記録するステップと、
    オリジナルの前記PDLジョブについての前記検出を行うステップ群に従って、前記PDLジョブ内のデータおよびリソースを再配置することなく、前記共通リソースの印及び前記ページ境界の印を含む編成された表現を生成するステップと、
    前記リソースを実行するステップと、
    グラフィック状態コマンドを、順序替えして送出される前記ページ群の先頭に置くステップとを含む方法。
  3. 並べ替えがページ反転である、請求項2に記載の方法。
JP2010525808A 2007-09-20 2008-09-12 ページ記述言語の並行処理 Active JP5349481B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/858,477 2007-09-20
US11/858,477 US20090080025A1 (en) 2007-09-20 2007-09-20 Parallel processing of page description language
PCT/US2008/010658 WO2009038670A1 (en) 2007-09-20 2008-09-12 Parallel processing of page description language

Publications (3)

Publication Number Publication Date
JP2010541041A JP2010541041A (ja) 2010-12-24
JP2010541041A5 JP2010541041A5 (ja) 2011-11-04
JP5349481B2 true JP5349481B2 (ja) 2013-11-20

Family

ID=40303641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010525808A Active JP5349481B2 (ja) 2007-09-20 2008-09-12 ページ記述言語の並行処理

Country Status (5)

Country Link
US (1) US20090080025A1 (ja)
EP (1) EP2191361A1 (ja)
JP (1) JP5349481B2 (ja)
CN (1) CN101802770A (ja)
WO (1) WO2009038670A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100202008A1 (en) * 2009-02-11 2010-08-12 Boris Aronshtam Comprehensive print job skeleton creation
US20100228951A1 (en) * 2009-03-05 2010-09-09 Xerox Corporation Parallel processing management framework
US20100315666A1 (en) * 2009-06-11 2010-12-16 Yitzhak Lazer High speed page transmission
JP5393343B2 (ja) * 2009-08-21 2014-01-22 キヤノン株式会社 印刷データ処理装置、印刷データ処理方法、プログラム
JP5424778B2 (ja) * 2009-08-21 2014-02-26 キヤノン株式会社 印刷データ処理装置、印刷データ処理方法、プログラム
JP5531531B2 (ja) * 2009-09-25 2014-06-25 富士ゼロックス株式会社 画像処理システム及び画像処理プログラム
US8665469B2 (en) * 2010-02-10 2014-03-04 Xerox Corporation Page parallel rip with interleaved chunks
US8665457B2 (en) * 2010-03-10 2014-03-04 Ricoh Company, Ltd. Postscript stream interpreter with integrated pagination
JP5538995B2 (ja) * 2010-04-30 2014-07-02 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US8427684B2 (en) 2010-06-14 2013-04-23 Infoprint Solutions Company Llc Resource conflict resolution mechanism
JP2012200956A (ja) * 2011-03-24 2012-10-22 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
US8780373B2 (en) * 2011-06-13 2014-07-15 Ricoh Company, Ltd. Serial raster image processors used for error correction in a parallel raster image processor environment
US8693016B2 (en) 2011-07-20 2014-04-08 Ricoh Company, Ltd. Processing multi-page segments in a parallel RIP environment with a serial RIP
JP4952859B1 (ja) * 2011-09-15 2012-06-13 富士ゼロックス株式会社 印刷データ処理システム
US9052854B2 (en) * 2012-03-30 2015-06-09 Xerox Corporation Parallel printing system
JP5799968B2 (ja) * 2013-03-14 2015-10-28 富士ゼロックス株式会社 印刷システム
JP6827798B2 (ja) * 2016-12-21 2021-02-10 キヤノン株式会社 画像形成装置、画像形成装置の制御方法、プログラム。
US11989601B1 (en) * 2023-03-27 2024-05-21 Kyocera Document Solutions Inc. Methods and printing system using a failover raster image processors

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05241936A (ja) * 1992-03-03 1993-09-21 Mitsubishi Electric Corp ガーベッジコレクション処理方式及びその記憶装置
US6243172B1 (en) * 1995-01-18 2001-06-05 Varis Corporation Method and system for merging variable text and images into bitmaps defined by a page description language
DE69524381T2 (de) * 1995-03-23 2002-08-14 Agfa-Gevaert N.V., Mortsel Parallele Verarbeitung des Datenstroms der Seitenbeschreibungssprache
US6657741B1 (en) * 1995-08-07 2003-12-02 Tr Systems, Inc. Multiple print engine system with selectively distributed ripped pages
JPH10198539A (ja) * 1997-01-08 1998-07-31 Fuji Xerox Co Ltd 画像形成装置および画像形成方法
US6825943B1 (en) * 1999-11-12 2004-11-30 T/R Systems Method and apparatus to permit efficient multiple parallel image processing of large jobs
US6509974B1 (en) * 2000-05-17 2003-01-21 Heidelberger Druckmaschinen Ag Automated job creation for job preparation
JP4393076B2 (ja) * 2002-02-20 2010-01-06 キヤノン株式会社 画像処理方法及びその装置
US6817791B2 (en) * 2003-04-04 2004-11-16 Xerox Corporation Idiom recognizing document splitter
US7861156B2 (en) * 2003-05-29 2010-12-28 Electronics For Imaging, Inc. Methods and apparatus for parallel processing page description language data
WO2004110759A2 (en) * 2003-06-09 2004-12-23 Goss International, Inc. Offset printing press with cantilevered printing and inking modules
JP2006039719A (ja) * 2004-07-23 2006-02-09 Fuji Xerox Co Ltd 画像処理装置、及び画像処理方法

Also Published As

Publication number Publication date
CN101802770A (zh) 2010-08-11
WO2009038670A1 (en) 2009-03-26
EP2191361A1 (en) 2010-06-02
US20090080025A1 (en) 2009-03-26
JP2010541041A (ja) 2010-12-24

Similar Documents

Publication Publication Date Title
JP5349481B2 (ja) ページ記述言語の並行処理
US20100202008A1 (en) Comprehensive print job skeleton creation
US8103952B2 (en) Directed SAX parser for XML documents
JP5183444B2 (ja) 印刷制御装置、印刷制御方法、及びコンピュータプログラム
JP3417742B2 (ja) 印刷処理装置および方法
JP5238526B2 (ja) 印刷リソース管理のためのシステム及び方法
EP1465053A2 (en) Idiom recognizing document splitter
US20100079798A1 (en) Image processing apparatus, image processing method, program therefor, and medium storing program
JP2008262543A (ja) Pdfダイレクトプリントのためのpdfデータの不連続伝送
JP2008059279A (ja) 文字列出力処理を最適化する技術
JPH09114611A (ja) 印刷処理装置および方法
US7973967B2 (en) Pseudo-multithread framework for XPSDrv filter pipeline
JP5261250B2 (ja) ページ記述言語を処理する印刷データ処理装置、方法及びコンピュータ可読媒体
JP2014076602A (ja) 印刷制御装置、画像形成システムおよびプログラム
US20080158605A1 (en) Method, Device and Computer Program Product for Generating a Page and/or Domain-Structured Data Stream from a Line Data Stream
US20050203919A1 (en) Method and apparatus for reordering an arbitrary order signal sequence into a streamable signal sequence
JP2010026895A (ja) 情報処理装置、画像形成装置、およびプログラム
CN101261621A (zh) 文档处理方法及装置
US8984397B2 (en) Architecture for arbitrary extensible markup language processing engine
CN112114817A (zh) 基于cobol语言的数据字典字段信息获取方法及装置
US9052854B2 (en) Parallel printing system
JP5244770B2 (ja) 画像形成装置
JP2012098927A (ja) 情報処理装置、情報処理方法、プログラム及び情報処理システム
US8665457B2 (en) Postscript stream interpreter with integrated pagination
JP3589255B2 (ja) 文書処理装置および方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130820

R150 Certificate of patent or registration of utility model

Ref document number: 5349481

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250