JP3776866B2 - 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム - Google Patents

電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム Download PDF

Info

Publication number
JP3776866B2
JP3776866B2 JP2002305028A JP2002305028A JP3776866B2 JP 3776866 B2 JP3776866 B2 JP 3776866B2 JP 2002305028 A JP2002305028 A JP 2002305028A JP 2002305028 A JP2002305028 A JP 2002305028A JP 3776866 B2 JP3776866 B2 JP 3776866B2
Authority
JP
Japan
Prior art keywords
file
document
electronic document
cover
printing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002305028A
Other languages
English (en)
Other versions
JP2004139466A (ja
Inventor
資長 五味
司 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002305028A priority Critical patent/JP3776866B2/ja
Priority to US10/685,493 priority patent/US7240281B2/en
Publication of JP2004139466A publication Critical patent/JP2004139466A/ja
Application granted granted Critical
Publication of JP3776866B2 publication Critical patent/JP3776866B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Description

【0001】
【発明の属する技術分野】
本発明は、例えばウェブビューアでの閲覧を前提にマークアップ言語で記述された電子ドキュメント(ウェブドキュメント)をインターネットなどのネットワークを介してダウンロードして印刷する場合に、電子ドキュメントを紙面への印刷に適合させて冊子の体裁で印刷処理する技術に関する。
【0002】
【従来の技術】
ネットワーク上に備えられた電子ドキュメントをダウンロードして印刷する場合には、例えばインターネットを常時接続し、またはその都度ダイアルアップを行う必要がある。例えば、電子ドキュメントがHTML(HyperText Markup Language )形式で記述されたファイル(HTMLファイル)で構成されている場合に、ウェブビューアに表示される1つのウェブページでも複数のファイルで構成されていることがある。そのため、ウェブビューアで閲覧している電子ドキュメントのHTMLファイルをコンピュータ端末にダウンロードして印刷する場合に、1つのHTMLファイルのダウンロード後に、ウェブページでリンクされたイメージファイルをさらにダウンロードする必要があった。また、電子ドキュメントを構成するファイルをコンピュータ端末のローカルエリアに一旦保存して印刷する場合に、HTMLファイルのリンクが絶対的記述の場合には、リンクの記述を修正する必要があった。
【0003】
特に、ウェブビューアで電子ドキュメントのウェブページを印刷すると、ウェブビューアの表示では必要であっても、ナビゲーションボタン(前ページアイコン、次ページアイコン、トップページアイコンなど)やバナーなど紙面に印刷される内容としては不必要な情報も印刷されて、印刷されるページあたりの情報密度が薄くなってしまうという問題があった。
【0004】
このような問題を解決するために、HTMLで記述された電子文書のリンク元のページ(親ページ)において、リンク付けされた目的となるHTMLファイルのページ(子ページ)の内容を親ページ上に展開して新たなHTMLファイルを編集し、この新たなファイルを印刷する方法が提案されている(特許文献1参照)。
【0005】
【特許文献1】
特開平11−25156号公報
【0006】
【発明が解決しようとする課題】
前記特許文献1に記載されている技術により、親ページからリンクされた子ページを再度ダウンロードしたりリンクを修正したりするという操作上の煩わしさや表示されているファイル単位での印刷による紙面上の余白部分を、ある程度減少させることができる。
【0007】
しかし、特許文献1に記載されている技術は、リンクされた子ページの内容を親ページ上に展開した新たなHTMLファイルを生成し、この新たなHTMLファイルの内容を単純に連続して印刷するだけである。特許文献1に記載されている技術では、印刷結果として、例えば電子マニュアルなどを本来の冊子としての体裁を備えた印刷物を印刷することができない。
【0008】
本発明の目的は、ダウンロードされたオンラインヘルプやオンラインマニュアルなどの電子ドキュメントを、本来の書物の体裁を整えた印刷物、特にドキュメント名や内容となる項目を表示した表紙を備えた印刷物もしくはドキュメント名をヘッダーやフッターとして表示した印刷物として印刷する処理をコンピュータに実行させるための電子ドキュメント印刷プログラムを提供することである。
【0009】
また、本発明の別の目的は、ダウンロードした電子ドキュメントを印刷する際に、ユーザが任意に選択した電子ドキュメントの一部分だけを本来の書物の体裁を整えた印刷物として印刷する処理をコンピュータに実行させるための電子ドキュメント印刷プログラムを提供することである。
【0010】
さらに、本発明の目的は、前記電子ドキュメント印刷プログラムで実行される処理を実現する電子ドキュメント印刷システムを提供することである。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明は、マークアップ言語で記述された電子ドキュメントを印刷する処理をコンピュータに実行させるためのプログラムであって、前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段にアクセスする処理と、前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成処理と、前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工処理と、前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理とをコンピュータに実行させるものである。
【0012】
また、前記電子ドキュメント印刷プログラムは、さらに、一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得処理を、コンピュータに実行させるものである。
【0013】
さらに、前記電子ドキュメント印刷プログラムにおいて、前記印刷処理は、前記電子ドキュメントの表紙あり印刷または表紙なし印刷のいずれかの印刷要求を受け付け、前記印刷要求が表紙あり印刷の場合に、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷し、前記印刷要求が表紙なし印刷の場合に、前記加工済ファイルをもとに前記表紙情報をヘッダー、フッターまたはヘッダーとフッターの両方に付加してドキュメントを印刷する処理を含むものである。
【0014】
または、前記電子ドキュメント印刷プログラムにおいて、前記ファイル解析・加工処理は、解析した前記文書構造をもとに、前記電子ドキュメントの目次を生成するための目次構造情報および目次項目と加工済ファイルとの対応情報を生成する処理を含み、前記印刷処理は、前記目次構造情報および前記対応情報をもとに前記文書構造の各階層の表示または非表示を動的に制御可能な目次を表示し、前記目次から印刷する項目の選択を受け付け、前記電子ドキュメントの印刷要求に応じて前記目次で選択された項目に対応する前記加工済ファイルをもとに表紙付きドキュメントを印刷する処理を含むものである。
【0015】
また、本発明は、マークアップ言語で記述された電子ドキュメントを印刷するシステムであって、一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得手段と、前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段と、前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成手段と、前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工手段と、前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理手段とを備える。
【0016】
本発明にかかるプログラムを実行するコンピュータ端末は、例えばインターネットなどのネットワークを介して電子ドキュメントを管理する電子ドキュメントサーバにアクセスし、一つの電子ドキュメントを構成するマークアップ言語形式(例えばHTML形式)のドキュメントファイルを取得する。また、印刷対象とする前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を解析定義情報記憶手段に記憶しておく。
【0017】
そして、ダウンロードした前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示されるドキュメント名称、ドキュメントコード、著作権表示などの表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する。また、前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要なナビゲーションボタンなどの情報を削除する。また、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成する。その後、ユーザの前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する。
【0018】
さらに、本発明は、ユーザから、前記電子ドキュメントの表紙あり印刷または表紙なし印刷のいずれかの印刷要求を受け付け、前記印刷要求が表紙あり印刷の場合には、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷し、前記印刷要求が表紙なし印刷の場合に、前記加工済ファイルをもとに前記表紙情報をヘッダー、フッターまたはヘッダーとフッターの両方に付加してドキュメントを印刷する。
【0019】
さらに、本発明は、解析した前記文書構造をもとに、前記電子ドキュメントの目次を生成するための目次構造情報(構造化目次構造体)および目次項目と加工済ファイルとの対応情報(ファイル対応情報)を生成し、前記構造化目次構造体および前記ファイル対応情報をもとに前記文書構造の各階層の表示または非表示を動的に制御可能な目次(構造化目次)を表示する。そして、前記構造化目次からユーザが選択した印刷する項目を受け付け、前記電子ドキュメントの印刷要求に応じて前記目次で選択された項目に対応する前記加工済ファイルをもとに表紙付きドキュメントを印刷する。
【0020】
このように、本発明は、インターネットの接続状態とはかかわりなく、ダウンロードした電子ドキュメントを書物の体裁を整えたドキュメントとして印刷することができる。特に、ドキュメント名、ドキュメントコード、著作権表示などの必要事項を表示した表紙を備えた体裁でドキュメントを印刷し、または、ドキュメント名、ドキュメントコード、著作権表示などをヘッダーやフッターなどに表示した体裁でドキュメントを印刷することができる。
【0021】
さらに、本発明は、電子ドキュメントを構成するファイルの記述から生成した構造化目次を表示し、ユーザが電子ドキュメントの文書構造を目視により確認しながら任意に選択した項目だけを印刷することができる。
【0022】
【発明の実施の形態】
図1に、本発明にかかる電子ドキュメント印刷システムの構成例を示す。電子ドキュメント印刷システム1は、ネットワーク2を介して電子ドキュメントサーバ3と接続することができる。
【0023】
電子ドキュメントサーバ3は、ウェブビューアでの表示を前提にした電子ドキュメント4を管理し、要求にもとづいて電子ドキュメント4をダウンロードさせる装置である。ここで、電子ドキュメント4は、HTMLで記述されたHTMLドキュメントとする。
【0024】
電子ドキュメント印刷システム1は、ファイル取得手段10、ファイル解析・加工手段20、印刷処理手段40を備える。
【0025】
ファイル取得手段10は、ネットワーク2を介して電子ドキュメントサーバ3から電子ドキュメント4をダウンロードする手段であり、ダウンロードファイル決定部11とダウンロード部12とを備える。
【0026】
ダウンロードファイル決定部11は、ユーザ入力などで与えられたダウンロードするファイルのURL(Uniform Resource Locator)をもとに、印刷処理対象とする1つの電子ドキュメント4を構成する複数のファイルのうちダウンロードするファイルを決定する手段である。
【0027】
ダウンロード部12は、電子ドキュメント4を構成するファイルのうちダウンロードファイル決定部11が定めたダウンロード対象のファイル群をダウンロードし電子ドキュメント印刷システム1内に格納する手段である。ダウンロードされた電子ドキュメント4のファイル群をHTMLファイル51とする。
【0028】
ファイル解析・加工手段20は、ファイル取得手段10がダウンロードしたHTMLファイル51の各ファイルの記述を解析定義情報50をもとに解析し、紙面への印刷に適合するように記述を加工した加工済ファイル53を作成し、HTMLファイル51をもとに表紙用ファイル52を作成する手段であり、表紙用ファイル作成部21、解析・加工処理部22、および目次構造体作成部23を備える。
【0029】
解析定義情報50は、印刷対象とする電子ドキュメント4をHTMLで記述する場合に用いられたテンプレートや記述規則をもとに定められた情報であって、解析処理において対象とするタグや判定規則、加工処理において付加するタグなどの解析で用いる定義情報である。電子ドキュメント印刷システム1は、ダウンロードするHTMLファイルの特性などに基づいて予め定めておいた解析定義情報50を記憶しておく。
【0030】
表紙用ファイル作成部21は、ファイル取得手段10がダウンロードしたHTMLファイル51から印刷処理時にドキュメント6の表紙となる表紙用ファイル52を作成する手段である。
【0031】
解析・加工処理部22は、解析定義情報50をもとにHTMLファイル51の記述を解析し、紙面への印刷に適合するようにHTMLファイル51を加工する手段である。具体的には、HTMLファイル51の記述を解析して、本文データ内で参照されているHTMLファイルやイメージファイルをダウンロードする。また、印刷するドキュメント6において不要な情報を削除する。また、電子ドキュメント4の文書構造をHTMLファイル51の記述から解析し、文書構造の項目単位(「章」、「節」、「項」など)にHTMLファイル51を分割する処理を行い、解析・加工処理した加工済ファイル53を電子ドキュメント印刷システム1内に格納する。
【0032】
さらに、解析結果をもとに、電子ドキュメント4の文書構造に従って分割された加工済ファイル53の階層構造と、目次(構造化目次)の各項目を表示する際に用いる項目のタイトルを取得する加工済ファイル53との対応関係をファイル対応情報54として記憶する。
【0033】
目次構造体作成部23は、解析・加工処理部22の解析結果をもとに、印刷処理手段40で表示される構造化目次の構成を管理するための構造化目次構造体55を作成する手段である。構造化目次構造体55は、電子ドキュメント4の文書構造すなわち加工済ファイル53の階層関係に関する情報である。
【0034】
印刷処理手段40は、HTMLファイル51の内容を書物の体裁を備えた印刷物として印刷するための処理を行う手段であり、構造化目次表示処理部41、ドキュメント表示処理部42、印刷項目取得部43、印刷処理部44、および印刷プレビュー処理部45を備える。
【0035】
構造化目次表示処理部41は、電子ドキュメント4の文書構造の「章、節、項」などの各項目に対応する加工済ファイル53の階層関係をツリー状態で表し、目次の各項目の表示または非表示をユーザのクリックなどにより動的に制御することができる構造化目次をウェブビューア(図示しない)に表示する手段である。構造化目次表示処理部41は、構造化目次の各項目に、対応する加工済ファイル53の内容に応じたアイコンを付加して表示することもできる。
【0036】
ドキュメント表示処理部42は、構造化目次の先頭項目として定められた加工済ファイル53の内容、構造化目次において選択された項目に対応する加工済ファイル53の内容などをウェブビューアに表示する手段である。
【0037】
印刷項目取得部43は、ウェブビューアに表示された構造化目次において印刷対象として選択された項目を取得する手段である。印刷処理部44は、印刷項目取得部43で取得された印刷項目を書物の体裁に整えたドキュメント6として印刷する手段である。印刷プレビュー処理部45は、印刷するドキュメント6の内容をウェブビューアに表示する手段である。
【0038】
以下に、電子ドキュメント印刷システム1の処理の概要を説明する。ここで、電子ドキュメント印刷システム1のファイル取得手段10がダウンロードする電子ドキュメント4は、HTMLで記述されたパソコン装置の取扱説明書を内容とするオンラインマニュアルであるとする。
【0039】
図2に、印刷対象の電子ドキュメント4の1ページがウェブビューアに表示されている場合のウェブビューアの表示画面100の例を示す。また、図3〜図5に、表示画面100に表示されているページのもととなるHTMLファイルのソースの一部を示す。図3〜図5は、1つのHTMLファイルの一部分であり、図3は先頭部分のソースの例、図4は中間部分のソースの例、図5は最後部分のソースの例を示す。
【0040】
一般的に、ウェブビューアで表示されるページは、図2の表示画面100に示すように、目次110を内容とするHTMLファイルや本文120を内容とするHTMLファイルなどから構成された表示用のHTMLファイルに基づいて表示されている。
【0041】
また、本文120として表示されるページは、ナビゲーションボタン130が組み込まれ、また、文書構造として複数の階層に属する内容が組み合わされた表示用のHTMLファイルに基づいて表示されている。ここでは、目次110から分かるように、「1 各部の名称と働き」は、「第1章 各部名称」の直下の階層に属する内容すなわち第2階層の項目(節)である。また、「パソコン本体」およびパソコン本体のイメージ140は、「1 各部の名称と働き」の直下の階層に属する内容すなわち第3階層の項目(項)である。
【0042】
電子ドキュメント印刷システム1のファイル解析・加工手段20は、図2の表示画面100に示すようなオンラインマニュアルのウェブページをそのまま印刷するのではなく、印刷物(取扱説明書)として体裁よく印刷するために、ダウンロードしたHTMLファイル51に対し解析・加工処理を施す。
【0043】
すなわち、電子ドキュメント4を体裁を整えて印刷するために、ドキュメント6の表紙を印刷するための表紙用ファイル52を作成する。
【0044】
また、本文120のページ中に組み合わされたナビゲーションボタン130などの不要な情報を削除し、文書構造を構成する「章、節、項」などの項目単位にHTMLファイル51を分割して加工済ファイル53を生成する。また、分割して生成した加工済ファイル53の階層関係を構造化目次構造体55およびファイル対応情報54として記憶しておく。
【0045】
例えば、ファイル解析・加工手段20は、図3〜図5に示すHTMLファイル51の記述から、第1階層(章)の「第1章 各部名称」を構成する第2階層(節)の項目「1 各部の名称と働き(第1章第1節)」と、その下位の第3階層(項)の項目「パソコン本体前面(第1章第1節第1項)」とが含まれていると解析する。そして、解析結果にもとづき、このHTMLファイル51をそれぞれの項目ごとに分割して2つの加工済ファイル53を生成する。
【0046】
図6〜図8に、加工済ファイル53のソースを示す。図6は、図3〜図5に示すHTMLファイルから分割した第2階層(節)の項目「1 各部の名称と働き」のファイルのソースを示す。また、図7および図8は、図3〜図5に示すHTMLファイルから分割した第3階層(項)の項目「パソコン本体前面」のファイルのソースを示す。
【0047】
図9に、構造化目次および解析・加工処理した加工済ファイル53にもとづくページを表示した表示画面の例を示す。図9の表示画面200では、印刷処理対象の電子ドキュメント4(オンラインマニュアル)の目次を階層的に表示する構造化目次210と、印刷に不要な情報を削除して項目単位に分割された加工済ファイル53にもとづく本文220とを表示する。
【0048】
図9に示すように、本文220に表示されたページの加工済ファイル53は、第2階層(節)の項目「1 各部の名称と働き」のファイルである。そのため、図2の本文120に表示されているように、第3階層(項)の項目である「パソコン本体前面」およびパソコン本体のイメージ140は同時に表示されない。
【0049】
ユーザは、表示画面200の構造化目次210に表示された構造化目次から印刷したい項目を選択することができる。電子ドキュメント印刷システム1の印刷処理手段40は、表紙用ファイル52と選択された項目に対応する加工済ファイル53とを1つの印刷ジョブ用ファイルに結合して印刷処理を行う。図10に、印刷結果のドキュメント6のイメージを示す。
【0050】
このように、電子ドキュメント印刷システム1により、図2の表示画面に示すようなウェブビューアでの表示を前提にして記述されたHTMLファイル51から、図10のイメージに示すような印刷物としての体裁を備えたドキュメント6を取得することが可能である。
【0051】
以下に、電子ドキュメント印刷システム1の各処理手段の処理をより詳細に説明する。図11に、ファイル取得処理の処理フローを示す。
【0052】
ファイル取得手段10は、ダウンロード部12により、ユーザ入力操作や他のプログラムから与えられたURLにアクセスして電子ドキュメント4の目次を記述しているHTMLファイル、例えば、”index.html”ファイルのダウンロードを行う(ステップS1)。
【0053】
そして、ダウンロードファイル決定部11により、ダウンロードした”index.html”ファイルから、ダウンロード対象とするHTMLファイルのリストを作成し、ダウンロードを行うファイルの総数を算出する(ステップS2)。具体的には、”index.html”ファイル内の最初の<hr>タグから最後の<hr>タグまでの間で<href>で定義されているURLを抽出し、抽出したURLをもとにダウンロードするHTMLファイルのリストを作成する。なお、同一のURLが複数回記述されている場合には、すでにリストに登録したURLと重複するものは無視する。
【0054】
図12〜図14に、ダウンロードした1つのindex.htmlのソースの一部を示す。図12〜図14は、index.htmlの先頭から連続する部分のソースを示し、図12の下向き矢印で示す部分から図14の上向き矢印で示す部分までに出現する<href>で定義されているURLは、目次を構成する各項目の内容であるHTMLファイルのURLであるので、これらのURLをダウンロード・ファイルのリストに登録する。
【0055】
そして、ダウンロード部12により、ダウンロード・ファイルのリストをもとに電子ドキュメント4を構成するHTMLファイルのダウンロードを行い、ダウンロードしたファイルをHTMLファイル51として記憶する(ステップS3)。
【0056】
図15に、ファイル解析・加工処理の処理フローを示す。
【0057】
ファイル解析・加工手段20は、ファイル取得手段10からダウンロードしたファイルのURLおよびHTMLファイル51が格納されたフォルダのパスを取得して、解析・加工処理部22により、解析を行うHTMLファイル51が存在するかどうかを判定する(ステップS11)。HTMLファイル51が存在する場合には、ステップS12以降の処理が行われる。
【0058】
解析・加工処理部22により、HTMLファイル51内で定義されているHTMLファイル、イメージファイルなどのダウンロードを行い、取得したファイルを記憶する(ステップS12)。
【0059】
具体的には、ダウンロードされた順番ですべてのHTMLファイル51を参照して、HTMLファイル内の最初の<hr>タグから最後の<hr>タグまでの間で<href>で定義されているURLをもとにHTMLファイルをダウンロードし、<img>タグで指定されているイメージファイルをダウンロードする。なお、既にダウンロードしたファイルと同一のファイルはダウンロードしない。図16に、ファイル取得手段10でダウンロードされたHTMLファイル51のソースの一部を示す。例えば、図16に示す下向き矢印および上向き矢印の間に出現する<href>タグで定義されたURLをもとにHTMLファイルをダウンロードする。
【0060】
さらに、所定の解析定義情報50をもとにHTMLファイル51の記述を解析し、不要な情報の削除、「章・節・項」など文書構造を構成する項目単位へのファイルの分割などの加工処理を行い加工済ファイル53を作成して記憶し、解析結果をファイル対応情報54として書き出す(ステップS13)。
【0061】
例えば、解析を行っているHTMLファイル51内の最初の<hr>タグの出現位置より前に記述された情報を削除し、HTMLファイル51内の最後の<hr>タグの出現位置より後に記述された情報を削除する。また、解析を行っているHTMLファイル51内の<href>タグを削除する。さらに、HTMLファイル51内に<h1><h2><h3>タグがある場合には、これらのタグが出現する位置の前の情報により1つのファイルを作成し、それ以降の情報により新たなファイルを作成する。
【0062】
ここでは、加工済ファイル53には、「12桁の数字列」のファイル名と「.html」の拡張子で構成されるファイル名が付与される。ファイル名の数字12桁の部分を3桁ずつ4等分に分け( ”000111222333.html ”) 、それぞれ先頭から第1階層、第2階層、第3階層、第4階層と区分する。
【0063】
ファイル名は、例えば以下のようになる。
1)「第1章」のファイルのファイル名は、”001000000000.html”となり、第1階層のファイルになる。
2)「第2章」のファイルのファイル名は、”002000000000.html”となり、第1階層のファイルになる。
3)「第2章、第1節」のファイルのファイル名は、”002001000000.html”となり、第2階層のファイルになる。
4)「第2章、第2節」のファイルのファイル名は、”002002000000.html”となり、第2階層のファイルになる。
5)「第2章、第2節、第1項」のファイルのファイル名は、”002002001000.html”となり、第3階層のファイルになる。
6)「第3章」のファイルのファイル名は、”003000000000.html”となり、第1階層のファイルになる。
【0064】
また、構造化目次で項目を示すタイトルを取得するためのHTMLファイルのURL(ファイル名)を構造化された順序でファイル対応情報54に登録する。
【0065】
次に、表紙用ファイル作成部21により、ダウンロード部12によりダウンロードされたHTMLファイル51のデータをもとに表紙用ファイル(HTMLファイル)を作成する(ステップS14)。
【0066】
例えば、電子ドキュメント4のトップページを構成するHTMLファイル51(例えばtop.htmlファイルなど)から表紙に記載するマニュアル名称、マニュアルコード、著作権に関する表示情報を抽出して表紙用ファイル52を作成し記憶しておく。
【0067】
具体的には、以下の手順により表紙用ファイル52を作成する。
1)top.htmlなどの対象となるHTMLファイル51から、改行コードにより判定した1行単位で文字列を取得する。
2)取得した行にHTMLタグ以外の文字が存在するか否かをチェックして、HTMLタグ以外の文字列を取得する。
3)この処理が1回目の処理であれば、取得したHTMLタグ以外の文字列を「マニュアル名称」とする。
4)この処理が2回目の処理であれば、取得したHTMLタグ以外の文字列を「マニュアルコード」とする。
5)変換された文字列に”Copyright”などの文字が存在するか否かをチェックし、存在する場合には、変換された文字列を著作権表示(コピーライト)とする。
6)予め備えておいた表紙用ファイルのひな形となるHTMLファイルなどに、取得したマニュアル名称、マニュアルコード、著作権表示(コピーライト)の文字列を挿入して表紙用ファイル52を作成する。
【0068】
解析、加工などを行う場合に使用する解析定義情報50は、解析において対象とするタグや加工において付加するタグなどを定義した情報である。図17に解析定義情報で定義される解析対象タグの例を示す。また、図18に、加工において付加するタグの例を示す。
【0069】
図17に示す<h1>、<h2>、<h3>は、ファイルの分割を行う際の判定に使用するタグである。<hr>は、不要な情報の削除を行う際の判定に使用するタグである。<href>は、HTMLファイルのダウンロードを行う際の判定に使用するタグである。<src img>は、イメージファイルのダウンロードを行う際の判定に使用するタグである。
【0070】
<title>は、HTMLファイルのタイトル情報が必要な場合に使用するタグである。この<title>は、構造化目次の項目に登録する文字列(タイトル)を取得する場合や、印刷処理またはプレビュー処理において表紙を作成する時に選択された項目の文字列を取得する場合に使用する。
【0071】
<meta http−equiv=”Content−Type” content=”text/html;charset=iso−2022−jp”>は、解析処理されて作成された加工済ファイル(HTMLファイル)のヘッダ部に挿入するタグである。
【0072】
<STYLE TYPE=”text/css”>H6{page−break−before:always}</STYLE>タグは、印刷処理またはプレビュー処理において印刷ジョブ用HTMLファイルのヘッダ部に挿入するタグである。このタグを挿入することにより、HTMLファイル内で<H6>タグが記述されていると、その箇所(記述位置)で改ページが行われる。<H6>は、印刷処理またはプレビュー処理において印刷ジョブ用HTMLファイル内で改ページを行う位置に記述するタグである。
【0073】
図18に示す<NAME>***</NAME>は、表紙用ファイル内のヘッダ部で使用するタグである。***の部分にマニュアル名称(ドキュメント名称)を示す文字列が記述される。
【0074】
<CODE>***</CODE>は、表紙用ファイル内のヘッダ部で使用するタグである。***の部分にマニュアルコード(ドキュメントコード)を示す文字列が記述される。
【0075】
<COPYRIGHT>***</COPYRIGHT>は、表紙用ファイル内のヘッダ部で使用するタグである。***の部分に著作権表示に関する文字列が記述される。
【0076】
<K*></K*>は、このHTMLファイルが何階層目のファイルであるかを表すためのタグである。このタグ情報は、このHTMLファイルが対応する項目の表示階層の変更が行われた時に使用する。例えば、<K1></K1>は第1階層を、<K2></K2>はその下位の第2階層を示す。
【0077】
<BASEFILENAME=”***”>は、解析・加工処理終了後の加工済ファイル53のファイル名を表すタグである。このタグ情報は、表示階層の変更が行われた時に使用する。
<SUBTITLE=”***”>は、この加工済ファイル53のタイトル名を表すタグである。このタグ情報は、表示階層の変更が行われた時に使用する。
【0078】
<viewdocs><K*><BASEFILENAME=”***”><SUBTITLE=”***”></K*></viewdocs>は、解析・加工処理中に作成される加工済ファイル53のボディ部の先頭に挿入されるタグである。
【0079】
さらに、目次構造体作成部23により、ファイル対応情報54をもとに構造化目次構造体55を作成する(ステップS15)。
【0080】
構造化目次構造体55は、構造化目次の構成を管理するための構造体である。図19に、構造化目次構造体55を構成する項目(モジュール)の例を示す。構造化目次構造体55は、以下のような項目(モジュール)から構成される。
【0081】
”HTREEITEM hTreeItem”は、構造化目次に項目を登録した際に渡される構造化目次を管理するツリーハンドルである。ツリーハンドルは、構造化目次に項目を登録する際に使用する関数”InsertItem()”の戻り値で取得される。
【0082】
”CString strTitle”は、構造化目次で項目に表示されるタイトルである。”int iRoot”は、自分がルート(第1階層)であるかどうかを判定するフラグである。値=0であれば子供すなわち第2階層以下であることを表し、値=1であればルートすなわち第1階層であることを表す。
【0083】
”int iRootCnt”自分の親となる項目が構造化目次に登録された番号である。”int iDeep”は、自分が何階層に属しているかを判定するためのフラグである。例えば、値=1であれば第1階層、値=2であれば第2階層、値=3であれば第3階層、値=4であれば第4階層であることを表す。
【0084】
”CString strPath”は、登録する加工済ファイル53のパス情報である。”bool bCheckOn”は、構造化目次で現在自分が選択されているか否かを判定するフラグである。値=TRUEであれば、構造化目次のチェックボックスがON(選択されている状態)であることを、値=FALSEであれば、構造化目次のチェックボックスがOFF(選択されていない状態)であることを表す。
【0085】
目次構造体作成部23では、加工済ファイル53の各々に付与された数字12桁のファイル名をもとにファイル間の階層関係情報を取得して構造化目次構造体55に設定する。
【0086】
図20に、構造化目次表示処理フローを示す。構造化目次表示処理は、印刷処理手段40の構造化目次表示処理部41により実行される。
【0087】
印刷処理手段40は、構造化目次表示処理部41により、構造化目次構造体55に設定された情報をもとに構造化目次を表示する(ステップS21)。具体的には、構造化目次構造体55から第1階層の項目を抽出し、抽出した項目に対応する加工済ファイル53のファイル名をファイル対応情報54から取得し、取得した加工済ファイル53内の<TITLE>タグの文字列(タイトル)を抽出し、図9に示す表示画面200の構造化目次210に抽出したタイトルをツリー形状で表示する。これにより、構造化目次のデフォルト表示として第1階層の項目である各章のタイトルが表示される。
【0088】
また、印刷処理手段40は、構造化目次表示処理部41により、構造化目次のタイトルと共に、項目内容の種類に応じたアイコンを表示することができる。例えば、タイトルを表示する項目に対応する加工済ファイル53内の最初の<hr>タグから最後の<hr>タグまでの間に出現するタグの出現割合を算出し、所定のタグが90%以上の割合で出現する場合には、そのタグに応じたアイコンを表示する。図21にアイコン表示の例を示す。図21に示すように、加工済ファイル53内に所定の割合で出現するタグが<table>である場合には構造化目次の項目に表アイコンを、<img>である場合にはイメージアイコンを、<a>である場合にはリンクアイコンを表示する。またこれら3つのタグが所定の出現割合を満たさない場合などはブックアイコンを表示する。
【0089】
また、ドキュメント表示処理部42は、構造化目次の先頭項目に登録された加工済ファイル53(HTMLファイル)の内容を表示画面200の本文220に表示する(ステップS22)。
【0090】
図22に、印刷処理の処理フローを示す。印刷処理は、印刷処理手段40の印刷項目取得部43および印刷処理部44により実行される。
【0091】
印刷処理手段40は、印刷項目取得部43により、構造化目次で選択された項目、表紙印刷の有無の設定を取得する(ステップS31)。印刷する項目の選択は、表示画面200の構造化目次210に表示された項目のチェックボックスをユーザがチェックすることにより行う。また、表紙印刷の有無は、例えば、表示画面200の操作指定項目表示部(メニューバー)に表紙印刷メニューを表示したり、印刷設定画面(図示しない)に表紙印刷の設定チェックボックスを表示したりして、ユーザがこれらのメニュー項目を選択したり設定をチェックすることにより行う。
【0092】
そして、印刷時の表紙の有無を判断し(ステップS32)、「表紙あり」であれば表紙作成処理を行う(ステップS33)。
【0093】
図23に表紙作成処理の処理フローを示す。印刷処理部44により、作業域に印刷ジョブ用ファイルを作成し、表紙用ファイルのひな型の内容をコピーする(ステップS40)。さらに構造化目次構造体55をもとに構造化目次の項目が存在するかどうかを判断し(ステップS41)、項目が存在すれば、構造化目次の項目を先頭から順に1つずつチェックして、項目が選択されているかどうかを判断する(ステップS42)。bCheckOn”のフラグの値をみて構造化目次の項目が選択されていれば、作業域に一時的構造体を作成し、この一時的構造体に格納されているタイトル数のカウンタ値が所定数(例えば15)以下であるかどうかを判断する(ステップS43)。
【0094】
一時的構造体のタイトル数のカウンタ値が所定数以下であれば、構造化目次で選択された項目のタイトルを取得して一時的構造体に格納する。その後タイトル数のカウンタ値をカウントアップする(ステップS44)。具体的には、抽出した項目に対応する加工済ファイル53のファイル名をファイル対応情報54から取得し、取得した加工済ファイル53内の<title>タグの文字列(タイトル)を抽出し一時的構造体に格納し、タイトル数のカウンタ値を1加算する。なお、選択された項目が属する階層をチェックして、選択された項目が複数の階層のものである場合には、最上位の階層の項目のタイトルのみを格納する。また、選択されたすべての項目のタイトルを順に格納するようにしてもよい。
【0095】
構造化目次で未処理の選択された項目が残っていれば、タイトル数のカウンタ値が所定数に達しない間は、ステップS43およびステップS44の処理を行う。そして、タイトル数のカウンタ値が所定数を超過していれば、一時的構造体のタイトルの最後尾に文字列「その他・・・」を格納する(ステップS45)。
【0096】
その後、表紙用ファイル52から改行コードで判定して1行単位で文字列を取得し(ステップS46)、ファイルの最後尾になるまで(ステップS47)、取得した文字列内に<a name=”item”>タグが存在するか否かを判定する(ステップS48)。文字列内に<a name=”item”>タグが存在する場合には、一時的構造体に格納されている項目のタイトルを印刷ジョブ用ファイルに挿入する(ステップS49)。
【0097】
一方、文字列内に<a name=”item”>タグが存在しない場合には、1行単位で文字列を取得して(ステップS46)、ファイルの最後尾になるまで(ステップS47)ステップS48およびステップS49の処理を繰り返す。
【0098】
表紙作成処理(図22:ステップS33)を行った後、選択されている項目の加工済ファイル53をファイル対応情報54に設定されている順序で抽出し、印刷ジョブ用ファイルに抽出された順序で加工済ファイル53を結合する(ステップS34)。一方、印刷時の表紙の有無を判断して(ステップS32)、「表紙なし」であれば、選択されている項目の加工済ファイル53をファイル対応情報54に設定されている順序で抽出し、加工済ファイル54を抽出された順序で1つのファイルに結合して印刷ジョブ用ファイルとする(ステップS35)。その後、印刷ジョブ用ファイルの表紙以外のページにヘッダー、フッター、またはその両方とページ番号を付加してドキュメント6を印刷する(ステップS36)。例えば、ヘッダーにはその項目のタイトル、マニュアル名などの文字列を、フッターにはマニュアル名、著作権表示などの文字列を挿入して印刷する。
【0099】
図24に、プレビュー処理の処理フローを示す。プレビュー処理は、印刷処理手段40の印刷プレビュー処理部45により実行される。印刷処理手段40は、印刷プレビュー処理部45により、プレビューが選択されたか否かを判定し(ステップS51)、プレビューが選択されたら、印刷処理部44から印刷ジョブ用ファイルを取得し(ステップS52)、印刷ジョブ用ファイルの表紙以外のページにヘッダー、フッター、またはその両方とページ番号を付加してその内容をプレビュー画面(図示しない)に表示する(ステップS53)。そして、プレビュー画面で戻るまたは終了のボタンがクリックで選択された場合にはプレビュー画面を閉じて終了する(ステップS54)。
【0100】
本発明の各処理手段または機能または要素は、コンピュータにより読み取られ実行される処理プログラムとして実現することができる。また、本発明を実現する処理プログラムは、コンピュータが読み取り可能な、可搬媒体メモリ、半導体メモリ、ハードディスクなどの適当な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。図25に、電子ドキュメント印刷システムをコンピュータが読み取り可能な処理プログラムで実現する場合に、処理プログラムで使用する関数(モジュール)の例を示す。
【0101】
以上、本発明をその実施の形態により説明したが、本発明はその主旨の範囲において種々の変形が可能であることは当然である。
【0102】
本形態において、本発明にかかる電子ドキュメント印刷システム1は、ファイル取得手段10がネットワーク2を介したダウンロード機能を備えるものとして説明した。しかし、電子ドキュメント印刷システム1のファイル取得手段10はダウンロード機能を備えずに、外部記憶装置などに記憶されたHTMLファイル51を読み込んでファイル解析・加工処理および印刷処理を行うことも可能である。
【0103】
本形態において、本発明にかかる電子ドキュメント印刷システム1は、1つの解析定義情報を備えているものとして説明した。しかし、電子ドキュメント印刷システム1は、印刷処理対象とする種々の電子ドキュメントごとに対応する、その電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートや記述規則にもとづいて予め定めた情報を定義した複数の解析定義情報を備えるようにしてもよい。
【0104】
本発明の形態および実施例の特徴を列記すると以下のとおりである。
【0105】
(付記1) マークアップ言語で記述された電子ドキュメントを印刷する処理をコンピュータに実行させるためのプログラムであって、
前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段にアクセスする処理と、
前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成処理と、
前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工処理と、
前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理とを、
コンピュータに実行させる
ことを特徴とする電子ドキュメント印刷プログラム。
【0106】
(付記2)前記付記1に記載の電子ドキュメント印刷プログラムにおいて、
さらに、一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得処理を、
コンピュータに実行させる
ことを特徴とする電子ドキュメント印刷プログラム。
【0107】
(付記3)前記付記1に記載の電子ドキュメント印刷プログラムにおいて、
前記表紙ファイル作成処理は、前記表紙情報として前記電子ドキュメントの名称および識別情報を抽出する処理を含む
ことを特徴とする電子ドキュメント印刷プログラム。
【0108】
(付記4)前記付記1に記載の電子ドキュメント印刷プログラムにおいて、
前記表紙ファイル作成処理は、前記表紙情報として著作権表示に関する情報を抽出する処理を含む
ことを特徴とする電子ドキュメント印刷プログラム。
【0109】
(付記5)前記付記1に記載の電子ドキュメント印刷プログラムにおいて、
前記印刷処理は、前記電子ドキュメントの表紙あり印刷または表紙なし印刷のいずれかの印刷要求を受け付け、前記印刷要求が表紙あり印刷の場合に、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷し、前記印刷要求が表紙なし印刷の場合に、前記加工済ファイルをもとに前記表紙情報をヘッダー、フッターまたはヘッダーとフッターの両方に付加してドキュメントを印刷する処理を含む
ことを特徴とする電子ドキュメント印刷プログラム。
【0110】
(付記6)前記付記1に記載の電子ドキュメント印刷プログラムにおいて、
前記ファイル解析・加工処理は、解析した前記文書構造をもとに、前記電子ドキュメントの目次を生成するための目次構造情報および目次項目と加工済ファイルとの対応情報を生成する処理を含み、
前記印刷処理は、前記目次構造情報および前記対応情報をもとに前記文書構造の各階層の表示または非表示を動的に制御可能な目次を表示し、前記目次から印刷する項目の選択を受け付け、前記電子ドキュメントの印刷要求に応じて前記目次で選択された項目に対応する前記加工済ファイルをもとに表紙付きドキュメントを印刷する処理を含む
ことを特徴とする電子ドキュメント印刷プログラム。
【0111】
(付記7) マークアップ言語で記述された電子ドキュメントを印刷するシステムであって、
一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得手段と、
前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段と、
前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成手段と、
前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工手段と、
前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理手段とを備える
ことを特徴とする電子ドキュメント印刷システム。
【0112】
(付記8) マークアップ言語で記述された電子ドキュメントを印刷する処理をコンピュータに実行させるためのプログラムを記録する記録媒体であって、
一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得処理と、
前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段にアクセスする処理と、
前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成処理と、
前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工処理と、
前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理とを、
コンピュータに実行させるプログラムを記録した
ことを特徴とする電子ドキュメント印刷プログラム記録媒体。
【0113】
(付記9) マークアップ言語で記述された電子ドキュメントを印刷する処理方法であって、
一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得し、
前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段にアクセスし、
前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成し、
前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成し、
前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する
ことを特徴とする電子ドキュメント印刷処理方法。
【0114】
【発明の効果】
以上説明したように、本発明によれば、ユーザは、インターネットの接続状態とはかかわりなく、すなわちインターネットへの常時接続やダイアルアップ接続が不可能な状況においても、ダウンロードしておいたオンラインヘルプファイルやオンラインマニュアルなどの電子ドキュメントを冊子の体裁で印刷された印刷物として取得することができる。
【0115】
また、ユーザは、かかる印刷物をウェブビューアで閲覧して確認することができる。
【0116】
また、本発明では、電子ドキュメントを構成するファイルの記述を解析して紙面への印刷へ適したファイルに加工するため、電子ドキュメントを表示するために作成されたHTMLファイルを単純に連続印刷する場合に比べて、ドキュメントの内容をまとめて印刷することができ、印刷枚数を節約することができる。
【0117】
さらに、本発明により、ユーザは、電子ドキュメントを構成する項目をツリー形状で表示した目次から印刷したい項目だけを任意に選択することができ、選択された項目のみで構成されたドキュメントを冊子の体裁を整えた印刷物として取得することができる。
【図面の簡単な説明】
【図1】本発明にかかる電子ドキュメント印刷システムの構成例を示す図である。
【図2】印刷対象とする電子ドキュメントのページを表示するページビューアの表示画面例を示す図である。
【図3】図2に示す本文ページのHTMLファイルのソースの一部を示す図である。
【図4】図2に示す本文ページのHTMLファイルのソースの一部を示す図である。
【図5】図2に示す本文ページのHTMLファイルのソースの一部を示す図である。
【図6】加工済ファイルのソースを示す図である。
【図7】加工済ファイルのソースの一部を示す図である。
【図8】加工済ファイルのソースの一部を示す図である。
【図9】構造化目次および加工済ファイルのページを表示する表示画面の例を示す図である。
【図10】印刷結果のドキュメントのイメージを示す図である。
【図11】ファイル取得処理の処理フローを示す図である。
【図12】ファイル取得処理を説明するためにダウンロードしたindex.htmlのソースの一部を示す図である。
【図13】ファイル取得処理を説明するためにダウンロードしたindex.htmlのソースの一部を示す図である。
【図14】ファイル取得処理を説明するためにダウンロードしたindex.htmlのソースの一部を示す図である。
【図15】ファイル解析・加工処理の処理フローを示す図である。
【図16】データ解析・加工処理におけるダウンロードを説明するためにHTMLファイルのソースの一部を示す図である。
【図17】解析において対象となる解析対象タグの例を示す図である。
【図18】加工において付加するタグの例を示す図である。
【図19】構造化目次構造体を構成する項目(モジュール)の例を示す図である。
【図20】構造化目次表示処理の処理フローを示す図である。
【図21】表示されるアイコンの例を示す図である。
【図22】印刷処理の処理フローを示す図である。
【図23】表紙作成処理の処理フローを示す図である。
【図24】プレビュー処理の処理フローを示す図である。
【図25】電子ドキュメント印刷システムを実現するプログラムで使用する関数(モジュール)の例を示す図である。
【符号の説明】
1 電子ドキュメント印刷システム
2 ネットワーク
3 電子ドキュメントサーバ
4 電子ドキュメント(HTML)
6 ドキュメント
10 ファイル取得手段
11 ダウンロードファイル決定部
12 ダウンロード部
20 ファイル解析・加工手段
21 表紙用ファイル作成部
22 解析・加工処理部
23 目次構造体作成部
40 印刷処理手段
41 構造化目次表示処理部
42 ドキュメント表示処理部
43 印刷項目取得部
44 印刷処理部
45 印刷プレビュー処理部
50 解析定義情報
51 HTMLファイル
52 表紙用ファイル
53 加工済ファイル
54 ファイル対応情報
55 構造化目次構造体

Claims (5)

  1. マークアップ言語で記述された電子ドキュメントを印刷する処理をコンピュータに実行させるためのプログラムであって、
    前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段にアクセスする処理と、
    前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成処理と、
    前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工処理と、
    前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理とを、
    コンピュータに実行させる
    ことを特徴とする電子ドキュメント印刷プログラム。
  2. 請求項1に記載の電子ドキュメント印刷プログラムにおいて、
    さらに、一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得処理を、
    コンピュータに実行させる
    ことを特徴とする電子ドキュメント印刷プログラム。
  3. 請求項1に記載の電子ドキュメント印刷プログラムにおいて、
    前記印刷処理は、前記電子ドキュメントの表紙あり印刷または表紙なし印刷のいずれかの印刷要求を受け付け、前記印刷要求が表紙あり印刷の場合に、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷し、前記印刷要求が表紙なし印刷の場合に、前記加工済ファイルをもとに前記表紙情報をヘッダー、フッターまたはヘッダーとフッターの両方に付加してドキュメントを印刷する処理を含む
    ことを特徴とする電子ドキュメント印刷プログラム。
  4. 請求項1に記載の電子ドキュメント印刷プログラムにおいて、
    前記ファイル解析・加工処理は、解析した前記文書構造をもとに、前記電子ドキュメントの目次を生成するための目次構造情報および目次項目と加工済ファイルとの対応情報を生成する処理を含み、
    前記印刷処理は、前記目次構造情報および前記対応情報をもとに前記文書構造の各階層の表示または非表示を動的に制御可能な目次を表示し、前記目次から印刷する項目の選択を受け付け、前記電子ドキュメントの印刷要求に応じて前記目次で選択された項目に対応する前記加工済ファイルをもとに表紙付きドキュメントを印刷する処理を含む
    ことを特徴とする電子ドキュメント印刷プログラム。
  5. マークアップ言語で記述された電子ドキュメントを印刷するシステムであって、
    一つの電子ドキュメントを構成するマークアップ言語形式のドキュメントファイルを取得するファイル取得手段と、
    前記電子ドキュメントをマークアップ言語で記述する場合に用いられたテンプレートおよび記述規則をもとに定められた解析をするための解析定義情報を記憶する解析定義情報記憶手段と、
    前記ドキュメントファイルに記述されたタグ情報およびタグ要素をもとに前記電子ドキュメントの表紙に表示される表紙情報を抽出して前記電子ドキュメントの表紙ファイルを作成する表紙ファイル作成手段と、
    前記ドキュメントファイルの記述を前記解析定義情報にもとづいて解析し、前記ドキュメントファイルから前記ドキュメントの印刷に不要な情報を削除し、前記電子ドキュメントの文書構造を解析し、解析された前記文書構造に従って前記ドキュメントファイルを前記文書構造を構成する項目単位に分割して加工済ファイルを作成するファイル解析・加工手段と、
    前記電子ドキュメントの印刷要求に応じて、前記表紙ファイルおよび前記加工済ファイルをもとに表紙付きドキュメントを印刷する印刷処理手段とを備える
    ことを特徴とする電子ドキュメント印刷システム。
JP2002305028A 2002-10-18 2002-10-18 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム Expired - Fee Related JP3776866B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002305028A JP3776866B2 (ja) 2002-10-18 2002-10-18 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
US10/685,493 US7240281B2 (en) 2002-10-18 2003-10-16 System, method and program for printing an electronic document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002305028A JP3776866B2 (ja) 2002-10-18 2002-10-18 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム

Publications (2)

Publication Number Publication Date
JP2004139466A JP2004139466A (ja) 2004-05-13
JP3776866B2 true JP3776866B2 (ja) 2006-05-17

Family

ID=32452276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002305028A Expired - Fee Related JP3776866B2 (ja) 2002-10-18 2002-10-18 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム

Country Status (2)

Country Link
US (1) US7240281B2 (ja)
JP (1) JP3776866B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012059225A (ja) * 2010-09-13 2012-03-22 Seiko Epson Corp 情報処理装置,情報処理方法及びそのプログラム
CN108647066A (zh) * 2018-03-23 2018-10-12 深圳航天智慧城市系统技术研究院有限公司 在浏览器中弹出html页面遮盖citymaker三维引擎的方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4756907B2 (ja) * 2004-06-01 2011-08-24 キヤノン株式会社 画像形成装置、画像形成装置の処理方法、コンピュータプログラム及びコンピュータ読み取り可能な記録媒体
JP4651096B2 (ja) * 2004-09-09 2011-03-16 キヤノン株式会社 暗号化印刷処理方法及び装置
CN100424680C (zh) * 2004-09-09 2008-10-08 佳能株式会社 加密打印处理方法和装置
JP4311738B2 (ja) * 2004-09-15 2009-08-12 キヤノン株式会社 画像形成装置およびその制御方法、並びにコンピュータプログラム
US8065359B2 (en) * 2004-09-16 2011-11-22 Nokia Corporation Integrated method and apparatus to manage mobile devices and services
KR100636177B1 (ko) 2004-09-20 2006-10-19 삼성전자주식회사 정책 기반 확장성 생성 언어 문서 출력 관리 방법 및 시스템
FI20045367A (fi) * 2004-10-01 2006-04-02 Nokia Corp Menetelmä, laite ja tietokoneohjelma tuote mediaa sisältävän tiedoston tekijänoikeusinformaation käsittelyyn
TWI274274B (en) * 2004-12-30 2007-02-21 Teco Image Sys Co Ltd Method for dividing print document
JP4657773B2 (ja) * 2005-03-22 2011-03-23 株式会社東芝 画像処理装置および画像処理方法
JP4155278B2 (ja) 2005-04-20 2008-09-24 コニカミノルタビジネステクノロジーズ株式会社 文書処理装置、その制御プログラム、および、その制御方法
JP4182973B2 (ja) * 2005-10-31 2008-11-19 ブラザー工業株式会社 情報端末装置、データ提供システム、及び、プログラム
JP5135963B2 (ja) * 2006-10-04 2013-02-06 セイコーエプソン株式会社 画像保存システム
JP5026068B2 (ja) * 2006-12-27 2012-09-12 株式会社エヌ・ティ・ティ・データ 情報収集システム
JP4983436B2 (ja) * 2007-06-28 2012-07-25 ブラザー工業株式会社 データ構造、言語ファイル、情報処理装置および印刷装置
JP5200639B2 (ja) * 2008-04-09 2013-06-05 株式会社リコー 画像形成装置、情報処理方法、及びプログラム
EP2359263A4 (en) * 2008-12-19 2018-01-03 EntIT Software LLC Document information selection method and computer program product
JP5140615B2 (ja) * 2009-01-30 2013-02-06 京セラドキュメントソリューションズ株式会社 印刷方法、画像形成装置及びウェブサーバ
JP2010194778A (ja) * 2009-02-24 2010-09-09 Konica Minolta Business Technologies Inc 印刷装置、プログラム及び印刷装置のデータ処理方法
JP2010200062A (ja) * 2009-02-26 2010-09-09 Oki Data Corp 画像形成装置
JP2010218457A (ja) * 2009-03-18 2010-09-30 Ricoh Co Ltd 画像形成装置、画像形成方法およびプログラム
JP5545110B2 (ja) * 2010-08-06 2014-07-09 ブラザー工業株式会社 印刷のための制御装置及びコンピュータプログラム
JP5739253B2 (ja) * 2011-07-06 2015-06-24 アンテナハウス株式会社 文書処理方法
CN103500090B (zh) * 2013-09-18 2016-11-02 百度在线网络技术(北京)有限公司 一种移动设备、显示电子文件页面的方法及装置
US10866963B2 (en) 2017-12-28 2020-12-15 Dropbox, Inc. File system authentication

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6546406B1 (en) * 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
US6185588B1 (en) * 1996-12-31 2001-02-06 International Business Machines Corporation Method and apparatus for printing worldwide web pages in accordance with operator selected formatting
JP3392321B2 (ja) 1997-06-30 2003-03-31 富士通株式会社 業務用電子マニュアル提供装置とそれに接続される端末装置及びプログラム記憶媒体
US6178433B1 (en) * 1997-07-15 2001-01-23 International Business Machines Corporation Method and system for generating materials for presentation on a non-frame capable web browser
US6377956B1 (en) * 1999-02-22 2002-04-23 Siemens Corporate Research, Inc. Automatically configuring product manual by binding document objects in logical structure to proper versions of component documents in a document database
US6917436B2 (en) * 1999-04-13 2005-07-12 International Business Machines Corporation Method and computer program product for implementing web based document printing
KR100319756B1 (ko) * 2000-01-21 2002-01-09 오길록 논문 문서영상 구조 분석 방법
US20020083096A1 (en) * 2000-12-18 2002-06-27 Hsu Liang Hua System and method for generating structured documents and files for network delivery
US20040015782A1 (en) * 2002-07-17 2004-01-22 Day Young Francis Templating method for automated generation of print product catalogs

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012059225A (ja) * 2010-09-13 2012-03-22 Seiko Epson Corp 情報処理装置,情報処理方法及びそのプログラム
US8797559B2 (en) 2010-09-13 2014-08-05 Seiko Epson Corporation Information processing device, information processing method, and program thereof
CN108647066A (zh) * 2018-03-23 2018-10-12 深圳航天智慧城市系统技术研究院有限公司 在浏览器中弹出html页面遮盖citymaker三维引擎的方法

Also Published As

Publication number Publication date
JP2004139466A (ja) 2004-05-13
US20040128280A1 (en) 2004-07-01
US7240281B2 (en) 2007-07-03

Similar Documents

Publication Publication Date Title
JP3776866B2 (ja) 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
US8869023B2 (en) Conversion of a collection of data to a structured, printable and navigable format
US7240294B2 (en) Method of constructing a composite image
US6822663B2 (en) Transform rule generator for web-based markup languages
US7315848B2 (en) Web snippets capture, storage and retrieval system and method
US20070162845A1 (en) User interface for webpage creation/editing
US20090019386A1 (en) Extraction and reapplication of design information to existing websites
US8775928B2 (en) Layout-based page capture
WO2004084091A2 (en) Markup language cut-and-paste
JP2009075879A (ja) 画像処理装置と画像処理方法とプログラム
AU760816B2 (en) System for capturing, annotating and transmitting images of internet web pages
US20070101278A1 (en) Web site theme designer
WO2002037939A9 (en) Method of constructing a composite image within an image space of a webpage
JP5136087B2 (ja) クライアント装置およびクライアント制御プログラム
JP2000067038A (ja) ホームページ作成装置
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
US6826577B1 (en) Method and apparatus for data storage, and recording medium therefor
AU2002246646B2 (en) Web snippets capture, storage and retrieval system and method
KR100573091B1 (ko) 퍼스널 배너 작성 프로그램
JP2001306550A (ja) 表示情報処理装置
JP2010049598A (ja) ウェブサイト作成支援装置及びウェブサイト作成支援プログラム
KR100375506B1 (ko) 소용량 온라인 방식의 에이치티엠엘 저작 시스템 및 저작방법
JP2003058576A (ja) Webページの表示制御方法およびプログラム
JP2002342377A (ja) ウェブページ閲覧プログラム
WO2009090890A1 (ja) コンピュータ上に電子文書を表示するためのコンピュータソフトウェアプログラム及びその方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060223

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100303

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100303

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110303

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees