JP2003085159A - 文書処理装置および画像出力装置ならびにそれらの方法 - Google Patents

文書処理装置および画像出力装置ならびにそれらの方法

Info

Publication number
JP2003085159A
JP2003085159A JP2001279508A JP2001279508A JP2003085159A JP 2003085159 A JP2003085159 A JP 2003085159A JP 2001279508 A JP2001279508 A JP 2001279508A JP 2001279508 A JP2001279508 A JP 2001279508A JP 2003085159 A JP2003085159 A JP 2003085159A
Authority
JP
Japan
Prior art keywords
document
print data
contents
generating
structured document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001279508A
Other languages
English (en)
Inventor
Seizoku Go
青粟 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2001279508A priority Critical patent/JP2003085159A/ja
Publication of JP2003085159A publication Critical patent/JP2003085159A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Abstract

(57)【要約】 【課題】 構造化文書を章節の検索が容易な態様で印刷
を行い、また、他の印刷ジョブの印刷物が紛れ込まない
ようにする。 【解決手段】 構造化文書解析部501は、HTML文
書ファイルを解析して抽象ツリー構造を生成し、各描画
オブジェクトの印刷位置を決定する。関連文書検出部5
02は、先頭のHTML文書中の各章節のリンクを検出
し、関連文書読み取り部503は各章節のHTML文書
を読み取る。各章節のHTML文書に対しても同様の処
理が行われる。目次情報生成部504は、各オブジェク
トの位置・サイズに基づいて、ページ番号付きの目次情
報を生成する。構造化文書解析部501は、目次情報を
加味して各オブジェクトの印刷位置を再決定し、印刷デ
ータ生成部505が印刷データを生成する。印刷要求送
信部は506は、目次と各章節の印刷データを一つの印
刷ファイルとしてプリンタに印刷要求を送信する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネット上
では使われている構造化文書の印刷を印刷装置に要求す
る文書処理装置(情報処理装置)と、構造化文書を印刷
するネットワーク対応型画像出力装置に関するものであ
り、より広くは、このような文書処理技術や画像出力技
術に関する。
【従来の技術】近年、様々な情報を載せたWorld
Wide Webサーバ(以後WWWサーバと記す)
と、このサーバへHTTP(Hyper Text T
ransfer Protocol)、FTP(Fil
e Transfer Protocol)等プロトコ
ルでアクセスするための専用ソフトウェア(以下、ブラ
ウザと記す)を搭載したコンピュータとをネットワーク
で接続し、WWWサーバ上の情報をコンピュータから参
照することが可能となってきた。これにより、複数のコ
ンピュータから特定のWWWサーバ上の情報を参照し、
共有することが出来るようになった。更に、WWWサー
バ上の情報はHTML(Hyper Text Mar
kup Language)、XML(Extensi
ble Markup Language)等構造化文
書の形式で記載され、上記ブラウザはWWWサーバ上の
構造化文書をコンピュータ内に格納することができ、印
刷機能を有する画像出力装置に対してコンピュータ内に
一旦格納した情報の印刷出力を指示することで、WWW
サーバ上の構造化文書を印刷することも出来るようにな
った。
【0002】また、プリンタの高機能化により、上記構
造化文書を直接印刷するネットワーク対応型画像出力装
置が出現してきている。その種の画像出力装置は、クラ
イアントから構造化文書の印刷要求を受け、構造化文書
をデコンポーズし印刷する。構造化文書をデコンポーズ
中にハイパーリンクで示されたオブジェクトを検出した
場合、ネットワーク対応型画像出力装置はオブジェクト
のリンクアドレス(URLなど)にしたがって該当する
情報提供サーバからそのオブジェクトのデータを読み取
り、構造化文書の合成並びに印刷イメージの生成を行
う。
【0003】
【発明が解決しようとする課題】WWWサーバは大量の
情報を利用者に提供する場合、関連する複数の構造化文
書により構築された構造化文書群を利用することが多
い。このような構造化文書群は先頭文書とハイパーリン
クで該先頭文書から関連つけられた関連文書を備えてい
るため、長い文章でも簡単に表示することができる。即
ち、文章の目次と各章節は別々な構造化文書で表示さ
れ、文章の目次は先頭文書として、各章節の文書は目次
先頭文書のリンクとして構築されている。このような構
造化文書群で表示された文章の全文を印刷するときに、
目次と各章節は別々な構造化文章(HTML,XMLフ
ァイルなど)になっているため、印刷が各構造化文書で
個別に行われる。従って、各構造化文書の印刷ジョブの
間に他の関連無いジョブを実行する可能性がある。その
場合、印刷時間が多めにかかり、また、文章の繋がりが
なくなると言う問題があった。
【0004】また、前記のような文章の目次と各章節を
印刷しても、別々な構造化文書で記述されているため、
印刷したページ番号は各構造化文書毎のページ番号にな
ってしまい、文章の全体でページ付けをしていない。さ
らに目次には各章節のページ番号をつけず、目次から各
章節を索引するのは困難であるという問題があった。
【0005】また、たとえ前記文章の目次と各章節を同
じ構造化文書(HTML,XMLファイル等)で記述し
ていたとしても、印刷した目次に各章節のページ番号が
付いてないため、目次から各章節を索引するのは同じく
困難である。
【0006】本発明の目的は、前記のような構造化文書
群或いは単一の構造化文書の印刷において、前記各章節
を索引することが困難であると言う問題を解決すること
にある。また、構造化文書群の印刷は一回でより速やか
に行うことにより、印刷性能を向上させることを目的と
する。
【0007】
【課題を解決するための手段】本発明によれば上述の目
的を達成するために特許請求の範囲に記載のとおりの構
成を採用している。
【0008】ここでは、本発明を詳細に説明するのに先
立って特許請求の範囲の記載内容について補充的に説明
を行う。
【0009】本発明の第1の側面によれば、上述の目的
を達成するために、ネットワーク上のサーバ装置にアク
セスして前記サーバ装置より取得した所望の構造化文書
群から画像データを生成し、所定の出力装置から出力さ
せる文書処理装置に:関連文書が関連づけられ前記関連
文書とともに構造化文書群を構成する先頭文書を解析し
て、ハイパーリンクで記述された関連文書を検出する関
連文書検出手段と;前記関連文書検出手段より検出した
関連文書を前記ネットワークを介して取得する関連文書
取得手段と;前記関連文書に基づいて画像データを生成
する画像生成手段と;前記画像データに従って自動的に
目次を生成する目次生成手段と;前記画像データと前記
目次生成手段により生成した目次とを合成する合成手段
とを設けるようにしている。
【0010】この構成においては、所望の構造化文書群
の先頭文書を解析して自動的に目次を生成し、この目次
と関連文書の画像データとを合成して出力するようにし
ているので、読みやすい文書をユーザに提供できる。さ
らに、複数の文書を1つの印刷対象の画像データに変換
して出力するので、構造文書群の印刷結果の中に他の印
刷ジョブの印刷結果が紛れ込むことがない。
【0011】文書処理装置はパーソナルコンピュータや
ワークステーション等の情報処理装置として構成するこ
とができる。文書処理装置からの出力画像を受け取り画
像出力を行う出力装置は、例えばプリンタ(印刷装置)
である。プリンタはネットワークを介してまたは直接に
文書処理装置に接続される。出力装置は、例えば、表示
装置であってもよい。表示装置に表示する場合にはペー
ジ記述言語でフォーマット化されることが好ましい。
【0012】この構成において、前記目次生成手段は、
前記印刷データ生成手段により生成した印刷データに基
づいて、ページ番号を計数するページ番号計数手段を具
備し、前記ページ番号計数手段より計数されたページ番
号と関連文書中の内容を関連付けて、ページ番号付きの
目次を生成するようにしてもよい。
【0013】また、前記関連文書は連続したページとし
て印刷してもよい。
【0014】また、本発明の第2の側面によれば、上述
の目的を達成するために、ネットワーク上のサーバ装置
にアクセスして前記サーバ装置より取得した所望の構造
化文書から印刷データを生成し、所定の出力装置から出
力させる文書処理装置に:前記構造化文書から同一ファ
イル内を指しているリンクを検出するリンク検出手段
と;前記検出したリンクに基づいてページ番号を埋め込
むページ番号埋め込み手段と;前記ページ番号埋め込み
手段により変更した構造化文書に基づいて印刷データを
生成する印刷データ生成手段とを設けるようにしてい
る。
【0015】この構成においては、リンクの階層構造に
したがってページの割り振りを行うことができ読みやす
い態様で文書を印刷できる。
【0016】また、本発明の第3の側面によれば、ネッ
トワーク上のサーバ装置にアクセスして前記サーバ装置
より取得した所望の構造化文書から画像データを生成
し、所定の出力装置から出力させる文書処理装置に:前
記構造化文書を解析して、章節を抽出する章節抽出手段
と;前記章節抽出手段により抽出した章節のデータに基
づいて印刷データを生成する印刷データ生成手段と;前
記印刷データに従って自動的に目次を生成する目次生成
手段と;前記印刷データと前記目次生成手段により生成
した目次とを合成する合成手段とを設けるようにしてい
る。
【0017】この構成においては、章節に準拠して目次
を生成することによりユーザが読みやすい印刷文書を作
成できる。
【0018】なお、本発明は装置やシステムとして実現
するほかに方法の態様でも実現可能であり、また少なく
ともその一部をコンピュータプログラムとして構成する
ことができる。
【0019】本発明の上述の側面および本発明の他の側
面は特許請求の範囲に記載され、以下、実施例を用いて
詳細に説明される。
【0020】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施例を詳解する。但し、以下の説明では、情報処理
装置としてクライアントを構成するパーソナルコンピュ
ータ(PC)を想定するとともに、画像出力装置として
ネットワーク接続されたプリンタを想定する。また、構
造化文章の例として、HTMLファイルとXMLファイ
ルを取り上げることにする。
【0021】[実施例の環境]まず、実施例が適用され
る環境について説明する。
【0022】図1には、本発明の実施に供されるクライ
アントPCのハードウェア構成を模式的に図解してい
る。クライアントを構成するPCの一例は、米国インタ
ーナショナル・ビジネス・マシーンズ社のPC/AT
(Personal Computer/Advanc
ed Technology)互換機またはその後継機
である。以下、図示した各部について説明する。
【0023】PCのメインコントローラであるCPU
(Central Processing Unit)
101は、オペレーティングシステム(OS)の制御下
で、各種のアプリケーションを実行するようになってい
る。
【0024】図示の通り、CPU101は、バス113
によって他の機器類(後述)と相互接続されている。バ
ス113上の各機器にはそれぞれ固有のメモリアドレス
またはI/Oアドレスが付与されており、CPU101
はアドレス指定することによってバス接続された各機器
へのアクセスが可能となっている。バス113の一例は
PCI(Peripheral Component
Interconnect)バスである。
【0025】ROM102はプログラムコードやデータ
を恒久的に保存する読み出し専用メモリであり、例えば
システム内の各機器をハードウェア操作するためのコー
ド群や電源投入時の初期化、自己診断プログラムなどを
格納している。また、RAM103は、CPU101に
おいて実行するプログラムコードをロードしたり、実行
中の作業データを一時保管するために使用される、読み
書き可能なメモリである。
【0026】ディスプレイコントローラ105は、CP
U101が発行する描画命令を実際に処理するための専
用コントローラである。ディスプレイコントローラ10
5において処理された描画データは、例えばフレームバ
ッファ(図示しない)に一旦書き込まれた後、表示装置
108に画面出力される。表示装置108は、例えば、
CRT(Cathode Ray Tube)ディスプ
レイや、液晶表示ディスプレイ(Liquid Cry
stal Display)などである。
【0027】入力機器インターフェース106は、キー
ボード109やマウス110などのユーザ入力機器をシ
ステムに接続するための装置である。入力機器インター
フェース106は、キーボード109によるキー入力ま
たはマウス110を介した座標指示入力に応答して、プ
ロセッサ101に対して割り込みを発生する。
【0028】外部機器インターフェース107は、ハー
ドディスクドライブ(HDD)111やメディアドライ
ブ112等の外部装置をシステムに接続するための装置
であり、例えば、IDE(Integrated Dr
ive Electronics)やSCSI(Sma
ll Computer System Interf
ace)等のインターフェース規格に準拠する。
【0029】HDD111は、記憶媒体としての磁気デ
ィスクを固定的に搭載した外部記憶装置であり(周
知)、記憶容量やデータ転送速度などの点で他の外部装
置よりも優れている。ソフトウェアプログラムを実行可
能な状態でHDD111上に置くことをプログラムのシ
ステムへの「インストール」と呼ぶ。また、メディアド
ライブ112は、CD(Compact Disc)や
MO(Magneto−Optical disc)、
DVD(Digital Versatile Dis
c)等可搬型メディアを装填112aして、データ記録
面にアクセスするための装置である。可搬型メディア
は、主として、ソフトウェアプログラムやデータファイ
ルなどをコンピュータ可読形式のデータとしてバックア
ップすることや、これらを複数のシステム間で移動(販
売、流通、配布を含む)する目的で使用される。
【0030】LANインターフェース104は、Eth
ernet等の所定の通信プロトコルに従って、システ
ムをLAN(Local Area Network)
に接続することができる。LAN上では、複数のホスト
(コンピュータ:図示しない)がトランスペアレントな
状態で接続され、分散コンピューティング環境が構築さ
れている。また、ホストの一部はルータとして稼動し、
さらに他のLANやインターネットなどの外部ネットワ
ークとの相互接続を実現している。インターネット上で
は、構造化文書(XML,HTMLなど)形式で記述さ
れたドキュメントを初めとして、各種のデータコンテン
ツやソフトウェアプログラムなどの配信が行われる。
【0031】また、図2は、本発明の実施に供されたプ
リンタのハードウェア構成を模式的に示している。図示
の通り、プリンタはCPU201と、ROM202、R
AM203、操作パネル204、LANインタフェース
205とプリントエンジン206とで構成される。
【0032】メインコントローラであるCPU201
は、ROM202中に格納された制御用ソフトウェアを
実行するとともに、RAM203を作業領域として使用
する。RAM203に記憶される作業データには、RO
M202からロードされたプログラムコードの他、プリ
ント受信データ、印刷イメージなどのビットマップデー
タなどが含まれる。なお、大容量のプリント受信データ
をスプール(SPOOL:Simulataneous
Peripheral OperationOnLi
ne)するために、プリンタはHDD(図示しない)な
どの2次記憶装置を備えていてもよい。
【0033】操作パネル204は、ユーザ(オペレー
タ)が、プリンタの前で、印刷枚数や印刷条件(両面/
片面、カラー/白黒、Nアップなど)等のプリンタの設
定を行うためのユーザインターフェースである。
【0034】LANインターフェース205は、Eth
ernet等の所定の通信プロトコルに従って、プリン
タをLANに接続することができる。LAN上では、複
数のホスト(コンピュータ:図示しない)がトランスペ
アレントな状態で接続され、分散コンピューティングが
構築されている。また、ホストの一部はルータとして稼
動し、さらに他のLANインターネットなどの外部ネッ
トワークとの相互接続を実現している。インターネット
上では、構造化文書(XML,HTMLなど)形式で記
述されたドキュメントを初めとして、各種のデータコン
テンツやソフトウェアプログラムなどの配信が行われ
る。
【0035】プリンタはLAN経由で印刷要求を受信し
たり、プリント受信データ(HTML,XMLドキュメ
ント)中でリンク参照されている各種のオブジェクトへ
のアクセスを行うことができる。
【0036】プリントエンジン206は、印刷データと
してのビットマップイメージを受信して、所定の印刷用
紙上への情報出力を実行する。
【0037】図3には、クライアント(図1)301
と、プリンタ(図2)302とを含んだ本実施例にかか
るネットワークプリントシステムの構成を模式的に示し
ている。
【0038】図示の通り、クライアント301とプリン
タ302はLAN303を介してインターネット304
に接続されている。
【0039】本実施例かかるプリンタ302は、ネット
ワーク対応型である。即ち、プリンタ302は、クライ
アント301から印刷要求を受け取った文書の印刷を行
う。この場合、クライアント301が、構造化文書を解
析し構造化文書中に記述されたネットワーク情報すなわ
ちURLにしたがって関連するオブジェクトデータをネ
ットワーク上の該当サーバから受け取って目次生成やペ
ージ番号付与を行って、プリンタ302に印刷要求を行
うことができる。また、プリンタ302が、クライアン
ト301から構造化文書自体の印刷要求を直接に受け取
って、該当サーバからオブジェクトデータをダウンロー
ドして目次生成やページ番号付与を行って印刷出力する
ようにしてもよい。プリンタアダプタや、プリント管理
を行う所定のプリントサーバが目次生成やページ番号付
与を行ってもよい。
【0040】なお、以下に説明する実施例では、クライ
アント301が目次生成やページ番号付与を行ってい
る。
【0041】[第1の実施例]図4には、本実施例に係
る構造化文書を例示している。同図に示す例では、構造
化文書はHTML形式で記述されている。また、本例で
は、先頭文書Lと個別の要素文書Cとが別々のHTML
文書となっている。先頭文書には各章節のタイトルが記
述され、各章節の要素文書にアンカータグによりリンク
が張られている。各要素文書には各章節の文章が記述さ
れている。
【0042】図5は、本発明の第1の実施例に係るクラ
イアントコンピュータの機能構成を模式的に示したブロ
ック図である。同図示したように、クライアントは構造
化文書解析部501と、関連文書検出部502と、関連
文書読み取り部503と、目次情報生成部504と、印
刷データ生成部505と、印刷要求送信部506とを実
現する。
【0043】次に、図5〜図9を参照して本実施例の形
態の全体の動作について詳細に説明する。図6は、本発
明の第1の実施例にかかる構造化文書解析部501と、
関連文書検出部502と、関連文書読み取り部503に
おいて実行される処理手順のフローチャートである。ま
ず、利用者は図4に示した先頭のHTMLファイルの印
刷要求を所定の入力手段(図1のキーボード109等)
から入力すると、構造化文書解析部501は、ファイル
の解析を行って抽象ツリー構造を生成し(Step60
1)、各オブジェクト即ち描画対象となる文字や図の印
刷位置を決定する(Step602)。図7は、構造化
文書解析部501により生成した抽象ツリーの構造の一
例を示す図である。
【0044】次に、関連文書検出部502は、先頭のH
TML文書中の関連する各章節のリンクを検出する(S
tep603)。関連文書のリンクが見つかった場合
(Step604)、関連文書読み取り部503は検出
した各章節のリンクのURLを介して、該当サーバから
各章節のHTML文書を読み取る(Step605)。
【0045】次に、読み取った各章節のHTML文書は
構造化文書解析部501を通して、構造の解析(Ste
p601)と、各オブジェクトの印刷位置決定(Ste
p602)と、関連文章リンクの検出(Step60
3)と、関連文書の読み取り(Step605)を行
う。
【0046】次に目次情報の生成および印刷データの生
成について図8を参照して説明する。の処理手順につい
ては図8を参照して説明する。図8は、本発明の第1の
実施例にかかる構造化文書解析部501と、目次情報生
成部504と、印刷データ生成部505と、印刷要求送
信部506において実行される処理手順のフローチャー
トである。
【0047】目次情報生成部504は、前記構造化文書
解析部501により配置した各オブジェクトの位置とペ
ージサイズに基づいて、ページ番号を含む目次情報の生
成を行う(Step801)。これについて、図9を参
照して後に詳述する。
【0048】次に、構造化文書解析部501は、前記目
次情報生成部504により生成したページ番号付きの目
次情報に従って、前記生成した抽象ツリーの構造をアッ
プデートして、追加した目次のオブジェクトを含む各オ
ブジェクトの印刷位置を再決定する(Step80
2)。次に、印刷データ生成部505は、前記アップデ
ートした抽象ツリーの構造と各オブジェクトの位置に従
って、印刷データを生成する(Step803)。次
に、印刷要求送信部は506は、前記生成した目次と各
章節の印刷データを一つの印刷ファイルとしてプリンタ
に印刷要求を送信する(Step804)。
【0049】図9は、前記目次情報生成部504におけ
る目次情報を生成する手順を示している。まず、前記生
成した抽象ツリー構造の原点からツリー構造に含まれる
オブジェクトを参照していく。参照したオブジェクトが
カレントページに含まれるかどうか判断し(Step9
01)、含まれていないと判断したら、ページ番号を増
加しカレントページを更新する(Step902)。次
に、前ページ(すでに確認したページ)の関連文書のリ
ンクのリストがない場合(Step903)、前ページ
の関連文書のリンクのリストを生成する(Step90
4)。次に、全部のオブジェクトの処理が終わると(S
tep905)、前記各ページの関連文書のリンクのリ
ストに基づいて、ページ付きの目次を作成する(Ste
p906)。本実施例で生成された目次の一例は例えば
図10に示すようなものである。
【0050】[第2の実施例]図11には、本実施例に
係る構造化文書を例示している。同図に示す例では、構
造化文書の目次と各章節は同じHTMLファイルで記述
され、目次から同一ファイル内をリンク指している各章
節のリンクを有する。
【0051】図12は、本発明の第2の実施例にかかる
クライアントコンピュータの機能構成を模式的に示した
ブロック図である。同図示したように、クライアントは
構造化文書解析部1201と、インターナルリンク検出
部1202と、ページ番号埋め込み部1203と、印刷
データ生成部1204と、印刷要求送信部1205とを
実現する。
【0052】次に、図12および図13を参照して本実
施例の形態の全体の動作について詳細に説明する。図1
3は、本発明の第2の実施例にかかる実施される処理手
順のフローチャートである。まず、利用者は図11に示
したHTMLファイルの印刷要求を入力手段(図1のキ
ーボード109等)から入力すると、構造化文書解析部
1201はファイルの解析を行って抽象ツリー構造を生
成し(Step1301)、各オブジェクトの印刷位置
を決定する(Step1302)。構造化文書解析部1
201により生成した抽象ツリーの構造の一例は図7に
示している。
【0053】次に、インターナルリンク検出部1202
は、前記生成した抽象ツリーを介してHTML中の同一
ファイル内を指している各章節のインターナルリンクを
検出する(Step1303)。次に、ページ番号埋め
込み部1203は構造化文書解析部1201により配置
された各オブジェクトの印刷位置とページサイズに基づ
いて、印刷出力ページを計数して、前記インターナルリ
ンク検出部1202により検出した各章節のリンクの部
分にページ番号を埋め込む(Step1304)。次
に、構造化文書解析部1201は、ページ番号を埋め込
んだ後の構造化文書の各オブジェクトの印刷位置を再決
定する(Step1305)。次に、印刷データ生成部
1204は、新たな各オブジェクトの印刷位置に従って
印刷データを生成する(Step1306)。次に、印
刷要求送信部1205は前記生成した印刷データを一つ
の印刷ファイルとしてプリンタに印刷要求を送信する
(Step1307)。
【0054】[第3の実施例]図14には、本実施例に
係る構造化文書を例示している。同図に示す例では、構
造化文書の目次と各章節は、それぞれ自分のタグを持ち
(例えば、<chapter>で各章節を表す)、同じ
XML文書に記述されている。
【0055】図15は、本発明の第3の実施例にかかる
クライアントコンピュータの機能構成を模式的に示した
ブロック図である。同図示したように、クライアントは
構造化文書解析部1501と、章節を抽出する章節抽出
部1502と、目次情報生成部1503と、印刷データ
生成部1504と、印刷要求送信部1505とを実現す
る。
【0056】次に、図15および図16を参照して本実
施例の形態の全体の動作について詳細に説明する。図1
6は、本発明の第3の実施例にかかる実行される処理手
順のフローチャートである。まず、利用者は図14に示
したXML文書の印刷要求を入力手段から入力すると、
構造化文書解析部1501は、文書の解析を行って抽象
ツリー構造を生成する(Step1601)、図7は、
構造化文書解析部1501により生成した抽象ツリーの
構造の一例を示す図である。
【0057】次に、章節抽出部1502は、XMLファ
イル中で章節のタグ(<chapter>)を探索し、
章節コンテンツを抽出する(Step1602)。次
に、前記抽出した章節のコンテンツに基づいて、構造化
文書解析部1501において章節内の各オブジェクトの
印刷位置を決定する(Step1603)。次に、目次
情報生成部1503は、前記配置した章節のオブジェク
トの位置とページサイズに基づいて、ページ番号付きの
目次情報の生成を行う(Step1604)。
【0058】次に、構造化文書解析部1501は、前記
目次情報生成部1503により生成したページ番号付き
の目次情報に従って、前記生成した抽象ツリーの構造を
更新して、追加した目次の各オブジェクトの印刷位置を
再決定する(Step1605)。次に、印刷データ生
成部1504は、前記アップデートした抽象ツリー構造
と各オブジェクトの位置に従って、印刷データを生成す
る(Step1606)。次に、印刷要求送信部150
5は、前記生成した目次と各章節の印刷データを一つの
印刷ファイルとしてプリンタに印刷要求を送信する(S
tep1607)。
【0059】以上で実施例の説明を終了する。なお、上
述の例では、構造化文書の解析、ページ番号の埋め込
み、目次情報の生成等をクライアント側で行うようにし
たが、プリンタ側でそのような処理を行うようにしても
よい。また、上述の例では印刷結果をユーザが利用する
ようにしたが、印刷結果と同様のデータ(ページ単位で
表示され、ページ送りができるもの。上述と同様に目次
やページ番号が含まれる)を表示装置に表示するように
してもよい。
【0060】
【発明の効果】上述したように、本発明の情報処理装置
と画像出力装置は次の効果を奏する。 (1)目次から各章の索引ができないと言う問題に対処
でき、各章の各部分のページ番号は一目瞭然となる。 (2)目次と各章は別々な文書になっていても、印刷し
たい文書は一つのジョブとして一回で印刷することによ
り、前記印刷ジョブの間他のジョブの割り込みによって
引き起こされた問題に対処でき、より速やかに印刷がで
きる。
【図面の簡単な説明】
【図1】 本発明の実施に供されるクライアントPCの
ハードウェア構成を模式的に示した図である。
【図2】 本発明の実施に供されるプリンタのハードウ
ェア構成を模式的に示した図である。
【図3】 クライアントと、プリンタと、サーバを含ん
だ本実施例にかかるネットワークシステム構成を模式的
示した図である。
【図4】 本発明の第1の実施例にかかる構造化文章群
の一例を示した図である。
【図5】 本発明の第1の実施例にかかるクライアント
コンピュータの機能構成を模式的に示した図である。
【図6】 本発明の第1の実施例にかかる構造化文書解
析部501と、関連文書検出部502と、関連文書読み
取り部503において実行される処理手順のフローチャ
ートである。
【図7】 本発明の第1の実施例にかかる構造化文書に
より生成した抽象ツリー構造の一例を示した図である。
【図8】 本発明の第1の実施例にかかる構造化文書解
析部501と、目次情報生成部504と、印刷データ生
成部505と、印刷要求送信部506において実行され
る処理手順のフローチャートである。
【図9】 本発明の第1の実施例にかかる目次情報生成
部504における目次情報を生成する手順のフローチャ
ートである。
【図10】 本発明の第1の実施例で生成された目次の
例を示す図である。
【図11】 本発明の第2の実施例にかかる構造化文章
の一例を示した図である。
【図12】 本発明の第2の実施例にかかるクライアン
トコンピュータの機能構成を模式的に示した図である。
【図13】 本発明の第2の実施例にかかる実施される
処理手順のフローチャートである。
【図14】 本発明の第3の実施例にかかる構造化文章
の示した一例を示した図である。
【図15】 本発明の第3の実施例にかかるクライアン
トコンピュータの機能を模式的に示した図である。
【図16】 本発明の第3の実施例にかかる実施される
処理手順のフローチャートである。
【符号の説明】
301 クライアント 302 プリンタ 501 構造化文書解析部 502 関連文書検出部 503 関連文書読み取り部 504 目次情報生成部 505 印刷データ生成部 506 印刷要求送信部 1201 構造化文書解析部 1202 インターナルリンク検出部 1203 ページ番号埋め込み部 1204 印刷データ生成部 1205 印刷要求送信部 1501 構造化文書解析部 1502 章節抽出部 1503 目次情報生成部 1504 印刷データ生成部 1505 印刷要求送信部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 419 G06F 17/30 419B Fターム(参考) 2C061 AP01 HJ08 HQ17 5B009 NA06 NB14 NC06 NG02 QA07 QA13 RC01 TA08 VC01 5B021 AA01 BB01 BB04 CC05 EE04 5B075 ND03 ND23 ND35 ND36 PQ02 PQ03 PQ05 PQ20 PQ32 UU05

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上のサーバ装置にアクセス
    して前記サーバ装置より取得した所望の構造化文書群か
    ら画像データを生成し、所定の出力装置から出力させる
    文書処理装置において、 関連文書が関連づけられ前記関連文書とともに構造化文
    書群を構成する先頭文書を解析して、ハイパーリンクで
    記述された関連文書を検出する関連文書検出手段と、 前記関連文書検出手段より検出した関連文書を前記ネッ
    トワークを介して取得する関連文書取得手段と、 前記関連文書に基づいて画像データを生成する画像生成
    手段と、 前記画像データに従って自動的に目次を生成する目次生
    成手段と、 前記画像データと前記目次生成手段により生成した目次
    とを合成する合成手段とを備えることを特徴とする文書
    処理装置。
  2. 【請求項2】 前記目次生成手段は、前記印刷データ生
    成手段により生成した印刷データに基づいて、ページ番
    号を計数するページ番号計数手段を具備し、前記ページ
    番号計数手段より計数されたページ番号と関連文書中の
    内容を関連付けて、ページ番号付きの目次を生成するこ
    とを特徴とする請求項1に記載の文書処理装置。
  3. 【請求項3】 前記関連文書は連続したページとして印
    刷することを特徴とする請求項1に記載の情報処理装置
    及び文書処理装置。
  4. 【請求項4】 ネットワーク上のサーバ装置にアクセス
    して前記サーバ装置より取得した所望の構造化文書から
    印刷データを生成し、所定の出力装置から出力させる文
    書処理装置において、 前記構造化文書から同一ファイル内を指しているリンク
    を検出するリンク検出手段と、 前記検出したリンクに基づいてページ番号を埋め込むペ
    ージ番号埋め込み手段と、 前記ページ番号埋め込み手段により変更した構造化文書
    に基づいて印刷データを生成する印刷データ生成手段と
    を備えることを特徴とする文書処理装置。
  5. 【請求項5】 ネットワーク上のサーバ装置にアクセス
    して前記サーバ装置より取得した所望の構造化文書から
    画像データを生成し、所定の出力装置から出力させる文
    書処理装置において、 前記構造化文書を解析して、章節を抽出する章節抽出手
    段と、 前記章節抽出手段により抽出した章節データに基づいて
    印刷データを生成する印刷データ生成手段と、 前記印刷データに従って自動的に目次を生成する目次生
    成手段と、 前記印刷データと前記目次生成手段により生成した目次
    とを合成する合成手段とを備えることを特徴とする文書
    処理装置。
  6. 【請求項6】 前記目次生成手段は、前記印刷データ生
    成する手段により生成した印刷データに基づいて、ペー
    ジ番号を計数するページ番号計数手段を具備し、前記ペ
    ージ番号計数手段より計数されたページ番号と関連文書
    中の内容を関連付けて、ページ番号付きの目次を生成す
    ることを特徴とする請求項5に記載の画像出力装置。
  7. 【請求項7】 請求項1〜6のいずれかに記載の文書処
    理装置と所定の出力装置とをネットワークで接続し、前
    記文書処理装置から出力される出力データに基づいて前
    記出力装置により印刷出力を行うことを特徴とする文書
    印刷システム。
  8. 【請求項8】 ネットワーク上のサーバ装置より取得し
    た所望の構造化文書群から印刷データを生成し、前記生
    成した印刷データに基づいて画像を印刷出力する画像出
    力装置において、 関連文書が関連づけられ前記関連文書とともに構造化文
    書群を構成する先頭文書を解析して、ハイパーリンクで
    記述された関連文書を検出する関連文書検出手段と、 前記関連文書検出手段より検出した関連文書を前記ネッ
    トワークを介して取得する関連文書取得手段と、 前記関連文書に基づいて印刷データを生成する印刷生成
    手段と、 前記印刷データに従って自動的に目次を生成する目次生
    成手段と、 前記印刷データを前記目次生成手段により生成した目次
    とともに印刷出力する出力手段とを備えることを特徴と
    する画像出力装置。
  9. 【請求項9】 ネットワーク上のサーバ装置より取得し
    た所望の構造化文書から印刷データを生成し、前記生成
    した印刷データに基づいて画像を印刷出力する画像出力
    装置において、 前記構造化文書から同一ファイル内を指しているリンク
    を検出するリンク検出手段と、 前記検出したリンクに基づいてページ番号を埋め込むペ
    ージ番号埋め込み手段と、 前記ページ番号埋め込み手段により変更した構造化文書
    に基づいて印刷データを生成する印刷データ生成手段
    と、 前記印刷データを印刷出力する出力手段とを備えること
    を特徴とする画像出力装置。
  10. 【請求項10】 ネットワーク上のサーバ装置より取得
    した所望の構造化文書から印刷データを生成し、前記生
    成した印刷データに基づいて画像を印刷出力する画像出
    力装置において、 前記構造化文書を解析して、章節を抽出する章節抽出手
    段と、 前記章節抽出手段により抽出した章節データに基づいて
    印刷データを生成する印刷データ生成手段と、 前記印刷データに従って自動的に目次を生成する目次生
    成手段と、 前記印刷データを前記目次生成手段により生成した目次
    とともに印刷出力する出力手段とを備えることを特徴と
    する画像出力装置。
  11. 【請求項11】 ネットワーク上のサーバ装置より取得
    した所望の構造化文書群から印刷データを生成し、前記
    生成した印刷データに基づいて画像を印刷出力する画像
    出力方法において、 関連文書が関連づけられ前記関連文書とともに構造化文
    書群を構成する先頭文書を解析して、ハイパーリンクで
    記述された関連文書を検出する関連文書検出ステップ
    と、 前記関連文書検出ステップより検出した関連文書を前記
    ネットワークを介して取得する関連文書取得ステップ
    と、 前記関連文書に基づいて印刷データを生成する印刷生成
    ステップと、 前記印刷データに従って自動的に目次を生成する目次生
    成ステップと、 前記印刷データを前記目次生成手段により生成した目次
    とともに印刷出力する出力ステップとを備えることを特
    徴とする画像出力方法。
  12. 【請求項12】 ネットワーク上のサーバ装置より取得
    した所望の構造化文書から印刷データを生成し、前記生
    成した印刷データに基づいて画像を印刷出力する画像出
    力方法において、 前記構造化文書を解析して、章節を抽出する章節抽出ス
    テップと、 前記章節抽出ステップにより抽出した章節データに基づ
    いて印刷データを生成する印刷データ生成ステップと、 前記印刷データに従って自動的に目次を生成する目次生
    成ステップと、 前記印刷データを前記目次生成手段により生成した目次
    とともに印刷出力する出力ステップとを備えることを特
    徴とする画像出力方法。
  13. 【請求項13】 ネットワーク上のサーバ装置にアクセ
    スして前記サーバ装置より取得した所望の構造化文書群
    から画像データを生成し、所定の出力装置から出力させ
    る文書処理方法において、 関連文書が関連づけられ前記関連文書とともに構造化文
    書群を構成する先頭文書を解析して、ハイパーリンクで
    記述された関連文書を検出する関連文書検出ステップ
    と、 前記関連文書検出ステップより検出した関連文書を前記
    ネットワークを介して取得する関連文書取得ステップ
    と、 前記関連文書に基づいて画像データを生成する画像生成
    ステップと、 前記画像データに従って自動的に目次を生成する目次生
    成ステップと、 前記画像データと前記目次生成ステップにより生成した
    目次とを合成する合成ステップとを備えることを特徴と
    する情報処理方法。
  14. 【請求項14】 ネットワーク上のサーバ装置にアクセ
    スして前記サーバ装置より取得した所望の構造化文書か
    ら印刷データを生成し、所定の出力装置から出力させる
    文書処理方法において、 前記構造化文書から同一ファイル内を指しているリンク
    を検出するリンク検出ステップと、 前記検出したリンクに基づいてページ番号を埋め込むペ
    ージ番号埋め込みステップと、 前記ページ番号埋め込みステップにより変更した構造化
    文書に基づいて印刷データを生成する印刷データ生成ス
    テップとを備えることを特徴とする文書処理方法。
  15. 【請求項15】 ネットワーク上のサーバ装置にアクセ
    スして前記サーバ装置より取得した所望の構造化文書か
    ら画像データを生成し、所定の出力装置から出力させる
    文書処理方法において、 前記構造化文書を解析して、章節を抽出する章節抽出ス
    テップと、 前記章節抽出ステップにより抽出した章節データに基づ
    いて印刷データを生成する印刷データ生成ステップと、 前記印刷データに従って自動的に目次を生成する目次生
    成ステップと、 前記印刷データと前記目次生成ステップにより生成した
    目次とを合成する合成ステップとを備えることを特徴と
    する文書処理方法。
JP2001279508A 2001-09-14 2001-09-14 文書処理装置および画像出力装置ならびにそれらの方法 Pending JP2003085159A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001279508A JP2003085159A (ja) 2001-09-14 2001-09-14 文書処理装置および画像出力装置ならびにそれらの方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001279508A JP2003085159A (ja) 2001-09-14 2001-09-14 文書処理装置および画像出力装置ならびにそれらの方法

Publications (1)

Publication Number Publication Date
JP2003085159A true JP2003085159A (ja) 2003-03-20

Family

ID=19103686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001279508A Pending JP2003085159A (ja) 2001-09-14 2001-09-14 文書処理装置および画像出力装置ならびにそれらの方法

Country Status (1)

Country Link
JP (1) JP2003085159A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8051371B2 (en) 2004-10-25 2011-11-01 Nec Corporation Document analysis system and document adaptation system
WO2012169380A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
JP2017045203A (ja) * 2015-08-25 2017-03-02 シャープ株式会社 画像処理装置、画像形成装置及び章分け処理方法
CN108228176A (zh) * 2016-12-15 2018-06-29 北京国双科技有限公司 一种表格的创建方法及创建装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8051371B2 (en) 2004-10-25 2011-11-01 Nec Corporation Document analysis system and document adaptation system
WO2012169380A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
JPWO2012169380A1 (ja) * 2011-06-09 2015-02-23 達也 進藤 文書共有システム
JP2017045203A (ja) * 2015-08-25 2017-03-02 シャープ株式会社 画像処理装置、画像形成装置及び章分け処理方法
CN108228176A (zh) * 2016-12-15 2018-06-29 北京国双科技有限公司 一种表格的创建方法及创建装置

Similar Documents

Publication Publication Date Title
US6965958B1 (en) Searching for printers over a network using intermediate print data
US8928904B2 (en) Data processing apparatus having a printer driver for changing an output destination
JP3984890B2 (ja) 印刷制御装置および方法、コンピュータプログラム、記憶媒体
JP2006065839A (ja) 情報処理装置及び印刷情報処理方法、並びにコンピュータプログラム
JP5451352B2 (ja) プリントサーバー、印刷設定画面の提供方法及びプログラム
US7149826B2 (en) Peripheral device output job routing
US8688864B2 (en) Information processing apparatus, information processing method, and information processing program
US20040021906A1 (en) Peripheral device output job routing
JP2001109693A (ja) デバイス検索クライアント並びにデバイス並びにデバイス検索サーバ、またその方法並びにそのプログラムが格納された記憶媒体
JP2015225481A (ja) 印刷設定情報を効率良く編集するためのプログラム
JPH11143661A (ja) 印刷システム
JP2008146177A (ja) 情報検索方法及び情報検索装置
JP2003085159A (ja) 文書処理装置および画像出力装置ならびにそれらの方法
JP2007094554A (ja) 情報処理装置および印刷装置探索方法
US7352484B2 (en) Printing system and management method therefor
JP2003084951A (ja) 文書処理装置および画像出力装置ならびにそれらの方法
JP3829798B2 (ja) 画像形成装置およびプログラム
US20060119886A1 (en) Print control unit and a print control program
JPH1115608A (ja) 印刷データ生成装置及び印刷データ生成方法
JP3399461B2 (ja) 印刷システム
JP2002007133A (ja) デバイスドライバーのインストール方法
JP2003330658A (ja) 印刷システム
JP2003308325A (ja) データ登録装置、データ登録方法、データ登録プログラムおよび記録媒体
JP2000276311A (ja) ネットワーク情報出力装置及び方法
JP2010061677A (ja) データ処理装置、印刷装置、データ処理方法、制御方法、および記録媒体