JP2000148438A - 構造化文書の出力装置 - Google Patents

構造化文書の出力装置

Info

Publication number
JP2000148438A
JP2000148438A JP10317934A JP31793498A JP2000148438A JP 2000148438 A JP2000148438 A JP 2000148438A JP 10317934 A JP10317934 A JP 10317934A JP 31793498 A JP31793498 A JP 31793498A JP 2000148438 A JP2000148438 A JP 2000148438A
Authority
JP
Japan
Prior art keywords
structured document
document data
document
declaration information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10317934A
Other languages
English (en)
Inventor
Hiroyuki Eguchi
博行 江口
Nobuo Iwata
伸夫 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP10317934A priority Critical patent/JP2000148438A/ja
Publication of JP2000148438A publication Critical patent/JP2000148438A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Record Information Processing For Printing (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 構造化文書における印刷の作業効率を向上さ
せるとともに、コストの低減を図る。 【解決手段】 ホストI/F11は、上記LAN20に
接続されており、該LAN20を介してホスト装置30
から送信される文書データを受信する。解析部12は、
受信した文書データの構成要素を解析する。選択部13
は、解析部12により解析された文書データの構成要素
の要素名を操作パネル14にメニュー表示し、ユーザか
らの選択指示を解釈する。デコンポーザ15は、ユーザ
により選択部13で選択された要素名に該当する文書デ
ータのみを記録可能な印刷データに変換する。印刷部1
6は、デコンポーザ15により変換された印刷データを
記録用紙に印字して出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、タグと呼ばれる
識別子とともに記述される情報の集合により構成される
構造化文書を出力する構造化文書の出力装置に関する。
【0002】
【従来の技術】近年、構造化文書を作成および編集する
文書処理システムが実用化されている。構造化文書の代
表的な規格として、SGML(Standard Generalized M
arkupLanguage, ISO8613)があり、インターネットで話
題となっているHTML(Hyper Text Markup Languag
e)は、このSGMLを基礎としたものである。さら
に、HTMLの機能を拡張したXML(eXtensible Mar
kup Language)が今注目を集めている。
【0003】従来、上述した構造化文書を印刷する場
合、全文書を印刷するか、指定されたページを印刷して
いた。したがって、文章が大容量になればなるほど、印
刷にかかる所要時間が増大し、作業効率の低下を招いて
しまう。さらに、記録用紙、インクなどの消耗品の浪費
に伴い、高コスト化を余儀なくされるなどの欠点があっ
た。
【0004】そこで、上述した欠点を解決するために、
特開平2―297143号公報に記載されている印刷処
理方式では、文書の属性情報により印刷するページを指
定可能している。また、特開平2―297144号公報
に記載されている印刷処理方式では、文書の属性情報に
より印刷するノードを指定可能としている。さらに、特
開平2―297175号公報に記載されている印刷処理
方式では、指定されたノード以下に該当する文書の内容
を印刷可能とし、ユーザが予め印刷するページを把握す
る必要がなかった。
【0005】
【発明が解決しようとする課題】しかしながら、従来技
術では、指定した文書中のテキストのみを印刷したい場
合や、任意の図を印刷したい場合でも、ページやノード
単位でしか選択することができないため、不要な部分を
印刷してしまい、構造化文書の利点を十分に活用するこ
とができないという問題があった。
【0006】この発明は上述した事情に鑑みてなされた
もので、構造化文書において選択された構成要素に対応
する部分のみを出力することができ、また、作業効率を
向上させることができるとともに、コストの低減を図る
ことができる構造化文書の出力装置を提供することを目
的としている。
【0007】
【課題を解決するための手段】上述した問題点を解決す
るために、請求項1記載の発明では、予め定義された構
成要素の集合から構成される構造化文書データを入力す
る入力手段と、前記入力手段から入力した構造化文書デ
ータの構成要素を定義する要素宣言情報を抽出する要素
宣言情報抽出手段と、前記要素宣言情報抽出手段によっ
て抽出された要素宣言情報を表示する表示手段と、前記
表示手段に表示された要素宣言情報のなかから少なくと
も1つの要素宣言情報を選択する選択手段と、前記選択
手段によって選択された要素宣言情報により記述された
部分を、前記入力手段から入力した構造化文書データか
ら抽出する部分抽出手段と、前記部分抽出手段によって
抽出された部分の文書データを出力する出力手段とを具
備することを特徴とする。
【0008】この発明によれば、入力手段により、予め
定義された構成要素の集合から構成される構造化文書デ
ータを入力し、要素宣言情報抽出手段により、構造化文
書データの構成要素を定義する要素宣言情報を抽出す
る。次に、前記要素宣言情報抽出手段によって抽出され
た要素宣言情報を表示手段に表示し、表示された要素宣
言情報のなかから少なくとも1つの要素宣言情報をユー
ザにより選択手段によって選択させる。そして、選択さ
れた要素宣言情報により記述された部分を、部分抽出手
段により、構造化文書データから抽出し、該抽出した部
分を出力手段で出力する。したがって、必要な部分のみ
を印刷することが可能となり、印刷時間を短縮すること
ができ、作業効率が著しく向上させることが可能とな
る。
【0009】また、前記構造化文書データが他の構造化
文書データを関連付けて記述する階層構造を有する場
合、階層選択手段により、部分抽出手段による抽出にお
ける階層の深さを選択可能とすることにより、不要な階
層の構成要素まで印刷してしまう欠点を解消し、出力時
間を短縮することが可能となり、作業効率が著しく向上
させることが可能となる。また、前記部分抽出手段を、
前記構造化文書データを蓄積する外部装置に備えるよう
に構成し、出力装置では、前記選択手段によって選択さ
れた要素宣言情報を前記外部装置に送信し、該外部装置
から送信されてくる、選択された要素宣言情報によって
記述された部分の文書データのみを受信して出力手段に
より出力することにより、送受信するデータ量を削減す
ることが可能となる。また、前記出力手段を、前記部分
抽出手段により抽出された部分を印刷データに変換して
用紙に印刷する印刷手段とすることにより、印刷時間を
短縮することが可能となり、作業効率が著しく向上させ
ることが可能となるとともに、コストの低減を図ること
が可能となる。
【0010】
【発明の実施の形態】次に図面を参照してこの発明の実
施形態について説明する。なお、本実施形態では、構造
化文書としてSGMLおよびXMLで記述された文書を
例として説明する。
【0011】A.実施形態の構成 図1は、本発明の実施形態による文書処理システムの一
構成例を示すブロック図である。文書処理装置10は、
LAN(ローカルエリアネットワーク)20を介してホ
スト30と接続されている。また、ホスト30は、LA
N20を介してプロキシサーバ31と接続されており、
また、プロシキサーバ31は、インターネット40を介
してWWWサーバ32と接続されている。ホスト30、
プロシキサーバ31、WWWサーバ32は、例えばパー
ソナルコンピュータから構成されている。
【0012】次に、ホスト30が構造化文書を入手する
プロセスについて説明する。ホスト30は、ユーザによ
り構造化文書のコンテンツの所在(URL:Uniform Re
source Locator)が入力されると、プロキシサーバ31
に問い合わせる。プロキシサーバ31に所望するコンテ
ンツがキャッシュされていれば、ホスト30は、プロキ
シサーバ31からコンテンツをダウンロードする。一
方、プロキシサーバ31に所望するコンテンツがキャッ
シュされていなければ、プロキシサーバ31は、コンテ
ンツの所在(URL)に基づいて、インターネット40
を介してWWWサーバ32からコンテンツをダウンロー
ドし、その後、ホスト30がプロキシサーバ31からコ
ンテンツをダウンロードする。
【0013】また、文書処理装置10は、ホストI/F
11、解析部12、選択部13、操作パネル14、デコ
ンポーザ15、印刷部16、CPU17、ROM18お
よびRAM19から構成されている。ホストI/F11
は、上記LAN30に接続されており、該LAN30を
介してホスト装置30から送信される文書データを受信
する。解析部12は、受信した文書データの構成要素を
解析する。また、選択部13は、解析部12により解析
された文書データの構成要素(要素名)を、後述する操
作パネル14にメニュー表示し、ユーザによって選択さ
れた構成要素を解釈する。上記解析部12および選択部
13は、ソフトウェアにより構成されており、各々、R
OMに格納されているか、後述するROM18に格納さ
れている。操作パネル14は、例えば、液晶タッチパネ
ルから構成されており、文書処理装置10の各種設定を
行うとともに、上述したように、文書データの構成要素
を表示するとともに、該構成要素から所望する要素名を
ユーザにより選択させる。
【0014】デコンポーザ15は、受信した文書データ
を記録可能な印刷データに変換する。印刷部16は、デ
コンポーザ15により変換された印刷データを出力する
プリンタ(レーザプリンタなど)とから構成されてお
り、デコンポーザ15からの印刷データを記録用紙に印
字して出力する。CPU17は、文書処理装置10の動
作全体を制御する。ROM18は、上記解析部12およ
び選択部13を構成するソフトウェアや、CPU17に
より実行される制御プログラムなどを記憶する。RAM
19は、CPU17によるプログラムの実行に伴って、
種々のデータレジスタやワーキングエリアとして用いら
れる。
【0015】SGMLまたはXMLで記述されている文
書は、図2に示すように、宣言(Declaration)、
DTD(Document Type Definition:文書型定義)、
文書インスタンス(Document Instance)の3つの部分
から構成されている。宣言は、文書がどのような基準
に従って記述されているかを示す部分であり、文書に使
われているコードの種類や、要素名などの最大文字数、
タグのマークが「<>」であることなどが含まれる。図
3は、SGML宣言の一例(ISO8879)を示す概
念図である。
【0016】DTDでは、文書インスタンスのタグ付
けの方法が定義されている。図4は、DTDの一例を示
す概念図である。図において、<!ELEMENT 要
素名-- (要素内容)>の部分が要素宣言である。文
書インスタンスは、タグ付き文書とも呼ばれ、DTDで
定義された文書の要素クラス(型)に従って、実際の文
書が記述されている部分である。図5は、文書インスタ
ンスの一例を示す概念図である。文書インスタンスは、
上記DTDで定義されたタグによって記述されている。
【0017】B.実施形態の動作 次に、上述した実施形態の動作について説明する。ここ
で、図6は、本実施形態の動作を説明するためのフロー
チャートである。ホスト30から文書の印刷が指示され
ると、まず、ホストI/F11を介してSGML宣言あ
るいはXML宣言を受信し(ステップS100)、解析
部12によってこれから受信する文書がSGMLあるい
はXMLであるか否かを判断する(ステップS11
0)。ここで、受信した文書がSGMLあるいはXML
でない場合には、受信した文書をデコンポーザ15に転
送し(ステップS120)、記録可能な印刷データに変
換する(ステップS130)。次に、変換された印刷デ
ータを印刷部16に転送し(ステップS140)、記録
紙に出力する(ステップS150)。そして、文書デー
タを全て受信したか否かを判断し(ステップS16
0)、文書データの受信が終了していない場合には、ス
テップS100に戻り、上述した処理を繰り返し実行す
る。一方、受信が終了した場合には、印刷処理を終了す
る。
【0018】受信した文書がSGMLあるいはXMLで
ある場合には、次に送られてくるDTDを受信し(ステ
ップS170)、DTDの要素宣言を抽出する(ステッ
プS180)。図7は、DTDの要素宣言が指定されて
いる例を示す概念図である。要素宣言は、<!ELEM
ENT 要素名 -- (要素内容)>の部分であり、図
示の例では、title、to(宛先)、from(発
信元)などが構成要素として宣言されている。ここで、
抽出された構成要素の要素名を選択部13によって操作
パネル14にメニュー表示する(ステップS190)。
ここで、ユーザは、操作パネル14にメニュー表示され
た構成要素名のなかから印刷したい内容に対応する要素
名を選択する。例えば、図示の例では、ユーザは、文書
のなかでタイトル部分のみを印刷したい場合には、タグ
<title>を選択する。次に、操作パネル15に表
示した要素名のうち、選択された要素名をホストI/F
11を介してホスト30に送信する(ステップS20
0)。
【0019】ここで、ホスト30は、受信した要素名に
該当する部分を文書インスタンスから抽出し、文書処理
装置10に送信する。文書処理装置10は、ホストI/
F11を介して、上記要素名に該当する部分の文書を受
信すると、解析部12によってこれから受信する文書が
SGMLあるいはXMLであるか否かを判断する(ステ
ップS110)。この場合、SGML宣言あるいはXM
L宣言ではないため、受信した文書(選択した要素名に
該当する部分)をデコンポーザ15に転送し(ステップ
S120)、記録可能な印刷データに変換する(ステッ
プS130)。そして、変換された印刷データを印刷部
16に転送し(ステップS140)、記録紙に出力する
(ステップS150)。
【0020】なお、上述した実施形態では、選択した部
分を印刷する構成としたが、これに限らず、選択した部
分を表示装置(操作パネル)に表示するようにしてもよ
い。これにより、所望する部分のみを容易に確認するこ
とができ、構造化文書から効率的に情報を収集すること
が可能となる。
【0021】上述した実施形態においては、文書処理装
置10において、DTDから印刷したい要素名を選択し
た後、ホスト30に要素名に基づく文書インスタンスの
内容の送信を要求し、ホスト30で受信した要素名に該
当する部分を文書インスタンスから抽出するようにした
が、文書処理装置10に蓄積手段を設けて、一旦、全文
書をホスト30から受信した後、文書処理装置10によ
りユーザが選択した要素名に該当する部分を文書インス
タンスから抽出するようにしてもよい。この場合、図1
に示す選択部13により、ユーザが選択した要素名に該
当する部分を文書インスタンスから抽出するようにすれ
ばよい。
【0022】さらに、SGMLあるいはXMLによる構
造化文書では、リンク先を記述することにより、他のペ
ージや他の文書を階層構造とすることができるようにな
っている。したがって、単に要素を選択すると、そこに
リンク先が定義されていると、リンク先の他の文書も印
刷されることになり、階層の深さによっては、ユーザの
意図に反して膨大な量が出力されることになる。そこ
で、本実施形態では、1文書単位の処理のみでなく、操
作パネル14から印刷したい階層位置、すなわち、リン
ク先の数を指定させることにより、印刷範囲を明確にす
ることで無駄な印刷を防止するようにしてもよい。
【0023】
【発明の効果】以上、説明したように、この発明によれ
ば、入力手段により入力された構造化文書データの構造
化文書データの構成要素を定義する要素宣言情報を、要
素宣言情報抽出手段により抽出し、該抽出された要素宣
言情報を表示手段に表示し、表示された要素宣言情報の
なかから少なくとも1つの要素宣言情報を選択手段によ
り選択し、選択された要素宣言情報により記述された部
分を、部分抽出手段により、構造化文書データから抽出
して出力手段で出力するようにしたので、必要な部分の
みを出力することができ、出力時間を短縮することがで
き、作業効率が著しく向上させることができるととも
に、コストの低減を図ることができるという利点が得ら
れる。また、構成要素を複数種類抽出することで、印刷
のバリエーションが広げることができるという利点が得
られる。さらに、文書の構成要素が階層的である場合、
階層の深さを選択するようにしたので、階層構造を有し
ている場合であっても、不要な階層の構成要素まで印刷
してしまう欠点を解消し、印刷時間を短縮することがで
き、作業効率が著しく向上させることができるという利
点が得られる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による文書処理システム
の構成を示すブロック図である。
【図2】 SGMLまたはXMLで記述されている文書
構成の一例を示す概念図である。
【図3】 SGML宣言の一例(ISO8879)を示
す概念図である。
【図4】 DTDの一例を示す概念図である。
【図5】 文書インスタンスの一例を示す概念図であ
る。
【図6】 本実施形態の動作を説明するためのフローチ
ャートである。
【図7】 DTDの要素宣言が指定されている例を示す
概念図である。
【符号の説明】
10 文書処理装置 11 ホストI/F(入力手段、送信手段、受信手段) 12 解析部(要素宣言情報抽出手段) 13 選択部(選択手段、部分抽出手段、階層選択手
段) 14 操作パネル(表示手段) 15 デコンポーザ(出力手段) 16 印刷部(出力手段、印刷手段) 17 CPU 18 ROM 19 RAM 20 LAN 30 ホスト(外部装置) 31 プロキシサーバ 32 WWWサーバ 40 インターネット
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 2C087 AB01 AB05 BA06 BD05 CB03 CB17 5B009 QA06 RC04 VC01 5B021 AA01 AA02 AA30 CC05 EE01

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 予め定義された構成要素の集合から構成
    される構造化文書データを入力する入力手段と、 前記入力手段から入力した構造化文書データの構成要素
    を定義する要素宣言情報を抽出する要素宣言情報抽出手
    段と、 前記要素宣言情報抽出手段によって抽出された要素宣言
    情報を表示する表示手段と、 前記表示手段に表示された要素宣言情報のなかから少な
    くとも1つの要素宣言情報を選択する選択手段と、 前記選択手段によって選択された要素宣言情報により記
    述された部分を、前記入力手段から入力した構造化文書
    データから抽出する部分抽出手段と、 前記部分抽出手段によって抽出された部分の文書データ
    を出力する出力手段とを具備することを特徴とする構造
    化文書の出力装置。
  2. 【請求項2】 前記構造化文書データが他の構造化文書
    データを関連付けて記述する階層構造を有する場合、前
    記部分抽出手段による抽出における階層の深さを選択す
    る階層選択手段を具備することを特徴とする請求項1記
    載の構造化文書の出力装置。
  3. 【請求項3】 前記部分抽出手段は、前記構造化文書デ
    ータを蓄積する外部装置に備えられ、 前記選択手段によって選択された要素宣言情報を前記外
    部装置に送信する送信手段と、 前記外部装置から送信されてくる、前記部分抽出手段に
    よって抽出された部分の文書データを受信する受信手段
    とを具備し、 前記出力手段は、前記受信手段によって受信した部分を
    出力することを特徴とする請求項1記載の構造化文書の
    出力装置。
  4. 【請求項4】 前記出力手段は、前記部分抽出手段によ
    り抽出された部分を印刷データに変換して用紙に印刷す
    る印刷手段であることを特徴とする請求項請求項1ない
    し3のいずれかに記載の構造化文書の出力装置。
JP10317934A 1998-11-09 1998-11-09 構造化文書の出力装置 Pending JP2000148438A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10317934A JP2000148438A (ja) 1998-11-09 1998-11-09 構造化文書の出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10317934A JP2000148438A (ja) 1998-11-09 1998-11-09 構造化文書の出力装置

Publications (1)

Publication Number Publication Date
JP2000148438A true JP2000148438A (ja) 2000-05-30

Family

ID=18093662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10317934A Pending JP2000148438A (ja) 1998-11-09 1998-11-09 構造化文書の出力装置

Country Status (1)

Country Link
JP (1) JP2000148438A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7793207B2 (en) 2005-03-28 2010-09-07 Canon Kabushiki Kaisha Converting text data into binary data using external link information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7793207B2 (en) 2005-03-28 2010-09-07 Canon Kabushiki Kaisha Converting text data into binary data using external link information

Similar Documents

Publication Publication Date Title
KR100576030B1 (ko) 인쇄 시스템, xml 파일의 인쇄 방법 및 컴퓨터 판독 가능 기록 매체
EP1810124B1 (en) Document managing system and method thereof
JP3444269B2 (ja) ネットワーク上のコンテンツを編集して印刷するネットワークプリンタ及びネットワーク上のコンテンツ印刷方法
JP4338905B2 (ja) Pdf直接印刷機能付きプリンタの印刷指示用プログラムおよび印刷指示方法
US20040015782A1 (en) Templating method for automated generation of print product catalogs
JP2003131930A (ja) コンテンツ変換処理装置、スタイルシート自動選択方法、およびそのプログラム
CN110865775B (zh) 一种基于web进行在线设计与预览的打印方法
EP0964339A2 (en) Computer system for printing a HTML document
US6907565B1 (en) Web-based output writer and editor
US7688460B2 (en) Communication terminal for accessing and printing page data from links
JP2000148438A (ja) 構造化文書の出力装置
US20040051901A1 (en) Information processsing apparatus, a function extension program, computer readable storage medium storing the program, and information processing method
JPH11265273A (ja) ネットワークプリンタ装置
JPH11316672A (ja) インターネットプリントシステム
JPH11272440A (ja) 印刷方法
JP2002103746A (ja) Xmlデータ対応バーコードの印字方法
WO1998036365A1 (en) Hyper text markup language development tool
JP2001306550A (ja) 表示情報処理装置
JPH11249849A (ja) 印刷支援システム
JPH10334082A (ja) ブラウザおよびその表示方法ならびにその記録媒体
JP2003058576A (ja) Webページの表示制御方法およびプログラム
JP2004240754A (ja) 印刷方式及び出力制御方式
JP2004206524A (ja) 発行画面管理システム、発行画面管理方法および発行画面管理プログラム
KR100644654B1 (ko) 엑스.엠.엘. 데이터 인쇄방법 및 엑스.엠.엘. 데이터를지원하는 화상형성장치
JP2002091946A (ja) 画像処理装置及びその方法、及び画像処理システム