JP2000339307A - 組版装置 - Google Patents
組版装置Info
- Publication number
- JP2000339307A JP2000339307A JP11151359A JP15135999A JP2000339307A JP 2000339307 A JP2000339307 A JP 2000339307A JP 11151359 A JP11151359 A JP 11151359A JP 15135999 A JP15135999 A JP 15135999A JP 2000339307 A JP2000339307 A JP 2000339307A
- Authority
- JP
- Japan
- Prior art keywords
- document
- style
- typesetting
- character string
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
作を容易にする。 【解決手段】 変換テーブル生成部104は、ひな形S
GML文書を解析し、要素内容に文字列を含む文書要素
を抽出し、これらに対応するスタイル名の設定をユーザ
に促し、文書要素とスタイル名の対応を示す変換テーブ
ル122を作成する。スタイルテンプレート作成部10
6は、変換テーブル122に含まれるスタイル名の一覧
を示すスタイルテンプレートを作成する。文書変換部1
08は、ひな形SGML文書のタグを変換テーブル12
2を用いてスタイルタグに変換し、組版形式文書を作成
する。組版編集部20は、スタイルテンプレート及び組
版形式文書を受け取り、前者を基にスタイル名の一覧を
表示し、各スタイル名に対応するスタイル内容の設定を
ユーザに促す。スタイル内容を設定すべき項目が自動的
に作成されるので、ユーザはどの文書要素にスタイルを
設定すればよいか迷わなくて済む。
Description
処理する組版装置に関する。
で、SGML(Standard Generalized Mark-up Languag
e)等の構造化文書の考え方に基づく文書管理が行われ
るようになっている。周知のようにSGMLでは、文書
の階層的な論理構造に着目し、文書の内容を構成する各
要素に対し、その要素の論理構造上の意味を表すタグを
付加することにより文書を構造化している。そして、タ
グ付け規則を統一することにより同種文書の論理構造の
一貫性を保ち、文書の検索や再利用の効率向上を図って
いる。
は、専ら文書の論理的側面を規定したものであり、文書
の視覚的な側面、すなわち印刷や画像表示における見栄
え/体裁については何ら規定しない。このため、構造化
文書を組版して出版物を作成する場合には、文書各部の
体裁(スタイル)を別途規定する必要がある。構造化文
書はその目的からして同構造の文書が多数存在すること
が通常であり、それら文書に共通の体裁を定め、これに
従って自動組版を行うことが一般的である。
イル設定の手法には、大別して、プログラミングによる
方法と対話的な方法の2種類があった。前者は、構造化
文書の各文書要素をどのようなスタイルで組版するかな
どをプログラミング言語で記述する方法であり、後者
は、GUIなどにより各文書要素に対するスタイルを対
話的に設定する方法である。
スタイル設定の手法は、構造化文書及びプログラミング
言語の両方についての高度な知識と経験を必要とするの
で、熟練者でないと満足な組版ができないという問題が
あった。もっと簡便にスタイル記述が可能なスクリプト
言語を提供するシステムもあるが、この場合もスクリプ
ト言語を修得する必要があり、やはりある程度の専門的
知識が必要とされた。特に、このようなプログラミング
等による手法は、構造の異なる多種類の文書を処理する
ような用途では、各種類ごとに個別にプログラムを記述
する必要があり、非常に大きな時間と労力を要してい
た。
ような問題を解決するものであるが、対話的なスタイル
設定機能を提供する従来システムは、次のような点でま
だ十分なものと言えなかった。
は、編集画面上にページを表示し、ユーザが各文書要素
をこのページ上の所望の位置に貼り付けていくという操
作で組版レイアウトを作成し、この操作でできた組版情
報を用いて同構造の他の文書も自動組版できるようにし
ている。しかしながら、このシステムは、文書の構造化
された文脈に対しては、プログラミング的な手法で対応
せざるを得なかった。すなわち、このシステムは、大き
な文書要素をページにどのように配置するかというレベ
ルではユーザフレンドリな操作環境を実現していたが、
その文書要素の中の子要素、孫要素のレイアウトやスタ
イル等については結局プログラミング方式で記述しなけ
ればならなかった。
素のツリー構造を表示し、この表示で文書要素を選択し
てスタイル内容を設定するというユーザインタフェース
を提供するものがある。このシステムは、文書要素の論
理構造の立場がわかりやすいという点でスタイル内容の
設定をある程度容易にするものである。しかしながら、
このシステムは、どの文書要素がスタイルを設定すべき
文字列を含んでいるかが分かり難いという難点がある。
すなわち、周知のように構造化文書の文書要素には、要
素内容に子要素のみを含み文字列を含まないものも多
い。これに対し、組版の対象となるのは文字列であり、
文字列を含まない文書要素には基本的にはスタイル設定
は不要である。また、ある文書要素に設定したスタイル
内容が子要素のスタイルにどのように影響するかなどを
規定し、それをユーザがしっかり覚えていないと、設定
したスタイル内容がユーザの意図せぬ副作用をもたらす
場合もある。
定方式の双方に共通する問題として、組版結果を構造化
文書にフィードバックすることが極めて困難だったとい
う点がある。例えば、プログラミング方式では作成した
プログラムで構造化文書を処理することにより、自動組
版装置で取り扱い可能な形式の文書となる。一般に自動
組版装置では内部形式の文書に対して編集を加える機能
を有しており、例えば印刷結果を見て文字の誤り等を発
見した場合には、この編集機能を用いて文書に修正を加
えることができた。しかしながら、従来装置はこの修正
結果を元のSGMLに反映させる点については全く考慮
しておらず、修正結果を反映させるには別途SGMLエ
ディタなどを用いる必要があった。この点は、対話設定
方式の場合も同様であり、対話設定したスタイル情報を
構造化文書に適用して自動組版装置で取り扱い可能な形
式の文書に変換し、自動組版装置の側でその文書に修正
を加えることはよくあるが、自動組版装置での修正結果
を元の構造化文書に反映させるツールは提供されていな
かった。
されたものであり、構造化文書の自動組版のためのスタ
イル設定の操作を容易にし、多種類の構造化文書を取り
扱う場合でも効率よく組版できるようにすることを目的
とする。また本発明は、スタイル情報を含んだ組版処理
可能な形式の文書と構造化文書との間で相互の形式変換
ができる装置を提供することを目的とする。
め、本発明に係る組版装置は、構造化文書を解析して要
素内容に文字列を含む文書要素を抽出し、抽出した各文
書要素に対してスタイルタグを割り当て、これら各文書
要素とスタイルタグとの間の対応関係情報を生成する対
応関係情報生成手段と、前記対応関係情報内のスタイル
タグを一覧表示して各スタイルタグに対応するスタイル
内容をユーザに設定させ、この設定内容を表すスタイル
テンプレートを生成するスタイル設定支援手段と、入力
された構造化文書から文書要素の文字列を検出し、前記
変換テーブルを参照してこれら文字列に対してそれぞれ
当該文書要素に対応するスタイルタグを付加することに
より、前記構造化文書を組版形式文書に変換する変換手
段と、を有し、組版形式文書の各スタイルタグを前記ス
タイルテンプレートに従って解釈し、この解釈結果に従
ってスタイルタグが付加された文字列を組版することを
特徴とする。
ル設定が必要な文字列を含んだ文書要素が対応関係情報
生成部で抽出され、このような文字列を含む文書要素に
対応するスタイルタグの一覧が表示されるので、ユーザ
はこのスタイルタグ一覧を見ながら各スタイルタグに必
要なスタイル内容を設定すればよい。したがって、本発
明によれば、ユーザは、従来のようにどの要素にスタイ
ルを設定するかを判断する必要がなくなり、スタイル設
定操作が非常に容易になる。
情報生成手段で抽出した文書要素に関する情報として上
位階層の文書要素の情報を前記対応関係情報を含める手
段と、与えられた組版形式文書を、前記対応関係情報を
参照して構造化文書に変換する逆変換手段と、を更に設
けた。
が、文字列を含む文書要素とどのような関係にあるかと
いう情報が対応関係情報に含まれることになる。したが
って、このような対応関係情報を用いることにより、組
版形式文書のスタイルタグから、構造化文書のすべての
文書要素の構造を再生することができ、これにより組版
形式文書を構造化文書に変換することができる。この態
様によれば、構造化文書を変換して得た組版形式文書に
修正を加えた場合、修正した組版形式文書を逆変換する
ことにより、その修正結果を反映した構造化文書を得る
ことができる。また、一から新たに作成した組版形式文
書から構造化文書を得ることもできる。
タグの一意性を確保する手段を設けた態様では、構造化
文書を組版形式文書に変換した際に文書要素の並び順を
変更した場合でも、組版形式文書のスタイルタグから構
造化文書の文書要素を正しく特定することができ、組版
形式文書から構造化文書への変換を正しく行うことがで
きる。
文書要素のタグに記述された属性情報を、組版しないコ
メント文として組版用文書に組み込むことにより、組版
形式文書に属性情報を残すことができる。したがって、
構造化文書を変換して得た組版形式文書に対し何らかの
修正を加え、この修正結果を構造化文書に逆変換した場
合などにも、属性情報が失われずに戻ることになる。
組版出力にて文書要素に対応して自動発生させる文字列
の指定を受け付ける手段と、指定された自動発生文字列
に対して前記文書要素に対応するスタイルタグとは区別
可能なスタイルタグを割り当てる手段と、自動発生文字
列のスタイルタグに対応するスタイル内容を設定する手
段と、を更に設けた。これにより、構造化文書になかっ
た文字列を組版結果にのみ反映させ、元の構造化文書に
逆変換したときには消去することができる。
実施形態という)について、図面に基づいて説明する。
を示す機能ブロック図である。図示のように、本実施形
態の組版装置は、大きく分けて構造化文書用フロントエ
ンド部10と組版編集部20の2つから構成される。
で組版して印刷出力やディスプレイ出力などの可視出力
を生成するための装置である。本実施形態では、組版編
集部20は、DTP(デスク・トップ・パブリッシン
グ)システムで見られる対話的な組版編集機能と、バッ
チ処理(自動組版)機能の両方を有する。
ルに関する指定内容(スタイル内容と呼ぶ)を表すタグ
(スタイルタグと呼ぶ)を埋め込んだ形で管理される。
例えば、書体や文字サイズなどを指定して「大見出し」
なるスタイルを定義した場合、そこに指定された書体、
文字サイズなどの組合せがスタイル内容である。スタイ
ルタグは、基本的には、スタイル適用範囲の開始点を示
す開始タグと終了点を示す終了タグのペアで用いられ
る。スタイルタグとしては、スタイルの名称(すなわち
スタイル内容を指し示す名前:スタイル名と呼ぶ)を所
定の記号、例えば“<”と“>”のペアで囲んだものを
用いることができる。この場合、「大見出し」というス
タイルのスタイルタグは開始タグが“<大見出し>”、
終了タグが“</大見出し>”などとなる。組版編集部
20内の文書は、スタイル適用対象の文字列の前後にそ
のスタイル内容を示す開始及び終了のスタイルタグで付
加した形となる。このような形式の文書を組版形式文書
と呼ぶ。
な説明であり、本実施形態では更に高度なタグ付け方式
を採用している。例えば、スタイルタグを組版の観点か
ら見ていくつかの機能種類に分類し、その機能種類を示
す記号をスタイル名に付加したものをスタイルタグとし
て用いている。このような組版形式文書の一例を図2に
示す。図において、“<P 改訂年月>”というスタイ
ルタグ300は、「段落」という組版上の機能種類を表
す記号「P」と、「改訂年月」というスタイル名の組合
せになっている。「P」すなわち「段落」という機能種
類は、段落単位で規定できるスタイルが適用可能なこと
を示している。図には、このほかに記号「T」、「C」
がスタイルタグに用いられているが、前者は「テキス
ト」、後者は「コメント」という組版上の機能を示して
いる。「テキスト」という種類は組版に文字列レベルの
スタイルが適用可能なことを示す。「コメント」という
種類は、組版対象でない情報を組版対象文書内に組み込
むために用いる。また、図示のように、段落(P)やコ
メント(C)のスタイルタグは、終了タグを省略するこ
とができる。
でなく、ユーザが自由に設定することができる。この設
定は、編集処理部210が提供するスタイル設定UI
(ユーザインタフェース)215により行う。このUI
215は、スタイル名とスタイル内容の設定画面を提供
し、ユーザはこれを用いてスタイル名とスタイル内容を
設定することができる。このようにして作成されたスタ
イル名とこれに対応するスタイル内容の情報は、スタイ
ルテンプレート222として記憶部220に記憶され
る。
編集のために、文書の所望の文字列に対してスタイルを
設定するためのUIを提供する。ユーザは、このUIを
用いて、所望の文字列を範囲指定し、この文字列に対し
てスタイルを設定していく。この設定は、登録されたス
タイル名の一覧を表示し、これをユーザが選択するなど
の方法で行える。設定されたスタイルは、スタイルタグ
として記憶部220内の組版形式文書224に組み込ま
れる。
ようにして作成された組版形式文書のスタイルタグを読
み取り、これに対応するスタイル内容をスタイルテンプ
レート222から特定し、そのスタイルタグの適用範囲
の文字列に対して適用して、所定の出力形式のデータに
変換するという作業となる。出力形式は、例えば印刷業
界で広く用いられているPostScript(米国ア
ドビ社の商標)などのページ記述言語などである。組版
編集部20においてこの組版処理を行うのが組版処理部
230である。
ユーザからの指示を受けて組版編集を行う機能を有する
が、それに加えて他の装置で作成された組版形式文書を
読み込んで自動組版する機能も有する。
GML文書を組版編集部20で組版しようとする場合、
SGML文書を組版編集部20で処理可能な組版形式文
書に変換する必要がある。この処理を行うのが構造化文
書用フロントエンド部10である。また、構造化文書用
フロントエンド部10は、組版編集部20で作成あるい
は修正された組版形式文書をSGML文書に逆変換する
機能も有する。
て、ESIS変換部102は、SGML文書(インスタ
ンス)の構文チェックを行い、ESIS(Element Stru
cture Information Set)形式のデータに変換する。
S形式のデータに基づき、SGML文書と組版形式文書
との間の形式変換のための変換テーブル122を作成す
る。変換テーブル122は、基本的には、SGML文書
の文書要素とこれに対応するスタイルタグとの対応関係
を示すテーブルであり、記憶部120内に生成される。
変換テーブル生成部104は、変換テーブルの作成に当
たり、SGML文書から抽出した文書要素に対してスタ
イルタグを割り当てて行く。ただし、組版対象となるの
は基本的に文書要素の要素内容に含まれる文字列なの
で、変換テーブル生成部104は、要素内容に文字列を
含む文書要素、含まない文書要素を識別し、文字列を含
む文書要素に対してスタイルタグを割り当てる。なお、
組版段階で元のSGML文書に含まれない文字列を挿入
したい場合があるが、本実施形態では、そのような場合
にも対応できるようにしている。
換テーブル122に基づきスタイルテンプレートを作成
するユニットである。ただし、ここで作成されるスタイ
ルテンプレートは、スタイル名の一覧のみであり、その
スタイル名に対応するスタイル内容は未設定となってい
る。スタイル内容の設定は組版編集部20で行う。すな
わち、スタイル内容未設定のスタイルテンプレートを組
版編集部20に与えれば、組版編集部20のスタイル設
定UI215が、そのテンプレートにあるスタイル名の
一覧を表示し、ユーザに対し各スタイル名に対するスタ
イル内容の設定を促す。
を用いて、SGML文書と組版形式文書との相互の形式
変換を行う。この変換処理は、大略的にいえばSGML
と組版形式文書との間でのタグの変換処理である。文書
変換部108の変換処理は、論理構造のみに着目したS
GML文書と論理構造よりも組版スタイルに重点を置く
組版結果との相違点を考慮した形でなされる。
ユニットを含め、構造化文書用フロントエンド部10全
体の処理を制御する。
した。以上説明したように、この組版装置は、自動組版
機能、組版形式文書からSGML文書を作成する機能を
提供すると共に、これらの処理に用いる変換テーブルな
どの変換情報を容易に作成できるユーザインタフェース
機能を提供する。以下では、本実施形態の装置における
組版処理の手順を説明する。
換テーブル、スタイルテンプレートを作成する手順を説
明する。
型定義)を作成し、このDTDに従ったひな形SGML
文書を作成する。このひな形SGML文書は、変換テー
ブル及びスタイルテンプレートを作成する際にひな形と
して用いるだけなので、文書の内容(文字列の内容)は
何でもよい。すなわち、DTDに従ってタグ付けされて
いればよく、特に組版目的から言えば、文字列を含む文
書要素内には何らかの文字列が記述されていればよい。
ML文書を考える。この文書では、各ボックス400が
文書要素を示し、ボックス内部の文字列がその文書要素
の要素名を示す。各ボックス間を結ぶ線分が文書要素間
の親子関係を表しており、線分の左側のボックスが右側
のボックスの親である。例えば、この文書「添付文書」
は薬品の説明書であり、「書誌的事項」と「本体」とい
う2つの文書要素から構成されている。また例えば文書
要素「改訂年月」には、アスタリスク(*)を含んだマ
ーク410が従属しているが、これは「改訂年月」が文
字列を要素内容として含むことを示している。同様に、
マーク410を子に持つ「版数」、「主要文献」など
も、文字列を要素内容に含む。一方、「添付文書」や
「書誌的事項」など、子にマーク410を持たない文書
要素は、要素内容に文字列を含まない。図3に示す文書
構造を持つひな形SGML文書の一例を図4に示す。ユ
ーザは、図4に示すSGML文書のように、タグを正し
く付加し、文字列のあるべきところには適当な文字列を
記述してひな形SGML文書を作成する。
SGMLエディタなどを用いて行えばよい。
ド部10に読み込ませ、自動組版用の変換テーブル12
2を作成する。
ひな形SGML文書に対し、ESIS変換部102でE
SIS変換処理が施される。次に、変換テーブル生成部
104が、ESIS変換結果を元にSGML文書から、
要素内容に文字列を有する文書要素を拾い出し、これら
を変換テーブルに書き込んでいく。このとき、各文書要
素は、ESIS変換結果を利用して文書構造上一意に特
定できる形で、変換テーブルに記入する。
換テーブルは、文書要素種別500とそれに対応するス
タイル名510とを列挙したものであり、文書要素種別
500には、要素内容に文字列を含む各文書要素ごと
に、ルートから順にツリー構造をたどってその文書要素
に至るまでの各文書要素の名前が列挙される。例えば、
図3や図4の例で、文字列を含む1番目の文書要素「改
訂年月」については、ルート要素「添付文書」から順に
「書誌的事項」、「改訂履歴」と、「改訂年月」に至る
までの文書要素の名前が、階層順に列挙されている。こ
の要素名の順列により、要素内容に文字列を有する「改
訂年月」という文書要素が一意に特定される。文字列を
有する他の文書要素(「版数」、「主要文献」など)も
同様の形で記入される。
種別500)を変換テーブルに登録する処理は、変換テ
ーブル生成部104で自動的に行われる。一方、登録し
た文書要素に対応するスタイル名は、ユーザにより設定
される。すなわち、変換テーブル生成部104は、変換
テーブルへの文書要素種別500の登録が完了すると、
スタイル名510が未記入状態の変換テーブルを画面表
示し、ユーザに各文書要素に対応するスタイル名の記入
を促す。ユーザは、これに応じてスタイル名を記入して
いく。スタイル名は、後に説明する組版形式文書からS
GML文書への変換のために、1つの文書構造(すなわ
ち1つの変換テーブル)内で一意である必要がある。こ
のため、変換テーブル生成部104は、1つの変換テー
ブル内で同じスタイル名を設定できないように管理を行
うとともに、ユーザにより同一スタイル名が入力された
場合はその旨の警告メッセージを表示するなどしてユー
ザにスタイル名の変更などの対処を促す。このようにし
て、各文書要素に対して、組版形式文書における一意な
スタイル名が設定され、変換テーブルに登録される。
白紙状態からユーザが記入する方式に限らない。変形例
として、例えば変換テーブル生成部104側でSGML
の文書要素名を元にスタイル名を自動生成し、これに対
してユーザが好みに合わせて変更を加えられるようにす
ることも可能である。この場合も、スタイル名の一意性
は変換テーブル生成部104により確保される。
GML文書に含まれない文字列を挿入したい場合やSG
ML文書の内容の一部又は全部を表形式で組版したい場
合、ある文書要素を元のSGML文書での順番とは違っ
た位置に組版したい場合などの特殊な処理の指定を受け
付けることができる。このような特殊指定は、変換テー
ブルの特殊指定520の欄に設定される。例えば、ユー
ザが、特殊な処理を指定したい文書要素の特殊指定52
0の欄をマウス等で選択すると、用意されたいくつかの
特殊処理についての設定画面が呼び出され、それに対し
てユーザが所望の処理の種類や処理パラメータなどを入
力していく。
元のSGML文書にない文字列を自動発生して組版した
い場合には、例えば図3、図4のSGML文書例の<主
要文献>という文書要素は、文献名の文字列を要素内容
に含むが、この文献名の前に“[主要文献]”などと見
出しを入れる場合がある。このような場合、ユーザは、
各文書要素ごとに特殊指定内容を記憶する別のテーブル
を作成し、これに指定内容を登録してもよい。また、変
換テーブル(図5)上で、文字列を挿入したい文書要素
を選択し、挿入する文字列を入力してもよい。<使用上
注意>などのように文字列を要素内容に持たない要素に
対しても、文字列挿入を指定することができる。このよ
うな指定情報は、特殊指定欄520に登録される。
の中で表組したい各文書要素に対し、その文書要素を表
のいずれの行、列に割り付けるかを指定する。この指定
情報は、特殊指定520の欄に登録される。
なった位置に移動して組版したい場合には、ユーザはそ
の文書要素をマウス等で選択し、更にその移動先を指定
する。移動先は、例えば直前の文書要素を指定するなど
の方式で指定する。例えば文書要素<主要文献>の内容
文字列を要素<症状>の文字列の後に組版したい場合、
移動先として<症状>を指定する。この移動先の情報も
特殊指定520の欄に登録される。
の指定が完了すると、変換テーブルが完成する。完成し
た変換テーブルは、元のSGML文書との対応関係が分
かる形で保存される。例えば、DTDの識別名やファイ
ル名などを付加情報として変換テーブルに付け加えれば
よい。
作成部106が、変換テーブルを参照して、組版形式文
書に現れるスタイル名を列挙したスタイルテンプレート
を作成する。図6が、この結果できるスタイルテンプレ
ートの一例である。スタイルテンプレートでは、スタイ
ル名とこれに対応するスタイル内容の設定欄とが対にな
っている。
る文書要素に対応するスタイル名と、特殊処理として文
書要素に対応して自動発生する文字列のスタイル名の両
方が登録される。後者のスタイル名は、対応する文書要
素の名前に“auto”など自動発生文字列を示す予約
語を付加することにより自動生成する。例えば、文書要
素<主要文献>に対応して自動発生させる“[主要文
献]”なる文字列のスタイル名は、スタイルテンプレー
ト作成部106により“auto主要文献”と自動生成
される。図6の例では、<使用上注意>、<重要注意
>、<相互作用>及び<主要文献>の4つの要素に対し
て自動発生文字列が登録されている。自動発生文字列
は、対応する文書要素の位置に発生され、その文書要素
が要素内容に文字列を持つ場合には、その文字列の前又
は後ろのいずれか、予めユーザが指定した方に出力され
る。従って、自動発生文字列のスタイル名は、対応する
文書要素のスタイル名の前又は後ろのいずれか設定され
た方に配置されることになる。
が指定された文書要素のスタイル名は、スタイルテンプ
レート上では移動先の位置に登録される。例えば、図5
に示すように要素<主要文献>はSGML文書の中で3
番目の文字列所有要素であるが、特殊指定として要素<
症状>の後に移動することを指定すると、図6に示すよ
うにスタイル名「主要文献」は「症状」の後に登録され
ることになる。
の出力が指定された場合、表を構成する各文書要素のス
タイル名のうちの先頭のものの前に、表全体のスタイル
名が生成される。このスタイル名には、表罫線のスタイ
ルなど、表全体にかかわるスタイル内容が設定される。
レートは、この段階ではスタイル内容の欄が空欄であ
る。このようにして作成されたスタイルテンプレート
は、元のSGML文書のDTD、又は変換テーブルとの
対応関係が分かるような情報を付加される。なお、スタ
イル内容は、このあと組版編集部20にて設定される。
のスタイルテンプレートが作成されると、その変換テー
ブルを用いてひな形SGML文書を組版形式文書に変換
し、この変換結果をスタイルテンプレートとともに組版
編集部20に渡す。ひな形SGML文書の変換は、文書
変換部108で行われる。すなわち、文書変換部108
は、ひな形SGML文書を先頭から読み取っていき、要
素内容の文字列を見つけては、それに対応するスタイル
名を変換テーブルから特定し、そのスタイル名のタグ
(スタイルタグ)をその文字列に付加していく。また、
文書変換部108は、変換テーブルの特殊指定520の
情報を参照して、自動発生文字列が指定されていればそ
の文字列とスタイルタグを文書中に挿入する。
置の移動が指定されていれば、その文書要素の要素内容
の文字列とスタイルタグとを指定された移動先に移動す
ると共に、移動前の元の位置に、移動した文字列の元々
の位置であることを示す記述を追加する。これは、組版
形式文書をSGML文書に逆変換できるようにするため
の処置である。前に例示した図2の組版形式文書では、
3行目がこの元々の位置を表す記述になっている。この
例は、元のSGML文書での出現順では3番目に位置し
ていた要素<主要文献>の文字列を文書の最後に移動し
た場合を示しており、3行目の記述ではコメントのタグ
“<C ・・・>”の中に、文字列の移動先が要素<症
状>の後であることをしめす記述“移動先 症状”が組
み込まれている。なお、本実施形態の組版形式文書で
は、コメントは文字列に付属しなければならないという
制約を設けたため、ダミーの文字列にそのコメント記述
を付加した形をとった。ダミーの文字列は、組版時には
無視されるように予め取り決められたものである。この
ダミーの文字列には形式上スタイルタグを付加する必要
があるので“<T auto>”なるタグを自動生成し
て付加している。スタイルタグにおける“auto”な
る文字列は自動生成したものを表し、これが含まれてい
るスタイルタグが付加された文字列は、SGML文書へ
逆変換する際に無視されるので、このダミー及びコメン
ト文がSGML文書に組み込まれてしまうことはない。
また、文書の末尾に移動された<主要文献>の文字列の
方には、SGMLへ変換する際にどの位置に戻したらよ
いかを示す“戻し先”の情報が、前述の移動先の場合と
同様に、コメント形式で挿入される。
の出力が指定された場合、組版形式文書における表内容
の開始位置と終了位置に、表の開始と終了を表すスタイ
ルタグが挿入され、更に表内容の文字列のどこまでが表
の一行分を構成するかを示すため、行を区切るタグが挿
入される。これにより表形式の組版が可能になる。
ML文書のタグの中には、当該要素に設定された属性が
記述される場合がある。本実施形態は、組版形式文書か
らSGML文書に逆変換することも念頭に置いているた
め、SGML文書を組版形式文書に変換する際にそれら
属性の情報が消失しないようにしている。具体的には、
属性をコメント形式で付加するという処置を行ってい
る。例で説明すると、例えば、
dddが属性情報)、組版形式文書では次のように変換
する。
な組版形式文書が得られる。
組版形式に変換されると、スタイルテンプレートととも
に組版編集部20に渡される。この受け渡しは、LAN
などのネットワークを介して行ってもよいし、フロッピ
ーディスクなどの可搬媒体を用いて行ってもよい。ま
た、構造化文書用フロントエンド部10と組版編集部2
0が同じオペレーティングシステム上で動作するアプリ
ケーションである場合は、オペレーティングシステムを
介して受け渡してもよい。
を受け取った組版編集部20は、それらを記憶部220
に記憶する。そして、編集処理部210により図7に示
すような編集画面600が生成され、これを用いてスタ
イル内容の設定が行われる。この編集画面600には、
文書内容部分を表示する文書内容表示部610と、スタ
イル名の一覧を表示するスタイル名一覧620が設けら
れている。文書内容表示部610には、組版形式文書に
含まれる文書内容の文字列が順番に表示される。この表
示部610の各文字列とスタイル名一覧620の各スタ
イル名とは互いにリンクしており、一方をマウスで選択
すると他方も同時に選択状態となる(例えば反転表示な
どの表示形態となる)。そして、選択された文字列/ス
タイル名に対するスタイル内容の設定画面が表示され
る。スタイル内容の設定画面には、例えば図8に示すよ
うに設定すべきスタイルの項目が列挙され、それら各項
目に対し、キーボードで値を記入したり、あるいは予め
用意されていた候補値リストを呼び出してその中から所
望のものを選択したりするなどにより、スタイル内容が
設定される。ユーザによって設定されなかった項目は、
所定のデフォルト値と解釈される。スタイル内容が設定
されると、文書内容表示部610における当該文字列の
書体や文字サイズなどがその設定内容に応じて変更さ
れ、スタイル設定の結果を目で確認することができる。
このようなスタイル設定をスタイル名一覧620のすべ
てのスタイル名について行うことにより、スタイル設定
が完了する。設定されたスタイル内容は、記憶部220
内のスタイルテンプレート222に登録される。
上にレイアウト枠を生成し、そこに文字列を貼り付ける
ことも可能である。この場合、スタイルテンプレートの
その文字列のスタイル名のスタイル内容に、貼り付け先
のレイアウト枠の識別情報が設定されることになる。な
お、レイアウト枠と文字列との対応づけの仕方は、例示
したレイアウト枠の識別情報をスタイル内容に設定する
方法に限られない。
すると、自動組版処理が可能になる。
場合、ユーザは、まず組版対象のSGML文書を構造化
文書用フロントエンド部10に入力し、使用する変換テ
ーブルを指定して組版形式文書への変換を指示する。こ
れにより、前述のひな形SGML文書の変換の際に説明
したのと同様の手順で、文書変換部108が入力された
SGML文書を組版形式文書に変換する。
し、使用するスタイルテンプレートを指定して自動組版
処理を指示すれば、組版処理部230がそのスタイルテ
ンプレートに登録された各スタイル名のスタイル内容に
従って、組版形式文書の各文字列を組版する。
結果、例えば文字の誤りなどを発見した場合、本実施形
態では組版編集部20の編集処理部210のUIでその
誤りを修正することができる。そして本実施形態では、
このように組版編集部20上で変更した文書をSGML
に逆変換する機能を提供することにより、処理の効率化
を図っている。すなわち、組版編集部20上での修正・
変更は、組版形式文書224に対して行われるが、この
変更・修正された組版形式文書を構造化文書用フロント
エンド部10に渡し、変換テーブルを用い、前述したS
GMLから組版形式への変換の逆方向の変換を行うこと
により、SGML文書を得ることができる。
上注意>や<T auto>など(図2参照)、SGM
Lから組版形式への変換の際に自動発生された内容を示
すスタイルタグに支配される範囲は、元々のSGML文
書になかったものなので消去される。また、コメント形
式として挿入された属性情報は、対応する文書要素の要
素タグの中に組み込まれ、SGMLの形式となる。ま
た、表のために組み込まれたスタイルタグも消去され、
元のSGMLの形に戻される。
文字列を有さない文書要素のタグも生成する必要がある
が、これについては変換テーブル内に各文書要素の上位
の要素名がすべて示されているので、これに基づき文字
列を有しない文書要素のタグを生成することができる。
また、移動されている文書要素の文字列も、前述した戻
し先の記述を参照して元のSGML文書での有るべき位
置に戻すことができる。このように、変換テーブルを用
いることにより、組版形式文書は正しくSGML文書に
戻すことができる。
集部20で最初から作成した文書からSGML文書を生
成することもできる。この場合、まず組版編集部20の
編集画面(図7)上に文書内容表示部610にキーボー
ドからテキストを入力し、所望のスタイルテンプレート
のスタイル名一覧620を呼び出す。そして、文書内容
表示部610の文字列を範囲指定し、一覧620のスタ
イル名にリンクする。これによりすべてのスタイル名に
対応する文字列の指定ができると、組版編集部20上で
1つの文書が完成したことになる。これを構造化文書用
フロントエンド部10にて変換テーブルを用いて変換す
ることにより、SGML文書を得ることができる。
によれば、まずスタイルテンプレート作成部106にて
スタイル内容の設定が必要なスタイル名の一覧が作成さ
れ、ユーザはそれに従ってスタイル内容を設定していけ
ばよいので、従来のようにどの要素にスタイル内容を設
定すればよいかを迷うことがなく、スタイル設定作業が
容易になる。
とスタイルテンプレートを用いることにより、SGML
文書の自動組版が可能となった。そして、本実施形態で
は、変換テーブルとスタイルテンプレートが容易に作成
できるので、DTDの異なる多種類のSGML文書を取
り扱う場合でも、従来よりも少ない時間と労力で自動組
版を行うことができる。
一意になるように管理したことにより、組版形式文書の
スタイルタグからSGMLの文書要素を一意に特定する
ことができるようになり、この結果組版形式文書をSG
ML文書に変換することが可能となった。また、SGM
L文書の属性情報を組版形式文書に組み込む仕組みを設
けたので、逆変換において属性情報もSGML情報に反
映させることが可能になった。
い文字列を組版結果に組み込む仕組みを提供し、そのよ
うにして組み込んだ文字列には、元のSGML文書にあ
った文字列とは区別できるスタイルタグ(すなわち上記
の例では“auto”なる予約語をスタイル名に付加し
た)を用いた。これにより、SGML文書になかった文
字列を組版結果にのみ反映させ、元のSGML文書に逆
変換したときには消去することができる。
明したが、本発明はSGML以外の構造化文書、例えば
XMLやHTML等の文書にも適用可能である。
ブロック図である。
形式で示した図である。
示す図である。
例を示す図である。
テンプレートの例を示す図である。
を示す図である。
容の例を示す図である。
部、30 文書データベース、100 処理制御部、1
02 ESIS変換部、104 変換テーブル生成部、
106 スタイルテンプレート作成部、108 文書変
換部、120記憶部、122 変換テーブル、210
編集処理部、215 スタイル設定UI(ユーザインタ
フェース)、220 記憶部、222 スタイルテンプ
レート、224 組版形式文書、230 組版処理部。
Claims (5)
- 【請求項1】 構造化文書を解析して要素内容に文字列
を含む文書要素を抽出し、抽出した各文書要素に対して
スタイルタグを割り当て、これら各文書要素とスタイル
タグとの間の対応関係情報を生成する対応関係情報生成
手段と、 前記対応関係情報内のスタイルタグを一覧表示して各ス
タイルタグに対応するスタイル内容をユーザに設定さ
せ、この設定内容を表すスタイルテンプレートを生成す
るスタイル設定支援手段と、 入力された構造化文書から文書要素の文字列を検出し、
前記変換テーブルを参照してこれら文字列に対してそれ
ぞれ当該文書要素に対応するスタイルタグを付加するこ
とにより、前記構造化文書を組版形式文書に変換する変
換手段と、 を有し、組版形式文書の各スタイルタグを前記スタイル
テンプレートに従って解釈し、この解釈結果に従ってス
タイルタグが付加された文字列を組版する組版装置。 - 【請求項2】 前記抽出した文書要素に関する情報とし
て上位階層の文書要素の情報を前記対応関係情報に含め
る手段と、 与えられた組版形式文書を、前記対応関係情報を参照し
て構造化文書に変換する逆変換手段と、 を更に有することを特徴とする請求項1記載の組版装
置。 - 【請求項3】 前記対応関係情報生成手段は、前記対応
関係情報内における各スタイルタグの一意性を確保する
手段を有することを特徴とする請求項2記載の組版装
置。 - 【請求項4】 前記変換手段は、構造化文書の文書要素
のタグに記述された属性情報を、コメント文として組版
用文書に組み込むことを特徴とする請求項2又は3に記
載の組版装置。 - 【請求項5】 構造化文書の組版出力にて文書要素に対
応して自動発生させる文字列の指定を受け付ける手段
と、 指定された自動発生文字列に対して前記文書要素に対応
するスタイルタグとは区別可能なスタイルタグを割り当
てる手段と、 前記自動発生文字列のスタイルタグに対応するスタイル
内容を設定する手段と、 を更に有する請求項2から請求項4のいずれかに記載の
組版装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11151359A JP2000339307A (ja) | 1999-05-31 | 1999-05-31 | 組版装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11151359A JP2000339307A (ja) | 1999-05-31 | 1999-05-31 | 組版装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000339307A true JP2000339307A (ja) | 2000-12-08 |
Family
ID=15516829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11151359A Pending JP2000339307A (ja) | 1999-05-31 | 1999-05-31 | 組版装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000339307A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7073120B2 (en) | 2001-05-21 | 2006-07-04 | Kabushiki Kaisha Toshiba | Structured document transformation method, structured document transformation apparatus, and program product |
JP2006260077A (ja) * | 2005-03-16 | 2006-09-28 | Fuji Xerox Co Ltd | 電子フォーム印刷装置 |
CN100435139C (zh) * | 2006-10-13 | 2008-11-19 | 北京北大方正电子有限公司 | 一种单元格特殊符号对齐的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728817A (ja) * | 1993-07-15 | 1995-01-31 | Hitachi Ltd | 文書情報の構造変換方法 |
JPH11143874A (ja) * | 1997-11-11 | 1999-05-28 | Fujitsu Ltd | 構造化文書の体裁定義支援装置 |
-
1999
- 1999-05-31 JP JP11151359A patent/JP2000339307A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728817A (ja) * | 1993-07-15 | 1995-01-31 | Hitachi Ltd | 文書情報の構造変換方法 |
JPH11143874A (ja) * | 1997-11-11 | 1999-05-28 | Fujitsu Ltd | 構造化文書の体裁定義支援装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7073120B2 (en) | 2001-05-21 | 2006-07-04 | Kabushiki Kaisha Toshiba | Structured document transformation method, structured document transformation apparatus, and program product |
US7228498B2 (en) | 2001-05-21 | 2007-06-05 | Kabushiki Kaisha Toshiba | Structured document transformation apparatus for managing document information transfers between a server and a client |
JP2006260077A (ja) * | 2005-03-16 | 2006-09-28 | Fuji Xerox Co Ltd | 電子フォーム印刷装置 |
JP4539386B2 (ja) * | 2005-03-16 | 2010-09-08 | 富士ゼロックス株式会社 | 電子フォーム印刷装置 |
CN100435139C (zh) * | 2006-10-13 | 2008-11-19 | 北京北大方正电子有限公司 | 一种单元格特殊符号对齐的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6799299B1 (en) | Method and apparatus for creating stylesheets in a data processing system | |
US20040015782A1 (en) | Templating method for automated generation of print product catalogs | |
EP1126380A1 (en) | Converting a formatted document into an XML-document | |
JP2006525609A (ja) | コンテンツを複数のフォーマットで出力するための仕様を規定するシステムおよび方法 | |
US20040041818A1 (en) | Design system for website text graphics | |
US20040153465A1 (en) | Document generation system and user interface for producing a user desired document | |
JPH0581257A (ja) | ドキユメント要素の意図された外観を保存するための構造化ドキユメント編集システム及び方法 | |
JP2003150586A (ja) | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20070067336A1 (en) | Electronic publishing system and method for managing publishing requirements in a neutral format | |
WO2019098107A1 (ja) | 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法 | |
US20070180359A1 (en) | Method of and apparatus for preparing a document for display or printing | |
US20030222916A1 (en) | Object-oriented processing of tab text | |
JP4373470B2 (ja) | 文書変換活用システム | |
JP2007164705A (ja) | 電子化文書の変換方法及びプログラム | |
JP2003108331A (ja) | データ変換方法、プログラム及び記録媒体 | |
JP2000339307A (ja) | 組版装置 | |
JPH0728817A (ja) | 文書情報の構造変換方法 | |
JP3076348B2 (ja) | 文書整形装置及び文書整形方法 | |
JP2000076226A (ja) | 文書データの編集システム | |
JPH05101053A (ja) | 構造化文書編集方法 | |
JP2003281123A (ja) | 電子申請書作成ツール及び電子申請書作成方法並びに電子申請書作成プログラム | |
JP2004178011A (ja) | 文書変換装置及び文書変換方法 | |
JP2011018122A (ja) | 文書処理装置およびプログラム | |
JP2004038496A (ja) | Xml文書作成システム | |
JP3125754U (ja) | アプリケーション非依存データ生成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050215 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050404 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050404 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060127 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060306 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20060317 |