JPH09251457A - 文書変換装置 - Google Patents

文書変換装置

Info

Publication number
JPH09251457A
JPH09251457A JP8061348A JP6134896A JPH09251457A JP H09251457 A JPH09251457 A JP H09251457A JP 8061348 A JP8061348 A JP 8061348A JP 6134896 A JP6134896 A JP 6134896A JP H09251457 A JPH09251457 A JP H09251457A
Authority
JP
Japan
Prior art keywords
document
page
display
title
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8061348A
Other languages
English (en)
Inventor
Hiroshi Shibazaki
博 柴崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dainippon Screen Manufacturing Co Ltd filed Critical Dainippon Screen Manufacturing Co Ltd
Priority to JP8061348A priority Critical patent/JPH09251457A/ja
Publication of JPH09251457A publication Critical patent/JPH09251457A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 ディスプレイでの表示に適した構造を有する
構造化文書を自動生成できる文書変換装置を提供する。 【解決手段】 文書記述言語で作成された構造化文書で
ある原文書から文書内容である本文要素を削除し、タイ
トル要素および対応タイトル要素からなるタイトルペー
ジを生成する。また、原文書から対応タイトル要素を抜
き出し、仮文書ページとした後、分割して1ページがデ
ィスプレイの1画面に納まる文書ページを生成する。そ
の後、タイトルページの対応タイトル要素と、対応する
文書ページとにリンクを施し、タイトルページがディス
プレイに表示された状態で、マウスなどを用いて対応タ
イトル要素を選択指定すると対応する文書ページに画面
が切り替わるようにする。また、各文書ページには、タ
イトルページや他の文書ページに画面が切り替えること
ができるように適宜ヘッダを付加する。変換後のタイト
ルページと文書ページとからなる表示用の文書は、デー
タが一元化されるとともに、読者が本を読む感覚で文書
を読むことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書記述言語に
より記述される構造化文書をディスプレイ上での表示に
適した構造化文書に半自動的、あるいは自動的に変換す
る装置に関する。
【0002】
【従来の技術】文書を読者に伝える方法として、従来、
紙という媒体に印刷して頒布するという方法が用いられ
てきた。そして従来の紙による文書では、文書の提供者
は紙上にどのような書式や字体を用いて印刷すれば読者
に読みやすくなるのかを考慮していた。また文書が固有
の書式や字体などといった情報で電子化文書として作成
されていても、電子化文書の互換性がないため、作成者
と利用者間でお互いに電子化文書の共有化が出来ない現
状があった。そして、これらの電子化文書の共有化の促
進のために、最近では一定の規則に従って文書を記述し
又固有の処理情報を含まない文書記述言語として、例え
ばSGMLなどの文書記述言語が普及しつつある。この
文書記述言語で表現される文書は固有の処理情報を変え
ることで紙媒体に所望の出力結果を得ることが出来る。
つまりこの文書記述言語によって電子化された原文書の
活用範囲を広めることができる。しかし文書記述言語は
あくまでも紙媒体への印刷を意識したものであって、文
書のどのような構造がディスプレイ上での表示に適した
構造であるかを定めたものではない。したがって、1つ
の文書を様々な構造で記述することができ、どのような
構造が表示に適しているのかという判断は各文書提供者
に委ねられている。
【0003】以上のことから、現在、文書の電子化作業
手順としては、まず、電子化すべき文書を文書記述言語
を用いて構造化し(以下、この構造化された文書を「構
造化文書」という。)、その後、この構造化文書をもと
にディスプレイ上での表示に適していると考えられる新
たな構造化文書へ手作業にて変換を行っている。
【0004】
【発明が解決しようとする課題】以上を説明してきたよ
うに、電子化された文書は手作業にて表示に適した文書
へ変換が行われている。したがって、変換には多くの時
間と労力を要する上に誤変換も生じやすいという問題を
有している。また、変換方式にも個人差があり、変換後
の文書の統一性を保持することが困難であるという課題
も有している。
【0005】また、どのような表示形式が適切かは定義
されていないため、変換後の文書が長く、画面をスクロ
ールしながら読まなければならなかったり、後どれだけ
読まなければならないのかを認識しにくく、読者の読む
気を損なう表示形式が数多く存在する。つまり、構造化
文書の長所を十分に生かしていないのが現状である。
【0006】さらに、一度変換を施した文書であって
も、他の表示形式で表示するためには再度変換を要し、
時間と労力を浪費するとともに、文書データの保存形式
も一元化することができず、原文書の内容の変更に柔軟
に対応できないという問題も有している。
【0007】そこで、この発明は上記課題に鑑みなされ
たもので、まず、読者の読む気を損なわないという観点
から表示に適した文書を定義し、構造化された原文書を
表示に適した文書へ半自動的、あるいは、自動的に変換
する装置を提供することにより、文書データの一元化を
図り、誤変換を防止するとともに時間および労力の削減
を実現することを目的とする。
【0008】
【課題を解決するための手段】請求項1の発明は、文書
記述言語で記述される構造化文書を、ディスプレイでの
表示に適した構造化文書に変換する装置であって、(a)
1つの構造化文書からなる原文書を記憶する記憶手段
と、(b)前記原文書の文書内容を省いたタイトルページ
を半自動的または自動的に生成するタイトルページ生成
手段と、(c)前記文書内容を表示する複数の文書ページ
を前記タイトルページとは別に自動的に生成する文書ペ
ージ生成手段とを備え、前記複数の文書ページのそれぞ
れは前記ディスプレイの表示サイズに合わせて作成され
るとともに、前記タイトルページに表示される特定の構
成要素のうち、前記文書ページに表示される前記文書内
容に対応するものが対応タイトル要素として当該文書ペ
ージとリンク情報によって互いにリンクされており、前
記対応タイトル要素の表示を選択指定することにより、
対応する文書ページが前記リンク情報を介して選択され
て前記ディスプレイに表示可能とされている。
【0009】請求項2の発明は、請求項1の装置におい
て、前記タイトルページ生成手段が、(b-1)前記原文書
の構造をグラフィカルに表示させるグラフィカル表示手
段と、(b-2)前記構造中から、前記対応タイトル要素と
当該要素に応じた文書内容を有する構成要素との関係を
示す表示指定情報を前記グラフィカル表示手段上で指定
して作成し、前記記憶手段に記憶させる表示指定情報作
成手段とを有している。
【0010】請求項3記載の発明は、請求項2の装置に
おいて、前記タイトルページ生成手段が、(b-3)前記原
文書においては対応すべき対応タイトル要素を有しない
文書内容が前記表示指定情報作成手段によって指定され
たときに、前記文書内容に対応すべき対応タイトル要素
を自動生成する対応タイトル生成手段を有している。
【0011】請求項4の発明は、請求項1ないし3のい
ずれかの装置において、前記タイトルページ生成手段
が、(b-4)前記記憶手段から前記原文書を読出し、前記
表示指定情報に基づいて前記対応タイトル要素に含まれ
る前記文書内容を削除し、前記リンク情報を付加するこ
とにより前記タイトルページを生成するタイトル化手段
を有し、前記文書ページ生成手段が、(c-1)前記記憶手
段から前記対応タイトル要素とともに当該要素に対応す
る前記文書内容を読出して分割することにより前記文書
ページを生成する文書分割手段を有している。
【0012】請求項5の発明は、請求項1ないし請求項
4のいずれかの装置において、(d)前記ディスプレイ上
で指定されることによって前記ディスプレイにおける表
示を他のページに切り替えるヘッダまたはフッタを、前
記文書ページのそれぞれに自動的に付与するヘッダ/フ
ッタ付与手段をさらに備えている。
【0013】
【発明の実施の形態】この発明は、文書記述言語で記述
された文書(構造化文書)を表示に適した文書(表示用
文書)に変換する文書変換装置に関するものであるが、
具体的実施の形態を説明する前に、まず、変換対象とな
る構造化文書の構成について説明する。
【0014】<1.構造化文書の構成>構造化文書は図
1に示すように構造記述部分と内容部分とから構成され
る。構造記述部分には、「見出し」や「本文」といった
文書の包含関係である構成要素の構造が記述されてお
り、この構造を有する文書の実体が内容部分に記述され
ている。以下、これらの構造記述部分と内容部分とにつ
いて順に説明する。
【0015】構造記述部分では、図2に示すように定義
文により各構成要素の構造が定義されている。各定義文
では、定義識別子の後に構成要素の名前を定義し、次に
その構成要素が含む下位要素を下位要素の出現順序で配
置し、さらに、それぞれの下位要素に出現回数を定義し
て、文書のツリー構造を決定している。
【0016】以下に、図2の「報告書」の構造を例とし
て定義内容を順に説明する。
【0017】・構成要素の名前には、「報告書、大見出
し、日付、名前、本文、見出し、段落、テキストデー
タ」が相当する。なお、テキストデータは最下位の構成
要素となっている。
【0018】・構成要素が含む下位要素は要素の名前の
次に定義されており、例えば、報告書は「大見出し、日
付、名前、本文」、本文は「見出し、段落」、段落は
「テキストデータ」で構成されている。
【0019】・文書中における下位要素の出現順序は、
下位要素の記述順序であり、例えば、報告書は、「大見
出し、日付、名前、本文」の順で各下位要素が出現す
る。
【0020】・下位要素の出現回数は、通常1回のみ出
現することとなっているが、下位要素あるいは下位要素
の集合に出現回数識別子「+」を付けることにより、こ
れらが1回以上複数回出現することを定義している。例
えば、本文では「見出し」が1回出現し「段落」が1回
以上出現するという構成要素の集合が1回以上出現す
る。なお、0回以上出現する場合には出現回数識別子
「*」を用いる。
【0021】以上のように定義されている図2の構造記
述部分をツリー形式で表現すると図3に示すようにな
る。
【0022】次に、構造化文書の内容部分について説明
する。
【0023】内容部分は、文書の実体であるテキストデ
ータにマークアップ(開始タグと終了タグ)を付けたも
のから構成されており、開始タグと終了タグとに挟まれ
た部分が、その両タグが示す構成要素の下位要素となっ
ている。
【0024】マークアップは構造記述部分で定義した要
素の名前を、「<(要素の名前)>」と囲んだものを開始
タグ、「</(要素の名前)>」とで囲んだものを終了タ
グとしており、図4(a)に示す文書をマークアップを利
用して表現すると、「<報告書><大見出し>寒さ暑さ</大
見出し><日付>1995年11月9日</日付><名前>山田 太郎</
名前><本文><見出し>1.寒いところ</見出し><段落>朝は
寒い。夜も寒い。........</段落><段落>北極は寒い。
南極も寒い。........</段落><段落>冬は寒い。秋も寒
い。........</段落><見出し>2.暑いところ</見出し><
段落>赤道は暑い。........</段落></本文></報告書>」
となる。この構造を整理したものが図4(b)であり、図
3に示す報告書の構造と同様の構造となっている。
【0025】構造化文書がディスプレイ上に表示される
とき、このように構造が定義されている内容部分のテキ
ストデータのみが予め定められた書式に則って表示され
ることとなり、例えば、図4(a)に示したように書式が
整えられて表示される。
【0026】また、この構造化文書は1つの構造化文書
により記述される必要はなく、分割して別個の構造化文
書に格納しておき、内容部分において引用することもで
きる。図5(a)、(b)は、図4(a)に示される内容部分の
うち、「1.寒いところ」および「2.暑いところ」とがそ
れぞれ別の構造化文書2aおよび2bに格納されている
状態を示す図である。また、図5(c)はこれらの構造化
文書2a、2bを引用する構造化文書2を示す図であ
る。図示するように、構造化文書2aおよび2bは構造
化文書2において「<引用=構造化文書名>テキストデー
タ</引用>」という形式でリンク情報として引用されて
おり、例えば、この構造化文書2が図6(a)に示すよう
にディスプレイ上に表示された状態で構造化文書2aが
引用されている「1.寒いところ」をマウスなどを用いて
クリックなどして指定することにより構造化文書2aが
図6(b)に示すようにディスプレイ上に表示されるよう
になる。このような構造化文書2と構造化文書2a(お
よび2b)との引用関係をリンク情報を用いて実現する
ことを「リンクする」と以下呼ぶこととする。
【0027】<2.第1の実施の形態>この発明の第1
の実施の形態として、以上説明してきた構造化文書を、
ディスプレイ上での表示に適した表示用文書に半自動的
あるいは自動的に変換する装置について説明する。な
お、以下の説明では変換前の構造化文書を原文書という
こととする。
【0028】この実施の形態では表示用文書として、以
下の形態を有する文書を指す。
【0029】・タイトルページと文書ページとを有し、
それぞれが構造化文書の構成を有している。
【0030】・また、タイトルページには文書の内容で
ある本文を省いた形態を有しており、省かれた文書の内
容が文書ページに記述されている。
【0031】・また、各文書ページに対応するタイトル
ページの表示はそれぞれの文書ページにリンクされてお
り、マウスなどを用いてクリックするなどして指定する
ことにより、その文書ページに画面が切り替わるように
なっている。
【0032】・さらに、図7に示すようにタイトルペー
ジは原則として1ページで構成され、文書ページは必要
に応じて複数ページから構成されており、各文書ページ
の記載内容の量は、ディスプレイ上に一度に表示できる
量となっている。
【0033】・文書ページでは、タイトルページ、前後
のページ、および、各ページを示す表示があり、この表
示をクリックなどすることによりそのページへ移行でき
るようにリンクされている。
【0034】これらのタイトルページおよび文書ページ
がディスプレイ上に表示された例を図8〜図12に示
す。図8はタイトルページTPを表示した画面を示す図
であり、図9、図10および図11は見出し「1.寒いと
ころ」の内容である文書ページDPa、DPbおよびD
Pcを表示した画面であり、図12は「見出し」「2.暑
いところ」の内容が記載された文書ページDPdを表示
した画面を示している。タイトルページTPは必ずしも
1画面に納まる必要はなく、納まらない場合はスクロー
ルなどして「見出し」が全て表示されるようになってい
る。また、それぞれの文書ページの表示内容は1画面に
納まるようになっている。
【0035】なお、この例では、以下の説明を簡易にす
るために、各「段落」は1画面に納まる量であり、各文
書ページは各「段落」の初めから始まるものとしている
が、もちろん、各「段落」が1画面に納まらない場合は
さらに文書ページが必要であり、また、各文書ページは
「段落」の初めから始まる必要はなく、「見出し」に対
応する全ての「段落」をつなぎ合わせ、頭から1画面に
表示できる量ごと分割して各文書ページとしてもよい。
【0036】タイトルページTPの見出し「1.寒いとこ
ろ」および「2.暑いところ」はそれぞれの内容が記載さ
れている文書ページDPaおよびDPdにリンクされて
おり、マウスなどを用いて「見出し」をクリックするこ
とによりリンクされた文書ページに画面表示が切り替わ
るようになっている。
【0037】各文書ページでは図9に示すように画面左
上に記載されている文字をクリックなどすることにより
それぞれに対応する構造化文書に画面表示が切り替わる
ようになっている。すなわち、図9の例では、「上
層」、「次」、「2」および「3」がそれぞれタイトル
ページTP、文書ページDPb、文書ページDPbおよ
び文書ページDPcにリンクされており、これらの文字
をクリックなどすることにより、各文書ページに画面が
切り替わるようになっている。
【0038】これらの構造化文書(タイトルページTP
および文書ページDPa〜DPd)の実体を示したもの
が図13〜図17である。これらの構造化文書の構造記
述部分は共通構造記述部分として全て同一であり、出現
回数が0回の構成要素も表現できるように、出現回数が
0回以上を示す出現回数識別子「*」を用いている。
【0039】取り扱う構造化文書をこのような複数の構
造化文書に変換することにより、ディスプレイを介して
読む者に対して以下に列挙するような効果が得られる。
【0040】・タイトルページを参照することにより、
文書全体の内容が容易に把握できる。また、文書ページ
にリンクされた表示をクリックすることにより、その対
応する文書内容を即読むことができ、操作性がよい。
【0041】・各文書ページは1画面に納まる量に制限
されているので、読者が画面をスクロールさせる煩わし
さがない。また、各文書ページからもタイトルページや
別の文書ページに即画面を切り替えることができ、操作
性がよい。
【0042】・各文書ページに表示される文書ページ切
り替えの表示から、その文書ページが一連の文章のどの
あたりに存在するかが把握でき、読者の読む気力を減退
させない。
【0043】次に、変換対象である1つの構造化文書
(原文書)を前述の形態を有する表示用文書である複数
の構造化文書へ変換する文書変換装置について説明す
る。
【0044】この文書変換装置は、図18に示すように
演算部11、記憶部12、キーボード13aやマウス1
3bを制御する入力制御部13、および、ディスプレイ
14aを制御する表示制御部14が中央のバスライン1
5に接続された構成を有している。処理対象である原文
書および処理プログラムなどは記憶部12に記憶されて
おり、これらと入力手段であるキーボード13aやマウ
ス13bによって入力される情報とが演算部11におい
て処理され、処理結果がディスプレイ14aに表示され
るとともに必要ならば記憶部12に記憶されるようにな
っている。
【0045】この装置では、新規な構造を有する原文書
を表示用文書へ変換する際にはオペレータが介在して各
構成要素の処理方法を表示指定情報として指定する半自
動モードで変換処理が行われ、新規でない構造を有する
原文書に対しては予め作成された表示指定情報を用いて
オペレータを介しない自動モードで変換処理が行われ
る。以下、図2に示される構造記述部分と図4(b)に示
される内容部分とを有する構造化文書から図13〜図1
7に示される表示用文書への変換を例として半自動モー
ド、自動モードの順で処理内容を詳説する。
【0046】図19は、半自動モードの場合のオペレー
タの作業内容を示した流れ図である。まず、オペレータ
は変換対象である原文書を指定し、次に、半自動モード
で変換処理を行うかどうかを指定する。すなわち、予め
保存されている表示指定情報を使用するかどうかを指定
する。ここで、表示指定情報を使用しないと選択した場
合、オペレータが表示指定情報を作成する半自動モード
で処理が行われることとなる。
【0047】半自動モードが指定されると、まず、ディ
スプレイ14a上に原文書の文書構造が図3に示したよ
うにグラフィカルにツリー形式で表示される。次に、こ
れらの表示された各構成要素に対し、以下に列挙する分
類を指定する。
【0048】・対応タイトル要素:タイトルページに表
示される構成要素であり、文書ページにリンクされるも
の ・本文要素:本文ページに表示される文書内容を有する
構成要素 なお、指定されなかった構成要素はタイトル要素として
取り扱われ、タイトルページを構成するが、文書ページ
にリンクされない構成要素として取り扱われる。また、
テキストデータは対応する構成要素と一体をなすもので
あるため、分類しないものとする。
【0049】図13〜図17に示される表示用文書に変
換する場合、対応タイトル要素として「見出し」が指定
され、本文要素として「段落」が指定され、指定されな
い「大見出し」、「日付」、および、「名前」がタイト
ル要素となる。これらの指定の情報は、表示指定情報と
して保存することができ、同様の構造を有する構造化文
書を表示用文書に自動モードにおいて変換する際に用い
られる。
【0050】以上がオペレータが指示する内容であり、
表示指定情報が作成されると、図20および図21に示
される処理が変換装置内部において自動的に処理される
こととなる。なお、これらの処理の一般的な様子を図を
用いて簡潔に示したものが図22である。
【0051】まず、図13に示される共通構造記述部分
が生成される(図20参照)。これは、各構造化文書の
構造を示すものであるが、共通して用いることができる
ように構成要素の0回以上の出現を示す出現回数識別子
「*」を用いている。具体的には、全てのテキスト以外
の構造要素に「*」を付加する処理となる。なお、この
構造記述部分は文書に対する処理(コピーや構造チェッ
クなど)を行う際に参照されるために存在するものであ
り、文書の構成を的確に表現するものが好ましいが、こ
の実施の形態では、処理の簡易さから出現回数識別子
「*」を用いて共通化を図っている。
【0052】次に、指定された対応タイトル要素が存在
するかどうかを調べ、存在する場合、この対応タイトル
要素に基づいてタイトルページTPが生成される。な
お、指定された対応タイトル要素が存在しない場合につ
いては後述する。
【0053】タイトルページTPは、原文書の複製から
本文要素を削除し、対応タイトル要素と後に生成される
文書ページとにリンクを施すことによって生成される。
具体的には、元の構造化文書から「段落」をマークアッ
プとともに削除し、「見出し」と後に生成される文書ペ
ージとにリンクを施してタイトル化し、図13に示され
るタイトルページTPを生成する。なお、この段階では
文書ページは生成されていないため、リンク情報である
引用マークアップに用いられる構造化文書名には仮文書
ページ名を付与しておき、この情報をリンクページ名リ
ストとして保存しておく。そして、最後に共通構造記述
部分を付加してタイトルページTPが完成する。
【0054】次に、文書ページDPa〜DPdが作成さ
れるが、この処理は、本文要素(仮文書ページ)の分
割、共通構造記述部分の付加、ヘッダ/フッタ付加、リ
ンク処理の順で行われる(図21、図22参照)。
【0055】まず、リンクページ名リストに基づいて原
文書から本文要素を対応タイトル要素とともに仮文書ペ
ージとして抜き出し、分割して文書ページの原形を生成
する。この分割は予め1画面に表示できる指定された文
字数に基づいて行う。また、分割された文書ページの最
初のものの名前をタイトルページTPに引用されている
仮文書ページ名とするとともに各文書ページ名を分割ペ
ージ名リストとして保存しておく。次に、これらの文書
ページに共通構造記述部を付加するとともに、分割ペー
ジ名リストに基づいて図8〜図12の画面の左上に表示
されているヘッダ(あるいはフッタ)を付加し、各文書
ページへのリンク処理を施す。この処理により、図14
〜図17に示される構造を有する文書ページDPa〜D
Pdが生成され、各文書ページからタイトルページTP
や他の文書ページへ画面の切替がヘッダをクリックする
などして行うことができるようになる。また、タイトル
ページTPからも「見出し」として表示される各段落へ
の先頭の文書ページへ画面を切り替えることができるよ
うになる。
【0056】以上説明してきたように、この装置ではオ
ペレータが対応タイトル要素および本文要素を指定する
だけで、ディスプレイ14a上での表示に適した構造化
文書を生成することができる。したがって、オペレータ
が逐一原文書を分割したり、マークアップを埋め込むな
どの作業が不要になり、作業性が格段に向上する。ま
た、この表示用文書はタイトルページと文書ページとか
らなるため、読者は文章の構成を容易に把握して読みた
い部分をすぐに読むことができる。また、ヘッダの表示
から読んでいる位置を容易に把握でき、かつ、画面のス
クロールも必要ないので読む気力を減退させることもな
い。
【0057】以上が、この文書変換装置の半自動モード
におけるオペレータの作業内容および装置の処理内容で
あるが、この装置では図19の過程ATに示すように、
オペレータの作業を省略して自動モードで変換処理を行
うこともできる。この場合、予め同様の構造を有する構
造化文書が一度半自動モードで表示用文書に変換されて
おり、その際に作成した表示指定情報が保存されている
ことが前提となる。この表示指定情報を読み込むことに
より、オペレータが介在せずに同様の処理が実行され、
表示用文書を生成することができるようになる。その結
果、さらに文書変換処理の効率が向上される。
【0058】<3.第2の実施の形態>第1の実施の形
態では、半自動モードにおいてオペレータが対応タイト
ル要素および本文要素を指定することにより、文書変換
が行われたが、実際の文書には必ずしも対応タイトル要
素に相当するものが存在するわけではない。すなわち、
「見出し」に相当するものを介在させずに「段落」に相
当するもののみが存在する場合がある。この場合、各段
落に「詳細1」、「詳細2」などといった「見出し」
(すなわち、対応タイトル要素)に相当する構成要素を
自動生成し、タイトルページから各段落にアクセスが容
易となるようにする必要がある。
【0059】図20中、過程NTに示される部分が、こ
の対応タイトル要素の自動生成に相当する。ここでは、
表示指定情報に対応タイトル要素が存在しない図23
(a)に示す例のような場合、各本文要素の前に図23(b)
に示すように「詳細1」、「詳細2」などのテキストデ
ータを「見出し」のマークアップとともに挿入し、対応
タイトル要素を生成する。その他の処理は第1の実施の
形態と同様であり、これらの「見出し」が図24(a)お
よび図24(b)に示すようにタイトルページおよび文書
ページに表示されるようになる。
【0060】なお、この例では第1の実施の形態と同
様、各段落は1画面に納まる量となっているが、もちろ
ん、各段落が1画面に納まらない量であれば段落は分割
され文書ページ数が増加することとなる。
【0061】以上のように対応タイトル要素を自動生成
することで、対応タイトル要素が存在しない文書に対し
ても段落ごとに容易にアクセスすることができるように
なる。もちろん、「詳細1」、「詳細2」などといった
「見出し」では、文章の内容が把握しにくいので、例え
ば、「段落」におけるテキストデータの始まりの数十文
字を対応タイトル要素を構成するテキストデータとして
用いてもよい。この場合、以前読んだ文書ページを読み
直したい場合などは特に有効に活用することができる。
【0062】<4.変形例>以上、この発明に係る文書
変換装置の実施の形態について説明してきたが、この発
明は上記実施の形態に限定されるものではなく、以下の
ような変形も可能である。
【0063】・第1の実施の形態では1つの原文書に1
組の本文要素と対応タイトル要素しか指定できないよう
になっているが、複数組の指定ができるようにしてもよ
い。例えば、「見出し」と「段落」以外に、「章名」と
「柱書」とが存在するとき、これらをそれぞれ対応タイ
トル要素と本文要素としてもよい(図25(a)参照)。
さらに、「見出し」の下位要素に「小見出し」が存在す
る場合、「見出し」と「小見出し」とを対応タイトル要
素とし、対応する「段落」を本文要素としてもよい(図
25(b)参照)。
【0064】・また、「小見出し」が存在するときは、
「小見出し」用のタイトルページと「見出し」用のタイ
トルページとを設け、お互いにリンクを施すことにより
階層構造を構築してもよい。
【0065】・上記実施の形態では、タイトルページは
1ページに限定されているが、複数ページに分割するこ
とにより、タイトルページにおいてもスクロールなどの
画面操作をなくすようにしてもよい。
【0066】・上記実施の形態では、画面の切替に「上
層へ」や「前/次ページへ」と表示した文字をクリック
などする手法を用いているが、矢印などのグラフィカル
な表示をクリックなどするようにしてもよい。
【0067】・上記実施の形態では文字のみで構成され
た文書しか扱えない仕組みになっているが、絵柄やグラ
フなどを含んでいてもその面積を計算してそのページに
組み込める文字数上限を変化させ、本文要素を分割する
機能を追加することで、絵柄やグラフが組み込まれた文
書ページをディスプレイの画面に収めることが可能にな
る。
【0068】・上記実施の形態では、各構成要素のテキ
ストデータをそのまま表示しているが、構成要素の種類
に応じて違ったフォント、大きさ、色、文字スタイル
(イタリック、ボールドなど)、レイアウト(右ツメ、
左ツメ、中央、インデント量など)を設定することでよ
り見やすい表示用文書を完成させることが可能になる。
【0069】
【発明の効果】請求項1記載の発明によれば、原文書か
らタイトルページと文書ページとを半自動的または自動
的に生成するため、時間と労力を削減でき、また、オペ
レータによる誤変換を防止することができる。また、原
文書が一元化されるので、原文書の変更に柔軟に対応で
きる。また、文書ページの各ページはディスプレイの表
示サイズに合わせて作成されるので、読者は画面をスク
ロールさせる煩わしさから解放され、読む気力が減退す
ることもない。さらに、タイトルページの対応タイトル
要素は文書ページとリンク情報を介してリンクされてい
るので、読者が目的の文書の位置に素早くたどり着くこ
とができる。
【0070】請求項2記載の発明によれば、グラフィカ
ルに表示される文書構造を見ながら表示指定情報を作成
することができるので、オペレータの作業内容が簡潔か
つ容易となる。
【0071】請求項3記載の発明によれば、対応タイト
ル要素を自動生成するので、対応タイトル要素に相当す
る構成要素が存在しない場合であっても、表示用文書を
生成することができる。
【0072】請求項4記載の発明によれば、文書内容を
リンク情報に置換することによりタイトルページを生成
し、文書内容を分割することにより文書ページを生成す
るため、請求項1記載の発明の効果と同様、時間、労力
および誤変換を削減することができるともに、読者の読
む気力を減退させることもない。
【0073】請求項5記載の発明によれば、各文書ペー
ジにヘッダまたはフッタを付与するので、読者はさらに
素早く目的の文書の位置に到達することができる。
【図面の簡単な説明】
【図1】構造化文書の構成を示す図である。
【図2】構造記述部分を示す図である。
【図3】構造化文書の構造を示す図である。
【図4】内容部分を示す図である。
【図5】リンクされた構造化文書の例を示す図である。
【図6】構造化文書の表示画面を示す図である。
【図7】表示用文書の構成を示す図である。
【図8】タイトルページの表示画面を示す図である。
【図9】文書ページの表示画面を示す図である。
【図10】文書ページの表示画面を示す図である。
【図11】文書ページの表示画面を示す図である。
【図12】文書ページの表示画面を示す図である。
【図13】タイトルページの構成を示す図である。
【図14】文書ページの構成を示す図である。
【図15】文書ページの構成を示す図である。
【図16】文書ページの構成を示す図である。
【図17】文書ページの構成を示す図である。
【図18】文書変換装置の構成を示す図である。
【図19】オペレータの作業内容を示す流れ図である。
【図20】タイトルページ生成における処理の流れ図で
ある。
【図21】文書ページ生成における処理の流れ図であ
る。
【図22】表示用文書生成過程を示す図である。
【図23】対応タイトル要素自動生成後の内容部分を示
す図である。
【図24】対応タイトル要素自動生成後の文書表示画面
を示す図である。
【図25】表示指定情報の変形例を示す図である。
【符号の説明】 1 文書変換装置 11 演算部 12 記憶部 13a キーボード 13b マウス 14a ディスプレイ TP タイトルページ DPa、DPb、DPc、DPd 文書ページ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書記述言語で記述される構造化文書
    を、ディスプレイでの表示に適した構造化文書に変換す
    る装置であって、 (a)1つの構造化文書からなる原文書を記憶する記憶手
    段と、 (b)前記原文書の文書内容を省いたタイトルページを半
    自動的または自動的に生成するタイトルページ生成手段
    と、 (c)前記文書内容を表示する複数の文書ページを前記タ
    イトルページとは別に自動的に生成する文書ページ生成
    手段と、を備え、 前記複数の文書ページのそれぞれは前記ディスプレイの
    表示サイズに合わせて作成されるとともに、 前記タイトルページに表示される特定の構成要素のう
    ち、前記文書ページに表示される前記文書内容に対応す
    るものが対応タイトル要素として当該文書ページとリン
    ク情報によって互いにリンクされており、 前記対応タイトル要素の表示を選択指定することによ
    り、対応する文書ページが前記リンク情報を介して選択
    されて前記ディスプレイに表示可能とされることを特徴
    とする文書変換装置。
  2. 【請求項2】 請求項1の装置において、 前記タイトルページ生成手段が、 (b-1)前記原文書の構造をグラフィカルに表示させるグ
    ラフィカル表示手段と、 (b-2)前記構造中から、前記対応タイトル要素と当該要
    素に応じた文書内容を有する構成要素との関係を示す表
    示指定情報を前記グラフィカル表示手段上で指定して作
    成し、前記記憶手段に記憶させる表示指定情報作成手段
    と、を有することを特徴とする文書変換装置。
  3. 【請求項3】 請求項2の装置において、 前記タイトルページ生成手段が、 (b-3)前記原文書においては対応すべき対応タイトル要
    素を有しない文書内容が前記表示指定情報作成手段によ
    って指定されたときに、前記文書内容に対応すべき対応
    タイトル要素を自動生成する対応タイトル生成手段、を
    有することを特徴とする文書変換装置。
  4. 【請求項4】 請求項1ないし3のいずれかの装置にお
    いて、 前記タイトルページ生成手段が、 (b-4)前記記憶手段から前記原文書を読出し、前記表示
    指定情報に基づいて前記対応タイトル要素に含まれる前
    記文書内容を削除し、前記リンク情報を付加することに
    より前記タイトルページを生成するタイトル化手段、を
    有し、 前記文書ページ生成手段が、 (c-1)前記記憶手段から前記対応タイトル要素とともに
    当該要素に対応する前記文書内容を読出して分割するこ
    とにより前記文書ページを生成する文書分割手段、を有
    することを特徴とする文書変換装置。
  5. 【請求項5】 請求項1ないし請求項4のいずれかの装
    置において、 (d)前記ディスプレイ上で指定されることによって前記
    ディスプレイにおける表示を他のページに切り替えるヘ
    ッダまたはフッタを、前記文書ページのそれぞれに自動
    的に付与するヘッダ/フッタ付与手段、をさらに備える
    ことを特徴とする文書変換装置。
JP8061348A 1996-03-18 1996-03-18 文書変換装置 Pending JPH09251457A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8061348A JPH09251457A (ja) 1996-03-18 1996-03-18 文書変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8061348A JPH09251457A (ja) 1996-03-18 1996-03-18 文書変換装置

Publications (1)

Publication Number Publication Date
JPH09251457A true JPH09251457A (ja) 1997-09-22

Family

ID=13168551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8061348A Pending JPH09251457A (ja) 1996-03-18 1996-03-18 文書変換装置

Country Status (1)

Country Link
JP (1) JPH09251457A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007068229A (ja) * 2006-11-28 2007-03-15 Kyocera Corp 携帯端末装置
JPWO2007052680A1 (ja) * 2005-10-31 2009-04-30 株式会社ジャストシステム 文書処理装置及び文書処理方法
US8051371B2 (en) 2004-10-25 2011-11-01 Nec Corporation Document analysis system and document adaptation system
JP2012164346A (ja) * 2012-04-24 2012-08-30 Canon Inc 情報処理装置、情報処理装置の制御方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8051371B2 (en) 2004-10-25 2011-11-01 Nec Corporation Document analysis system and document adaptation system
JPWO2007052680A1 (ja) * 2005-10-31 2009-04-30 株式会社ジャストシステム 文書処理装置及び文書処理方法
JP2007068229A (ja) * 2006-11-28 2007-03-15 Kyocera Corp 携帯端末装置
JP4673282B2 (ja) * 2006-11-28 2011-04-20 京セラ株式会社 携帯端末装置
JP2012164346A (ja) * 2012-04-24 2012-08-30 Canon Inc 情報処理装置、情報処理装置の制御方法、及びプログラム

Similar Documents

Publication Publication Date Title
US4933880A (en) Method for dynamically processing non-text components in compound documents
EP0173123B1 (en) Implicit creation of a superblock structure in a multiple data editor
EP0173122B1 (en) Integrated multiple data editor
EP0173124B1 (en) Multiple data editor using flow attributes for text objects
US6901427B2 (en) Font sharing system in which data representing a character string can be communicated between a client computer and a server wherein only layout frames are displayed in a preview area of a display screen
US4723210A (en) Superblock structure in a multiple in a data editor
JPS6342305B2 (ja)
JPS5862729A (ja) 対話式テキスト処理システム
JPH077408B2 (ja) 強調特性変更方法及びシステム
US20040133595A1 (en) Generation of persistent document object models
JPS6290753A (ja) 文書作成装置
JPWO2006051721A1 (ja) 文書処理装置及び文書処理方法
US5673429A (en) Database display system using list management of display formats
JPH09251457A (ja) 文書変換装置
JPWO2005098698A1 (ja) 文書処理装置
JPS59142628A (ja) メモ書きを作成・管理する文書作成機
EP0617374A1 (en) A data processing system for printing screen information
JPH11272666A (ja) 文書編集システム、方法、及び記録媒体
JP3016248B2 (ja) 文書表示装置
JP2001051771A (ja) 画像処理システム及び方法
JP2978178B2 (ja) 文書作成装置及びその制御方法
JP2744234B2 (ja) 文書処理装置
KR20010107072A (ko) 웹 브라우저에 노트기능을 제공한 웹 브라우징 구축 방법
Merz et al. Planning PDF Documents
JP2001318911A (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体