JPH0512261A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0512261A
JPH0512261A JP3159235A JP15923591A JPH0512261A JP H0512261 A JPH0512261 A JP H0512261A JP 3159235 A JP3159235 A JP 3159235A JP 15923591 A JP15923591 A JP 15923591A JP H0512261 A JPH0512261 A JP H0512261A
Authority
JP
Japan
Prior art keywords
document
data
information
displayed
additional data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3159235A
Other languages
English (en)
Inventor
Masayuki Kurahashi
倉橋政之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3159235A priority Critical patent/JPH0512261A/ja
Publication of JPH0512261A publication Critical patent/JPH0512261A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文書の構造レベルに応じた情報を付加するこ
とにより、読みやすくしかも必要に応じて十分な量の情
報を得ることができる文書処理を行う。 【構成】 文書は、文字列を表すテキストデータと構造
化された文書の各構造を表すデータとから構成されてお
り、各構造を表すデータには各構造に関連する情報が付
加される。例えば、単語を示すデータには、その単語の
意味を示す文字データが付加される。これらの文書デー
タは外部記憶装置1−1に格納される。外部記憶装置1
−1からテキストデータ及び構造データが読み出されて
ディスプレイ装置1−8に文書が表示される。この文書
が表示されている状態において、例えば、キー入力装置
1−4により前記単語が指示されると、文書構造付加デ
ータ処理装置1−2によりその構造に関連する付加情
報、すなわち、単語の意味が読み出され、元の文書とは
別にディスプレイ装置1−8に表示される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、構造化された電子的な
文書を取り扱う文書処理装置に関する。
【0002】
【従来の技術】近年、ワードプロセッサやワークステー
ション等の文書処理装置を使用して電子的な文書を作成
することが一般に行われている。しかしながら、従来の
文書処理装置においては、一般にメーカー毎に記録形式
が異なっているため、作成済みの電子的な文書を他の文
書処理装置で利用することが困難であった。
【0003】文字に関しては、文字コードが共通である
ため、記録形式を標準化してフロッピディスクに記録し
たり、伝送形式を標準化して通信回線を介して伝送する
ことにより、文書データを交換することが行われてい
る。しかしこの場合、利用できるのは単純な文字列だけ
であり、図形や文書の様式等の情報は利用できない。
【0004】そこで、文書処理装置で作成される一般的
な文書のデータを共用できるようにするための事務文書
体系(ODA;Office DocumentArc
hitecture)と呼ばれる体系が標準化されつつ
ある(例えば、野口他,「OSIの実現とその課題(V
I)事務文書体系(ODA)」,情報処理学会誌,Vo
l.31,No9,pp.1235−1244参照)。
【0005】上記事務文書体系においては、文書が予め
決められた規則に基づいて構造化され、構造化された文
書データが伝送される。なお、構造化とは、たとえば、
章、節、パラグラフ等の文書の論理的構造を抽出した
り、ページ、図形枠等の文書割り付け上の構造を抽出し
て、これらの情報から文書データを構築することを意味
する。受信側では、構造化された文書データに対して逆
の処理を施せば元の文書が再現される。
【0006】
【発明が解決しようとする課題】上述のように、事務文
書体系においては、文書を構造化することにより文書の
標準化を行うことができるが、最終的に得られた文書か
ら読み取ることができる情報の量は、標準化の有無の関
係なく、従来の紙の上に印刷された文書と同じである。
すなわち、文書中に表示されている文字或いは図形のみ
が、ユーザが知ることが出来る情報である。
【0007】一方、社会において流通する情報量の増加
に伴い、文書に記載すべき情報の量も増加し、またその
内容も細分化している。このため、例えば或る技術分野
に関する文書を作成する場合、読者のレベルを想定しな
がら文書を作成する必要がある。例えばその分野で周知
と思われる技術や用語については、背景の説明を行うこ
となく説明を進めることができるが、特定の分野でしか
知られてないと思われる事項に関しては、文章中に、或
いは脚注等で説明を加えておく必要がある。
【0008】このため、ある程度一般的な読者を対象と
した文書を作成する場合には、注意書きが多くなってし
まい、また、文章も長くなってしまう。
【0009】また、技術文献等では、内容の把握が容易
にできるように、要約が付記されたり、コンピュータ検
索のためのキーワードが付記されていることがあるが、
これらの情報は必ずしも全ての読者にとって必要なもの
ではない。
【0010】このように十分な情報を文書中に盛り込も
うとすると、文書が煩雑で長大なものとなり、読みにく
くなってしまうという問題があった。
【0011】そこで、本発明は、先に述べた構造化文書
に着目し、構造化文書で規定された文書構造、或いは、
文書を自動的に分析した結果であるところの文書構造に
対して、その構造レベルに応じた情報を付加することに
より、読みやすくしかも必要に応じて十分な量の情報を
得ることができる文書処理を行うことを目的とする。
【0012】
【課題を解決するための手段】本発明は、前記目的を達
成するため、構造化された文書に対して処理を行う文書
処理装置であって、文字列を表すテキストデータと構造
化された文書の各構造を表すデータとを記憶する記憶手
段と、前記各構造を表すデータに各構造に関連する情報
を付加する手段と、前記テキストデータを各構造を表す
データに基づいて表示する手段と、前記構造を指定する
手段と、指定された構造に対応する付加情報を出力する
手段とを設けたことを特徴とする。
【0013】
【作用】本発明においては、文書が、文字列を表すテキ
ストデータと構造化された文書の各構造を表すデータと
から構成されており、各構造を表すデータには各構造に
関連する情報が付加される。例えば、単語を示すデータ
には、その単語の意味を示す文字データが付加される。
表示手段においては、テキストデータと文書構造を表す
データとに基づいて文書が表示されるが、文書が表示さ
れている状態において、例えば、前記単語が指示される
と、その構造に関連する情報、すなわち、単語の意味
が、元の文書とは別に表示される。
【0014】
【実施例】以下、図面を参照しながら、実施例により本
発明の特徴を具体的に説明する。図1は、本発明の文書
処理装置の実施例を示す概略構成説明図である。
【0015】外部記憶装置1−1には、例えば従来の技
術の項で説明した事務文書体系(ODA)を用いて構造
化された文書データが記憶されている。構造化された文
書データは、文字列自体を表すテキストデータと、文書
の構造を表すためのデータとこの文書構造に付加された
データとから構成されている。なお、ここでは、文書構
造自体を表すデータとこれに付随するデータを合わせて
文書構造付加データと称する。外部記憶装置1−1に記
憶されている文書データは、文書構造付加データ処理装
置1−2により読み込まれ、文書構造付加データと従来
のテキストデータに分離され、前者は文書構造付加デー
タ処理装置1−2で、後者はエディタ装置1−3で処理
される。
【0016】一方、キー入力装置1−4及びマウス等の
座標入力装置1−5から入力された情報についても、入
出力制御装置1−6を経由して文書構造付加データ処理
装置1−2に入力され、文書構造付加データとテキスト
データに分離されて、前者は文書構造付加データ処理装
置1−2で、後者はエディタ装置1−3で処理される。
【0017】これらの文書データと文書構造付加データ
に基づき、表示制御装置1−7と入出力制御装置1−6
により、ディスプレイ装置1−8に文書が表示される。
【0018】図2は、文書構造付加データを持つ文書デ
ータの構造例を図示したものである。
【0019】本実施例では、文書データは、文書データ
管理部2−1と、テキストデータ部2−2と、文書構造
付加データ部2−3とから構成されている。
【0020】文書データ管理部2−1は、文書データの
先頭にあり、テキストデータの先頭を示すオフセット値
2−1−1と文書構造付加データ管理テーブル2−1−
2が入っている。テキストデータ部2−2は、このテキ
ストデータオフセット値2−1−1により、文書データ
内での開始位置が分かるようになっている。また、文書
構造付加データ管理テーブル2−1−2は、文書構造と
そのテキストデータおよび文書構造付加データとの対応
を管理するためのものである。
【0021】図3は、文書構造付加データ管理テーブル
2−1−2のフォーマットの例として、本実施例におけ
る章レベル、節レベルの文書構造付加データ管理テーブ
ルを示したものである。
【0022】図3(a)に示す章構造付加データ管理テ
ーブル3−1には、各章を識別するための章ID番号
と、テキストデータ部での開始位置とその長さ、そし
て、章構造付加データの文書構造付加データ部での開始
位置が記述されている。これにより、この章IDを持つ
章がテキストのどの部分に対応し、また、この章という
文書構造にはどのような章構造付加データが付いている
かが判るようになっている。
【0023】また、図3(b)に示す節構造付加データ
管理テーブル3−2には、上位の構造である章の中での
その節の相対位置がその開始位置とその長さで表現され
ている。節構造付加データについては、章構造の場合と
同様である。この例では、下位の構造がどの構造に属す
るかはそのIDから判断できるようになっている。例え
ば、第1.1節は、第1章の第1節であることが判るよ
うになっている。
【0024】図4は、文書構造付加データの例を示した
ものである。
【0025】同図(a)では、“ASAP”という単語
についての付加情報を、単語構造付加データ4−1で示
してある。この例で示すように、文書構造付加データ
は、複数の種類のデータを持つことができ、その区別
は、そのデータが持つ属性情報によって区別される。こ
の図4(a)の単語構造付加データ4−1の例では、省
略形でない英語と、その日本語での意味などを記述して
いる。同様に、段落についての付加情報について示した
のが、図4(b)に示す段落構造付加データ4−2であ
る。ここでは、その段落の要約とその段落で現れるキー
ワードを記述している。
【0026】本実施例では、文書構造付加データを、単
語レベル、文レベル、段落レベル、節レベル、章レベル
の各構造に対して持っており、各文書構造のレベルに応
じた注記として利用している。図5は各レベルの関係を
模式的に示している。
【0027】例えば、単語レベルについている注記とし
ては単語の意味などを情報として持ち、段落レベルで
は、その段落についての要約やキーワードが載せられて
いる。このように、単語レベルと段落レベルについてい
る注記ではその内容が全く異なるものとなっており、そ
れらの注記をその文書の構造に付けることにより、文書
の構造に応じた注記を得ることが可能となっている。
【0028】図6は、文書構造付加データを含む文書の
処理フローである。
【0029】外部記憶装置1−1から文書データが読み
込まれ(ステップ101)、この文書データは、テキス
トデータと文書構造付加データに分けられ、それぞれエ
ディタ装置1−3と文書構造付加データ処理装置1−2
で処理される(ステップ102)。文書を編集する場合
は、文書構造付加データについては、文書構造付加デー
タ処理装置1−2が、文書そのものについては、エディ
タ装置1−3が処理する。但し、編集により、文書の構
造が変化したり、位置が変化したりするので、それにつ
いては文書構造付加データ処理装置1−2が処理する。
編集が終了した場合は、外部記憶に文書構造付加データ
とテキストデータを一つにして文書データという形で記
憶する(ステップ103)。
【0030】図7は、文書構造付加データを編集する際
の処理フローを説明するものである。例えば、いま“A
SAP”という単語についての文書構造付加データを編
集する場合を例に挙げて説明する。
【0031】ユーザが文書構造の付加データを編集する
には、まず、対象となる文書構造を選択する必要があ
る。そこでユーザは座標入力装置1−5等を使用して
“ASAP”という単語が表示されている位置をエディ
タ装置1−3に対して指示する。エディタ装置1−3
は、編集対象の文書構造が存在するテキスト上の位置デ
ータを得る(ステップ201)。次に、得られたテキス
トデータの位置から、その位置が属する文書構造をすべ
て文書構造付加データ処理装置1−2がディスプレイ装
置1−8の画面上に表示する(ステップ202)。例え
ば、図5に示す例において、“ASAP”という単語が
表示されている位置が指定されたとすると、この単語に
対応する単語構造付加データ、第1段落の段落構造付加
データ、第1節の節構造付加データ、第1章の章構造付
加データが編集対象の候補となる文書構造として表示さ
れる(ステップ202)。なお、この編集対象の候補と
なる文書構造は、全データが表示されるのではなく、項
目名のみ、或いは、最小必要限の情報が付加された状態
で表示され、文書構造が一覧できるようになっている。
【0032】次に、ユーザがこれらの候補の中から目的
とする文書構造を、座標入力装置1−5等を使用して選
択すると、文書構造付加データ処理装置1−2は、その
文書構造の文書構造付加データを、各属性ごとに属性値
として表示する(ステップ203)。すなわち、この例
の場合、図4(a)に示すような単語構造付加データが
表示される。したがって、ユーザはキー入力装置1−4
や座標入力装置1−5を使用して、エディタ装置1−3
により単語構造付加データ、即ち、属性情報を編集する
ことができる。編集後の属性情報は、文書構造付加デー
タ処理装置1−2において文書構造付加データに格納さ
れる (ステップ204)。
【0033】上述のようにして、ユーザは文書構造付加
データの属性値を変更することができる。
【0034】次に、上述のようにして作成或いは編集さ
れた文書をユーザが見る場合について図8のフローチャ
ートを参照して説明する。
【0035】キー入力装置1−4或いは座標入力装置1
−5を使用して、目的文書を指定すると(ステップ30
1)、該当する文書の文書データが外部記憶装置1−1
から読み出され(ステップ302)、図5に示すよう
に、文書データ中の内容に応じて文書がディスプレイ装
置1−8に表示される(ステップ303)。初期状態に
おいては、ディスプレイ装置1−8に表示されるのは、
テキストデータ部2−2に格納されているテキストデー
タ2−2−1のみである。
【0036】ここで、ユーザが文書中の“ASAP”と
いう単語の意味が判らず、その意味を知りたい場合に
は、例えば座標入力装置1−5を使用して“ASAP”
の文字の部分を選択した後に、ディスプレイ装置1−8
に表示された「付加データ表示」コマンド部を座標入力
装置1−5で選択すると(ステップ304,305)、
或いは、キー入力装置1−4に設けられた「付加データ
表示」のキーを押すと、ディスプレイ装置1−8の表示
画面上に付加データ表示ウィンドウが開かれ、先に説明
した編集動作の場合と同様に、候補の項目が表示される
ので(ステップ306)、単語構造付加データを座標入
力装置1−5で選択すると(ステップ307)、その属
性情報、すなわち“ASAP”という単語の正式名称,
意味等が表示される(ステップ308)。したがってユ
ーザは辞書等を見ることなく、その単語の意味を知るこ
とができる。また、単語構造付加データではなく、段落
構造付加データを選択した場合には、その段落の要約や
その段落に含まれているキーワード等を知ることができ
る。
【0037】また、付加データ表示ウィンドウを閉じる
ためには、例えば、そのウィンドウ中に表示されている
「閉じる」コマンド部を選択すればよい(ステップ30
9,310)。
【0038】また、座標入力装置1−5から「付加デー
タ表示」コマンド以外の入力があった場合には、各コマ
ンドに対応した処理を行う(ステップ311)。例え
ば、スクロール指示があったような場合は、テキストデ
ータ中のディスプレイ装置1−8に表示される部分を順
次変更する。
【0039】更に、文書のテキスト情報のみを知りたい
場合には、付加データ表示ウィンドウを表示することな
く、スクロール操作により文書の内容を短時間で把握す
ることもできる。
【0040】なお、章や節を示す行が選択されたときに
は、章構造付加データや節構造付加データを直接表示す
るようにしてもよい。
【0041】以上に述べたように、本実施例において
は、文書構造自体に情報を付加することにより、直接文
書上の文字として表示されている情報だけではなく、必
要に応じてそれに付随する情報を知ることもできる。こ
れにより、ユーザの必要に応じて最も適した方法で文書
を利用することができる。
【0042】なお、上述の実施例においては、文書構造
付加データに文字情報からなる属性情報を登録するよう
にしたが、これに限定されるものではなく、適当な属性
情報をつけて自由に登録できる。例えば、文書構造に音
声や画像データを付加することで、テキストデータと同
時にその文書構造に付加された映像や音声を再現するこ
ともできる。
【0043】また、文書構造にフォントファイル情報を
つけることで、ディスプレイへの表示の際、フォントフ
ァイルを切り替えることにより、多様なフォントを使用
することができる。更に、より一般には、文書のフォー
マット情報を入れることで、文書の表示フォーマットを
文書構造に応じて自由に行うことができる。
【0044】更に、構造化文書をプログラムで処理する
ような場合、必要なデータを文書構造に付加すること
で、テキスト処理に柔軟性を持たせることができる。
【0045】また更に、本発明では、予め与えられた文
書構造でなくとも、自動的に文書を解析したその結果の
構造に対しても情報を付加することができる。
【0046】
【発明の効果】以上に述べたように、本発明において
は、文書構造自体に情報を付加することにより、文書構
造に密着した情報を文書データに付加することが可能と
なる。これにより、従来のテキスト情報の中には表現で
きなかった、もしくは、表現が困難であった情報を文書
の中に含ませることができ、高い表現力を有する文書を
作成することができる。
【図面の簡単な説明】
【図1】 本発明の文書処理装置の実施例を示す概略構
成説明図である。
【図2】 文書データの構造例を示す説明図である。
【図3】 章及び節の文書構造付加データ管理テーブル
の構造例を示す説明図である。
【図4】 単語及び段落の文書構造付加データの構造例
を示す説明図である。
【図5】 文書の構造を説明するための図である。
【図6】 文書処理の概略の流れを示すフローチャート
である。
【図7】 文書構造付加データを編集する際の処理を示
すフローチャートである。
【図8】 ユーザが文書を見る際の処理を示すフローチ
ャートである。
【符号の説明】
1−1 外部記憶装置、1−2 文書構造付加データ処
理装置、1−3 エディタ装置、1−4 キー入力装
置、1−5 座標入力装置、1−6 入出力制御装置、
1−7 表示制御装置、1−8 ディスプレイ装置、2
−1 文書データ管理部、2−1−1 テキストデータ
オフセット値、2−1−2 文書構造付加データ管理テ
ーブル、2−2 テキストデータ部、2−2−1 テキ
ストデータ、2−3 文書構造付加データ部、2−3−
1 文書構造付加データ、3−1章構造付加データ管理
テーブル、3−2 節構造付加データ管理テーブル、4
−1 単語構造付加データ、4−2 段落構造付加デー

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 構造化された文書に対して処理を行う文
    書処理装置であって、文字列を表すテキストデータと構
    造化された文書の各構造を表すデータとを記憶する記憶
    手段と、前記各構造を表すデータに各構造に関連する情
    報を付加する手段と、前記テキストデータを各構造を表
    すデータに基づいて表示する手段と、前記構造を指定す
    る手段と、指定された構造に対応する付加情報を出力す
    る手段とを設けたことを特徴とする文書処理装置。
JP3159235A 1991-06-29 1991-06-29 文書処理装置 Pending JPH0512261A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3159235A JPH0512261A (ja) 1991-06-29 1991-06-29 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3159235A JPH0512261A (ja) 1991-06-29 1991-06-29 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0512261A true JPH0512261A (ja) 1993-01-22

Family

ID=15689298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3159235A Pending JPH0512261A (ja) 1991-06-29 1991-06-29 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0512261A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6347910B1 (en) 1996-09-27 2002-02-19 Mitsubishi Heavy Industries, Ltd. Submarine power storage system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6347910B1 (en) 1996-09-27 2002-02-19 Mitsubishi Heavy Industries, Ltd. Submarine power storage system

Similar Documents

Publication Publication Date Title
US6002798A (en) Method and apparatus for creating, indexing and viewing abstracted documents
US5293473A (en) System and method for editing a structured document to modify emphasis characteristics, including emphasis menu feature
US7088859B1 (en) Apparatus for processing machine-readable code printed on print medium together with human-readable information
JPH08241332A (ja) 全文登録語検索装置および方法
US5940842A (en) Character string retrieval system having a variable display range
EP0384986A2 (en) Method for displaying online information
JPH11184865A (ja) 文書要約装置
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JPH11250077A (ja) 情報処理装置、情報処理方法及び記録媒体
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JPH0512261A (ja) 文書処理装置
JPS634334A (ja) 文書イメ−ジ電子フアイル装置
JP2005031813A (ja) 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
JP2868256B2 (ja) プログラム編集装置
KR100477650B1 (ko) 응용프로그램과 독립적으로 파일을 인쇄하는 방법
JPH11161726A (ja) 電子帳票システム
JP2601139B2 (ja) 文字列検索装置
JPS61195455A (ja) 文書作成装置
JP3154790B2 (ja) 光学的文字読取装置
JPH06110946A (ja) マルチメディアデータ検索装置、及びマルチメディア・ユーザインタフェース
JPH10162126A (ja) 文書の電子化装置
JP2000181909A (ja) 辞書学習方法及び文書作成装置
WO1993018467A1 (en) Method of and apparatus for storing and displaying a document
JPH09218809A (ja) ファイル情報確認装置およびその方法
JPH09251547A (ja) 文書イメージ管理装置、及び文書イメージ管理方法