JPH1196161A - 文書変換装置 - Google Patents
文書変換装置Info
- Publication number
- JPH1196161A JPH1196161A JP9273465A JP27346597A JPH1196161A JP H1196161 A JPH1196161 A JP H1196161A JP 9273465 A JP9273465 A JP 9273465A JP 27346597 A JP27346597 A JP 27346597A JP H1196161 A JPH1196161 A JP H1196161A
- Authority
- JP
- Japan
- Prior art keywords
- document
- definition
- source
- link
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】原始文書からリンク付構造化文書を容易に作成
すること。 【解決手段】複数の原始文書1を共通に構成している構
成要素に関して、構成要素間の関係を階層的に示したオ
ブジェクト図2を表す文書構成情報を生成し、記憶す
る。この文書構成情報に基づいて、原始文書1の構文を
解析し文書の構成要素に分解するための構文解析規則4
と、構成要素間の全体と部分との集約関係を規定した文
書型定義5と、構成要素間のリンクを定義するリンク定
義6とを生成3する。任意の原始文書に対して構造解析
規則4を適用して文書を構成要素に分解し、分解された
構成要素に対して文書型定義5を適用して構造化文書を
生成7する。生成された構造化文書に対して、文書型定
義とリンク定義6とを適用して、自文書又は他文書の所
定箇所を参照できるリンク情報が挿入されたリンク付構
造化文書13を生成11する。
すること。 【解決手段】複数の原始文書1を共通に構成している構
成要素に関して、構成要素間の関係を階層的に示したオ
ブジェクト図2を表す文書構成情報を生成し、記憶す
る。この文書構成情報に基づいて、原始文書1の構文を
解析し文書の構成要素に分解するための構文解析規則4
と、構成要素間の全体と部分との集約関係を規定した文
書型定義5と、構成要素間のリンクを定義するリンク定
義6とを生成3する。任意の原始文書に対して構造解析
規則4を適用して文書を構成要素に分解し、分解された
構成要素に対して文書型定義5を適用して構造化文書を
生成7する。生成された構造化文書に対して、文書型定
義とリンク定義6とを適用して、自文書又は他文書の所
定箇所を参照できるリンク情報が挿入されたリンク付構
造化文書13を生成11する。
Description
【0001】
【産業上の利用分野】本発明は、構造化されていない一
般文書(以下、「原始文書」という)をマーク付けによ
り構造化された文書(以下、「構造化文書」という)と
し、さらに、他の文書を参照できるリンク情報が挿入さ
れたリンク付構造化文書を自動生成する変換装置に関す
る。本装置は、原始文書を記憶したデータベースやCD
ROM等の記憶媒体に対して、リンク付構造化文書のデ
ータベースやCDROM等の記憶媒体を容易に作成する
装置として用いられる。例えば、インターネット、イン
トラネットのサーバにおいて、リンク付構造化文書のデ
ータベースの構築に用いられる。又、その文書データを
記憶したCDROM等の記憶媒体等の製造に用いること
ができる。
般文書(以下、「原始文書」という)をマーク付けによ
り構造化された文書(以下、「構造化文書」という)と
し、さらに、他の文書を参照できるリンク情報が挿入さ
れたリンク付構造化文書を自動生成する変換装置に関す
る。本装置は、原始文書を記憶したデータベースやCD
ROM等の記憶媒体に対して、リンク付構造化文書のデ
ータベースやCDROM等の記憶媒体を容易に作成する
装置として用いられる。例えば、インターネット、イン
トラネットのサーバにおいて、リンク付構造化文書のデ
ータベースの構築に用いられる。又、その文書データを
記憶したCDROM等の記憶媒体等の製造に用いること
ができる。
【0002】
【従来の技術】最近、コンピュータ技術、ネットワーク
の進化により、データベースからの文書データの読み出
しが簡便に行えるようになってきている。文書における
希望箇所のアクセスが容易に行えるように、SGML(S
tandard Generalized Markup Language) 又はHTML
(Hyper Text Markup Language) と呼ばれる文書中に構
造を示すマークを付した言語で記述された構造化文書が
用いられている。又、文章中に自文書や他文書の所定箇
所を参照できるリンクが付されたリンク付構造化文書が
用いられている。
の進化により、データベースからの文書データの読み出
しが簡便に行えるようになってきている。文書における
希望箇所のアクセスが容易に行えるように、SGML(S
tandard Generalized Markup Language) 又はHTML
(Hyper Text Markup Language) と呼ばれる文書中に構
造を示すマークを付した言語で記述された構造化文書が
用いられている。又、文章中に自文書や他文書の所定箇
所を参照できるリンクが付されたリンク付構造化文書が
用いられている。
【0003】この構造化文書を作成するには、直接、構
造化文書を作成する方法の他、マークの付されていない
原始文書を作成して、この原始文書に対して、予め設定
されたルールに従って、マーク付を行うという方法が採
用されている。又、自動的にマーク付を行う方法は、既
存の原始文書を有効に利用して、構造化文書のデータベ
ースを得ることができるという利点がある。この自動的
にマーク付を行う方法として、特開平8−16594号
公報に記載の方法が知られている。
造化文書を作成する方法の他、マークの付されていない
原始文書を作成して、この原始文書に対して、予め設定
されたルールに従って、マーク付を行うという方法が採
用されている。又、自動的にマーク付を行う方法は、既
存の原始文書を有効に利用して、構造化文書のデータベ
ースを得ることができるという利点がある。この自動的
にマーク付を行う方法として、特開平8−16594号
公報に記載の方法が知られている。
【0004】
【発明が解決しようとする課題】しかし、特開平8−1
6594号公報の方法は、原始文書の記載とルールの条
件文とを照合して、照合する場合にはその部分のみルー
ルの結論文に置換するという方法である。従って、ルー
ルは、単に、置換すべき語句とマーク付語句との対応表
で与えているに過ぎない。よって、原始文書の構成様式
が変化すれば、それに伴い、ルールを再度、作成し直す
必要がある。又、語句による置換であるため、意味上の
階層関係とは異なる階層関係となってしまう場合がある
という問題がある。このため、階層構造を変化させたい
場合に対応できない。又、自文書や他文書の所定箇所を
参照するリンクを付す場合には、その対策はなく、手操
作によりリンク情報を挿入しなければならない。さら
に、原始文書の内容が更新されたり、構造様式が変更に
なった場合には、最初のルール作りからやり直す必要が
ある。
6594号公報の方法は、原始文書の記載とルールの条
件文とを照合して、照合する場合にはその部分のみルー
ルの結論文に置換するという方法である。従って、ルー
ルは、単に、置換すべき語句とマーク付語句との対応表
で与えているに過ぎない。よって、原始文書の構成様式
が変化すれば、それに伴い、ルールを再度、作成し直す
必要がある。又、語句による置換であるため、意味上の
階層関係とは異なる階層関係となってしまう場合がある
という問題がある。このため、階層構造を変化させたい
場合に対応できない。又、自文書や他文書の所定箇所を
参照するリンクを付す場合には、その対策はなく、手操
作によりリンク情報を挿入しなければならない。さら
に、原始文書の内容が更新されたり、構造様式が変更に
なった場合には、最初のルール作りからやり直す必要が
ある。
【0005】そこで、本発明の第1の目的は、原始文書
からリンク付構造化文書を容易に作成できるようにする
ことである。第2の目的は、原始文書の構造様式を階層
的に記述したオブジェクト図として与えることで、リン
ク付構造化文書を自動的に生成できるようにすることで
ある。第3の目的は、原始文書の内容の更新や構造様式
の変更に容易に対応できるようにすることである。さら
に、第4の目的は、構造化文書の生成とリンク付文書と
の生成を別工程とすることで、リンク情報の変更やリン
ク付をする文書中の位置の変更を容易にすることであ
る。
からリンク付構造化文書を容易に作成できるようにする
ことである。第2の目的は、原始文書の構造様式を階層
的に記述したオブジェクト図として与えることで、リン
ク付構造化文書を自動的に生成できるようにすることで
ある。第3の目的は、原始文書の内容の更新や構造様式
の変更に容易に対応できるようにすることである。さら
に、第4の目的は、構造化文書の生成とリンク付文書と
の生成を別工程とすることで、リンク情報の変更やリン
ク付をする文書中の位置の変更を容易にすることであ
る。
【0006】
【課題を解決するための手段】上記課題を解決するため
の発明の構成は、マーク付のない原始文書を論理構造を
示すマークを付けた構造化文書に変換する文書変換装置
において、複数の原始文書を記憶する原始文書記憶手段
と、複数の原始文書を共通に構成している構成要素に関
して、構成要素間の関係を階層的に示したオブジェクト
図を表す文書構成情報を記憶する文書構成情報記憶手段
と、文書構成情報記憶に記憶された文書構成情報に基づ
いて、原始文書の構文を解析し文書の構成要素に分解す
るための構文解析規則と、構成要素間の全体と部分との
集約関係を規定した文書型定義と、構成要素間のリンク
を定義するリンク定義とを生成する文書構造定義生成手
段と、構文解析規則、文書型定義、リンク定義とを記憶
する構造定義記憶手段と、任意の原始文書に対して構造
解析規則を適用して文書を構成要素に分解し、分解され
た構成要素に対して文書型定義を適用して構造化文書を
生成する文書構造化手段と、生成された構造化文書に対
して、文書型定義とリンク定義とを適用して、自文書又
は他文書の所定箇所を参照できるリンク情報が挿入され
たリンク付構造化文書を生成するリンク付構造化文書生
成手段とから成ることを特徴とする。
の発明の構成は、マーク付のない原始文書を論理構造を
示すマークを付けた構造化文書に変換する文書変換装置
において、複数の原始文書を記憶する原始文書記憶手段
と、複数の原始文書を共通に構成している構成要素に関
して、構成要素間の関係を階層的に示したオブジェクト
図を表す文書構成情報を記憶する文書構成情報記憶手段
と、文書構成情報記憶に記憶された文書構成情報に基づ
いて、原始文書の構文を解析し文書の構成要素に分解す
るための構文解析規則と、構成要素間の全体と部分との
集約関係を規定した文書型定義と、構成要素間のリンク
を定義するリンク定義とを生成する文書構造定義生成手
段と、構文解析規則、文書型定義、リンク定義とを記憶
する構造定義記憶手段と、任意の原始文書に対して構造
解析規則を適用して文書を構成要素に分解し、分解され
た構成要素に対して文書型定義を適用して構造化文書を
生成する文書構造化手段と、生成された構造化文書に対
して、文書型定義とリンク定義とを適用して、自文書又
は他文書の所定箇所を参照できるリンク情報が挿入され
たリンク付構造化文書を生成するリンク付構造化文書生
成手段とから成ることを特徴とする。
【0007】上記の文書構造化手段により構造化文書の
生成と、リンク付構造文書生成手段によるリンク付とは
連続して行っても良く、同時に行っても良い。連続して
行うとは、先ず、原始文書に構文解析規則、文書型定義
を適用して、構造化文書を生成して、その後に、その構
造化文書に対してリンク定義を適用して、リンク付構造
化文書を生成することを意味する。又、同時に行うと
は、原始文書に構文解析規則、文書型定義、及び、リン
ク定義を一度に適用して、構文化文書を生成しつつ、リ
ンク付構造化文書に変換することを意味する。又、構造
化手段により生成された構造化文書は、一旦、記憶装置
に記憶しておき、リンク付構造化文書生成手段は、後
に、この記憶装置に記憶されている構造化文書に対して
文書型定義とリンク定義とを参照して、リンク付構造化
文書を生成するようにしても良い。
生成と、リンク付構造文書生成手段によるリンク付とは
連続して行っても良く、同時に行っても良い。連続して
行うとは、先ず、原始文書に構文解析規則、文書型定義
を適用して、構造化文書を生成して、その後に、その構
造化文書に対してリンク定義を適用して、リンク付構造
化文書を生成することを意味する。又、同時に行うと
は、原始文書に構文解析規則、文書型定義、及び、リン
ク定義を一度に適用して、構文化文書を生成しつつ、リ
ンク付構造化文書に変換することを意味する。又、構造
化手段により生成された構造化文書は、一旦、記憶装置
に記憶しておき、リンク付構造化文書生成手段は、後
に、この記憶装置に記憶されている構造化文書に対して
文書型定義とリンク定義とを参照して、リンク付構造化
文書を生成するようにしても良い。
【0008】
【発明の作用及び効果】複数の原始文書に関して、複数
の原始文書を共通に構成している構成要素の階層的関係
をオブジェクト図として表す。このオブジェクト図を表
す文書構成情報が文書構成情報記憶手段に記憶される。
この文書構成情報に基づいて、原始文書の構文が解析さ
れ、文書を構成要素に分解するための構文解析規則が生
成される。又、文書構成情報に基づいて、構成要素間の
全体と部分との集約関係を規定した文書型定義と、構成
要素間のリンクを定義するリンク定義とが生成される。
次に、任意の原始文書に対して構造解析規則が適用され
て文書は構成要素に分解される。分解された構成要素に
対して文書型定義が適用されて構造化文書が生成され
る。生成された構造化文書に対して、文書型定義とリン
ク定義とが適用されて、自文書又は他文書の所定箇所を
参照できるリンク情報が挿入されたリンク付構造化文書
が生成される。
の原始文書を共通に構成している構成要素の階層的関係
をオブジェクト図として表す。このオブジェクト図を表
す文書構成情報が文書構成情報記憶手段に記憶される。
この文書構成情報に基づいて、原始文書の構文が解析さ
れ、文書を構成要素に分解するための構文解析規則が生
成される。又、文書構成情報に基づいて、構成要素間の
全体と部分との集約関係を規定した文書型定義と、構成
要素間のリンクを定義するリンク定義とが生成される。
次に、任意の原始文書に対して構造解析規則が適用され
て文書は構成要素に分解される。分解された構成要素に
対して文書型定義が適用されて構造化文書が生成され
る。生成された構造化文書に対して、文書型定義とリン
ク定義とが適用されて、自文書又は他文書の所定箇所を
参照できるリンク情報が挿入されたリンク付構造化文書
が生成される。
【0009】このような作用により、オブジェクト図を
与えるだけで、構造化文書とリンク付構造化文書が自動
生成される。又、原始文書の内容が更新されていれば、
この処理が再度、実行される。又、原始文書の構造様式
が変更されれば、それに基づいてオブジェクト図を変更
して、上記の処理を実行することで、容易に、リンク付
構造化文書を生成することができる。さらに、オブジェ
クト図を同一とする構造様式の原始文書であれば、類型
の異なる原始文書に対しても、そのオブジェクト図を用
いて同様にリンク付構造化文書を作成することができ
る。又、構造化文書を生成した後、リンク付文書を生成
するようにした場合には、リンク情報の変更やリンク付
をする文書中の位置の変更や追加を容易に行うことがで
きる。
与えるだけで、構造化文書とリンク付構造化文書が自動
生成される。又、原始文書の内容が更新されていれば、
この処理が再度、実行される。又、原始文書の構造様式
が変更されれば、それに基づいてオブジェクト図を変更
して、上記の処理を実行することで、容易に、リンク付
構造化文書を生成することができる。さらに、オブジェ
クト図を同一とする構造様式の原始文書であれば、類型
の異なる原始文書に対しても、そのオブジェクト図を用
いて同様にリンク付構造化文書を作成することができ
る。又、構造化文書を生成した後、リンク付文書を生成
するようにした場合には、リンク情報の変更やリンク付
をする文書中の位置の変更や追加を容易に行うことがで
きる。
【0010】
【発明の実施の形態】以下、本発明を実施例に基づいて
説明する。図4は、本実施例装置のハードウエアの構成
を示している。CPU50、固定ディスク51、53、
RAM52、本装置の処理プログラムを記憶したCDR
OM54等のコンピュータシステムで構成されている。
固定ディスク51には原始文書を記憶する原始文書メモ
リ510、固定ディスク53には、構造化文書を記憶す
る構造化文書メモリ530、リンク付構造化文書を記憶
するリンク付構造化文書メモリ531が設けられてい
る。又、RAM52には、文書構成情報を記憶する文書
構成情報メモリ521、構造定義を記憶する構造定義メ
モリ522、構造化文書を記憶する構造化文書メモリ5
23、リンク付構造化文書を記憶するリンク付構造化文
書メモリ524とが形成されている。
説明する。図4は、本実施例装置のハードウエアの構成
を示している。CPU50、固定ディスク51、53、
RAM52、本装置の処理プログラムを記憶したCDR
OM54等のコンピュータシステムで構成されている。
固定ディスク51には原始文書を記憶する原始文書メモ
リ510、固定ディスク53には、構造化文書を記憶す
る構造化文書メモリ530、リンク付構造化文書を記憶
するリンク付構造化文書メモリ531が設けられてい
る。又、RAM52には、文書構成情報を記憶する文書
構成情報メモリ521、構造定義を記憶する構造定義メ
モリ522、構造化文書を記憶する構造化文書メモリ5
23、リンク付構造化文書を記憶するリンク付構造化文
書メモリ524とが形成されている。
【0011】図1は、本実施例装置の全体のシステム構
成を示している。原始文書の記憶媒体である固定ディス
ク51に、ワードプロセッサ等により作成された多数の
原始文書1が格納されている。この原始文書1は、例え
ば、図2(a)に示すようなプログラム仕様書と、図2
(b)に示すように、その仕様書により作成されるプロ
グラムリスト等である。これらの多数で多種類のプログ
ラム仕様書とそれらに対応した多数、多種類のプログラ
ムリストが原始文書1として記憶されている。図2にお
いて、モジュール名、そのモジュール名に対応したプロ
グラムリスト毎に、1つの原始文書とする。
成を示している。原始文書の記憶媒体である固定ディス
ク51に、ワードプロセッサ等により作成された多数の
原始文書1が格納されている。この原始文書1は、例え
ば、図2(a)に示すようなプログラム仕様書と、図2
(b)に示すように、その仕様書により作成されるプロ
グラムリスト等である。これらの多数で多種類のプログ
ラム仕様書とそれらに対応した多数、多種類のプログラ
ムリストが原始文書1として記憶されている。図2にお
いて、モジュール名、そのモジュール名に対応したプロ
グラムリスト毎に、1つの原始文書とする。
【0012】多種類のプログラム仕様書及び多種類のプ
ログラムリストにおいて、共通する構成要素を抽出し、
構成要素間を階層的に示したオブジェクト図2が作成さ
れる。このオブジェクト図2は、人間が原始文書の構造
を解析することで行われる。オブジェクト図2は図3の
ように作成される。図3のプログラム仕様書とプログラ
ムリストは、総括名称として、ソフトウエア技術文書と
呼ぶことができるので、第1階層に「ソフトウエア技術
文書」という構成要素名が置かれる。次に、第2階層に
プログラム仕様書について「仕様書」、プログラムリス
トについて「ソースプログラム」という構成要素名が置
かれる。
ログラムリストにおいて、共通する構成要素を抽出し、
構成要素間を階層的に示したオブジェクト図2が作成さ
れる。このオブジェクト図2は、人間が原始文書の構造
を解析することで行われる。オブジェクト図2は図3の
ように作成される。図3のプログラム仕様書とプログラ
ムリストは、総括名称として、ソフトウエア技術文書と
呼ぶことができるので、第1階層に「ソフトウエア技術
文書」という構成要素名が置かれる。次に、第2階層に
プログラム仕様書について「仕様書」、プログラムリス
トについて「ソースプログラム」という構成要素名が置
かれる。
【0013】次に、仕様書について見ると、図2(a)
に表示された2つの原始文書において、「モジュール
名」が存在する。よって、この「モジュール名」を「仕
様項目」という構成要素名とし、図3のオブジェクト図
において、第3階層に「仕様項目」という構成要素名が
置かれる。又、その「仕様項目」には、「初期化」、
「車輪速度演算」等の識別名称が与えられているので、
その名称を「識別記号」という構成要素とし、図3にお
いて、「仕様項目」に結合して「識別記号」を設ける。
次に、仕様書には「車輪速度」、「車輪加速度」、「車
輪速度」等の変数の一覧が存在する。よって、これらの
記述に対して「変数一覧」という構成要素名を付け、図
3において、第4階層に「変数一覧」の構成要素名を配
置する。そして、この変数に対する処理内容が記述され
ているので、この記述に対して「処理の説明」という構
成要素名を付け、図3において、「変数一覧」と同一階
層の第4階層にその構成要素名を配置する。
に表示された2つの原始文書において、「モジュール
名」が存在する。よって、この「モジュール名」を「仕
様項目」という構成要素名とし、図3のオブジェクト図
において、第3階層に「仕様項目」という構成要素名が
置かれる。又、その「仕様項目」には、「初期化」、
「車輪速度演算」等の識別名称が与えられているので、
その名称を「識別記号」という構成要素とし、図3にお
いて、「仕様項目」に結合して「識別記号」を設ける。
次に、仕様書には「車輪速度」、「車輪加速度」、「車
輪速度」等の変数の一覧が存在する。よって、これらの
記述に対して「変数一覧」という構成要素名を付け、図
3において、第4階層に「変数一覧」の構成要素名を配
置する。そして、この変数に対する処理内容が記述され
ているので、この記述に対して「処理の説明」という構
成要素名を付け、図3において、「変数一覧」と同一階
層の第4階層にその構成要素名を配置する。
【0014】プログラムリストについても同様である。
即ち、「初期化」、「車輪速度演算」という識別記号
で、各プログラムモジュールが区分化されている。よっ
て、図3に示すように、第3階層に、「モジュール」と
いう構成要素名と「識別記号」という構成要素名が置か
れる。そして、プログラムには変数宣言文A1、B1
と、具体的な演算式A2、B2が与えられている。よっ
て、図3において、第4階層に「変数宣言」という構成
要素名と、「モジュール本体」という構成要素名とが配
置される。
即ち、「初期化」、「車輪速度演算」という識別記号
で、各プログラムモジュールが区分化されている。よっ
て、図3に示すように、第3階層に、「モジュール」と
いう構成要素名と「識別記号」という構成要素名が置か
れる。そして、プログラムには変数宣言文A1、B1
と、具体的な演算式A2、B2が与えられている。よっ
て、図3において、第4階層に「変数宣言」という構成
要素名と、「モジュール本体」という構成要素名とが配
置される。
【0015】このように、原始文書の構造を階層的に示
したのがオブジェクト図である。さらに、プログラム仕
様書とプログラムリストとの2つの原始文書は、モジュ
ール名により関連付けられている。よって、プログラム
仕様書の原始文書における「仕様項目」の「識別記号」
と、プログラムリストの原始文書における「モジュール
本体」の「識別記号」とが対応関係にあるので、図3に
示すように、「詳細化の関係」として線分Lで結合す
る。
したのがオブジェクト図である。さらに、プログラム仕
様書とプログラムリストとの2つの原始文書は、モジュ
ール名により関連付けられている。よって、プログラム
仕様書の原始文書における「仕様項目」の「識別記号」
と、プログラムリストの原始文書における「モジュール
本体」の「識別記号」とが対応関係にあるので、図3に
示すように、「詳細化の関係」として線分Lで結合す
る。
【0016】このように、原始文書を階層的に規定した
オブジェクト図2が得られ、そのオブジェクト図2の示
す階層及び結合関係を示した文書構成情報が得られる。
例えば、第1階層に「ソフトウエア技術文書」があり、
第2階層に「仕様書」と「ソースプログラム」があり、
それらは第1階層の「ソフトウエア技術文書」に結合し
ている。第3階層には、第2階層の「仕様書」に結合し
た「仕様項目」とそれを識別する「識別記号」と、第2
階層の「ソースプログラム」に結合した「モジュール」
とそれを識別する「識別記号」とがあり、それぞれの
「識別記号」が結合されている。第4階層には、第3階
層の「仕様項目」に結合する「変数一覧」と「処理の説
明」と、第3階層の「モジュール」に結合する「変数宣
言」と「モジュール本体」とがある等のコンピュータに
より処理可能なデータである文書構成情報が作成され
る。この文書構成情報がRAM52の文書構成情報メモ
リ521に記憶される。
オブジェクト図2が得られ、そのオブジェクト図2の示
す階層及び結合関係を示した文書構成情報が得られる。
例えば、第1階層に「ソフトウエア技術文書」があり、
第2階層に「仕様書」と「ソースプログラム」があり、
それらは第1階層の「ソフトウエア技術文書」に結合し
ている。第3階層には、第2階層の「仕様書」に結合し
た「仕様項目」とそれを識別する「識別記号」と、第2
階層の「ソースプログラム」に結合した「モジュール」
とそれを識別する「識別記号」とがあり、それぞれの
「識別記号」が結合されている。第4階層には、第3階
層の「仕様項目」に結合する「変数一覧」と「処理の説
明」と、第3階層の「モジュール」に結合する「変数宣
言」と「モジュール本体」とがある等のコンピュータに
より処理可能なデータである文書構成情報が作成され
る。この文書構成情報がRAM52の文書構成情報メモ
リ521に記憶される。
【0017】図9は、CPU50によるリンク付構造化
文書を生成する処理手順を示したフローチャートであ
る。ステップ100において、この文書構成情報に基づ
いて、原始文書1の構文を解析し、構成要素に分解する
ための構文解析規則4が生成される。プログラム仕様書
に対する構文解析規則は、図5(a)に示すようにな
る。文書構成情報を表した図3において、第2階層に構
成要素名の「仕様書」がある。この「仕様書」はその下
層に「仕様項目」がある。この「仕様項目」にあたる部
分を各原始文書から抽出するには、仕様項目、項目間区
切りパターンZ(図2)、仕様書を識別の対象として行
う(ルールR11)。その「仕様項目」の下層には、
「変数一覧」と「処理の説明」がある。よって、「仕様
項目」は、識別記号、項目内区切りパターンY、変数の
説明、項目内区切りパターンY、処理の説明の順序で現
れる(ルールR12)。このような構文解析規則4が生
成され、RAM52の構造定義メモリ522に記憶され
る。尚、構文解析規則4はさらに人間の判断により付加
又は修正されても良い。
文書を生成する処理手順を示したフローチャートであ
る。ステップ100において、この文書構成情報に基づ
いて、原始文書1の構文を解析し、構成要素に分解する
ための構文解析規則4が生成される。プログラム仕様書
に対する構文解析規則は、図5(a)に示すようにな
る。文書構成情報を表した図3において、第2階層に構
成要素名の「仕様書」がある。この「仕様書」はその下
層に「仕様項目」がある。この「仕様項目」にあたる部
分を各原始文書から抽出するには、仕様項目、項目間区
切りパターンZ(図2)、仕様書を識別の対象として行
う(ルールR11)。その「仕様項目」の下層には、
「変数一覧」と「処理の説明」がある。よって、「仕様
項目」は、識別記号、項目内区切りパターンY、変数の
説明、項目内区切りパターンY、処理の説明の順序で現
れる(ルールR12)。このような構文解析規則4が生
成され、RAM52の構造定義メモリ522に記憶され
る。尚、構文解析規則4はさらに人間の判断により付加
又は修正されても良い。
【0018】次に、ステップ102において、文書構成
情報に基づいて、図5(b)に示すような文書型定義5
が生成される。図3の第2階層は「仕様書」であるの
で、書類種名のDOCTYPE は仕様書となり(R21)、そ
の第3階層には「仕様項目」が配置されているので、そ
の「仕様書」のELEMENT は複数の仕様項目となる(R2
2)。そして、図3において、「仕様項目」に「変数一
覧」と「処理の説明」が結合しているので、「仕様項
目」のELEMENT は、変数一覧、処理の説明となる(R2
3)。さらに、「仕様項目」は、「識別記号」がデータ
で与えらている(R24)。このような文書型定義が生
成される。この文書型定義5は、構成要素間の全体と部
分との集約関係を定義したものである。この文書型定義
5はRAM52の構造定義メモリ522に記憶される。
情報に基づいて、図5(b)に示すような文書型定義5
が生成される。図3の第2階層は「仕様書」であるの
で、書類種名のDOCTYPE は仕様書となり(R21)、そ
の第3階層には「仕様項目」が配置されているので、そ
の「仕様書」のELEMENT は複数の仕様項目となる(R2
2)。そして、図3において、「仕様項目」に「変数一
覧」と「処理の説明」が結合しているので、「仕様項
目」のELEMENT は、変数一覧、処理の説明となる(R2
3)。さらに、「仕様項目」は、「識別記号」がデータ
で与えらている(R24)。このような文書型定義が生
成される。この文書型定義5は、構成要素間の全体と部
分との集約関係を定義したものである。この文書型定義
5はRAM52の構造定義メモリ522に記憶される。
【0019】次に、ステップ104で、文書構成情報に
基づいて、リンク定義6が生成される。このリンク定義
6は、図3のオブジェクト図に示されているように、文
書の構成要素間の結合関係を規定するものである。図3
の例では、プログラム仕様書の「仕様項目」の「識別記
号」とプログラムリストの「モジュール」の「識別記
号」とが結合されている。図5(c)に示すように、R
31でリンクの始点の構成要素、R32でリンクの終点
の構成要素が指定され、R33で結合条件として始点と
終点の「識別記号」同士を結合することが指定される。
このリンク定義6はRAM52の構造定義メモリ522
に記憶される。プログラムリストに関する原始文書につ
いても同様に、構文解析規則4、文書型定義5、リンク
定義6が生成される。これらは、文書構造定義と総称さ
れる。以上のステップ100、102、104が図1及
び請求項の文書構造定義生成手段3に相当する。
基づいて、リンク定義6が生成される。このリンク定義
6は、図3のオブジェクト図に示されているように、文
書の構成要素間の結合関係を規定するものである。図3
の例では、プログラム仕様書の「仕様項目」の「識別記
号」とプログラムリストの「モジュール」の「識別記
号」とが結合されている。図5(c)に示すように、R
31でリンクの始点の構成要素、R32でリンクの終点
の構成要素が指定され、R33で結合条件として始点と
終点の「識別記号」同士を結合することが指定される。
このリンク定義6はRAM52の構造定義メモリ522
に記憶される。プログラムリストに関する原始文書につ
いても同様に、構文解析規則4、文書型定義5、リンク
定義6が生成される。これらは、文書構造定義と総称さ
れる。以上のステップ100、102、104が図1及
び請求項の文書構造定義生成手段3に相当する。
【0020】次に、ステップ106において、RAM5
2の文書構造定義メモリ522に記憶された文書構造定
義のうち構文解析規則4と文書型定義5(図5)を用い
て、図2に示す原始文書1が解析され、図6に示す構造
化文書9が生成される。先ず、図2に示す原始文書は、
構文解析規則4に従って構成要素が抽出される。次に、
文書型定義5に従って統合され、構造化文書9が生成さ
れる。先ず、図2の原始文書1から図5のR11の規則
により、書類名として「仕様書」が、「仕様項目」の
「識別記号」として「初期化」が抽出される。これと、
文書型定義のR21、R22、R24の適用により、図
6の構造化文書の<仕様書>、<仕様項目識別記号=”
初期化”>が生成される(C1)。次に、構文解析規則
R12を適用して、変数として、「車輪速度」、「車輪
加速度」が抽出され、文書型定義R23を適用して、<
変数一覧>、車輪速度、車輪加速度、</変数一覧>が
生成される(C2)。次に、構文解析規則R12を適用
して、原始文書1から処理の説明の部分の文書が抽出さ
れ、文書型定義R23を適用して、<処理の説明>、す
べての変数に0を代入、</処理の説明>が生成される
(C3)。次に、構文解析規則R11と文書型定義R2
2の適用により、1つの仕様項目についての記述の終了
を示す</仕様項目>が生成される(C4)。
2の文書構造定義メモリ522に記憶された文書構造定
義のうち構文解析規則4と文書型定義5(図5)を用い
て、図2に示す原始文書1が解析され、図6に示す構造
化文書9が生成される。先ず、図2に示す原始文書は、
構文解析規則4に従って構成要素が抽出される。次に、
文書型定義5に従って統合され、構造化文書9が生成さ
れる。先ず、図2の原始文書1から図5のR11の規則
により、書類名として「仕様書」が、「仕様項目」の
「識別記号」として「初期化」が抽出される。これと、
文書型定義のR21、R22、R24の適用により、図
6の構造化文書の<仕様書>、<仕様項目識別記号=”
初期化”>が生成される(C1)。次に、構文解析規則
R12を適用して、変数として、「車輪速度」、「車輪
加速度」が抽出され、文書型定義R23を適用して、<
変数一覧>、車輪速度、車輪加速度、</変数一覧>が
生成される(C2)。次に、構文解析規則R12を適用
して、原始文書1から処理の説明の部分の文書が抽出さ
れ、文書型定義R23を適用して、<処理の説明>、す
べての変数に0を代入、</処理の説明>が生成される
(C3)。次に、構文解析規則R11と文書型定義R2
2の適用により、1つの仕様項目についての記述の終了
を示す</仕様項目>が生成される(C4)。
【0021】以下、原始文書1の「モジュール名:車輪
速度演算」の文書についての構造化文書9への変化が実
行される。図3のオブジェクト図から明白なように、こ
の文書は、前の文書の「モジュール名:初期化」と全く
同一の構造をしている。よって、全く同様に構文解析規
則と文書型定義が適用されて、構造化文書が生成される
(C5)。そして、構文解析規則R11と文書型定義R
21、R22の適用により、仕様書の最終を示す</仕
様書>が生成される(C6)。プログラムリストについ
ても同様に作成される。このようにして作成されたマー
クにより構造化された構造化文書9はRAM52の構造
化文書メモリ523に記憶されると共に、固定ディスク
53の構造化文書メモリ530にも出力される。ステッ
プ106の処理が図1及び請求項の文書構造化手段7に
対応する。
速度演算」の文書についての構造化文書9への変化が実
行される。図3のオブジェクト図から明白なように、こ
の文書は、前の文書の「モジュール名:初期化」と全く
同一の構造をしている。よって、全く同様に構文解析規
則と文書型定義が適用されて、構造化文書が生成される
(C5)。そして、構文解析規則R11と文書型定義R
21、R22の適用により、仕様書の最終を示す</仕
様書>が生成される(C6)。プログラムリストについ
ても同様に作成される。このようにして作成されたマー
クにより構造化された構造化文書9はRAM52の構造
化文書メモリ523に記憶されると共に、固定ディスク
53の構造化文書メモリ530にも出力される。ステッ
プ106の処理が図1及び請求項の文書構造化手段7に
対応する。
【0022】次に、ステップ108で、図5(c)のリ
ンク定義を構造化文書9に適用して、図7に示すような
リンク情報の挿入されたHTMLで表現されたリンク付
構造化文書13が生成される。リンク定義R31、R3
2により、仕様書の仕様項目、プログラムリストのモジ
ュールとがリンク付けられ、リンク定義R33によりそ
れらは識別記号でリンクされている。よって、図6の構
造化文書の<仕様項目識別記号=”初期化”>の行D1
がリンク始点となり、リンク終点はプログラムリストの
識別記号が「初期化」であるモジュールである。よっ
て、図7のリンク付構造化文書において、行E1で示す
リンク情報が挿入される。仕様項目「車輪速度演算」に
ついても、同様に、「車輪速度演算」が識別記号である
ので、図6の構造化文書の<仕様項目 識別記号=”車
輪速度演算”>の行D2がリンク始点となる。又、リン
ク終点はプログラムリストの識別記号が「車輪速度演
算」であるモジュールである。よって、図7のリンク付
構造化文書において、行E2で示すリンク情報が挿入さ
れる。
ンク定義を構造化文書9に適用して、図7に示すような
リンク情報の挿入されたHTMLで表現されたリンク付
構造化文書13が生成される。リンク定義R31、R3
2により、仕様書の仕様項目、プログラムリストのモジ
ュールとがリンク付けられ、リンク定義R33によりそ
れらは識別記号でリンクされている。よって、図6の構
造化文書の<仕様項目識別記号=”初期化”>の行D1
がリンク始点となり、リンク終点はプログラムリストの
識別記号が「初期化」であるモジュールである。よっ
て、図7のリンク付構造化文書において、行E1で示す
リンク情報が挿入される。仕様項目「車輪速度演算」に
ついても、同様に、「車輪速度演算」が識別記号である
ので、図6の構造化文書の<仕様項目 識別記号=”車
輪速度演算”>の行D2がリンク始点となる。又、リン
ク終点はプログラムリストの識別記号が「車輪速度演
算」であるモジュールである。よって、図7のリンク付
構造化文書において、行E2で示すリンク情報が挿入さ
れる。
【0023】このように生成されたリンク付構造化文書
13はRAM52のリンク付構造化文書メモリ524に
記憶されると共に、固定ディスク53のリンク付構造化
メモリ531に記憶される。このようなHTMLで表現
されたリンク付構造化文書をブラウザにより表示すれ
ば、図8に示すようになる。F1、F2の行にリンク情
報が挿入されている。よって、このF1行を選択すれ
ば、プログラムリストの初期化モジュールのプログラム
リストを表示させることができる。又、F2行を選択す
れば、プログラムリストの車輪速度演算モジュールのプ
ログラムリストを表示することができる。このステップ
108が図1及び請求項のリンク付構造化文書生成手段
11に対応する。
13はRAM52のリンク付構造化文書メモリ524に
記憶されると共に、固定ディスク53のリンク付構造化
メモリ531に記憶される。このようなHTMLで表現
されたリンク付構造化文書をブラウザにより表示すれ
ば、図8に示すようになる。F1、F2の行にリンク情
報が挿入されている。よって、このF1行を選択すれ
ば、プログラムリストの初期化モジュールのプログラム
リストを表示させることができる。又、F2行を選択す
れば、プログラムリストの車輪速度演算モジュールのプ
ログラムリストを表示することができる。このステップ
108が図1及び請求項のリンク付構造化文書生成手段
11に対応する。
【0024】尚、ステップ106、108の処理は一度
に行うことが可能であり、構造化文書を一旦生成するこ
となく、直接、リンク付構造化文書を生成するようにし
ても良い。又、図9の処理手順では、文書構造定義から
リンク付構造化文書の生成までを連続して行うようにし
ているが、プログラム仕様書やプログラムリスト等の原
始文書の作成と、構造化文書の生成までをあるグループ
Aで行い、リンク付構造化文書の生成は、構造化文書と
リンク定義とを記憶装置や通信線路により別のグループ
Bに送信して、そのグループBで行っても良い。又、プ
ログラムの修正の場合には、プログラムリストと共にプ
ログラム仕様書が修正される。このような場合には、原
始文書の版数情報を別に与え、リンク付構造化文書の版
数と比較し、原始文書が更新されている場合には、原始
文書から構造化文書を生成することから再度実施するよ
うにしても良い。
に行うことが可能であり、構造化文書を一旦生成するこ
となく、直接、リンク付構造化文書を生成するようにし
ても良い。又、図9の処理手順では、文書構造定義から
リンク付構造化文書の生成までを連続して行うようにし
ているが、プログラム仕様書やプログラムリスト等の原
始文書の作成と、構造化文書の生成までをあるグループ
Aで行い、リンク付構造化文書の生成は、構造化文書と
リンク定義とを記憶装置や通信線路により別のグループ
Bに送信して、そのグループBで行っても良い。又、プ
ログラムの修正の場合には、プログラムリストと共にプ
ログラム仕様書が修正される。このような場合には、原
始文書の版数情報を別に与え、リンク付構造化文書の版
数と比較し、原始文書が更新されている場合には、原始
文書から構造化文書を生成することから再度実施するよ
うにしても良い。
【0025】又、図10に示すように、通信回線を利用
してコンピュータ端末のHTML表示装置20からサー
バ21を呼び出し、リンク付構造化文書を受信する場合
がある。この場合には、リンク付構造化文書のデータベ
ースを作成しておく他、要求に応じて、サーバのCGI
22が起動して、原始文書からリンク付構造化文書を生
成して、HTML表示装置20に送信する方法がある。
この場合には、原始文書1が更新されていなければ、構
造化文書9のデータベースを用いて、リンク付構造化文
書生成手段11だけを起動して、リンク定義6を用いて
リンク付構造化文書を生成し、この文書をHTML表示
装置20に送信する。又、原始文書1が更新されていれ
ば、文書構造化手段7とリンク付構造化文書生成手段1
1とを起動して、原始文書1に構文解析規則4、文書型
定義5、リンク定義6を適用して、最初から、リンク付
構造化文書13を生成するようにしても良い。
してコンピュータ端末のHTML表示装置20からサー
バ21を呼び出し、リンク付構造化文書を受信する場合
がある。この場合には、リンク付構造化文書のデータベ
ースを作成しておく他、要求に応じて、サーバのCGI
22が起動して、原始文書からリンク付構造化文書を生
成して、HTML表示装置20に送信する方法がある。
この場合には、原始文書1が更新されていなければ、構
造化文書9のデータベースを用いて、リンク付構造化文
書生成手段11だけを起動して、リンク定義6を用いて
リンク付構造化文書を生成し、この文書をHTML表示
装置20に送信する。又、原始文書1が更新されていれ
ば、文書構造化手段7とリンク付構造化文書生成手段1
1とを起動して、原始文書1に構文解析規則4、文書型
定義5、リンク定義6を適用して、最初から、リンク付
構造化文書13を生成するようにしても良い。
【図面の簡単な説明】
【図1】本発明の具体的な実施例に係る文書変換装置の
システム構成を示した構成図。
システム構成を示した構成図。
【図2】原始文書の一例を示した説明図。
【図3】文書構成情報を示したオブジェクト図を示した
説明図。
説明図。
【図4】実施例装置の構成を示した構成図。
【図5】構文解析規則、文書型定義、リンク定義を示し
た説明図。
た説明図。
【図6】構造化文書の一例を示した説明図。
【図7】リンク付構造化文書の一例を示した説明図。
【図8】リンク付構造化文書の表示例を示した説明図。
【図9】実施例装置のCPUの処理手順を示したフロー
チャート。
チャート。
【図10】他の実施例装置のシステム構成を示した構成
図。
図。
【符号の説明】 1…原始文書 2…オブジェクト図 3…文書構造定義生成手段 4…構文解析規則 5…文書型定義 6…リンク定義 7…文書構造化手段 9…構造化文書 11…リンク付構造化文書生成手段 13…リンク付構造化文書 510…原始文書メモリ 521…文書構成情報メモリ 522…構造定義メモリ 523、530…構造化文書メモリ 524、531…リンク付構造化文書メモリ
Claims (1)
- 【請求項1】 マーク付のない原始文書を論理構造を示
すマークを付けた構造化文書に変換する文書変換装置に
おいて、 複数の原始文書を記憶する原始文書記憶手段と、 前記複数の原始文書を共通に構成している構成要素に関
して、構成要素間の関係を階層的に示したオブジェクト
図を表す文書構成情報を記憶する文書構成情報記憶手段
と、 前記文書構成情報記憶に記憶された前記文書構成情報に
基づいて、前記原始文書の構文を解析し文書の構成要素
に分解するための構文解析規則と、前記構成要素間の全
体と部分との集約関係を規定した文書型定義と、前記構
成要素間のリンクを定義するリンク定義とを生成する文
書構造定義生成手段と、 前記構文解析規則、前記文書型定義、前記リンク定義と
を記憶する構造定義記憶手段と、 任意の前記原始文書に対して前記構造解析規則を適用し
て文書を構成要素に分解し、分解された構成要素に対し
て前記文書型定義を適用して構造化文書を生成する文書
構造化手段と、 前記生成された前記構造化文書に対して、前記文書型定
義と前記リンク定義とを適用して、自文書又は他文書の
所定箇所を参照できるリンク情報が挿入されたリンク付
構造化文書を生成するリンク付構造化文書生成手段とか
ら成ることを特徴とする文書変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9273465A JPH1196161A (ja) | 1997-09-19 | 1997-09-19 | 文書変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9273465A JPH1196161A (ja) | 1997-09-19 | 1997-09-19 | 文書変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1196161A true JPH1196161A (ja) | 1999-04-09 |
Family
ID=17528310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9273465A Pending JPH1196161A (ja) | 1997-09-19 | 1997-09-19 | 文書変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1196161A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005096173A1 (ja) * | 2004-03-30 | 2005-10-13 | Victor Company Of Japan, Limited | 電子化サービスマニュアル生成方法、付加データ生成方法 |
JP2009527852A (ja) * | 2006-02-24 | 2009-07-30 | マイクロソフト コーポレーション | Ediスキーマをモデル化するためのxmlペイロード仕様 |
JP2009527851A (ja) * | 2006-02-24 | 2009-07-30 | マイクロソフト コーポレーション | Ediインスタンスベースのトランザクションセット定義 |
US8156148B2 (en) | 2006-02-24 | 2012-04-10 | Microsoft Corporation | Scalable algorithm for sharing EDI schemas |
JP2019040261A (ja) * | 2017-08-22 | 2019-03-14 | 大日本印刷株式会社 | 情報処理装置及びプログラム |
-
1997
- 1997-09-19 JP JP9273465A patent/JPH1196161A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005096173A1 (ja) * | 2004-03-30 | 2005-10-13 | Victor Company Of Japan, Limited | 電子化サービスマニュアル生成方法、付加データ生成方法 |
KR100889906B1 (ko) | 2004-03-30 | 2009-03-20 | 니혼 빅터 가부시키가이샤 | 전자화 서비스 매뉴얼 생성 방법, 부가 데이터 생성 방법, 전자화 서비스 매뉴얼 생성 장치, 부가 데이터 생성 장치, 전자화 서비스 매뉴얼 생성용 프로그램 및 부가 데이터 생성용 프로그램이 기록된 기록 매체 |
JP2009217831A (ja) * | 2004-03-30 | 2009-09-24 | Victor Co Of Japan Ltd | 付加データ生成方法、付加データ生成装置、付加データ生成用プログラム並びにこのプログラムが記録された記録媒体 |
JP2009527852A (ja) * | 2006-02-24 | 2009-07-30 | マイクロソフト コーポレーション | Ediスキーマをモデル化するためのxmlペイロード仕様 |
JP2009527851A (ja) * | 2006-02-24 | 2009-07-30 | マイクロソフト コーポレーション | Ediインスタンスベースのトランザクションセット定義 |
JP2011159302A (ja) * | 2006-02-24 | 2011-08-18 | Microsoft Corp | Ediスキーマをモデル化するためのxmlペイロード仕様 |
US8156148B2 (en) | 2006-02-24 | 2012-04-10 | Microsoft Corporation | Scalable algorithm for sharing EDI schemas |
JP2019040261A (ja) * | 2017-08-22 | 2019-03-14 | 大日本印刷株式会社 | 情報処理装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6502112B1 (en) | Method in a computing system for comparing XMI-based XML documents for identical contents | |
US6748569B1 (en) | XML server pages language | |
US7165073B2 (en) | Dynamic, hierarchical data exchange system | |
US7159185B1 (en) | Function objects | |
US7191397B2 (en) | XML server pages language | |
US6658624B1 (en) | Method and system for processing documents controlled by active documents with embedded instructions | |
US20020073119A1 (en) | Converting data having any of a plurality of markup formats and a tree structure | |
US20080196015A1 (en) | Formatting and viewing source objects | |
US6442576B1 (en) | Searching for documents with multiple element types | |
Eckstein et al. | XML pocket reference | |
US20020032706A1 (en) | Method and system for building internet-based applications | |
Benz et al. | XML programming bible | |
US20080222521A1 (en) | Viewing System that Supports Multiple Electronic Document Types | |
Langham et al. | Cocoon: building XML applications | |
US20020143815A1 (en) | Item, relation, attribute: the IRA object model | |
WO2000063783A1 (en) | Method and system for generating structured data from semi-structured data sources | |
AU2003225697A1 (en) | Dynamic generation of schema information for data description languages | |
EP1283993A2 (en) | Method and system for building internet-based applications | |
US6772395B1 (en) | Self-modifying data flow execution architecture | |
Jones et al. | Python & XML: XML Processing with Python | |
US20070094289A1 (en) | Dynamic, hierarchical data exchange system | |
US20060004887A1 (en) | Method and device for generating distributed java applications by means of a central xml configuration file | |
JPH1196161A (ja) | 文書変換装置 | |
EP2711838A1 (en) | Documentation parser | |
Hadlock | Ajax for Web Application Developers |