JP2000330989A - 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体 - Google Patents

構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP2000330989A
JP2000330989A JP11141174A JP14117499A JP2000330989A JP 2000330989 A JP2000330989 A JP 2000330989A JP 11141174 A JP11141174 A JP 11141174A JP 14117499 A JP14117499 A JP 14117499A JP 2000330989 A JP2000330989 A JP 2000330989A
Authority
JP
Japan
Prior art keywords
document
structured document
entity
sgml
declarations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11141174A
Other languages
English (en)
Inventor
Nariyuki Suehira
生志 末平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11141174A priority Critical patent/JP2000330989A/ja
Priority to US09/441,074 priority patent/US6922697B1/en
Publication of JP2000330989A publication Critical patent/JP2000330989A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 1つの文書型定義で複数種類の論理構造を定
義できるような工夫を施すことにより、複数種類の論理
構造の構造化文書を容易に作成かつ管理することができ
るようにする。 【解決手段】 文書型定義20に、複数種類の論理構造
をそれぞれ定義する複数の要素宣言EL1〜ELnと、
複数種類の論理構造をそれぞれ指定するための複数の実
体宣言EN1〜ENnとを予め列記しておき、複数の実
体宣言EN1〜ENnのうちのいずれか一つを有効化す
ることにより、複数の要素宣言EL1〜ELnのうちの
一つを有効化し、有効化された要素宣言によって定義さ
れる論理構造で構造化文書100を作成する。

Description

【発明の詳細な説明】
(目次) 発明の属する技術分野 従来の技術(図6,図7) 発明が解決しようとする課題 課題を解決するための手段 発明の実施の形態(図1〜図5) 発明の効果
【0001】
【発明の属する技術分野】本発明は、所定の文書型定義
に従った構造化文書〔例えばSGML(StandardGenera
llized Markup Language )文書〕を作成する方法、お
よび、その構造化文書を記録したコンピュータ読取可能
な記録媒体に関する。
【0002】
【従来の技術】一般に、構造化文書としては、文書デー
タからレイアウト情報等を除外して、テキスト形式で文
書内容を表現するSGML(Standard Generallized Ma
rkup Language )文書が知られている。かかるSGML
文書は、文書の構造を識別するためのタグと呼ばれる記
号(マーク)を付すことにより文書の論理的な構造を規
定でき、文書の保存/検索や交換のための標準的な言語
として普及しつつある。
【0003】このSGML文書は、文書に使われる文字
コードの種類等の各基準を記述するSGML宣言と、文
書要素の相互関係すなわち文書構造を規定するDTD
(Document Type Definition)と、文書内容を示す文書
インスタンスとからなる。DTDは、文書の要素(見出
し,本文,リスト等)に張り付けるタグを定義するもの
であり、具体的には、文書の要素,要素の間の包含関
係,要素を並べる順序や要素の出現回数等を定義する要
素宣言や、要素の属性を定義する属性宣言、特殊文字や
絵等を文書に取り込む方法を宣言する実体宣言等をそな
えて構成されている。そして、DTDでは、タグの親子
関係,出現順序,出現回数等を木構造で定義することが
できるようになっている。
【0004】さて、SGML文書を作成する際には、ま
ず最初にSGML文書の文書構造すなわちDTDを作成
又は取得し、このDTDに適合する文書インスタンスを
作成する。また、上述したSGML文書の作成におい
て、異なる論理構造を有するSGML文書を作成する場
合には、論理構造毎に、その論理構造に応じたDTDを
作成又は取得して用いる。
【0005】ここで、論理構造の例として、表形式レイ
アウトと階層構造形式レイアウトとのそれぞれの場合に
おける各DTD(要素宣言)の記述例を図示すると、図
6は表形式レイアウトの論理構造を定義するDTDにお
ける要素宣言の記述例を示し、図7は階層構造形式レイ
アウトの論理構造を定義するDTDにおける要素宣言の
記述例を示すものである。
【0006】図6に示すようなDTDによって定義され
る表形式レイアウトのSGML文書は、表の作成・表示
に適しており、例えば、SGML文書入力時におけるテ
ンプレートとして表を提示させ、作成者がこのテンプレ
ートに従って各セル中に内容を記述することにより表を
作成したり、又、表をディスプレイに表示したり印刷し
たりする用途に適している。
【0007】一方、図7に示すようなDTDによって定
義される階層構造形式レイアウトのSGML文書は、例
えば、作成した文書をSGMLデータベースに登録し、
このデータベース中から所望の情報を検索する用途に適
している。そして、これらの表形式レイアウトの論理構
造を定義するDTDと階層構造形式レイアウトの論理構
造を定義するDTDとは、図6および図7に示すよう
に、互いに異なる構成を有しており、作成者は、SGM
L文書の使用用途に応じた論理構造を定義するDTDを
用いてSGML文書を作成するのである。つまり、論理
構造の種類に応じたDTDを作成又は取得し、そのDT
DによりSGML文書を作成している。
【0008】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の構造化文書作成方法においては、一の文書を
SGML文書として異なる用途に用いる場合には、その
用途に応じた論理構造を定義するDTDを作成又は取得
し、更に、そのDTDを用いたSGML文書を作成しな
ければならないので、その作業が煩雑で作成者の負担が
大きいという課題がある。
【0009】例えば、一の文書の内容を表として表示・
印刷するほかSGMLデータベースに登録して利用する
場合には、表形式レイアウトの論理構造を定義するDT
Dと、階層構造形式レイアウトの論理構造を定義するD
TDとをそれぞれ作成し、論理構造の種類毎に、その種
類に応じたDTDを有するSGML文書を作成しなけれ
ばならない。つまり、文書内部は同じであるがDTDの
異なるSGML文書を、論理構造の種類の数(ここでは
2)だけ作成しなければならないのである。
【0010】また、作成したSGML文書の使用に伴っ
て、使用の便宜を図るために新たに文書要素(タグ)を
追加する等、DTDに編集を施す必要が生ずる場合もあ
るが、論理構造毎に作成された複数のSGML文書に、
新たに文書要素(タグ)を追加する場合等には、SGM
L文書の管理上、各SGML文書の内容を統一するため
に各SGML文書のDTDに漏れなく編集(新たな要素
の追加)を行なう必要がある。しかし、複数のSGML
文書のDTDに対し前記編集を施すにあたり、SGML
文書の作成者は、編集漏れが生じないように注意しなけ
ればならず、その作成者に対する管理負担が大きいとい
う課題もある。
【0011】本発明は、このような課題に鑑み創案され
たもので、1つの文書型定義で複数種類の論理構造を定
義できるような工夫を施すことにより、複数種類の論理
構造の構造化文書を容易に作成かつ管理することができ
るようにした、構造化文書作成方法および構造化文書を
記録したコンピュータ読取可能な記録媒体を提供するこ
とを目的とする。
【0012】
【課題を解決するための手段】このため、本発明の構造
化文書作成方法は、所定の文書型定義に従った構造化文
書を作成する構造化文書作成方法であって、文書型定義
に、複数種類の論理構造をそれぞれ定義する複数の要素
宣言と、複数種類の論理構造をそれぞれ指定するための
複数の実体宣言とを予め列記しておき、複数の実体宣言
のうちのいずれか一つを有効化することにより、複数の
要素宣言のうちの一つを有効化し、有効化されたこの要
素宣言によって定義される論理構造で構造化文書を作成
することを特徴としている(請求項1)。このとき、複
数の実体宣言のそれぞれに、その実体宣言が有効である
か無効であるかを指示する制御情報を付加・記述しても
よい(請求項2)。
【0013】また、本発明の構造化文書を記録したコン
ピュータ読取可能な記録媒体は、所定の文書型定義に従
って作成された構造化文書を記録したコンピュータ読取
可能な記録媒体であって、構造化文書は、記録媒体に形
成されるデータファイルに記録され、このデータファイ
ルが、少なくとも、文書型定義を記録した領域と、文書
内容を記録した領域とを有し、文書型定義を記録した領
域において、複数種類の論理構造をそれぞれ定義する複
数の要素宣言と、複数種類の論理構造をそれぞれ指定す
るための複数の実体宣言とが列記されるとともに、複数
の実体宣言のそれぞれに、その実体宣言が有効であるか
無効であるかを指示する制御情報が付加・記述されてい
ることを特徴としている(請求項5)。
【0014】なお、複数種類の論理構造として、階層構
造形式レイアウトおよび表形式レイアウトを含んでもよ
い(請求項3,請求項6)。また、構造化文書が、SG
ML(Standard Generallized Markup Language) 文書で
あり、文書型定義が、SGML文書における文書構造を
規定するDTD(Document Type Definition)であっても
よい(請求項4,請求項7)。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明の一実施形態として
の構造化文書作成方法により作成されたSGML文書
(構造化文書)の構成を示す図、図2は本発明を適用さ
れるシステム(コンピュータシステム10)の構成を示
すブロック図である。
【0016】コンピュータシステム10は、図2に示す
ように、CPU11,ハードディスク12,メモリ1
3,インターフェース14,キーボード15,マウス1
6,ディスプレイ17およびバス18をそなえて構成さ
れており、構造化文書であるSGML(Standard Gener
allized Markup Language )文書を作成するためのもの
である。
【0017】メモリ13は、CPU11が種々の演算処
理を行なう際に、データ等の展開等に用いる領域であ
り、RAM(Random Access Memory) 等により構成され
ている。インターフェース14は、コンピュータシステ
ム10と外部との間でデータ授受を可能にするものであ
り、例えば、通信ポート等により構成されている。
【0018】キーボード15やマウス16は、SGML
文書の作成者が、文書や種々の指示等を入力したり選択
等を行なったりするための入力手段であり、又、ディス
プレイ17は、CPU11による演算処理の結果や、作
成中のSGML文書等を表示するものである。CPU1
1は、キーボード15やマウス16から入力された指示
に従って、ハードディスク12に格納されたデータやメ
モリ13を用いて各種演算処理やSGML文書の作成処
理を行なうほか、インターフェース14およびディスプ
レイ150等を制御するものである。
【0019】ハードディスク(磁気ディスク装置)12
は種々のデータ等を格納するものであり、このハードデ
ィスク12に形成された所定の領域であるデータファイ
ル1に、後述するごとく作成したSGML文書100
(図1参照)が記録される。つまり、本実施形態では、
ハードディスク12が、SGML文書100を記録した
コンピュータ読取可能な記録媒体となっている。
【0020】なお、図1に示すごとく作成されるSGM
L文書100は、ハードディスク12以外に、フレキシ
ブルディスク,CD−ROM,光ディスク,光磁気ディ
スク,磁気テープなどの各種記録媒体にも、本実施形態
と同様に記録されて、搬送されたり保存されたりする。
ところで、SGML文書100は、所定のDTD(Docu
ment Type Definition;文書型定義)に従って作成され
る構造化文書であり、例えば、図1に示すように、ハー
ドディスク12に形成されたデータファイル1に記録さ
れ、SGML宣言(図示せず),DTD20および文書
インスタンス(文書内容)30をそなえて構成されてい
る。すなわち、データファイル1は、DTD20を記録
した領域と文書インスタンス30を記録した領域とを、
少なくとも有している。
【0021】ここで、SGML宣言は、文書に使用され
る文字コードの種類や、終了タグが省略可能であるか否
か等の各基準を記述するものであり、文書インスタンス
30は、文書内容を示すものである。DTD20は、文
書の構造を規定するものであり、文書構造要素を任意に
意味付けして規定するものであって、各文書構造要素の
出現順序,各文書構造要素間の階層関係,各文書構造要
素の繰り返し回数等を記述するものである。そして、D
TD20は、文書を構成する要素(element )とその相
互関係,すなわち階層関係と参照関係とを要素宣言(E
LEMENT文)や実体宣言(ENTITY文)を使っ
て定義する。
【0022】具体的には、DTD20は、どのような文
書型定義を使用しているかを宣言する文書型宣言(後
述),SGML文書の論理構造を定義する要素宣言EL
1〜ELnおよび論理構造を指定するための実体宣言E
N1〜ENnをそなえて構成されている。さらに、DT
D20には、本実施形態中には図示しないが、タグの短
縮や省略の仕方を示す最小化に関する情報や、要素の属
性を定義する属性宣言(ATTLIST文)、データに
対する処理を定義する記法宣言、SGMLの処理システ
ムへの指示であるマーク、注釈等が記述されるようにな
っている。
【0023】そして、本方法により作成されるSGML
文書のDTD20においては、図1に示すように、複数
種類(ここではn種類;nは2以上の自然数)の論理構
造をそれぞれ定義するn個の要素宣言EL1〜ELn
と、前記複数種類の論理構造をそれぞれ指定するための
n個の実体宣言EN1〜ENnとが列記されており、更
に、これらの実体宣言EN1〜ENnのそれぞれに、そ
の実体宣言EN1〜ENnが有効であるか無効であるか
を指示する制御情報Ii(i=1,2,…n)が付加・
記述されている。
【0024】図3は本実施形態の構造化文書作成方法に
より作成されたDTD20の記述例を示す図、図4は本
実施形態のSGML文書における文書型宣言の記述例を
示す図である。以下、これらの図3および図4を用いて
本実施形態におけるDTD20の具体例について説明す
る。また、ここでは、論理構造として、階層構造形式レ
イアウトと表形式レイアウトとの2種類があり、これら
2種類の論理構造でSGML文書を作成する必要がある
場合について説明する。
【0025】図3に示すように、DTD20において、
実体宣言EN1aおよびEN2aはそれぞれ互いに異な
る論理構造を指定するための実体宣言(ENTITY
文)であり、具体的には、実体宣言EN1aは実体名
「hierarchy 」を宣言するものであり、実体宣言EN2
aは実体名「table 」を宣言するものである。また、実
体宣言EN1a,EN2aには、それぞれ制御情報I1
a,I2aとして、“INCLUDE"および"IGNORE"のうちい
ずれか一方が記述されるようになっている。
【0026】そして、図3中に示す実体宣言EN1aの
制御情報I1aには“INCLUDE"が記述されており、実体
宣言EN1aは、実体名「hierarchy 」を宣言するとと
もに、“INCLUDE"という制御情報I1aによって、実体
名「hierarchy 」により宣言される実体(要素宣言EL
2a)が有効である旨を宣言(有効化)している。ま
た、実体宣言EN2aの制御情報I2aには"IGNORE"が
記述されており、実体宣言EN2aは、実体名「table
」を宣言するとともに、"IGNORE"という制御情報I1
02によって、実体名「table 」により宣言される実体
(要素宣言EL1a)が無効である旨を宣言(無効化)
している。
【0027】要素宣言EL1aは、実体名「table 」に
より宣言される実体を定義するもの(ELEMENT
文)であり、具体的には、実体名「table 」で宣言され
る実体が表形式レイアウトの論理構造となるように定義
するものである。また、要素宣言EL2aは、実体名
「hierarchy 」により宣言される実体を定義するもの
(ELEMENT文)であり、具体的には、実体名「hi
erarchy 」で宣言される実体が階層構造形式レイアウト
の論理構造となるように定義するものである。
【0028】図5は本実施形態のSGML文書において
論理構造を表形式レイアウトにするための実体宣言EN
1aおよびEN2aの記述例を示す図であるが、この図
5に示す実体宣言EN1aおよびEN2aにおいては、
実体宣言EN1aの制御情報I1aに"IGNORE"が記述さ
れており、これにより、実体名「hierarchy 」により宣
言される実体(要素宣言EL2a;図3参照)が無効化
されるようになっている。又、実体宣言EN2aの制御
情報I2aに“INCLUDE"が記述されており、これによ
り、実体名「table 」により宣言される実体(要素宣言
EL1a;図3参照)が有効化されるようになってい
る。
【0029】すなわち、図3中における実体宣言EN1
aおよびEN2aの制御情報I1a,I2aをそれぞれ
図5に示すように書き替えることにより、SGML文書
の論理構造を表形式レイアウトにすることができるので
ある。このような制御情報の書替に際しては、例えば、
図4に示すような文書型宣言が用いられる。
【0030】図4に示す文書型宣言40は、図3に示す
実体宣言EN1a,EN2aと同様の実体宣言EN1
a,EN2aをそなえており、更に、これらの実体宣言
EN1a,EN2aには、それぞれ制御情報I1a,I
2aを付加・記述されている。そして、この図4に示す
文書型宣言40をSGML文書の文書型宣言として用い
るとともに、これらの制御情報I1a,I2aのうちの
一方(図4中では制御情報I1a)に“INCLUDE"を記述
するとともに、他方(図4中では制御情報I2a)に"I
GNORE"を記述することにより、実体名「hierarchy 」に
より宣言される実体と実体名「table 」により宣言され
る実体とのうち、その一方を有効化することができる。
【0031】上述の構成により、作成者は、ディスプレ
イ17の表示を見ながら、キーボード15やマウス16
を用いて、そのDTD20において、図3に示すよう
に、表形式レイアウトの論理構造を定義する要素宣言E
L1aおよび階層構造形式レイアウトの論理構造を定義
する要素宣言EL2aとともに、これらの要素宣言EL
1a,EL2aをそれぞれ指定するための実体宣言EN
1a,EN2aを列記する。
【0032】そして、これらの実体宣言EN1a,EN
2aのうちの一方の制御情報I1a(I2a)に“INCL
UDE"を設定するとともに、他方の制御情報I2a(I1
a)に"IGNORE"を設定する。例えば、図3に示すよう
に、実体宣言EN1aの制御情報I1aに“INCLUDE"を
設定するとともに実体宣言EN2aの制御情報I2a
に"IGNORE"を設定することにより、SGML文書100
の論理構造を階層構造形式レイアウトにする。
【0033】また、作成者は、図3中における実体宣言
EN1aおよびEN2aの制御情報I1aおよびI2a
を図5に示すように書き替えることにより、SGML文
書100の論理構造を表形式レイアウトにする。このよ
うに、本発明の一実施形態としての構造化文書作成方法
によれば、DTD20に、表形式レイアウトの論理構造
を定義する要素宣言EL1aおよび階層構造形式レイア
ウトの論理構造を定義する要素宣言EL2aとともに、
これらの要素宣言EL1a,EL2aをそれぞれ指定す
るための実体宣言EN1a,EN2aを列記し、更に、
これらの実体宣言EN1a,EN2aのうち一方の制御
情報I1a(I2a)に“INCLUDE"を設定するととも
に、他方の制御情報I2a(I1a)に"IGNORE"を設定
することにより、階層構造形式レイアウトおよび表形式
レイアウトのうち、いずれか一方の論理構造を有するS
GML文書を容易に作成することができるので、表とし
て表示・印刷するほかデータベースに登録して利用する
場合等において作業性を向上させることができる利点が
あるほか、これらの2種類の論理構造のうちから所望の
論理構造を選択的に決定して、この論理構造を有するS
GML文書100を容易に作成することができ、かかる
SGML文書を容易に作成かつ管理することができるの
で、作業効率を向上させることができる利点がある。
【0034】また、複数の論理構造、例えば、階層構造
形式レイアウトの論理構造を有するSGML文書100
と、表形式レイアウトの論理構造を有するSGML文書
100とで共通のDTD20を用いることができるの
で、使用の便宜を図るために新たな文書要素(タグ)を
追加する等、DTD20を編集する場合においても1つ
のDTD20のみを編集すればよく、一部のSGML文
書のDTDにおける編集漏れの発生を無くすことがで
き、SGML文書の信頼性や品質を向上させることがで
きるほか、作成者等の管理負担を軽減することができ
る。
【0035】なお、本発明は上述した実施形態に限定さ
れるものではなく、本発明の趣旨を逸脱しない範囲で種
々変形して実施することができる。例えば、上記実施形
態では、複数種類の論理構造として階層構造形式レイア
ウトおよび表形式レイアウトの場合について説明してい
るが、本発明は、これに限定されるものではなく、種々
の論理構造で同じ内容のSGML文書(構造化文書)を
作成する必要がある場合に、上記実施形態と同様に適用
され、上記実施形態の作用効果を得ることができる。
【0036】また、上記実施形態では、構造化文書がS
GML文書である場合について説明したが、本発明は、
これに限定されるものではなく、他の構造化文書、例え
ばXML(Extended Markup Language)にも上記実施形
態と同様に適用され、上記実施形態と同様の作用効果を
得ることができる。
【0037】
【発明の効果】以上詳述したように、本発明の構造化文
書作成方法および構造化文書を記録したコンピュータ読
取可能な記録媒体によれば、文書型定義に、複数種類の
論理構造をそれぞれ定義する複数の要素宣言と、複数種
類の論理構造をそれぞれ指定するための複数の実体宣言
とを予め列記しておき、複数の実体宣言のうちのいずれ
か一つを有効化することにより、複数の要素宣言のうち
の一つを有効化し、この有効化された要素宣言によって
定義される論理構造で構造化文書を作成するので、互い
に異なる論理構造を有する複数の構造化文書間において
文書型定義を共有することができ、これにより、文書型
定義を編集する場合等において、一部の構造化文書の文
書型定義における編集漏れの発生を無くすことができ、
構造化文書の信頼性や品質を向上させることができるほ
か、複数の論理構造のうちから所望の論理構造を選択的
に決定することにより、かかる構造化文書を容易に作成
かつ管理することができるので、作業効率を向上させる
ことができる利点がある(請求項1,請求項5)。
【0038】なお、複数の実体宣言のそれぞれに、その
実体宣言が有効であるか無効であるかを指示する制御情
報を付加・記述してもよく、これにより、複数の論理構
造中から容易に所望の論理構造を選択して構造化文書を
作成することができ、作業効率を向上させることができ
る利点がある(請求項2,請求項5)。また、複数種類
の論理構造として、階層構造形式レイアウトおよび表形
式レイアウトを含んでもよく、これにより、階層構造形
式レイアウトおよび表形式レイアウトのうち、いずれか
一方の論理構造を有する構造化文書文書を容易に作成す
ることができるので、表として表示・印刷するほかデー
タベースに登録して利用する場合等において作業性を向
上させることができる利点がある(請求項3,請求項
6)。
【0039】さらに、構造化文書が、SGML文書であ
り、文書型定義が、SGML文書における文書構造を規
定するDTDであってもよく、これにより、SGML文
書におけるDTDを編集する場合等において、一部のS
GML文書のDTDにおける編集漏れの発生を無くすこ
とができ、SGML文書の信頼性や品質を向上させるこ
とができる利点があり、又、複数の論理構造中から、容
易に所望の論理構造でSGML文書を作成することがで
きるので、作業効率を向上させることができる利点があ
る(請求項4,請求項7)。
【図面の簡単な説明】
【図1】本発明の一実施形態としての構造化文書作成方
法により作成されたSGML文書の構成を示す図であ
る。
【図2】本発明を適用されるシステム(コンピュータシ
ステム)の構成を示すブロック図である。
【図3】本実施形態の構造化文書作成方法により作成さ
れたDTDの記述例を示す図である。
【図4】本実施形態のSGML文書における文書型宣言
の記述例を示す図である。
【図5】本実施形態のSGML文書において論理構造を
表形式レイアウトにするための実体宣言の記述例を示す
図である。
【図6】一般的な表形式レイアウトの論理構造を定義す
るDTDの記述例を示す図である。
【図7】一般的な階層構造形式レイアウトの論理構造を
定義するDTDの記述例を示す図である。
【符号の説明】
1 データファイル 10 コンピュータシステム 11 CPU 12 ハードディスク(記録媒体) 13 メモリ 14 インターフェース 15 キーボード 16 マウス 17 ディスプレイ 18 バス 20 DTD(文書型定義) 30 文書インスタンス 40 文書型宣言 EN1〜ENn,EN1a,EN2a 実体宣言 EL1〜ELn,EL1a,EL2a 要素宣言 I1〜In,I1a,I2a 制御情報 100 SGML文書(構造化文書)

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 所定の文書型定義に従った構造化文書を
    作成する構造化文書作成方法であって、 該文書型定義に、複数種類の論理構造をそれぞれ定義す
    る複数の要素宣言と、該複数種類の論理構造をそれぞれ
    指定するための複数の実体宣言とを予め列記しておき、 該複数の実体宣言のうちのいずれか一つを有効化するこ
    とにより、該複数の要素宣言のうちの一つを有効化し、 有効化された該要素宣言によって定義される論理構造で
    該構造化文書を作成することを特徴とする、構造化文書
    作成方法。
  2. 【請求項2】 該複数の実体宣言のそれぞれに、その実
    体宣言が有効であるか無効であるかを指示する制御情報
    を付加・記述することを特徴とする、請求項1記載の構
    造化文書作成方法。
  3. 【請求項3】 該複数種類の論理構造として、階層構造
    形式レイアウトおよび表形式レイアウトを含むことを特
    徴とする、請求項1または請求項2に記載の構造化文書
    作成方法。
  4. 【請求項4】 該構造化文書が、SGML(Standard Ge
    nerallized MarkupLanguage) 文書であり、該文書型定
    義が、該SGML文書における文書構造を規定するDT
    D(Document Type Definition)であることを特徴とす
    る、請求項1〜請求項3のいずれか1項に記載の構造化
    文書作成方法。
  5. 【請求項5】 所定の文書型定義に従って作成された構
    造化文書を記録したコンピュータ読取可能な記録媒体で
    あって、 該構造化文書は、該記録媒体に形成されるデータファイ
    ルに記録され、 該データファイルが、少なくとも、該文書型定義を記録
    した領域と、文書内容を記録した領域とを有し、 該文書型定義を記録した領域において、複数種類の論理
    構造をそれぞれ定義する複数の要素宣言と、該複数種類
    の論理構造をそれぞれ指定するための複数の実体宣言と
    が列記されるとともに、 該複数の実体宣言のそれぞれに、その実体宣言が有効で
    あるか無効であるかを指示する制御情報が付加・記述さ
    れていることを特徴とする、構造化文書を記録したコン
    ピュータ読取可能な記録媒体。
  6. 【請求項6】 該複数種類の論理構造として、階層構造
    形式レイアウトおよび表形式レイアウトを含むことを特
    徴とする、請求項5記載の構造化文書を記録したコンピ
    ュータ読取可能な記録媒体。
  7. 【請求項7】 該構造化文書が、SGML(Standard Ge
    nerallized MarkupLanguage) 文書であり、該文書型定
    義が、該SGML文書における文書構造を規定するDT
    D(Document Type Definition)であることを特徴とす
    る、請求項5または請求項6記載の構造化文書を記録し
    たコンピュータ読取可能な記録媒体。
JP11141174A 1999-05-21 1999-05-21 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体 Pending JP2000330989A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11141174A JP2000330989A (ja) 1999-05-21 1999-05-21 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体
US09/441,074 US6922697B1 (en) 1999-05-21 1999-11-16 Structured document preparation method and computer-readable recording medium on which a structured document is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11141174A JP2000330989A (ja) 1999-05-21 1999-05-21 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000330989A true JP2000330989A (ja) 2000-11-30

Family

ID=15285873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11141174A Pending JP2000330989A (ja) 1999-05-21 1999-05-21 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体

Country Status (2)

Country Link
US (1) US6922697B1 (ja)
JP (1) JP2000330989A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000322303A (ja) * 1999-05-10 2000-11-24 Fujitsu Ltd 統合ドキュメント管理システムおよびそれに用いられるドキュメント引出装置、ならびにドキュメント引出プログラムを記録したコンピュータ読み取り可能な記録媒体
US7281204B1 (en) * 1999-11-23 2007-10-09 Fujitsu Limited Hub document preparation method
US7069503B2 (en) * 2001-06-04 2006-06-27 Murata Kikai Kabushiki Kaisha Device and program for structured document generation data structure of structural document
US20040064789A1 (en) * 2002-07-10 2004-04-01 Csg Systems, Inc. System and method for generating invoices using a markup language
JP3815567B2 (ja) * 2003-03-31 2006-08-30 日本電気株式会社 コンピュータシステム、コンピュータプログラム、コンピュータ間の通信方法、構造化文書の符号化方法、符号化された構造化文書の復号方法
JP4676136B2 (ja) * 2003-05-19 2011-04-27 株式会社日立製作所 文書構造検査方法および装置
US8121946B1 (en) 2006-08-01 2012-02-21 United Services Automobile Association System and method for modular electronic signature block
US8861856B2 (en) 2007-09-28 2014-10-14 Abbyy Development Llc Model-based methods of document logical structure recognition in OCR systems
US8452132B2 (en) * 2008-09-23 2013-05-28 Abbyy Software Ltd. Automatic file name generation in OCR systems
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems
US9413912B2 (en) 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5655130A (en) * 1994-10-14 1997-08-05 Unisys Corporation Method and apparatus for document production using a common document database
JPH0969101A (ja) * 1995-08-31 1997-03-11 Hitachi Ltd 構造化文書生成方法および装置
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
JPH10116275A (ja) 1996-10-11 1998-05-06 Fuji Xerox Co Ltd 文書スタイル編集装置
WO1998037655A1 (en) * 1996-12-20 1998-08-27 Financial Services Technology Consortium Method and system for processing electronic documents
JPH10187726A (ja) 1996-12-27 1998-07-21 Canon Inc 構造化文書編集システム
US6012098A (en) * 1998-02-23 2000-01-04 International Business Machines Corp. Servlet pairing for isolation of the retrieval and rendering of data
JPH11296541A (ja) * 1998-04-14 1999-10-29 Fujitsu Ltd 構造化データ管理システム及び構造化データ管理プログラムを記録したコンピュータ読み取り可能な記録媒体
FI116851B (fi) * 2001-05-03 2006-03-15 Fit Biotech Oyj Plc Ilmentämisvektori, sen käyttöjä ja menetelmä sen valmistamiseksi sekä sitä sisältäviä tuotteita

Also Published As

Publication number Publication date
US6922697B1 (en) 2005-07-26

Similar Documents

Publication Publication Date Title
CA2533568C (en) Data store for software application documents
US7409634B2 (en) Method and apparatus for end-to-end content publishing system using XML with an object dependency graph
US7617234B2 (en) XML schema for binding data
US20100199167A1 (en) Document processing apparatus
US20040041818A1 (en) Design system for website text graphics
US20060150085A1 (en) Data binding in a word-processing application
US20060195783A1 (en) Programmability for binding data
US20090019064A1 (en) Document processing device and document processing method
US20100115394A1 (en) Document processing device and document processing method
US20080288861A1 (en) Generating a word-processing document from database content
US20070258100A1 (en) Document Processing Device and Document Processing Method
US20070061349A1 (en) Hierarchically describing shapes
US20080256092A1 (en) Data Processing Device and Data Processing Method
JP2000330989A (ja) 構造化文書作成方法および構造化文書を記録したコンピュータ読取可能な記録媒体
US20080250311A1 (en) Document Processing Device, and Document Processing Method
US7802181B2 (en) Document processing device and document processing method
JPWO2006051712A1 (ja) 文書処理装置及び文書処理方法
US20090235156A1 (en) Document processing device and document processing method
US20080005136A1 (en) Data Processing Device, Document Processing Device, and Document Processing Method
US20100077295A1 (en) Document processing device and document processing module
US20100115395A1 (en) Data processing apparatus
JPWO2006051714A1 (ja) 文書処理装置及び文書処理方法
US8423518B2 (en) Representation of multiple markup language files in one file for the production of new markup language files
US20080005154A1 (en) Document Processing Device and Document Processing Method
AU2020200471A1 (en) Web Application Builder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060426

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060518

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20061208