JPH0756920A - 構造化文書処理装置 - Google Patents

構造化文書処理装置

Info

Publication number
JPH0756920A
JPH0756920A JP5218989A JP21898993A JPH0756920A JP H0756920 A JPH0756920 A JP H0756920A JP 5218989 A JP5218989 A JP 5218989A JP 21898993 A JP21898993 A JP 21898993A JP H0756920 A JPH0756920 A JP H0756920A
Authority
JP
Japan
Prior art keywords
document
partial structure
processing
template
structure sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5218989A
Other languages
English (en)
Inventor
Tadashi Michima
端 陌間
Masaaki Hatanaka
正明 畑中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5218989A priority Critical patent/JPH0756920A/ja
Publication of JPH0756920A publication Critical patent/JPH0756920A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 ユーザに繁雑な作業を強いることなく、構造
化文書の複数の文書部品に対して一括した文書処理を行
なうことのできる構造化文書処理装置を提供する。 【構成】 入力文書保持部2は、構造化文書である入力
文書1を保持し、部分構造列抽出部3に対して、入力文
書1の構造および内容を引き渡す。部分構造列抽出部3
は、抽出指示部4からの抽出指示に基づいて、入力文書
1の構造から、部分構造を抜き出し、部分構造列を生成
する。処理実行部5は、部分構造列抽出部3において生
成された部分構造列、及び、処理指示部6の処理指示に
基づいて、構造化文書処理を実行し、その結果を出力文
書7として出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、構造化文書の処理を行
なう構造化文書処理装置に関するものである。
【0002】
【従来の技術】業務上の文書を作成する場合、そのひな
型となる帳票を用意しておき、そこに必要な内容を記入
するようにすることは一般に行なわれている。記入すべ
き内容が文書の作成者が考案しなければならない内容で
はなく、日付けや、その他何らかの条件で決定されるも
のであったり、他の文書にある内容をそのまま複写した
りすることもある。文書を文字列として扱う従来の文書
処理装置では、このような文書の作成者が内容を考える
ものではなく、ある程度自動的に処理可能な編集操作ま
で文書の作成者が行なわなければならず、繁雑である。
【0003】一方、文書を内容の単位で階層化した構造
化文書が注目されている。構造化文書の代表的なものと
しては、例えば、“ISO/IS 8613,Info
rmation Processing−Text a
nd Office System−Office D
ocument Architecture(ODA)
and Interchange Format(1
988)”や、Furuta.R.,“Concept
s and Model for Structure
d Documents”,Cambridge Un
iversity Press,pp.7−38(19
88)に記載されたものなどが知られている。構造化文
書を用いると、論理構造のひな型をあらかじめ用意して
おき、ひな型の文書中の論理的な単位(文書部品)を挿
入・置換する文書処理を行なって、文書を作成すること
が可能となる。これにより、上述のような、文書の作成
者が内容を考えなくても良い部分について、ある程度の
自動的な処理が可能となる。
【0004】このような文書処理を行なう場合、文書中
の複数の論理部品を簡便に扱うことにより、利便性が向
上する。例えば、ある文書中の図表を別の文書に複製し
て再利用しようとする場合を考える。そのような処理
を、再利用する図表の1つ1つについて指示を与える必
要がある処理装置を用いて実現するとすれば、ユーザの
手間は非常に大きいものとなる。そのような装置では、
従来のエディター上で、コピー,ペーストを繰り返すこ
とと比べて、利便性が向上したとはいえない。
【0005】例えば、特願平4−207620号には、
構造化文書中の複数の文書部品を同時に操作する方法が
示されている。この方法では、複数の文書中の複数の文
書部品を一括して取り扱うために、共通の属性値を用い
る。共通の属性値を各文書部品にあらかじめ設定してお
くことにより、ユーザの意図する処理動作を共通の属性
値が設定されている各文書部品に対して一括して行なう
ことが可能となった。この方法を用いることにより、ユ
ーザが、処理対象の文書部品を特定する属性値と、その
属性値に対応する処理動作との組をシステムに与えるこ
とにより、簡便に構造化文書に対する処理を行なうこと
ができる。このとき、処理対象となる文書部品を特定す
る属性値を切り替えることにより、どのような処理を行
なうかを切り替えることができる。
【0006】しかしながら、この方法では、文書の作成
者が属性値を管理しなければならない。大量の文書部品
を処理の対象とする場合、文書の作成者は、処理の種類
ごとに別の属性値を各文書部品に付加する必要があり、
はなはだ煩雑である。また、文書部品を新たに作成した
際に、どのような処理に用いるのかを考慮して、処理に
応じた属性値を付加しなければならない。
【0007】この従来の方法による処理を、例をもとに
して説明する。入力文書から表を抜き出し、ひな型の文
書であるテンプレート文書の各章の末尾に挿入する処理
を例にする。図35は、従来の表の挿入処理を説明する
ための第1の例の説明図、図36は、図35における入
力文書の論理構造の説明図、図37は、図35における
テンプレート文書の論理構造の説明図である。図35に
おいて、入力文書は2つの表からなる。入力文書の論理
構造を図36に示す。また、テンプレート文書は2つの
章からなる。テンプレート文書の論理構造を図37に示
す。図35に示したテンプレート文書および図37に示
したその構造のうち、点線で示した文書部品は、テンプ
レート文書が用意された段階では存在せず、文書処理の
結果生じる部分を示している。以下の図中においても、
点線を用いて表現する文書部品は、同様の意味に用い
る。図35に示したテンプレート文書の各章の末尾に、
点線で示したように、入力文書からの表をそれぞれ挿入
する処理を実現することを考える。
【0008】上述の特願平4−207620号に記載さ
れている方法によれば、処理の種類ごとに各文書部品に
統一した属性値を付与する。この例では、入力文書の文
書部品である「表1」および「表2」に、例えば、「挿
入部品」という属性値をそれぞれ付与し、かつ、テンプ
レート文書の第1章の「本文」および第2章の「本文」
に、例えば、「末子に挿入」という属性値をそれぞれ付
与する。付与された属性値に基づいて統一した処理が実
行され、この場合、表の挿入処理が実現する。
【0009】しかしながら、入力文書およびテンプレー
ト文書が変更された場合に問題が生じる。図38は、従
来の表の挿入処理を説明するための第2の例の説明図、
図39は、図38における入力文書の論理構造の説明
図、図40は、図38におけるテンプレート文書の論理
構造の説明図である。図38に示すように、ユーザによ
る編集によって、入力文書に「表3」が加えられて、表
の数が3つに増え、また、テンプレート文書に「第3
章」が追加されたとする。このとき、処理の種類ごとに
各文書部品に統一した属性値を付与するために、図39
の入力文書の論理構造中の「表3」、および、図40の
テンプレート文書の論理構造中の第3章の「本文」に属
性値を付与する必要がある。どのような属性値が必要か
を知るためには、以前に属性値を付与されている文書部
品、例えば、「表1」や、第1章の「本文」等を参照し
なければならない。参照した結果、「挿入部品」、「末
子に挿入」という属性値を付与しなければいけないこと
がわかるので、それぞれの文書部品にこれらの属性値を
新たに付与することになる。このように、処理に用いる
文書の変更の度に、属性値の付与という、はなはだ煩雑
な作業を行なわなければならない。
【0010】また、別の問題もある。図41は、従来の
表の挿入処理を説明するための第3の例の説明図、図4
2は、従来の表の挿入処理の第3の例において章の追加
を行なう場合の説明図である。図41に示すように、入
力文書中に「表3」が追加されたが、テンプレート文書
は変更されず、不整合が生じた場合を考える。この場
合、入力文書の構造は図39と共通であり、テンプレー
ト文書の構造は図37と共通である。入力文書中の「表
1」、「表2」、「表3」には、属性値「挿入部品」が
付与されており、テンプレート文書中の2つの「本文」
には、属性値「末子に挿入」が付与されているとする。
この場合、「表3」は、挿入すべき章がテンプレート中
に存在せず、挿入処理はエラーとなる。ユーザには、図
42に示すように、入力文書中の表の数に併せて「第3
章」を新設するような処理が望まれるが、従来の技術で
は、これを解決する有効な手段を示しておらず、エラー
として例外処理を行なうことになる。そのために、入力
文書中の表の数に合わせて第3章を新設するような処理
は実現できない。
【0011】このように、従来の技術では、文書部品群
に対して一括した文書処理を行なうことは可能である
が、処理対象の文書が変更されるとユーザに煩雑な作業
を強いることになる。また、処理内容が処理対象の文書
の構造その他によって切り替わるような処理を構築する
ことができない。
【0012】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、ユーザに繁雑な作業を強い
ることなく、構造化文書の複数の文書部品に対して一括
した文書処理を行なうことのできる構造化文書処理装置
を提供することを目的とするものである。
【0013】
【課題を解決するための手段】本発明は、構造化文書に
対して処理を行なう構造化文書処理装置において、入力
文書から所定の条件に従って部分構造を抜き出しこれに
基づき部分構造列を生成する部分構造列抽出手段と、該
部分構造列抽出手段により生成された前記部分構造列を
用いて指示された処理を行ない出力文書を作成する処理
手段を有することを特徴とするものである。前記部分構
造列抽出手段は、複数の入力文書から複数の部分構造列
を抽出し、保持するように構成することができる。
【0014】また、この構造化文書処理装置は、出力文
書のひな型となるテンプレート文書を保持するテンプレ
ート文書保持手段を有し、前記処理手段は、前記部分構
造列抽出手段により生成された前記部分構造列を用い前
記テンプレート文書保持手段に保持されているテンプレ
ート文書に基づき指示された処理を行ない出力文書を作
成することを特徴とするものである。
【0015】さらに、前記テンプレート文書保持手段を
有する構造化文書処理装置において、処理の指示あるい
は前記テンプレート文書保持手段に保持されている前記
テンプレート文書の情報に従い、前記部分構造列抽出手
段により生成された前記部分構造列に対して処理を行な
う部分構造列処理手段を有することを特徴とするもので
ある。
【0016】また、前記テンプレート文書保持手段を有
する構造化文書処理装置において、前記テンプレート文
書保持手段に保持されている前記テンプレート文書に対
して、処理の指示あるいは前記部分構造列抽出手段によ
り生成された前記部分構造列に基づいた処理を行なうテ
ンプレート文書処理手段を有することを特徴とするもの
である。
【0017】
【作用】本発明によれば、入力された構造化文書は、部
分構造列抽出手段によって、処理に必要な文書部品が抽
出され、部分構造列が生成される。処理手段では、生成
された部分構造列を一括して処理対象として扱い、指示
された構造化文書処理を行なう。その結果を出力文書と
して出力する。また、テンプレート文書保持手段を設け
てテンプレート文書を保持しておき、処理手段におい
て、部分構造列を用いてテンプレート文書に対して処理
を行ない、出力文書を作成する。
【0018】これにより、処理に必要な各文書部品は、
ある条件をもとに抽出し、ある場合には、抽出された文
書部品の列に対しての文書部品の抽出や処理等を行なっ
て、部分構造列を生成しているので、従来のように、そ
れぞれに属性値を付与することなく、必要な文書部品を
抽出することができ、ユーザの利便性を向上させること
ができる。
【0019】また、部分構造列処理手段において、指示
された条件あるいはテンプレート文書の情報に従って、
部分構造列に対して、さらに部分列の抽出など、種々の
処理を行なうことができるので、例えば、部分構造列と
テンプレート文書が不整合であっても、テンプレート文
書に合わせた処理を行なって、出力文書を得ることがで
きる。さらに、テンプレート文書処理手段において、部
分構造列に基づいてテンプレート文書に対して処理を行
なうことができるので、例えば、部分構造列とテンプレ
ート文書が不整合の場合に、部分構造列にテンプレート
文書を整合させて処理を行ない、出力文書を得ることが
できる。このため、従来のように不整合のためにエラー
となることなく、所望の出力文書を得ることができる。
【0020】
【実施例】図1は、本発明の構造化文書処理装置の第1
の実施例を示すブロック構成図である。図中、1は入力
文書、2は入力文書保持部、3は部分構造列抽出部、4
は抽出指示部、5は処理実行部、6は処理指示部、7は
出力文書である。
【0021】入力文書保持部2は、構造化文書である入
力文書1を保持し、部分構造列抽出部3に対して、入力
文書1の構造および内容を引き渡す。部分構造列抽出部
3は、抽出指示部4からの抽出指示に基づいて、入力文
書1の構造から、部分構造を抜き出し、部分構造列を生
成する。処理実行部5は、部分構造列抽出部3において
生成された部分構造列、及び、処理指示部6の処理指示
に基づいて、構造化文書処理を実行し、その結果を出力
文書7として出力する。出力する出力文書7は、構造化
文書の形式で出力しても良いし、文書のイメージとして
出力することも可能である。抽出指示部4及び処理指示
部6は、それぞれ、抽出指示、処理指示を保持しておく
構成としても良い。
【0022】本発明の構造化文書処理装置の第1の実施
例における動作を具体例をもとに説明する。図2は、本
発明の構造化文書処理装置の第1の実施例における具体
的な処理例の説明図、図3は、図2における入力文書の
論理構造の説明図、図4は、図2における入力文書から
抽出された部分構造列の説明図である。図2に示すよう
に、入力文書は、2つの章を有している。入力文書中の
章題を抽出して目次のような一覧を作成する処理を行な
う。入力文書の論理構造を図3に示す。入力文書のイメ
ージを図2に示してはいるが、実際には、入力文書1は
図3に示す論理構造の形式で入力文書保持部2に保持さ
れる。入力文書から抽出される部分構造列を図4に示
す。部分構造列は、図3に示す入力文書の論理構造か
ら、処理に必要な要素である章が2つ順序を持って並べ
られている。図中の矢印は、その順序の方向を示してい
る。部分構造列としては、章題のほか、本文や、段落、
表、図、これらを含めた章や節全体、あるいは文書全体
等、種々の構造をその要素とすることができる。
【0023】図3に示す入力文書1が入力文書保持部2
に保持されている。抽出指示部4からは、例えば、「入
力文書から章、章題を抽出し、部分構造列とする」とい
う指示が部分構造列抽出部3に送られる。部分構造列抽
出部3において、入力文書1から図4に示した部分構造
列を抜き出す。
【0024】一方、処理指示部6からは、例えば、「部
分構造列の各要素を列記する」という指示が、処理実行
部5に送られる。処理実行部5において、部分構造列抽
出部3において生成された部分構造列をもとに、章題を
列記した文書を生成し、図2に示すような出力文書とし
て出力する。
【0025】このように、この実施例では、抽出指示に
従って部分構造列の抽出、生成を行なっているので、例
えば、入力文書1中に章の数が増加した場合であって
も、同じ動作を行なわせることによって、所望の文書を
出力文書として得ることができる。このとき、従来のよ
うに、増加した章に属性値をいちいち付与する必要はな
い。
【0026】図5は、本発明の構造化文書処理装置の第
2の実施例を示すブロック構成図である。図中、図1と
同様の部分には同じ符号を付して説明を省略する。8は
部分構造列管理部、9はテンプレート文書保持部、10
はテンプレート文書である。この実施例では、部分構造
列管理部8及びテンプレート文書保持部9を有する例を
示している。部分構造列抽出部3において抜き出され、
生成された部分構造列は、部分構造列管理部8において
保持、管理される。部分構造列管理部8は、その内部
に、例えば、部分構造列のデータベースを有する構成と
することができる。出力文書7のひな型であるテンプレ
ート文書10は、テンプレート文書保持部9に保持され
る。処理実行部5は、処理指示部6から送られる処理指
示に従って、テンプレート文書保持部9からテンプレー
ト文書10を、また、部分構造列管理部8から部分構造
列を得て文書処理を実行する。その結果を出力文書7と
して出力する。
【0027】この実施例では、部分構造列管理部8を有
しているので、複数の部分構造列および複数文書の部分
構造列を保持、管理することができる。部分構造列管理
手段8は、上述のように、その内部に部分構造列のデー
タベースを有する構成の他、部分構造列のデータベース
を持たずに、部分構造列のデータベースに対するインタ
ーフェースとしても実現可能である。データベースでな
くとも、単に部分構造列を保持できる構成であれば、実
現することができる。もちろん、図1に示したように、
部分構造列管理手段8を有しない構成も可能である。
【0028】本発明の構造化文書処理装置の第2の実施
例における動作を具体例をもとに説明する。図6は、本
発明の構造化文書処理装置の第2の実施例における第1
の具体的な処理例の説明図、図7は、図6における入力
文書の論理構造の説明図、図8は、図6におけるテンプ
レート文書とその論理構造の説明図、図9は、図6にお
ける入力文書から抽出された部分構造列の説明図、図1
0(A)は、図6における出力文書、図10(B)は、
その論理構造の説明図である。
【0029】図6に示すように、入力文書は、2つの表
と2つの段落とからなり、テンプレート文書は、2つの
章と各章に属する段落とからなる。入力文書中の表をテ
ンプレート文書中の各章の末尾に挿入する処理を行な
う。入力文書の構造を図7に、テンプレート文書の構造
を図8に示す。入力文書から抽出される部分構造列を図
9に示す。この例の場合、抽出される文書部品は、2つ
の表である。
【0030】図7に示す入力文書は入力文書保持部2
に、また、図8に示すテンプレート文書はテンプレート
文書保持部9に、それぞれ保持される。抽出指示部4か
らは、例えば、「入力文書から図表を抽出し、部分構造
列とする」という指示が部分構造列抽出部3に送られ
る。部分構造列抽出部3では、入力文書1から抽出指示
に従って、図7において点線で囲んで示す部分構造を抜
き出し、図9に示す部分構造列を生成する。生成された
部分構造列は、部分構造列管理部8に送られ、保持、管
理される。
【0031】一方、処理指示部6からは、例えば、「部
分構造列の各要素をテンプレート文書の各章の章末に挿
入」という指示が、処理実行部5に送られる。処理実行
部5において、処理指示に従い、部分構造列管理部8に
対して部分構造列を要求し、部分構造列管理部8から要
求した部分構造列を受け取るとともに、テンプレート文
書保持部9に保持されているテンプレート文書に対し、
部分構造列の挿入処理を行なう。そして、処理結果を出
力文書7として出力する。この処理により、出力文書
は、図10に示すように、各章のおわりに入力文書中の
表が挿入されている。
【0032】挿入すべき表の数が増加した場合であって
も、挿入される側の文書の章の数が対応していれば、同
じ動作によって所望の文書を出力文書として得ることが
できる。図11は、本発明の構造化文書処理装置の第2
の実施例における第2の具体的な処理例の説明図、図1
2は、図11における入力文書の論理構造の説明図で
る。図13(A)は、図11におけるテンプレート文
書、図13(B)は、その論理構造の説明図である。図
14は、図11における入力文書から抽出された部分構
造列の説明図、図15は、図11における出力文書の論
理構造の説明図である。
【0033】図11に示すように、入力文書中の表の数
が3つに増加し、同時にテンプレート文書の章の数も3
つに増加したとする。このとき、挿入すべき表の数も3
つに増加した。しかし、抽出指示部4から送られる「入
力文書から図表を抽出し、部分構造列とする」という指
示、および、処理指示部6から送られる「部分構造列の
各要素をテンプレート文書の各章の章末に挿入」という
指示が実行されることによって、第1の具体的な処理例
と同様の手順で所望の文書が得られる。これらの指示
は、第1の具体的な処理例と同じである。すなわち、図
12に示した入力文書から、点線で囲んだ3つの表を抜
き出し、図14に示すような部分構造列を生成する。そ
して、図13に示すテンプレート文書に対して、生成し
た部分構造列の各表を各章の章末に挿入処理し、図15
に示す論理構造の出力文書を生成する。
【0034】また、一部の表が図に置き換わった場合で
あっても同じ動作によって所望の文書を出力文書として
得ることができる。図16は、本発明の構造化文書処理
装置の第2の実施例における第3の具体的な処理例の説
明図、図17は、図16における入力文書の論理構造の
説明図、図18は、図16における入力文書から抽出さ
れた部分構造列の説明図、図19(A)は、図16にお
ける出力文書、図19(B)は、その論理構造の説明図
である。
【0035】図16に示した入力文書、テンプレート文
書は、図6に示した入力文書、テンプレート文書に比べ
て「表2」が「図1」と置き換わっている。しかし、抽
出指示部4から送られる「入力文書から図表を抽出し、
部分構造列とする」という指示、および、処理指示部6
から送られる「部分構造列の各要素をテンプレート文書
の各章の章末に挿入」という指示が実行されることによ
り、上述の第1の具体的な処理例と同様の指示、手順
で、所望の文書が得られる。すなわち、図17に示す入
力文書から、点線で囲んだ表と図が抜き出され、図18
に示す部分構造列が生成される。テンプレート文書は、
図8に示されたものと同じである。生成された部分構造
列は、テンプレート文書の各章の章末にそれぞれ挿入さ
れ、図19に示すような出力文書を得ることができる。
【0036】このように、第2の実施例では、テンプレ
ート文書への挿入処理において、入力文書の文書部品が
増加したり、変更されたりしても、新たに属性値を付与
することなく、同じ指示により所望の出力文書を得るこ
とができる。
【0037】また、図20に示すような複数の文書から
の図表の挿入の処理を行なうこともできる。図20は、
本発明の構造化文書処理装置の第2の実施例における第
4の具体的な処理例の説明図、図21は、図20におけ
る入力文書Bの論理構造の説明図、図22は、図20に
おける入力文書から抽出された部分構造列の説明図、図
23(A)は、図20における出力文書、図23(B)
は、その論理構造の説明図である。は、図20における
出力文書とその論理構造の説明図である。
【0038】入力文書Aは、2つの段落と2つの表から
なり、入力文書Bは2つの段落と2つの図からなる。テ
ンプレート文書は、2つの章からなる。入力文書Aから
2つの表を抜き出し、テンプレート文書の各章の末尾に
挿入し、かつ、入力文書Bから2つの図を抜き出し、テ
ンプレート文書の各章の先頭に挿入する処理を行なう。
入力文書Bの構造を図21に示す。入力文書Aの構造
は、図7に示されたものと同じである。テンプレート文
書は、図8に示されたものと同じである。図22に2つ
の入力文書から抽出され、生成された2つの部分構造列
を示す。
【0039】図7に示す入力文書Aおよび図21に示す
入力文書Bを入力文書保持部2に、また、図8に示すテ
ンプレート文書をテンプレート文書保持部9にそれぞれ
保持する。抽出指示部4からは、「入力文書から図表を
抽出し、部分構造列とする」という指示が、部分構造列
抽出部3に送られる。
【0040】部分構造列抽出部3において、図7に示す
入力文書Aから、点線で囲んだ2つの表を抜き出し、部
分構造列Aを作成する。また、図21に示す入力文書B
から、点線で囲んだ2つの図を抜き出し、部分構造列B
を作成する。部分構造列A,Bは、部分構造列抽出部3
から部分構造列管理部8に送られる。部分構造列管理部
8は、部分構造列Aを例えば「streamA」と、部
分構造列Bを例えば「streamB」と名付けて、そ
れぞれ保持、管理する。
【0041】一方、処理保持部6から、例えば、「『s
treamA』の各要素をテンプレート文書の各章の章
末に挿入」および「『streamB』の各要素をテン
プレート文書の各章の先頭に挿入」という指示が処理実
行部5に送られる。処理実行部5は、「stream
A」を部分構造列管理部8に要求し、送られてきた「s
treamA」をテンプレート文書10の各章の章末に
挿入する。さらに、処理実行部5は、「stream
B」を部分構造列管理部8に要求し、送られてきた「s
treamB」を、「streamA」が挿入された後
のテンプレート文書の各章の先頭に挿入する。そして、
「streamA」,「streamB」が挿入された
後の処理結果を、図23に示すような出力文書として出
力する。
【0042】図と表の位置が入れ替わった出力文書であ
っても、簡単に作成することができる。図24(A)
は、図20における図と表が入れ替わった出力文書、図
24(B)は、その論理構造の説明図である。作成方法
としては、入力文書Aと入力文書Bを入れ替えるだけで
よく、処理方法をなんら変更せずに得ることができる。
もちろん、入力文書Aと入力文書Bをそのままにし、処
理指示を「『streamA』の各要素をテンプレート
文書の各章の先頭に挿入」および「『streamB』
の各要素をテンプレート文書の各章の章末に挿入」とい
う指示とすることもできる。
【0043】図25は、本発明の構造化文書処理装置の
第3の実施例を示すブロック構成図である。図中、図5
と同様の部分には同じ符号を付して説明を省略する。1
1は部分構造列処理部、12は部分構造列処理指示部で
ある。
【0044】部分構造列処理部11は、部分構造列処理
指示部12から送られる部分構造列処理指示に基づいて
部分構造列管理手段に保持されている部分構造列を処理
する。例えば、部分構造列から、部分構造列処理指示で
指示された条件に応じて必要な部分構造列を抜き出すこ
とができる。また、テンプレート文書保持部9に保持さ
れているテンプレート文書10の構造や内容を参照し、
これらの情報に基づいて部分構造列に対して処理を行な
うことができる。処理された部分構造列は、再び部分構
造列管理手段8に保持、管理される。部分構造列処理指
示部12は、部分構造列処理指示を保持しておく機能を
有するように構成することもできる。
【0045】本発明の構造化文書処理装置の第3の実施
例における動作を具体例をもとに説明する。図26は、
本発明の構造化文書処理装置の第3の実施例における第
1の具体的な処理例の説明図、図27は、本発明の構造
化文書処理装置の第3の実施例における第2の具体的な
処理例の説明図、図28は、図26、図27における入
力文書の論理構造の説明図、図29は、図26、図27
における入力文書から抽出された部分構造列の説明図、
図30は、図27におけるテンプレート文書Bを用いた
ときの出力文書の論理構造の説明図である。
【0046】図26,図27に示すように、複数の文書
から図表を抽出し、挿入の処理を行なうこととする。図
26においては、入力文書は、3つの段落、2つの表、
1つの図からなり、テンプレート文書Aは、2つの章か
らなる。このとき、入力文書中の2つの表を、テンプレ
ート文書Aの各章末に挿入する。図27においては、入
力文書は図26と同一のものであるが、テンプレート文
書Bは、3つの章から構成されている。このとき、入力
文書中の2つの表と1つの図をテンプレート文書Bの各
章末に挿入する。すなわち、図26に示すように、テン
プレート文書が2章構成であれば、表のみを入力文書か
ら抜き出してテンプレート文書の各章末に挿入し、それ
以外の場合には、入力文書中の全ての図表を抜き出して
テンプレート文書の各章末に挿入するものとする。
【0047】入力文書の構造を図28に示している。テ
ンプレート文書Aは、図8に示されたものと同じもので
ある。テンプレート文書Bは、図13に示されたものと
同じものである。図29において、部分構造列Aは入力
文書から抽出した部分構造列を示し、部分構造列Bは、
部分構造列処理部11による処理後の部分構造列を示
す。テンプレート文書Aによる出力文書は、図10に示
したものと同じものである。図30にテンプレート文書
Bによる出力文書の構造を示す。
【0048】まず、図28に示す入力文書を入力文書保
持部2に、図8または図13に示すテンプレート文書を
テンプレート文書保持部9にそれぞれ保持する。抽出指
示部4から、例えば、「入力文書から図表を抽出し、部
分構造列とする」という指示が、部分構造列抽出部3に
送られる。部分構造列抽出部3において、入力文書から
図29に点線で囲んで示す2つの表と1つの図を抜き出
し、部分構造列Aを作成する。部分構造列Aは、部分構
造列抽出部3から部分構造列管理部8に送られる。部分
構造列管理部8は、部分構造列Aを保持、管理する。
【0049】部分構造列処理指示部12から部分構造列
処理部11へ、例えば、「テンプレート文書中の章の数
が2であれば部分構造列から表だけを抜き出したものを
新たに部分構造列とする。」という部分構造列処理指示
が送られる。部分構造列処理部11は、テンプレート文
書保持部9に保持されているテンプレート文書10の構
造を調べる。その結果、章の数が2でなければ何も実行
しない。また、章の数が2であれば、部分構造列管理部
8に部分構造列を要求し、送られてきた部分構造列Aか
ら表のみを抜き出し、新しく図29に示す部分構造列B
を作成する。部分構造列Bは、部分構造列管理部8に送
られる。部分構造管理手段8は、部分構造列Aを削除
し、部分構造列Bを部分構造列として保持、管理する。
【0050】一方、処理指示部6から、例えば、「部分
構造列の各要素をテンプレート文書の各章の章末に挿
入」という指示が処理実行部5に送られる。処理実行部
5は、部分構造列を部分構造列管理部8に要求し、送ら
れてきた部分構造列をテンプレート文書の各章の章末に
挿入する。挿入された後の処理結果を、図10あるいは
図30に示すような出力文書として出力する。
【0051】このように、部分構造列処理部11によ
り、用いるテンプレート文書に従って部分構造列を処理
することができるので、処理指示を変更せずに、テンプ
レート文書に従った出力文書を得ることができる。
【0052】上述の処理の中で、部分構造列処理部11
において作成された部分構造列Bにより、もとの部分構
造列Aを削除しているが、これを削除せず、テンプレー
ト文書の種類とともに、部分構造列A及び部分構造列B
をともに保持、管理することもできる。このとき、処理
指示部6で使用することが指定されたテンプレート文書
に従って、部分構造列管理部8が部分構造列を選択し、
処理実行部へ送るように構成することができる。
【0053】図31は、本発明の構造化文書処理装置の
第4の実施例を示すブロック構成図である。図中、図2
5と同様の部分には同じ符号を付して説明を省略する。
13はテンプレート文書処理部、14はテンプレート文
書処理指示部である。
【0054】テンプレート文書処理部13は、テンプレ
ート文書の前処理として、テンプレート文書処理指示部
14の指示に従い、テンプレート文書の処理を行なう。
その際に、部分構造列管理部8に保持されている部分構
造列の要素の数、内容等、部分構造列に関する情報を参
照にすることもできる。処理指示部6に保持された指示
に従って、処理実行部5は、テンプレート文書処理部1
3で前処理されたテンプレート文書と、部分構造列管理
部8から部分構造列を得て文書処理を実行することにな
る。
【0055】図32は、本発明の構造化文書処理装置の
第4の実施例における具体的な処理例の説明図、図33
は、図32における入力文書から抽出された部分構造列
の説明図、図34は、図32における出力文書の論理構
造の説明図である。この例では、図32に示すような図
表の挿入の処理を行なうこととする。すなわち、入力文
書中から図表を抜き出し、テンプレート文書中の各章の
章末に挿入する。ただし、入力文書中の図表の数がテン
プレート文書中の章の数より大きい場合、超過している
数だけの章をテンプレート文書中に追加した上で図表の
挿入を行なう。図32においては、入力文書は、3つの
段落、2つの表、1つの図からなり、テンプレート文書
は2つの章からなる。入力文書中の表1、図35を第1
章、第2章の各章末に挿入する。表2は、テンプレート
文書に章題のみを持つ第3章を追加した上で第3章に挿
入する。
【0056】入力文書の構造は、図28に示されたもの
と同じである。テンプレート文書は、図8に示されたも
のと同じものである。図33に抽出される部分構造列を
示す。出力文書を図34に示す。図32及び図34中、
一点鎖線で囲まれた部分は、自動的に追加された第3章
の部分である。
【0057】まず、図28に示す入力文書を入力文書保
持部2に、また、図8に示すテンプレート文書をテンプ
レート文書保持部9にそれぞれ保持する。抽出指示部4
から、例えば、「入力文書から図表を抽出し、部分構造
列とする」という指示が、部分構造列抽出部3に送られ
る。部分構造列抽出部3において、図28に示した入力
文書から、点線で囲んだ図、表を抜き出し、図33に示
す部分構造列を作成する。作成された部分構造列は、部
分構造列抽出部3から部分構造列管理部8に送られる。
部分構造列管理部8は、部分構造列を保持、管理する。
この例では、部分構造処理指示部、部分構造列処理部は
動作しない。
【0058】テンプレート文書処理指示部14から、例
えば、「部分構造列の要素の数とテンプレート文書の章
の数とを比べて、部分構造列の要素の数が大きい場合
は、要素の数と章の数が同じになるようにテンプレート
文書に章を追加する。それ以外の場合は、テンプレート
文書を加工しない。」という指示をテンプレート文書処
理部13に送る。テンプレート文書処理部13は、送ら
れた指示を実行する。図28に示した入力文書の例の場
合、図33に示すように、部分構造列の要素の数は3で
あり、図8に示すテンプレート文書の章の数は2であ
る。よって、テンプレート文書処理部13は、章を1つ
テンプレート文書に追加する。
【0059】処理保持部6から、例えば、「部分構造列
の各要素をテンプレート文書の各章の章末に挿入」とい
う処理指示が処理実行部5に送られる。処理実行部5
は、部分構造列を部分構造列管理部8に要求し、送られ
てきた部分構造列をテンプレート文書の各章の章末に挿
入する。このとき用いられるテンプレート文書は、テン
プレート文書処理部13において章の追加されたものが
用いられる。その結果、図34に示すように、第3章が
追加され、各章に図表が挿入された出力文書が出力され
る。
【0060】このように、入力文書とテンプレート文書
の不整合の場合であっても、処理指示を変更することな
く、自動的に整合を図って文書処理を行なうことができ
る。この例において、テンプレート文書の形式を優先さ
せ、章を追加せずに挿入処理を行なう場合には、部分構
造処理指示部12から、テンプレート文書に合わせた部
分構造列を作成するように指示することにより、所望の
処理を行なわせることができる。
【0061】上述の各実施例において、各部はそれぞれ
別のモジュールで構成され、実行されるので、全体に影
響を与えることなく、部分の定義を変更することが可能
となっている。このことによって高い保守性と拡張性が
実現されている。
【0062】上述の各実施例において、処理実行部5、
部分構造列処理部11、テンプレート文書処理部13に
は、例えば、特願平4−206722号に記載されてい
る処理方法または処理装置を用いて構築することができ
る。また、本発明の構造化文書処理装置は、具体的に
は、文書処理機能を有する装置、例えばワークステーシ
ョンやコンピュータなどによって実現することができ
る。
【0063】
【発明の効果】以上の説明から明らかなように、本発明
によれば、ユーザに対して過度の負担をかけることな
く、構造化文書の複数の文書部品を一括して扱う処理が
可能となり、ユーザの利便性を向上させることができ
る。
【0064】また、例えば、入力文書から抽出した部分
構造列とテンプレート文書が不整合であっても、部分構
造列あるいはテンプレート文書に合わせた処理を行なっ
て、出力文書を得ることができる。このため、従来のよ
うに不整合のためにエラーとなることなく、所望の出力
文書を得ることができるという効果がある。
【図面の簡単な説明】
【図1】 本発明の構造化文書処理装置の第1の実施例
を示すブロック構成図である。
【図2】 本発明の構造化文書処理装置の第1の実施例
における具体的な処理例の説明図である。
【図3】 図2における入力文書の論理構造の説明図で
ある。
【図4】 図2における入力文書から抽出された部分構
造列の説明図である。
【図5】 本発明の構造化文書処理装置の第2の実施例
を示すブロック構成図である。
【図6】 本発明の構造化文書処理装置の第2の実施例
における第1の具体的な処理例の説明図である。
【図7】 図6における入力文書の論理構造の説明図で
ある。
【図8】 図6におけるテンプレート文書とその論理構
造の説明図である。
【図9】 図6における入力文書から抽出された部分構
造列の説明図である。
【図10】 図6における出力文書とその論理構造の説
明図である。
【図11】 本発明の構造化文書処理装置の第2の実施
例における第2の具体的な処理例の説明図である。
【図12】 図11における入力文書の論理構造の説明
図である。
【図13】 図11におけるテンプレート文書とその論
理構造の説明図である。
【図14】 図11における入力文書から抽出された部
分構造列の説明図である。
【図15】 図11における出力文書とその論理構造の
説明図である。
【図16】 本発明の構造化文書処理装置の第2の実施
例における第3の具体的な処理例の説明図である。
【図17】 図16における入力文書の論理構造の説明
図である。
【図18】 図16における入力文書から抽出された部
分構造列の説明図である。
【図19】 図16における出力文書とその論理構造の
説明図である。
【図20】 本発明の構造化文書処理装置の第2の実施
例における第4の具体的な処理例の説明図である。
【図21】 図20における入力文書Bの論理構造の説
明図である。
【図22】 図20における入力文書から抽出された部
分構造列の説明図である。
【図23】 図20における出力文書とその論理構造の
説明図である。
【図24】 図20における図と表が入れ替わった出力
文書とその論理構造の説明図である。
【図25】 本発明の構造化文書処理装置の第3の実施
例を示すブロック構成図である。
【図26】 本発明の構造化文書処理装置の第3の実施
例における第1の具体的な処理例の説明図である。
【図27】 本発明の構造化文書処理装置の第3の実施
例における第2の具体的な処理例の説明図である。
【図28】 図26、図27における入力文書の論理構
造の説明図である。
【図29】 図26、図27における入力文書から抽出
された部分構造列の説明図である。
【図30】 図27におけるテンプレート文書Bを用い
たときの出力文書の論理構造の説明図である。
【図31】 本発明の構造化文書処理装置の第4の実施
例を示すブロック構成図である。
【図32】 本発明の構造化文書処理装置の第4の実施
例における具体的な処理例の説明図である。
【図33】 図32における入力文書から抽出された部
分構造列の説明図である。
【図34】 図32における出力文書の論理構造の説明
図である。
【図35】 従来の表の挿入処理を説明するための第1
の例の説明図である。
【図36】 図35における入力文書の論理構造の説明
図である。
【図37】 図35におけるテンプレート文書の論理構
造の説明図である。
【図38】 従来の表の挿入処理を説明するための第2
の例の説明図である。
【図39】 図38における入力文書の論理構造の説明
図である。
【図40】 図38におけるテンプレート文書の論理構
造の説明図である。
【図41】 従来の表の挿入処理を説明するための第3
の例の説明図である。
【図42】 従来の表の挿入処理の第3の例において章
の追加を行なう場合の説明図である。
【符号の説明】
1 入力文書、2 入力文書保持部、3 部分構造列抽
出部、4 抽出指示部、5 処理実行部、6 処理指示
部、7 出力文書、8 部分構造列管理部、9テンプレ
ート文書保持部、10 テンプレート文書、11 部分
構造列処理部、12 部分構造列処理指示部、13 テ
ンプレート文書処理部、14 テンプレート文書処理指
示部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 構造化文書に対して処理を行なう構造化
    文書処理装置において、入力文書から所定の条件に従っ
    て部分構造を抜き出しこれに基づき部分構造列を生成す
    る部分構造列抽出手段と、該部分構造列抽出手段により
    生成された前記部分構造列を用いて指示された処理を行
    ない出力文書を作成する処理手段を有することを特徴と
    する構造化文書処理装置。
  2. 【請求項2】 出力文書のひな型となるテンプレート文
    書を保持するテンプレート文書保持手段を有し、前記処
    理手段は、前記部分構造列抽出手段により生成された前
    記部分構造列を用い前記テンプレート文書保持手段に保
    持されている前記テンプレート文書に基づき指示された
    処理を行ない出力文書を作成することを特徴とする請求
    項1に記載の構造化文書処理装置。
  3. 【請求項3】 処理の指示あるいは前記テンプレート文
    書保持手段に保持されている前記テンプレート文書の情
    報に従い、前記部分構造列抽出手段により生成された前
    記部分構造列に対して処理を行なう部分構造列処理手段
    を有することを特徴とする請求項2に記載の構造化文書
    処理装置。
  4. 【請求項4】 前記テンプレート文書保持手段に保持さ
    れている前記テンプレート文書に対して、処理の指示あ
    るいは前記部分構造列抽出手段により生成された前記部
    分構造列に基づいた処理を行なうテンプレート文書処理
    手段を有することを特徴とする請求項2または3に記載
    の構造化文書処理装置。
JP5218989A 1993-08-11 1993-08-11 構造化文書処理装置 Pending JPH0756920A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5218989A JPH0756920A (ja) 1993-08-11 1993-08-11 構造化文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5218989A JPH0756920A (ja) 1993-08-11 1993-08-11 構造化文書処理装置

Publications (1)

Publication Number Publication Date
JPH0756920A true JPH0756920A (ja) 1995-03-03

Family

ID=16728530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5218989A Pending JPH0756920A (ja) 1993-08-11 1993-08-11 構造化文書処理装置

Country Status (1)

Country Link
JP (1) JPH0756920A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069501B2 (en) 2000-01-25 2006-06-27 Fuji Xerox Co., Ltd. Structured document processing system and structured document processing method
JP2008282399A (ja) * 1996-09-09 2008-11-20 Microsoft Corp 媒体でデザインするためのコンテンツの自動的なレイアウトおよび書式設定
US7478320B2 (en) 2003-07-28 2009-01-13 International Business Machines Corporation Structured document processor
JP2010128687A (ja) * 2008-11-26 2010-06-10 Canon Inc 情報処理方法、情報処理装置、およびコンピュータプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282399A (ja) * 1996-09-09 2008-11-20 Microsoft Corp 媒体でデザインするためのコンテンツの自動的なレイアウトおよび書式設定
US7069501B2 (en) 2000-01-25 2006-06-27 Fuji Xerox Co., Ltd. Structured document processing system and structured document processing method
US7478320B2 (en) 2003-07-28 2009-01-13 International Business Machines Corporation Structured document processor
US8214735B2 (en) 2003-07-28 2012-07-03 International Business Machines Corporation Structured document processor
JP2010128687A (ja) * 2008-11-26 2010-06-10 Canon Inc 情報処理方法、情報処理装置、およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
JPH05257661A (ja) ソフトウェア生産方式
JPH0756920A (ja) 構造化文書処理装置
US5261103A (en) Method of and system for compiling source program
JP2005078119A (ja) ソフトウェア開発支援装置およびソフトウェア開発支援方法およびプログラムおよび記録媒体
JP2720768B2 (ja) プログラムカストマイズ装置
JP3080891B2 (ja) 帳票処理装置
JPH05265736A (ja) レイアウト装置
JP2000057322A (ja) コンピュータにおける画像処理編集履歴機構を備えた画像処理装置
JP4759874B2 (ja) 表組みパターン作成装置
JPH09274564A (ja) プログラム網図作成装置
JPH1139379A (ja) 作業支援情報作成システム
JPH0589103A (ja) 文書編集処理装置
JPH05334325A (ja) データ処理装置の帳票作成方式
JPS62269272A (ja) イメ−ジデ−タと日本語文字デ−タの編集方式
JPS62169241A (ja) メデイア統合フアイル方式
JP2003308207A (ja) プログラム仕様書生成システム
JPH01124056A (ja) 文書処理装置
JPH0486922A (ja) 知識エディタ
JP2003271384A (ja) ソフトウェア仕様管理方法およびソフトウェア仕様管理装置並びにプログラム
JPH10116284A (ja) 文書処理装置
JPH0540612A (ja) 計算機資産変換処理装置
JPH03166642A (ja) テキスト入力方法および装置
JPH05257766A (ja) 特定ファイル出力方式
JPS63180130A (ja) 対話シ−ケンス編集装置
JPS63174171A (ja) 帳票形式生成方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees