JPH10214265A - Device for processing structured document - Google Patents

Device for processing structured document

Info

Publication number
JPH10214265A
JPH10214265A JP9017153A JP1715397A JPH10214265A JP H10214265 A JPH10214265 A JP H10214265A JP 9017153 A JP9017153 A JP 9017153A JP 1715397 A JP1715397 A JP 1715397A JP H10214265 A JPH10214265 A JP H10214265A
Authority
JP
Japan
Prior art keywords
document
input
output
tree
operation instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9017153A
Other languages
Japanese (ja)
Inventor
Makoto Imamura
誠 今村
Osamu Moriguchi
修 森口
Katsushi Suzuki
克志 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP9017153A priority Critical patent/JPH10214265A/en
Publication of JPH10214265A publication Critical patent/JPH10214265A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To realize the processing of a high level structured document such as constraint check between document contents across constituting element identifiers in a document, or conversion, synthesis, and division for plural input and output documents. SOLUTION: The analysis of the logical structure of an input document 11 is operated, and an input document structural tree is prepared by a document structure analyzing means 13. The reading of a document structure operation instruction 15 is operated, and operation instructions described in it are successively taken out and interpretation-executed by a document structure operation instruction interpretation executing means 16. Then, an output document structural tree is generated from the input document structural tree prepared by the document structure analyzing means 13, and an output document 24 is generated from the prepared output document structural tree by a structured document generating means 23.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、文書作成・承
認、既存文書の再利用、文書フォーマットの変更、文書
保存・検索・閲覧、データ集計、出版印刷等の文書管理
・処理業務において、文書の論理構造を利用して、文書
の変換・生成、文書の合成・分割、文書の正しさの検
証、さらには文書の誤りの訂正等を行なう構造化文書処
理装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to document management and processing services such as document creation / approval, reuse of existing documents, change of document format, document storage / retrieval / browsing, data tabulation, and publication printing. BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a structured document processing apparatus that performs conversion and generation of a document, synthesis and division of a document, verification of the correctness of a document, and correction of a document error using a logical structure.

【0002】[0002]

【従来の技術】図53は、例えば特開平8−16589
号公報に開示される、従来の構造化文書処理装置の構成
を示すブロック図であり、構造化文書の持つ誤りを文書
構造を考慮しながら校正できるようにしたものである、
図において、1はその構造化文書処理装置であり、文書
内容が文書の構成要素識別子と対応付けて記述される構
造化文書を処理するものである。2は構造化文書処理装
置1の備える入力文書ファイルであり、処理対象となる
構造化文書を格納するものである。3は同じく構造化文
書処理装置1の備える出力文書ファイルであり、処理さ
れた構造化文書を格納するものである。
2. Description of the Related Art FIG.
Is a block diagram showing a configuration of a conventional structured document processing device disclosed in Japanese Patent Application Laid-Open Publication No. H10-207, which is capable of correcting an error of a structured document while considering a document structure.
In FIG. 1, reference numeral 1 denotes a structured document processing apparatus for processing a structured document in which document contents are described in association with document component identifiers. Reference numeral 2 denotes an input document file provided in the structured document processing apparatus 1, which stores a structured document to be processed. Reference numeral 3 denotes an output document file provided in the structured document processing apparatus 1, which stores a processed structured document.

【0003】また、上記構造化文書処理装置1の内部に
おいて、4は誤り検出プログラムであり、処理対象とな
る構造化文書の持つ誤りを検出するものである。5はチ
ェック項目表であり、誤り検出プログラム4の検出処理
に必要となるチェックデータを管理するものである。6
は文書構造表であり、誤り検出プログラム4の抽出した
処理対象となる構造化文書の持つ文書構造情報を格納す
るものである。7はチェック結果表であり、誤り検出プ
ログラム4の検出結果を格納するものである。8は誤り
作成プログラムであり、処理対象となる構造化文書の持
つ誤り内容の一覧を作成するものである。9は誤り修正
プログラムであり、処理対象となる構造化文書の持つ誤
りを修正するものである。
In the structured document processing apparatus 1, an error detection program 4 detects an error of a structured document to be processed. Reference numeral 5 denotes a check item table for managing check data required for the detection processing of the error detection program 4. 6
Is a document structure table, which stores document structure information of the structured document to be processed extracted by the error detection program 4. Reference numeral 7 denotes a check result table for storing the detection result of the error detection program 4. Reference numeral 8 denotes an error creation program which creates a list of error contents of the structured document to be processed. An error correction program 9 corrects an error of the structured document to be processed.

【0004】次に動作について説明する。図53におい
て、誤り検出プログラム4は入力文書ファイル2から読
み出された処理対象となる構造化文書を解析すること
で、当該処理対象となる構造化文書の持つ構成要素識別
子と、その構成要素識別子が指定する文書内容とを抽出
し、その抽出結果を文書構造表6に格納する。次いで、
抽出された文書内容が、チェック項目表5のチェックデ
ータが示す誤り文書条件に該当するか否かをチェックす
ることで、処理対象となる構造化文書の持つ誤りを検出
し、その検出結果をチェック結果表7に格納する。
Next, the operation will be described. In FIG. 53, the error detection program 4 analyzes the structured document to be processed, which is read from the input document file 2, and determines the component identifier of the structured document to be processed, and the component identifier of the structured document. Is extracted, and the extraction result is stored in the document structure table 6. Then
By checking whether the extracted document content satisfies the error document condition indicated by the check data in the check item table 5, an error of the structured document to be processed is detected, and the detection result is checked. The result is stored in Table 7.

【0005】図54はそのチェック項目表5の一例を示
す説明図である。このチェック項目表5は、処理対象と
なる構造化文書に対してのチェック条件と、その構造化
文書の持つ誤りの修正方法とを構成要素識別子名(図中
のチェックIDおよびチェック要素)をキーにして管理
するものである。例えば、この図54に示した表中のチ
ェックIDが「1」の行では、「箇条書き」という構成
要素識別子が指定する文書内容の要素数が上限値の8個
を超えているかどうかをチェックするためのデータを管
理している。
FIG. 54 is an explanatory diagram showing an example of the check item table 5. In the check item table 5, the check conditions for the structured document to be processed and the method of correcting errors in the structured document are keyed by component element identifier names (check ID and check element in the figure). Is to be managed. For example, in the table in which the check ID is "1" in the table shown in FIG. I manage the data to do.

【0006】誤り作成プログラム8はこのチェック項目
表5に基づいて誤り検出プログラム4が作成したチェッ
ク結果表7を参照し、処理対象となる構造化文書の持つ
誤り内容の一覧を作成して、それを出力文書ファイル3
に出力する。また、誤り修正プログラム9もそのチェッ
ク結果表7を参照し、処理対象となる構造化文書の持つ
誤りに対して、チェック項目表5のチェックデータが示
す修正方法を適用することで誤りの修正を行ない、修正
された構造化文書を出力文書ファイル3に出力する。
The error creation program 8 refers to the check result table 7 created by the error detection program 4 based on the check item table 5 to create a list of errors contained in the structured document to be processed, Output document file 3
Output to The error correction program 9 also refers to the check result table 7 and corrects errors by applying the correction method indicated by the check data in the check item table 5 to errors in the structured document to be processed. And outputs the modified structured document to the output document file 3.

【0007】なお、このような従来の構造化文書処理装
置に関連のある技術についての記載がある文献として
は、上記特開平8−16589号公報の他にも、例え
ば、特開平5−101054号公報、特開平8−137
872号公報、特開平8−137877号公報、特開平
8−190560号公報などがある。
[0007] In addition to the above-mentioned Japanese Patent Application Laid-Open No. H8-16589, for example, Japanese Patent Application Laid-Open No. H5-110154 discloses a technique which describes a technique related to such a conventional structured document processing apparatus. Gazette, JP-A-8-137
872, JP-A-8-137877 and JP-A-8-190560.

【0008】[0008]

【発明が解決しようとする課題】従来の構造化文書処理
装置は以上のように構成されているので、構造化文書に
対する操作を記述したチェック項目表5の表現能力が充
分ではないため、チェックできる条件に制限があるとい
う課題があった。例えば、構造化文書に対してのチェッ
ク条件を構成要素識別子名をキーとして記述しているの
で、複数の構成要素識別子名にまたがる文書内容間の制
約条件をチェックしたり、構成要素識別子の出現の文脈
に応じてチェックすべき条件が変わる処理を実行したり
するといった処理が困難であったり、チェック項目表5
の記述が必要以上に複雑になってしまうなどの問題点が
あった。
Since the conventional structured document processing apparatus is configured as described above, the check capability of the check item table 5 which describes the operation on the structured document is not sufficient, so that it can be checked. There was a problem that conditions were limited. For example, since the check conditions for structured documents are described using component identifier names as keys, it is possible to check constraints between document contents that span multiple component identifier names, and to check the occurrence of component identifiers. It is difficult to execute a process that changes the condition to be checked according to the context, or the check item table 5
There was a problem that the description was more complicated than necessary.

【0009】また、チェック項目表5の記述形式が汎用
性に欠けているため、誤り修正プログラム9がチェック
項目表5の記述形式に依存した形になりやく、チェック
すべき誤りの内容に応じて誤り修正プログラム9の新規
作成・変更が必要になったり、複数の入出力文書に対す
る処理が考慮されておらず、「複数の文書間にまたがる
内容の整合性のチェック」や「文書の合成/分割」がで
きないなどといった課題もあった。
Further, since the description format of the check item table 5 lacks versatility, the error correction program 9 tends to be dependent on the description format of the check item table 5, and depends on the content of the error to be checked. A new creation / change of the error correction program 9 is required, and processing of a plurality of input / output documents is not taken into account. There was also a problem that it was not possible.

【0010】この発明は上記のような課題を解決するた
めになされたもので、構造化文書に対する操作命令の集
まりである文書構造操作命令書に高い記述能力と汎用性
を持たせるとともに、文書構造操作命令書を統一的に解
釈実行する文書構造操作命令解釈実行手段を備えること
により、文書内の構成要素識別子にまたがる文書内容間
の制約チェックや複数の入出力文書に対する変換・合成
・分割といったより高度な構造化文書の処理を実現する
ことのできる構造化文書処理装置を得ることを目的とす
る。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems. A document structure operation instruction, which is a group of operation instructions for a structured document, has high description capability and versatility, and has a document structure. Equipped with document structure operation instruction interpreting and executing means for interpreting and executing operation instructions in a unified manner, enabling checking of constraints between document contents spanning component identifiers in a document, conversion, synthesis, and division of multiple input / output documents. It is an object of the present invention to obtain a structured document processing device capable of realizing advanced structured document processing.

【0011】また、文書構造操作命令解釈実行手段を文
書構造操作命令書中の個々の操作命令に依存しないよう
に実現することにより、「対象とする構造化文書の変
更」や「構造文書に対する操作内容の変更」に対して、
文書構造操作命令書のみを変更すればよいようにして、
構造化文書処理プログラムの作成の手間を削減可能な構
造化文書処理装置を得ることを目的とする。
[0011] Further, by realizing the document structure operation instruction interpretation and execution means so as not to depend on individual operation instructions in the document structure operation instruction, "change of target structured document" or "operation for structured document" is performed. Content change "
By changing only the document structure operation instruction,
It is an object of the present invention to provide a structured document processing apparatus capable of reducing the trouble of creating a structured document processing program.

【0012】[0012]

【課題を解決するための手段】請求項1記載の発明に係
る構造化文書処理装置は、文書構造解析手段において入
力文書の論理構造を解析して入力文書構造木を作成し、
文書構造操作命令解釈実行手段において、読み込んだ文
書構造操作命令書に記述された操作命令を順番に取り出
して解釈実行することで、文書構造解析手段の作成した
入力文書構造木より出力文書構造木を生成し、その出力
文書構造木から構造化文書生成手段にて出力文書を生成
するようにしたものである。
According to a first aspect of the present invention, there is provided a structured document processing apparatus for analyzing a logical structure of an input document by a document structure analysis unit to create an input document structure tree.
In the document structure operation instruction interpretation executing means, the output document structure tree is extracted from the input document structure tree created by the document structure analysis means by sequentially taking out and interpreting the operation instructions described in the read document structure operation instruction document. Then, an output document is generated by a structured document generation unit from the output document structure tree.

【0013】請求項2記載の発明に係る構造化文書処理
装置は、文書構造操作命令解釈実行手段が文書構造操作
命令書を読み込んで、構造要素識別子の指定する文書内
容を入力文書構造木から抽出する構造要素抽出手段、文
書処理内容を構造要素識別子の指定する文書内容に課せ
られる条件によって制御する条件判定手段、構造要素識
別子の指定する各々の文書内容に対する操作命令を解釈
実行する繰り返し構造処理手段、および出力文書構造木
に構造要素識別子が指定する文書内容を挿入する構造要
素代入手段の中から、その読み込んだ文書構造操作命令
書より順次取り出した操作命令のタイプに応じて必要な
ものを選択し、操作命令の解釈実行を行なうようにした
ものである。
[0013] In the structured document processing apparatus according to the second aspect of the present invention, the document structure operation instruction interpretation and execution means reads the document structure operation instruction and extracts the document content specified by the structure element identifier from the input document structure tree. Structural element extracting means, condition determining means for controlling the contents of document processing by the conditions imposed on the document contents specified by the structural element identifier, and repetitive structure processing means for interpreting and executing an operation command for each document content specified by the structural element identifier , And from the structural element substituting means for inserting the document content specified by the structural element identifier into the output document structural tree, select a necessary one according to the type of the operation instruction sequentially extracted from the read document structure operation instruction Then, interpretation and execution of the operation command are performed.

【0014】請求項3記載の発明に係る構造化文書処理
装置は、複数の入力文書に対する入力文書構造木を管理
する複数入力文書構造木管理手段を設けて、文書構造解
析手段から複数の入力文書構造木を受理し、入力文書識
別子と入力文書構造木を対応付けて入力文書構造木バッ
ファに格納するとともに、構造要素抽出手段から入力文
書識別子と構造要素抽出命令を受理した場合に、その入
力文書識別子に対応する入力文書構造木から構造要素識
別子が指定する文書内容を抽出するようにしたものであ
る。
According to a third aspect of the present invention, there is provided a structured document processing apparatus comprising: a plurality of input document structure tree management means for managing an input document structure tree for a plurality of input documents; When a structure tree is received, the input document identifier and the input document structure tree are associated with each other and stored in the input document structure tree buffer, and when the input document identifier and the structure element extraction instruction are received from the structure element extraction unit, the input document The document content specified by the structural element identifier is extracted from the input document structure tree corresponding to the identifier.

【0015】請求項4記載の発明に係る構造化文書処理
装置は、複数の出力文書に対する出力文書構造木を管理
する複数出力文書構造木管理手段を設けて、構造要素代
入手段から出力文書識別子と構造要素代入命令を受理し
た場合に、その出力文書識別子に対応する出力文書構造
木に構造要素識別子が指定する文書内容を挿入するよう
にしたものである。
According to a fourth aspect of the present invention, there is provided a structured document processing apparatus comprising: a plurality of output document structure tree management means for managing an output document structure tree for a plurality of output documents; When a structure element assignment command is received, the document content specified by the structure element identifier is inserted into the output document structure tree corresponding to the output document identifier.

【0016】請求項5記載の発明に係る構造化文書処理
装置は、文書構造操作命令解釈実行手段が文書構造操作
命令書を読み込んで、構造要素抽出手段、条件判定手
段、繰り返し構造処理手段、構造要素代入手段、さらに
は、辞書ファイルから辞書を呼び出した辞書を参照して
入力文書中に含まれる用語の処理を行なう用語処理手段
の中から、その読み込んだ文書構造操作命令書より順次
取り出した操作命令のタイプに応じて必要なものを選択
し、操作命令の解釈実行を行なうようにしたものであ
る。
According to a fifth aspect of the present invention, there is provided the structured document processing apparatus, wherein the document structure operation instruction interpretation and execution means reads the document structure operation instruction and reads the structure element extraction means, the condition determination means, the repetitive structure processing means, and the structure. An operation sequentially extracted from the read document structure operation instruction from the element substitution means, and further from the term processing means for processing the terms contained in the input document by referring to the dictionary that called the dictionary from the dictionary file A necessary one is selected according to the type of the instruction, and the operation instruction is interpreted and executed.

【0017】請求項6記載の発明に係る構造化文書処理
装置は、用語検証に必要な用語と用語に付随する情報を
収録した用語辞書を辞書ファイル内に格納しておき、用
語処理手段としての用語検証手段により、入力文書中の
用語が呼び出された用語辞書に収録されている用語かど
うかを検証して、用語に関する誤りの検出や修正を行な
うようにしたものである。
According to a sixth aspect of the present invention, in the structured document processing apparatus, a term dictionary containing terms necessary for term verification and information associated with the terms is stored in a dictionary file, and the term processing means is used as term processing means. The term verification means verifies whether the term in the input document is a term contained in the called term dictionary, and detects or corrects an error relating to the term.

【0018】請求項7記載の発明に係る構造化文書処理
装置は、変換前の用語と変換後の用語との対応関係を収
録した変換辞書を辞書ファイル内に格納しておき、用語
処理手段としての用語処理手段により、呼び出された変
換辞書を参照することによって、入力文書中に含まれる
用語を当該用語に対応付けられている別の用語に変換す
るようにしたものである。
According to a seventh aspect of the present invention, in the structured document processing apparatus, a conversion dictionary containing correspondences between terms before conversion and terms after conversion is stored in a dictionary file, and used as term processing means. By referring to the conversion dictionary called by the term processing means, the term included in the input document is converted into another term associated with the term.

【0019】請求項8記載の発明に係る構造化文書処理
装置は、定型文書の入力用画面のレイアウトを記述した
定型文書入力画面記述書を定型文書入力手段で読み込
み、定型文書の入力用画面を作成した後、定型文書の入
力を受理してその結果を出力文書構造木生成手段に送
り、出力文書構造木生成手段では、定型文書入力画面記
述書の記述と出力文書の論理構造の対応関係を記述した
定型文書入力画面記述・出力文書構造木対応表を読み込
んで、定型文書入力手段の出力と定型文書入力画面記述
・出力文書構造木対応表の内容から出力文書構造木を生
成し、それを出力文書構造木バッファに格納するように
したものである。
According to an eighth aspect of the present invention, in the structured document processing apparatus, a fixed document input screen description describing a layout of a fixed document input screen is read by a fixed document input means, and the fixed document input screen is read. After the creation, the input of the standard document is received and the result is sent to the output document structure tree generating means. The output document structural tree generating means checks the correspondence between the description of the standard document input screen description and the logical structure of the output document. Reads the described standard document input screen description / output document structure tree correspondence table and generates an output document structure tree from the output of the standard document input means and the contents of the standard document input screen description / output document structure tree correspondence table. This is stored in the output document structure tree buffer.

【0020】請求項9記載の発明に係る構造化文書処理
装置は、文書構造操作命令解釈実行手段が文書構造操作
命令書を読み込んで、構造要素抽出手段、条件判定手
段、繰り返し構造処理手段、構造要素代入手段、さらに
は、定型文書入力画面における入力枠と出力文書構造木
中の構造要素識別子の対応関係に関する情報を定型文書
入力画面記述・出力文書構造木対応表に代入して定型文
書入力画面記述・出力文書構造木対応表を作成する対応
表代入手段の中から、その読み込んだ文書構造操作命令
書より順次取り出した操作命令のタイプに応じて必要な
ものを選択し、操作命令の解釈実行を行なうようにした
ものである。
According to a ninth aspect of the present invention, in the structured document processing apparatus, the document structure operation instruction interpretation and execution means reads the document structure operation instruction, and reads the structure element extraction means, the condition determination means, the repetitive structure processing means, and the structure. Element substitution means, and further substitutes information relating to the correspondence between the input frame in the standard document input screen and the structural element identifier in the output document structure tree into the standard document input screen description / output document structure tree correspondence table to input the standard document input screen. From the correspondence table substitution means for creating a description / output document structure tree correspondence table, select necessary ones according to the types of operation instructions sequentially extracted from the read document structure operation instructions, and interpret and execute the operation instructions Is performed.

【0021】請求項10記載の発明に係る構造化文書処
理装置は、入出力文書構造対応付け手段を設け、入力文
書文書型定義書と出力文書文書型定義書とを読み込ん
で、それぞれの論理構造を表現する木構造を表示し、そ
れら両者の木構造の構造要素識別子間の対応付けを受理
して文書構造操作命令書を作成するようにしたものであ
る。
According to a tenth aspect of the present invention, there is provided a structured document processing apparatus comprising an input / output document structure associating unit, which reads an input document document type definition document and an output document document type definition document, and reads the respective logical structures. Is displayed, and the correspondence between the structural element identifiers of the two tree structures is received to create a document structure operation instruction.

【0022】[0022]

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.ここではまず、与えられた文書構造操作
命令書を用いて、入力された構造化文書の文書構造を操
作することによって出力文書を生成する、この発明の実
施の形態1による構造化文書処理装置の構成と動作につ
いて説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below. Embodiment 1 FIG. Here, first, an output document is generated by manipulating the document structure of an input structured document using a given document structure operation instruction, and the structured document processing apparatus according to the first embodiment of the present invention. The configuration and operation will be described.

【0023】ここで、構造化文書とは、文書の記述内容
で区別される表題、著者名、序文、本文のような、文書
構成要素の文書中での役割を表現する構造要素識別子を
付与することにより、文書の論理的な構造を表現する文
書のことである。構造化文書は、文書の構成要素中での
役割を表現する構造要素識別子によって文書中の構成要
素を確定することができ、またその後の処理のための属
性を付与することができるので、文書作成・承認、既存
文書の再利用、文書フォーマットの変更、文書保存・検
索・閲覧、データ集計、出版印刷等のアプリケーション
が必要とする情報を計算機が自動的に抽出することが可
能になる。従って、文書を利用した計算機システムより
一層の自動化を推進することができる。
Here, a structured document is provided with a structural element identifier that represents the role of a document component in the document, such as a title, author name, preface, and text, which are distinguished by the description content of the document. This is a document that expresses the logical structure of the document. In the structured document, the components in the document can be determined by the structural element identifiers representing the roles in the components of the document, and attributes for subsequent processing can be added. -Computers can automatically extract information required by applications such as approval, reuse of existing documents, change of document format, document storage / search / browsing, data tabulation, and publication printing. Therefore, it is possible to promote further automation than a computer system using documents.

【0024】以下、この発明の実施の形態1による構造
化文書処理装置を図について説明する。図1はこの実施
の形態1の構造化文書処理装置の構成を示すブロック図
である。図において、11はこの構造化文書処理装置に
入力される入力文書であり、12はこの入力文書の文書
型が定義されている入力文書文書型定義書である。ここ
で、文書型の定義とは、構造化文書において、構造要素
識別子によって識別される文書中の構成要素の出現順序
を規定する記述である。13はこれら入力文書11およ
び入力文書文書型定義書12を読み込み、入力文書文書
型定義書12に記述されている入力文書11の文書型の
定義を参照しながら入力文書11の論理構造を解析した
後、当該入力文書11の論理構造を表現する木構造であ
る入力文書構造木を作成する文書構造解析手段である。
14はこの文書構造解析手段13が作成した入力文書構
造木を記憶する入力文書構造木バッファである。
Hereinafter, a structured document processing apparatus according to a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of the structured document processing apparatus according to the first embodiment. In the figure, reference numeral 11 denotes an input document input to the structured document processing apparatus, and reference numeral 12 denotes an input document document type definition document in which the document type of the input document is defined. Here, the definition of the document type is a description that specifies the order of appearance of the components in the document identified by the structural element identifier in the structured document. Reference numeral 13 reads the input document 11 and the input document document type definition document 12, and analyzes the logical structure of the input document 11 with reference to the document type definition of the input document 11 described in the input document document type definition document 12. Thereafter, the document structure analysis unit creates an input document structure tree which is a tree structure expressing the logical structure of the input document 11.
An input document structure tree buffer 14 stores the input document structure tree created by the document structure analysis means 13.

【0025】15は文書構造木に対する操作命令が記述
されている文書構造操作命令書である。この文書構造操
作命令書15はこの発明の主要要素であって、文書の変
換や文書の正しさの検証など、ユーザが目的とする構造
化文書の処理に必要な文書構造に対する手続きを、文書
構造の操作命令として記述することが可能になる。16
は文書構造操作命令解釈実行手段であり、文書構造操作
命令書15を読み込んで文書構造操作命令書15に記述
された操作命令を解釈実行し、出力文書の論理構造を表
現する木構造である出力文書構造木を入力文書構造木よ
り生成するものである。この文書構造操作命令解釈実行
手段16は、上記文書構造操作命令書15と並んでこの
発明の主要要素であり、文書構造操作命令書15に記述
された操作命令を解釈実行することによって、ユーザが
目的とする構造化文書の処理が実現される。
Reference numeral 15 denotes a document structure operation instruction in which operation instructions for the document structure tree are described. The document structure operation instruction 15 is a main element of the present invention. The document structure operation instruction 15 describes a procedure for a document structure required for processing a structured document intended by a user, such as conversion of a document and verification of the correctness of the document. Can be described as an operation instruction. 16
Is a document structure operation instruction interpreting and executing means, which reads the document structure operation instruction book 15, interprets and executes the operation instructions described in the document structure operation instruction book 15, and outputs a tree structure expressing a logical structure of the output document. The document structure tree is generated from the input document structure tree. The document structure operation instruction interpretation and execution means 16 is a main element of the present invention along with the document structure operation instruction 15 and interprets and executes the operation instructions described in the document structure operation instruction 15 so that the user can execute the operation. The intended processing of the structured document is realized.

【0026】17は構造要素抽出手段であり、文書構造
操作命令書15に記述されている操作命令にしたがっ
て、入力文書構造木バッファ14に格納された入力文書
構造木から構造要素識別子が指定する文書の内容を抽出
するものである。18は条件判定手段であり、文書構造
操作命令書15に記述されている操作命令にしたがっ
て、その構造要素識別子が指定する文書内容に課せられ
る条件により文書の処理内容を制御するものである。1
9は繰り返し構造処理手段であり、文書構造操作命令書
15に記述されている操作命令にしたがって、文書構造
要素識別子が繰り返し出現する場合に、その構造要素識
別子が指定するそれぞれの文書内容に対する操作命令を
解釈実行するものである。20は構造要素代入手段であ
り、文書構造操作命令書15に記述されている操作命令
にしたがって、構造要素識別子が指定する文書の内容を
出力文書構造木に挿入するものである。
Reference numeral 17 denotes a structural element extracting means, which outputs a document specified by a structural element identifier from the input document structural tree stored in the input document structural tree buffer 14 in accordance with the operation instruction described in the document structure operation instruction book 15. To extract the contents of Numeral 18 is a condition determining means for controlling the processing contents of the document in accordance with the conditions imposed on the document content specified by the structural element identifier in accordance with the operation command described in the document structure operation command document 15. 1
Reference numeral 9 denotes a repetitive structure processing means. When a document structure element identifier appears repeatedly according to the operation instruction described in the document structure operation instruction document 15, an operation instruction for each document content specified by the structure element identifier is provided. Is interpreted and executed. Reference numeral 20 denotes a structural element substituting unit which inserts the contents of the document specified by the structural element identifier into the output document structure tree in accordance with the operation instruction described in the document structure operation instruction document 15.

【0027】なお、これら構造要素抽出手段17、条件
判定手段18、繰り返し構造処理手段19、および構造
要素代入手段20は、文書構造操作命令解釈実行手段1
6によって、文書構造操作命令書15から順次取り出さ
れる操作命令のタイプに応じて呼び出されて、当該操作
命令の解釈実行に用いられる。
The structural element extracting means 17, the condition determining means 18, the repetitive structure processing means 19, and the structural element substituting means 20 include the document structure operation instruction interpretation executing means 1
6 is called according to the type of the operation instruction sequentially extracted from the document structure operation instruction 15 and used for interpreting and executing the operation instruction.

【0028】21は出力文書構造木バッファであり、文
書構造操作命令解釈実行手段16による文書構造操作命
令書15に記述された操作命令の解釈実行によって作成
された出力文書構造木を記憶するものである。22は当
該構造化文書処理装置より出力される出力文書の文書型
が定義されている出力文書文書型定義書である。23は
構造化文書生成手段であり、出力文書文書型定義書22
を読み込み、出力文書文書型定義書22に記述されてい
る出力文書の文書型の定義を参照しながら、出力文書構
造木バッファ21に格納されている出力文書構造木より
出力文書を生成するものである。24はこの構造化文書
生成手段23によって生成、出力される出力文書であ
る。
Reference numeral 21 denotes an output document structure tree buffer, which stores an output document structure tree created by interpreting and executing the operation command described in the document structure operation command 15 by the document structure operation command interpretation and execution means 16. is there. Reference numeral 22 denotes an output document document type definition document in which the document type of the output document output from the structured document processing apparatus is defined. Reference numeral 23 denotes a structured document generation unit, and the output document document type definition document 22
And generates an output document from the output document structure tree stored in the output document structure tree buffer 21 while referring to the document type definition of the output document described in the output document document type definition document 22. is there. Reference numeral 24 denotes an output document generated and output by the structured document generation unit 23.

【0029】図2はこの実施の形態1における入力文書
11の一例を示す説明図であり、購入伺い書についてそ
の内容が例示されている。また、図3は同じく出力文書
24の一例を示す説明図であり、購入許可書についてそ
の内容が例示されている。なお、これら図2と図3に示
された入力文書11および出力文書24はともに構造化
文書であり、例えば図2の<伺い書番号>は構造要素識
別子の例であり、この購入伺い書の伺い書番号が「31
4」であることを示している。
FIG. 2 is an explanatory diagram showing an example of the input document 11 according to the first embodiment, and illustrates the contents of a purchase inquiry form. FIG. 3 is an explanatory view showing an example of the output document 24, and the contents of a purchase permit are exemplified. Note that both the input document 11 and the output document 24 shown in FIGS. 2 and 3 are structured documents. For example, <Inquiry Form Number> in FIG. 2 is an example of a structural element identifier, and The inquiry number is "31
4 ".

【0030】以下、この実施の形態1の説明では、図2
に示した購入伺い書に示されている購入希望品の価格の
合計が正しいかどうか、また、200000円以上の購
入伺い書に必要な部長検印があるかどうをチェックした
後、図3に示した購入許可書を作成して出力する場合を
例に説明する。なお、チェックの結果は、図3の購入許
可書中の構造要素識別子である<合計チェック>と<検
印チェック>の中身に挿入されている。
Hereinafter, in the description of the first embodiment, FIG.
After checking whether the sum of the price of the desired product shown in the purchase inquiry form shown in (1) is correct and whether the purchase inquiry form of more than 200,000 yen has the required seal of the general manager, it is shown in FIG. An example in which a purchase permit is created and output will be described. Note that the result of the check is inserted into the contents of <total check> and <seal check>, which are the structural element identifiers in the purchase permit of FIG.

【0031】図4はこの実施の形態1における入力文書
文書型定義書12の内容を示す説明図であり、図2に例
示した入力文書11に対する文書型の定義内容の一例が
示されている。また、図5は同じく出力文書文書型定義
書22の内容を示す説明図であり、図3に例示した出力
文書24に対する文書型の定義内容の一例が示されてい
る。なお、これらの文書型定義は、文書中に出現する構
造要素識別子の順序を規定するものであり、その意味
は、ISO規格8879のSGML(Standard
Generalized Markup Langu
age)における文書型定義に準ずるものである。例え
ば、図4の1行目と2行目は、<購入伺い書>と</購
入伺い書>いう構造要素識別子に挟まれる領域では、<
伺い書番号>、<氏名>、<社員番号>、<購入希望品
>、<合計>、<購入希望会社>、そして<部長検印>
の順に構造要素識別子が出現することを示している。
FIG. 4 is an explanatory diagram showing the contents of the input document document type definition document 12 according to the first embodiment, and shows an example of the contents of the document type definition for the input document 11 shown in FIG. FIG. 5 is an explanatory diagram showing the contents of the output document document type definition document 22, and shows an example of the document type definition contents for the output document 24 shown in FIG. Note that these document type definitions define the order of structural element identifiers that appear in a document, and their meanings are defined in SGML (Standard) according to ISO standard 8879.
Generalized Markup Langu
age) conforms to the document type definition in (age). For example, the first and second lines in FIG. 4 indicate that the area between the structural element identifiers <purchase inquiry sheet> and </ purchase inquiry sheet>
Inquiry form number, <name>, <employee number>, <purchased item>, <total>, <purchased company>, and <general manager seal>
, The structural element identifiers appear in this order.

【0032】図6はこの実施の形態1における入力文書
構造木の一例を示す説明図であり、図2に示した入力文
書11に対して文書構造解析手段13が作成したものを
例示している。図中の「伺い書番号」等の実線の枠付き
の文字列は構造要素識別子であり、構造木は構造要素識
別子間の包含関係を上下関係(図中では左右の関係にな
る)で表現したものである。
FIG. 6 is an explanatory diagram showing an example of the input document structure tree in the first embodiment, and illustrates an example of the input document 11 shown in FIG. . In the figure, a character string with a solid line frame such as “interrogation number” is a structural element identifier, and the structural tree expresses the inclusion relationship between the structural element identifiers in a vertical relationship (a left-right relationship in the diagram). Things.

【0033】なお、構造木の枝が含む構造要素識別子を
図中の左から順に並べたものをパス表現と呼ぶ。例え
ば、図中の点線枠41で囲んで示した枝のパス表現は、
<購入伺い書>.<伺い書番号>であり、点線枠42で
囲んで示した枝のパス表現は、<購入伺い書>.<購入
希望品>.<項目>.<名称>である。また、枝の先に
ある構造要素を指し示す表現として、「パス表現<購入
伺い書>.<伺い書番号>が指し示す構造要素」を用い
る。例えば、図6に示す入力文書構造木において、パス
表現<購入伺い書>.<伺い書番号>が指し示す構造要
素とは「314」であり、パス表現<購入伺い書>.<
購入希望品>.<項目>.<名称>が指し示す構造要素
とは、「ワープロA」である。
Note that a sequence in which the structural element identifiers included in the branches of the structural tree are arranged in order from the left in the figure is called a path expression. For example, a path expression of a branch surrounded by a dotted line frame 41 in the figure is:
<Purchase inquiry form>. <Inquiry form number>, and the path expression of the branch surrounded by a dotted frame 42 is <Purchase inquiry form>. <Purchase item>. <Item>. <Name>. In addition, as the expression indicating the structural element at the tip of the branch, “structural element indicated by path expression <purchase inquiry>. <Inquiry book number>” is used. For example, in the input document structure tree shown in FIG. 6, the path expression <purchase inquiry>. The structural element indicated by the <interrogation letter number> is "314", and the path expression <purchase inquiry letter>. <
Purchased item>. <Item>. The structural element indicated by <name> is “word processor A”.

【0034】図7はこの実施の形態1における文書構造
操作命令書15の一例を示す説明図であり、文書構造木
に対する操作命令の集まりである。操作命令のタイプと
しては、構造要素抽出文、条件文、繰り返し文、構造要
素代入文などがあり、文書構造操作命令解釈実行手段1
6では、これらの操作命令のタイプに応じて、構造要素
抽出手段17、条件判定手段18、繰り返し構造処理手
段19、構造要素代入手段20の中から必要なものを呼
び出して、当該操作命令を解釈実行する。なお、図7
(a)には記述された文書構造木に対する操作命令の一
例を示しており、同図(b)にはその構造要素抽出文に
よって抽出される構造要素の一例を示している。
FIG. 7 is an explanatory diagram showing an example of the document structure operation instruction 15 in the first embodiment, which is a collection of operation instructions for the document structure tree. The type of the operation command includes a structure element extraction statement, a conditional statement, a repetition statement, a structure element assignment statement, and the like.
In step 6, according to the type of these operation instructions, necessary ones are called from among the structural element extracting means 17, the condition judging means 18, the repetitive structure processing means 19, and the structural element substituting means 20, and the operation instructions are interpreted. Run. FIG.
(A) shows an example of an operation instruction for the described document structure tree, and (b) shows an example of a structure element extracted by the structure element extraction statement.

【0035】同図(a)において、点線枠43で囲まれ
た部分は文書構造操作命令書15の宣言文であり、構造
操作の名前が「購入伺い書検印確認」であることを示し
ている。ここでは、構造操作の記述中において、入力フ
ァイルはIで参照され、入力ファイルの文書型定義は
「購入伺い書.dtd」であること、および出力ファイ
ルはOで参照され、出力ファイルの文書型定義は「購入
許可書.dtd」であることを示している。また、点線
枠44で囲まれた部分は変数宣言であり、XとYが変数
であること、さらにYが整数であることを示している。
In FIG. 7A, a portion surrounded by a dotted line frame 43 is a declaration sentence of the document structure operation instruction document 15, which indicates that the name of the structure operation is "purchase inquiry stamp seal confirmation". . Here, in the description of the structure operation, the input file is referred to by I, the document type definition of the input file is “purchase inquiry document.dtd”, and the output file is referred to by O, and the document type of the output file is referred to. The definition indicates that it is “purchase permit. Dtd”. The portion enclosed by a dotted frame 44 is a variable declaration, which indicates that X and Y are variables, and that Y is an integer.

【0036】また、点線枠45で囲まれた部分は構造要
素抽出文であり、入力文書構造木中の<購入伺い書>.
<伺い書番号>で示されるパス表現が指し示す構造要素
を抽出することを示している。図6の説明で述べた例に
よれば、この場合には「314」を抽出する。点線枠4
6で囲まれた部分は構造要素代入文であり、前記構造要
素抽出文(45)によって抽出された構造要素を、出力
文書構造木中のパス表現<購入許可書>.<許可書番号
>に対応する枝に挿入することを示す。具体的には、後
述する図8に示す出力文書構造木のパス表現<購入許可
書>.<許可書番号>に対応する枝に「314」を挿入
することを示している。
The portion enclosed by the dotted line frame 45 is a structural element extraction sentence, and <purchase inquiry>.
This indicates that the structural element indicated by the path expression indicated by <interrogation number> is to be extracted. According to the example described in the description of FIG. 6, “314” is extracted in this case. Dotted frame 4
6 is a structural element assignment statement, and the structural element extracted by the structural element extraction statement (45) is represented by a path expression <purchase permit>. This indicates that it is to be inserted into the branch corresponding to <permit number>. Specifically, a path expression of the output document structure tree shown in FIG. This indicates that "314" is to be inserted into the branch corresponding to <permit number>.

【0037】点線枠47で囲まれた部分は前記構造要素
代入文(46)と同様に、構造要素抽出文を含んだ構造
要素代入文であるが、構造要素抽出文中のパス表現<購
入伺い書>.<購入希望品>.<項目>.<名称>が入
力文書構造木中で繰り返し構造を持つ場合について例示
したものである。この場合には、繰り返し構造を保存し
て枝を挿入することを意味している。具体的には、図6
に示した入力文書構造木中のパス表現<購入伺い書>.
<購入希望品>.<項目>.<名称>に対応する枝は、
ワープロA、プリンタB、表計算ソフトCの3本がある
が、後述する図8に示すように、この構造を保存したま
ま、出力文書構造木中のパス表現<購入許可書>.<購
入許可品>.<品名>に対応する枝を3本作成すること
を示している。
The portion surrounded by the dotted frame 47 is a structure element assignment statement including a structure element extraction statement as in the case of the structure element assignment statement (46). >. <Purchase item>. <Item>. This is an example in which <name> has a repeating structure in the input document structure tree. In this case, it means that the branch is inserted while the repeating structure is preserved. Specifically, FIG.
Path expression in the input document structure tree shown in <Purchase inquiry>.
<Purchase item>. <Item>. The branch corresponding to <name>
Although there are three word processors A, a printer B, and a spreadsheet software C, as shown in FIG. 8 described later, the path expression in the output document structure tree <purchase permit>. <Purchased products>. This indicates that three branches corresponding to <article name> are created.

【0038】点線枠48で囲まれた部分は構造要素抽出
文であり、点線枠49で囲まれた部分は繰り返し文であ
る。繰り返し文(49)は構造要素抽出文(48)によ
って抽出された構造要素の繰り返し構造の中から価格の
部分を取り出し、その価格の合計をYに代入することを
示している。この場合、構造要素抽出文(48)によっ
て抽出される構造要素は、図7(b)に点線枠52に囲
んで示した<名称>と<価格>からなる3つの構造要素
が並んだものになり、それが変数Xに代入される。そし
てこの構造要素(52)から、繰り返し文(49)中の
car(X)によって、図7(b)の点線枠53、5
5、56で囲まれたものがその順番で取り出され、ca
r(X).<価格>によって各々の価格が取り出され
て、その合計が変数Yに格納される。
The portion enclosed by a dotted frame 48 is a structural element extraction sentence, and the portion enclosed by a dotted frame 49 is a repeated sentence. The repetition statement (49) indicates that a price part is extracted from the repetition structure of the structural element extracted by the structural element extraction statement (48), and the sum of the prices is substituted for Y. In this case, the structuring element extracted by the structuring element extraction sentence (48) is one in which three structuring elements consisting of <name> and <price> shown in a dotted frame 52 in FIG. And it is assigned to the variable X. Then, from this structural element (52), by using car (X) in the repetition sentence (49), dotted frames 53, 5 and 5 in FIG.
Items enclosed by 5, 56 are taken out in that order, and ca
r (X). Each price is extracted by <price>, and the total is stored in a variable Y.

【0039】図7(a)の点線枠50で囲まれた部分は
条件文であり、変数Yに格納された購入希望品の合計金
額が入力文書構造木中のパス表現<購入伺い書>.<合
計>の指し示す文書内容に等しいかどうかをチェック
し、等しい場合には出力文書構造木中のパス表現<購入
許可書>.<合計チェック>に対応する枝に「成功」を
挿入し、そうでない場合には「失敗」を挿入することを
示している。また、点線枠51で囲まれた部分も同様の
条件文であり、購入伺い書の合計が200000円を超
える場合には、購入伺い書の<部長検印>が指し示す文
書内容が「あり」かどうかをチェックし、「あり」の場
合には出力文書の<検印チェック>に「成功」を挿入
し、そうでない場合には<検印チェック>に「失敗」を
挿入することを示している。
The part enclosed by the dotted frame 50 in FIG. 7A is a conditional statement, and the total price of the product desired to be stored stored in the variable Y is represented by a path expression <purchase inquiry>. It is checked whether it is equal to the document content indicated by <total>, and if it is, the path expression in the output document structure tree <purchase permit>. "Success" is inserted in the branch corresponding to <Total Check>, and "Fail" is inserted otherwise. The portion enclosed by the dotted frame 51 is the same conditional statement. If the total of the purchase inquiry document exceeds 200000 yen, it is determined whether or not the document content indicated by the <General Manager's seal> of the purchase inquiry document is “Yes”. Indicates that “success” is inserted into <checkmark> of the output document if “yes”, and “failure” is inserted into <checkmark> otherwise.

【0040】このようして導入したパス表現と条件文と
を併用すれば、構成要素識別子の出現の文脈に応じて変
わる処理を記述することが可能となる。例えば、図6に
例示した入力文書構造木においては、<名称>という構
造要素識別子は<購入希望品>および<購入希望会社>
に伴って出現しているが、パス表現として<購入伺い書
>.<購入希望品>.<項目>.<名称>と、<購入伺
い書>.<購入希望会社>.<名称>とを使い分けるこ
とによりこの出現の文脈を区別することができる。従っ
て、従来の構造化文書処理装置では困難であった、構成
要素識別子の出現の文脈に応じてチェックすべき条件が
変わる処理を実行することも可能となる。
When the path expression and the conditional sentence thus introduced are used together, it is possible to describe a process that changes according to the context of the appearance of the component identifier. For example, in the input document structure tree illustrated in FIG. 6, the structural element identifier of <name> is <purchased item> and <purchased company>
, But as a path expression <purchase inquiry>. <Purchase item>. <Item>. <Name> and <Purchase Inquiry Form>. <Purchase company>. By using <name> properly, the context of this appearance can be distinguished. Therefore, it is possible to execute a process in which the condition to be checked changes according to the context of the appearance of the component identifier, which is difficult in the conventional structured document processing apparatus.

【0041】また、同様に、従来の構造化文書処理装置
では困難であった、複数の構成要素識別子名にまたがる
文書内容間の制約条件のチェックについても、図7の繰
り返し文(49)で示したように、パス表現<購入伺い
書>.<購入希望品>.<項目>.<価格>が指し示す
数字の合計が、パス表現<購入伺い書>.<合計>が指
し示す数字の合計に等しいかどうかというような、複数
の構成要素識別子名にまたがる文書内容間の制約条件を
記述することができる。
Similarly, the checking of constraints between document contents over a plurality of constituent element identifiers, which was difficult with the conventional structured document processing apparatus, is also shown by the repetition sentence (49) in FIG. As you can see, pass expression <purchase inquiry form>. <Purchase item>. <Item>. The sum of the numbers indicated by <price> is the path expression <purchase inquiry>. It is possible to describe a constraint condition between document contents spanning a plurality of component element identifier names, such as whether or not <sum> is equal to the sum of the numbers pointed to.

【0042】図8はこの実施の形態1における出力文書
構造木の一例を示す説明図であり、図2に例示した入力
文書11に対して、文書構造操作命令解釈実行手段16
が図7(a)に示した文書構造操作命令書15に記述さ
れている操作命令を解釈実行する過程で、構造要素代入
手段20によって作成されたものである。また、図9は
同じく出力文書の文書型定義構造木の一例を示す説明図
であり、図5に例示した出力文書文書型定義書22に対
応する文書型定義構造木を示している。なお、文書型定
義構造木の構成方法は入力文書構造木を構成する場合と
同様であり、構造要素識別子間の包含関係を上下関係
(図中では左右の関係)で表現することにより得られ
る。
FIG. 8 is an explanatory diagram showing an example of the output document structure tree according to the first embodiment. The input document 11 shown in FIG.
Are created by the structural element substitution means 20 in the process of interpreting and executing the operation instruction described in the document structure operation instruction document 15 shown in FIG. FIG. 9 is an explanatory diagram showing an example of the document type definition structure tree of the output document, and shows a document type definition structure tree corresponding to the output document document type definition document 22 shown in FIG. The configuration method of the document type definition structure tree is the same as that of the case of configuring the input document structure tree, and is obtained by expressing the inclusion relation between the structural element identifiers in a vertical relationship (a left-right relationship in the figure).

【0043】次に動作について説明する。ここで、図1
0はこの実施の形態1における構造化文書処理装置の全
体の動作を示すフローチャートである。まず最初に、文
書構造解析手段13がステップST1において、入力文
書11と入力文書文書型定義書12を読み込み、次いで
ステップST2において入力文書11の文書構造を解析
し、解析結果として入力文書構造木を作成して、それを
入力文書構造木バッファ14に格納する。例えば、入力
文書11が図2に例示したものであり、かつ入力文書文
書型定義書12が図4に例示するものであった場合に
は、図6に例示した入力文書構造木が作成され、その入
力文書構造木が入力文書構造木バッファ14に送られて
記憶される。
Next, the operation will be described. Here, FIG.
0 is a flowchart showing the overall operation of the structured document processing apparatus according to the first embodiment. First, in step ST1, the document structure analysis means 13 reads the input document 11 and the input document document type definition document 12, and then analyzes the document structure of the input document 11 in step ST2. It is created and stored in the input document structure tree buffer 14. For example, when the input document 11 is the one illustrated in FIG. 2 and the input document document type definition document 12 is the one illustrated in FIG. 4, the input document structure tree illustrated in FIG. The input document structure tree is sent to and stored in the input document structure tree buffer 14.

【0044】次に、ステップST3において文書構造操
作命令解釈実行手段16は、文書構造操作命令書15の
読み込みを行ない、さらにステップST4において、そ
の読み込んだ文書構造操作命令書15からそこに記載さ
れている操作命令を順に取り出す。ここで、文書構造操
作命令書15から操作命令が取り出せる場合にはステッ
プST5に進み、取り出せない場合にはステップST1
0に進む。
Next, in step ST3, the document structure operation instruction interpretation / execution means 16 reads the document structure operation instruction 15, and in step ST4, the document structure operation instruction 15 Fetch the operation instructions in order. Here, if the operation command can be extracted from the document structure operation instruction document 15, the process proceeds to step ST5, and if not, the process proceeds to step ST1.
Go to 0.

【0045】ステップST5では、取り出した操作命令
の命令タイプを判定し、その命令タイプに応じて、構造
要素抽出手段17、条件判定手段18、繰り返し構造処
理手段19、構造要素代入手段20の中の必要なものを
呼び出して、取り出された操作命令を解釈実行させる。
当該操作命令の解釈実行が終了した後はステップST4
に戻り、文書構造操作命令書15から次の操作命令を取
り出す。
In step ST5, the instruction type of the fetched operation instruction is determined. Call the necessary ones to interpret and execute the extracted operation instruction.
After the interpretation execution of the operation command is completed, step ST4 is performed.
Then, the next operation instruction is extracted from the document structure operation instruction document 15.

【0046】ステップST5における判定の結果、命令
タイプが構造要素抽出文の場合には構造要素抽出手段1
7を呼び出し、ステップST6において入力文書構造木
から構造要素を抽出する。なお、このステップST6に
おける構造要素抽出の動作の詳細については、図11の
フローチャートを用いて後に説明する。
If the result of determination in step ST5 is that the instruction type is a structural element extraction statement, the structural element extracting means 1
7, and extracts a structural element from the input document structure tree in step ST6. The details of the structure element extraction operation in step ST6 will be described later with reference to the flowchart of FIG.

【0047】また、命令タイプが条件文の場合には、条
件判定手段18を呼び出してステップST7で条件文を
実行し、命令タイプが繰り返し文の場合には、繰り返し
構造処理手段19を呼び出してステップST8で繰り返
し文を実行する。なお、このステップST7における条
件文の実行の処理、およびステップST8における繰り
返し文の実行の処理は公知の方法で実現するものとす
る。
If the instruction type is a conditional statement, the condition judging means 18 is called to execute the conditional statement in step ST7. If the instruction type is a repetitive statement, the repetitive structure processing means 19 is called to execute the step. In step ST8, a repetition statement is executed. The processing of executing the conditional statement in step ST7 and the processing of executing the repetition statement in step ST8 are realized by a known method.

【0048】さらに、命令タイプが構造要素代入文の場
合にはステップST9に進み、構造要素代入手段20を
呼び出して、出力文書構造木バッファ21に記憶されて
いる出力文書構造木の該当部分に構造要素を挿入する。
なお、このステップST9における構造要素挿入の動作
の詳細については、図12のフローチャートを用いて後
に説明する。
Further, if the instruction type is a structural element assignment statement, the process proceeds to step ST 9, where the structural element assignment means 20 is called, and the structure is added to the corresponding portion of the output document structure tree stored in the output document structure tree buffer 21. Insert an element.
The details of the operation of inserting the structural element in step ST9 will be described later with reference to the flowchart of FIG.

【0049】ここで、例えば入力文書構造木バッファ1
4中に記憶されている入力文書構造木が図6に例示した
ものであり、かつ文書構造操作命令書15の内容が図7
に例示したものである場合には、文書構造操作命令解釈
実行手段16による操作命令の解釈実行の終了時におい
て、図8に例示した出力文書構造木が作成され、それが
出力文書構造木バッファ21に格納される。
Here, for example, the input document structure tree buffer 1
4 shows an example of the input document structure tree shown in FIG. 6, and the contents of the document structure operation instruction 15 are shown in FIG.
When the interpretation and execution of the operation command by the document structure operation command interpretation and execution means 16 are completed, the output document structure tree illustrated in FIG. Is stored in

【0050】ステップST4にて文書構造操作命令書1
5から操作命令が取り出せなくなると、構造化文書生成
手段23はステップST10において、出力文書文書型
定義書22の読み込みを行なう。次に構造化文書生成手
段23はステップST11において、その読み込んだ出
力文書文書型定義22を参照しながら、出力文書構造木
バッファ21に格納された出力文書構造木から出力文書
24を作成し、ステップST12において、その作成し
た出力文書24を出力する。なお、ステップST11に
おける出力文書24の作成動作の詳細については、図1
3のフローチャートを用いて後に説明する。
At step ST4, the document structure operation instruction 1
When the operation command cannot be taken out from Step 5, the structured document generating means 23 reads the output document document type definition document 22 in Step ST10. Next, in step ST11, the structured document generating means 23 creates an output document 24 from the output document structure tree stored in the output document structure tree buffer 21 while referring to the read output document document type definition 22. In ST12, the created output document 24 is output. The details of the operation of creating the output document 24 in step ST11 are described in FIG.
This will be described later using the flowchart of FIG.

【0051】図11は上記図10に示したステップST
6による構造要素抽出動作の詳細を示すフローチャート
である。図10に示すステップST5の判定結果によ
り、文書構造操作命令解釈実行手段16によって呼び出
された構造要素抽出手段17が入力文書構造木から構造
要素を抽出する場合、まずステップST21において、
構造要素抽出文からパス表現の取り出しを行なう。次い
でステップST22において、その取り出したパス表現
に対応する入力文書構造木中の枝を探した後、ステップ
ST23にて、入力文書構造木中の枝の下にある構造要
素を取り出し、処理を図10のステップST4に戻す。
FIG. 11 shows step ST shown in FIG.
6 is a flowchart illustrating details of a structural element extraction operation according to No. 6. According to the determination result of step ST5 shown in FIG. 10, when the structural element extracting unit 17 called by the document structure operation instruction interpretation executing unit 16 extracts a structural element from the input document structural tree, first in step ST21,
The path expression is extracted from the structural element extraction statement. Next, in step ST22, after searching for a branch in the input document structural tree corresponding to the extracted path expression, in step ST23, a structural element below the branch in the input document structural tree is extracted, and the process is performed as shown in FIG. Return to step ST4.

【0052】例えば、入力文書構造木バッファ14中に
記憶される入力文書構造木が図6に例示するものであ
り、かつ構造要素抽出文が図7中に例示された点線枠4
5で囲まれたものである場合には、パス表現として<購
入伺い書>.<伺い書番号>が取り出され、入力文書構
造木中の枝として図6の点線枠41で囲まれた部分が選
ばれ、構造要素として「314」が取り出される。
For example, the input document structure tree stored in the input document structure tree buffer 14 is as shown in FIG. 6, and the structuring element extraction sentence is indicated by a dotted line frame 4 in FIG.
If the item is enclosed by 5, the purchase expression is <Purchase Inquiry Form> as the path expression. The <interrogation number> is extracted, a portion surrounded by a dotted frame 41 in FIG. 6 is selected as a branch in the input document structure tree, and “314” is extracted as a structural element.

【0053】図12は上記図10に示したステップST
9による構造要素挿入動作の詳細を示すフローチャート
である。図10に示すステップST5の判定結果によ
り、文書構造操作命令解釈実行手段16によって呼び出
された構造要素代入手段20が、出力文書構造木の該当
部分に構造要素を挿入する場合、まずステップST31
において、構造要素代入文の右辺(:=の右側の部分)
から代入する構造要素を受け取る。次いでステップST
32において、構造要素代入文の左辺(:=の左側の部
分)からパス表現を取り出し、ステップST33におい
て、そのパス表現に対応する入力文書構造木中の枝を探
した後、ステップST34において、その枝の下にステ
ップST31で得られた構造要素を挿入し、処理を図1
0のステップST4に戻す。
FIG. 12 shows step ST shown in FIG.
9 is a flowchart showing details of a structural element insertion operation according to No. 9; As a result of the determination in step ST5 shown in FIG. 10, when the structural element substituting means 20 called by the document structure operating instruction interpretation executing means 16 inserts a structural element into a corresponding part of the output document structural tree, first, in step ST31.
, The right side of the structural element assignment statement (the part to the right of: =)
To receive the structuring element to be assigned. Then step ST
At step 32, a path expression is extracted from the left side of the structuring element assignment statement (the part on the left side of: =). At step ST33, a branch in the input document structure tree corresponding to the path expression is searched for. The structure element obtained in step ST31 is inserted below the branch, and the process is performed as shown in FIG.
Return to step ST4 of "0".

【0054】例えば、入力文書構造木バッファ14中に
記憶されている入力文書構造木が図6に例示したもので
あり、かつ構造要素代入文が図7(a)に例示された点
線枠46で囲まれたものである場合には、代入する構造
要素として「314」を受け取り(ステップST3
1)、パス表現として<購入許可書>.<許可書番号>
が取り出され(ステップST32)、出力文書構造木中
の枝として図8に例示された点線枠57で囲まれている
枝が選ばれ(ステップST33)、構造要素として「3
14」が挿入される(ステップST34)。
For example, the input document structure tree stored in the input document structure tree buffer 14 is the one illustrated in FIG. 6, and the structural element assignment statement is indicated by a dotted frame 46 illustrated in FIG. If the element is enclosed, "314" is received as a structural element to be substituted (step ST3).
1) As a pass expression, <purchase permit>. <Permit number>
Is extracted (step ST32), a branch surrounded by a dotted frame 57 illustrated in FIG. 8 is selected as a branch in the output document structure tree (step ST33), and “3” is used as a structural element.
14 "is inserted (step ST34).

【0055】図13は上記図10に示したステップST
11による出力文書24の生成動作の詳細を示すフロー
チャートである。構造化文書生成手段23が出力文書構
造木から出力文書24を作成する場合、まずステップS
T41において、図10に示すステップST10にて読
み込んだ出力文書文書型定義書22より出力文書24の
文書型定義構造木を作成する。次いでステップST12
において、その文書型定義構造木の文書型定義の枝を左
から順に(図9に示した文書型定義構造木では上から順
に)たどり、たどる枝がある場合にはステップST43
に進み、たどる枝がなくなると図10のステップST1
2に進む。ステップST43では、文書型定義構造木中
の枝に対応する出力文書構造木の枝を探し、その枝に対
応する構造要素識別子と構造要素を出力した後、ステッ
プST42に戻り、たどる枝がなくなるまでこの処理を
繰り返す。
FIG. 13 shows the step ST shown in FIG.
11 is a flowchart showing the details of the operation of generating an output document 24 by the H.11. When the structured document generation unit 23 creates the output document 24 from the output document structure tree, first, in step S
In T41, a document type definition structure tree of the output document 24 is created from the output document document type definition document 22 read in step ST10 shown in FIG. Next, step ST12
, The branches of the document type definition in the document type definition structure tree are traced in order from the left (in the document type definition structure tree shown in FIG. 9 from the top), and if there is a branch to be traced, the process proceeds to step ST43.
When there are no more branches to follow, step ST1 in FIG.
Proceed to 2. In step ST43, a branch of the output document structure tree corresponding to the branch in the document type definition structure tree is searched, and a structure element identifier and a structure element corresponding to the branch are output. Then, the process returns to step ST42 until the branch to be followed disappears. This process is repeated.

【0056】例えば、出力文書構造木バッファ21中に
記憶されている出力文書構造木が図8に例示されたもの
であり、かつ出力文書文書型定義書22が図5に例示さ
れたものである場合には、文書型定義構造木として図9
に例示されたものがステップST41において作成さ
れ、出力文書24として図3に例示した文書が生成され
る。また、ステップST42において文書型定義構造木
の枝を左から順番にたどるとは、図9に例示された出力
文書型定義構造木中で、<購入許可書>.<許可書番号
>、<購入許可書>.<検印チェック>、<購入許可書
>.<合計チェック>、<購入許可書>.<購入許可品
>.<品名>、<購入許可書>.<見積り>.<社名>
の順番にたどることを意味している。
For example, the output document structure tree stored in the output document structure tree buffer 21 is as illustrated in FIG. 8, and the output document document type definition document 22 is as illustrated in FIG. In the case shown in FIG.
Are generated in step ST41, and the document illustrated in FIG. Further, to follow the branches of the document type definition structure tree in order from the left in step ST42 means that in the output document type definition structure tree illustrated in FIG. <Permit number>, <purchase permit>. <Seal Check>, <Purchase Permit>. <Total Check>, <Purchase Permit>. <Purchased products>. <Product Name>, <Purchase Permit>. <Estimate>. <Company name>
It means to follow the order.

【0057】このように、図13に示した処理によっ
て、図8に例示した出力文書構造木の枝の順序が、上か
ら、<購入許可書>.<許可書番号>、<購入許可書
>.<購入許可品>.<品名>、<見積り>.<社名
>、<購入許可書>.<合計チェック>、<購入許可書
>.<検印チェック>の順であるにもかかわらず、図3
に例示した出力文書24では、図9に例示した出力文書
型定義構造木と同じ順序になっている。
As described above, by the processing shown in FIG. 13, the order of the branches of the output document structure tree illustrated in FIG. <Permit number>, <purchase permit>. <Purchased products>. <Product name>, <Estimate>. <Company name>, <Purchase permit>. <Total Check>, <Purchase Permit>. Despite the order of <Seal Check>, FIG.
The output document 24 illustrated in FIG. 9 has the same order as the output document type definition structure tree illustrated in FIG.

【0058】以上のように、この実施の形態1によれ
ば、図2に示した購入伺い書中の購入希望品の価格の合
計金額が当該購入伺い書中の合計と等しいかどうかをチ
ェックするとともに、その合計が200000円以上の
場合には部長検印の有無をチェックし、それらのチェッ
ク結果を含んだ図3に示す購入許可書を出力文書として
生成することができ、このように、高い表現能力を持つ
文書構造操作命令書15に記述された文書構造に対する
操作命令を解釈実行することにより、複数の構成要素識
別子名にまたがる文書内容間の制約条件のチェックや、
構成要素識別子の出現の文脈に応じてチェックすべき条
件が変わる処理の実行など、より高度な構造化文書処理
を実現することが可能となり、さらに、文書構造操作命
令解釈実行手段16を文書構造操作命令書15中の個々
の操作命令に依存しないように実現することができるの
で、対象とする構造化文書の変更や、構造文書の操作内
容の変更に対しても、文書構造操作命令書15のみを変
更するだけでよくなるため、構造化文書処理プログラム
の作成の手間を削減することが可能になるなどの効果が
ある。
As described above, according to the first embodiment, it is checked whether or not the total price of the desired product in the purchase inquiry shown in FIG. 2 is equal to the total in the purchase inquiry. In addition, when the total is 200000 yen or more, the presence / absence of the director's seal is checked, and the purchase permit shown in FIG. 3 including the check results can be generated as an output document. By interpreting and executing an operation instruction for the document structure described in the document structure operation instruction document 15 having the capability, it is possible to check constraints between document contents spanning a plurality of component element identifier names,
It is possible to realize more advanced structured document processing, such as execution of processing in which conditions to be checked are changed in accordance with the context of the appearance of the component element identifier. Since the present invention can be realized without depending on the individual operation instructions in the instruction book 15, only the document structure operation instruction book 15 can be used for the change of the target structured document or the change of the operation content of the structured document. Can be simply changed, so that it is possible to reduce the trouble of creating a structured document processing program.

【0059】実施の形態2.上記実施の形態1では、1
つの入力文書について出力文書を生成するものについて
説明したが、複数の入力文書に対して出力文書を生成す
ることも可能である。この実施の形態2はそのような複
数の入力文書に対して出力文書を生成する構造化文書処
理装置に関するものであり、これにより、一方の入力文
書に記載されている内容と、もう一方の入力文書に記載
されている内容とに矛盾がないかどうかをチェックした
り、複数の入力文書を合成して一つの出力文書を作成す
ることができるようになる。
Embodiment 2 In the first embodiment, 1
Although the case where an output document is generated for one input document has been described, an output document can be generated for a plurality of input documents. The second embodiment relates to a structured document processing apparatus for generating an output document for such a plurality of input documents, whereby the contents described in one input document and the other input document are output. This makes it possible to check whether there is any inconsistency with the contents described in the document, or to create one output document by combining a plurality of input documents.

【0060】以下、そのようなこの発明の実施の形態2
を図について説明する。図14はこの実施の形態2によ
る構造化文書処理装置の構成を示すブロック図であり、
実施の形態1と同一または相当する部分については、図
1と同一符号を付しその説明を省略する。図において、
25は複数入力文書構造木管理手段であり、文書構造解
析手段13から複数の入力文書構造木を順番に受理し、
文書構造操作命令書15から読み出した入力文書識別子
と入力文書構造木とを対応付けて入力文書構造木バッフ
ァ14に格納するものである。また、構造要素抽出手段
17から入力文書識別子と構造要素抽出命令を受理した
場合には、その入力文書識別子に対応する入力文書構造
木から構造要素識別子が指定する文書の内容を抽出す
る。
Hereinafter, such a second embodiment of the present invention will be described.
Will be described with reference to FIG. FIG. 14 is a block diagram showing a configuration of the structured document processing apparatus according to the second embodiment.
Portions that are the same as or correspond to those in Embodiment 1 are given the same reference numerals as in FIG. 1, and descriptions thereof are omitted. In the figure,
Reference numeral 25 denotes a plurality of input document structure trees management means, which sequentially receives a plurality of input document structure trees from the document structure analysis means 13;
The input document identifier read from the document structure operation instruction 15 and the input document structure tree are stored in the input document structure tree buffer 14 in association with each other. When the input document identifier and the structural element extraction command are received from the structural element extracting unit 17, the contents of the document specified by the structural element identifier are extracted from the input document structure tree corresponding to the input document identifier.

【0061】図15はこの実施の形態2における入力文
書11の一例を示す説明図であり、この場合には従業員
名簿の記載例が示されている。この従業員名簿において
は従業員の氏名と社員番号が記載されており、例えば、
氏名「森口 太郎」の社員番号は「15926」であ
り、氏名「今村 次郎」の社員番号は「53589」で
あることを示している。
FIG. 15 is an explanatory diagram showing an example of the input document 11 according to the second embodiment. In this case, a description example of an employee list is shown. In this employee list, the names and numbers of the employees are listed. For example,
The employee number of the name "Taro Moriguchi" is "15926", and the employee number of the name "Jiro Imamura" is "53589".

【0062】図16はこの実施の形態2における、入力
文書識別子と入力文書構造木の対応関係を表現する入力
文書識別子・入力文書構造木対応表の一例を示す説明図
である。この入力文書識別子・入力文書構造木対応表
は、複数入力文書構造木管理手段25が、文書構造操作
命令書15から読み出した入力文書識別子と入力文書構
造木とを対応付けて入力文書構造木バッファ14に格納
する際のデータ構造を示したものである。なお、図中の
点線枠61で囲まれた部分は図2に例示した入力文書1
1に対する入力文書構造木、点線枠62で囲まれた部分
は図15に例示した入力文書11に対する入力文書構造
木であり、点線枠63で囲まれた部分は上記入力文書構
造木(61)中の枝、点線枠64で囲まれた部分は上記
入力文書構造木(62)中の枝である。
FIG. 16 is an explanatory diagram showing an example of an input document identifier / input document structure tree correspondence table expressing the correspondence between an input document identifier and an input document structure tree in the second embodiment. This input document identifier / input document structure tree correspondence table is stored in the input document structure tree buffer by the input document structure tree management means 25 by associating the input document identifier read from the document structure operation instruction 15 with the input document structure tree. 14 shows a data structure when the data is stored. A portion surrounded by a dotted frame 61 in the figure is the input document 1 illustrated in FIG.
The portion surrounded by the dotted line frame 62 is the input document structure tree for the input document 11 illustrated in FIG. 15, and the portion surrounded by the dotted line frame 63 is the input document structure tree (61) in the input document structure tree (61). The portion surrounded by the dotted line frame 64 is a branch in the input document structure tree (62).

【0063】図17はこの実施の形態2における文書構
造操作命令書15の一例を示す説明図であり、図2に例
示した購入伺い書、および図15に例示した従業員名簿
を入力文書11として受理して、購入伺い書における氏
名と社員番号の対応関係が、従業員名簿に記載される氏
名と社員番号の対応関係と同じであるかどうかをチェッ
クするために必要な文書構造の操作命令が記載されてい
る場合について例示している。
FIG. 17 is an explanatory diagram showing an example of the document structure operation instruction 15 in the second embodiment. The purchase inquiry form shown in FIG. 2 and the employee list shown in FIG. Upon receipt, a document structure operation instruction necessary to check whether the correspondence between the name and employee number in the purchase inquiry document is the same as the correspondence between the name and employee number listed in the employee list is issued. This is illustrated for the case described.

【0064】なお、図中の点線枠65で囲まれた部分は
入力文書識別子とその入力文書識別子に対応する文書型
定義の対応関係を記述しており、入力文書識別子I1に
対応する入力文書の文書型定義の名称が「購入伺い書.
dtd」であること、および入力文書識別子I2に対応
する入力文書の文書型定義の名称が「従業員名簿.dt
d」であることを示している。また、点線枠66で囲ま
れた部分は入力文書識別子I1に対応する入力文書構造
木に対する構造要素抽出文であり、図16に示した入力
文書構造木(61)中の点線枠63で囲まれた枝の下の
構造要素を抽出することを示している。同様に、点線枠
67で囲まれた部分は入力文書識別子I2に対応する入
力文書構造木に対する構造要素抽出文であり、図16に
示す入力文書構造木(62)中の点線枠64で囲まれた
枝の下の構造要素を抽出することを示している。
A portion surrounded by a dotted line frame 65 in the figure describes the correspondence between the input document identifier and the document type definition corresponding to the input document identifier. The name of the document type definition is "purchase inquiry form.
dtd ”and the name of the document type definition of the input document corresponding to the input document identifier I2 is“ employee list.dt ”
d ". The portion surrounded by the dotted frame 66 is a structural element extraction sentence for the input document structured tree corresponding to the input document identifier I1, and is surrounded by the dotted frame 63 in the input document structured tree (61) shown in FIG. This indicates that the structural element below the branch is extracted. Similarly, a portion surrounded by a dotted frame 67 is a structural element extraction sentence for the input document structured tree corresponding to the input document identifier I2, and is surrounded by a dotted frame 64 in the input document structured tree (62) shown in FIG. This indicates that the structural element below the branch is extracted.

【0065】このように、文書構造操作命令書15にお
ける構造要素抽出文に入力文書識別子を埋め込むことに
より、入力文書識別子・入力文書構造木対応表中のどの
入力文書構造木から構造要素を抽出するかを表現するこ
とができ、従来の構造化文書処理装置では困難であっ
た、複数の文書間にまたがる内容の整合性のチェックや
文書の合成を行なうことも可能となる。
As described above, by embedding the input document identifier in the structural element extraction statement in the document structure operation instruction 15, the structural element is extracted from which input document structural tree in the input document identifier / input document structural tree correspondence table. Can be expressed, and it is also possible to check the consistency of contents across a plurality of documents and to combine documents, which are difficult with a conventional structured document processing apparatus.

【0066】次に動作について説明する。ここで、図1
8は文書構造操作命令解釈実行手段16によって呼び出
された構造要素抽出手段17により、入力文書構造木バ
ッファ14に記憶されている入力文書識別子・入力文書
構造木対応表中の入力文書構造木から構造要素を抽出す
る際の動作を示すフローチャートである。図10のフロ
ーチャートに示したステップST5における判定の結果
により、構造要素抽出手段17が、入力文書識別子・入
力文書構造木対応表中の入力文書構造木から構造要素を
抽出する場合、まずステップST51において、構造要
素抽出文から入力文書識別子とパス表現の取り出しを行
なう。次いでステップST52において、その取り出し
た入力文書識別子に対応する入力文書構造木に対して、
取り出したパス表現に対応する枝を探す。その後ステッ
プST53において、入力文書構造木中の上記ステップ
ST52で得られた枝の下にある構造要素を取り出し
て、処理を図10のステップST4に戻す。
Next, the operation will be described. Here, FIG.
Reference numeral 8 denotes a structure from the input document structure tree in the input document identifier / input document structure tree correspondence table stored in the input document structure tree buffer 14 by the structure element extraction means 17 called by the document structure operation instruction interpretation execution means 16. It is a flowchart which shows the operation | movement at the time of extracting an element. According to the result of the determination in step ST5 shown in the flowchart of FIG. 10, when the structural element extracting means 17 extracts a structural element from the input document structural tree in the input document identifier / input document structural tree correspondence table, first, in step ST51, Then, the input document identifier and the path expression are extracted from the structural element extraction statement. Next, in step ST52, for the input document structure tree corresponding to the extracted input document identifier,
Search for a branch corresponding to the extracted path expression. Thereafter, in step ST53, the structural element below the branch obtained in step ST52 in the input document structure tree is extracted, and the process returns to step ST4 in FIG.

【0067】例えば、入力文書構造木バッファ14中に
記憶されている入力文書識別子・入力文書構造木対応表
が図16に例示するものであり、かつ構造要素抽出文が
図17に例示された点線枠65で囲まれたものである場
合には、ステップST51においてパス表現として<購
入伺い書>.<社員番号>が取り出され、ステップST
52において入力文書構造木中の枝として、図16中の
点線枠63で囲まれた部分が選ばれ、ステップST53
において構造要素「15926」が取り出される。
For example, the input document identifier / input document structure tree correspondence table stored in the input document structure tree buffer 14 is as shown in FIG. If it is the one enclosed in the frame 65, in step ST51, a <purchase inquiry>. <Employee number> is extracted and step ST
In 52, a portion surrounded by a dotted frame 63 in FIG. 16 is selected as a branch in the input document structure tree, and a step ST53 is performed.
In, the structural element “15926” is extracted.

【0068】以上のように、この実施の形態2によれ
ば、図2に示した購入伺い書と図15に示した従業員名
簿とを入力文書11として受理し、購入伺い書における
氏名と社員番号の対応関係が、従業員名簿に記載される
氏名と社員番号の対応関係と同じであるかどうかをチェ
ックすることができ、このように、入力文書識別子・入
力文書構造木対応表により構造要素を抽出すべき入力文
書構造木を選択することが可能になるので、一方の文書
に記載されている内容ともう一方の文書に記載されてい
る内容とに矛盾があるか否かをチェックしたり、複数の
文書を合成して一つの文書を作成するといったより高度
な構造化文書処理を実現することが可能になるので、構
造化文書に対する文書変換や文書の正しさの検証等の能
力を向上させることができる効果がある。
As described above, according to the second embodiment, the purchase inquiry form shown in FIG. 2 and the employee list shown in FIG. 15 are received as input documents 11, and the name and the employee in the purchase inquiry form are received. It is possible to check whether the correspondence between the numbers is the same as the correspondence between the names and employee numbers described in the employee list, and thus, the input document identifier / input document structure tree correspondence table is used to determine the structural elements. It is possible to select the input document structure tree from which to extract the content, so it is possible to check whether there is any inconsistency between the content described in one document and the content described in the other document. , Which enables more advanced structured document processing, such as combining multiple documents to create a single document, improving the ability to convert documents into structured documents and verify the correctness of documents. To make There can be effectively.

【0069】実施の形態3.上記実施の形態2では、複
数の入力文書に対して出力文書を生成するものについて
説明したが、入力文書から複数の出力文書を生成するこ
とも可能である。この実施の形態3はそのような入力文
書から複数の出力文書を生成する構造化文書処理装置に
関するものであり、これによって、文書中の構造要素が
満たすべき条件に応じて文書を分割することができるよ
うになり、また、上記実施の形態2の構造化文書処理装
置と組み合わせることにより、複数の入力文書から複数
の出力文書を生成することができるようになる。
Embodiment 3 In the second embodiment, a case has been described in which an output document is generated for a plurality of input documents. However, it is also possible to generate a plurality of output documents from an input document. The third embodiment relates to a structured document processing apparatus that generates a plurality of output documents from such an input document. It is possible to generate a plurality of output documents from a plurality of input documents by combining with the structured document processing apparatus of the second embodiment.

【0070】以下、そのようなこの発明の実施の形態3
を図について説明する。図19はこの実施の形態3によ
る構造化文書処理装置の構成を示すブロック図であり、
実施の形態1と同一または相当する部分については、図
1と同一符号を付しその説明を省略する。図において、
26は複数出力文書構造木管理手段であり、構造要素代
入手段20から出力文書識別子と構造要素代入命令を受
理した場合に、その出力文書識別子に対応する出力文書
構造木にその構造要素代入命令が指定する文書の内容を
挿入するものである。
Hereinafter, such a third embodiment of the present invention will be described.
Will be described with reference to FIG. FIG. 19 is a block diagram showing a configuration of the structured document processing apparatus according to the third embodiment.
Portions that are the same as or correspond to those in Embodiment 1 are given the same reference numerals as in FIG. 1, and descriptions thereof are omitted. In the figure,
Reference numeral 26 denotes a plurality of output document structure tree management means. When an output document identifier and a structure element assignment instruction are received from the structure element assignment means 20, the structure element assignment instruction is added to the output document structure tree corresponding to the output document identifier. Inserts the contents of the specified document.

【0071】図20は図3に例示した購入許可書を入力
文書11とする場合の出力文書24の一例を示す説明図
である。なお、同図(a)は図3に示す購入許可書か
ら、購入品の価格が200000円以上の購入品の名称
と価格のリストを抽出、記載した出力文書24について
例示したものである。同様に、図20(b)は図3に示
す購入許可書から、購入品の価格が200000円未満
の購入品の名称と価格のリストを抽出、記載した出力文
書24について例示したものである。
FIG. 20 is an explanatory diagram showing an example of the output document 24 when the purchase license shown in FIG. 3A illustrates an example of the output document 24 in which a list of names and prices of purchased items whose price is 200000 yen or more is extracted and described from the purchase permit shown in FIG. Similarly, FIG. 20B illustrates an example of an output document 24 in which a list of names and prices of purchased items whose purchase prices are less than 200,000 yen is extracted and described from the purchase permit shown in FIG.

【0072】図21はこの実施の形態3における、出力
文書識別子と出力文書構造木の対応関係を表現する入力
文書識別子・入力文書構造木対応表の一例を示す説明図
である。この出力文書識別子・出力文書構造木対応表
は、構造要素代入手段20が文書構造操作命令書15に
記載された構造要素代入文にしたがって出力文書構造木
を作成する際に用いられるものであり、出力文書構造木
バッファ21に記憶されているデータ構造の一例につい
て例示したものである。なお、図中の点線枠71で囲ま
れた部分は図20(a)に示した出力文書24を生成す
るための元となる出力文書構造木であり、点線枠72で
囲まれた部分は図20(b)に示した出力文書24を生
成するための元となる出力文書構造木である。従って、
構造化文書生成手段23により、この出力文書構造木
(71)からは図20(a)に示す出力文書24が生成
され、出力文書構造木(72)からは図20(b)に示
す出力文書24が生成される。また、点線枠73で囲ま
れた部分は上記出力文書構造木(71)中の枝、点線枠
74で囲まれた部分は上記出力文書構造木(72)中の
枝である。
FIG. 21 is an explanatory diagram showing an example of an input document identifier / input document structure tree correspondence table expressing the correspondence between an output document identifier and an output document structure tree in the third embodiment. This output document identifier / output document structure tree correspondence table is used when the structure element assignment means 20 creates an output document structure tree in accordance with the structure element assignment statement described in the document structure operation instruction document 15, 2 illustrates an example of a data structure stored in the output document structure tree buffer 21. The portion surrounded by a dotted frame 71 in the figure is an output document structure tree that is a source for generating the output document 24 shown in FIG. 20A, and the portion surrounded by a dotted frame 72 is This is an output document structure tree from which the output document 24 shown in FIG. 20B is generated. Therefore,
An output document 24 shown in FIG. 20A is generated from the output document structure tree (71) by the structured document generation means 23, and an output document shown in FIG. 20B is generated from the output document structure tree (72). 24 is generated. The portion surrounded by the dotted frame 73 is a branch in the output document structure tree (71), and the portion surrounded by the dotted frame 74 is a branch in the output document structure tree (72).

【0073】図22はこの実施の形態3における文書構
造操作命令書15の一例を示す説明図であり、図3に例
示した購入許可書を入力文書11として受理し、当該購
入許可書中の購入品の価格が200000円以上である
ものとそうでないものに選別した後、各々の条件を満た
す購入品のリストを別文書として出力するために必要な
文書構造の操作命令が記載されている場合について例示
している。より具体的には、購入品の価格が20000
0円以上の場合には、出力文書識別子O1に対応する出
力文書構造木に購入品の品名と価格を挿入し、2000
00円未満の場合には、出力文書識別子O2に対応する
出力文書構造木に購入品の品名と価格を挿入する操作命
令が記載されている。
FIG. 22 is an explanatory diagram showing an example of the document structure operation instruction 15 according to the third embodiment. The purchase permit shown in FIG. 3 is received as the input document 11, and the purchase in the purchase permit is received. The case where the operation order of the document structure necessary to output the list of the purchased items satisfying each condition as a separate document is described after selecting the item whose price is more than 200,000 yen or not. An example is shown. More specifically, the price of the purchased product is 20,000
In the case of 0 yen or more, the name and price of the purchased item are inserted into the output document structure tree corresponding to the output document identifier O1, and
If it is less than 00 yen, an operation instruction for inserting the name and price of the purchased item is described in the output document structure tree corresponding to the output document identifier O2.

【0074】なお、図中の点線枠75で囲まれた部分は
出力文書識別子に対応する文書型定義の対応関係を記述
しており、出力文書識別子O1とO2に対応する入力文
書の文書型定義の名称が「購入品リスト.dtd」であ
ることを示している。また、点線枠76で囲まれた部分
は出力文書識別子O1に対応する出力文書構造木に対す
る構造要素代入文であり、図21に示した出力文書構造
木(71)中の点線枠73で囲まれた枝の下に「200
000以上」という構造要素を挿入することを示してい
る。同様に、点線枠77で囲まれた部分は出力文書識別
子O2に対応する出力文書構造木に対する構造要素代入
文であり、図21に示した出力文書構造木(72)中の
点線枠74で囲まれた枝の下に「200000未満」と
いう構造要素を挿入することを示している。
The portion surrounded by the dotted frame 75 in the figure describes the correspondence between the document types defined for the output document identifiers, and the document type definitions of the input documents corresponding to the output document identifiers O1 and O2. Is "purchase item list.dtd". The portion surrounded by the dotted frame 76 is a structural element assignment statement for the output document structure tree corresponding to the output document identifier O1, and is surrounded by the dotted frame 73 in the output document structure tree (71) shown in FIG. "200
000 or more "is inserted. Similarly, a portion surrounded by a dotted frame 77 is a structural element assignment statement for the output document structured tree corresponding to the output document identifier O2, and is surrounded by a dotted frame 74 in the output document structured tree (72) shown in FIG. This indicates that a structural element “less than 200,000” is inserted below the branch.

【0075】このように、文書構造操作命令書15にお
ける構造要素代入文に出力文書識別子を埋め込むことに
より、出力文書識別子・出力文書構造木対応表中のどの
出力文書構造木に対して構造要素を挿入するかを表現す
ることができ、従来の構造化文書処理装置では困難であ
った、複数の文書間にまたがる内容の整合性のチェック
や文書の分割を行なうことも可能となる。
As described above, by embedding the output document identifier in the structure element assignment statement in the document structure operation instruction document 15, the structure element is assigned to which output document structural tree in the output document identifier / output document structural tree correspondence table. It is possible to express whether to insert the document, and it is also possible to check the consistency of the content over a plurality of documents and to divide the document, which is difficult with a conventional structured document processing apparatus.

【0076】次に動作について説明する。ここで、図2
3は文書構造操作命令解釈実行手段16によって呼び出
された構造要素代入手段20により、出力文書構造木バ
ッファ21に記憶されている出力文書識別子・出力文書
構造木対応表中の出力文書構造木に構造要素を挿入する
際の動作を示すフローチャートである。図10のフロー
チャートに示したステップST5における判定の結果に
より、構造要素代入手段20が出力文書識別子・出力文
書構造木対応表中の出力文書構造木に構造要素を挿入す
る場合、まずステップST61において、構造要素代入
文の右辺(:=の右側の部分)から代入する構造要素を
受け取り、さらにステップST62において、左辺(:
=の左側の部分)から出力文書識別子とパス表現を取り
出す。次いでステップST63において、その取り出し
た出力文書識別子に対応する出力文書構造木に対して、
取り出したパス表現に対応する枝を探す。その後ステッ
プST64において、上記ステップST63で得られた
枝の下に、上記ステップST61で得られた構造要素を
挿入して、処理を図10のステップST4に戻す。
Next, the operation will be described. Here, FIG.
Reference numeral 3 denotes a structure of the output document structure tree in the output document identifier / output document structure tree correspondence table stored in the output document structure tree buffer 21 by the structure element substitution means 20 called by the document structure operation instruction interpretation execution means 16. 9 is a flowchart illustrating an operation when inserting an element. As a result of the determination in step ST5 shown in the flowchart of FIG. 10, when the structural element substitution means 20 inserts a structural element into the output document structural tree in the output document identifier / output document structural tree correspondence table, first in step ST61, The structural element to be substituted is received from the right side (the right part of: =) of the structural element substitution statement, and further, in step ST62, the left side (:
Extract the output document identifier and the path expression from the left part of =). Next, in step ST63, for the output document structure tree corresponding to the extracted output document identifier,
Search for a branch corresponding to the extracted path expression. Thereafter, in step ST64, the structural element obtained in step ST61 is inserted below the branch obtained in step ST63, and the process returns to step ST4 in FIG.

【0077】例えば、出力文書構造木バッファ21に記
憶される出力文書識別子・出力文書構造木対応表が図2
1に例示されたものであり、かつ構造要素代入文が図2
2に例示された点線枠76で囲まれたものである場合に
は、ステップST61において構造要素として「200
000以上」を受け取り、ステップST62においてパ
ス表現として<購入品リスト>.<タイプ>が取り出さ
れる。そして、ステップST63において出力文書構造
木の枝として図21中の点線枠73で囲まれた部分が選
ばれ、ステップST64において構造要素「20000
0以上」が代入される。
For example, the output document identifier / output document structure tree correspondence table stored in the output document structure tree buffer 21 is shown in FIG.
2 and the structural element assignment statement is shown in FIG.
In the case where the frame is surrounded by the dotted frame 76 illustrated in FIG.
000 or more ", and in step ST62, as a path expression <purchase list>. <Type> is retrieved. Then, in step ST63, a portion surrounded by a dotted frame 73 in FIG. 21 is selected as a branch of the output document structure tree, and in step ST64, the structural element "20000"
"0 or more" is substituted.

【0078】以上のように、この実施の形態3によれ
ば、図3に示した購入許可書を入力文書11として受理
し、購入許可書中の購入品の価格が200000円以上
である購入品のリストである、図20(a)に示した出
力文書24と、購入許可書中の購入品の価格が2000
00円未満である購入品のリストである、図20(b)
に示した出力文書を別々に生成することができ、このよ
うに、出力文書識別子・出力文書構造木対応表により構
造要素を挿入すべき出力文書構造木を選択することが可
能になるので、文書中の構造要素が満たすべき条件に応
じて文書を分割したり、複数の入力文書11から複数の
出力文書24を生成するといったより高度な構造化文書
処理を実現することが可能となるので、構造化文書に対
する文書変換や文書の正しさの検証等の能力を向上させ
ることができる効果がある。
As described above, according to the third embodiment, the purchase permit shown in FIG. 3 is accepted as the input document 11, and the purchase price in the purchase permit is 200000 yen or more. The output document 24 shown in FIG. 20A and the price of the purchased item in the purchase
FIG. 20 (b) is a list of purchased items for less than ¥ 00.
Can be separately generated. In this way, it is possible to select an output document structure tree into which a structural element is to be inserted by using the output document identifier / output document structure tree correspondence table. Since it is possible to realize a more advanced structured document process such as dividing a document according to a condition to be satisfied by a structural element therein, or generating a plurality of output documents 24 from a plurality of input documents 11, the structure can be improved. This has the effect of improving the ability to convert a document into a document and verify the correctness of the document.

【0079】実施の形態4.上記各実施の形態において
は、操作命令のタイプが構造要素抽出文、条件文、繰り
返し文、および構造要素代入文であった場合について説
明したが、操作命令のタイプにさらに辞書呼び出し文を
追加することも可能である。実施の形態4はその辞書呼
び出し文を用いて入力文書中に含まれる用語に関する誤
りの検出を行ない、その検出結果を含む文書を生成する
構造化文書処理装置に関するものである。
Embodiment 4 In each of the above-described embodiments, the case where the type of the operation instruction is a structural element extraction statement, a conditional statement, a repetition statement, and a structural element assignment statement has been described. It is also possible. The fourth embodiment relates to a structured document processing apparatus that detects an error relating to a term included in an input document by using the dictionary call sentence and generates a document including the detection result.

【0080】以下、そのようなこの発明の実施の形態4
を図について説明する。図24はこの実施の形態4によ
る構造化文書処理装置の構成を示すブロック図であり、
実施の形態1と同一または相当する部分については、図
1と同一符号を付しその説明を省略する。図において、
27は辞書が格納された辞書ファイルとしての用語辞書
ファイルであり、その辞書として用語検証に必要な用語
と用語に付随する情報を収録した用語辞書が格納された
ものである。28は用語処理手段としての用語検証手段
であり、文書構造操作命令解釈実行手段16から呼び出
され、文書構造操作命令書15中の操作命令にしたがっ
て、入力文書11中の用語が用語辞書ファイル27から
呼び出した用語辞書に収録されている用語かどうかを検
証するものである。29は用語辞書管理手段であり、用
語検証手段28から用語辞書の検索命令を受理すると、
用語辞書ファイル27から呼び出された用語辞書を検索
して、その検索結果を用語検証手段28に返すものであ
る。なお、この用語辞書管理手段29は公知の方法で実
現するものとし、詳細な構成と動作の記述はここでは省
略する。
Hereinafter, such a fourth embodiment of the present invention will be described.
Will be described with reference to FIG. FIG. 24 is a block diagram showing a configuration of the structured document processing apparatus according to the fourth embodiment.
Portions that are the same as or correspond to those in Embodiment 1 are given the same reference numerals as in FIG. 1, and descriptions thereof are omitted. In the figure,
Reference numeral 27 denotes a term dictionary file serving as a dictionary file in which a dictionary is stored. The term dictionary stores terms necessary for term verification and information associated with the terms. Reference numeral 28 denotes term verification means as term processing means. The term verification means 28 is called from the document structure operation instruction interpretation / execution means 16, and the terms in the input document 11 are read from the term dictionary file 27 in accordance with the operation instructions in the document structure operation instruction book 15. This verifies whether the term is included in the called term dictionary. Reference numeral 29 denotes a term dictionary management unit, which receives a term dictionary search command from the term verification unit 28,
A term dictionary called from the term dictionary file 27 is searched, and the search result is returned to the term verification means 28. The term dictionary management means 29 is realized by a known method, and a detailed description of its configuration and operation is omitted here.

【0081】図25はこの実施の形態4における入力文
書11の一例を示す説明図、図26は同じく出力文書2
4の一例を示す説明図である。なお、図25に示す入力
文書11は参考文献のリストを記載した文書を例示した
ものであり、参考文献ごとにタイトルと雑誌名称を記載
している。また、図26に示す出力文書24は図25に
示した参考文献のリストにおける雑誌名称の誤りを記載
した文書を例示したものであり、参考文献中の雑誌名称
の誤りとその誤りの内容を示すエラーメッセージを記載
している。
FIG. 25 is an explanatory view showing an example of the input document 11 according to the fourth embodiment, and FIG.
FIG. 4 is an explanatory diagram showing an example. The input document 11 shown in FIG. 25 is an example of a document in which a list of reference documents is described, and the title and the magazine name are described for each reference document. The output document 24 shown in FIG. 26 is an example of a document describing an error in a magazine name in the list of references shown in FIG. 25. Describes the error message.

【0082】図27はこの実施の形態4における用語辞
書ファイル27より呼び出される用語辞書の内容の一例
を示す説明図である。この用語辞書はその名称(辞書
名)を「雑誌名称辞書」とする、雑誌の名称を収録した
ものについて例示したものであり、「情報処理学会全国
大会」や「情報処理学会論文誌」などはその雑誌の名称
の一例を示したものである。
FIG. 27 is an explanatory diagram showing an example of the contents of the term dictionary called from the term dictionary file 27 in the fourth embodiment. This term dictionary is an example of the name of a magazine, whose name (dictionary name) is "magazine name dictionary". This is an example of the name of the magazine.

【0083】図28はこの実施の形態4における文書構
造操作命令書15の一例を示す説明図であり、図25に
例示した参考文献のリストを入力文書11として受理
し、その参考文献の雑誌名称が図27に例示した「雑誌
名称辞書」に収録されているものかどうかをチェック
し、収録されていない場合にはその雑誌名称とエラーメ
ッセージを含んだ出力文書24を生成するために必要な
文書構造の操作命令が記載されている場合について例示
している。
FIG. 28 is an explanatory diagram showing an example of the document structure operation instruction 15 according to the fourth embodiment. The list of reference documents illustrated in FIG. 25 is received as the input document 11, and the journal name of the reference document is received. Is included in the “magazine name dictionary” illustrated in FIG. 27, and if not, a document necessary to generate an output document 24 including the magazine name and an error message The case where the operation instruction of the structure is described is illustrated.

【0084】図において、点線枠81で囲まれた部分は
辞書識別子とその辞書識別子に対応する辞書名との対応
関係を記述しており、辞書識別子D1の辞書名が「雑誌
名称辞書」であることを示している。点線枠82および
点線枠83で囲まれた部分は構造要素代入文であり、変
数Yにはこれら構造要素代入文(82)および構造要素
代入文(83)によって、図25に例示した入力文書1
1中でパス表現<参考文献>.<項目>が指し示す構造
要素が順番に代入されることを示している。点線枠84
で囲まれた部分は辞書呼び出し文であり、文の左辺(属
することを示す数学記号の左側)のY.<雑誌名称>が
指し示す用語が、文の右辺(属することを示す数学記号
の右側)の辞書識別子D1が示す雑誌名称辞書に収録さ
れているかどうかをチェックする。変数Yには前述のよ
うに、図25の入力文書11中でパス表現<参考文献
>.<項目>が指し示す構造要素が順番に代入されるの
で、結局、当該辞書呼び出し文(84)の左辺である
Y.<雑誌名称>には、入力文書11中の参考文献の雑
誌名称が順番に代入されることになり、この辞書呼び出
し文(84)によって、参考文献の雑誌名称が図27に
例示した雑誌名称辞書に収録されているかどうかをチェ
ックする文書構造の操作命令を表現することができる。
In the figure, a portion surrounded by a dotted frame 81 describes a correspondence between a dictionary identifier and a dictionary name corresponding to the dictionary identifier, and the dictionary name of the dictionary identifier D1 is “magazine name dictionary”. It is shown that. The portion surrounded by the dotted frame 82 and the dotted frame 83 is a structural element assignment statement, and the variable Y is input document 1 illustrated in FIG. 25 by the structural element assignment statement (82) and the structural element assignment statement (83).
1. Path expression in <Reference>. It indicates that the structural elements indicated by <item> are substituted in order. Dotted frame 84
Is a dictionary call sentence, and Y. on the left side of the sentence (left side of the mathematical symbol indicating belonging). It is checked whether the term indicated by the <magazine name> is included in the magazine name dictionary indicated by the dictionary identifier D1 on the right side of the sentence (to the right of the mathematical symbol indicating belonging). As described above, the variable Y has a path expression <reference> in the input document 11 of FIG. Since the structural elements pointed to by <item> are substituted in order, after all, Y.K. The magazine name of the reference in the input document 11 is sequentially substituted for <magazine name>, and the dictionary call sentence (84) changes the magazine name of the reference into the magazine name dictionary illustrated in FIG. It is possible to express an operation instruction of a document structure for checking whether or not it is included in a document.

【0085】次に動作について説明する。ここで、図2
9はこの実施の形態4における構造化文書処理装置の全
体の動作を示すフローチャートである。なお、基本的な
動作は実施の形態1において説明したものと同等である
ためここではその説明は省略し、それとは異なる部分を
中心に説明する。ステップST5において、取り出した
操作命令の命令タイプを判定し、その命令タイプに応じ
て、構造要素抽出手段17、条件判定手段18、繰り返
し構造処理手段19、構造要素代入手段20、用語検証
手段28の中の必要なものを呼び出して、取り出された
操作命令を解釈実行させる。当該操作命令の解釈実行が
終了した後はステップST4に戻り、文書構造操作命令
書15から次の操作命令を取り出す。
Next, the operation will be described. Here, FIG.
9 is a flowchart showing the overall operation of the structured document processing device according to the fourth embodiment. Since the basic operation is the same as that described in the first embodiment, a description thereof will be omitted here, and a description will be given focusing on a different portion. In step ST5, the instruction type of the extracted operation instruction is determined. According to the instruction type, the structural element extraction unit 17, the condition determination unit 18, the repetitive structure processing unit 19, the structural element substitution unit 20, and the term verification unit 28 Call the necessary ones to interpret and execute the extracted operation instruction. After the interpretation of the operation command is completed, the process returns to step ST4, and the next operation command is extracted from the document structure operation command 15.

【0086】ステップST5における判定の結果、命令
タイプが構造要素抽出文であれば構造要素抽出手段17
を呼び出してステップST6で入力文書構造木から構造
要素を抽出し、条件文であれば条件判定手段18を呼び
出してステップST7で条件文を実行し、命令タイプが
繰り返し文であれば繰り返し構造処理手段19を呼び出
してステップST8で繰り返し文を実行し、構造要素代
入文であれば構造要素代入手段20を呼び出してステッ
プST9で出力文書構造木に構造要素を挿入する。ま
た、ステップST5における判定の結果、命令タイプが
辞書呼び出し文であった場合には用語検証手段28を呼
び出して、ステップST13において入力文書11中の
用語が用語辞書ファイル27より呼び出した用語辞書に
収録されている用語かどうかの検証を行なう。
If the result of determination in step ST5 is that the instruction type is a structure element extraction statement, the structure element extraction means 17
To extract the structural elements from the input document structure tree in step ST6, call the condition determining means 18 if it is a conditional sentence, execute the conditional sentence in step ST7, and execute the repeated sentence processing means if the instruction type is a repetitive sentence. 19, the repetition sentence is executed in step ST8, and if it is a structure element assignment statement, the structure element assignment means 20 is called, and in step ST9, a structure element is inserted into the output document structure tree. If the result of determination in step ST5 is that the instruction type is a dictionary call sentence, the term verification means 28 is called, and the terms in the input document 11 are recorded in the term dictionary called from the term dictionary file 27 in step ST13. Verify that the term is used.

【0087】図30はこのステップST13における文
書構造操作命令書15中の辞書呼び出し文を解釈実行す
る動作を示すフローチャートである。文書構造操作命令
解釈実行手段16に呼び出された用語検証手段28は、
まずステップST71において、用語辞書ファイル27
より辞書呼び出し文の右辺にある用語辞書の呼び出しを
行なう。次いでステップST72において、当該辞書呼
び出し文の左辺にある用語が、ステップST71で用語
辞書ファイル27より呼び出した用語辞書に収録されて
いるか否かのチェックを行なう。その結果、当該用語が
その用語辞書に収録されている場合には、ステップST
73に進んで真(true)を返した後、処理を図29
のステップST4に戻す。一方、収録されていない場合
にはステップST74に進んで偽(false)を返し
た後、上記ステップST4に処理を戻す。
FIG. 30 is a flowchart showing the operation of interpreting and executing the dictionary call sentence in the document structure operation instruction 15 in step ST13. The term verification means 28 called by the document structure operation command interpretation execution means 16
First, in step ST71, the term dictionary file 27
The term dictionary on the right side of the dictionary call is called. Next, in step ST72, it is checked whether or not the term on the left side of the dictionary call sentence is included in the term dictionary called from the term dictionary file 27 in step ST71. As a result, if the term is included in the term dictionary, step ST
After returning to 73 and returning true, the process proceeds to FIG.
Return to step ST4. On the other hand, if it is not recorded, the process proceeds to step ST74, returns false, and then returns to step ST4.

【0088】例えば、入力文書11が図25に例示した
ものであり、かつ辞書呼び出し文が図28中に例示され
た点線枠84で囲まれたものであり、かつ用語辞書が図
27に例示したものである場合には、ステップST71
で図27に示す雑誌名称辞書が用語辞書ファイル27か
ら呼び出され、ステップST72で図25に示す入力文
書中の参考文献の雑誌名称である「情報処理学会全国大
会」と「情処論」が当該雑誌名称辞書に収録されている
かどうかのチェックをする。「情報処理学会全国大会」
は図27に示す雑誌名称辞書に収録されているのでステ
ップST73で真(true)を返し、「情処論」は図
27に示す雑誌名称辞書には収録されていないのでステ
ップST74で偽(false)を返す。このステップ
ST74で偽(false)が返された場合の出力文書
24の例が図26に示されている。
For example, the input document 11 is the one illustrated in FIG. 25, the dictionary call sentence is surrounded by a dotted frame 84 illustrated in FIG. 28, and the term dictionary is illustrated in FIG. If so, step ST71
In step ST72, the magazine name dictionary shown in FIG. 27 is called from the term dictionary file 27, and in step ST72, the journal names of the reference documents in the input document shown in FIG. Check if it is included in the magazine name dictionary. "Information Processing Society of Japan National Convention"
Is returned in step ST73 because it is included in the magazine name dictionary shown in FIG. 27. Since "information processing" is not included in the magazine name dictionary shown in FIG. 27, false is returned in step ST74. )return it. FIG. 26 shows an example of the output document 24 in a case where false is returned in step ST74.

【0089】以上のように、この実施の形態4によれ
ば、図25に例示した参考文献リストを入力文書11と
して受理し、参考文献の雑誌名称が図27に示した雑誌
名称辞書に収録されているものかどうかをチェックし
て、収録されていない場合にはその雑誌名称とエラーメ
ッセージを含んだ、図26に例示する出力文書24を生
成することができ、このように、辞書呼び出し文を解釈
実行する用語検証手段28により、入力文書11中に含
まれる用語が用語辞書に含まれるかどうかをチェックす
ることが可能となるため、入力文書11中に含まれる用
語に関する誤りを検出して、その誤り検出の結果を含む
出力文書24を生成するといったより高度な構造化文書
処理を実現することができる効果がある。
As described above, according to the fourth embodiment, the reference list exemplified in FIG. 25 is received as the input document 11, and the journal name of the reference is recorded in the journal name dictionary shown in FIG. It is possible to generate an output document 24 illustrated in FIG. 26 including the magazine name and the error message if it is not recorded. It is possible to check whether or not the term included in the input document 11 is included in the term dictionary by the term verification means 28 that executes the interpretation. There is an effect that it is possible to realize more advanced structured document processing such as generating the output document 24 including the result of the error detection.

【0090】実施の形態5.上記実施の形態4において
は、操作命令のタイプに辞書呼び出し文を追加し、それ
を用いて入力文書中に含まれる用語に関する誤りの検出
を行なう場合について説明したが、その辞書呼び出し文
を用いて、入力文書に含まれる用語を別の用語に変換し
た後、出力文書を生成することも可能である。図31は
そのようなこの発明の実施の形態5による構造化文書処
理装置の構成を示すブロック図であり、実施の形態1と
同一または相当する部分については、図1と同一符号を
付しその説明を省略する。
Embodiment 5 In the fourth embodiment, a case has been described where a dictionary call sentence is added to the type of operation command and an error related to a term included in the input document is detected using the dictionary call sentence. It is also possible to generate an output document after converting a term included in an input document into another term. FIG. 31 is a block diagram showing a configuration of such a structured document processing apparatus according to the fifth embodiment of the present invention. Portions that are the same as or correspond to those in the first embodiment are given the same reference numerals as in FIG. Description is omitted.

【0091】図において、30は辞書が格納された辞書
ファイルとしての変換辞書ファイルであり、辞書として
変換前の用語と変換後の用語の対応関係を収録した変換
辞書が格納されているものである。31は用語処理手段
としての用語変換手段であり、文書構造操作命令解釈実
行手段16から呼び出され、文書構造操作命令書15中
の操作命令にしたがって、入力文書11中の用語をそれ
に対応する別の用語に変換するものである。32は用語
辞書管理手段であり、変換対象となる用語を受理する
と、変換辞書ファイル30から呼び出された変換辞書を
検索して、その用語を対応する別の用語に変換し、その
変換によって得られた用語を用語変換手段31に返すも
のである。なお、この変換辞書管理手段32は公知の方
法で実現するものとし、その詳細な構成と動作の記述は
ここでは省略する。
In the figure, reference numeral 30 denotes a conversion dictionary file as a dictionary file in which a dictionary is stored, and a conversion dictionary storing correspondences between terms before conversion and terms after conversion is stored as a dictionary. . Numeral 31 is term conversion means as term processing means, which is called from the document structure operation instruction interpretation / execution means 16 and converts a term in the input document 11 according to the operation instruction in the document structure operation instruction book 15 into another corresponding word. Is converted into terms. Numeral 32 denotes a term dictionary management means, which receives a term to be converted, searches the conversion dictionary called from the conversion dictionary file 30, converts the term into another corresponding term, and obtains the converted term. The returned term is returned to the term conversion means 31. The conversion dictionary management means 32 is realized by a known method, and a detailed description of its configuration and operation is omitted here.

【0092】図32はこの実施の形態5における入力文
書11の一例を示す説明図、図33は同じく出力文書2
4の一例を示す説明図である。なお、図32に示す入力
文書11は参考文献のリストを記載した文書を例示した
ものであり、参考文献ごとにタイトルと雑誌名称を記載
している。また、図33に示す出力文書24は、用語変
換手段31が変換辞書ファイル30より呼び出した変換
辞書を参照することにより、図32に例示した入力文書
11の雑誌名称を変換した後、出力した文書を例示した
もので、図32に示した入力文書11における参考文献
の雑誌名称「情処論」が「情報処理学会論文誌」に変換
されている。
FIG. 32 is an explanatory view showing an example of the input document 11 according to the fifth embodiment, and FIG.
FIG. 4 is an explanatory diagram showing an example. Note that the input document 11 shown in FIG. 32 is an example of a document in which a list of reference documents is described, and the title and journal name are described for each reference document. The output document 24 shown in FIG. 33 is obtained by converting the magazine name of the input document 11 illustrated in FIG. In the input document 11 shown in FIG. 32, the journal name "information processing theory" of the reference document is converted into "information processing society journal".

【0093】図34はこの実施の形態5における変換辞
書ファイル30より呼び出される変換辞書の内容の一例
を示す説明図である。この変換辞書はその名称(辞書
名)を「雑誌略称・正式名称対応辞書」とし、変換前の
用語として雑誌の略称を収録し、変換後の用語として雑
誌の正式名称を収録している。例えば、「情処全大」の
正式名称は「情報処理学会全国大会」であり、「情処
論」の正式名称は「情報処理学会論文誌」であることを
示している。
FIG. 34 is an explanatory diagram showing an example of the contents of the conversion dictionary called from the conversion dictionary file 30 in the fifth embodiment. This conversion dictionary has its name (dictionary name) as “journal abbreviation / official name correspondence dictionary”, and stores the abbreviation of the magazine as a term before conversion and the official name of the magazine as a term after conversion. For example, the official name of "Jojo Zendai" is "National Convention on Information Processing Society", and the official name of "Jojojo" is "Transactions of Information Processing Society of Japan".

【0094】図35はこの実施の形態5における文書構
造操作命令書15の一例を示す説明図であり、図32に
例示した参考文献のリストを入力文書11として受理
し、その参考文献の雑誌名称が図34に例示した変換辞
書「雑誌略称・正式名称対応辞書」の変換前の用語(略
称)として収録されているかどうかをチェックし、収録
されている場合にはその雑誌名称を変換後の用語(正式
名称)に変換して出力文書24を生成するために必要な
文書構造の操作命令が記載されている場合について例示
している。
FIG. 35 is an explanatory view showing an example of the document structure operation instruction 15 according to the fifth embodiment. The list of reference documents illustrated in FIG. 32 is received as the input document 11, and the journal name of the reference document is received. Is checked as a term (abbreviation) before conversion in the conversion dictionary “dictionary for magazine abbreviation / official name” illustrated in FIG. This example illustrates a case where an operation instruction of a document structure necessary to generate the output document 24 by converting the document into (official name) is described.

【0095】図において、点線枠85で囲まれた部分は
図28の点線枠81で囲まれた部分と同様に、辞書識別
子とその辞書識別子に対応する辞書名との対応関係を記
述しており、辞書識別子D1の辞書名が「雑誌名称略称
・正式名称対応辞書」であることを示している。点線枠
86で囲まれた部分は変換辞書を呼び出す辞書呼び出し
文であり、文の左辺(属することを示す数学記号の左
側)Y.<雑誌名称>が指し示す用語が、文の右辺(属
することを示す数学記号の右側)の辞書識別子D2が指
し示す「雑誌名称・略称正式名称対応辞書」に変換前の
用語として収録されているかどうかをチェックし、収録
されている場合にはその変換前の用語に対応付けられた
変換後の用語を変数Zに代入することを示している。点
線枠87で囲まれた部分は構造要素代入文であり、辞書
呼び出し文(86)によって得られた変換後の用語Zを
出力文書識別子Oが指し示す出力文書構造木のパス表現
<参考文献>.<項目>.<雑誌名>が示す枝の下に挿
入することを示している。従って、この辞書呼び出し文
(86)によって、参考文献の雑誌名称が略称である場
合には、それを正式名称に変換する文書構造の操作命令
を表現することができる。
In the figure, a portion surrounded by a dotted frame 85 describes the correspondence between a dictionary identifier and a dictionary name corresponding to the dictionary identifier, similarly to the portion surrounded by a dotted frame 81 in FIG. , The dictionary name of the dictionary identifier D1 is a “magazine name abbreviation / official name correspondence dictionary”. A portion surrounded by a dotted line frame 86 is a dictionary call sentence for calling the conversion dictionary, and the left side of the sentence (the left side of the mathematical symbol indicating belonging). Determines whether the term indicated by <magazine name> is recorded as a term before conversion in the “dictionary for magazine name / abbreviation formal name” indicated by the dictionary identifier D2 on the right side of the sentence (to the right of the mathematical symbol indicating belonging). This indicates that if a check is made and the term is recorded, the converted term associated with the term before the conversion is substituted for the variable Z. The part enclosed by the dotted frame 87 is a structural element assignment statement, and the path expression of the output document structure tree in which the output document identifier O points to the converted term Z obtained by the dictionary call statement (86) <Reference>. <Item>. This indicates that it is inserted below the branch indicated by <magazine name>. Therefore, according to the dictionary call sentence (86), if the journal name of the reference is an abbreviated name, an operation command of a document structure for converting the abbreviation into an official name can be expressed.

【0096】次に動作について説明する。ここで、図3
6はこの実施の形態5における構造化文書処理装置の、
文書構造操作命令書15中で変換辞書を呼び出す辞書呼
び出し文を解釈実行する動作を示すフローチャートであ
る。なお、全体動作については、図29にそのフローチ
ャートを示した実施の形態4の場合と同様であるため、
ここではその説明は省略する。
Next, the operation will be described. Here, FIG.
Reference numeral 6 denotes a structured document processing apparatus according to the fifth embodiment.
11 is a flowchart showing an operation of interpreting and executing a dictionary call sentence for calling a conversion dictionary in a document structure operation instruction book 15. Note that the overall operation is the same as that of the fourth embodiment whose flowchart is shown in FIG.
Here, the description is omitted.

【0097】まずステップST81において、変換辞書
ファイル30より辞書呼び出し文の右辺にある変換辞書
の呼び出しを行なう。次いでステップST82におい
て、当該辞書呼び出し文の左辺にある用語が、ステップ
ST81で変換辞書ファイル30より呼び出した変換辞
書に収録されているか否かのチェックを行なう。その結
果、当該用語がその変換辞書に収録されている場合には
ステップST83に進んで、辞書呼び出し文の右辺にあ
る変数に変換後の用語を代入した後、真(true)を
返して処理を図29のステップST4に戻す。一方、収
録されていない場合にはステップST84に進んで偽
(false)を返した後、上記ステップST4に処理
を戻す。
First, in step ST81, a conversion dictionary on the right side of a dictionary call sentence is called from the conversion dictionary file 30. Next, in step ST82, it is checked whether or not the term on the left side of the dictionary call sentence is included in the conversion dictionary called from the conversion dictionary file 30 in step ST81. As a result, if the term is included in the conversion dictionary, the process proceeds to step ST83, where the converted term is substituted for a variable on the right side of the dictionary call statement, and true (true) is returned. It returns to step ST4 of FIG. On the other hand, if it is not recorded, the process proceeds to step ST84 to return false, and then returns to step ST4.

【0098】例えば、入力文書11が図32に例示した
ものであり、かつ辞書呼び出し文が図35中に例示され
た点線枠86で囲まれたものであり、かつ変換辞書が図
34に例示したものである場合には、ステップST81
で図34に示した「雑誌名称・正式名称対応辞書」が変
換辞書ファイル30から呼び出され、ステップST82
にて図32に示す入力文書11中の参考文献の雑誌名称
である「情報処理学会全国大会」と「情処論」が当該
「雑誌名称・正式名称対応辞書」に収録されているかど
うかのチェックが行なわれる。その結果、「情報処理学
会全国大会」は図34に示した「雑誌名称・正式名称対
応辞書」に変換前の用語として収録されていないので、
ステップST83において偽(false)を返し、
「情処論」は図34に示した「雑誌名称・正式名称対応
辞書」に変換前の用語として収録されているので、ステ
ップST84において、図35の辞書呼び出し文(8
6)の変数Zに当該「情処論」に対応付けられた変換後
の用語「情報処理学会論文誌」を代入した後、真(tr
ue)を返す。
For example, the input document 11 is the one illustrated in FIG. 32, the dictionary call sentence is surrounded by the dotted line frame 86 illustrated in FIG. 35, and the conversion dictionary is illustrated in FIG. If so, the process proceeds to step ST81.
In step ST82, the "dictionary for magazine name / official name" shown in FIG. 34 is called from the conversion dictionary file 30.
32, it is checked whether the journal names of the reference documents in the input document 11 shown in FIG. 32, "National Convention of Information Processing Society of Japan" and "Information" are included in the "dictionary for magazine names / official names". Is performed. As a result, the “National Convention on Information Processing Society of Japan” is not included as a term before conversion in the “dictionary for magazine name / official name” shown in FIG.
In step ST83, false is returned.
Since "information processing theory" is recorded as a term before conversion in the "magazine name / official name correspondence dictionary" shown in FIG. 34, in step ST84, the dictionary call sentence (8
After substituting the converted term “Transactions of Information Processing Society of Japan” associated with the “information processing theory” into the variable Z of 6), the true (tr
ue).

【0099】以上のように、この実施の形態5によれ
ば、図32に例示した参考文献リストを入力文書11と
して受理して、参考文献の雑誌名称が図34に示した変
換辞書(雑誌略称・正式名称対応辞書)に変換前の用語
(略称)として収録されているものかどうかをチェック
し、収録されている場合にはその雑誌名称を変換後の用
語(正式名称)に変換して出力文書を生成することがで
き、このように、変換辞書を呼び出す辞書呼び出し文を
解釈実行する用語変換手段31により、入力文書11中
に含まれる用語を対応する別の用語に変換することが可
能となるため、入力文書11中に含まれる用語に関する
誤りを修正した文書を生成したり、用語の表記を変更し
た文書を生成するといった、より高度な構造化文書処理
を実現することができる効果がある。
As described above, according to the fifth embodiment, the reference list exemplified in FIG. 32 is received as the input document 11, and the journal name of the reference is changed to the conversion dictionary (journal abbreviation) shown in FIG. Check whether the term (abbreviation) before conversion is included in the dictionary (formal name correspondence dictionary), and if it is, convert the magazine name to the converted term (official name) and output it A document can be generated, and in this manner, the term included in the input document 11 can be converted into another corresponding term by the term conversion unit 31 that interprets and executes a dictionary call sentence that calls the conversion dictionary. Therefore, it is possible to realize more advanced structured document processing, such as generating a document in which an error relating to a term included in the input document 11 is corrected or generating a document in which the description of terms is changed. There is that effect.

【0100】実施の形態6.この発明による構造化文書
処理装置は、定型文書の入力画面を利用して構造化文書
を編集するようにすることも可能である。図37はその
ようなこの発明の実施の形態6による構造化文書処理装
置の構成を示すブロック図であり、実施の形態1と同様
または相当する部分については、図1と同一の符号を付
しその説明を省略する。
Embodiment 6 FIG. The structured document processing apparatus according to the present invention can edit a structured document by using a fixed document input screen. FIG. 37 is a block diagram showing a configuration of such a structured document processing apparatus according to the sixth embodiment of the present invention. Components similar or corresponding to those of the first embodiment are denoted by the same reference numerals as in FIG. The description is omitted.

【0101】図において、33は定型文書入力画面記述
書であり、定型文書の入力用画面のレイアウトを記述し
たものである。34は定型文書入力手段であり、定型文
書入力画面記述書33を読み込み、定型文書の入力用画
面を作成した後、ユーザからの定型文書入力を受理し
て、その結果を後述する出力文書構造木生成手段36に
送るものである。なお、この定型文書画面記述書33と
定型文書入力手段34とは公知の方法で実現するものと
し、ここではその詳細構成と動作の記述は省略する。3
5は定型文書入力画面記述・出力文書構造対応表であ
り、定型文書入力画面記述書33に記述された定型文書
の入力用画面のレイアウトと出力文書24の論理構造と
の対応関係を記述したものである。36は出力文書構造
木生成手段であり、定型文書入力画面記述・出力文書構
造対応表35を読み込んで、定型文書入力手段34の出
力から出力文書構造木を生成し、それを出力文書構造木
バッファ21に格納するものである。
In the drawing, reference numeral 33 denotes a standard document input screen description, which describes the layout of a standard document input screen. Reference numeral 34 denotes a standard document input means, which reads the standard document input screen description 33, creates a screen for inputting the standard document, receives a standard document input from the user, and outputs the result to an output document structure tree described later. This is sent to the generating means 36. The standard document screen description 33 and the standard document input unit 34 are realized by a known method, and the detailed configuration and operation are not described here. 3
Reference numeral 5 denotes a standard document input screen description / output document structure correspondence table, which describes the correspondence between the layout of the standard document input screen described in the standard document input screen description 33 and the logical structure of the output document 24. It is. Reference numeral 36 denotes an output document structure tree generating means which reads a fixed document input screen description / output document structure correspondence table 35, generates an output document structure tree from the output of the fixed document input means 34, and outputs the output document structure tree buffer. 21.

【0102】図38はこの実施の形態6における定型文
書入力画面記述書33の内容の一例を示す説明図であ
り、氏名を「森口 太郎」、「今村 次郎」、「藤井
三郎」の中から選択するメニューと、「品名」と「価
格」という枠に文字列の入力を促す画面を表現したもの
を例示している。なお、その記述形式と意味は、例えば
公知のWWW(World Wide Web)の文書
記述言語HTML(Hyper Text Marku
p Language)に準ずるものとする。
FIG. 38 is an explanatory diagram showing an example of the contents of the standard document input screen description 33 according to the sixth embodiment. The names are "Taro Moriguchi", "Jiro Imamura", "Fujii"
A menu that selects from among “Saburo” and a screen that prompts the user to input a character string in a frame of “article name” and “price” are illustrated. The description format and the meaning are described in, for example, the well-known WWW (World Wide Web) document description language HTML (Hyper Text Marku).
p Language).

【0103】図39は上記図38に例示した定型文書入
力画面記述書33から定型文書入力手段34によって作
成される、この実施の形態6における定型文書入力画面
の一例を示す説明図である。なお、この定型文書入力手
段34による定型文書入力画面の生成動作は、例えば公
知の技術であるWWWのブラウザの動作に準ずるものと
する。
FIG. 39 is an explanatory view showing an example of the fixed form document input screen according to the sixth embodiment created by the fixed form document input means 34 from the fixed form document input screen description 33 exemplified in FIG. Note that the operation of generating the standard document input screen by the standard document input unit 34 conforms to, for example, the operation of a WWW browser which is a known technique.

【0104】図40は図39に例示した定型文書入力画
面に対してユーザがメニュー選択と文字列入力をした結
果、定型文書入力手段34より送出される出力の一例を
示す説明図である。この定型文書入力手段34の出力は
同図に点線枠91で囲んで示すような式の集まりであ
る。なお、図中の&は式の始まりを示す記号であり、こ
の発明では、記号=の左辺を属性と呼び、右辺をその属
性の値と呼ぶ。点線枠91で囲まれた式の例によれば、
「1.2」が属性であり、属性「1.2」の値は「森口
太郎」である。なお、この定型文書入力手段34の出
力中の式の属性は、定型文書入力画面におけるメニュー
を選択する枠や文字列を入力する枠(以後入力枠と呼
ぶ)を同定する識別子の役割を持つ。
FIG. 40 is an explanatory diagram showing an example of an output sent from the standard document input means 34 as a result of the menu selection and the character string input by the user on the standard document input screen shown in FIG. The output of the fixed-form document input means 34 is a group of expressions as shown in FIG. Note that & in the figure is a symbol indicating the beginning of the expression. In the present invention, the left side of the symbol = is called an attribute, and the right side is called the value of the attribute. According to the example of the expression surrounded by the dotted line frame 91,
“1.2” is the attribute, and the value of the attribute “1.2” is “Taro Moriguchi”. The attribute of the expression in the output of the standard document input means 34 has a role of an identifier for identifying a frame for selecting a menu or a frame for inputting a character string (hereinafter referred to as an input frame) on the standard document input screen.

【0105】図41はこの実施の形態6における定型文
書入力画面記述・出力文書構造記述対応表35の一例を
示す説明図であり、定型文書入力画面入力枠の識別子を
構成する数字(以下、入力枠識別子と呼ぶ)と出力文書
構造木における構造要素識別子との対応関係を記述して
いる。この定型文書入力画面記述・出力文書構造記述対
応表35を用いることにより、定型文書の入力画面中の
入力枠と出力文書構造木中の枝に対応するパス表現とを
対応付けることができる。例えば、図40の点線枠91
で囲まれた式の属性「1.2」に対応するパス表現は、
入力枠識別子の1に対応する構造要素識別子が、図41
に点線枠92で囲んで示すように<購入伺い書>であ
り、入力枠識別子の2に対応する構造要素識別子が、点
線枠93で囲んで示すように<氏名>であることから、
<購入伺い書>.<氏名>であることがわかる。
FIG. 41 is an explanatory diagram showing an example of the correspondence table 35 between the fixed-form document input screen description and the output document structure description according to the sixth embodiment. It describes the correspondence between the frame identifier) and the structural element identifier in the output document structure tree. By using the standard document input screen description / output document structure description correspondence table 35, it is possible to associate an input frame in the input screen of the standard document with a path expression corresponding to a branch in the output document structure tree. For example, a dotted frame 91 in FIG.
The path expression corresponding to the attribute “1.2” of the expression enclosed by
The structural element identifier corresponding to the input frame identifier 1 is shown in FIG.
Is a <purchase inquiry form> as shown in a dotted frame 92, and the structural element identifier corresponding to the input frame identifier 2 is <name> as shown in a dotted frame 93.
<Purchase inquiry form>. You can see that it is <name>.

【0106】図42は出力文書構造木生成手段36によ
って生成される、この実施の形態6における出力文書構
造木の一例を示す説明図である。図40の点線枠91で
囲まれた式の属性「1.2」に対応する枝は、図42に
点線枠94で囲んで示したものとなる。なぜなら、図4
1の説明で述べたように、属性「1.2」に対応するパ
ス表現は<購入伺い書>.<氏名>となるからである。
従って、定型文書入力画面記述・出力文書構造対応表3
5を用いることにより、定型文書入力手段34の出力中
の式の属性と出力文書構造木の枝とを対応付けることが
可能となる。また、実施の形態1において説明した動作
と同様にして、構造化文書生成手段23によってこの文
書構造木から図2に例示したものと同様の出力文書24
を生成することができる。
FIG. 42 is an explanatory diagram showing an example of the output document structure tree according to the sixth embodiment generated by the output document structure tree generation means 36. The branch corresponding to the attribute “1.2” of the expression surrounded by the dotted frame 91 in FIG. 40 is the one shown in FIG. 42 surrounded by the dotted frame 94. Because Figure 4
1, the path expression corresponding to the attribute “1.2” is <purchase inquiry>. This is because it becomes <name>.
Therefore, the standard document input screen description / output document structure correspondence table 3
By using No. 5, it becomes possible to associate the attribute of the expression being output from the fixed-form document input means 34 with the branch of the output document structure tree. Further, in the same manner as the operation described in the first embodiment, the structured document generation unit 23 outputs the same output document 24 as that illustrated in FIG.
Can be generated.

【0107】次に動作について説明する。ここで、図4
3は上記出力文書構造木生成手段36の動作を示すフロ
ーチャートである。まずステップST91において、定
型文書入力手段34の出力から式を順に取り出し、取り
出しに成功した場合にはステップST92に進む。一
方、取り出しに失敗した場合にはそのままこの処理を終
了する。ステップST92においては、定型文書入力画
面記述・出力文書構造対応表35を参照し、取り出した
式の左辺(=の左側の部分)に対するパス表現を得る。
次いでステップST93において、その得られたパス表
現に対応する出力文書構造木中の枝を探し、ステップS
T94において、取り出した式の右辺(=の右側の部
分)の文字列を出力文書構造木中の枝に挿入して、一連
の処理を終了する。
Next, the operation will be described. Here, FIG.
3 is a flowchart showing the operation of the output document structure tree generating means 36. First, in step ST91, formulas are sequentially extracted from the output of the standard document input means 34, and if the extraction is successful, the process proceeds to step ST92. On the other hand, if the removal has failed, the process is terminated. In step ST92, referring to the standard document input screen description / output document structure correspondence table 35, a path expression for the left side (the left part of =) of the extracted expression is obtained.
Next, in step ST93, a branch in the output document structure tree corresponding to the obtained path expression is searched for.
In T94, the character string on the right side (the right part of =) of the extracted expression is inserted into a branch in the output document structure tree, and a series of processing ends.

【0108】例えば、ステップST91において取り出
される式が、図40に点線枠91で囲んで示したもので
あり、かつ定型文書入力画面記述・出力文書構造対応表
35が図41に例示したものである場合には、ステップ
ST92において、パス表現として<購入伺い書>.<
氏名>が選択され、ステップST93において、出力文
書構造木の枝として図42に点線枠94で示したものが
選択され、さらにステップST94において、その出力
文書構造木の枝に「森口 太郎」が挿入される。
For example, the formula extracted in step ST91 is shown by being surrounded by a dotted frame 91 in FIG. 40, and the standard document input screen description / output document structure correspondence table 35 is shown in FIG. 41 by way of example. In this case, in step ST92, the path expression is <purchase inquiry>. <
Is selected as a branch of the output document structure tree in step ST93, and in step ST94, "Taro Moriguchi" is inserted into the branch of the output document structure tree in step ST94. Is done.

【0109】以上のように、この実施の形態6によれ
ば、定型文書入力手段34によって作成された、図39
に示す定型文書入力画面中の入力枠をユーザが順次うめ
てゆくことにより、図2に例示したものと同様の出力文
書を生成することができ、このように、出力文書構造木
生成手段36にて定型文書入力手段34の出力から出力
文書構造木を生成することが可能となるため、定型文書
の入力画面を利用して構造化文書を編集することができ
る効果がある。
As described above, according to the sixth embodiment, FIG.
2 can generate an output document similar to that illustrated in FIG. 2 by sequentially filling the input frame in the fixed document input screen shown in FIG. Thus, the output document structure tree can be generated from the output of the fixed document input means 34, so that the structured document can be edited using the fixed document input screen.

【0110】実施の形態7.上記実施の形態6において
は、定型文書入力画面記述・出力文書構造対応表35を
事前に人手で準備する場合について説明したが、それを
当該構造化文書処理装置で生成することによって、定型
文書の入力画面を利用した構造化文書の編集の手間を削
減することも可能である。図44はそのようなこの発明
の実施の形態7による構造化文書処理装置の構成を示す
ブロック図であり、実施の形態6と同様または相当する
部分については、図37と同一の符号を付しその説明を
省略する。図において、37は対応表代入手段であり、
文書構造操作命令解釈実行手段16から呼び出され、文
書構造操作命令書15に記述された操作命令にしたがっ
て、定型文書入力画面における入力枠と出力文書構造木
中の構造要素識別子の対応関係に関する情報を定型文書
入力画面記述・出力文書構造対応表35に代入するもの
である。
Embodiment 7 FIG. In the sixth embodiment, the case has been described in which the standard document input screen description / output document structure correspondence table 35 is manually prepared in advance. However, by generating the same in the structured document processing apparatus, the standard document It is also possible to reduce the trouble of editing the structured document using the input screen. FIG. 44 is a block diagram showing a configuration of such a structured document processing apparatus according to the seventh embodiment of the present invention. Components similar or corresponding to those in the sixth embodiment are denoted by the same reference numerals as in FIG. The description is omitted. In the figure, reference numeral 37 denotes a correspondence table substitution means,
In accordance with the operation command described in the document structure operation instruction book 15 which is called from the document structure operation instruction interpretation executing means 16, information relating to the correspondence between the input frame in the standard document input screen and the structural element identifier in the output document structure tree is obtained. This is substituted into the standard document input screen description / output document structure correspondence table 35.

【0111】図45はこの実施の形態7における定型文
書入力画面記述書33(出力文書24と同じもの)を生
成するために必要な情報を含んだ入力文書の一例を示す
説明図であり、購入伺い書テンプレートについて例示し
たものである。
FIG. 45 is an explanatory diagram showing an example of an input document including information necessary for generating the standard document input screen description 33 (same as the output document 24) according to the seventh embodiment. This is an example of an inquiry form template.

【0112】図46はこの実施の形態7における文書構
造操作命令書15の一例を示す説明図であり、図45に
示した出力文書24を入力文書として受理し、図46に
示す定型文書入力画面記述・出力文書構造対応表35
と、図45に示す定型文書入力画面記述書33を生成す
るために必要な文書構造の操作命令が記載されている場
合について例示している。図において、点線枠95で囲
まれた部分は対応表識別子とその対応表識別子の対応表
を記述しており、対応表識別子Tは「定型文書入力画面
記述・出力文書構造対応表」であることを示している。
また、点線枠96で囲まれた部分は対応表代入文であ
り、この対応表代入文の右辺(:=の右側の部分)を左
辺(:=の左側の部分)の対応表識別子Tが指し示す
「定型文書入力画面記述・出力文書構造対応表」に代入
することを示している。
FIG. 46 is an explanatory view showing an example of the document structure operation instruction 15 according to the seventh embodiment. The output document 24 shown in FIG. 45 is received as an input document, and the standard document input screen shown in FIG. Description / output document structure correspondence table 35
And a case where an operation command of a document structure necessary to generate the standard document input screen description 33 shown in FIG. 45 is described. In the figure, a portion surrounded by a dotted line frame 95 describes a correspondence table identifier and a correspondence table of the correspondence table identifier, and the correspondence table identifier T is a “standard document input screen description / output document structure correspondence table”. Is shown.
The portion surrounded by the dotted line frame 96 is a correspondence table assignment statement, and the correspondence table identifier T of the left side (the left part of: =) indicates the right side (the right part of: =) of the correspondence table assignment statement. It indicates that it is to be substituted into the "standard document input screen description / output document structure correspondence table".

【0113】次に動作について説明する。ここで、図4
7はこの実施の形態7における構造化文書処理装置の全
体の動作を示すフローチャートである。なお、基本的な
動作は実施の形態1において説明したものと同等である
ためここではその説明は省略し、それとは異なる部分を
中心に説明する。ステップST5において、取り出した
操作命令の命令タイプを判定し、その命令タイプに応じ
て、構造要素抽出手段17、条件判定手段18、繰り返
し構造処理手段19、構造要素代入手段20、対応表代
入手段37の中の必要なものを呼び出して、取り出され
た操作命令を解釈実行させる。当該操作命令の解釈実行
が終了した後はステップST4に戻り、文書構造操作命
令書15から次の操作命令を取り出す。ステップST5
における判定の結果、命令タイプが対応表代入文であっ
た場合には対応表代入手段37を呼び出し、ステップS
T14において対応表代入文を解釈実行する。
Next, the operation will be described. Here, FIG.
7 is a flowchart showing the overall operation of the structured document processing apparatus according to the seventh embodiment. Since the basic operation is the same as that described in the first embodiment, a description thereof will be omitted here, and a description will be given focusing on a different portion. In step ST5, the instruction type of the extracted operation instruction is determined, and according to the instruction type, the structural element extracting unit 17, the condition determining unit 18, the repetitive structure processing unit 19, the structural element substituting unit 20, the correspondence table substituting unit 37 Is called to interpret and execute the fetched operation instruction. After the interpretation of the operation command is completed, the process returns to step ST4, and the next operation command is extracted from the document structure operation command 15. Step ST5
If the result of the determination in (1) is that the instruction type is a correspondence table assignment statement, the correspondence table assignment means 37 is called, and step S
At T14, the correspondence table assignment statement is interpreted and executed.

【0114】図48はこのステップST14における文
書構造操作命令書15中の対応表代入文を解釈実行する
動作を示すフローチャートである。文書構造操作命令解
釈実行手段16に呼び出された対応表代入手段37は、
まずステップST101において、対応表代入文の右辺
から入力枠識別子と構造要素識別子を取り出し、次いで
ステップST102において、その取り出した結果を定
型文書入力画面記述・出力文書構造対応表35に代入し
て、処理を図47のステップST4に戻す。例えば、入
力文書11が図45に例示したものであり、かつ対応表
代入文が図46の点線枠96で囲んだものである場合に
は、ステップST101において、入力枠識別子として
1が、そして構造要素識別子として<購入伺い書>がそ
れぞれ取り出され、それをステップST102において
定型文書入力画面記述・出力文書構造対応表35に代入
した結果が、図41に点線枠92で囲んで示した部分に
あたる。
FIG. 48 is a flow chart showing the operation of interpreting and executing the correspondence table assignment statement in the document structure operation instruction 15 in step ST14. The correspondence table substituting means 37 called by the document structure operation instruction interpretation executing means 16
First, in step ST101, an input frame identifier and a structural element identifier are extracted from the right side of the correspondence table assignment statement, and then, in step ST102, the extracted results are substituted into the standard document input screen description / output document structure correspondence table 35 to perform processing. Is returned to step ST4 of FIG. For example, if the input document 11 is the one illustrated in FIG. 45 and the correspondence table assignment statement is the one surrounded by the dotted frame 96 in FIG. 46, in step ST101, 1 is set as the input frame identifier, and <Purchase Inquiry Form> is taken out as an element identifier, and the result obtained by substituting it into the standard document input screen description / output document structure correspondence table 35 in step ST102 corresponds to a portion surrounded by a dotted frame 92 in FIG.

【0115】以上のように、この実施の形態7によれ
ば、図45に示した文書を入力文書11として受理し、
図41に示した定型文書入力画面記述・出力文書構造対
応表35と図38に示した定型文書入力画面記述書33
を生成することができ、このように、対応表代入文を解
釈実行する対応表代入手段37により、定型文書の入力
画面を利用した構造化文書の編集の際に必要となる定型
文書入力画面記述書33と定型文書入力画面記述・出力
文書構造対応表35を、当該構造化文書処理装置で生成
することが可能となるため、定型文書の入力画面を利用
した構造化文書の編集の手間を削減することができる効
果がある。
As described above, according to the seventh embodiment, the document shown in FIG.
The fixed document input screen description / output document structure correspondence table 35 shown in FIG. 41 and the fixed document input screen description 33 shown in FIG.
Can be generated. In this way, the correspondence table assignment means 37 interpreting and executing the correspondence table assignment statement allows the fixed form document input screen description necessary when editing the structured document using the fixed document input screen. It is possible to generate the document 33 and the standard document input screen description / output document structure correspondence table 35 by the structured document processing apparatus, thereby reducing the trouble of editing the structured document using the standard document input screen. There is an effect that can be.

【0116】実施の形態8.上記各実施の形態において
は、文書構造操作命令書15の編集については特に言及
していなかったが、入力文書文書型定義書12と出力文
書文書型定義書22の木構造を表示し、その構造木を操
作することによって、文書構造操作命令書15の編集を
行なうことも可能である。図49はそのようなこの発明
の実施の形態8による構造化文書処理装置の構成を示す
ブロック図であり、実施の形態1と同様または相当する
部分については、図1と同一の符号を付しその説明を省
略する。図において、38は入出力文書構造対応付け手
段であり、入力文書文書型定義書12と出力文書文書型
定義書22とを読み込んで、それぞれの論理構造を表現
する木構造を画面上に表示し、ポインティングデバイス
を用いたユーザの操作による両者の木構造の構造要素識
別子間の対応付けを受理して、文書構造操作命令書15
を作成するものである。
Embodiment 8 FIG. In each of the above embodiments, the editing of the document structure operation instruction 15 is not particularly mentioned, but the tree structures of the input document document type definition document 12 and the output document document type definition document 22 are displayed. By manipulating the tree, the document structure operation instruction 15 can be edited. FIG. 49 is a block diagram showing a configuration of such a structured document processing apparatus according to the eighth embodiment of the present invention. The same reference numerals as in FIG. 1 denote parts similar or corresponding to those in the first embodiment. The description is omitted. In the figure, reference numeral 38 denotes an input / output document structure associating means, which reads the input document document type definition document 12 and the output document document type definition document 22, and displays a tree structure expressing each logical structure on a screen. Receiving the correspondence between the tree-structured structural element identifiers by the user's operation using the pointing device,
Is to create.

【0117】図50はこの実施の形態8における入出力
文書構造対応付け手段38が、入力文書文書型定義書1
2と出力文書文書型定義書22を読み込み、木構造で表
示することによって得られる入出力文書構造対応付けイ
ンタフェースの一例を示す説明図である。図において、
点線枠101で囲まれた部分は図4に示した入力文書文
書型定義書12の論理構造を表現する木構造であり、点
線枠102で囲まれた部分は図5に示した出力文書文書
型定義書22の論理構造を表現する木構造である。点線
枠103で囲まれた部分は上記木構造(101)の枝で
あり、点線枠104で囲まれた部分は上記木構造(10
2)の枝である。105および106はポインティング
デバイスによってその位置が制御されるカーソルであ
る。点線枠107で囲まれた部分は上記カーソル105
を用いて木構造(101)の枝(103)を指定するこ
とにより得られる、入力文書11の文書構造木のパス表
現であり、点線枠108で囲まれた部分は上記カーソル
106を用いて木構造(102)の枝(104)を指定
することにより得られる、出力文書24の文書構造木の
パス表現である。
FIG. 50 shows that the input / output document structure associating means 38 according to the eighth embodiment uses the input document document type definition document 1
2 is an explanatory diagram showing an example of an input / output document structure correspondence interface obtained by reading an output document document type definition document 22 and displaying it in a tree structure. FIG. In the figure,
The portion surrounded by the dotted frame 101 is a tree structure expressing the logical structure of the input document document type definition document 12 shown in FIG. 4, and the portion surrounded by the dotted frame 102 is the output document document type shown in FIG. It is a tree structure expressing the logical structure of the definition document 22. A portion surrounded by a dotted frame 103 is a branch of the tree structure (101), and a portion surrounded by a dotted frame 104 is a branch of the tree structure (10).
It is a branch of 2). Reference numerals 105 and 106 denote cursors whose positions are controlled by a pointing device. The part surrounded by the dotted frame 107 is the cursor 105
Is a path expression of the document structure tree of the input document 11 obtained by specifying the branch (103) of the tree structure (101) using This is a path expression of the document structure tree of the output document 24 obtained by designating the branch (104) of the structure (102).

【0118】図45は入出力文書構造対応付け手段38
によって得られる、この実施の形態8における文書構造
操作命令書15の一例を示す説明図である。図におい
て、点線枠109で囲まれた部分は入力文書11に対し
て生成された構造要素抽出文であり、点線枠110で囲
まれた部分は出力文書24に対して生成された構造要素
代入文である。
FIG. 45 shows an input / output document structure associating means 38.
FIG. 28 is an explanatory diagram showing an example of a document structure operation instruction document 15 according to the eighth embodiment, which is obtained by the above method. In the figure, a portion surrounded by a dotted frame 109 is a structural element extraction statement generated for the input document 11, and a portion surrounded by a dotted frame 110 is a structural element substitution statement generated for the output document 24. It is.

【0119】次に動作について説明する。ここで、図5
2は上記入出力文書構造対応付け手段38の動作を示す
フローチャートである。まずステップST111におい
て、入力文書文書型定義書12と出力文書文書型定義書
22とを読み込んで、それぞれの文書型定義の論理構造
を表現する構造木(以下、文書型定義構造木という)を
画面上に表示する。次いでステップST112におい
て、入力文書11の文書型定義構造木中の枝に対するポ
インティングデバイスによるユーザからの指定を受理す
る。次にステップST113において、その文書型定義
構造木中の枝からパス表現の同定を行なった後、ステッ
プST114において、入力文書11に対する構造要素
抽出文を生成する。次いでステップST115におい
て、出力文書24の文書型定義構造木中の枝に対するポ
インティングデバイスによるユーザからの指定を受理す
る。次にステップST116において、その文書型定義
構造木中の枝からパス表現の同定を行なった後、ステッ
プST117において、出力文書24に対する構造要素
代入文を生成する。
Next, the operation will be described. Here, FIG.
2 is a flowchart showing the operation of the input / output document structure associating means 38. First, in step ST111, the input document document type definition document 12 and the output document document type definition document 22 are read, and a structure tree expressing the logical structure of each document type definition (hereinafter, referred to as a document type definition structure tree) is displayed on a screen. Display above. Next, in step ST112, the pointing device accepts the designation from the user for the branch in the document type definition structure tree of the input document 11. Next, in step ST113, a path expression is identified from a branch in the document type definition structure tree, and in step ST114, a structural element extraction sentence for the input document 11 is generated. Next, in step ST115, the designation from the user by the pointing device for the branch in the document type definition structure tree of the output document 24 is received. Next, in step ST116, a path expression is identified from a branch in the document type definition structure tree, and then in step ST117, a structural element assignment statement for the output document 24 is generated.

【0120】例えば、入力文書文書型定義書12が図4
に例示したものであり、かつ出力文書文書型定義書22
が図5に例示したものである場合には、ステップST1
11において、図50の点線枠101および102で囲
まれた部分に示された木構造が画面表示される。さら
に、ユーザがステップST112でポインティングデバ
イスを用いてカーソル105を移動させ、図50の木構
造(101)の枝(103)を指定した場合、ステップ
ST113では入力文書11の文書型定義構造木とし
て、図50に点線枠107で囲んで示したパス表現を得
る。そして、ステップST114にて図51に点線枠1
09で囲んで示した入力文書11に対する構造要素抽出
文が生成される。また、ユーザがステップST115に
おいて、引き続きポインティングデバイスを用いてカー
ソル106を移動させ、図50に示した木構造(10
2)の枝(104)指定した場合、ステップST116
では出力文書24の文書型定義構造木として、図50に
点線枠108で囲んで示したパス表現を得る。そして、
ステップST117にて図51に点線枠110で囲んで
示した出力文書24に対する構造要素代入文が生成され
る。
For example, the input document document type definition document 12 is shown in FIG.
And the output document document type definition document 22
Is the one illustrated in FIG. 5, the step ST1
At 11, the tree structure shown in the portion surrounded by the dotted frames 101 and 102 in FIG. 50 is displayed on the screen. Further, when the user moves the cursor 105 using the pointing device in step ST112 and designates the branch (103) of the tree structure (101) in FIG. The path expression surrounded by a dotted frame 107 in FIG. 50 is obtained. Then, in step ST114, the dotted frame 1 in FIG.
A structural element extraction sentence for the input document 11 enclosed by 09 is generated. Further, in step ST115, the user continues to move the cursor 106 using the pointing device, and the tree structure (10
When the branch (104) of 2) is designated, step ST116
Then, as the document type definition structure tree of the output document 24, a path expression shown by a dotted frame 108 in FIG. 50 is obtained. And
In step ST117, a structural element assignment statement for the output document 24 shown in FIG.

【0121】以上のように、この実施の形態8によれ
ば、図4および図5に示した入力文書文書型定義書12
と出力文書文書型定義書22を読み込み、入出力構造対
応付けのためのインタフェースを生成、表示して、ポイ
ンティングデバイスによる木構造中の枝の指定を受け付
けることにより、図51に示す文書構造操作命令書15
を生成することができ、このように、インタフェース画
面上に表示された文書型定義構造木をポインティングデ
バイスを用いて操作することにより、文書構造操作命令
書15を編集することが可能となるため、文書構造操作
命令書15の編集の手間を削減することができる効果が
ある。
As described above, according to the eighth embodiment, the input document document type definition document 12 shown in FIGS.
51, an interface for input / output structure correspondence is generated and displayed, and the designation of a branch in the tree structure by the pointing device is received. Book 15
Can be generated, and by operating the document type definition structure tree displayed on the interface screen using the pointing device, the document structure operation instruction 15 can be edited. There is an effect that the trouble of editing the document structure operation instruction 15 can be reduced.

【0122】[0122]

【発明の効果】以上のように、請求項1記載の発明によ
れば、文書構造操作命令解釈実行手段が文書構造操作命
令書を読み込み、そこに記述された操作命令を順番に取
り出して解釈実行することで、文書構造解析手段が入力
文書の論理構造を解析して作成した入力文書構造木より
出力文書構造木を生成し、構造化文書生成手段にてその
出力文書構造木から出力文書を生成するように構成した
ので、高度な構造化文書の処理を実現することが可能と
なり、構造化文書処理プログラムの作成の手間を削減す
ることができる構造化文書処理装置が得られる効果があ
る。
As described above, according to the first aspect of the present invention, the document structure operation instruction interpretation and execution means reads the document structure operation instruction, and sequentially extracts and executes the operation instructions described therein. By doing so, the document structure analysis unit generates an output document structure tree from the input document structure tree created by analyzing the logical structure of the input document, and the structured document generation unit generates an output document from the output document structure tree With such a configuration, it is possible to realize advanced structured document processing, and it is possible to obtain a structured document processing apparatus capable of reducing the trouble of creating a structured document processing program.

【0123】請求項2記載の発明によれば、文書構造操
作命令書を読み込んだ文書構造操作命令解釈実行手段
が、その文書構造操作命令書より順次取り出した操作命
令のタイプに応じて、構造要素識別子の指定する文書内
容を入力文書構造木から抽出する構造要素抽出手段、文
書処理内容を構造要素識別子の指定する文書内容に課せ
られる条件によって制御する条件判定手段、構造要素識
別子の指定する各々の文書内容に対する操作命令を解釈
実行する繰り返し構造処理手段、出力文書構造木に構造
要素識別子が指定する文書内容を挿入する構造要素代入
手段の中から必要なものを選択して、操作命令を解釈実
行するように構成したので、複数の構成要素識別子名に
またがる文書内容間の制約条件のチェックや、構成要素
識別子の出現の文脈に応じてチェックすべき条件が変わ
る処理の実行といった、より高度な構造化文書の処理が
可能になって、構造化文書に対する文書変換や文書の正
しさの検証等の能力を向上させることができ、また、対
象とする構造化文書の変更や、構造文書の操作内容の変
更に対しても、文書構造操作命令書のみを変更するだけ
でよくなるので、構造化文書処理プログラムの作成の手
間を削減することが可能になる効果がある。
According to the second aspect of the present invention, the document structure operation instruction interpretation and execution means which has read the document structure operation instruction book has the structure element according to the type of the operation instruction sequentially extracted from the document structure operation instruction book. Structural element extracting means for extracting the content of the document specified by the identifier from the input document structure tree, condition determining means for controlling the content of the document processing by the conditions imposed on the content of the document specified by the structural element identifier, Interpretation and execution of the operation instruction by selecting the necessary one from the repetitive structure processing means for interpreting and executing the operation instruction for the document contents, and the structure element substitution means for inserting the document contents specified by the structure element identifier into the output document structure tree Check for constraints between document contents that span multiple component identifier names, and the context of the occurrence of component identifiers. It is possible to perform more advanced structured document processing, such as execution of processing that changes conditions to be checked according to it, and it is possible to improve capabilities such as document conversion for structured documents and verification of document correctness, In addition, since it is only necessary to change the document structure operation instruction when changing the target structured document or the content of the operation of the structured document, it is possible to reduce the trouble of creating the structured document processing program. It has the effect that it becomes possible.

【0124】請求項3記載の発明によれば、複数の入力
文書に対する入力文書構造木を管理する複数入力文書構
造木管理手段によって、文書構造解析手段から複数の入
力文書構造木を受理し、入力文書識別子と入力文書構造
木を対応付けて入力文書構造木バッファに格納するとと
もに、構造要素抽出手段から入力文書識別子と構造要素
抽出命令を受理した場合に、その入力文書識別子に対応
する入力文書構造木から構造要素識別子が指定する文書
の内容を抽出するように構成したので、一方の文書に記
載されている内容と他方の文書に記載されている内容と
に矛盾がないかをチェックしたり、複数の文書を合成し
て一つの文書を作成するといった、より高度な構造化文
書処理を実現することが可能になる効果がある。
According to the third aspect of the present invention, the plurality of input document structure trees are managed by the plurality of input document structure tree management means for managing the input document structure trees for the plurality of input documents. The document identifier and the input document structure tree are stored in the input document structure tree buffer in association with each other, and when the input document identifier and the structure element extraction command are received from the structure element extraction means, the input document structure corresponding to the input document identifier is received. Since the structure of the document specified by the structural element identifier is extracted from the tree, it is possible to check whether there is any inconsistency between the contents described in one document and the contents described in the other document, There is an effect that it is possible to realize more advanced structured document processing, such as creating one document by combining a plurality of documents.

【0125】請求項4記載の発明によれば、複数の出力
文書に対する出力文書構造木を管理する複数出力文書構
造木管理手段によって、構造要素代入手段から出力文書
識別子と構造要素代入命令を受理した場合に、その出力
文書識別子に対応する出力文書構造木に構造要素識別子
が指定する文書の内容を挿入するように構成したので、
文書中の構造要素が満たすべき条件に応じて文書を分割
したり、複数の入力文書から複数の出力文書を生成する
といった、より高度な構造化文書処理を実現することが
可能になる効果がある。
According to the fourth aspect of the present invention, the output document identifier and the structure element assignment command are received from the structure element assignment means by the multiple output document structure tree management means for managing the output document structure tree for the plurality of output documents. In this case, since the content of the document specified by the structural element identifier is inserted into the output document structure tree corresponding to the output document identifier,
There is an effect that it is possible to realize more advanced structured document processing such as dividing a document according to a condition to be satisfied by a structural element in the document or generating a plurality of output documents from a plurality of input documents. .

【0126】請求項5記載の発明によれば、文書構造操
作命令書を読み込んだ文書構造操作命令解釈実行手段
が、その文書構造操作命令書より順次取り出した操作命
令のタイプに応じて、構造要素抽出手段、条件判定手
段、繰り返し構造処理手段、構造要素代入手段、さらに
は辞書ファイルから辞書を呼び出した辞書を参照して入
力文書中に含まれる用語の処理を行なう用語処理手段の
中から必要なものを選択して、操作命令を解釈実行する
ように構成したので、入力文書中に含まれる用語につい
て所望の処理を行なうことが可能になり、構造化文書に
対する文書変換や文書の正しさの検証等の処理能力を向
上させることができる効果がある。
According to the fifth aspect of the present invention, the document structure operation instruction interpreting and executing means which has read the document structure operation instruction is configured to execute the structure element in accordance with the type of the operation instruction sequentially extracted from the document structure operation instruction. The extraction means, the condition determination means, the repetitive structure processing means, the structure element substitution means, and the term processing means for processing the terms contained in the input document by referring to the dictionary that called the dictionary from the dictionary file are required. Since it is configured to select an object and interpret and execute the operation instruction, it is possible to perform desired processing on terms included in the input document, to convert a structured document into a document, and to verify the correctness of the document. There is an effect that the processing capacity such as can be improved.

【0127】請求項6記載の発明によれば、辞書ファイ
ルに用語検証に必要な用語と用語に付随する情報を収録
した用語辞書を格納し、入力文書中の用語が呼び出され
た用語辞書に収録されている用語かどうかを用語検証手
段にて検証するように構成したので、入力文書中に含ま
れる用語に関する誤りの検出や、誤った用語の修正を行
なうことが可能となり、構造化文書に対する文書の正し
さについての検証能力を向上させることができる効果が
ある。
According to the sixth aspect of the present invention, the dictionary file stores a term dictionary containing terms necessary for term verification and information accompanying the terms, and the terms in the input document are recorded in the called term dictionary. Since the term verification means is used to verify whether or not a term is included in the input document, it is possible to detect errors relating to the terms contained in the input document and correct the erroneous terms. There is an effect that the ability to verify the correctness of the data can be improved.

【0128】請求項7記載の発明によれば、辞書ファイ
ルに変換前の用語と変換後の用語との対応関係を収録し
た変換辞書を格納し、用語変換手段が呼び出された変換
辞書を参照して、入力文書中に含まれる用語を当該用語
に対応付けられている別の用語に変換するように構成し
たので、使用している用語の表記を変更した文書を生成
することが可能になる効果がある。
According to the seventh aspect of the present invention, the dictionary file stores a conversion dictionary in which the correspondence between the terms before conversion and the terms after conversion is stored, and the term conversion means refers to the called conversion dictionary. Is configured to convert a term included in the input document into another term associated with the term, so that it is possible to generate a document in which the notation of the term used is changed. There is.

【0129】請求項8記載の発明によれば、定型文書入
力手段において、定型文書の入力用画面のレイアウトを
記述した定型文書入力画面記述書を読み込んで定型文書
の入力用画面を作成した後、ユーザの定型文書入力を受
理してその結果を出力文書構造木生成手段に送り、出力
文書構造木生成手段において、定型文書入力画面記述書
の記述と出力文書の論理構造の対応関係を記述した定型
文書入力画面記述・出力文書構造木対応表を読み込ん
で、定型文書入力手段の出力と定型文書入力画面記述・
出力文書構造木対応表の内容から出力文書構造木を生成
し、それを出力文書構造木バッファに格納するように構
成したので、定型文書の入力画面を利用して構造化文書
を編集することが可能となり、構造化文書の作成を容易
化することができる効果がある。
According to the eighth aspect of the invention, the standard document input means reads the standard document input screen description describing the layout of the standard document input screen and creates the standard document input screen. A user receives a standard document input and sends the result to an output document structure tree generating means. In the output document structure tree generating means, a fixed form describing the correspondence between the description of the fixed document input screen description and the logical structure of the output document. The document input screen description / output document structure tree correspondence table is read, and the output of the standard document input means and the standard document input screen description /
Since the output document structure tree is generated from the contents of the output document structure tree correspondence table and is stored in the output document structure tree buffer, it is possible to edit the structured document using the input screen of the standard document. This makes it possible to easily create a structured document.

【0130】請求項9記載の発明によれば、文書構造操
作命令書を読み込んだ文書構造操作命令解釈実行手段
が、その文書構造操作命令書より順次取り出した操作命
令のタイプに応じて、構造要素抽出手段、条件判定手
段、繰り返し構造処理手段、構造要素代入手段、さらに
は定型文書入力画面における入力枠と出力文書構造木中
の構造要素識別子の対応関係に関する情報を定型文書入
力画面記述・出力文書構造木対応表に代入して、定型文
書入力画面記述・出力文書構造木対応表を作成する対応
表代入手段の中から必要なものを選択して、操作命令を
解釈実行するように構成したので、定型文書の入力画面
を利用した構造化文書の編集の際に必要となる定型文書
入力画面記述書と定型文書入力画面記述・出力文書構造
対応表を生成することができるようになり、定型文書の
入力画面を利用した構造化文書の編集の手間を削減する
ことが可能となって、構造化文書の作成をより効率化す
ることができる効果がある。
According to the ninth aspect of the present invention, the document structure operation instruction interpreting and executing means which reads the document structure operation instruction forms the structural element according to the type of the operation instruction sequentially extracted from the document structure operation instruction. Extraction means, condition determination means, repetitive structure processing means, structure element substitution means, and information on the correspondence between the input frame in the fixed document input screen and the structural element identifier in the output document structure tree. It is configured to interpret and execute the operation command by selecting the necessary one from the correspondence table substitution means for creating the fixed document input screen description / output document structure tree correspondence table by substituting it into the structure tree correspondence table. To generate a standard document input screen description and a standard document input screen description / output document structure correspondence table required when editing structured documents using the standard document input screen Can be as becomes, it becomes possible to reduce the labor of editing a structured document using an input screen of the standard document, there is an effect that can be more efficient to create a structured document.

【0131】請求項10記載の発明によれば、入出力文
書構造対応付け手段にて入力文書文書型定義書と出力文
書文書型定義書を読み込み、それぞれの論理構造を表現
する木構造を表示し、それら両者の木構造の構造要素識
別子間の対応付けを受理して文書構造操作命令書を作成
するように構成したので、画面上に表示された文書型定
義構造木をポインティングデバイスなどを用いて操作す
ることにより、文書構造操作命令書を編集することが可
能となり、文書構造操作命令書の編集の手間を軽減する
ことができ、構造化文書の作成をより効率的に行なうこ
とができる効果がある。
According to the tenth aspect of the present invention, the input / output document structure correspondence means reads the input document document type definition document and the output document document type definition document, and displays a tree structure expressing each logical structure. Since the document structure operation instruction is created by accepting the correspondence between the structural element identifiers of the two tree structures, the document type definition structure tree displayed on the screen is displayed using a pointing device or the like. By performing the operation, the document structure operation instruction can be edited, the labor for editing the document structure operation instruction can be reduced, and the effect that the structured document can be created more efficiently can be obtained. is there.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施の形態1による構造化文書処
理装置の構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a structured document processing device according to a first embodiment of the present invention.

【図2】 この発明の実施の形態1における入力文書の
一例を示す説明図である。
FIG. 2 is an explanatory diagram showing an example of an input document according to Embodiment 1 of the present invention.

【図3】 この発明の実施の形態1における出力文書の
一例を示す説明図である。
FIG. 3 is an explanatory diagram illustrating an example of an output document according to Embodiment 1 of the present invention;

【図4】 この発明の実施の形態1における入力文書文
書型定義書の一例を示す説明図である。
FIG. 4 is an explanatory diagram showing an example of an input document document type definition document according to the first embodiment of the present invention.

【図5】 この発明の実施の形態1における出力文書文
書型定義書の一例を示す説明図である。
FIG. 5 is an explanatory diagram showing an example of an output document document type definition document according to the first embodiment of the present invention.

【図6】 この発明の実施の形態1における入力文書構
造木の一例を示す説明図である。
FIG. 6 is an explanatory diagram showing an example of an input document structure tree according to the first embodiment of the present invention.

【図7】 この発明の実施の形態1における文書構造操
作命令書の一例を示す説明図である。
FIG. 7 is an explanatory diagram showing an example of a document structure operation instruction according to the first embodiment of the present invention.

【図8】 この発明の実施の形態1における出力文書構
造木の一例を示す説明図である。
FIG. 8 is an explanatory diagram illustrating an example of an output document structure tree according to Embodiment 1 of the present invention;

【図9】 この発明の実施の形態1における出力文書の
文書型定義構造木の一例を示す説明図である。
FIG. 9 is an explanatory diagram showing an example of a document type definition structure tree of an output document according to the first embodiment of the present invention.

【図10】 この発明の実施の形態1における構造化文
書処理装置の全体動作を示すフローチャートである。
FIG. 10 is a flowchart illustrating an overall operation of the structured document processing device according to the first embodiment of the present invention.

【図11】 この発明の実施の形態1における構造要素
抽出手段の動作を示すフローチャートである。
FIG. 11 is a flowchart illustrating an operation of a structural element extracting unit according to the first embodiment of the present invention.

【図12】 この発明の実施の形態1における構造要素
代入手段の動作を示すフローチャートである。
FIG. 12 is a flowchart showing an operation of a structural element substituting unit according to the first embodiment of the present invention.

【図13】 この発明の実施の形態1における構造化文
書生成手段の動作を示すフローチャートである。
FIG. 13 is a flowchart showing an operation of a structured document generation unit according to the first embodiment of the present invention.

【図14】 この発明の実施の形態2による構造化文書
処理装置の構成を示すブロック図である。
FIG. 14 is a block diagram illustrating a configuration of a structured document processing device according to a second embodiment of the present invention.

【図15】 この発明の実施の形態2における入力文書
の一例を示す説明図である。
FIG. 15 is an explanatory diagram showing an example of an input document according to Embodiment 2 of the present invention.

【図16】 この発明の実施の形態2における入力文書
識別子・入力文書構造木対応表の一例を示す説明図であ
る。
FIG. 16 is an explanatory diagram showing an example of an input document identifier / input document structure tree correspondence table according to Embodiment 2 of the present invention;

【図17】 この発明の実施の形態2における文書構造
操作命令書の一例を示す説明図である。
FIG. 17 is an explanatory diagram showing an example of a document structure operation command according to Embodiment 2 of the present invention.

【図18】 この発明の実施の形態2における構造要素
抽出手段の動作を示すフローチャートである。
FIG. 18 is a flowchart showing an operation of a structural element extracting unit according to Embodiment 2 of the present invention.

【図19】 この発明の実施の形態3による構造化文書
処理装置の構成を示すブロック図である。
FIG. 19 is a block diagram showing a configuration of a structured document processing device according to a third embodiment of the present invention.

【図20】 この発明の実施の形態3における出力文書
の一例を示す説明図である。
FIG. 20 is an explanatory diagram showing an example of an output document according to Embodiment 3 of the present invention.

【図21】 この発明の実施の形態3における出力文書
識別子・出力文書構造木対応表の一例を示す説明図であ
る。
FIG. 21 is an explanatory diagram showing an example of an output document identifier / output document structure tree correspondence table according to Embodiment 3 of the present invention.

【図22】 この発明の実施の形態3における文書構造
操作命令書の一例を示す説明図である。
FIG. 22 is an explanatory diagram showing an example of a document structure operation instruction according to Embodiment 3 of the present invention.

【図23】 この発明の実施の形態3における構造要素
代入手段の動作を示すフローチャートである。
FIG. 23 is a flowchart showing an operation of a structural element substituting unit according to Embodiment 3 of the present invention.

【図24】 この発明の実施の形態4による構造化文書
処理装置の構成を示すブロック図である。
FIG. 24 is a block diagram showing a configuration of a structured document processing device according to a fourth embodiment of the present invention.

【図25】 この発明の実施の形態4における入力文書
の一例を示す説明図である。
FIG. 25 is an explanatory diagram showing an example of an input document according to Embodiment 4 of the present invention.

【図26】 この発明の実施の形態4における出力文書
の一例を示す説明図である。
FIG. 26 is an explanatory diagram showing an example of an output document according to Embodiment 4 of the present invention.

【図27】 この発明の実施の形態4における用語辞書
の一例を示す説明図である。
FIG. 27 is an explanatory diagram showing an example of a term dictionary according to Embodiment 4 of the present invention.

【図28】 この発明の実施の形態4における文書構造
操作命令書の一例を示す説明図である。
FIG. 28 is an explanatory diagram showing an example of a document structure operation instruction according to Embodiment 4 of the present invention.

【図29】 この発明の実施の形態4における構造化文
書処理装置の全体動作を示すフローチャートである。
FIG. 29 is a flowchart showing an overall operation of the structured document processing apparatus according to Embodiment 4 of the present invention.

【図30】 この発明の実施の形態4における用語検証
手段動作を示すフローチャートである。
FIG. 30 is a flowchart showing an operation of term verification means in Embodiment 4 of the present invention.

【図31】 この発明の実施の形態5による構造化文書
処理装置の構成を示すブロック図である。
FIG. 31 is a block diagram showing a configuration of a structured document processing device according to a fifth embodiment of the present invention.

【図32】 この発明の実施の形態5における入力文書
の一例を示す説明図である。
FIG. 32 is an explanatory diagram showing an example of an input document according to Embodiment 5 of the present invention.

【図33】 この発明の実施の形態5における出力文書
の一例を示す説明図である。
FIG. 33 is an explanatory diagram showing an example of an output document according to Embodiment 5 of the present invention.

【図34】 この発明の実施の形態5における変換辞書
の一例を示す説明図である。
FIG. 34 is an explanatory diagram showing an example of a conversion dictionary according to Embodiment 5 of the present invention.

【図35】 この発明の実施の形態5における文書構造
操作命令書の一例を示す説明図である。
FIG. 35 is an explanatory diagram showing an example of a document structure operation command according to Embodiment 5 of the present invention.

【図36】 この発明の実施の形態5における用語変換
手段の動作を示すフローチャートである。
FIG. 36 is a flowchart showing the operation of the term conversion means according to Embodiment 5 of the present invention.

【図37】 この発明の実施の形態6による構造化文書
処理装置の構成を示すブロック図である。
FIG. 37 is a block diagram showing a configuration of a structured document processing device according to a sixth embodiment of the present invention.

【図38】 この発明の実施の形態6における定型文書
入力画面記述書の一例を示す説明図である。
FIG. 38 is an explanatory diagram showing an example of a standard document input screen description according to Embodiment 6 of the present invention.

【図39】 この発明の実施の形態6における定型文書
入力画面の一例を示す説明図である。
FIG. 39 is an explanatory diagram showing an example of a fixed form document input screen according to Embodiment 6 of the present invention.

【図40】 この発明の実施の形態6における定型文書
入力手段の出力の一例を示す説明図である。
FIG. 40 is an explanatory diagram showing an example of output of a fixed form document input unit according to Embodiment 6 of the present invention.

【図41】 この発明の実施の形態6における定型文書
入力画面記述・出力文書構造記述対応表の一例を示す説
明図である。
FIG. 41 is an explanatory diagram showing an example of a standard document input screen description / output document structure description correspondence table according to Embodiment 6 of the present invention.

【図42】 この発明の実施の形態6における出力文書
構造木生成手段によって生成される出力文書構造木の一
例を示す説明図である。
FIG. 42 is an explanatory diagram showing an example of an output document structure tree generated by an output document structure tree generation unit according to Embodiment 6 of the present invention.

【図43】 この発明の実施の形態6における出力文書
構造木生成手段の動作を示すフローチャートである。
FIG. 43 is a flowchart showing an operation of an output document structure tree generating means according to Embodiment 6 of the present invention.

【図44】 この発明の実施の形態7による構造化文書
処理装置の構成を示すブロック図である。
FIG. 44 is a block diagram showing a configuration of a structured document processing device according to a seventh embodiment of the present invention.

【図45】 この発明の実施の形態7における入力文書
の一例を示す説明図である。
FIG. 45 is an explanatory diagram showing an example of an input document according to Embodiment 7 of the present invention.

【図46】 この発明の実施の形態7における文書構造
操作命令書の一例を示す説明図である。
FIG. 46 is an explanatory diagram showing an example of a document structure operation instruction according to Embodiment 7 of the present invention.

【図47】 この発明の実施の形態7における構造化文
書処理装置の全体動作を示すフローチャートである。
FIG. 47 is a flowchart showing an overall operation of the structured document processing device according to the seventh embodiment of the present invention.

【図48】 この発明の実施の形態7における対応表代
入手段の動作を示すフローチャートである。
FIG. 48 is a flowchart showing an operation of a correspondence table substituting unit according to the seventh embodiment of the present invention.

【図49】 この発明の実施の形態8による構造化文書
処理装置の構成を示すブロック図である。
FIG. 49 is a block diagram showing a configuration of a structured document processing device according to an eighth embodiment of the present invention.

【図50】 この発明の実施の形態8における入出力文
書構造対応付けインタフェースの一例を示す図である。
FIG. 50 is a diagram illustrating an example of an input / output document structure association interface according to the eighth embodiment of the present invention.

【図51】 この発明の実施の形態8における文書構造
操作命令書の一例を示す説明図である。
FIG. 51 is an explanatory diagram showing an example of a document structure operation instruction document according to Embodiment 8 of the present invention.

【図52】 この発明の実施の形態8における出力文書
構造対応付け手段の動作を示すフローチャートである。
FIG. 52 is a flowchart showing the operation of an output document structure associating unit according to Embodiment 8 of the present invention.

【図53】 従来の構造化文書処理装置の構成を示すブ
ロック図である。
FIG. 53 is a block diagram showing a configuration of a conventional structured document processing device.

【図54】 従来の構造化文書処理装置におけるチェッ
ク項目表の一例を示す説明図である。
FIG. 54 is an explanatory diagram showing an example of a check item table in a conventional structured document processing device.

【符号の説明】[Explanation of symbols]

11 入力文書、12 入力文書文書型定義書、13
文書構造解析手段、14 入力文書構造木バッファ、1
5 文書構造操作命令書、16 文書構造操作命令解釈
実行手段、17 構造要素抽出手段、18 条件判定手
段、19 繰り返し構造処理手段、20 構造要素代入
手段、21 出力文書構造木バッファ、22 出力文書
文書型定義書、23 構造化文書生成手段、24 出力
文書、25 複数入力文書構造木管理手段、26 複数
出力文書構造木管理手段、27用語辞書ファイル(辞書
ファイル)、28 用語検証手段(用語処理手段)、3
0 変換辞書ファイル(辞書ファイル)、31 用語変
換手段(用語処理手段)、32 変換辞書管理手段、3
3 定型文書入力画面記述書、34 定型文書入力手
段、35 定型文書入力画面記述・出力文書構造木対応
表、36 出力文書構造木生成手段、37 対応表代入
手段、38 入出力文書構造対応付け手段。
11 input document, 12 input document document type definition document, 13
Document structure analysis means, 14 Input document structure tree buffer, 1
5 Document structure operation instruction document, 16 Document structure operation instruction interpretation and execution means, 17 Structural element extraction means, 18 Condition judgment means, 19 Iterative structure processing means, 20 Structural element substitution means, 21 Output document structure tree buffer, 22 Output document document Type definition document, 23 structured document generation means, 24 output documents, 25 multiple input document structure tree management means, 26 multiple output document structure tree management means, 27 term dictionary file (dictionary file), 28 term verification means (term processing means) ), 3
0 conversion dictionary file (dictionary file), 31 term conversion means (term processing means), 32 conversion dictionary management means, 3
3 standard document input screen description, 34 standard document input means, 35 standard document input screen description / output document structure tree correspondence table, 36 output document structure tree generation means, 37 correspondence table substitution means, 38 input / output document structure correspondence means .

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 入力文書の論理構造を解析して、前記入
力文書の論理構造を表現する木構造である入力文書構造
木を作成する文書構造解析手段と、 前記文書構造解析手段の作成した入力文書構造木を記憶
する入力文書構造木バッファと、 文書構造木に対する操作命令が記述された文書構造操作
命令書を読み込み、当該文書構造操作命令書に記述され
た操作命令を順番に取り出して解釈し実行することによ
り、前記入力文書構造木より出力文書の論理構造を表現
する木構造である出力文書構造木を生成する文書構造操
作命令解釈実行手段と、 前記文書構造操作命令解釈実行手段の生成した出力文書
構造木を記憶する出力文書構造木バッファと、 前記出力文書構造木から出力文書を生成する構造化文書
生成手段とを備えた構造化文書処理装置。
1. A document structure analysis means for analyzing a logical structure of an input document to create an input document structure tree which is a tree structure expressing the logical structure of the input document, and an input created by the document structure analysis means. An input document structure tree buffer for storing the document structure tree and a document structure operation instruction in which operation instructions for the document structure tree are described are read, and the operation instructions described in the document structure operation instruction are sequentially extracted and interpreted. Executing the document structure operation instruction interpretation executing means for generating an output document structure tree which is a tree structure expressing the logical structure of the output document from the input document structure tree; and A structured document processing apparatus comprising: an output document structure tree buffer for storing an output document structure tree; and a structured document generation unit configured to generate an output document from the output document structure tree.
【請求項2】 文書構造操作命令解釈実行手段が、読み
込んだ文書構造操作命令書に記述されている操作命令を
順次取り出し、取り出した前記操作命令のタイプに応じ
て、 入力文書構造木から構造要素識別子が指定する文書の内
容を抽出する構造要素抽出手段、 前記構造要素識別子が指定する文書の内容に課せられる
条件により文書の処理内容を制御する条件判定手段、 前記構造要素識別子が繰り返し出現する場合に、その構
造要素識別子が指定する各々の文書の内容に対する操作
命令を解釈実行する繰り返し構造処理手段、 および前記構造要素識別子が指定する文書内容を出力文
書構造木に挿入する構造要素代入手段の中から必要なも
のを選択して、当該操作命令の解釈実行を行なうもので
あることを特徴とする請求項1記載の構造化文書処理装
置。
2. A document structure operation instruction interpretation / execution means sequentially retrieves operation instructions described in a read document structure operation instruction, and reads a structural element from an input document structure tree in accordance with the type of the retrieved operation instruction. Structural element extracting means for extracting the content of the document specified by the identifier; condition determining means for controlling the processing content of the document according to the condition imposed on the content of the document specified by the structural element identifier; when the structural element identifier appears repeatedly And a repetitive structure processing means for interpreting and executing an operation instruction for the content of each document specified by the structure element identifier, and a structure element substitution means for inserting the document content specified by the structure element identifier into an output document structure tree. 2. The structured sentence according to claim 1, wherein a necessary one is selected from the list and the interpretation and execution of the operation instruction are performed. Processing apparatus.
【請求項3】 文書構造解析手段から複数の入力文書構
造木を受理し、文書構造操作命令書から読み出した入力
文書識別子と前記入力文書構造木との対応付けを行なう
とともに、構造要素抽出手段から入力文書識別子と構造
要素抽出命令を受理すると、その入力文書識別子に対応
する入力文書構造木から構造要素識別子が指定する文書
の内容を抽出する複数入力文書構造木管理手段を設けた
ことを特徴とする請求項2記載の構造化文書処理装置。
3. A plurality of input document structure trees are received from a document structure analysis unit, and an input document identifier read from a document structure operation instruction is associated with the input document structure tree. When receiving the input document identifier and the structural element extraction instruction, a plurality of input document structural tree management means is provided for extracting the contents of the document specified by the structural element identifier from the input document structural tree corresponding to the input document identifier. The structured document processing device according to claim 2.
【請求項4】 構造要素代入手段から出力文書識別子と
構造要素代入命令を受理し、前記出力文書識別子に対応
する出力文書構造木に、前記構造要素代入命令が指定す
る文書の内容を挿入する複数出力文書構造木管理手段と
を設けたことを特徴とする請求項2または請求項3記載
の構造化文書処理装置。
4. A method for receiving an output document identifier and a structure element assignment command from a structure element assignment means, and inserting the contents of the document specified by the structure element assignment command into an output document structure tree corresponding to the output document identifier. 4. The structured document processing apparatus according to claim 2, further comprising output document structure tree management means.
【請求項5】 文書構造操作命令解釈実行手段が、読み
込んだ文書構造操作命令書に記述されている操作命令を
順次取り出し、取り出した前記操作命令のタイプに応じ
て、 入力文書構造木から構造要素識別子が指定する文書の内
容を抽出する構造要素抽出手段、 前記構造要素識別子が指定する文書の内容に課せられる
条件により文書の処理内容を制御する条件判定手段、 前記構造要素識別子が繰り返し出現する場合に、その構
造要素識別子が指定する各々の文書の内容に対する操作
命令を解釈実行する繰り返し構造処理手段、 前記構造要素識別子が指定する文書の内容を出力文書構
造木に挿入する構造要素代入手段、 および、辞書ファイルから辞書を呼び出し、呼び出され
た辞書を参照して入力文書中に含まれる用語の処理を行
なう用語処理手段の中から必要なものを選択して、当該
操作命令の解釈実行を行なうものであることを特徴とす
る請求項1記載の構造化文書処理装置。
5. A document structure operation instruction interpretation / execution means sequentially retrieves operation instructions described in the read document structure operation instruction, and reads a structural element from an input document structure tree in accordance with the type of the retrieved operation instruction. Structural element extracting means for extracting the content of the document specified by the identifier; condition determining means for controlling the processing content of the document according to the condition imposed on the content of the document specified by the structural element identifier; when the structural element identifier appears repeatedly A repetitive structure processing means for interpreting and executing an operation command for the content of each document specified by the structural element identifier; a structural element substitution means for inserting the content of the document specified by the structural element identifier into an output document structure tree; and Terminator that calls a dictionary from a dictionary file and processes the terms contained in the input document with reference to the called dictionary And Select from the unit, the structured document processing apparatus according to claim 1, characterized in that to perform interpretation and execution of the operation instruction.
【請求項6】 辞書ファイルが、用語検証に必要な用語
と、用語に付随する情報を収録した用語辞書を格納した
用語辞書ファイルであり、 用語処理手段が、入力文書中の用語が前記用語辞書ファ
イルから呼び出された用語辞書に収録されている用語か
否かを検証し、前記入力文書中に含まれる用語に関する
誤りの検出や修正を行なう用語検証手段であることを特
徴とする請求項5記載の構造化文書処理装置。
6. The dictionary file is a term dictionary file storing terms required for term verification and term dictionaries in which information associated with the terms is stored. 6. A term verification means for verifying whether a term is included in a term dictionary called from a file and detecting or correcting an error relating to a term included in the input document. Structured document processing device.
【請求項7】 辞書ファイルが、変換前の用語と変換後
の用語との対応関係を収録した変換辞書を格納した変換
辞書ファイルであり、 用語処理手段が、前記変換辞書ファイルから呼び出され
た変換辞書を参照して、入力文書中に含まれる用語を当
該用語に対応付けられている別の用語に変換する用語変
換手段であることを特徴とする請求項5記載の構造化文
書処理装置。
7. The dictionary file is a conversion dictionary file storing a conversion dictionary containing correspondences between terms before conversion and terms after conversion, and the term processing means converts the conversion dictionary called from the conversion dictionary file. 6. The structured document processing device according to claim 5, wherein the structured document processing device is a term conversion unit that converts a term included in the input document into another term associated with the term with reference to the dictionary.
【請求項8】 定型文書の入力用画面のレイアウトを記
述した定型文書入力画面記述書を読み込んで前記定型文
書の入力用画面を作成し、定型文書の入力を受理する定
型文書入力手段と、 前記定型文書入力画面記述書の記述と出力文書の論理構
造との対応関係を記述した定型文書入力画面記述・出力
文書構造木対応表を読み込み、前記定型文書入力手段の
出力から出力文書構造木を生成する出力文書構造木生成
手段とを設けたことを特徴とする請求項1または請求項
2記載の構造化文書処理装置。
8. A fixed-form document input means for reading a fixed-form document input screen description describing a layout of a fixed-form document input screen, creating the fixed-form document input screen, and receiving the fixed-form document input; Reads the standard document input screen description / output document structure tree correspondence table that describes the correspondence between the description of the standard document input screen description and the logical structure of the output document, and generates an output document structure tree from the output of the standard document input means. 3. The structured document processing apparatus according to claim 1, further comprising: an output document structured tree generating unit that performs the processing.
【請求項9】 文書構造操作命令解釈実行手段が、読み
込んだ文書構造操作命令書に記述されている操作命令を
順次取り出し、取り出した前記操作命令のタイプに応じ
て、 入力文書構造木から構造要素識別子が指定する文書の内
容を抽出する構造要素抽出手段、 前記構造要素識別子が指定する文書の内容に課せられる
条件により文書処理内容を制御する条件判定手段、 前記構造要素識別子が繰り返し出現する場合に、その構
造要素識別子が指定する各々の文書の内容に対する操作
命令を解釈実行する繰り返し構造処理手段、 前記構造要素識別子が指定する文書の内容を出力文書構
造木に挿入する構造要素代入手段、 および、定型文書入力画面における入力枠と出力文書構
造木中の構造要素識別子の対応関係に関する情報を代入
することにより、定型文書入力画面記述書の記述と出力
文書の論理構造との対応関係を記述した定型文書入力画
面記述・出力文書構造木対応表を作成する対応表代入手
段の中から必要なものを選択して、当該操作命令の解釈
実行を行なうものであることを特徴とする請求項8記載
の構造化文書処理装置。
9. A document structure operation instruction interpreting / executing means sequentially extracts operation instructions described in the read document structure operation instruction, and reads a structural element from an input document structure tree according to the type of the extracted operation instruction. Structural element extracting means for extracting the content of the document specified by the identifier; condition determining means for controlling the content of the document processing by the condition imposed on the content of the document specified by the structural element identifier; when the structural element identifier appears repeatedly Repetitive structure processing means for interpreting and executing an operation instruction for the content of each document specified by the structure element identifier; structure element substitution means for inserting the content of the document specified by the structure element identifier into an output document structure tree; By substituting information about the correspondence between the input frame in the standard document input screen and the structural element identifier in the output document structure tree , Select a required one from the correspondence table substitution means for creating a correspondence table between the description of the standard document input screen description document and the logical structure of the output document, and a correspondence table for the standard document input screen description / output document structure tree. 9. The structured document processing device according to claim 8, wherein said structured document processing device interprets and executes said operation command.
【請求項10】 入力文書の文書型が定義されている入
力文書文書型定義書と、出力文書の文書型が定義されて
いる出力文書文書型定義書を読み込んで、それぞれの論
理構造を表現する木構造を表示し、両者の前記木構造の
構造要素識別子間の対応付けを受理して文書構造操作命
令書を作成する入出力文書構造対応付け手段を設けたこ
とを特徴とする請求項1または請求項2記載の構造化文
書処理装置。
10. An input document document type definition document in which a document type of an input document is defined and an output document document type definition document in which a document type of an output document is defined are read and their respective logical structures are expressed. 2. An input / output document structure associating means for displaying a tree structure, accepting a correspondence between the two structural element identifiers of the tree structure, and creating a document structure operation instruction document. The structured document processing device according to claim 2.
JP9017153A 1997-01-30 1997-01-30 Device for processing structured document Pending JPH10214265A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9017153A JPH10214265A (en) 1997-01-30 1997-01-30 Device for processing structured document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9017153A JPH10214265A (en) 1997-01-30 1997-01-30 Device for processing structured document

Publications (1)

Publication Number Publication Date
JPH10214265A true JPH10214265A (en) 1998-08-11

Family

ID=11936047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9017153A Pending JPH10214265A (en) 1997-01-30 1997-01-30 Device for processing structured document

Country Status (1)

Country Link
JP (1) JPH10214265A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331486A (en) * 2000-05-22 2001-11-30 Mirainet Co Ltd Website integrated retrieval method on communication and recording medium storing software programmed so as to perform the method
JP2003504703A (en) * 1999-06-18 2003-02-04 ユニヴァーシティ カレッジ ロンドン Method and apparatus for monitoring and maintaining the integrity of a distribution document
JP2006285832A (en) * 2005-04-04 2006-10-19 Fuji Electric Systems Co Ltd Xml data conversion system
US7231591B2 (en) 2003-03-31 2007-06-12 Nec Corporation Computer system suitable for communications of structured documents
JP2011150424A (en) * 2010-01-19 2011-08-04 Nec Corp Document preparation support system, document preparation support method and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04116765A (en) * 1990-09-07 1992-04-17 Fuji Xerox Co Ltd Electronic document processor
JPH0728817A (en) * 1993-07-15 1995-01-31 Hitachi Ltd Structure converting method of document information
JPH07121512A (en) * 1993-10-20 1995-05-12 Matsushita Electric Ind Co Ltd Document preparing device
JPH08106464A (en) * 1994-10-04 1996-04-23 Fuji Xerox Co Ltd Document generating device
JPH08190560A (en) * 1995-01-10 1996-07-23 Fujitsu Ltd Structure test device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04116765A (en) * 1990-09-07 1992-04-17 Fuji Xerox Co Ltd Electronic document processor
JPH0728817A (en) * 1993-07-15 1995-01-31 Hitachi Ltd Structure converting method of document information
JPH07121512A (en) * 1993-10-20 1995-05-12 Matsushita Electric Ind Co Ltd Document preparing device
JPH08106464A (en) * 1994-10-04 1996-04-23 Fuji Xerox Co Ltd Document generating device
JPH08190560A (en) * 1995-01-10 1996-07-23 Fujitsu Ltd Structure test device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504703A (en) * 1999-06-18 2003-02-04 ユニヴァーシティ カレッジ ロンドン Method and apparatus for monitoring and maintaining the integrity of a distribution document
JP2001331486A (en) * 2000-05-22 2001-11-30 Mirainet Co Ltd Website integrated retrieval method on communication and recording medium storing software programmed so as to perform the method
US7231591B2 (en) 2003-03-31 2007-06-12 Nec Corporation Computer system suitable for communications of structured documents
JP2006285832A (en) * 2005-04-04 2006-10-19 Fuji Electric Systems Co Ltd Xml data conversion system
JP2011150424A (en) * 2010-01-19 2011-08-04 Nec Corp Document preparation support system, document preparation support method and program

Similar Documents

Publication Publication Date Title
US7069501B2 (en) Structured document processing system and structured document processing method
US6014680A (en) Method and apparatus for generating structured document
US7185275B2 (en) Method and computer system for enabling a user to construct a web-site navigation
JPH07325827A (en) Automatic hyper text generator
US20060080361A1 (en) Document information processing apparatus, document information processing method, and document information processing program
US20050005239A1 (en) System and method for automatic insertion of cross references in a document
JPH09134282A (en) Program generation method
JPH04505227A (en) Document generation device and method
JP3305949B2 (en) Program analyzer
US7769773B1 (en) Relevant rule inspector for hierarchical documents
US5907851A (en) Editing nested documents by appointing a portion for insertion with an alternative substitute
US20090249181A1 (en) Method of approximate document generation
JPH10214265A (en) Device for processing structured document
JPH05101054A (en) Document preparation supporting system by synthesizing component
JPH06259420A (en) Sentence editing support device
JP3085383B2 (en) Document processing method
JPH08221417A (en) New/old comparing editing device for structured document
JP3766406B2 (en) Machine translation device
JPH0816597A (en) Word dictionary registration device and document recognition device
JPH09265431A (en) Method and device for editing document, and client device including the device
JP3302260B2 (en) Document processing system
JP2004178011A (en) Document conversion device and documents conversion method
JP3210842B2 (en) Information processing device
JP3537260B2 (en) Linked document search and display system
JPH09330212A (en) Programming language processing system