JP2003288365A - Additive information management method and additive information management system - Google Patents

Additive information management method and additive information management system

Info

Publication number
JP2003288365A
JP2003288365A JP2002092920A JP2002092920A JP2003288365A JP 2003288365 A JP2003288365 A JP 2003288365A JP 2002092920 A JP2002092920 A JP 2002092920A JP 2002092920 A JP2002092920 A JP 2002092920A JP 2003288365 A JP2003288365 A JP 2003288365A
Authority
JP
Japan
Prior art keywords
additional information
information
original
document
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002092920A
Other languages
Japanese (ja)
Inventor
Masayuki Ashikawa
将之 芦川
Masakazu Hattori
雅一 服部
Takuya Kanewa
拓也 金輪
Katsuhiko Nonomura
克彦 野々村
Hiroshi Niina
博 新名
Shozo Isobe
庄三 磯部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002092920A priority Critical patent/JP2003288365A/en
Publication of JP2003288365A publication Critical patent/JP2003288365A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide an additive information management method and an additive information management system capable of separately managing original information and additive information and easily managing the relation between the both to enable an efficient retrieval or extraction of information. <P>SOLUTION: A structured original document and the additive information to be added to the original document are managed on individual structured databases having hierarchized logic structures, respectively. The hierarchized logic structure of each structured database is made mutually equal, thereby, the positions on each structured database of the original document and the additive information are made to correspond to each other, so that either one can be easily referred to from the other. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、構造化された情
報を、階層化された論理構造を持つ構造化データベース
で管理する構造化情報管理システムに係り、特に、管理
された異なる複数の構造化情報に対する印象や感想等を
表わす付加的な情報を、その構造化情報に関連付けて管
理する付加情報管理方法及び付加情報管理システムに関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a structured information management system for managing structured information in a structured database having a hierarchical logical structure, and more particularly to a plurality of different managed structured information management systems. The present invention relates to an additional information management method and an additional information management system for managing additional information representing impressions and impressions of information in association with its structured information.

【0002】[0002]

【従来の技術】周知のように、従来の文書管理方法にお
いては、大量の情報を一括管理する手法を主体としてい
たために、その情報を活用する際の効率面で問題が発生
している。
2. Description of the Related Art As is well known, in the conventional document management method, since a method of collectively managing a large amount of information is mainly used, there is a problem in efficiency in utilizing the information.

【0003】このため、近年では、特定の個人や部門が
保有するノウハウや企業データのうち、企業の経営にと
って重要なものを蓄積して「経営資産」として活用しよ
うとする活動、すなわち、ナレッジマネジメントが提唱
されている。
Therefore, in recent years, among the know-how and company data held by a specific individual or department, those that are important for the management of the company are accumulated and used as "management assets", that is, knowledge management. Has been proposed.

【0004】このナレッジマネジメントの中核をなす技
術として期待されている技術が、XML(eXtensible M
arkup Language)である。XMLは、柔軟な活用性と連
携性とを備えた標準のドキュメント記述言語であり、主
要ベンダーからのサポートも約束されている。
The technology expected as the core technology of this knowledge management is XML (eXtensible M
arkup Language). XML is a standard document description language with flexible usability and cooperation, and is supported by major vendors.

【0005】XMLデータベースは、管理対象における
複数の構造化文書の各構成要素を、1つの巨大な構造化
文書の文書構造を構成する構成要素として管理する、X
ML特化のツリー上の階層的なデータ構造を持ってい
る。
The XML database manages the respective constituent elements of a plurality of structured documents under management as constituent elements constituting the document structure of one huge structured document.
It has a hierarchical data structure on the tree specialized for ML.

【0006】このように構造化されたXMLデータベー
スを、ナレッジマネジメント用途として用いる際には、
ナレッジマネジメントの特徴である特定の個人や部門が
保有する情報を蓄積するために、さらなる情報の登録が
必要となる。このため、情報登録に関して管理者の負担
が非常に大きなものとなり、効率が低下する。
When the XML database structured in this way is used for knowledge management,
It is necessary to register more information in order to accumulate the information held by a specific individual or department, which is a characteristic of knowledge management. Therefore, the burden of the administrator on the information registration becomes very heavy, and the efficiency is lowered.

【0007】しかしながら、管理者の負担を軽減するた
めに、情報の登録や管理をユーザに対して開放した場合
には、データベースの破損を招く等、安全性の面で問題
が生じる。
However, if information registration or management is opened to the user in order to reduce the burden on the administrator, there is a problem in terms of safety such as damage to the database.

【0008】この解決方法として、管理者が登録するデ
ータを元情報とし、ユーザの登録するデータを付加情報
として管理する方法が考えられている。ただし、この場
合には、元情報と、この元情報に付加される付加情報と
を別個に管理するために、両情報間の相互関連を示す情
報の管理が必要となる。この情報の管理は、管理者に依
存し、付加情報が多くなるに比例して非常に煩雑なもの
となる。
As a solution to this problem, a method of managing data registered by an administrator as original information and managing data registered by a user as additional information is considered. However, in this case, in order to separately manage the original information and the additional information added to the original information, it is necessary to manage the information indicating the mutual relationship between the two pieces of information. The management of this information depends on the administrator and becomes extremely complicated in proportion to the amount of additional information.

【0009】公知の技術として、特開2001−175
649号公報に記載された文書管理システムでは、付加
データ管理部が、文書管理部で管理している文書の任意
の領域に付された付加データを、文書に対応付けて、付
加データの作成者毎に管理している。
As a known technique, Japanese Patent Laid-Open No. 2001-175 is available.
In the document management system described in Japanese Patent No. 649, the additional data management unit associates the additional data attached to an arbitrary area of the document managed by the document management unit with the document, and creates the additional data. It manages each.

【0010】そして、利用者から参照要求を受けると、
要求された文書のページを文書管理部から取り出すとと
もに、その文書に対応付けられた付加データを付加デー
タ管理部から取り出す。このとき、参照を要求したユー
ザ、あるいはユーザの設定にしたがい、取り出す付加デ
ータを制限することができる。
When a reference request is received from the user,
The page of the requested document is taken out from the document management unit, and the additional data associated with the document is taken out from the additional data management unit. At this time, it is possible to restrict the additional data to be extracted according to the user who has requested the reference or the setting of the user.

【0011】この特許に関しては、文書と、この文書に
付加される付加データとを同一データベース上で管理し
ているため、それぞれ一方から他方を参照させるための
情報管理が必要となり、その管理が煩雑であるという問
題が生じる。
In this patent, since the document and the additional data added to this document are managed on the same database, it is necessary to manage the information so that each one refers to the other, and the management is complicated. The problem arises that

【0012】また、特開2001−22749号公報に
記載されたオンライン文書への個人付加情報を共有する
方法では、タグ付けされたオンライン文書を対象とし、
個人付加情報が付加してある文書IDと、タグのシーケ
ンシャル番号と、対象文字列と、その種類及び内容とを
合わせて管理する。
Further, in the method of sharing personal additional information to an online document described in Japanese Patent Laid-Open No. 2001-22749, a tagged online document is targeted,
The document ID to which the personal additional information is added, the sequential number of the tag, the target character string, and the type and content thereof are managed together.

【0013】次に、ユーザ毎に複数の個人付加情報をま
とめて管理するような個人付加シートを導入する。そし
て、シート毎に、当該シートを作成したユーザのID
と、他のユーザに対する当該シートのアクセス条件と
を、文書IDや前述した個人付加情報とともに管理す
る。また、他のユーザが既存シート上に新たに個人付加
情報を追加する場合には、文書IDの代わりに当該既存
シートのIDで添付先を一意に決定する。
Next, a personal addition sheet for collectively managing a plurality of personal additional information for each user is introduced. Then, for each sheet, the ID of the user who created the sheet
And the access conditions of the sheet to other users are managed together with the document ID and the above-mentioned personal additional information. When another user newly adds the personal additional information to the existing sheet, the attachment destination is uniquely determined by the ID of the existing sheet instead of the document ID.

【0014】この特許に関しては、文書に付加される付
加情報を、利用者毎に管理しているために、他の利用者
の情報を参照する際にデータベースへの請求が必要とな
り、処理が遅くなるという問題が生じる。
In this patent, since the additional information added to the document is managed for each user, it is necessary to charge the database when referring to the information of other users, and the processing is slow. The problem arises.

【0015】さらに、特開平10−40258号公報に
記載されたコンテンツと付加的情報の管理システム及び
そのシステムで管理されるコンテンツ及び付加的情報の
表示システムでは、データベースに蓄積されたコンテン
ツと、各コンテンツに対して与えられた付加的情報とを
管理する管理システムを対象としている。
Further, in the content and additional information management system and the content and additional information display system managed by the system described in Japanese Patent Laid-Open No. 10-40258, the content stored in the database and The target is a management system that manages additional information given to contents.

【0016】そして、複数のコンテンツをコンテンツ集
合として指定するコンテンツ集合指定手段と、該コンテ
ンツ集合指定手段にて指定された複数のコンテンツから
なるコンテンツ集合を管理するコンテンツ集合管理手段
と、各コンテンツに与えられた付加的情報を管理する付
加的情報管理手段とを備え、コンテンツ集合管理手段に
て管理されるコンテンツ集合に属する各コンテンツに対
して与えられた付加的情報を特定できるようにしてい
る。
Then, a content set designating means for designating a plurality of contents as a content set, a content set management means for managing a content set consisting of a plurality of contents designated by the content set designating means, The additional information management means for managing the provided additional information is provided so that the additional information given to each content belonging to the content set managed by the content set management means can be specified.

【0017】この特許に関しては、文書に対して付加情
報を1対1の対応形式にしていないため、それぞれの文
書と複数に関連付けされている付加情報との関係を示す
情報の管理が別途に必要となり、その管理が煩雑である
という問題が生じる。
In this patent, since the additional information is not in a one-to-one correspondence format with respect to the documents, it is necessary to separately manage the information indicating the relationship between each document and the additional information associated with a plurality of documents. Therefore, there arises a problem that the management is complicated.

【0018】[0018]

【発明が解決しようとする課題】以上のように、元情報
とこの元情報に付加される付加情報とをデータベース上
に格納し管理する際に、元情報に付加情報を一体化させ
て管理した場合は、元情報から対応する付加情報を参照
するのが容易である反面、元情報の信頼性が損なわれ易
く、データベースの安全性が確保され難いという問題が
生じる。
As described above, when the original information and the additional information added to this original information are stored and managed in the database, the additional information is integrated with the original information and managed. In this case, although it is easy to refer to the corresponding additional information from the original information, the reliability of the original information is likely to be impaired, and it is difficult to ensure the security of the database.

【0019】また、元情報と付加情報とを別々に管理す
る方法もあるが、元情報と付加情報とを相互に関係付け
ておくための情報管理が必要となり、その情報を管理保
持するために管理者への負担が増大し、利便性が損なわ
れるという問題が生じる。また、付加情報の量が多くな
ると、それらの整理が煩雑になり、情報の検索や抽出に
長い時間を要するという不都合も生じる。
There is also a method of separately managing the original information and the additional information, but it is necessary to manage the information for associating the original information and the additional information with each other. There is a problem that the burden on the administrator increases and the convenience is impaired. Further, when the amount of additional information is large, it becomes complicated to organize them, and there is a disadvantage that it takes a long time to search and extract information.

【0020】そこで、この発明は上記事情を考慮してな
されたもので、元情報と付加情報とを別途に管理し、し
かも、両者の相互関係を容易に管理することができ、効
率の良い情報の検索や抽出を行なうことを可能とした極
めて良好な付加情報管理方法及び付加情報管理システム
を提供することを目的とする。
Therefore, the present invention has been made in consideration of the above circumstances, and the original information and the additional information can be managed separately, and moreover, the mutual relationship between the two can be easily managed, resulting in efficient information. It is an object of the present invention to provide an extremely good additional information management method and additional information management system that enables the search and extraction of.

【0021】[0021]

【課題を解決するための手段】上述した従来の問題点に
対して、この発明は以下のような解決法を持つ。すなわ
ち、元情報とこの元情報に付加される付加情報とを別々
のデータベース上で管理し、それぞれのデータベースの
構造を全く同一のものにすることによって、一方の位置
が判明すれば対応する他方の情報の位置も判明するよう
にする。このため、元情報と付加情報とを対応付けるた
めの情報管理が不要となる。
The present invention has the following solutions to the above-mentioned conventional problems. That is, the original information and the additional information added to this original information are managed on separate databases, and the structures of the databases are made identical to each other. Make sure the location of information is known. Therefore, information management for associating the original information with the additional information is not necessary.

【0022】元情報に対する付加情報は、内部に他ユー
ザの情報等を全て保持する。このため、位置の特定が容
易であり、他ユーザ情報の閲覧が容易となる。これに伴
なう情報の増加による管理の煩雑化等の問題点は、構造
化文書(XML)を用いて要素(タグ)単位毎に管理が
可能になるために回避される。
The additional information with respect to the original information internally holds all the information of other users. Therefore, the position can be easily specified, and the other user information can be easily viewed. The problems such as the complexity of management due to the increase in information accompanying this can be avoided because management can be performed for each element (tag) using a structured document (XML).

【0023】元情報に対応する付加情報は、元情報と1
対1の関係で上記の方法にてデータベース上に管理され
ているため、必要な情報を取得するのが容易であり、関
連性を維持するための情報管理が不要である。また、こ
れにより付加情報が煩雑になる等の問題点は、構造化情
報(XML)を用いて要素(タグ)単位で管理すること
により回避している。
The additional information corresponding to the original information is the original information and 1
Since it is managed on the database by the above method in a one-to-one relationship, it is easy to acquire necessary information, and information management for maintaining the relationship is unnecessary. In addition, the problem that the additional information becomes complicated due to this is avoided by managing the element (tag) unit using the structured information (XML).

【0024】換言すれば、この発明は、構造化されたデ
ータベースで管理される元情報と、構造化されたデータ
ベースにおいて管理される元情報に対して付加された付
加情報との管理方法において、上述したような問題点を
解決するための手法を持つことを特徴としたものであ
る。
In other words, the present invention provides the management method of the original information managed by the structured database and the additional information added to the original information managed by the structured database as described above. It is characterized by having a method for solving the above problems.

【0025】上述の問題点を解決するために、この発明
では、元情報とこの元情報を構成する任意の要素に付さ
れた付加情報とを異なるデータベースにて、お互いの相
互関係を維持したまま管理を行ない、元情報に対して参
照要求がある場合は対応する付加情報を検索して出力す
るとともに、付加情報に対して検索がある場合にはそれ
に対する元情報を検索して出力することを特徴とするも
のである。
In order to solve the above-mentioned problems, according to the present invention, the original information and the additional information attached to any element constituting the original information are stored in different databases while maintaining their mutual relations. It manages and searches for and outputs the corresponding additional information when there is a reference request for the original information, and searches and outputs the original information for the corresponding additional information when there is a search. It is a feature.

【0026】具体的には、元情報、付加情報共に膨大な
数の構造化情報を、それぞれ1つづつの巨大な構造化情
報として一元管理するとともに、元情報より構成される
一元管理された構造化情報と、付加情報より構成される
一元管理された構造化情報との内的な構造を同一のもの
とすることにより、元情報に対する参照要求に対応する
付加情報を抽出し、かつ、付加情報に対する参照要求に
対応する元情報を抽出することが可能な広域な情報検索
システムが容易に構築できる。
Specifically, an enormous number of structured information for both the original information and the additional information are integrally managed as one huge structured information each, and a unified management structured by the original information is formed. By making the internal structure of the information and the centralized managed structured information composed of the additional information the same, the additional information corresponding to the reference request for the original information is extracted, and the additional information for the additional information is extracted. A wide area information retrieval system capable of extracting original information corresponding to a reference request can be easily constructed.

【0027】データベース上の各構造化情報の存在する
論理的なエリアは、構造化情報パスを用いて指定する。
すなわち、元情報と付加情報とが、データベースの名称
は異なるが、同一のパスを持つことによって抽出検索を
容易なものとしている。
The logical area where each structured information exists on the database is designated by using the structured information path.
That is, although the original information and the additional information have different database names, they have the same path to facilitate the extraction and retrieval.

【0028】このように、元情報と付加情報とを別途に
管理することにより、付加情報に編集を加える場合も元
情報に影響を及ぼすことがなく、付加情報は各元情報に
対し1対1にて管理しているために、1つの元情報に対
して複数のユーザの情報を集中管理するためにユーザが
他ユーザの情報を閲覧することが可能であり、付加情報
を元に元情報単位で分析や知識の収集を行なうことが可
能である。
In this way, by separately managing the original information and the additional information, the original information is not affected even when the additional information is edited, and the additional information has a one-to-one correspondence with each original information. Since it is managed by, the user can browse the information of other users to centrally manage the information of multiple users for one source information, and the source information unit is based on the additional information. It is possible to analyze and collect knowledge.

【0029】元情報と付加情報とを構築する構造化情報
の構築方法としてXMLを用いているが、XMLの特徴
として出力形式を外部に持つことが可能であり、XSL
(eXtensible Stylesheet Language)という形で定義さ
れている。
Although XML is used as a structured information construction method for constructing the original information and the additional information, it is possible to have an external output format as a feature of XML, and XSL is used.
(EXtensible Stylesheet Language).

【0030】この発明における元情報と付加情報との関
係をこれに適用し、元情報としてのXMLより構成され
る任意の構造化情報に対して、付加情報としてXMLの
出力情報であるXSLを対応させることにより、元情報
と出力形式を効率よく管理することが可能である。
The relationship between the original information and the additional information in the present invention is applied to this, and XSL which is the output information of XML is added as additional information to arbitrary structured information composed of XML as the original information. By doing so, the original information and the output format can be efficiently managed.

【0031】また、付加情報は、元情報に対し情報単位
で管理されるために、複数のXSLを一元管理させるこ
とにより、複数のXSLを1つの情報に対応付けること
が可能である。
Further, since the additional information is managed in units of information with respect to the original information, it is possible to associate a plurality of XSLs with one information by centrally managing a plurality of XSLs.

【0032】このため、ユーザの要求に応じて、対応す
る情報を元に付加情報よりユーザの請求に応じた出力形
式を対応させて出力させることが可能となる。
Therefore, according to the user's request, it is possible to output the additional information based on the corresponding information in a corresponding output format according to the user's request.

【0033】元情報と付加情報とを構築する構造化情報
の構築方法としてXMLを用いているが、XMLの特徴
としてどのような要素を用いて構造化を構築するかは、
情報構造定義情報であるDTD(Document Type Defini
tion)によって定義されるものである。
XML is used as a method of constructing structured information for constructing the original information and the additional information. What element is used as a feature of XML to construct the structured information is as follows.
DTD (Document Type Defini) which is information structure definition information
tion).

【0034】この発明における元情報と付加情報との関
係をこれに適用し、元情報としてのXMLに対し管理者
が変更を行なう際に、付加情報として情報構造定義情報
であるDTDを適用して、情報に対し情報構造の同一性
を保持するための予め定められた情報構造の作成支援を
容易に行なうことが可能である。
The relationship between the original information and the additional information in the present invention is applied to this, and when the administrator changes the XML as the original information, the DTD which is the information structure definition information is applied as the additional information. , It is possible to easily support the creation of a predetermined information structure for maintaining the identity of the information structure with respect to the information.

【0035】付加情報は、元情報に対し情報単位で管理
させるために複数のDTDを一元管理させることによ
り、1つの元情報に対し複数のDTDを用意することが
可能である。これにより、管理者が元情報の変更を行な
う際に、予め定められた複数のDTDにしたがって作業
することが可能である。
As for the additional information, a plurality of DTDs can be managed in an integrated manner in order to manage the original information in information units, and thus a plurality of DTDs can be prepared for one original information. Thereby, when the administrator changes the original information, it is possible to work according to a plurality of predetermined DTDs.

【0036】元情報と付加情報とを構築する構造化情報
の構築方法としてXMLを用いているが、XMLの特徴
として情報全体が各要素より成り立つものである。
XML is used as a method of constructing structured information for constructing the original information and the additional information, but the feature of XML is that the entire information is composed of each element.

【0037】この発明では、元情報の構成要素を最小単
位として付加情報を付加することが可能である。
In the present invention, it is possible to add additional information with the constituent elements of the original information as the minimum unit.

【0038】元情報を構成する内部の要素をユーザの請
求によりユーザの環境に出力する際に、元情報を構築す
る要素の付加情報に出力可能であるかどうかの段階を持
たせることにより、ユーザに対し元情報の要素毎に出力
制限を掛けることが可能となる。
When the internal elements that make up the original information are output to the user's environment at the request of the user, the additional information of the elements that make up the original information has a step of whether or not it is possible to output the information. On the other hand, it becomes possible to put an output restriction on each element of the original information.

【0039】[0039]

【発明の実施の形態】以下、この発明の実施の形態につ
いて図面を参照して詳細に説明する。まず、構造化文書
管理システムについて説明すると、構造化文書として、
前述したXMLやSGML(Standard Generalized Mar
kup Language)等で記述した文書が挙げられる。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will now be described in detail with reference to the drawings. First, I will explain the structured document management system.
The aforementioned XML and SGML (Standard Generalized Mar)
Examples include documents described in kup Language).

【0040】XMLとは、W3C(World Wide Web Con
sortium)にて定められた規格である。SGMLとは、
ISO(International Organization for Standardiza
tion)で定められた規格である。それぞれ文書を構造化
することを可能とする構造化文書規約である。
XML means W3C (World Wide Web Con
It is a standard defined by sortium). What is SGML?
ISO (International Organization for Standardiza)
standard). It is a structured document convention that enables each document to be structured.

【0041】以下、構造化文書として、XMLにて記述
された文書を例に説明を進める。構造化文書の文書構造
を定義したデータ(文書構造定義データ)をスキーマと
称している。XMLでは、そのスキーマを定義するため
にXML−SchemaやXDR(XML Data Reduced)等のス
キーマ言語が提案されている。ここでは、例えばXDR
でのスキーマを記述する場合を例にとり説明する。
Hereinafter, as a structured document, a document described in XML will be described as an example. Data that defines the document structure of a structured document (document structure definition data) is called a schema. In XML, schema languages such as XML-Schema and XDR (XML Data Reduced) have been proposed to define the schema. Here, for example, XDR
An example is given for describing the schema in.

【0042】スキーマも、構造化文書管理システムの管
理対象となる構造化文書であって、スキーマ文書と称さ
れることがある。このスキーマ文書と区別するために、
例えば、特許明細書、メール、週報、広告等の種々雑多
な内容を有する文書を、コンテンツ文書と称することも
ある。
The schema is also a structured document that is a management target of the structured document management system, and is sometimes called a schema document. To distinguish it from this schema document,
For example, a document having various miscellaneous contents such as a patent specification, mail, weekly report, advertisement, etc. may be referred to as a content document.

【0043】構造化文書管理システムでは、上記スキー
マ文書、上記コンテンツ文書、さらに、後述するような
ユーザからの検索要求内容を記述したクエリ、すなわ
ち、クエリ文書も管理対象とし、これらを総称して「文
書」と称している。以下、特に断わりがない場合、「文
書」と称するときは、コンテンツ文書、スキーマ文書、
クエリ文書を全て指すものとする。
In the structured document management system, the above-mentioned schema document, the above-mentioned content document, and a query describing the content of a search request from a user as described later, that is, a query document is also a management target, and these are collectively referred to as “query”. "Document". Hereinafter, unless otherwise specified, a “document” is referred to as a content document, a schema document,
Refers to all query documents.

【0044】次に、上記XMLについて簡単に説明す
る。図2は、XMLで記述された構造化文書の一例とし
て、「特許」情報の例を示している。XMLやSGML
では、文書の構造の表現にタグが用いられる。タグに
は、開始タグと終了タグとがあり、文書構造情報の構成
要素を開始タグと終了タグとで囲むことにより、文書中
の文字列(テキスト)区切りと、そのテキストが構造上
どの構成要素に属するのかを明確に記述することができ
る。
Next, the XML will be briefly described. FIG. 2 shows an example of “patent” information as an example of a structured document described in XML. XML and SGML
In, tags are used to represent the structure of a document. The tag includes a start tag and an end tag, and by enclosing the constituent elements of the document structure information with the start tag and the end tag, the character string (text) delimiter in the document and the constituent element in the structure Can be clearly described as belonging to.

【0045】ここで、開始タグとは、要素名称を記号
「<」と「>」とで閉じたものであって、終了タグと
は、要素名称を記号「</」と「>」とで閉じたもので
ある。タグに続く構成要素の内容が、テキスト(文字
列)または子供の構成要素の繰り返しである。
Here, the start tag is the element name closed with the symbols "<" and ">", and the end tag is the element name with the symbols "</" and ">". It's closed. The content of the component that follows the tag is a text (string) or repeating child component.

【0046】また、開始タグには、「<要素名称 属性
=“属性値”>」等のように、属性情報を設定すること
ができる。さらに、「<特許DB></特許DB>」の
ように、テキストを含まない構成要素は、簡易記法とし
て「<特許DB/>」のように表わすこともできる。
Attribute information can be set in the start tag, such as “<element name attribute =“ attribute value ”>”. Further, a constituent element that does not include text, such as “<patent DB></ patent DB>”, can be expressed as “<patent DB />” as a simple notation.

【0047】図2に示した文書は、「特許」タグから始
まる要素をルート(根)とし、その子要素として「タイ
トル」、「出願日」、「出願者」、「要約」タグから始
まる要素集合が存在している。また、「タイトル」タグ
から始まる要素には、「XMLデータベース」といっ
た、1つのテキスト(文字列)が存在する。
The document shown in FIG. 2 has an element starting from a "patent" tag as a root (root), and a set of elements starting from "title", "filing date", "applicant", and "summary" tags as its child elements. Exists. In addition, one text (character string) such as "XML database" exists in the element starting from the "title" tag.

【0048】XML等の構造化文書は、任意の構成要素
を繰り返し含んでいたり、さらには文書構造があらかじ
め決まっていない[RDB(Relational Data Base)や
OODB(オブジェクト指向データベース)のスキーマ
では定義できない]のが普通である。
A structured document such as XML repeatedly includes arbitrary constituent elements, and the document structure is not predetermined [cannot be defined by RDB (Relational Data Base) or OODB (object oriented database) schema]. Is normal.

【0049】図2に示したような構造化文書を論理的に
表現するために、図3に示すようなツリー表現が用いら
れる。ツリーは、ノード(番号が付され、円形で示され
たもの)とアーク(ノードを表わす円形間を繋ぐデータ
付き線)と四角形で囲まれたテキストとから構成されて
いる。
In order to logically represent the structured document as shown in FIG. 2, the tree representation as shown in FIG. 3 is used. The tree is composed of nodes (numbered and indicated by circles), arcs (lines with data connecting circles representing nodes), and text surrounded by a rectangle.

【0050】ノードは、文書オブジェクトに対応し、こ
のノードからタグ名や属性名に相当するラベルが付与さ
れた複数のアークが出ている。このアークの先は、他の
ノード、または、要素値としての文字列(テキスト)に
繋がる。また、ノードの中に記載されている英数字(#
0、#49等)は、オブジェクトIDである。
A node corresponds to a document object, and a plurality of arcs to which labels corresponding to tag names and attribute names are given are output from this node. The tip of this arc is connected to another node or a character string (text) as an element value. In addition, the alphanumeric characters (#
0, # 49, etc.) is the object ID.

【0051】図3に示したツリー構造を、図2に示した
構造化文書の文書オブジェクトツリーと称する。
The tree structure shown in FIG. 3 is referred to as the document object tree of the structured document shown in FIG.

【0052】図1は、この実施の形態で説明する付加情
報管理システムを示している。図1において、付加情報
管理システムは、大きく分けて、要求制御部1、アクセ
ス要求処理部2、検索要求処理部3、データアクセス部
4、付加情報記憶部5及び元文書記憶部6とから構成さ
れている。付加情報記憶部5及び元文書記憶部6は、例
えば外部記憶装置を用いて構成される。図1のシステム
構成は、ソフトウェアを用いても実現可能である。
FIG. 1 shows an additional information management system described in this embodiment. 1, the additional information management system is roughly divided into a request control unit 1, an access request processing unit 2, a search request processing unit 3, a data access unit 4, an additional information storage unit 5, and an original document storage unit 6. Has been done. The additional information storage unit 5 and the original document storage unit 6 are configured by using, for example, an external storage device. The system configuration of FIG. 1 can also be realized using software.

【0053】要求制御部1は、要求受付部11と結果処
理部12とから構成されている。要求受付部11は、ユ
ーザからの付加情報追加、付加情報及び元文書の取得、
付加情報や元文書に対する検索等の要求を受け付けて、
アクセス要求処理部2を呼び出す。結果処理部12は、
アクセス要求処理部2が処理した結果を要求元のユーザ
に返す処理を行なう。
The request control section 1 is composed of a request receiving section 11 and a result processing section 12. The request receiving unit 11 adds additional information from a user, acquires additional information and an original document,
Accepts requests for additional information and searches for original documents,
The access request processing unit 2 is called. The result processing unit 12
A process of returning the result processed by the access request processing unit 2 to the requesting user is performed.

【0054】アクセス要求処理部2は、ユーザからの付
加情報追加、付加情報及び元文書の取得等に対応した複
数の処理部から構成されている。つまり、このアクセス
処理部2は、付加情報格納部21、付加情報取得部22
及び元文書取得部23とから構成されている。
The access request processing section 2 is composed of a plurality of processing sections corresponding to addition of additional information from the user, acquisition of additional information and original document, and the like. That is, the access processing unit 2 includes the additional information storage unit 21 and the additional information acquisition unit 22.
And the original document acquisition unit 23.

【0055】付加情報格納部21は、付加情報記憶部5
の中の論理的な指定エリアに文書を格納する処理を行な
う。付加情報取得部22は、付加情報記憶部5の中の論
理的な指定エリアが指定されたときに、その指定エリア
に存在する文書を取得する処理を行なう。元文書取得部
23は、元文書記憶部6の中の論理的な指定エリアが指
定されたときに、その指定エリアに存在する文書を取得
する処理を行なう。
The additional information storage unit 21 includes the additional information storage unit 5
The process of storing the document in the logically designated area is performed. When a logical designated area in the additional information storage unit 5 is designated, the additional information acquisition unit 22 performs a process of obtaining a document existing in the designated area. The original document acquisition unit 23, when a logically designated area in the original document storage unit 6 is designated, performs processing for obtaining a document existing in the designated area.

【0056】付加情報記憶部5と元文書記憶部6とは、
構造化文書データベースであり、例えば図4に示すよう
に、付加情報や元文書を、UNIX(登録商標)のディ
レクトリ構造のように、階層的にツリー構造上に格納し
ている。
The additional information storage unit 5 and the original document storage unit 6 are
This is a structured document database. For example, as shown in FIG. 4, additional information and original documents are hierarchically stored in a tree structure like a UNIX (registered trademark) directory structure.

【0057】図4に示すように、元文書記憶部6は、図
3に示した1つの構造化文書のツリー構造と同様に表現
できる。すなわち、任意のノード以下の部分階層木(部
分ツリー)は、元文書記憶部6から切り出された構造化
文書であり、ここでは、これを元文書オブジェクトツリ
ーと称する。
As shown in FIG. 4, the original document storage unit 6 can be expressed in the same way as the tree structure of one structured document shown in FIG. That is, a partial hierarchical tree (partial tree) below an arbitrary node is a structured document cut out from the original document storage unit 6, and here, this is referred to as an original document object tree.

【0058】各ノードには、オブジェクトIDが割り当
てられている。このオブジェクトIDは、元文書記憶部
6内ではユニークな数値を持つものとする。階層木のル
ートとなるノードには、それがルートノードであること
を特定するためのオブジェクトID「#0」が割り当て
られるものとする。
An object ID is assigned to each node. This object ID has a unique numerical value in the original document storage unit 6. It is assumed that an object ID “# 0” for identifying that it is the root node is assigned to the root node of the hierarchical tree.

【0059】ルートノード、すなわち、「#0」のノー
ドからは、「root」タグを先頭に持つ「#1」のノ
ードにリンクが張られている。「#1」のノードから
は、「特許DB」タグを先頭に持つ「#2」のノードに
リンクが張られている。「#2」のノードからは、「特
許」タグを先頭に持つ「#42」のノードにリンクが張
られている。
A link is established from the root node, that is, the node "# 0" to the node "# 1" having the "root" tag at the head. A link is established from the "# 1" node to the "# 2" node having the "patent DB" tag at the head. A link is established from the "# 2" node to the "# 42" node having the "patent" tag at the head.

【0060】図2に示した「特許」情報は、「#42」
のノード以下の部分ツリーに対応している。このノード
からは、「タイトル」タグ、「出願日」タグ、「出願
者」タグ、「要約」タグ等を先頭に持つ各ノードにリン
クが張られ、末端のノードからは、「XMLデータベー
ス」、「T社」、「XMLに対する付加情報を統一的に
管理する」等の文字列(要素値)にリンクが張られてい
る。
The "patent" information shown in FIG. 2 is "# 42".
Corresponds to the partial tree under the node of. From this node, a link is set up to each node having a "title" tag, a "application date" tag, an "applicant" tag, a "summary" tag, etc. at the head, and from the end node, an "XML database", Links are provided to character strings (element values) such as "T company" and "to manage additional information for XML in a unified manner".

【0061】ところで、例えば、「#43」のノードに
リンクされた「XMLデータベース」という要素値は、
「#43」のノードと「#value」という特殊なタグ名
で接続されている。このタグ名は、「#」で始まるた
め、XML規格においては標準的なタグ名として利用す
ることはできない。
By the way, for example, the element value "XML database" linked to the node "# 43" is:
It is connected to the node "# 43" with a special tag name "#value". Since this tag name starts with "#", it cannot be used as a standard tag name in the XML standard.

【0062】このような元文書記憶部6の特定ノードを
指定するために、構造化文書パスを用いる。構造化文書
パスは「//root」から始まる文字列である。例え
ば、「//root/特許DB」は、「#1」のノード
から「特許DB」が付与されたアークが指し示すノー
ド、つまり、「#2」のノードに対応する。このように
「root」から「/」で区切られた部分文字列をタグ
名とみなすことで、「#0」のノードからタグ名の並び
に沿って対応するアークを下っていき、その最後のアー
クが指すノードが、パスの場所を指し示している。
A structured document path is used to specify such a specific node of the original document storage unit 6. The structured document path is a character string starting with "// root". For example, “// root / patent DB” corresponds to the node indicated by the arc to which the “patent DB” is assigned from the node “# 1”, that is, the node “# 2”. In this way, by considering the partial character string delimited by “/” from “root” as the tag name, the corresponding arc is descended from the node of “# 0” along the order of the tag names, and the last arc. The node pointed to by points to the location of the path.

【0063】例えば、「//root/特許DB/特
許」は、「#42」のノード、「//root/特許D
B/出願日/年」は、「#45」のノードを指し示して
いる。
For example, "// root / patent DB / patent" is a node of "# 42", "/ root / patent D".
"B / application date / year" indicates the node of "# 45".

【0064】「#2」のノード以下に、すなわち、「特
許DB」に、複数の「特許」情報を格納する場合には、
個々の「特許」情報を識別するために、構造化文書パス
にインデックス表現が可能である。
When a plurality of "patent" information is stored under the "# 2" node, that is, in the "patent DB",
An indexed representation is possible in the structured document path to identify individual "patent" information.

【0065】「特許DB」の最初の「特許」情報であれ
ば、「//root/特許DB/特許[0]」となる
が、これは「//root/特許DB/特許」と同じと
みなしている。
The first "patent" information in the "patent DB" is "/ root / patent DB / patent [0]", which is the same as "/ root / patent DB / patent". I regard it.

【0066】「特許DB」の2番目の「特許」情報であ
れば、「//root/特許DB/特許[1]DB」の
5番目の「特許」情報であれば、「//root/特許
DB/特許[4]」となる。
If it is the second "patent" information in the "patent DB", then "/ root / patent DB / patent [1] DB" is the fifth "patent" information, then "/ root /" Patent DB / patent [4] ”.

【0067】図6に示すように、付加情報記憶部5も、
図4に示した1つの構造化文書のツリー構造と同様に表
現できる。すなわち、任意のノード以下の部分階層木
(部分ツリー)は、付加情報記憶部5から切り出された
構造化文書であり、ここでは、これを付加情報オブジェ
クトツリーと称する。
As shown in FIG. 6, the additional information storage unit 5 also
It can be expressed similarly to the tree structure of one structured document shown in FIG. That is, a partial hierarchical tree (partial tree) below an arbitrary node is a structured document cut out from the additional information storage unit 5, and this is referred to as an additional information object tree here.

【0068】各付加情報ノードには、付加対象となるノ
ードのIDを用い、IDに付加情報独自のIDを付加す
る。付加情報IDは、付加対象となるノードの下ではユ
ニークな数値であり、付加対象となるノードは、構造化
文書データベース内でユニークな数値を持つために、結
果として付加情報IDも、構造化データベース内でユニ
ークな数値を持つこととなる。
The ID of the node to be added is used for each additional information node, and the ID unique to the additional information is added to the ID. The additional information ID is a unique numerical value under the node to be added, and the node to be added has a unique numerical value in the structured document database. As a result, the additional information ID is also structured database. It will have a unique number within.

【0069】階層木のルートとなるノードには、それが
ルートノードであることを特定するためのオブジェクト
ID「#0」が割り当てられるものとする。
The node serving as the root of the hierarchical tree is assigned the object ID "# 0" for specifying that it is the root node.

【0070】ルートノード、すなわち、「#0」のノー
ドからは、「root」タグを先頭に持つ「#1」のノ
ードにリンクが張られている。「#1」のノードから
は、「特許付加情報DB」タグを先頭に持つ「#2」の
ノードにリンクが張られている。「#2」のノードから
は、「特許」タグを先頭に持つ「#42」のノードにリ
ンクが張られている。
A link is established from the root node, that is, the node "# 0" to the node "# 1" having the "root" tag at the head. A link is established from the "# 1" node to the "# 2" node having the "patent additional information DB" tag at the head. A link is established from the "# 2" node to the "# 42" node having the "patent" tag at the head.

【0071】図5に示した「特許」情報に対して付加さ
れた付加情報は、「#42」のノード以下の部分ツリー
に対応している。「#42」以下の部分ツリーも、元文
書記憶部6の「#42」以下の部分ツリーと同じ構造を
持ち、付加情報は付加対象となる元文書の各要素に対し
て分割され、以下のようにリンクが貼られる。
The additional information added to the "patent" information shown in FIG. 5 corresponds to the partial tree below the "# 42" node. The partial tree under “# 42” also has the same structure as the partial tree under “# 42” in the original document storage unit 6, and the additional information is divided for each element of the original document to be added and Is affixed with a link.

【0072】すなわち、「#42」のノードからは、
「#42」である「特許」タグに付加された情報である
「有効度」タグを先頭に持つノードにリンクが張られ、
末端のノードからは、付加情報である「非常に有用であ
る」等の文字列(要素値)にリンクが張られている。
That is, from the node "# 42",
A link is established to a node having a "validity" tag which is the information added to the "patent" tag which is "# 42",
From the end node, a link is provided to a character string (element value) such as "very useful" which is additional information.

【0073】このように、元文書に付加された付加情報
記憶部5の特定ノードを指定するために、元文書記憶部
6にて特定ノードを指定した方法と同様に構造化文書パ
スを用いることが可能である。
As described above, in order to specify the specific node of the additional information storage unit 5 added to the original document, the structured document path is used similarly to the method of specifying the specific node in the original document storage unit 6. Is possible.

【0074】例えば「//root/特許付加情報DB
/特許」は、「#42」のノードに付加している付加情
報を指し示している。
For example, "// root / patent additional information DB
"/ Patent" indicates the additional information added to the node of "# 42".

【0075】構造化文書パスを用いるにあたって、デー
タベース部分の名称を変えることにより、元文書記憶部
6の特定ノードを指定する構造化文書パスで、付加情報
記憶部5内における元文書記憶部6の特定ノードに対応
する付加情報ノードを指定することが可能である。
When using the structured document path, by changing the name of the database part, the structured document path for designating a specific node of the original document storage unit 6 is used. It is possible to specify the additional information node corresponding to the specific node.

【0076】図1の説明に戻る。データアクセス部4
は、付加情報記憶部5及び元文書記憶部6をアクセスす
る基本インターフェースの集合である。このデータアク
セス部4は、付加情報オブジェクトツリー格納部41、
付加情報オブジェクトツリー取得部42、元文書オブジ
ェクトツリー取得部43及び文書パーサ部44とから構
成される。
Returning to the description of FIG. Data access unit 4
Is a set of basic interfaces for accessing the additional information storage unit 5 and the original document storage unit 6. The data access unit 4 includes an additional information object tree storage unit 41,
The additional information object tree acquisition unit 42, the original document object tree acquisition unit 43, and the document parser unit 44 are included.

【0077】付加情報オブジェクトツリー格納部41
は、付加情報記憶部5中の物理的な指定エリアに付加情
報を格納する処理を行なう。付加情報オブジェクトツリ
ー取得部42は、付加情報記憶部5中の物理的な指定エ
リアに存在する付加情報を取得する処理を行なう。
Additional information object tree storage unit 41
Performs a process of storing additional information in a physically designated area in the additional information storage unit 5. The additional information object tree acquisition unit 42 performs a process of acquiring additional information existing in a physically designated area in the additional information storage unit 5.

【0078】元文書オブジェクトツリー取得部43は、
元文書記憶部6中の物理的な指定エリアに存在する元文
書データを取得する処理を行なう。文書パーサ部44
は、ユーザによる元文書取得要求または付加情報取得要
求に応じて取得した元文書オブジェクトツリー、付加情
報オブジェクトツリーまたはその両方を、クライアント
102の表示部103に出力するためにXML文書に変
換するものである。
The original document object tree acquisition section 43
The original document data existing in the physically designated area in the original document storage unit 6 is acquired. Document parser unit 44
Is for converting the original document object tree and / or the additional information object tree acquired in response to the user's original document acquisition request or additional information acquisition request into an XML document for output to the display unit 103 of the client 102. is there.

【0079】付加情報記憶部5中の物理的な指定エリア
とは、構造化文書データベース内ではユニークな文書デ
ータの存在場所を指し示す内部データである。ユーザに
とっては、認識不能なデータである。
The physically designated area in the additional information storage section 5 is internal data indicating the location of unique document data in the structured document database. The data is unrecognizable to the user.

【0080】元文書記憶部6中の物理的な指定エリアと
は、構造化文書データベース内ではユニークな文書デー
タの存在場所を指し示す内部データである。ユーザにと
っては、認識不能なデータである。
The physically designated area in the original document storage unit 6 is internal data indicating the location of unique document data in the structured document database. The data is unrecognizable to the user.

【0081】また、上記検索要求処理部3は、付加情報
記憶部5または元文書記憶部6中に格納されたそれぞれ
のデータを検索する処理を行なう。
Further, the search request processing unit 3 performs a process of searching the respective data stored in the additional information storage unit 5 or the original document storage unit 6.

【0082】付加情報記憶部5に対する検索要求の場
合、要求制御部1の要求受付部11でユーザからの付加
情報に対する検索要求が受け付けられると、検索要求処
理部3は、データアクセス部4を通して付加情報記憶部
5にアクセスして検索要求に合致する付加情報集合を取
得し、検索要求に合致する付加情報集合に対応する元文
書データを元文書記憶部6より取得する。その取得結果
は、検索要求の対象として結果処理部12を介して出力
される。
In the case of a search request to the additional information storage unit 5, when the request receiving unit 11 of the request control unit 1 receives a search request for additional information from the user, the search request processing unit 3 adds through the data access unit 4. The information storage unit 5 is accessed to acquire the additional information set that matches the search request, and the original document data corresponding to the additional information set that matches the search request is acquired from the original document storage unit 6. The acquisition result is output via the result processing unit 12 as the target of the search request.

【0083】また、元文書記憶部6に対する検索要求の
場合、要求制御部1の要求受付部11でユーザからの付
加情報に対する検索要求が受け付けられると、検索要求
処理部3は、データアクセス部4を通して元文書記憶部
6にアクセスして検索要求に合致する元文書集合を取得
し、検索要求に合致する元文書集合に対応する付加情報
を付加情報記憶部5より取得する。その取得結果は、検
索要求の対象としてを対象として結果処理部12を介し
て出力される。
In the case of a search request to the original document storage unit 6, when the request receiving unit 11 of the request control unit 1 receives a search request for additional information from the user, the search request processing unit 3 causes the data access unit 4 to operate. The original document storage unit 6 is accessed through to obtain the original document set that matches the search request, and the additional information corresponding to the original document set that matches the search request is obtained from the additional information storage unit 5. The acquisition result is output via the result processing unit 12 as a target of the search request.

【0084】図7は、図1に示した構造化文書管理シス
テムの一利用形態を示している。図7では、WWWのバ
ックエンドで、図1に示した構成の付加情報管理システ
ム100が動作している場合を示している。
FIG. 7 shows a form of use of the structured document management system shown in FIG. FIG. 7 shows a case where the additional information management system 100 having the configuration shown in FIG. 1 is operating in the WWW back end.

【0085】複数(図7では3つ)のクライアント端末
(例えばパーソナルコンピュータ、携帯通信端末等)1
02のそれぞれで、WWWブラウザ103が動作してい
る。ユーザは、各クライアント端末102からWWWサ
ーバ101にアクセスすることにより、付加情報管理シ
ステム100にアクセスすることができる。
A plurality of (three in FIG. 7) client terminals (for example, personal computers, mobile communication terminals, etc.) 1
02, the WWW browser 103 is operating. The user can access the additional information management system 100 by accessing the WWW server 101 from each client terminal 102.

【0086】WWWブラウザ103とWWWサーバ10
1とは、HTTP(Hyper Text Transfer Protocol)で
通信している。
WWW browser 103 and WWW server 10
1 is in communication with HTTP (Hyper Text Transfer Protocol).

【0087】ユーザからの文書格納、文書取得、文書検
索等の要求は、WWWブラウザ103から送信されて、
WWWサーバ101を通して付加情報管理システム10
0に受け付けられ、処理された結果は、WWWサーバ1
01を通して要求元のWWWブラウザ103へ返信され
る。
Requests for document storage, document acquisition, document search, etc. from the user are transmitted from the WWW browser 103,
Additional information management system 10 through WWW server 101
0 is accepted and processed by the WWW server 1
It is returned to the requesting WWW browser 103 through 01.

【0088】(1)付加情報格納処理 次に、図1に示した付加情報管理システムの付加情報格
納処理動作について、図8に示すフローチャートを参照
して説明する。すなわち、クライアント端末から付加情
報管理システムに対して送信された文書格納要求が、要
求受付部11にて受け付けられたとき、図8に示した処
理動作が行なわれる。
(1) Additional Information Storage Processing Next, the additional information storage processing operation of the additional information management system shown in FIG. 1 will be described with reference to the flowchart shown in FIG. That is, when the document storage request transmitted from the client terminal to the additional information management system is accepted by the request acceptance unit 11, the processing operation shown in FIG. 8 is performed.

【0089】ここでは、例えば元文書が図4に示すよう
な状態であった場合に、「//root/特許DB/特
許[0]」に対して「<A>付加情報</A>」(以
下、付加情報と称する)を付加情報格納部21に渡す
(ステップS1)場合について説明する。
Here, for example, when the original document is in the state shown in FIG. 4, “<A> additional information </A>” is added to “/ root / patent DB / patent [0]”. A case where (hereinafter referred to as additional information) is passed to the additional information storage unit 21 (step S1) will be described.

【0090】付加文書格納部21は、元文書オブジェク
トツリー取得部43に構造化文書パスを渡す。元文書オ
ブジェクトツリー取得部43は、構造化文書パスから元
文書記憶部6中の物理的なエリアを特定することによ
り、そのエリアに存在する構造化文書パスにて表記され
たノード(元文書オブジェクトOx0)を含む元文書オ
ブジェクトツリーを取得する(ステップS2)。
The additional document storage unit 21 passes the structured document path to the original document object tree acquisition unit 43. The original document object tree acquisition unit 43 identifies a physical area in the original document storage unit 6 from the structured document path, so that the node (original document object) represented by the structured document path existing in the area is specified. An original document object tree including Ox0) is acquired (step S2).

【0091】この取得処理が完了することにより、付加
情報を付加するべき元文書データが存在することが証明
されると(ステップS3で有)、ステップS5に進む。
When the acquisition processing is completed and it is proved that the original document data to which the additional information is to be added exists (Yes in step S3), the process proceeds to step S5.

【0092】また、指定された構造化文書パスからそれ
に対応する元文書オブジェクトOx0が見つからなけれ
ば(ステップS3で無)、エラーとなり、付加情報格納
部21及び結果処理部12を介してクライアント端末に
「付加情報格納失敗」の旨のメッセージを返す(ステッ
プS4)。
Further, if the corresponding original document object Ox0 is not found from the designated structured document path (NO in step S3), an error occurs and the additional information storage unit 21 and the result processing unit 12 send the result to the client terminal. A message indicating "additional information storage failure" is returned (step S4).

【0093】付加文書格納部21は、元文書オブジェク
トツリー取得部43より付加情報が付加される元文書デ
ータの存在を確認する。元文書記憶部6における付加情
報の付加対象となる元文書の物理的なエリアを指定する
構造化文書パスと、付加情報記憶部5における付加情報
の物理的なエリアを指定する構造化文書パスとは、デー
タベース指定部分を除いて同一である。
The additional document storage unit 21 confirms the existence of the original document data to which the additional information is added by the original document object tree acquisition unit 43. A structured document path that specifies a physical area of the original document to which the additional information is added in the original document storage unit 6, and a structured document path that specifies a physical area of the additional information in the additional information storage unit 5 Are the same except for the database specification part.

【0094】このため、付加文書格納部21は、付加情
報を格納するための構造化文書パスを取得するために、
ユーザから指定された構造化文書パスのデータベース記
述部分を、付加情報記憶部6である付加情報データベー
スを指定するように変換する(ステップS5)。
Therefore, in order to acquire the structured document path for storing the additional information, the additional document storage unit 21
The database description portion of the structured document path designated by the user is converted so as to designate the additional information database which is the additional information storage unit 6 (step S5).

【0095】付加文書格納部21は、構造化文書パス変
換後、付加情報オブジェクトツリー取得部42に構造化
文書パスを渡す。この付加情報オブジェクトツリー取得
部42は、構造化文書パスから付加情報記憶部5中の物
理的なエリアを特定することにより、そのエリアに存在
する構造化文書パスにて表わされたノード(付加情報オ
ブジェクトOx0)を含む付加情報オブジェクトツリー
を取得する(ステップS6)。
After converting the structured document path, the additional document storage section 21 passes the structured document path to the additional information object tree acquisition section 42. The additional information object tree acquisition unit 42 specifies a physical area in the additional information storage unit 5 from the structured document path, and thereby the node (additional node) represented by the structured document path existing in the area is added. An additional information object tree including the information object Ox0) is acquired (step S6).

【0096】そして、構造化文書パスが正しければ、付
加情報オブジェクトOx0のオブジェクトIDを取得す
ることができるので(ステップS7でYES)、その場
合はステップS9に進む。
If the structured document path is correct, the object ID of the additional information object Ox0 can be acquired (YES in step S7). In that case, the process proceeds to step S9.

【0097】また、指定された構造化文書パスから、そ
れに対応する付加情報オブジェクトOx0が見つからな
ければ(ステップS7でNO)、エラーとなり、付加情
報格納部21及び結果処理部12を介してクライアント
端末に「付加情報格納失敗」の旨のメッセージを返す
(ステップS8)。
If the corresponding additional information object Ox0 cannot be found from the designated structured document path (NO in step S7), an error occurs and the client terminal is passed through the additional information storage unit 21 and the result processing unit 12. A message indicating "additional information storage failure" is returned to (step S8).

【0098】ステップS9では、格納付加情報の付加情
報オブジェクトツリーが、付加情報オブジェクトOx0
以下に追加される。すなわち、付加情報格納部21によ
り、格納付加情報の付加情報オブジェクトツリーを構成
する各付加情報オブジェクト(のファイル)にオブジェ
クトIDが与えられ、付加情報オブジェクトOx0から
格納付加情報の付加情報オブジェクトツリーにおける先
頭の付加情報オブジェクトにリンクが張られる。
In step S9, the additional information object tree of the additional information stored is the additional information object Ox0.
Added below. That is, the additional information storage unit 21 gives an object ID to each additional information object (file thereof) that constitutes the additional information object tree of the additional information to be stored, and the additional information object Ox0 to the head of the additional information object tree of the additional information object to be stored. A link is put to the additional information object of.

【0099】そして、付加情報オブジェクトツリー格納
部41により、格納付加情報の付加情報オブジェクトツ
リーを構成する各付加情報オブジェクト(のファイル)
が付加情報記憶部5に格納される。
Then, the additional information object tree storage unit 41 (each file) of each additional information object forming the additional information object tree of the stored additional information.
Is stored in the additional information storage unit 5.

【0100】(2)元文書取得処理 次に、図1に示した付加情報管理システムにおいて、付
加情報の付加対象となる元文書の取得処理動作につい
て、図9に示すフローチャートを参照して説明する。す
なわち、クライアント端末から付加情報管理システムに
対し、元文書取得要求として取得コマンドが送信され、
要求受付部11にて受け付けられたとき、図9に示した
処理動作が行なわれる。
(2) Original Document Acquisition Process Next, the acquisition process operation of the original document to which the additional information is added in the additional information management system shown in FIG. 1 will be described with reference to the flowchart shown in FIG. . That is, the client terminal sends an acquisition command as an original document acquisition request to the additional information management system,
When accepted by the request acceptance unit 11, the processing operation shown in FIG. 9 is performed.

【0101】ここでは、例えば元文書が図8に示した状
態のときに「//root/特許DB」を取得する作業
を行なう場合を例にとり説明する。要求受付部11は、
元文書取得命令を受け付けると、構造化文書パス「//
root/特許DB」を元文書取得部23に渡す(ステ
ップS11)。
Here, a case will be described as an example where the work of acquiring "/ root / patent DB" is performed when the original document is in the state shown in FIG. The request reception unit 11
When the original document acquisition command is accepted, the structured document path "//
"root / patent DB" is passed to the original document acquisition unit 23 (step S11).

【0102】元文書取得部23は、元文書オブジェクト
ツリー取得部43に構造化文書パスを渡す。元文書オブ
ジェクトツリー取得部43は、構造化文書パスから元文
書記憶部6中の物理的なエリアを特定することにより、
そのエリアに存在する構造化文書パスにて表わされたノ
ード(元文書オブジェクトOx5)を取り出す(ステッ
プS12)。
The original document acquisition unit 23 passes the structured document path to the original document object tree acquisition unit 43. The original document object tree acquisition unit 43 specifies the physical area in the original document storage unit 6 from the structured document path,
The node (original document object Ox5) represented by the structured document path existing in the area is taken out (step S12).

【0103】構造化文書パスの指定が正しければ、元文
書オブジェクトOx5のオブジェクトIDを取得するこ
とができるので(ステップS13でYES)、その場合
はステップS15に進む。
If the designation of the structured document path is correct, the object ID of the original document object Ox5 can be obtained (YES in step S13), and in that case, the process proceeds to step S15.

【0104】また、ステップS12において、指定され
た構造化文書パスからそれに対応する元文書オブジェク
トOx5が見つからなければ(ステップS13でN
O)、エラーとなり、元文書取得部23及び結果処理部
12を介して、クライアント端末に「元文書取得失敗」
のメッセージを返す(ステップS14)。
In step S12, if the corresponding original document object Ox5 is not found in the designated structured document path (N in step S13).
O), an error occurs and “Original document acquisition failure” is sent to the client terminal via the original document acquisition unit 23 and the result processing unit 12.
Is returned (step S14).

【0105】上記ステップS15では、ステップS12
で取得した元文書オブジェクトOx5から、元文書オブ
ジェクトOx5以下のオブジェクトツリーを取得する。
取得した元文書オブジェクトツリーは、文書パーサ部4
4にてXML文書に変換される(ステップS16)。
In step S15, step S12
An object tree below the original document object Ox5 is acquired from the original document object Ox5 acquired in.
The acquired original document object tree is the document parser unit 4
It is converted into an XML document in step 4 (step S16).

【0106】元文書記憶部6における付加情報の付加対
象となる元文書の物理的なエリアを指定する構造化文書
パスと、付加情報記憶部5における付加情報の物理的な
エリアを指定する構造化文書パスとは、データベース指
定部分を除いて同一である。
A structured document path for designating the physical area of the original document to which the additional information is added in the original document storage unit 6 and a structured document path for designating the physical area of the additional information in the additional information storage unit 5. The document path is the same except for the database specification part.

【0107】このため、元文書取得部23は、付加情報
を格納するための構造化文書パスを取得するために、ユ
ーザから指定された構造化文書パスのデータベース記述
部分を、付加情報記憶部5である付加情報データベース
を指定するよう変換する(ステップS17)。
For this reason, the original document acquisition unit 23 acquires the database description portion of the structured document path designated by the user in order to acquire the structured document path for storing the additional information. Is converted to specify the additional information database (step S17).

【0108】元文書取得部23は、構造化文書パス変更
後、付加情報オブジェクトツリー取得部42に構造化文
書パスを渡す。付加情報オブジェクトツリー取得部42
は、構造化文書パスから付加情報記憶部5中の物理的な
エリアを特定することによって、そのエリアに存在する
構造化文書パスにて表わされたノード(付加情報オブジ
ェクトOx5)を取り出す(ステップS18)。
After changing the structured document path, the original document acquisition section 23 passes the structured document path to the additional information object tree acquisition section 42. Additional information object tree acquisition unit 42
Identifies a physical area in the additional information storage unit 5 from the structured document path to extract the node (additional information object Ox5) represented by the structured document path existing in the area (step S18).

【0109】構造化文書パスの指定が正しければ、付加
情報オブジェクトOx5のオブジェクトIDを取得する
ことができるので(ステップS19でYES)、その場
合はステップS20に進む。
If the structured document path is correctly specified, the object ID of the additional information object Ox5 can be obtained (YES in step S19), and in that case, the process proceeds to step S20.

【0110】ステップS18において、指定された構造
化文書パスから、それに対応する付加情報オブジェクト
Ox5が見つからなければ(ステップS19でNO)、
元文書に対する付加情報が存在しないために、元文書取
得部23にメッセージを通知した後にステップS21に
進む。
In step S18, if the corresponding additional information object Ox5 cannot be found from the designated structured document path (NO in step S19).
Since there is no additional information for the original document, the original document acquisition unit 23 is notified of the message, and the process proceeds to step S21.

【0111】ステップS18で取得した付加情報オブジ
ェクトOx5から、付加情報オブジェクトOx5以下の
オブジェクトツリーを取得する。取得した元文書オブジ
ェクトツリーは、文書パーサ部44にてXML文書に変
換される(ステップS20)。例えば取得した元文書と
付加情報とは統合されて、図11に示すような情報のX
ML文書となる。
From the additional information object Ox5 obtained in step S18, the object tree of the additional information object Ox5 and below is obtained. The acquired original document object tree is converted into an XML document by the document parser unit 44 (step S20). For example, the acquired original document and the additional information are integrated and the information X as shown in FIG.
It becomes an ML document.

【0112】元文書取得部23は、それぞれ取得したX
ML文書を、例えばXSL(Extensible Stylesheet La
nguage)といった所定のスタイルシートとともに、クラ
イアント端末に返す(ステップS21)。クライアント
端末では、図11に示したXML文書を、スタイルシー
トを用いてHTMLデータに変換して、クライアント領
域に表示する。
The original document acquisition unit 23 acquires the acquired X
For example, an ML document is converted into an XSL (Extensible Stylesheet La
nguage) together with a predetermined style sheet (step S21). The client terminal converts the XML document shown in FIG. 11 into HTML data using a style sheet and displays it in the client area.

【0113】XSLを利用すると、XML文書を様々な
形に変換することができる。違う構造のXML文書に変
換することもできるし、XML文書からHTMLページ
を生成することも可能である。
By using XSL, an XML document can be converted into various forms. It is possible to convert it into an XML document having a different structure, and it is also possible to generate an HTML page from the XML document.

【0114】(3)付加情報取得処理 次に、図1に示した付加情報管理システムにおける付加
情報の取得処理動作について、図10に示すフローチャ
ートを参照して説明する。すなわち、クライアント端末
から付加情報管理システムに対し、付加情報取得要求と
して取得コマンドが送信され、要求受付部11にて受け
付けられたとき、図10に示した処理動作が行なわれ
る。
(3) Additional Information Acquisition Processing Next, the additional information acquisition processing operation in the additional information management system shown in FIG. 1 will be described with reference to the flowchart shown in FIG. That is, when the client terminal transmits an acquisition command as an additional information acquisition request to the additional information management system and the request reception unit 11 receives the acquisition command, the processing operation shown in FIG. 10 is performed.

【0115】ここでは、例えば元文書が図8に示した状
態のときに「//root/特許DB」と対応する付加
情報を取得する作業を行なう場合を例にとり説明する。
要求受付部11は、付加情報取得命令を受け付けると、
構造化文書パス「//root/特許DB」を付加情報
取得部22に渡す(ステップS31)。
Here, a case will be described as an example where a work for acquiring additional information corresponding to "/ root / patent DB" is performed when the original document is in the state shown in FIG.
When the request receiving unit 11 receives the additional information acquisition command,
The structured document path “// root / patent DB” is passed to the additional information acquisition unit 22 (step S31).

【0116】付加情報取得部22は、付加情報オブジェ
クトツリー取得部42に構造化文書パスを渡す。付加情
報オブジェクトツリー取得部42は、構造化文書パスか
ら付加情報記憶部5中の物理的なエリアを特定すること
により、そのエリアに存在する構造化文書パスにて表わ
されたノード(付加情報オブジェクトOx5)を取り出
す(ステップS32)。
The additional information acquisition unit 22 passes the structured document path to the additional information object tree acquisition unit 42. The additional information object tree acquisition unit 42 identifies a physical area in the additional information storage unit 5 from the structured document path, and thereby the node (additional information) represented by the structured document path existing in the area. The object Ox5) is taken out (step S32).

【0117】構造化文書パスの指定が正しければ、付加
情報オブジェクトOx5のオブジェクトIDを取得する
ことができるので(ステップS33でYES)、その場
合はステップS35へ進む。
If the structured document path is correctly specified, the object ID of the additional information object Ox5 can be acquired (YES in step S33). In that case, the process proceeds to step S35.

【0118】ステップS32において、指定された構造
化文書パスからそれに対応する付加情報オブジェクトO
x5が見つからなければ(ステップS33でNO)、エ
ラーとなり、付加情報取得部22及び結果処理部12を
介して、クライアント端末に「元文書取得失敗」のメッ
セージを返す(ステップS34)。
In step S32, the additional information object O corresponding to the specified structured document path
If x5 is not found (NO in step S33), an error occurs, and a message of "original document acquisition failure" is returned to the client terminal via the additional information acquisition unit 22 and the result processing unit 12 (step S34).

【0119】ステップS35では、ステップS32にて
取得した付加情報オブジェクトOx5から、付加情報オ
ブジェクトOx5以下のオブジェクトツリーを取得す
る。取得した付加情報オブジェクトツリーは、文書パー
サ部44にてXML文書に変換される(ステップS3
6)。
In step S35, an object tree below the additional information object Ox5 is acquired from the additional information object Ox5 acquired in step S32. The acquired additional information object tree is converted into an XML document by the document parser unit 44 (step S3).
6).

【0120】付加情報記憶部5における付加情報の物理
的なエリアを指定する構造化文書パスと、元文書記憶部
6における付加情報の付加対象となる元文書の物理的な
エリアを指定する構造化文書パスとは、データベース指
定部分を除いて同一である。このため、付加情報取得部
22は、付加情報の付加対象となる元文書を格納するた
めの構造化文書パスを取得するために、ユーザから指定
された構造化文書パスのデータベース記述部分を、元文
書記憶部6である付加情報データベースを指定するよう
変換する(ステップS37)。
A structured document path for designating a physical area of the additional information in the additional information storage unit 5 and a structured document path for designating a physical area of the original document to which the additional information is added in the original document storage unit 6. The document path is the same except for the database specification part. Therefore, in order to acquire the structured document path for storing the original document to which the additional information is added, the additional information acquisition unit 22 uses the database description part of the structured document path specified by the user as the source. Conversion is performed so as to specify the additional information database that is the document storage unit 6 (step S37).

【0121】付加情報取得部22は、構造化文書パス変
更後、元文書オブジェクトツリー取得部43に構造化文
書パスを渡す。元文書オブジェクトツリー取得部43
は、構造化文書パスから元文書記憶部6中の物理的なエ
リアを特定することにより、そのエリアに存在する構造
化文書パスにて表わされたノード(元文書オブジェクト
Ox5)を取り出す(ステップS38)。
After changing the structured document path, the additional information acquisition unit 22 passes the structured document path to the original document object tree acquisition unit 43. Original document object tree acquisition unit 43
Identifies the physical area in the original document storage unit 6 from the structured document path, and extracts the node (original document object Ox5) represented by the structured document path in that area (step S38).

【0122】構造化文書パスの指定が正しければ、元文
書オブジェクトOx5のオブジェクトIDを取得するこ
とができるので(ステップS39でYES)、その場合
はステップS41へ進む。
If the structured document path is correctly specified, the object ID of the original document object Ox5 can be acquired (YES in step S39). In that case, the process proceeds to step S41.

【0123】また、ステップS38において、指定され
た構造化文書パスからそれに対応する元文書オブジェク
トOx5が見つからなければ(ステップS39でN
O)、付加情報が付加するべき元文書が存在しないため
にエラーとなり、付加情報取得部22及び結果処理部1
2を介して、クライアント端末に「付加情報取得失敗」
のメッセージを返す(ステップS40)。
In step S38, if the corresponding original document object Ox5 cannot be found in the designated structured document path (N in step S39).
O), an error occurs because the original document to which the additional information should be added does not exist, and the additional information acquisition unit 22 and the result processing unit 1
“Additional information acquisition failure” on the client terminal via 2
Message is returned (step S40).

【0124】ステップS38で取得した元文書オブジェ
クトOx5から、元文書オブジェクトOx5以下のオブ
ジェクトツリーを取得する。取得した元文書オブジェク
トツリーは、文書パーサ部44にてXML文書に変換さ
れる(ステップS41)。例えば、取得した元文書と付
加情報とは統合されて、図11に示すような情報のXM
L文書となる。
From the original document object Ox5 obtained in step S38, the object tree below the original document object Ox5 is obtained. The acquired original document object tree is converted into an XML document by the document parser unit 44 (step S41). For example, the acquired original document and the additional information are integrated, and the XM of the information as shown in FIG.
It becomes an L document.

【0125】付加情報取得部23は、それぞれ取得した
XML文書を、例えばXSLといった所定のスタイルシ
ートとともに、クライアント端末へ返す(ステップS4
2)。クライアント端末では、図11に示したXML文
書を、スタイルシートを用いてHTMLデータに変換し
て、クライアント領域に表示する。
The additional information acquisition unit 23 returns the acquired XML documents to the client terminal together with a predetermined style sheet such as XSL (step S4).
2). The client terminal converts the XML document shown in FIG. 11 into HTML data using a style sheet and displays it in the client area.

【0126】以下、ユーザに対する表示の一例を図12
を用いて説明する。図12は、元文書取得処理もしくは
付加情報取得処理を行なった際に、クライアント端末1
02の表示部103に表示される、元文書及び付加情報
の表示形態の一例を示している。
Hereinafter, an example of the display for the user will be shown in FIG.
Will be explained. FIG. 12 shows the client terminal 1 when the original document acquisition process or the additional information acquisition process is performed.
2 shows an example of a display form of the original document and the additional information displayed on the display unit 103 of 02.

【0127】図12において、F1は元文書の内容を表
記する表題部分、F2は元文書の内容の一部分を表示す
る概要部分、F3は元文書に対する付加情報を編集する
ためのボタン群である。なお、この例では、取得処理が
終了し、該当結果を表示しているものとする。
In FIG. 12, F1 is a title part indicating the contents of the original document, F2 is a summary part displaying a part of the contents of the original document, and F3 is a button group for editing additional information for the original document. In this example, it is assumed that the acquisition process is completed and the relevant result is displayed.

【0128】表題部分F1には、元文書の表題となる部
分が取り出されて表示されている。これにより、結果と
して、どの要素を取得してきたのかを把握することが可
能である。また、日時情報等、他の元文書と区別が可能
な情報を付記してもよい。
In the title portion F1, the title portion of the original document is extracted and displayed. As a result, it is possible to grasp which element has been acquired. Further, information that can be distinguished from other original documents such as date and time information may be added.

【0129】概要部分F2は、元文書の内容を示す文章
が一定制限下で表示されている。これにより、表題のみ
では不明な情報及び元文書の概略を、把握することが可
能である。この概要部分に表示する要素は任意だが、文
章の形式であり情報量の多い要素を指定することによ
り、ユーザに対して限られた範囲で多くの情報を提供す
ることが可能である。
In the outline portion F2, sentences showing the contents of the original document are displayed under certain restrictions. As a result, it is possible to grasp the information and the outline of the original document which are unknown only by the title. Although the elements displayed in the outline portion are arbitrary, it is possible to provide a large amount of information to the user within a limited range by designating an element having a text format and a large amount of information.

【0130】付加情報編集ボタン群F3は、元文書に対
する付加情報を構成する要素とボタンが1対1に対応し
ている。ユーザは、編集する付加情報のボタンを押すこ
とによって、付加情報内の任意の要素に対し編集を行な
うことが可能となる。
The additional information edit button group F3 has a one-to-one correspondence between elements and buttons that form additional information for the original document. The user can edit any element in the additional information by pressing the button of the additional information to be edited.

【0131】ボタンを押すことにより、別の画面にその
付加情報が表示される。表示される際には、付加情報を
構成する構造化文書を直接表示するのではなく、XSL
等の任意の規則にしたがい、ユーザに対して理解が容易
な形式にて表示される。
By pressing the button, the additional information is displayed on another screen. When displayed, instead of directly displaying the structured document that constitutes the additional information, XSL
It is displayed in a format that is easy for the user to understand according to any rule such as.

【0132】また、付加情報の各要素を元にグラフ等の
任意の解析処理を適用した結果を出力することも可能で
ある。各ボタンを押すことにより、別の画面に付加情報
が表示され、表示された付加情報に対し編集を施すこと
も可能である。
It is also possible to output the result of applying an arbitrary analysis process such as a graph based on each element of the additional information. By pressing each button, the additional information is displayed on another screen, and the displayed additional information can be edited.

【0133】そして、編集が終了した際に、情報が更新
されたことを確認し、付加情報を付加情報記憶部5に格
納し、結果を更新するための処理が行なわれる。
Then, when the editing is completed, it is confirmed that the information has been updated, the additional information is stored in the additional information storage section 5, and the processing for updating the result is performed.

【0134】なお、図12に示した表示画面のレイアウ
トは一例であって、これに限られるものではない。ま
た、いくつかの操作例を示したが、これらについても一
例を示したに過ぎず種々の機能を有しても良い。
The layout of the display screen shown in FIG. 12 is an example, and the present invention is not limited to this. Further, although some operation examples have been shown, these examples are also merely examples and may have various functions.

【0135】また、この発明は、上記した実施の形態に
限定されるものではなく、実施段階ではその要旨を逸脱
しない範囲で種々に変形することが可能である。さら
に、上記した実施の形態には、種々の段階の発明が含ま
れており、開示される複数の構成用件における適宜な組
み合わせにより、種々の発明が抽出され得る。
Further, the present invention is not limited to the above-described embodiments, but can be variously modified in the implementation stage without departing from the spirit thereof. Further, the embodiments described above include inventions at various stages, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent requirements.

【0136】例えば、実施の形態に示される全構成要件
からいくつかの構成要件が削除されても、発明が解決し
ようとする課題の欄で述べた課題(の少なくとも1つ)
が解決でき、発明の効果の欄で述べられている効果(の
なくとも1つ)が得られる場合には、この構成要件が削
除された構成が発明として抽出され得る。
For example, even if some constituent elements are deleted from all the constituent elements shown in the embodiment, the problem (at least one of) described in the section of the problem to be solved by the invention
Can be solved and the effect described in the section of the effect of the invention (at least one) can be obtained, the configuration in which this constituent element is deleted can be extracted as the invention.

【0137】例として、以下の条件下における付加情報
管理システムの適用を記述する。
As an example, application of the additional information management system under the following conditions will be described.

【0138】(バイナリデータに対する適用)アスキー
コードより構成されるテキストデータに相対するデータ
として、バイナリデータが存在する。テキストデータ
は、その特性上、文字単位で内容を分割することが可能
だが、バイナリデータの場合は内部的に分割した場合
に、分割した後の単体では意味を持たないものになる場
合が多いため、バイナリデータを元文書として内部を構
造化し、付加情報を付加することは困難である。
(Application to Binary Data) Binary data exists as data corresponding to text data composed of ASCII code. Due to its characteristics, text data can be divided into characters, but in the case of binary data, when divided internally, it often becomes meaningless after being divided. , It is difficult to structure the inside with binary data as an original document and add additional information.

【0139】しかしながら、付加情報管理システムを用
いることによって、元データに任意の文書構造を持たせ
た後に、内部でバイナリデータを要素として扱うことに
より構造化文書として扱うことが可能である。
However, by using the additional information management system, it is possible to treat the binary data as an element internally after the original data has an arbitrary document structure, and thus it can be treated as a structured document.

【0140】バイナリデータの場合は、内部的に分割し
た場合に、分割した後の単体では意味を持たないものに
なる場合が多いため、要素単位で直接情報を付加するこ
とは困難であるが、任意の規則を適用することにより
(座標、バイト数等)、適用した規則に基づいて付加情
報を関連付けることが可能である。
In the case of binary data, it is difficult to directly add information on an element-by-element basis when the data is divided internally and the divided data often has no meaning. By applying an arbitrary rule (coordinates, number of bytes, etc.), it is possible to associate the additional information based on the applied rule.

【0141】(XSLを用いた様々な表記方法)XSL
を用いることによって、XML文書を様々な形に変換す
ることが可能である。XSLはXML文書とは独立した
形で存在し、XML文書内部より参照されることによっ
て適用される。
(Various Notation Methods Using XSL) XSL
By using, it is possible to convert the XML document into various forms. XSL exists independently of the XML document and is applied by being referenced from inside the XML document.

【0142】付加情報管理システムを用いるにあたり、
元文書をXML文書とし、付加情報をXSLとして適用
することによって、ユーザの選択したXML文書を変更
した後に出力することが可能である。
When using the additional information management system,
By applying the original document as an XML document and applying the additional information as XSL, the XML document selected by the user can be output after being changed.

【0143】また、付加情報管理システムは、任意の元
文書に対して複数の付加情報を保持することが可能であ
るため、付加情報管理システム上にて管理されるXML
文書には、複数のXSLを持たせることが可能となる。
これにより、ユーザが任意のXML文書を出力する際
に、複数のXSLから出力形式をユーザの意思により選
択することが可能となる。
Further, since the additional information management system can hold a plurality of additional information for an arbitrary original document, the XML managed by the additional information management system is used.
A document can have a plurality of XSLs.
As a result, when the user outputs an arbitrary XML document, it becomes possible to select the output format from a plurality of XSLs by the user's intention.

【0144】(DTDを用いた文書定義)DTD(Docu
ment Type Definition)は、XML文書において持ち得
る要素の形式を定めたものであり、DTDの存在するX
ML文書は、その定められた形式から逸脱することはで
きない。
(Document Definition Using DTD) DTD (Docu
ment Type Definition) defines the format of elements that can be included in the XML document, and the X where DTD exists.
An ML document cannot deviate from its defined format.

【0145】DTDは、XML文書とは独立した形で存
在し、XML文書内部より参照されることによって適用
される。
The DTD exists in a form independent of the XML document, and is applied by being referenced from inside the XML document.

【0146】付加情報管理システムを用いるにあたり、
元文書をXML文書とし、付加情報をDTDとして適用
することによって、XML文書に任意のDTDを持たせ
ることが可能となる。
When using the additional information management system,
By applying the original document as an XML document and applying the additional information as a DTD, it becomes possible to give the XML document an arbitrary DTD.

【0147】また、付加情報管理システムは任意の元文
書に対して複数の付加情報を保持することが可能である
ために、付加情報管理システム上にて管理されるXML
文書には複数のDTDを持たせることが可能となる。こ
れにより、管理者が元文書の変更を行なう際に、複数の
DTDから任意のDTDを選択して、その定義にしたが
い元文書を編集することが可能となる。
Further, since the additional information management system can hold a plurality of additional information with respect to an arbitrary original document, the XML managed on the additional information management system is used.
A document can have a plurality of DTDs. Accordingly, when the administrator changes the original document, it is possible to select an arbitrary DTD from the plurality of DTDs and edit the original document according to the definition.

【0148】(元文書における要素単位のセキュリティ
情報の付加)付加情報管理システムにて元文書として管
理される文書は構造化文書であり、要素によって構成さ
れている。
(Addition of Security Information in Element Unit in Original Document) A document managed as an original document by the additional information management system is a structured document and is composed of elements.

【0149】そして、元文書に対する付加情報は、元文
書の要素に対して付加することが可能である。付加情報
管理システムにおいて、任意の構造化文書に対し、付加
する情報にセキュリティ情報をもたせることにより、元
文書の要素単位でセキュリティを保持させることが可能
となる。
The additional information for the original document can be added to the elements of the original document. In the additional information management system, by adding security information to information to be added to an arbitrary structured document, it becomes possible to maintain security in the element unit of the original document.

【0150】ユーザが元文書に対して取得要求を出した
際に、付加情報管理システムは指定の元文書に対応する
付加情報を取得し、セキュリティの比較を行なう。そし
て、条件を満たさないユーザに対しては、閲覧不可の旨
のメッセージを送る形式を用いることによって拒否する
ことが可能となる。また、セキュリティ情報は付加情報
であるために、元文書に対して容易に変更することが可
能である。
When the user issues an acquisition request for the original document, the additional information management system acquires the additional information corresponding to the designated original document and compares the security. Then, it becomes possible to reject a user who does not satisfy the condition by using a format in which a message indicating that browsing is not possible is sent. Further, since the security information is additional information, it can be easily changed with respect to the original document.

【0151】以上に説明したように、上記した実施の形
態によれば、文書構造記述用言語であるXMLにて構築
されたデータベースに対し、原本であるデータを変更せ
ずに不特定のユーザからの情報追加を行なうことが可能
となる。このため、ユーザは安全性を保持したまま制限
を課されることなく、データベースを使用することが可
能となる。
As described above, according to the above-described embodiment, the original data is not changed from the unspecified user to the database constructed in XML which is the document structure description language. Information can be added. Therefore, the user can use the database without imposing restrictions while maintaining security.

【0152】なお、この発明は上記した実施の形態に限
定されるものではなく、この外その要旨を逸脱しない範
囲で種々変形して実施することができる。
The present invention is not limited to the above-described embodiments, but can be variously modified and implemented without departing from the scope of the invention.

【0153】[0153]

【発明の効果】以上詳述したようにこの発明によれば、
元情報と付加情報とを別途に管理し、しかも、両者の相
互関係を容易に管理することができ、効率の良い情報の
検索や抽出を行なうことを可能とした極めて良好な付加
情報管理方法及び付加情報管理システムを提供すること
ができる。
As described above in detail, according to the present invention,
An extremely good additional information management method capable of separately managing original information and additional information, easily managing mutual relation between the two, and enabling efficient information retrieval and extraction, and An additional information management system can be provided.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施の形態に係る付加情報管理シス
テムを説明するために示すブロック構成図。
FIG. 1 is a block configuration diagram shown for explaining an additional information management system according to an embodiment of the present invention.

【図2】XMLで記述された構造化文書の一例を説明す
るために示す図。
FIG. 2 is a diagram shown for explaining an example of a structured document described in XML.

【図3】図2に示された構造化文書の文書構造を模式的
にツリー表現で説明するために示す図。
FIG. 3 is a diagram schematically illustrating the document structure of the structured document shown in FIG. 2 in tree representation.

【図4】構造化文書データベースに対して、1つの「特
許」情報の文書オブジェクトツリーが追加された状態を
説明するために示す図。
FIG. 4 is a diagram shown for explaining a state in which one document object tree of “patent” information is added to the structured document database.

【図5】図2において記述された構造化文書に対し付加
される情報の一例を説明するために示す図。
FIG. 5 is a diagram for explaining an example of information added to the structured document described in FIG.

【図6】図4において記述された文書オブジェクトツリ
ーに対し図5で示された情報が追加された状態を説明す
るために示す図。
6 is a diagram for explaining a state in which the information shown in FIG. 5 is added to the document object tree described in FIG.

【図7】図1に示した付加情報管理システムの一利用形
態を示したもので、WWWのバックエンドで、付加情報
管理システムが動作している場合を示した図。
FIG. 7 is a diagram showing a form of use of the additional information management system shown in FIG. 1, showing a case where the additional information management system is operating at the WWW back end.

【図8】図1に示した付加情報管理システムの付加情報
格納処理について説明するために示すフローチャート。
8 is a flowchart shown to explain additional information storage processing of the additional information management system shown in FIG.

【図9】図1に示した付加情報管理システムの元文書取
得処理について説明するために示すフローチャート。
9 is a flowchart shown for explaining an original document acquisition process of the additional information management system shown in FIG.

【図10】図1に示した付加情報管理システムの付加情
報取得処理について説明するために示すフローチャー
ト。
10 is a flowchart shown for explaining additional information acquisition processing of the additional information management system shown in FIG.

【図11】取得した付加情報と元文書においてクライア
ントに送られるXMLで記述された構造化文書の一例を
説明するために示す図。
FIG. 11 is a diagram shown for explaining an example of a structured document described in XML that is sent to a client in the acquired additional information and the original document.

【図12】ユーザインターフェースとしての画面の表示
例を説明するために示す図。
FIG. 12 is a diagram for explaining a display example of a screen as a user interface.

【符号の説明】[Explanation of symbols]

1…要求制御部、 2…アクセス要求処理部、 3…検索要求処理部、 4…データアクセス部、 5…付加情報記憶部、 6…元文書記憶部、 11…要求受付部、 12…結果処理部、 21…付加情報格納部、 22…付加情報取得部、 23…元文書取得部、 41…付加情報オブジェクトツリー格納部、 42…付加情報オブジェクトツリー取得部、 43…元情報オブジェクトツリー取得部、 44…文書パーサ部。 1 ... Request control unit, 2 ... access request processing unit, 3 ... Search request processing unit, 4 ... Data access unit, 5 ... additional information storage unit, 6 ... Original document storage unit, 11 ... Request reception unit, 12 ... Result processing section, 21 ... additional information storage unit, 22 ... Additional information acquisition unit, 23 ... Original document acquisition unit, 41 ... Additional information object tree storage unit, 42 ... Additional information object tree acquisition unit, 43 ... Original information object tree acquisition unit, 44 ... Document parser section.

フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/21 G06F 17/21 570R (72)発明者 金輪 拓也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 野々村 克彦 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 新名 博 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 磯部 庄三 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B009 SA03 SA12 SA14 VA09 5B075 ND03 NK02 NK43 NK46 NR06 NR20 PQ02 PQ32 Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) G06F 17/21 G06F 17/21 570R (72) Inventor Takuya Kanawa 1 Komukai Toshiba-cho, Kawasaki-shi, Kanagawa Stock number Company Toshiba Research & Development Center (72) Inventor Katsuhiko Nonomura Komukai Toshiba Town No. 1, Komukai-shi, Kawasaki-shi, Kanagawa Stock Company Toshiba Research & Development Center (72) Inventor Hiroshi Komukai Toshiba, Saitama-ku, Kawasaki-shi, Kanagawa Town No. 1 In stock company Toshiba R & D Center (72) Inventor Shozo Isobe Komukai-shi, Kawasaki City Kanagawa Prefecture Komukai Toshiba Town No. 1 F company in Toshiba Research & Development Center (reference) 5B009 SA03 SA12 SA14 VA09 5B075 ND03 NK02 NK43 NK46 NR06 NR20 PQ02 PQ32

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 構造化された元情報と、この元情報に付
加される付加情報とを、それぞれ、階層化された論理構
造を持つ別個の構造化データベース上で管理し、各構造
化データベースの階層化された論理構造を同一にするこ
とにより、元情報と付加情報との各構造化データベース
上における位置を対応させることを特徴とする付加情報
管理方法。
1. Structured original information and additional information added to this original information are managed on separate structured databases each having a hierarchical logical structure, and the structured information of each structured database is managed. A method for managing additional information, characterized in that the positions of original information and additional information in each structured database are made to correspond by making the hierarchical logical structures the same.
【請求項2】 前記付加情報は、それが付加される前記
元情報単位で、該元情報と同一の階層化された論理構造
で管理されることを特徴とする請求項1記載の付加情報
管理方法。
2. The additional information management according to claim 1, wherein the additional information is managed in the same unitary logical structure as the original information in units of the original information to which the additional information is added. Method.
【請求項3】 前記元情報は、アスキーコードから構成
されるテキストデータに相当するバイナリデータと称さ
れるデータであることを特徴とする請求項1記載の付加
情報管理方法。
3. The additional information management method according to claim 1, wherein the original information is data called binary data corresponding to text data composed of an ASCII code.
【請求項4】 前記付加情報は、それが付加される前記
元情報を、前記構造化データベースから読み出して出力
する際の出力形式を選択する情報を含むことを特徴とす
る請求項1記載の付加情報管理方法。
4. The additional information according to claim 1, wherein the additional information includes information for selecting an output format when the original information to which the additional information is added is read from the structured database and output. Information management method.
【請求項5】 前記付加情報は、それが付加される前記
元情報に変更を行なう際の情報定義方法を選択する情報
を含むことを特徴とする請求項1記載の付加情報管理方
法。
5. The additional information management method according to claim 1, wherein the additional information includes information for selecting an information definition method when changing the original information to which the additional information is added.
【請求項6】 前記付加情報は、それが付加される前記
元情報に対するセキュリティレベルを示す情報を含むこ
とを特徴とする請求項1記載の付加情報管理方法。
6. The additional information management method according to claim 1, wherein the additional information includes information indicating a security level for the original information to which the additional information is added.
【請求項7】 前記付加情報で示されるセキュリティレ
ベルと、予め設定されたセキュリティレベルとを比較す
ることにより、前記元情報の前記構造化データベースか
らの読み出しの可否が判断されることを特徴とする請求
項6記載の付加情報管理方法。
7. The read / write availability of the original information from the structured database is determined by comparing a security level indicated by the additional information with a preset security level. The additional information management method according to claim 6.
【請求項8】 前記付加情報は、それが付加される前記
元情報を内容別に管理するために分類する基準となる情
報を含むことを特徴とする請求項1記載の付加情報管理
方法。
8. The additional information management method according to claim 1, wherein the additional information includes information serving as a reference for classifying the original information to which the additional information is added to manage the original information by content.
【請求項9】 前記付加情報は、構造化文書にて形成さ
れることを特徴とする請求項1記載の付加情報管理方
法。
9. The additional information management method according to claim 1, wherein the additional information is formed by a structured document.
【請求項10】 構造化された元情報を管理する、階層
化された論理構造を持つ第1の構造化データベースと、 この第1の構造化データベースとは別個に設置され、前
記元情報に付加される付加情報を管理する、前記第1の
構造化データベースと同じ階層化された論理構造を持つ
第2の構造化データベースとを具備し、 前記第1及び第2の構造化データベース上における前記
元情報と付加情報との位置を対応させたことを特徴とす
る付加情報管理システム。
10. A first structured database having a hierarchical logical structure for managing structured original information, and a first structured database installed separately from the first structured database and added to the original information. A second structured database having the same hierarchical logical structure as the first structured database for managing the additional information to be stored, and the original on the first and second structured databases. An additional information management system characterized in that the positions of information and additional information are associated with each other.
JP2002092920A 2002-03-28 2002-03-28 Additive information management method and additive information management system Pending JP2003288365A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002092920A JP2003288365A (en) 2002-03-28 2002-03-28 Additive information management method and additive information management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002092920A JP2003288365A (en) 2002-03-28 2002-03-28 Additive information management method and additive information management system

Publications (1)

Publication Number Publication Date
JP2003288365A true JP2003288365A (en) 2003-10-10

Family

ID=29237602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002092920A Pending JP2003288365A (en) 2002-03-28 2002-03-28 Additive information management method and additive information management system

Country Status (1)

Country Link
JP (1) JP2003288365A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006172282A (en) * 2004-12-17 2006-06-29 Canon Inc Document management system and method, and computer program
US7457812B2 (en) 2004-10-29 2008-11-25 Kabushiki Kaisha Toshiba System and method for managing structured document
WO2012014918A1 (en) * 2010-07-28 2012-02-02 株式会社Ubic Forensic system and forensic method, and forensic program
US8793277B2 (en) 2010-03-29 2014-07-29 Ubic, Inc. Forensic system, forensic method, and forensic program
US8799317B2 (en) 2010-03-29 2014-08-05 Ubic, Inc. Forensic system, forensic method, and forensic program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7457812B2 (en) 2004-10-29 2008-11-25 Kabushiki Kaisha Toshiba System and method for managing structured document
JP2006172282A (en) * 2004-12-17 2006-06-29 Canon Inc Document management system and method, and computer program
JP4612834B2 (en) * 2004-12-17 2011-01-12 キヤノン株式会社 Document management system, document search method, computer program, document search apparatus
US8793277B2 (en) 2010-03-29 2014-07-29 Ubic, Inc. Forensic system, forensic method, and forensic program
US8799317B2 (en) 2010-03-29 2014-08-05 Ubic, Inc. Forensic system, forensic method, and forensic program
US9244920B2 (en) 2010-03-29 2016-01-26 Ubic, Inc. Forensic system, forensic method, and forensic program
WO2012014918A1 (en) * 2010-07-28 2012-02-02 株式会社Ubic Forensic system and forensic method, and forensic program
JP2012032859A (en) * 2010-07-28 2012-02-16 Ubic:Kk Forensic system, forensic method and forensic program
US8549037B2 (en) 2010-07-28 2013-10-01 Ubic, Inc. Forensic system, forensic method, and forensic program

Similar Documents

Publication Publication Date Title
JP3842573B2 (en) Structured document search method, structured document management apparatus and program
US7293018B2 (en) Apparatus, method, and program for retrieving structured documents
US6763343B1 (en) Preventing duplication of the data in reference resource for XML page generation
JP4822889B2 (en) Database integrated reference program, database integrated reference method, and database integrated reference device
US7191397B2 (en) XML server pages language
JPH11242676A (en) Method for registering structured document, method for retrieving structured document, and portable medium used in these methods
JP4042830B2 (en) Content attribute information normalization method, information collection / service provision system, and program storage recording medium
JP2005190163A (en) Method, apparatus and program for retrieving structured data
JP3673189B2 (en) Write control method, structured document management apparatus, structured document editing apparatus, and program
JP3914081B2 (en) Access authority setting method and structured document management system
JP2003288365A (en) Additive information management method and additive information management system
JP5056384B2 (en) Search program, method and apparatus
JP3842576B2 (en) Structured document editing method and structured document editing system
JP3842572B2 (en) Structured document management method, structured document management apparatus and program
JPH10187680A (en) Document repository device managed by word, sentence and grain degree of part
Yu et al. Metadata management system: design and implementation
JP3632643B2 (en) Structured document management device
JP3842575B2 (en) Structured document search method, structured document management apparatus and program
JP3842574B2 (en) Information extraction method, structured document management apparatus and program
JP2004118543A (en) Method for retrieving structured document, and method, device and program for supporting retrieval
Škrbić et al. Bibliographic records editor in XML native environment
JP2004118379A (en) Structured document analysis display method, structured document analysis display unit, and its program
JP2004126640A (en) Document structure retrieving method, document structure retrieving device, and document structure retrieving program
JP2011222045A (en) Database integration reference program
JP2004348593A (en) Apparatus and method for retrieving storage, storage retrieval program, and storage retrieval program recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060926