JP2002297662A - Method and device for editing structured document, terminal, and program - Google Patents
Method and device for editing structured document, terminal, and programInfo
- Publication number
- JP2002297662A JP2002297662A JP2001098189A JP2001098189A JP2002297662A JP 2002297662 A JP2002297662 A JP 2002297662A JP 2001098189 A JP2001098189 A JP 2001098189A JP 2001098189 A JP2001098189 A JP 2001098189A JP 2002297662 A JP2002297662 A JP 2002297662A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- document
- structured
- search
- search request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、階層化された論理
構造を持つ構造化文書データベースに格納されている構
造化文書の編集方法および、それを用いた構造化文書編
集装置に関する。The present invention relates to a method for editing a structured document stored in a structured document database having a hierarchical logical structure, and a structured document editing apparatus using the same.
【0002】[0002]
【従来の技術】現在、IT(情報技術)の進化により、
莫大な量の情報が容易に入手できるようになった。その
一方で必要な情報が大量のデータに埋没してしまい、十
分に活用できないという弊害も発生している。情報が大
量に存在していても、それをうまく活用できなければ意
味がない。2. Description of the Related Art At present, with the evolution of IT (information technology),
An enormous amount of information has become readily available. On the other hand, there is also a problem that necessary information is buried in a large amount of data and cannot be fully utilized. Even if there is a large amount of information, it is meaningless if it cannot be used effectively.
【0003】そこで、特定の個人や部門が保有するノウ
ハウや業務データのうち企業の経営に重要なものを蓄積
して、「経営資産」として活用しようとする活動、すな
わち、ナレッジマネージメントが提唱されている。[0003] Therefore, an activity of accumulating know-how and business data possessed by a specific individual or department that is important for the management of a company and utilizing it as "management assets", that is, knowledge management has been proposed. I have.
【0004】例えば、特許明細書や、週報など、文書の
種類によっては、その書式が予め定められて、1つの書
式に統一されているのが一般的である。1つの書式に統
一された文書もあれば、全く書式のない自由書式の文書
も数多く存在する。For example, depending on the type of a document such as a patent specification or a weekly report, the format is generally predetermined and unified into one format. While some documents are unified in one format, many free-form documents have no format at all.
【0005】従って、ナレッジマネージメントを実現す
るためには、このような文書構造が予め定められている
ような文書も、それ以外の自由書式の文書も全て格納管
理できるデータベースが必要となる。Therefore, in order to realize knowledge management, a database is required which can store and manage all such documents having a predetermined document structure and other free-form documents.
【0006】次世代のナレッジマネージメントの中核技
術として期待されている技術がXMLである。XML
(Extesible Markup Languag
e)は柔軟な拡張性と連携性を備えた標準のドキュメン
ト記述言語であり、主要ベンダーからのサポートも約束
されている。[0006] XML is a technology expected as a core technology of next generation knowledge management. XML
(Extensible Markup Language)
e) is a standard document description language with flexible extensibility and coordination, and has been promised support from major vendors.
【0007】一方、近年のインターネット技術の発達に
より、WWW(World Wide Web)に代表
されるネットワーク上の文書共有システムが急速に普及
している。WWWでは、ネットワーク上の文書が現在、
HTML(HyperText Markup Lan
guage)で記述されている。この分野においてもH
TMLに継ぐ次世代の文書記述言語としてXMLが期待
されている。XMLでは、文書データの構造と表示スタ
イルを分けて定義することができるため文書構造の変更
や文書の再利用がしやすい、タグを用いて文書の構造を
厳密に定義できるためタグの条件指定による検索に適し
ている、といった特徴がある。On the other hand, with the development of the Internet technology in recent years, a document sharing system on a network represented by the WWW (World Wide Web) has rapidly spread. In the WWW, documents on the network are currently
HTML (HyperText Markup Lan)
g.). H in this field
XML is expected as a next-generation document description language following TML. In XML, the structure of the document data and the display style can be defined separately, so that the document structure can be easily changed and the document can be reused. It is suitable for searching.
【0008】このような、HTML、XMLで記述され
た文書は構造化文書と呼ばれており、今後ますます構造
化文書をネットワーク上で共有する場面が増えることが
予想される。特にXMLで記述された構造化文書に関し
ては、タグの条件指定による検索要求(クエリ)をクラ
イアントから発行して、サーバ上に置かれた構造化文書
の中から所望のデータを検索する検索システムの構築が
普及すると期待される。以下、ネットワーク上の構造化
文書のことを単に文書と呼ぶことにする。[0008] Such a document described in HTML and XML is called a structured document, and it is expected that the number of occasions in which the structured document is shared on a network will increase in the future. In particular, for a structured document described in XML, a search request (query) is issued from a client by specifying tag conditions, and a search system for searching for desired data from the structured document placed on a server is used. Construction is expected to spread. Hereinafter, a structured document on a network will be simply referred to as a document.
【0009】一方、インターネットでWWWを通じて得
られる文書は、不特定多数のユーザが共有して閲覧する
ことが前提となるため、ユーザ個人のタグ(あるいはマ
ークやコメント)を通常付加することができないように
なっている。[0009] On the other hand, documents obtained through the WWW on the Internet are premised on being shared and viewed by an unspecified number of users, so that tags (or marks or comments) of the users cannot be normally added. It has become.
【0010】しかしながら、文書が例えば、営業員が閲
覧する顧客データのとき、各営業員が顧客への訪問や案
件処理の優先順位(緊急度)を個人的にタグとしてつけ
たいという要望が生ずる場合がある。あるいは、文書が
特許データのとき、各特許に対しての評価や、何年何月
何日に閲覧したかをタグとして追加したいという要望が
生ずる場合がある。However, when the document is, for example, customer data browsed by a salesperson, a request arises that each salesperson wants to personally tag the priority (urgency) of visiting the customer or processing the case. There is. Alternatively, when the document is patent data, there may be a request to evaluate each patent or add a tag indicating the date, year, and date of browsing.
【0011】従って、書き換えが許可されていない構造
化文書データベースから、ネットワーク経由で不特定多
数のユーザが構造化文書を検索表示するシステムにおい
て、ユーザが個人用のタグを追加できる仕組みが望まれ
ている。Therefore, in a system in which an unspecified number of users search and display a structured document from a structured document database for which rewriting is not permitted via a network, a mechanism that allows the user to add a personal tag is desired. I have.
【0012】ここで、上記の要望に応えるための従来技
術として、文書に対してユーザが個人的なマークやコメ
ント等の情報を付加する方法が、特開2001−227
49号公報に開示されている。そこでは、文書を提供す
るサーバ側が、予め個人付加情報データベースや個人付
加情報管理部を文書とともに保持しており、ユーザが構
造化文書を表示する際にマークやコメントを付与して表
示することで、組織内の複数メンバー間でこれらの個人
付加情報をつけた文書を共有して閲覧する方式が提案さ
れている。Here, as a conventional technique for responding to the above demand, a method in which a user adds information such as a personal mark or a comment to a document is disclosed in Japanese Patent Laid-Open No. 2001-227.
No. 49 discloses this. In this case, the server providing the document previously holds the personal additional information database and the personal additional information management unit together with the document, and when the user displays the structured document, a mark or comment is added and displayed. There has been proposed a method of sharing and browsing a document with such personal additional information among a plurality of members in an organization.
【0013】しかしながら、上記の方法では文書を提供
するサーバと文書を表示するクライアントの両方を新規
に作りこむ必要がある。したがって、文書を提供するサ
ーバが外部組織に属していて、その構成を変えることが
許可されていない場合にはこの方法を適用することがで
きない。However, in the above method, it is necessary to newly create both a server for providing a document and a client for displaying the document. Therefore, this method cannot be applied when the server providing the document belongs to an external organization and its configuration is not permitted to be changed.
【0014】また、上記の方法は、新規に付加した個人
付加情報はマークやコメントを想定しているため、個人
付加情報を基に構造化文書を検索するといった機能は用
意されていない。しかしながら、例えば文書が特許デー
タのとき、自分で付与した評価が「A」の特許だけを検
索したい、といった要望が生ずる場合がある。さらに、
例えば文書のタグが閲覧日であり、その子要素の
「年」、「月」、「日」を取り得る場合もあるため、個
人用のタグ自体も階層構造を持つことが可能であること
が望まれている。Further, in the above method, since newly added personal additional information is assumed to be a mark or a comment, a function of searching for a structured document based on the personal additional information is not provided. However, for example, when the document is patent data, there may be a request that the user wants to search only the patents whose evaluation is “A”. further,
For example, since the tag of a document is the browsing date and its child elements may be "year", "month", and "day", it is hoped that the personal tag itself can have a hierarchical structure. It is rare.
【0015】以上より、文書を提供するサーバの構成を
変えることなく、個人用のタグを追加するための構造化
文書の編集や、編集内容を反映した構造化文書の検索が
行えるシステムが望まれている。As described above, there is a demand for a system capable of editing a structured document for adding a personal tag and searching for a structured document reflecting the edited contents without changing the configuration of a server that provides the document. ing.
【0016】特に、追加した個人用のタグを基にクライ
アントから検索できたり、そのために、個人用のタグは
階層構造を持つことができることが望まれている。In particular, it is desired that the client can search based on the added personal tag and that the personal tag can have a hierarchical structure.
【0017】[0017]
【発明が解決しようとする課題】以上説明したように、
サーバ側に構造化文書をおき、ネットワーク経由でクラ
イアント側から検索要求を発行して所望の構造化文書を
検索表示する形態において、構造化文書の書き換えが許
可されていないときであってもユーザが個人用のタグを
付加する編集を行いたいという要望に対し、特開200
1−22749号公報に開示されている方法では、文書
を提供するサーバ構成の変更が許可されていない場合に
適用できないという問題点があった。As described above,
In a mode in which a structured document is placed on the server side and a search request is issued from the client side via the network to search and display a desired structured document, even when rewriting of the structured document is not permitted, the user can perform In response to a request to perform editing by adding a personal tag,
The method disclosed in Japanese Patent Application Laid-Open No. 1-22749 has a problem that it cannot be applied when a change in the configuration of a server that provides a document is not permitted.
【0018】また、上記開示されている方法は、新規に
付加したマークやコメント等の個人付加情報を文書に付
加して表示するためのものであり、個人付加情報を基に
構造化文書を検索することはできないという問題点があ
った。Further, the method disclosed above is for adding and displaying personally added information such as newly added marks and comments to a document, and for retrieving a structured document based on the personally added information. There was a problem that it could not be done.
【0019】そこで、本発明は、上記問題点に鑑み、構
造化文書データベースを有し、その構造化文書データベ
ースに格納されている構造化文書をクライアントからの
要求に応じて提供するサーバの構成を変えることなく、
また、構造化文書データベースに対し、何ら操作を行う
ことなく、構造化文書データベースに格納されている構
造化文書に個人用のタグを追加する編集と、その編集し
た結果を反映した構造化文書の検索が容易に行える構造
化文書編集方法およびそれを用いた構造化文書編集装置
および端末装置およびプログラムを提供することを目的
とする。Accordingly, the present invention has been made in view of the above problems, and has a structure of a server having a structured document database and providing a structured document stored in the structured document database in response to a request from a client. Without changing
In addition, without performing any operation on the structured document database, editing to add a personal tag to the structured document stored in the structured document database, and editing of the structured document reflecting the edited result It is an object of the present invention to provide a structured document editing method capable of easily performing a search, a structured document editing device using the same, a terminal device, and a program.
【0020】[0020]
【課題を解決するための手段】本発明は、階層化された
論理構造を持つ構造化文書データベースに格納されてい
る複数の構成要素からなる構造化文書に追加する新たな
構成要素を作成して、この作成された新たな構成要素を
該構造化文書に対応付けて記憶し、前記構成要素とその
値を検索条件に含む検索要求に基づき、前記記憶手段で
記憶された新たな構成要素を検索するための第1の検索
要求と、前記構造化文書データベースに格納された構造
化文書を検索するための第2の検索要求とを生成し、前
記第2の検索要求に基づき前記構造化文書データベース
から検索された構造化文書に前記第1の検索要求に基づ
き検索された新たな構成要素が対応付けられているとき
は、該構造化文書に該新たな構成要素を追加して表示す
ることを特徴とする。SUMMARY OF THE INVENTION The present invention creates a new component to be added to a structured document consisting of a plurality of components stored in a structured document database having a hierarchical logical structure. Storing the created new component in association with the structured document, and searching for the new component stored in the storage unit based on a search request including the component and its value in a search condition. And a second search request for searching for a structured document stored in the structured document database, and generating the structured document database based on the second search request. When a new component retrieved based on the first search request is associated with the structured document retrieved from the above, it is necessary to add and display the new component in the structured document. Features .
【0021】本発明によれば、構造化文書を提供する側
(例えば、構造化文書管理システムおよびWWWサー
バ)の構成は一切変更することなく、しかも、構造化文
書データベースに対しては何ら操作を行う必要なく、書
き換えが許可されていない構造化文書データべース上の
構造化文書への編集(加工)と、その編集した結果を含
めた構造化文書の検索が容易に行える。According to the present invention, the structure of the side that provides a structured document (for example, a structured document management system and a WWW server) is not changed at all, and no operation is performed on the structured document database. It is possible to easily edit (process) a structured document on a structured document database for which rewriting is not permitted, and to search for a structured document including the edited result without having to perform the editing.
【0022】[0022]
【発明の実施の形態】まず、本発明の実施形態について
説明する前に、構造化文書管理システムについて説明す
る。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Before describing embodiments of the present invention, a structured document management system will be described.
【0023】(構造化文書管理システムの説明)構造化
文書として、XMLやSGMLなどで記述した文書が挙
げられる。SGML(Standard Genera
lized Markup Language)とは、
ISO(国際標準化機構)で定められた規格である。X
ML(eXtensible Markup Lang
uage)とは、W3C(World Wide We
b Consortium)にて定められた規格であ
る。それぞれ文書を構造化することを可能とする構造化
文書規約である。(Description of Structured Document Management System) Examples of structured documents include documents described in XML, SGML, or the like. SGML (Standard Genera)
Lizzed Markup Language)
This is a standard defined by the ISO (International Organization for Standardization). X
ML (extensible Markup Lang)
wage) is W3C (World Wide Wed)
b Consortium). These are structured document rules that enable each document to be structured.
【0024】以下、構造化文書として、XMLにて記述
された文書を例に説明を進める。構造化文書の文書構造
を定義したデータ(文書構造定義データ)をスキーマと
呼ぶ。XMLではそのスキーマを定義するためにXML
−SchemaやXDR(XML Data Redu
ced)などのスキーマ言語が提案されている。ここで
は、例えば、XDRでのスキーマを記述する場合を例に
とり説明する。Hereinafter, a description will be given by taking a document described in XML as an example of a structured document. Data defining the document structure of the structured document (document structure definition data) is called a schema. XML uses XML to define its schema.
-Schema and XDR (XML Data Redu
ced) and other schema languages have been proposed. Here, for example, a case of describing a schema in XDR will be described as an example.
【0025】スキーマも、構造化文書管理システムの管
理対象の構造化文書であり、従って、スキーマ文書と呼
ぶことがある。スキーマ文書と区別するために、特許明
細書やメール、週報、広告などの種々雑多な内容を有す
文書をコンテンツ文書と呼ぶこともある。The schema is also a structured document to be managed by the structured document management system, and may be called a schema document. In order to distinguish it from a schema document, a document having various contents such as a patent specification, an e-mail, a weekly report, and an advertisement may be referred to as a content document.
【0026】構造化文書管理システムでは、上記スキー
マ文書、上記コンテンツ文書、さらに、後述するような
ユーザからの検索要求内容を記述したクエリ、すなわ
ち、クエリ文書も管理対象とし、これらを総称して「文
書」と呼ぶ。In the structured document management system, the above-mentioned schema document, the above-mentioned content document, and a query which describes the contents of a search request from a user as described later, that is, a query document, are also managed. Document ".
【0027】以下、特にことわりがない場合、「文書」
と呼ぶときは、コンテンツ文書、スキーマ文書、クエリ
文書を全て指すものとする。Hereinafter, unless otherwise specified, "document"
Is used to refer to all of the content document, schema document, and query document.
【0028】まず、実施形態の説明を前に、XMLにつ
いて簡単に説明する。First, XML will be briefly described before describing the embodiment.
【0029】図3は、XMLで記述された構造化文書の
一例として、「特許」情報の例を示したものである。X
MLやSGMLは、文書の構造の表現にタグが用いられ
る。タグには、開始タグと終了タグがあり、文書構造情
報の構成要素を開始タグと終了タグで囲むことにより、
文書中の文字列(テキスト)区切りと、そのテキストが
構造上どの構成要素に属するのかを明確に記述すること
ができる。FIG. 3 shows an example of "patent" information as an example of a structured document described in XML. X
In ML and SGML, tags are used to represent the structure of a document. The tag has a start tag and an end tag. By surrounding the components of the document structure information with the start tag and the end tag,
It is possible to clearly describe a character string (text) delimiter in a document and to which structural element the text belongs.
【0030】ここで開始タグとは要素名称を記号
「<」、「>」で閉じたものであり、終了タグとは要素
名称を記号「</」と「>」で閉じたものである。タグ
に続く構成要素の内容が、テキスト(文字列)または子
供の構成要素の繰り返しである。また開始タグには「<
要素名称 属性=“属性値”>」などのように属性情報
を設定することができる。「<特許DB></特許DB
>」のようにテキストを含まない構成要素は、簡易記法
として「<特許DB/>」のように表わすこともでき
る。Here, the start tag means that the element name is closed by symbols "<" and ">", and the end tag means that the element name is closed by symbols "<//" and ">". The content of the component following the tag is a text (character string) or a repetition of the child component. In addition, the start tag is "<
Attribute information can be set such as “element name attribute =“ attribute value ”>”. "<Patent DB></ Patent DB
A component that does not include text, such as ">", can also be represented as "<Patent DB />" as a simple notation.
【0031】図3に示した文書は、「特許」タグから始
まる要素をルート(根)とし、その子要素として「タイト
ル」、「出願日」、「出願者」、「要約」タグから始ま
る要素集合が存在する。また、例えば、「タイトル」タ
グから始まる要素には「XMLデータベース」といっ
た、1つのテキスト(文字列)が存在する。The document shown in FIG. 3 has an element starting with a “patent” tag as a root, and an element set starting with “title”, “filing date”, “applicant”, and “summary” tags as its child elements. Exists. Also, for example, one text (character string) such as “XML database” exists in an element starting with a “title” tag.
【0032】XMLなどの構造化文書は、任意の構成要
素を繰り返し含んでいたり、さらには文書構造があらか
じめ決まっていない(RDB(リレーショナルデータベ
ース)やOODB(オブジェクト指向データベース)の
スキーマでは定義できない)のが普通である。Structured documents such as XML repeatedly include arbitrary constituent elements, or have a document structure that is not predetermined (cannot be defined by a schema of RDB (relational database) or OODB (object-oriented database)). Is common.
【0033】図3に示したような構造化文書を論理的に
表現するために、図4に示すようなツリー表現が用いら
れる。ツリーは、ノード(番号が付され、円形で示され
たもの)とアーク(ノードを表す円形間をつなぐデータ
付き線)と四角形で囲まれたテキストから構成されてい
る。In order to logically represent a structured document as shown in FIG. 3, a tree representation as shown in FIG. 4 is used. The tree is composed of nodes (numbered and indicated by a circle), arcs (data-attached lines connecting the circles representing the nodes), and text surrounded by rectangles.
【0034】ノードは文書オブジェクトに対応し、ノー
ドからタグ名や属性名に相当するラベルが付与された複
数のアークが出てきている。そのアークの先は、ノード
または要素値としての文字列(テキスト)である。ノー
ドの中に記載されている英数字(#0、#49)などは
オブジェクトIDである。A node corresponds to a document object, and a plurality of arcs with labels corresponding to tag names and attribute names have emerged from the node. The tip of the arc is a character string (text) as a node or element value. Alphanumeric characters (# 0, # 49) described in the nodes are object IDs.
【0035】図4に示したツリー構造を図3に示した構
造化文書の文書オブジェクトツリーと呼ぶ。The tree structure shown in FIG. 4 is called a document object tree of the structured document shown in FIG.
【0036】図1は、本実施形態に係る構造化文書管理
システムの構成例を示したものである。図1において、
構造化文書管理システムは、大きく分けて、要求制御部
1、アクセス要求処理部2、検索要求処理部3、データ
アクセス部4、文書記憶部5、インデックス記憶部6か
ら構成されている。文書記憶部5、インデックス記憶部
6は例えば、外部記憶装置を用いて構成される。FIG. 1 shows an example of the configuration of a structured document management system according to this embodiment. In FIG.
The structured document management system is roughly composed of a request control unit 1, an access request processing unit 2, a search request processing unit 3, a data access unit 4, a document storage unit 5, and an index storage unit 6. The document storage unit 5 and the index storage unit 6 are configured using, for example, an external storage device.
【0037】図1のシステム構成は、ソフトウエアを用
いて実現可能である。The system configuration shown in FIG. 1 can be realized by using software.
【0038】要求制御部1は、要求受付部11と結果処
理部12から構成されている。要求受付部11は、ユー
ザからの文書格納や文書取得、文書検索などの要求を受
け付けて、アクセス要求処理部2を呼び出す。結果処理
部12は、アクセス要求処理部2が処理した結果を要求
元のユーザに返す処理を行う。The request control unit 1 comprises a request receiving unit 11 and a result processing unit 12. The request receiving unit 11 receives a request from a user for storing a document, acquiring a document, searching for a document, and the like, and calls the access request processing unit 2. The result processing unit 12 performs a process of returning a result processed by the access request processing unit 2 to the requesting user.
【0039】アクセス要求処理部2は、ユーザからの文
書格納や文書取得などの要求に対応した複数の処理部か
ら構成されている。つまり、文書格納部21、文書取得
部22、文書削除部23から構成されている。The access request processing section 2 is composed of a plurality of processing sections corresponding to requests from the user for storing and obtaining documents. That is, it is configured by a document storage unit 21, a document acquisition unit 22, and a document deletion unit 23.
【0040】文書格納部21は、文書記憶部5中の論理
的な指定エリアに文書を格納する処理を行う。The document storage unit 21 performs processing for storing a document in a logically designated area in the document storage unit 5.
【0041】文書取得部22は、文書記憶部5中の論理
的なエリアが指定されたときに、その指定エリアに存在
する文書を取得する処理を行う。When a logical area in the document storage unit 5 is designated, the document acquiring unit 22 performs a process of acquiring a document existing in the designated area.
【0042】文書削除部23は、文書記憶部5中の論理
的な指定エリアに存在する文書を削除する処理を行う。The document deletion unit 23 performs a process of deleting a document existing in a logical designated area in the document storage unit 5.
【0043】文書記憶部5は、構造化文書データベース
であり、例えば、図8に示すように、文書をUNIX
(登録商標)のディレクトリ構造のように階層的にツリ
ー構造状に格納している。The document storage unit 5 is a structured document database. For example, as shown in FIG.
(Registered trademark) in a hierarchical tree structure like a directory structure.
【0044】図8に示すように、構造化文書データベー
スは、図4に示したような1つの構造化文書のツリー構
造と同様に表現できる。すなわち、任意のノード以下の
部分階層木(部分ツリー)は、構造化文書データベース
から切り出された構造化文書であり、ここでは、これを
文書オブジェクトツリーと呼ぶ。各ノードにはオブジェ
クトIDが割り当てられている。オブジェクトIDは、
構造化文書データベース内ではユニークな数値を持つも
のとする。As shown in FIG. 8, the structured document database can be expressed in the same manner as the tree structure of one structured document as shown in FIG. That is, a partial hierarchical tree (partial tree) below an arbitrary node is a structured document cut out from the structured document database, and is called a document object tree here. Each node is assigned an object ID. The object ID is
It shall have a unique numerical value in the structured document database.
【0045】階層木のルートとなるノードには、それが
ルートノードであることを特定するためのオブジェクト
ID「#0」が割り当てられるものとする。It is assumed that a node that is the root of the hierarchical tree is assigned an object ID "# 0" for specifying that it is the root node.
【0046】ルートノード、すなわち、「#0」のノー
ドからは「root」タグを先頭に持つ「#1」のノー
ドへリンクが張られている。「#1」のノードからは、
「特許DB」タグを先頭にもつ「#2」ノードへのリン
クが張られている。「#2」ノードからは、「特許」タ
グを先頭に持つ「#42」ノード、「#52」ノード、
「#62」ノードへのリンクがそれぞれ張られている。A link is provided from the root node, that is, the node of "# 0" to the node of "# 1" having a "root" tag at the top. From the node "# 1",
A link to a “# 2” node having a “patent DB” tag at the top is provided. From the “# 2” node, a “# 42” node, a “# 52” node having a “patent” tag at the top,
A link to the “# 62” node is provided.
【0047】図3に示した「特許」情報は、「#42」
ノード以下の部分ツリーに対応している。このノードか
らは「タイトル」タグ、「出願者」タグ、「要約」タグ
などを先頭にもつノードへリンクが張られ、末端のノー
ドからは、「XMLデータベース」、「T社」。「XM
Lを統一的に管理するデータベースを提供する…」など
の文字列(要素値)へのリンクが張られている。The “patent” information shown in FIG. 3 is “# 42”
It corresponds to the partial tree below the node. From this node, a link is provided to a node having a "title" tag, an "applicant" tag, a "summary" tag, and the like at the beginning, and from the terminal node, "XML database" and "T company". "XM
A link to a character string (element value) is provided.
【0048】「#52」ノード以下の部分ツリー、「#
62」ノード以下の部分ノードも1つの「特許」情報に
対応する部分である。The partial tree below the "# 52" node, "# 52"
Partial nodes below the "62" node are also parts corresponding to one piece of "patent" information.
【0049】ところで、例えば、「#43」ノードにリ
ンクされた「XMLデータベース」という要素値は、
「#43」ノードと「#value」という特殊なタグ
名で接続されている。このタグ名は、「#」で始まるた
めXML規格においては標準的なタグ名として利用する
ことはできない。By the way, for example, the element value “XML database” linked to the “# 43” node is:
It is connected to the “# 43” node with a special tag name “#value”. Since this tag name starts with “#”, it cannot be used as a standard tag name in the XML standard.
【0050】このような構造化文書データベースの特定
ノードを指定するために構造化文書パスを用いる。構造
化文書パスは「uix://root」から始まる文字
列である。uix(Universal Identi
fier for XML)は構造化文書パスであるこ
とを示す前置文字列である。A structured document path is used to specify a specific node in such a structured document database. The structured document path is a character string starting with “uix: // root”. ix (Universal Identity)
“fier for XML) is a prefix character string indicating a structured document path.
【0051】例えば、「uix://root/特許D
B」は、「#1」ノードから「特許DB」が付与された
アークが指し示すノード、つまり「#2」ノードに対応
する。このように「root」から「/」で区切られた
部分文字列をタグ名とみなすことで「#0」ノードから
タグ名の並びに沿って対応するアークを下っていき、そ
の最後のアークが指すノードが、パスの場所を指し示
す。For example, "uix: // root / Patent D
“B” corresponds to the node indicated by the arc to which “patent DB” is assigned from the “# 1” node, that is, the “# 2” node. In this way, by regarding the partial character string delimited by “/” from “root” as a tag name, the corresponding arc descends from the “# 0” node along the tag name sequence, and the last arc indicates the same. A node points to the location of the path.
【0052】例えば、「uix://root/特許D
B/特許」は、「#42」ノード、「uix://ro
ot/特許DB/出願日/年」は、「#45」ノードを
指し示す。For example, "ux: / root / Patent D
B / Patent ”is a“ # 42 ”node,“ ux: // ro
“ot / patent DB / application date / year” indicates the “# 45” node.
【0053】「#2」ノード以下に、すなわち、「特許
DB」に、複数の「特許」情報を格納する場合には、個
々の「特許」情報を識別するために、構造化文書パスに
インデックス表現が可能である。When a plurality of “patent” information is stored under the “# 2” node, that is, in the “patent DB”, an index is added to the structured document path to identify each “patent” information. Expression is possible.
【0054】「特許DB」の最初の「特許」情報であれ
ば、「uix://root/特許DB/特許[0]」
となるが、これは「uix://root/特許DB/
特許」と同じとみなす。If it is the first “patent” information of “patent DB”, “uix: // root / patent DB / patent [0]”
This is "uiix: // root / patent DB /
Patent ".
【0055】「特許DB」の2番目の「特許」情報であ
れば、「uix://root/特許DB/特許[1]
DB」の5番目の「特許」情報であれば、「uix:/
/root/特許DB/特許[4]」となる。In the case of the second “patent” information of the “patent DB”, “uix: // root / patent DB / patent [1]”
If it is the fifth “patent” information of “DB”, “uix: //
/ Root / patent DB / patent [4] ".
【0056】インデックス記憶部6には検索時に用い
る、要素名称生起インデックスとデータ生起インデック
スが記憶されている。The index storage unit 6 stores an element name occurrence index and a data occurrence index used at the time of retrieval.
【0057】要素名生起インデックスとは構造化文書デ
ータベースに格納されている要素名称のリストと、各要
素名称が先頭にある構造化文書(文書オブジェクトツリ
ー)の位置とを関連付けてインデックスファイル化した
ものである。例えば、図8の構造化文書データベースの
ように、(「特許」情報に対応する)「特許」という要
素名称が「#42」ノード以下の構造化文書、「#5
2」ノード以下の構造化文書、「#62」ノード以下の
構造化文書に存在する場合、これらをインデックス化す
ると、図9に示すように、それらの親ノード、「#2」
ノードが、要素名称生起インデックスファイルに「特
許」キーからのチェーンで格納される。The element name occurrence index is an index file in which a list of element names stored in the structured document database is associated with the position of the structured document (document object tree) in which each element name is at the head. It is. For example, as shown in the structured document database of FIG. 8, a structured document in which the element name “patent” (corresponding to “patent” information) is a node “# 42” or less, “# 5”
If there is a structured document under the “2” node and a structured document under the “# 62” node, these are indexed, and their parent nodes, “# 2”, as shown in FIG.
The nodes are stored in the element name occurrence index file in a chain from the “patent” key.
【0058】このように、親ノードでインデックス化す
ると、インデックスファイルを圧縮することができる。
すなわち、親ノードでインデックス化すれば、子ノード
が増大しようとも、親ノードで代用しているので、チェ
ーンサイズは増大しない。これに対し、実ノードをイン
デックス化すれば「特許」情報の格納数の増大とともに
チェーンサイズはそれに比例して増加してしまう。As described above, when indexing is performed at the parent node, the index file can be compressed.
In other words, if indexing is performed using the parent node, even if the number of child nodes increases, the size of the chain does not increase because the parent node is used instead. On the other hand, if real nodes are indexed, the chain size increases in proportion to the number of stored "patent" information.
【0059】データ生起インデックスとは、構造化文書
データベースに格納されている文字列データのリストと
各文字列データがある構造化文書(文書オブジェクトツ
リー)の位置とを関連付けてインデックスファイル化し
たものである。例えば、図8の構造化文書データベース
のように、「XML」という文字列データ(および、
「XML」という文字列を含む文字列)が「#43」ノ
ード以下の構造化文書、「#49」ノード以下の構造化
文書に存在する場合、これらをインデックス化すると、
図10に示すように、「#43」ノード、「#49」ノ
ードが、データ生起インデックスファイルに「XML」
キーからのチェーンで格納される。The data occurrence index is an index file that associates a list of character string data stored in the structured document database with the position of a structured document (document object tree) in which each character string data is located. is there. For example, as shown in the structured document database of FIG. 8, character string data of "XML" (and
If a character string including a character string “XML” exists in a structured document under the “# 43” node and a structured document under the “# 49” node, these are indexed.
As shown in FIG. 10, the “# 43” node and the “# 49” node add “XML” to the data occurrence index file.
Stored in a chain from the key.
【0060】なお、逆階層インデックスなど、その他の
インデックスファイルを用いてもよい。逆階層インデッ
クスとは、あるノードとその親ノードとの対応を格納し
たものである(あるノードからその親ノードを求めるこ
とができる)。Note that another index file such as an inverted hierarchical index may be used. The inverted hierarchical index stores a correspondence between a certain node and its parent node (the parent node can be obtained from a certain node).
【0061】文書記憶部5中の論理的な指定エリアと
は、ユーザにより構造化文書パスを用いて指定された文
書の格納場所を指す。構造化文書パスは、ユーザにとっ
て認識可能な表現である。The logical designation area in the document storage unit 5 indicates a storage location of a document designated by a user using a structured document path. The structured document path is an expression that can be recognized by the user.
【0062】図1の説明に戻る。Returning to the description of FIG.
【0063】データアクセス部4は、文書記憶部5をア
クセスする基本インターフェイスの集合である。データ
アクセス部4は、文書オブジェクトツリー格納部47、
文書オブジェクトツリー削除部48、文書オブジェクト
ツリー取得部49、文書文字列取得部44、パスから文
書オブジェクトツリー取得部45、文書パーサ部46、
合成文書作成部47、インデックス更新部48から構成
される。The data access unit 4 is a set of basic interfaces for accessing the document storage unit 5. The data access unit 4 includes a document object tree storage unit 47,
A document object tree deletion unit 48, a document object tree acquisition unit 49, a document character string acquisition unit 44, a path-based document object tree acquisition unit 45, a document parser unit 46,
It is composed of a composite document creating section 47 and an index updating section 48.
【0064】文書オブジェクトツリー格納部41は、文
書記憶部5中の物理的な指定エリアに文書オブジェクト
ツリーを格納する処理を行う。The document object tree storage section 41 performs a process of storing the document object tree in a physically designated area in the document storage section 5.
【0065】文書オブジェクトツリー削除部42は、文
書記憶部5中の物理的な指定エリアに存在する文書オブ
ジェクトツリーを削除する処理を行う。The document object tree deletion section 42 deletes the document object tree existing in the physically designated area in the document storage section 5.
【0066】文書オブジェクトツリー取得部43は、文
書記憶部5中の物理的な指定エリアに存在する文書オブ
ジェクトツリーを取得する処理を行う。The document object tree acquisition section 43 performs a process of acquiring a document object tree existing in a physically designated area in the document storage section 5.
【0067】文書文字列取得部44は、文書オブジェク
トツリーを構造化文書(XML文書)に変換する処理を
行う。The document character string acquisition unit 44 performs a process of converting a document object tree into a structured document (XML document).
【0068】パスから文書オブジェクトツリー取得部4
5は、構造化文書パスを解析して文書記憶部5中の物理
的なエリアを特定して、そのエリアに存在する文書オブ
ジェクトツリーを取り出す処理を行う。Document Object Tree Acquisition Unit 4 from Path
Reference numeral 5 performs a process of analyzing a structured document path, specifying a physical area in the document storage unit 5, and extracting a document object tree existing in the area.
【0069】文書パーサ部46は、ユーザにより入力さ
れた構造化文書を読み込んで構文解析して整合性の検査
を行い、さらに文書構造定義データであるスキーマが存
在すれば構造的に妥当かどうかの検証を行う。出力結果
は文書オブジェクトツリーとなる。文書パーサは、通
常、lex(lexical analyzer ge
nerator)といったレキシカルアナライザ(字句
解析を行い,トークンに分解する)とyacc(yet
another compiler compile
r)といったパーサジェネレータを組み合わせて構築す
ることができる。The document parser unit 46 reads the structured document input by the user, parses the structured document, checks the consistency, and further checks whether the schema as the document structure definition data is structurally valid. Perform verification. The output result is a document object tree. Document parsers are typically lex (lexical analyzer geo)
lexical analyzer (performs lexical analysis and decomposes into tokens) such as
another compiler compile
r) can be constructed in combination.
【0070】合成文書作成部47は、文書格納や文書削
除などをする際に、スキーマに合致しているかどうか検
査しなければならないが、この検査時に必要となるデー
タを作成して出力する。When storing a document, deleting a document, or the like, the synthetic document creating section 47 must check whether the schema matches the schema. The synthetic document creating section 47 creates and outputs data necessary for the checking.
【0071】インデックス更新部48は、文書格納や文
書削除などにより、構造化文書データベースの格納内容
が更新されるたびに、図9、図10に示した要素名称生
起インデックスとデータ生起インデックスを更新する。The index updating unit 48 updates the element name occurrence index and the data occurrence index shown in FIGS. 9 and 10 each time the storage content of the structured document database is updated due to document storage or document deletion. .
【0072】文書記憶部5中の物理的な指定エリアと
は、ファイルオフセットやオブジェクトIDなどの構造
化文書データベース内ではユニークな文書データの存在
場所を指し示す内部データである。ユーザにとっては認
識不能なデータである。The physical designated area in the document storage unit 5 is internal data indicating a unique document data location in a structured document database such as a file offset and an object ID. The data cannot be recognized by the user.
【0073】文書記憶部5中に格納された文書を検索す
る処理を行う。要求制御部1の要求受付部11でユーザ
からの文書検索の要求が受け付けられると、検索要求処
理部3には、要求受付部11からクエリ言語で記述され
たクエリ文書が入力する。そしてデータアクセス部4を
通してインデックス記憶部6,文書記憶部5にアクセス
し、検索要求に合致する文書集合を取得して、その結果
を結果処理部12を介して出力する。A process for searching for a document stored in the document storage unit 5 is performed. When the request receiving unit 11 of the request control unit 1 receives a document search request from a user, the search request processing unit 3 receives a query document described in a query language from the request receiving unit 11. Then, it accesses the index storage unit 6 and the document storage unit 5 through the data access unit 4 to acquire a document set that matches the search request, and outputs the result via the result processing unit 12.
【0074】図2は、図1に示した構造化文書管理シス
テムの一利用形態を示したもので、図2では、WWW
(World Wide Web)のバックエンドで、
図1に示した構成の構造化文書管理システム100が動
作している場合を示している。FIG. 2 shows one use form of the structured document management system shown in FIG. 1. In FIG.
(World Wide Web) backend,
2 shows a case where the structured document management system 100 having the configuration shown in FIG. 1 is operating.
【0075】複数(ここでは、例えば3つ)のクライア
ント端末(例えばパーソナルコンピュータ、携帯通信端
末など)102のそれぞれでWWWブラウザ103が動
作している。ユーザは、各クライアント端末からWWW
サーバ101にアクセスすることにより、構造化文書管
理システム100にアクセスすることができる。WWW
ブラウザ103とWWWサーバ101とは、HTTP
(Hyper TextTransfer Proto
col)で通信している。また、WWWサーバ101と
構造化文書管理システム100とは、CGI(Comm
on Gateway Interface)またはC
OM(Component Object Mode
l)などで通信している。A WWW browser 103 operates on each of a plurality of (here, for example, three) client terminals (for example, personal computers, portable communication terminals, etc.) 102. Users can access WWW from each client terminal.
By accessing the server 101, the structured document management system 100 can be accessed. WWW
The browser 103 and the WWW server 101 are HTTP
(Hyper TextTransfer Proto
col). Further, the WWW server 101 and the structured document management system 100 communicate with each other by CGI (Comm.
on Gateway Interface) or C
OM (Component Object Mode)
1) and so on.
【0076】ユーザからの文書格納、文書取得、文書検
索などの要求は、WWWブラウザ103から送信され
て、WWWサーバ101を通して構造化文書管理システ
ム100にて受け付けられ、処理された結果は、WWW
サーバ101を通して要求元のWWWブラウザ103へ
返信される。Requests such as document storage, document acquisition, and document search from the user are transmitted from the WWW browser 103, received by the structured document management system 100 through the WWW server 101, and processed by the WWW server.
The request is returned to the requesting WWW browser 103 through the server 101.
【0077】以下、図1の構造化文書管理システムの
(1)格納機能、(2)検索機能について詳細に説明す
る。そして、(3)適用例では、概念検索を用いた特許
調査の場合を例にとり説明する。Hereinafter, (1) the storage function and (2) the search function of the structured document management system of FIG. 1 will be described in detail. In (3) Application Example, a case of patent search using concept search will be described as an example.
【0078】格納機能図1の構造化文書管理システムに
おける格納系のコマンドには以下のものがある。Storage Function The storage commands in the structured document management system of FIG. 1 include the following.
【0079】 insertXML(パス、N番目、XML):文書格納 appendXML(パス、XML) :文書格納 getXML(パス) :文書取得 removeXML(パス) :文書削除 setSchema(パス、スキーマ) :スキーマ格納 getSchema(パス) :スキーマ取得 「insertXML」は、( )内に指定した構造化
文書パス以下のN番目に文書を挿入するコマンド(以
下、簡単に挿入コマンドと呼ぶ)である。InsertXML (path, Nth, XML): document storage appendXML (path, XML): document storage getXML (path): document acquisition removeXML (path): document deletion setSchema (path, schema): schema storage getSchema ): Schema acquisition “insertXML” is a command for inserting a document at the Nth position below the structured document path specified in parentheses (hereinafter simply referred to as an insert command).
【0080】「appendXML」は、( )内に指
定した構造化文書パス以下の最後に文書を挿入するコマ
ンド(以下、簡単に追加コマンドと呼ぶ)である。"AppendXML" is a command for inserting a document at the end of the structured document path specified in parentheses (hereinafter simply referred to as an additional command).
【0081】「getXML」は、( )内に指定した
構造化文書パス以下の文書を取り出すコマンド(以下、
簡単に取得コマンドと呼ぶ)である。“GetXML” is a command (hereinafter referred to as a command) for retrieving documents below the structured document path specified in parentheses.
(Referred to simply as an acquisition command).
【0082】「removeXML」は、( )内に指
定した構造化文書パス以下の文書(スキーマ文書以外の
文書で、主に、コンテンツ文書)を削除するコマンド
(以下、簡単に削除コマンドと呼ぶ)である。“RemoveXML” is a command (hereinafter simply referred to as a delete command) for deleting documents (documents other than schema documents, mainly content documents) below the structured document path specified in parentheses. is there.
【0083】「setSchema」は、( )内に指
定した構造化文書パスにスキーマを設定するコマンド
(以下、簡単にスキーマ格納コマンドと呼ぶ)である。“SetSchema” is a command for setting a schema in the structured document path specified in parentheses (hereinafter simply referred to as a schema storage command).
【0084】「getSchema」は、( )内に指
定した構造化文書パスに設定されているスキーマを取り
出すコマンド(以下、簡単にスキーマ取得コマンドと呼
ぶ)である。“GetSchema” is a command for extracting the schema set in the structured document path specified in parentheses (hereinafter simply referred to as a schema acquisition command).
【0085】上記コマンドのうち、挿入コマンド、追加
コマンド、スキーマ格納コマンドについての処理はアク
セス要求処理部2の文書格納部21で実行され、取得コ
マンド、スキーマ取得コマンドについての処理は文書取
得部22で実行され、削除コマンドについての処理は文
書削除部23で実行される。Of the above commands, the processing for the insert command, the add command, and the schema storage command is executed by the document storage unit 21 of the access request processing unit 2, and the processing for the acquisition command and the schema acquisition command is performed by the document acquisition unit 22. The processing for the executed deletion command is executed by the document deletion unit 23.
【0086】図5を参照して、構造化文書データベース
の初期状態(図5(a)参照)において、追加コマンド
を実行する場合について説明する。Referring to FIG. 5, a case where an additional command is executed in the initial state of the structured document database (see FIG. 5A) will be described.
【0087】図5(a)に示すように、「#0」ノード
と「#1」ノードが「root」アークで接続されてい
る初期状態に対して、「appendXML(“ui
x://root”,“<特許DB/>”)」を実行し
た結果、図5(b)に示すように、「#2」ノードと
「特許DB」アークが作成される。As shown in FIG. 5A, the initial state in which the “# 0” node and the “# 1” node are connected by a “root” arc is compared with “appendXML (“ ui
As a result of executing “x: // root”, “<patent DB />”), a “# 2” node and a “patent DB” arc are created as shown in FIG. 5B.
【0088】図5(b)に示した状態の構造化文書デー
タベースに対して、取得コマンドを実行する場合につい
て説明する。A case where an acquisition command is executed on the structured document database in the state shown in FIG. 5B will be described.
【0089】例えば、「getXML(“uix://
root”)」を実行すると、図5(b)の「roo
t」アークが示す「#0」ノード以下の文書オブジェク
トツリーが取り出され、それをXMLの文字列表現に変
換する。その結果、図6に示すように、「<root>
<特許DB/></root>」なる文字列が取り出さ
れる。取得コマンドの処理は、アクセス要求処理部2の
文書取得部22にて実行される。For example, “getXML (“ uix: ///
When “root”) is executed, “root” in FIG.
The document object tree below the “# 0” node indicated by the “t” arc is extracted, and is converted into an XML character string representation. As a result, as shown in FIG. 6, “<root>
A character string "<patent DB // </ root>" is extracted. The processing of the acquisition command is executed by the document acquisition unit 22 of the access request processing unit 2.
【0090】次に、図5(b)に示した状態の構造化文
書データベースに対して、図3に示すようなコンテンツ
文書(XML文書)としての「特許」情報を格納するた
めの追加コマンドを実行する場合について説明する。す
なわち、この場合、「appendXML(“uix:
//root/特許DB”,“<特許>…</特許
>”)」を実行する。このコマンド中「“<特許>…<
/特許>”」が、図3に示した「特許」情報に対応す
る。Next, an additional command for storing “patent” information as a content document (XML document) as shown in FIG. 3 is added to the structured document database in the state shown in FIG. 5B. The case of execution will be described. That is, in this case, “append XML (“ uix:
/// root / patent DB ”,“ <patent>... </ Patent> ”)”. In this command, ""<Patent> ... <
/ Patent>"" corresponds to the "patent" information shown in FIG.
【0091】上記追加コマンドの処理が実行されると、
図7に示すように、「#2」ノード以下に「#42」ノ
ードをトップとする文書オブジェクトツリー(図4に対
応)が追加される。When the processing of the additional command is executed,
As shown in FIG. 7, a document object tree (corresponding to FIG. 4) having the "# 42" node at the top is added below the "# 2" node.
【0092】図5(b)に示した状態の構造化文書デー
タベースに対して、次に示すような追加コマンドを3回
繰り返して実行したとする。Assume that the following additional command is repeatedly executed three times on the structured document database in the state shown in FIG. 5B.
【0093】「appendXML(“uix://r
oot/特許DB”,“<特許>…</特許>”)」上
記コマンド中、「<特許>…</特許>」は、図3に示
した文書構造のコンテンツ文書に対応する。"Append XML (" uix: // r
out / patent DB ”,“ <patent>... </ patent> ”) In the above command,“ <patent>.
【0094】すると、図8に示すように、「#2」ノー
ド以下に「#42」ノード、「#52」ノード、「#6
2」ノードをトップとする文書オブジェクトツリーが追
加される。Then, as shown in FIG. 8, the “# 42” node, the “# 52” node, the “# 6” node
A document object tree with the "2" node at the top is added.
【0095】次に、図8に示した状態の構造化文書デー
タベースに対して、3つの「特許」情報を取り出すため
の取得コマンドを実行した場合について説明する。この
場合、「getXML(“uix://root/特許
DB”)」を実行する。すると、「特許DB」アークが
示す「#2」ノード以下の文書オブジェクトツリーが取
り出され、それをXMLの文字列表現(XML文書)に
変換する。その結果、図11に示すように、「<特許D
B><特許>…</特許><特許>…</特許><特許
>…</特許></特許DB>」なる文字列が取り出さ
れる。Next, a case where an acquisition command for extracting three pieces of "patent" information is executed on the structured document database in the state shown in FIG. 8 will be described. In this case, “getXML (“ uix: // root / patent DB ”)” is executed. Then, a document object tree below the “# 2” node indicated by the “patent DB” arc is extracted, and converted into an XML character string expression (XML document). As a result, as shown in FIG.
B><patent>...</Patent><patent>...</Patent><patent>...</Patent></ patent DB>
【0096】構造化文書データベースでは、上記の「特
許」情報などのコンテンツ文書(XML文書)の文書構
造を定義したデータ、すなわち、スキーマも管理対象と
する。In the structured document database, data defining the document structure of the content document (XML document) such as the “patent” information, that is, a schema is also managed.
【0097】図12は、XML文書の文書構造を定義す
るスキーマの一例を示したものである。ここでは、XM
Lの文書構造定義言語の一つであるXDR(XML−D
ata Reduced)を取り上げる。もちろん、X
ML−Schemaなど他の文書構造定義言語を用いて
もかまわない。FIG. 12 shows an example of a schema that defines the document structure of an XML document. Here, XM
XDR (XML-D
data Reduced). Of course, X
Another document structure definition language such as ML-Schema may be used.
【0098】図12に示したスキーマは、図3に示した
「特許」情報の文書構造をXDRで定義したものであ
る。図12からも容易に分かるとおり、スキーマもXM
L形式の構造化文書である。「Schema」タグから
始まる構成要素から始まり、その子要素として、「El
ementType」タグから始まる要素集合が存在す
る。The schema shown in FIG. 12 defines the document structure of the “patent” information shown in FIG. 3 by XDR. As can be easily understood from FIG. 12, the schema is also XM
This is a structured document in the L format. It starts with a component that starts with a “Schema” tag, and has “El” as its child element.
There is an element set starting with the “elementType” tag.
【0099】図12に示したスキーマにおいて、例え
ば、最初の「ElementType」タグから始まる
子要素は以下の情報を意味している。In the schema shown in FIG. 12, for example, a child element starting from the first “ElementType” tag means the following information.
【0100】・「特許」タグを持つ要素の文書構造定義
(「ElementType name=”特許”」)
である。Document definition of element having “patent” tag (“ElementType name =“ patent ”)”
It is.
【0101】・子要素は要素だけ(「content
=”eltOnly”」)である。The child element is only an element (“content
= "EltOnly"").
【0102】・「タイトル」、「出願日」、「要約」タ
グから始まる子要素から構成される(「element
type=”タイトル”、…」)。さらに、その順番
は一意に決まっている(「order=”se
q”」)。It is composed of child elements starting from “title”, “filing date”, and “summary” tags (“element
type = “title”,... Further, the order is uniquely determined (“order =” se
q ")).
【0103】・上記「特許」タグから始まる要素の文書
構造定義の他に、「タイトル」「出願者」「要約」
「年」「月」「日」「出願日」の文書構造定義を記述し
ている。すなわち、「出願日」を除く、「タイトル」
「出願者」「要約」「年」「月」「日」タグから始まる
構成要素の子要素はテキストだけと定義されている
(「content=”textOnly”」)。-In addition to the document structure definition of the element starting from the "patent" tag, "title", "applicant", "summary"
It describes the document structure definition of "year", "month", "day" and "filing date". That is, excluding the “filing date”, the “title”
The child element of the component starting from the tags of “applicant”, “summary”, “year”, “month” and “day” is defined as text only (“content =“ textOnly ””).
【0104】・「出願日」タグから始まる構成要素の子
要素は、「年」、「月」、「日」の並びである。The child elements of the constituent elements starting from the “application date” tag are a sequence of “year”, “month”, and “day”.
【0105】図8に示した状態の構造化文書データベー
スに対して、図12に示したスキーマ文書を格納するた
めのスキーマ格納コマンドを実行する場合について説明
する。この場合、「setSchema(“uix:/
/root/特許DB”,“<Schema>…</S
chema>”)」を実行する。このコマンド中、
「“<Schema>…</Schema>”」」が図
12に示したスキーマ文書に対応する。A case where a schema storage command for storing the schema document shown in FIG. 12 is executed on the structured document database in the state shown in FIG. 8 will be described. In this case, "setSchema (" uix: /
/ Root / patent DB ","<Schema> ... <// S
chema> ”)”. In this command,
“<Schema>... </ Schema>” ”corresponds to the schema document shown in FIG.
【0106】上記コマンドの実行により、図13に示す
ように、「#2」ノード以下に「#schema」アー
クが追加され、その先には、「#3」ノードをトップノ
ードとする文書オブジェクトツリーが追加される。スキ
ーマ自身がXML文書表現になっているため、前述した
「特許」情報のようなコンテンツ文書格納のケースと同
様にツリー展開可能である。By executing the above command, as shown in FIG. 13, a “#schema” arc is added below the “# 2” node, followed by a document object tree having the “# 3” node as the top node. Is added. Since the schema itself is expressed in an XML document, the tree can be expanded similarly to the case of storing the content document such as the “patent” information described above.
【0107】図13において、「@name」など
「@」で始まるアークは属性に対応する。タグ名「#s
chema」も「#」、「@」で始まるためXML規格
においては標準的なタグ名として利用することはできな
い。In FIG. 13, arcs starting with “@”, such as “@name”, correspond to attributes. Tag name "#s
Since “chema” also starts with “#” and “$”, it cannot be used as a standard tag name in the XML standard.
【0108】「#2」ノード下に図12に示したスキー
マ文書が格納されたことにより、以後、「#2」ノード
以下にこれから格納される文書の文書構造は、図12に
示したスキーマ文書により定義された文書構造に適合す
ることが要求される。すなわち、「#2」ノード以下に
図12に示したスキーマが設定されることになる。Since the schema document shown in FIG. 12 is stored under the “# 2” node, the document structure of a document to be stored under the “# 2” node is changed to the schema document shown in FIG. It is required to conform to the document structure defined by That is, the schema shown in FIG. 12 is set below the “# 2” node.
【0109】「#2」ノード以下に図12に示したスキ
ーマが設定されると、図14に示すように、「#2」ノ
ードの文書オブジェクトのファイルには、「#2」ノー
ド以下の文書オブジェクトツリーには、当該スキーマが
存在する旨の属性値がセットされる。When the schema shown in FIG. 12 is set under the “# 2” node, as shown in FIG. 14, the file of the document object of the “# 2” node contains the document under the “# 2” node. An attribute value indicating that the schema exists is set in the object tree.
【0110】「#2」ノード以下に図12に示したスキ
ーマが設定された後に、このスキーマで定義された文書
構造に一致する図3に示したような「特許」情報を、図
14に示したように、文書オブジェクトツリーとして構
造化文書データベースに格納したとき、この文書の文書
構造には図12に示したスキーマが存在する旨の属性値
が、当該文書オブジェクトツリーを構成する各文書オブ
ジェクトにセットされる。例えば、当該文書オブジェク
トツリーを構成する各文書オブジェクトのファイルに対
して、スキーマが存在している旨の属性値(例えば、
「スキーマ適合有無」)に「1」がセットされる。図1
4では、スキーマに適合している各文書オブジェクト
(ノード)は2重丸で示している。2重丸で示した各文
書オブジェクトには、その文書オブジェクトに対応した
文書構造定義が存在することになる。After the schema shown in FIG. 12 is set under the “# 2” node, “patent” information as shown in FIG. 3 that matches the document structure defined by this schema is shown in FIG. As described above, when a document object tree is stored in the structured document database, an attribute value indicating that the schema shown in FIG. 12 exists in the document structure of this document is assigned to each document object constituting the document object tree. Set. For example, an attribute value indicating that a schema exists for a file of each document object constituting the document object tree (for example,
“1” is set in “schema conformance”. Figure 1
In FIG. 4, each document object (node) conforming to the schema is indicated by a double circle. Each document object indicated by a double circle has a document structure definition corresponding to the document object.
【0111】図15は、各文書オブジェクトのファイル
の内容を概念的に示したもので、例えば、オブジェクト
IDが「#42」の文書オブジェクトのファイルには、
その文書オブジェクトにリンクされている他の文書オブ
ジェクトに関する情報(例えば、アークや、リンク先の
文書オブジェクトへのポインタ値など)とともに、上記
属性値が記述されている。なお、当該文書オブジェクト
に適用するスキーマが存在しないときは、「スキーマ適
合有無」の値は「0」となる。FIG. 15 conceptually shows the contents of the file of each document object. For example, the file of the document object having the object ID “# 42” includes
The attribute value is described together with information (for example, an arc, a pointer value to a linked document object, and the like) related to another document object linked to the document object. When there is no schema to be applied to the document object, the value of “schema conformance” is “0”.
【0112】図16、図17は、図1の構造化文書管理
システムで、必要に応じて検索で使用される概念階層を
構造化文書で表現した例を示す。図16、図17に示す
「概念」情報はXMLで記述したコンテンツ文書であ
る。FIGS. 16 and 17 show an example in which the concept hierarchy used in the search is represented by a structured document in the structured document management system of FIG. 1 as needed. The “concept” information shown in FIGS. 16 and 17 is a content document described in XML.
【0113】図16に示した「概念」情報の例は、いわ
ゆる特許調査における特許文書の内容を分類するための
1つの分類軸として用いる「情報モデル」を概念階層で
表現している。「概念」タグで囲まれた「概念」情報
は、入れ子構造を持った文書構造をもっている。つま
り、図16の例では、概念「情報モデル」の子供概念と
して、概念「ドキュメント」、概念「リレーション」、
概念「オブジェクト」が存在している。また、概念「ド
キュメント」の子供概念として、概念「構造化訴求メン
ト」、概念「非構造化ドキュメント」が存在し、さら
に、概念「構造化ドキュメント」の子供概念として、概
念「XML」、概念「SGML」が存在している。In the example of the “concept” information shown in FIG. 16, an “information model” used as one classification axis for classifying the contents of a patent document in a so-called patent search is represented by a concept hierarchy. “Concept” information surrounded by “concept” tags has a document structure having a nested structure. That is, in the example of FIG. 16, the concept “document”, the concept “relation”,
The concept "object" exists. In addition, as a child concept of the concept “document”, there are a concept “structured appeal” and a concept “unstructured document”. Further, as a child concept of the concept “structured document”, the concept “XML” and the concept “ SGML "exists.
【0114】図17に示す「概念」情報の記述例は、図
16とは異なる分類軸「情報操作」を概念階層で表現し
ている。図17の例では、概念「情報操作」の子供概念
として、概念「検索」、概念「格納」、概念「加工」、
概念「流通」が存在している。The description example of the “concept” information shown in FIG. 17 expresses a classification axis “information operation” different from that in FIG. 16 in a concept hierarchy. In the example of FIG. 17, as the child concepts of the concept "information operation", the concept "search", the concept "storage", the concept "processing",
The concept "distribution" exists.
【0115】図16,図17に示したような「概念」情
報も、前述の「特許」情報と同様にして、構造化文書デ
ータベース内に格納することができる。すなわち、例え
ば、まず、図8に示した状態の構造化文書データベース
に対して、「appendXML(“uix://ro
ot”,“<概念DB/>”)」を実行して、図18に
示すように、「#201」ノードと「概念DB」アーク
が作成される。この状態において、図16に示した「概
念」情報を格納する場合には、「appendXML
(“uix://root/概念DB”,“<概念名前
>…</概念>”)」を実行する。このコマンド中
「“<概念名前>…</概念>”」が、図16に示した
「概念」情報に対応する。The “concept” information as shown in FIGS. 16 and 17 can be stored in the structured document database in the same manner as the “patent” information described above. That is, for example, first, for the structured document database in the state shown in FIG. 8, “appendXML (“ uix: // ro
ot ”,“ <concept DB / >> ”)”, a “# 201” node and a “concept DB” arc are created as shown in FIG. In this state, when the “concept” information shown in FIG. 16 is stored, “appendXML” is used.
(“Uix: // root / concept DB”, “<concept name>... </ Concept>”)). In this command, "<concept name> ... </ concept>" corresponds to the "concept" information shown in FIG.
【0116】上記追加コマンドの処理が実行されると、
図19に示すように、「#201」ノード以下に「#2
02」ノードをトップとする文書オブジェクトツリーが
追加される。When the processing of the additional command is executed,
As shown in FIG. 19, “# 2” is placed under the “# 201” node.
A document object tree with the “02” node at the top is added.
【0117】以上説明したように、図1の構造化文書管
理システムでは、構造化文書データベース上に登録され
る文書構造が異なる膨大な数のXML文書群(コンテン
ツ文書、スキーマ文書、クエリ文書など)を、図18,
図19に示すように、「root」タグを先頭に持つツ
リー状の1つの巨大なXML文書として取り扱う。その
ため、部分的なXML文書をアクセスするには巨大なX
ML文書に対するパスという文書構造に依存しない統一
的なアクセス手段を用いることにより、幅広くXML文
書を検索したり加工したりすることが可能になる。As described above, in the structured document management system of FIG. 1, a huge number of XML documents (content documents, schema documents, query documents, etc.) with different document structures registered in the structured document database From FIG. 18,
As shown in FIG. 19, it is handled as one huge XML document in a tree shape having a “root” tag at the top. Therefore, to access a partial XML document, a huge X
By using a unified access means that does not depend on a document structure such as a path to the ML document, it is possible to search and process the XML document widely.
【0118】また、構造化文書データベース上の一部に
スキーマを設定することで、格納しようとする文書の文
書構造がそのスキーマにより定義されている文書構造に
一致するか否かの妥当性のチェックが自動的に行なえる
(後述)。By setting a schema in a part of the structured document database, it is possible to check whether the document structure of the document to be stored matches the document structure defined by the schema. Can be automatically performed (described later).
【0119】(1−1)文書格納処理 次に、図1の構造化文書管理システムの文書格納処理動
作について、図20に示すフローチャートを参照して説
明する。(1-1) Document Storage Processing Next, the document storage processing operation of the structured document management system of FIG. 1 will be described with reference to the flowchart shown in FIG.
【0120】クライアント端末から構造化文書管理シス
テムに対し、文書格納要求として、挿入コマンド、追加
コマンド、スキーマ格納コマンドのうちのいずれかが送
信されて、要求受付部11にて受け付けられたとき、図
20に示した処理動作を行う。When any one of an insert command, an add command, and a schema storage command is transmitted from the client terminal to the structured document management system as a document storage request, and is received by the request receiving unit 11, FIG. The processing operation shown in FIG.
【0121】クライアント端末の所定の表示装置には、
構造化文書管理システム100(の例えば、要求制御部
1)から提供された、例えば、図31に示すようなユー
ザインターフェイスとしての画面が表示されている。The predetermined display device of the client terminal includes:
For example, a screen as a user interface as shown in FIG. 31 provided by the structured document management system 100 (for example, the request control unit 1) is displayed.
【0122】図31に示す画面には、構造化文書管理シ
ステム100への操作項目の一覧(メニュー)が表示さ
れている。操作項目として、「XML登録/削除」、
「スキーマ設定」、「XML検索」とがある。On the screen shown in FIG. 31, a list (menu) of operation items for the structured document management system 100 is displayed. As operation items, “XML registration / deletion”,
There are “schema setting” and “XML search”.
【0123】ユーザが例えば、この画面上で「XML登
録/削除」をマウス等のポインティングデバイスなどを
用いて選択すると、図32に示したような文書の格納/
削除を行うためのユーザインタフェースとしての画面が
表示される。When the user selects “XML registration / deletion” on this screen using a pointing device such as a mouse, for example, the storage / deletion of the document as shown in FIG.
A screen as a user interface for performing deletion is displayed.
【0124】図32において、領域W1には、文書構造
化文書データベースの現在のツリー構造の要素名(タグ
名)がユーザが理解可能なように簡略的に表示されてい
る。なお、図32では、上位階層の要素名のみを表示し
ているが、末端の要素名まで表示可能である。また、領
域W2は、構造化文書パスの入力領域であり、領域W1
の表示内容に従って、構造化文書パスを入力するように
なっている。また、領域W3は、格納する文書を入力し
たり、取得した文書を表示するようになっている。In FIG. 32, the element name (tag name) of the current tree structure of the document structured document database is simply displayed in the area W1 so that the user can understand it. In FIG. 32, only the element names in the upper hierarchy are displayed, but up to the terminal element names can be displayed. An area W2 is an input area of a structured document path, and an area W1
The structured document path is input in accordance with the display contents of. In the area W3, a document to be stored is input, and the acquired document is displayed.
【0125】例えば、構造化文書パスとして「roo
t」を入力する場合には、領域W1の「root」をマ
ウス等で選択すればよい。すると、図32に示すよう
に、領域W2の構造化文書パスの入力領域に「uix:
//root」と表示される。また、新たに、「特許D
B」という要素を追加する場合は、図32に示すよう
に、領域W3に、「特許DB」を入力する。そして、
「登録」ボタンB1を選択すると、クライアント端末か
らappendXML(“uix://root”,
“<特許DB/>”)」なる追加コマンドが構造化文書
管理システムへ送信される。構造化文書管理システムで
は、上記追加コマンドを受け、後述するような処理を実
行した結果、例えば、図5(b)に示すように、「#
2」ノードと「特許DB」アークが作成される。また、
領域W1には、図33に示すように、「root」の下
に「特許DB」が追加表示される。For example, as the structured document path, “root
When inputting "t", "root" in the area W1 may be selected with a mouse or the like. Then, as shown in FIG. 32, "uix:" is displayed in the input area of the structured document path in the area W2.
// root "is displayed. In addition, newly, "Patent D
To add an element "B", "patent DB" is input in the area W3 as shown in FIG. And
When the “Registration” button B1 is selected, an appendXML (“uix: // root”,
An additional command “<patent DB />”) is transmitted to the structured document management system. The structured document management system receives the additional command and executes a process as described below. As a result, for example, as shown in FIG.
A “2” node and a “patent DB” arc are created. Also,
As shown in FIG. 33, “patent DB” is additionally displayed under “root” in the area W1.
【0126】さて、ユーザが図34に示したような文書
の格納/削除画面上の領域W3に、例えば、文書「<A
>データ</A>」を入力し(あるいはCD−ROM等
の所定の記録媒体等から読み込むことにより入力し)、
領域W1の「特許[0]」をマウス等で選択すると、構
造化文書パスの入力領域W2に、「uix://roo
t/特許DB/特許[0]」と表示される。そして、
「登録」ボタンB1を選択すると、クライアント端末か
らappendXML(“uix://root”,
“<特許DB/>”)」なる追加コマンドが構造化文書
管理システムへ送信される。Now, for example, the document “<A” is displayed in the area W3 on the document storage / deletion screen as shown in FIG.
> Data </A> ”(or input by reading from a predetermined recording medium such as a CD-ROM),
When "Patent [0]" in the area W1 is selected with a mouse or the like, "ux: /// root" is displayed in the input area W2 of the structured document path.
t / Patent DB / Patent [0] "is displayed. And
When the “Registration” button B1 is selected, an appendXML (“uix: // root”,
An additional command “<patent DB />”) is transmitted to the structured document management system.
【0127】ここでは、例えば、構造化文書データベー
スが、図14に示した状態のときに、「appendX
ML(“uix://root/特許DB/特許
[0]”,“<A>データ</A>”)」なる追加コマ
ンドを受け付けた場合を例にとり説明する。In this case, for example, when the structured document database is in the state shown in FIG.
An example in which an additional command ML (“uix: // root / patent DB / patent [0]”, “<A> data </A>”) ”is received will be described.
【0128】要求受付部11は、上記追加コマンドを受
け付けると、上記追加コマンド中の2つのパラメータで
ある構造化文書パス「uix://root/特許DB
/特許[0]」と文書「<A>データ</A>」(以
下、格納文書と呼ぶ)とを文書格納部21へ渡す(ステ
ップS1)。When the request receiving unit 11 receives the additional command, the structured document path “uix: // root / patent DB”, which is two parameters in the additional command, is used.
/ Patent [0] "and the document"<A> data </A>"(hereinafter referred to as a stored document) to the document storage unit 21 (step S1).
【0129】まず、文書格納部21は、文書パーサ部4
6に格納文書を渡す。文書パーサ部46は、格納文書を
読み込んで、構文解析を行い、当該格納文書の文書構造
がXMLにて規定された正しい形式であるか否かの整合
性の検査を行う(ステップS2)。First, the document storage section 21 stores the document parser section 4
6 to pass the stored document. The document parser unit 46 reads the stored document, performs syntax analysis, and checks whether the document structure of the stored document is in a correct format defined by XML (step S2).
【0130】この整合性の検査でエラーが見つかれば
(ステップS3)、文書格納部21,結果処理部12を
介して、クライアント端末に「文書格納失敗」の旨のメ
ッセージを返す(ステップS4)。If an error is found in the consistency check (step S3), a message indicating "document storage failure" is returned to the client terminal via the document storage unit 21 and the result processing unit 12 (step S4).
【0131】整合性の検査でエラーが見つからなけれ
ば、次に、文書格納部21は、パスから文書オブジェク
トツリー取得部45へ構造化文書パスを渡す。パスから
文書オブジェクトツリー取得部45は、構造化文書パス
から文書記憶部5中の物理的なエリアを特定することに
より、そのエリアに存在する構造化文書パスにて表され
たノード(文書オブジェクトOx0)を含む文書オブジ
ェクトツリーを取り出す(ステップS5)。構造化文書
パスの指定が正しければ、文書オブジェクトOx0のオ
ブジェクトIDを取得することができるので(ステップ
S6)、その場合は、ステップS8へ進む。If no error is found in the consistency check, the document storage unit 21 then passes the structured document path from the path to the document object tree acquisition unit 45. From the path, the document object tree acquisition unit 45 specifies a physical area in the document storage unit 5 from the structured document path, and thereby a node (document object Ox0) represented by the structured document path existing in that area. ) Is extracted (step S5). If the specification of the structured document path is correct, the object ID of the document object Ox0 can be acquired (step S6). In that case, the process proceeds to step S8.
【0132】例えば、上記追加コマンドの場合、「#4
2」ノードが文書オブジェクトOx0となるので、その
オブジェクトIDとして、「#42」を取得するととも
に、この「#42」ノードを含む文書オブジェクトツリ
ー(例えば、「#42」ノードの全ての子孫ノードと
「#42」ノードと同じ階層にある全ての(兄弟)ノー
ドと、「#42」ノードの親ノードである「#2」ノー
ドとからなる文書オブジェクトツリー)を取得する。For example, in the case of the additional command, "# 4
Since the “2” node becomes the document object Ox0, “# 42” is acquired as the object ID, and a document object tree including this “# 42” node (for example, all descendant nodes of the “# 42” node and The document object tree including all (sibling) nodes in the same hierarchy as the “# 42” node and the “# 2” node that is the parent node of the “# 42” node is acquired.
【0133】指定された構造化文書パスからそれに対応
する文書オブジェクトOx0が見つからなければ、エラ
ーとなり(ステップS6)、文書格納部21,結果処理
部12を介して、クライアント端末に「文書格納失敗」
の旨のメッセージを返す(ステップS7)。If the corresponding document object Ox0 cannot be found from the designated structured document path, an error occurs (step S6), and the document storage unit 21 and the result processing unit 12 send a "document storage failure" to the client terminal.
Is returned (step S7).
【0134】例えば、構造化文書データベースが、図1
8に示した状態のときに、追加コマンドのパラメータと
して、構造化文書パスが「uix://root/その
他」と表されていたとき、これに対応する文書オブジェ
クトは存在しないので、ステップS6でエラーとなり、
ステップS7へ進む。For example, the structured document database is shown in FIG.
In the state shown in FIG. 8, when the structured document path is expressed as “ux: // root / other” as a parameter of the additional command, there is no corresponding document object, so that in step S6 Error
Proceed to step S7.
【0135】次に、ステップS8では、文書オブジェク
トOx0にスキーマが存在するか否かを検査する。この
検査は、前述したように、各文書オブジェクトのファイ
ルに属性値が記述されているので、この値をチェックす
ればよい。文書オブジェクトOx0のもつ「スキーマ属
性有無」の値が「1」のときは、ステップS9へ進む。Next, in step S8, it is checked whether or not a schema exists in the document object Ox0. In this inspection, as described above, since the attribute value is described in the file of each document object, this value may be checked. If the value of “presence / absence of schema attribute” of the document object Ox0 is “1”, the process proceeds to step S9.
【0136】以下、図20のステップS9の処理(合成
文書作成部47の処理)について、図21に示すフロー
チャートを参照して詳細に説明する。Hereinafter, the process of step S9 in FIG. 20 (the process of the composite document creating unit 47) will be described in detail with reference to the flowchart shown in FIG.
【0137】文書格納部21は、ステップS5で取得し
た文書オブジェクトツリーを合成文書作成部47へ渡
す。The document storage unit 21 passes the document object tree obtained in step S5 to the composite document creation unit 47.
【0138】合成文書作成部47は、この文書オブジェ
クトツリーを文書オブジェクトOx0から遡り、「Sc
hema」タグを子要素として持つ文書オブジェクトO
x1を検索する(ステップS21)。The synthetic document creating section 47 traces this document object tree back from the document object Ox0, and returns “Sc
document object O having a "hema" tag as a child element
x1 is searched (step S21).
【0139】例えば、図14に示した構造化文書データ
ベースでは、文書オブジェクトOx0としての「#4
2」ノードの親ノードである「#2」ノードから「Sc
hema」タグをトップ(先頭)にもつノード(「#
3」ノード)へのリンクが張られているので(「Sch
ema」タグを子要素として持つので)、この「#2」
ノードが文書オブジェクトOx1となる。よって、ステ
ップS22をスキップして、ステップS23へ進む。For example, in the structured document database shown in FIG. 14, “# 4” as the document object Ox0
From the “# 2” node, which is the parent node of the “2” node, “Sc”
hema "tag ("#
3 "node) (" Sch
ema "tag as a child element).
The node becomes the document object Ox1. Therefore, the process skips step S22 and proceeds to step S23.
【0140】この文書オブジェクトOx1から文書オブ
ジェクトOx0、さらに文書オブジェクトOx0からア
ークを辿って、その下流にある、文書オブジェクトの属
性値の値が「1」である全ての子ノードからなる文書オ
ブジェクトツリーOt1を取り出す(ステップS2
3)。The document object Ox1 to the document object Ox0, further tracing the arc from the document object Ox0, and a document object tree Ot1 downstream of the document object consisting of all the child nodes whose attribute value is "1". (Step S2)
3).
【0141】例えば、上記追加コマンド中のパラメータ
の構造化文書パスが「uix://root/特許DB
/特許[0]」と指定されているとき、文書オブジェク
トツリーOt1は、「#42」ノード〜「#49」ノー
ドから構成されたものとなる(図14参照)。For example, the structured document path of the parameter in the additional command is “ux: // root / patent DB”
/ Patent [0] ", the document object tree Ot1 is composed of nodes"# 42 "to"# 49 "(see FIG. 14).
【0142】次に、ステップS25へ進む。Next, the process proceeds to a step S25.
【0143】ステップS25では、文書オブジェクトツ
リーOt1に格納文書の文書オブジェクトツリーを文書
オブジェクトOx0の子ノードとして挿入する。その結
果得られた新たな文書オブジェクトツリーを文書オブジ
ェクトツリーOt2とする。In the step S25, the document object tree of the stored document is inserted into the document object tree Ot1 as a child node of the document object Ox0. The resulting new document object tree is referred to as a document object tree Ot2.
【0144】この文書オブジェクトツリーOt2をXM
L文書に変換し、それをテンポラリファイルAに出力す
る(ステップS27)。The document object tree Ot2 is converted to an XM
The document is converted into an L document and output to a temporary file A (step S27).
【0145】例えば、上記追加コマンド中のパラメータ
の格納文書「<A>データ</A>」の文書オブジェク
トツリー(この場合は、1つの文書オブジェクト)を
「#42」ノード〜「#49」ノードで構成された文書
オブジェクトツリーOt1に「#42」ノードの子ノー
ドとして挿入して得られた合成文書の文書オブジェクト
ツリーOt2をXML文書に変換した結果を図22に示
す。この合成文書は、もともとある「特許」情報に「<
A>データ</A>」というデータを追加したものとな
っている。For example, the document object tree (in this case, one document object) of the document "<A> data </A>" of the parameter stored in the additional command is changed from the "# 42" node to the "# 49" node. FIG. 22 shows the result of converting the document object tree Ot2 of the composite document obtained by inserting it as a child node of the "# 42" node into the document object tree Ot1 composed of XML documents into an XML document. This composite document contains “<
A> data </A> ”.
【0146】図22に示したXML文書、すなわち、合
成文書がテンポラリファイルAに出力され、テンポラリ
ファイルAに一時格納される。The XML document shown in FIG. 22, that is, the composite document is output to the temporary file A and temporarily stored in the temporary file A.
【0147】一方、スキーマタグ以下の文書オブジェク
トツリーOt3をXML文書に変換して、それをテンポ
ラリファイルBに出力する(ステップS28)。すなわ
ち、テンポラリファイルBには、スキーマ文書が一時格
納されることになる。On the other hand, the document object tree Ot3 below the schema tag is converted into an XML document and output to a temporary file B (step S28). That is, the schema document is temporarily stored in the temporary file B.
【0148】例えば、文書オブジェクトツリーOt3で
ある「#3」ノードをトップノードとする文書オブジェ
クトツリーをXML文書に変換した結果を図23に示
す。図23に示したXML文書がテンポラリファイルB
に出力され、テンポラリファイルBに一時格納される。For example, FIG. 23 shows a result obtained by converting a document object tree having the “# 3” node which is the document object tree Ot3 as a top node into an XML document. The XML document shown in FIG.
And temporarily stored in a temporary file B.
【0149】図22に示すように、テンポラリファイル
A(「tmp000.xml」)には、もともとある
「特許」情報の要素の他に、格納文書、すなわち、ここ
では、例えば、「<A>データ</A>」が挿入されて
いる。また、「xmlns=”x−schema:tm
p001.xml”」という、テンポラリファイルB
(「tmp001.xml」)へのリンク情報の記述が
ある。この記述は、「特許」情報に適用されるスキーマ
が出力されているテンポラリファイルBを指定してい
る。As shown in FIG. 22, the temporary file A (“tmp000.xml”) contains, in addition to the original “patent” information element, a stored document, that is, for example, “<A> data”. </A> ”is inserted. Also, "xmlns =" x-schema: tm
p001. xml ””, a temporary file B
(“Tmp001.xml”). This description specifies the temporary file B to which the schema applied to the “patent” information is output.
【0150】次に、図20の説明に戻る。Next, the description returns to FIG.
【0151】ステップS10では、文書格納部21は文
書パーサ部46に、合成文書のテンポラリファイルAと
スキーマのテンポラリファイルBとを与えて、合成文書
の文書構造の妥当性をチェックする。すなわち、文書パ
ーサ部46は、合成文書のテンポラリファイルAとスキ
ーマのテンポラリファイルBとを読み込み、合成文書の
文書構造が、スキーマにより定義されている文書構造に
一致するか否かをチェックする。In step S10, the document storage unit 21 provides the document parser unit 46 with the temporary file A of the composite document and the temporary file B of the schema, and checks the validity of the document structure of the composite document. That is, the document parser unit 46 reads the temporary file A of the synthetic document and the temporary file B of the schema, and checks whether or not the document structure of the synthetic document matches the document structure defined by the schema.
【0152】例えば、図22に示した合成文書と、図2
3に示したスキーマとで妥当性のチェックを行った場
合、合成文書には、スキーマにより定義されていない
「A」という要素が存在するため、図23の合成文書
は、妥当性のチェックでエラーとなる(ステップS1
1)。この場合、文書格納部21,結果処理部12を介
して、クライアント端末に「文書格納失敗」の旨のメッ
セージを返す(ステップS12)。For example, the composite document shown in FIG.
When the validity check is performed with the schema shown in FIG. 3, an element “A” not defined by the schema exists in the synthetic document. (Step S1
1). In this case, a message indicating "document storage failure" is returned to the client terminal via the document storage unit 21 and the result processing unit 12 (step S12).
【0153】例えば、クライアント端末の所定の表示装
置には、図35に示すようなメッセージが表示される。For example, a message as shown in FIG. 35 is displayed on a predetermined display device of the client terminal.
【0154】次に、構造化文書データベースが、図14
に示した状態のときに、「appendXML(“ui
x://root/特許DB”,“<特許>…</特許
>”)」なる追加コマンドを受け付けた場合について、
図20を参照して説明する。前述同様にして、文書オブ
ジェクトOx0のオブジェクトID「#2」を取得する
(ステップS5)、この文書オブジェクトには、スキー
マが存在するので(ステップS8)、ステップS9にお
いて合成文書を作成する。Next, the structured document database shown in FIG.
In the state shown in FIG. 5, "append XML (" ui
x: / root / patent DB ","<patent> ... </ patent>")"
This will be described with reference to FIG. In the same manner as described above, the object ID “# 2” of the document object Ox0 is acquired (step S5). Since a schema exists in this document object (step S8), a composite document is created in step S9.
【0155】この場合、文書オブジェクトOx0である
「#2」ノード自体から「Schema」タグをトップ
(先頭)にもつノード(「#3」ノード)へのリンクが
張られているので、この「#2」ノードが文書オブジェ
クトOx1となる(図21のステップS21)。すなわ
ち、文書オブジェクトOx0と文書オブジェクトOx1
が同じなので(ステップS22)、ステップS29へ進
み、格納文書「<特許>…</特許>」の文書オブジェ
クトツリーをXML文書に変換し、テンポラリファイル
Aに出力する(ステップS29)。In this case, a link is provided from the “# 2” node itself, which is the document object Ox0, to the node (“# 3” node) having the “Schema” tag at the top (top). The “2” node becomes the document object Ox1 (step S21 in FIG. 21). That is, the document object Ox0 and the document object Ox1
Are the same (step S22), the process proceeds to step S29, where the document object tree of the stored document “<patent>... </ Patent>” is converted into an XML document and output to the temporary file A (step S29).
【0156】例えば、図24に示すように、テンポラリ
ファイルA(「tmp000.xml」)には、格納文
書である「特許」情報、すなわち、ここでは、「<特許
>…</特許>」が出力されている。また、「xmln
s=”x−schema:tmp001.xml”」と
いう、テンポラリファイルB(「tmp001.xm
l」)へのリンク情報の記述がある。For example, as shown in FIG. 24, the temporary file A (“tmp000.xml”) contains “patent” information as a stored document, that is, “<patent>... </ Patent>” here. Has been output. Also, "xmln
s = “x-schema: tmp001.xml” ”and a temporary file B (“ tmp001.xml
l)).
【0157】次に、ステップS28へ進む。図25に示
すように、テンポラリファイルBには、「#3」ノード
をトップノードとするスキーマの文書オブジェクトツリ
ーをXML文書に変換した結果が出力されている。Next, the process proceeds to a step S28. As shown in FIG. 25, a result obtained by converting the document object tree of the schema having the “# 3” node as the top node into an XML document is output to the temporary file B.
【0158】図20のステップS10で、図24に示し
た合成文書と、図25に示したスキーマとで妥当性のチ
ェックを行ったとき、合成文書の文書構造と、スキーマ
により定義されている文書構造とは一致する、この場
合、ステップS11からステップS13へ進む。In step S10 of FIG. 20, when the validity of the composite document shown in FIG. 24 and the schema shown in FIG. 25 are checked, the document structure of the composite document and the document defined by the schema are determined. The structure matches. In this case, the process proceeds from step S11 to step S13.
【0159】ステップS13では、格納文書の文書オブ
ジェクトツリーが、文書オブジェクトOx0下に追加さ
れる。すなわち、文書格納部21により、格納文書の文
書オブジェクトツリーを構成する各文書オブジェクト
(のファイル)にオブジェクトIDが与えられ、文書オ
ブジェクトOx0から格納文書の文書オブジェクトツリ
ーの先頭の文書オブジェクトへリンクが張られる。そし
て、文書オブジェクトツリー格納部41により、格納文
書の文書オブジェクトツリーを構成する各文書オブジェ
クト(のファイル)が文書記憶部5に格納される。At step S13, the document object tree of the stored document is added below the document object Ox0. That is, the document storage unit 21 assigns an object ID to each of the document objects (files) constituting the document object tree of the stored document, and links the document object Ox0 to the first document object of the document object tree of the stored document. Can be Then, the document objects (files) constituting the document object tree of the stored document are stored in the document storage unit 5 by the document object tree storage unit 41.
【0160】次に、ステップS14へ進み、インデック
ス記憶部6のインデックスを更新する。Then, the process proceeds to a step S14 to update the index in the index storage unit 6.
【0161】なお、ステップS8で、文書オブジェクト
Ox0のもつ属性値の値が「0」のときは、上述したス
キーマを用いた合成文書の文書構造の妥当性のチェック
を行わずに、そのままマステップS13へ進み、格納文
書の文書オブジェクトツリーを、文書オブジェクトOx
0下に追加し(ステップS13)、それに伴い、インデ
ックス記憶部6のインデックスを更新する(ステップS
14)。If the attribute value of the document object Ox0 is “0” in step S8, the validity of the document structure of the composite document using the above-described schema is not checked, and the Proceeding to S13, the document object tree of the stored document is stored in the document object Ox.
0 (step S13), and the index in the index storage unit 6 is updated accordingly (step S13).
14).
【0162】(1−2)文書取得処理 次に、図1の構造化文書管理システムの文書取得処理動
作について、図26に示すフローチャートを参照して説
明する。(1-2) Document Acquisition Processing Next, the document acquisition processing operation of the structured document management system of FIG. 1 will be described with reference to the flowchart shown in FIG.
【0163】クライアント端末から構造化文書管理シス
テムに対し、文書取得要求として、取得コマンド、スキ
ーマ取得コマンドのうちのいずれかが送信されて、要求
受付部11にて受け付けられたとき、図26に示した処
理動作を行う。FIG. 26 shows a case where one of an acquisition command and a schema acquisition command is transmitted as a document acquisition request from the client terminal to the structured document management system and accepted by the request accepting unit 11. Performed processing operation.
【0164】例えば、ユーザが図36に示したような文
書の格納/削除画面上の領域W1の「特許DB」をマウ
ス等で選択すると(クリックすると)、構造化文書パス
の入力領域W2に、「uix://root/特許D
B」と表示されとともに、「getXML(“uix:
//root/特許DB”)」なる取得コマンドが構造
化文書管理システムへ送信される。For example, when the user selects (clicks) “Patent DB” in the area W1 on the document storage / deletion screen as shown in FIG. 36 with a mouse or the like, the input area W2 of the structured document path becomes "Ux: // root / Patent D
B "and" getXML ("uix:
/// root / patent DB ")" is transmitted to the structured document management system.
【0165】ここでは、例えば、構造化文書データベー
スが、図8に示した状態のときに、「getXML
(“uix://root/特許DB”)」なる取得コ
マンドを受け付けた場合を例にとり説明する。Here, for example, when the structured document database is in the state shown in FIG.
(“Ux: // root / patent DB”) ”will be described as an example.
【0166】要求受付部11は、上記取得コマンドを受
け付けると、上記取得コマンド中のパラメータである構
造化文書パス「uix://root/特許DB」を文
書取得部22へ渡す(ステップS31)。Upon receiving the acquisition command, the request receiving unit 11 passes the structured document path “uix: // root / patent DB”, which is a parameter in the acquisition command, to the document acquisition unit 22 (step S31).
【0167】文書取得部22は、パスから文書オブジェ
クトツリー取得部45へ構造化文書パスを渡す。パスか
ら文書オブジェクトツリー取得部45は、構造化文書パ
スから文書記憶部5中の物理的なエリアを特定すること
により、そのエリアに存在する構造化文書パスにて表さ
れたノード(文書オブジェクトOx5)を取り出す(ス
テップS32)。構造化文書パスの指定が正しければ、
文書オブジェクトOx5のオブジェクトIDを取得する
ことができるので(ステップS33)、その場合は、ス
テップS35へ進む。The document obtaining unit 22 passes the structured document path from the path to the document object tree obtaining unit 45. From the path, the document object tree acquisition unit 45 specifies a physical area in the document storage unit 5 from the structured document path, and thereby a node (document object Ox5) represented by the structured document path existing in that area. ) Is taken out (step S32). If the specification of the structured document path is correct,
Since the object ID of the document object Ox5 can be obtained (step S33), in that case, the process proceeds to step S35.
【0168】例えば、上記取得コマンドの場合、「#
2」ノードが文書オブジェクトOx5となるので、その
オブジェクトIDとして、「#2」を取得するととも
に、この「#2」ノード以下の文書オブジェクトツリー
Ot5(「#2」ノード、「#42」ノード〜「#4
9」ノード、「#52」ノード以下、「#62」ノード
以下)を取得する(ステップS35)。For example, in the case of the above acquisition command, "#
Since the “2” node is the document object Ox5, “# 2” is acquired as the object ID, and the document object tree Ot5 (“# 2” node, “# 42” node to “# 42” node) below this “# 2” node is acquired. "# 4
9 "node,"# 52 "node or less,"# 62 "node or less) are acquired (step S35).
【0169】ステップS32において、指定された構造
化文書パスからそれに対応する文書オブジェクトOx5
が見つからなければ、エラーとなり(ステップS3
3)、文書取得部22,結果処理部12を介して、クラ
イアント端末に「文書取得失敗」の旨のメッセージを返
す(ステップS34)。In step S32, the designated document object Ox5 is extracted from the designated structured document path.
If not found, an error occurs (step S3).
3) Return a message indicating "document acquisition failed" to the client terminal via the document acquisition unit 22 and the result processing unit 12 (step S34).
【0170】ステップS35で取得した文書オブジェク
トツリーOt5は、文書文字列取得部44でXML文書
に変換される。例えば、上記取得コマンドの場合、取得
したXML文書は、図11に示すような3つの「特許」
情報のXML文書となる。The document object tree Ot5 obtained in step S35 is converted into an XML document by the document character string obtaining unit 44. For example, in the case of the above acquisition command, the acquired XML document includes three “patents” as shown in FIG.
It becomes an XML document of information.
【0171】文書取得部22は、結果処理部12を介し
て、図11に示したようなXML文書を(例えば、XS
L(eXtensible Style Langua
ge)といった所定のスタイルシートとともに)、クラ
イアント端末へ返す(ステップS37)。The document acquisition unit 22 outputs the XML document as shown in FIG.
L (extensible Style Langua)
ge)) and returns it to the client terminal (step S37).
【0172】クライアント端末では、図11に示したX
ML文書を、スタイルシートを用いてHTMLデータに
変換して、例えば、図36に示すように、領域W2に表
示する。In the client terminal, X shown in FIG.
The ML document is converted into HTML data using a style sheet, and is displayed in an area W2, for example, as shown in FIG.
【0173】XSLを利用すると、XML文書を様々な
形に変換することが出来る。違う構文書造のXML文書
に変換することも出来るし、XML文書からHTMLペ
ージを生成することも出来る。By using XSL, an XML document can be converted into various forms. It can be converted to an XML document with a different syntax, and an HTML page can be generated from the XML document.
【0174】(1−3)文書削除処理 次に、図1の構造化文書管理システムの文書削除処理動
作について、図27に示すフローチャートを参照して説
明する。(1-3) Document Deletion Processing Next, the document deletion processing operation of the structured document management system of FIG. 1 will be described with reference to the flowchart shown in FIG.
【0175】クライアント端末から構造化文書管理シス
テムに対し、文書削除要求として、削除コマンドが送信
されて、要求受付部11にて受け付けられたとき、図2
7に示した処理動作を行う。When a deletion command is transmitted from the client terminal to the structured document management system as a document deletion request and is received by the request receiving unit 11, FIG.
The processing operation shown in FIG.
【0176】例えば、ユーザが図36に示したような文
書の格納/削除画面上の領域W1の「特許DB」をマウ
ス等で選択すると(クリックすると)、構造化文書パス
の入力領域W2に、「uix://root/特許D
B」と表示され、さらに、「削除」ボタンB2を選択す
ると「removeXML(“uix://root/
特許DB”)」なる削除コマンドが構造化文書管理シス
テムへ送信される。For example, when the user selects (clicks) “Patent DB” in the area W1 on the document storage / deletion screen as shown in FIG. 36 with a mouse or the like, the input area W2 of the structured document path becomes "Ux: // root / Patent D
B "is displayed, and when the" delete "button B2 is selected," removeXML ("uix: // root /
A patent DB “)” delete command is transmitted to the structured document management system.
【0177】ここでは、例えば、構造化文書データベー
スが、図14に示した状態のときに、「removeX
ML(“uix://root/特許DB/特許[0]
/出願日”)」なる削除コマンドを受け付けた場合を例
にとり説明する。Here, for example, when the structured document database is in the state shown in FIG. 14, “removeX
ML ("uix: // root / patent DB / patent [0]
An example in which a delete command “/ application date“) ”is received will be described.
【0178】要求受付部11は、上記削除コマンドを受
け付けると、上記削除コマンド中のパラメータである構
造化文書パス「uix://root/特許DB/特許
[0]/出願日」を文書削除部23へ渡す(ステップS
41)。When the request receiving unit 11 receives the deletion command, the structured document path “uix: // root / patent DB / patent [0] / filing date” which is a parameter in the deletion command is deleted by the document deleting unit. 23 (Step S
41).
【0179】次に、文書削除部23は、パスから文書オ
ブジェクトツリー取得部45へ構造化文書パスを渡す。
パスから文書オブジェクトツリー取得部45は、構造化
文書パスから文書記憶部5中の物理的なエリアを特定す
ることにより、そのエリアに存在する構造化文書パスに
て表されたノード(文書オブジェクトOx0)を含む文
書オブジェクトツリーを取り出す(ステップS42)。
構造化文書パスの指定が正しければ、文書オブジェクト
Ox0のオブジェクトIDを取得することができるので
(ステップS43)、その場合は、ステップS45へ進
む。Next, the document deletion unit 23 passes the structured document path from the path to the document object tree acquisition unit 45.
From the path, the document object tree acquisition unit 45 specifies a physical area in the document storage unit 5 from the structured document path, and thereby a node (document object Ox0) represented by the structured document path existing in that area. ) Is extracted (step S42).
If the specification of the structured document path is correct, the object ID of the document object Ox0 can be obtained (step S43). In that case, the process proceeds to step S45.
【0180】例えば、上記削除コマンドの場合、「#4
4」ノードが文書オブジェクトOx0となるので、その
オブジェクトIDとして、「#44」を取得するととも
に、この「#44」ノードを含む文書オブジェクトツリ
ー(例えば、「#44」ノードの全ての子孫ノードと
「#44」ノードと同じ階層にある全ての(兄弟)ノー
ドと、「#44」ノードの親ノードである「#42」ノ
ード、その親ノードである「#2」ノードとからなる文
書オブジェクトツリー)を取得する。For example, in the case of the above delete command, “# 4
Since the “4” node is the document object Ox0, “# 44” is acquired as the object ID, and a document object tree including this “# 44” node (for example, all descendant nodes of the “# 44” node and A document object tree including all (sibling) nodes in the same hierarchy as the “# 44” node, a “# 42” node that is a parent node of the “# 44” node, and a “# 2” node that is the parent node ) To get.
【0181】指定された構造化文書パスからそれに対応
する文書オブジェクトOx0が見つからなければ、エラ
ーとなり(ステップS43)、文書格納部21,結果処
理部12を介して、クライアント端末に「文書削除失
敗」の旨のメッセージを返す(ステップS44)。If the corresponding document object Ox0 is not found from the designated structured document path, an error occurs (step S43), and the document terminal 21 sends a "document deletion failure" via the document storage unit 21 and the result processing unit 12. Is returned (step S44).
【0182】次に、ステップS45では、文書オブジェ
クトOx0にスキーマが存在するか否かを検査する。こ
の検査は、前述したように、各文書オブジェクトのファ
イルに属性値が記述されているので、この値をチェック
すればよい。文書オブジェクトOx0のもつ属性値の値
が「1」のときは、ステップS46へ進む。Next, in a step S45, it is checked whether or not a schema exists in the document object Ox0. In this inspection, as described above, since the attribute value is described in the file of each document object, this value may be checked. If the attribute value of the document object Ox0 is “1”, the process proceeds to step S46.
【0183】以下、図27のステップS46の処理(合
成文書作成部47の処理(削除コマンド用))につい
て、図28に示すフローチャートを参照して詳細に説明
する。Hereinafter, the processing of step S46 in FIG. 27 (the processing of the synthesized document creating unit 47 (for the delete command)) will be described in detail with reference to the flowchart shown in FIG.
【0184】なお、図28において、図21と同一部分
は同一符号を付している。In FIG. 28, the same parts as those in FIG. 21 are denoted by the same reference numerals.
【0185】文書格納部21は、ステップS42で取得
した文書オブジェクトツリーを合成文書作成部47へ渡
す。The document storage unit 21 passes the document object tree obtained in step S42 to the composite document creation unit 47.
【0186】合成文書作成部47は、この文書オブジェ
クトツリーを文書オブジェクトOx0から遡り、「Sc
hema」タグを子要素として持つ文書オブジェクトO
x1を検索する(ステップS21)。The synthetic document creating section 47 traces this document object tree back from the document object Ox0, and returns “Sc
document object O having a "hema" tag as a child element
x1 is searched (step S21).
【0187】例えば、図14に示した構造化文書データ
ベースでは、文書オブジェクトOx0としての「#4
4」ノードの上流にある「#2」ノードから「Sche
ma」タグをトップ(先頭)にもつノード(「#3」ノ
ード)へのリンクが張られているので(「Schem
a」タグを子要素として持つので)、この「#2」ノー
ドが文書オブジェクトOx1となる。For example, in the structured document database shown in FIG. 14, “# 4” as the document object Ox0
From the "# 2" node upstream of the "4" node
Since the link to the node (“# 3” node) having the “ma” tag at the top (top) is provided (“Schem”).
The “# 2” node becomes the document object Ox1 because the “a” tag is included as a child element).
【0188】この文書オブジェクトOx1から文書オブ
ジェクトOx0、さらに文書オブジェクトOx0からア
ークを辿って、その下流にある、文書オブジェクトの属
性値の値が「1」である全ての子ノードからなる文書オ
ブジェクトツリーOt1を取り出す(ステップS2
3)。The document object Ox1 to the document object Ox0, further tracing an arc from the document object Ox0, and a document object tree Ot1 downstream of the document object consisting of all the child nodes having the attribute value of the document object of "1". (Step S2)
3).
【0189】例えば、上記追加コマンド中のパラメータ
の構造化文書パスが「uix://root/特許DB
/特許[0]/出願日」と指定されているとき、文書オ
ブジェクトツリーOt1は、「#42」ノード〜「#4
9」ノードから構成されたものとなる(図14参照)。For example, if the structured document path of the parameter in the above-mentioned additional command is “ux: // root / patent DB”
/ Patent [0] / filed date ", the document object tree Ot1 includes nodes"# 42 "to"# 4 ".
9 "node (see FIG. 14).
【0190】次に、ステップS26ヘ進み、文書オブジ
ェクトツリーOt1から文書オブジェクトOx0以下の
文書オブジェクトツリーを削除する。その結果得られた
新たな文書オブジェクトツリーを文書オブジェクトツリ
ーOt2とする。Then, the process proceeds to a step S26 to delete the document object tree below the document object Ox0 from the document object tree Ot1. The resulting new document object tree is referred to as a document object tree Ot2.
【0191】この文書オブジェクトツリーOt2をXM
L文書に変換し、それをテンポラリファイルAに出力す
る(ステップS27)。The document object tree Ot2 is converted to an XM
The document is converted into an L document and output to a temporary file A (step S27).
【0192】例えば、上記削除コマンド中のパラメータ
の構造化文書パス「uix://root/特許DB/
特許[0]/出願日」が指し示す「#44」ノード以下
の文書オブジェクトツリーを「#42」ノード〜「#4
9」ノードで構成された文書オブジェクトツリーOt1
から削除することにより得られた合成文書の文書オブジ
ェクトツリーOt2をXML文書に変換した結果を図2
9に示す。この合成文書は、もともとある「特許」情報
から「<出願日>…</出願日>」というデータを削除
したものとなっている。For example, the structured document path “uix: // root / patent DB /
The document object tree below the “# 44” node indicated by “Patent [0] / filing date” is changed from “# 42” node to “# 4”.
Document object tree Ot1 composed of "9" nodes
FIG. 2 shows the result of converting the document object tree Ot2 of the composite document obtained by deleting the
It is shown in FIG. This synthetic document is obtained by deleting data of “<application date>... </ Application date>” from the original “patent” information.
【0193】図29に示したXML文書、すなわち、合
成文書がテンポラリファイルAに出力され、テンポラリ
ファイルAに一時格納される。The XML document shown in FIG. 29, that is, the composite document is output to the temporary file A and temporarily stored in the temporary file A.
【0194】一方、スキーマタグ以下の文書オブジェク
トツリーOt3をXML文書に変換して、それをテンポ
ラリファイルBに出力する(ステップS28)。すなわ
ち、テンポラリファイルBには、スキーマ文書が一時格
納されることになる。On the other hand, the document object tree Ot3 below the schema tag is converted into an XML document and output to the temporary file B (step S28). That is, the schema document is temporarily stored in the temporary file B.
【0195】例えば、文書オブジェクトツリーOt3で
ある「#3」ノードをトップノードとする文書オブジェ
クトツリーをXML文書に変換した結果を図30に示
す。図30に示したXML文書がテンポラリファイルB
に出力され、テンポラリファイルBに一時格納される。For example, FIG. 30 shows a result of converting a document object tree having the “# 3” node, which is the document object tree Ot3, as a top node into an XML document. The XML document shown in FIG.
And temporarily stored in a temporary file B.
【0196】次に、図27の説明に戻る。Next, the description returns to FIG.
【0197】ステップS47では、文書削除部21は文
書パーサ部46に、合成文書のテンポラリファイルAと
スキーマのテンポラリファイルBとを与えて、文書格納
処理の場合と同様にして、合成文書の文書構造の妥当性
をチェックする。In step S47, the document deleting section 21 gives the document parser section 46 the temporary file A of the composite document and the temporary file B of the schema, and executes the document structure of the composite document in the same manner as in the document storage processing. Check the validity of
【0198】例えば、図29に示した合成文書と、図3
0に示したスキーマとで妥当性のチェックを行った場
合、合成文書には、スキーマにより定義されている「出
願日」という要素が存在しないため、図29の合成文書
は、妥当性のチェックでエラーとなる(ステップS4
8)。この場合、文書削除部21,結果処理部12を介
して、クライアント端末に「文書削除失敗」の旨のメッ
セージを返す(ステップS49)。For example, the composite document shown in FIG.
When the validity check is performed with the schema shown in FIG. 0, there is no element called “filing date” defined by the schema in the synthetic document. An error occurs (step S4
8). In this case, a message indicating "document deletion failed" is returned to the client terminal via the document deletion unit 21 and the result processing unit 12 (step S49).
【0199】なお、構造化文書データベースが、図14
に示した状態のときに、「removeXML(“ui
x://root/特許DB/特許[0]”)」なる削
除コマンドを、図27に従って処理を行うと、図28の
ステップS27において、図24に示したような合成文
書がテンポラリファイルAに出力される。テンポラリフ
ァイルBは、図30と同様である。It is to be noted that the structured document database shown in FIG.
In the state shown in, “removeXML (“ ui
When the delete command “x: // root / patent DB / patent [0]”) ”is processed according to FIG. 27, the combined document as shown in FIG. Is output. The temporary file B is the same as in FIG.
【0200】このとき、図24に示した合成文書と、図
30に示したスキーマとで妥当性のチェックを行った場
合、合成文書の文書構造と、スキーマにより定義されて
いる文書構造とは一致するので、ステップS48からス
テップS50へ進む。At this time, when the validity of the synthesized document shown in FIG. 24 and the schema shown in FIG. 30 are checked, the document structure of the synthesized document matches the document structure defined by the schema. Therefore, the process proceeds from step S48 to step S50.
【0201】ステップS50では、文書オブジェクトO
x0以下の文書オブジェクトツリーを削除する。すなわ
ち、文書オブジェクトツリー削除部42により、文書オ
ブジェクトOx0以下の文書オブジェクトツリーを構成
する各文書オブジェクト(のファイル)が文書記憶部5
から削除される。例えば、「#2」ノードから「#4
2」ノード以下の文書オブジェクトのファイルが削除さ
れる。In the step S50, the document object O
Delete the document object tree below x0. That is, the document object tree deletion unit 42 stores (the files of) each document object constituting the document object tree of the document object Ox0 or lower in the document storage unit 5.
Removed from. For example, from “# 2” node to “# 4”
The file of the document object under the "2" node is deleted.
【0202】次に、ステップS51へ進み、インデック
ス記憶部6のインデックスを更新する。また、クライア
ント端末の図36に示したような表示画面の領域W1に
は、「特許[0]」が表示さなくなる。Then, the flow advances to a step S51 to update the index in the index storage section 6. Further, “Patent [0]” is not displayed in the area W1 of the display screen of the client terminal as shown in FIG.
【0203】なお、ステップS45で、文書オブジェク
トOx0のもつ属性値の値が「0」のときは、上述した
スキーマを用いた合成文書の文書構造の妥当性のチェッ
クを行わずに、そのままマステップS50へ進み、文書
オブジェクトOx0以下の文書オブジェクトツリーを削
除し(ステップS50)、それに伴う、インデックス記
憶部6のインデックスを更新する(ステップS51)。When the attribute value of the document object Ox0 is “0” in step S45, the validity of the document structure of the composite document using the above-described schema is not checked, and the Proceeding to S50, the document object tree below the document object Ox0 is deleted (step S50), and the index in the index storage unit 6 is updated accordingly (step S51).
【0204】(1−4)スキーマの設定、スキーマを用
いた文書格納 図31に示した画面上で、ユーザが「Schema設定
Win」をマウス等のポインティングデバイスなどを用
いて選択すると、図37に示したようなスキーマの設定
を行うためのユーザインタフェースとしての画面が表示
される。(1-4) Schema Setting, Document Storage Using Schema When the user selects “Schema setting Win” on the screen shown in FIG. 31 by using a pointing device such as a mouse, etc., FIG. A screen as a user interface for setting the schema as shown is displayed.
【0205】ユーザが、領域W3に、例えば、図12に
示したような「特許」情報のスキーマを入力し、この入
力したスキーマを「特許DB」以下のノードに設定する
場合には、領域W1から「特許DB」をマウス等でクリ
ックして選択した後(領域W2には、「uix://r
oot/特許DB」が表示される)、「スキーマ設定」
ボタンB3を選択する。すると、「setSchema
(“uix://root/特許DB”,“<Sche
ma>…</Schema>”)」なるスキーマ格納コ
マンドが構造化文書管理システムへ送信される。このコ
マンドの処理は前述した文書格納処理動作と同様であ
る。When the user inputs, for example, a schema of “patent” information as shown in FIG. 12 into the area W3, and sets the input schema in a node under “patent DB”, the area W1 From the “Patent DB” by clicking with a mouse or the like (in the area W2, “uiix: // r
"Oot / Patent DB" is displayed), "Schema setting"
Select button B3. Then, "setSchema
(“Ux: // root / patent DB”, “<Sche
ma> ... </ Schema>")" is transmitted to the structured document management system. The processing of this command is the same as the document storage processing operation described above.
【0206】次に、「uix://root/特許D
B」の下に「特許」情報を格納しようとするとき、「特
許DB」以下のノードに既に設定されているスキーマを
用いて「特許」情報を入力する場合について説明する。Next, "uix: // root / Patent D"
A case where “patent” information is to be stored under “B” by inputting “patent” information using a schema that has already been set in nodes below “patent DB” will be described.
【0207】まず、スキーマを取得する。例えば、図3
8に示すような文書の格納/削除を行うための画面の領
域W1から「スキーマ」をマウス等を用いて選択する
と、文書パスの入力領域W2に、「uix://roo
t/特許DB/#Schema」と表示されとともに、
「getXML(“uix://root/特許DB/
Schema”)」なるスキーマ取得コマンドが構造化
文書管理システムへ送信される。First, a schema is obtained. For example, FIG.
When a “schema” is selected from a region W1 of the screen for storing / deleting a document as shown in FIG. 8 using a mouse or the like, “uiix: /// root” is displayed in a document path input region W2.
t / Patent DB / # Schema "
"GetXML (" uix: // root / patent DB /
A schema acquisition command “Schema”) is transmitted to the structured document management system.
【0208】このコマンドの処理は、前述した文書取得
処理と同様である。構造化文書管理システムから返され
るXML文書は、図38の画面の領域W3に表示され
る。The processing of this command is the same as the above-described document acquisition processing. The XML document returned from the structured document management system is displayed in the area W3 on the screen in FIG.
【0209】図38に示すように、領域R3には、「特
許」情報のデータ入力領域が各要素毎に設定されて表示
されている。この表示に従って、ユーザは、データを入
力すればよい。例えば、「タイトル」、「年」などのデ
ータ入力領域が階層的に配置され、表示されている。ユ
ーザは、このデータ入力領域にデータを入力すること
で、スキーマにより定義された文書構造の格納文書が容
易に作成することができる。As shown in FIG. 38, in a region R3, a data input region of “patent” information is set and displayed for each element. In accordance with this display, the user may input data. For example, data input areas such as "title" and "year" are hierarchically arranged and displayed. The user can easily create a stored document having a document structure defined by the schema by inputting data into the data input area.
【0210】また、領域W3に入力した「特許」情報の
格納先として、領域W1で「特許DB」をマウス等を用
いて選択すると、領域W2に構造化文書パスとして、
「uix://root/特許DB」が表示される。そ
の後、「登録」ボタンB1を選択すると、「appen
dXML(“uix://root/特許DB”,“<
特許>…</特許>”)」なる追加コマンドが構造化文
書管理システムへ送信される。When "patent DB" is selected in the area W1 using a mouse or the like as a storage destination of the "patent" information input in the area W3, a structured document path is stored in the area W2 as a structured document path.
“Uix: // root / patent DB” is displayed. After that, when the “register” button B1 is selected, “appen
dXML (“uix: // root / patent DB”, “<
An additional command "patent> ... </ patent>") "is transmitted to the structured document management system.
【0211】この場合、格納文書は、予めスキーマに従
って入力されたものなので、図20のステップS10の
妥当性チェックでエラーとなることはない。In this case, since the stored document has been input in advance according to the schema, no error occurs in the validity check in step S10 in FIG.
【0212】(2)検索機能 図1の構造化文書管理システムにおける検索系のコマン
ドには以下のものがある。(2) Search Function Search commands in the structured document management system shown in FIG. 1 include the following.
【0213】query(ql) 「query」は、パラメータとして( )内のクエリ
qlを実行し、その結果のXML文書を取得するコマン
ド(以下、検索コマンドと呼ぶ)である。Query (ql) "query" is a command (hereinafter referred to as a search command) for executing the query ql in parentheses as a parameter and obtaining the resulting XML document.
【0214】クエリは、図39に示すように、SQL
(Structured QueryLanguag
e)に似た形式の言語により、検索位置、検索条件、情
報抽出部分などを記述した、構造化されたXML文書で
ある。クエリ文書も構造化文書管理システムの管理対象
である。The query is, as shown in FIG.
(Structured QueryLanguag
This is a structured XML document that describes search positions, search conditions, information extraction parts, and the like in a language similar to e). Query documents are also managed by the structured document management system.
【0215】「kf:from」タグから始まる要素に
は、検索位置の指定と文書要素の値に変数を対応付ける
記述があり、「kf:where」タグのから始める要
素には、変数に関する条件づけの記述があり、「kf:
select」タグから始まる要素には、検索結果の出
力形式が記述される。[0215] The element starting from the "kf: from" tag has a description for specifying a search position and associating a variable with a value of a document element. There is a description, "kf:
The element starting with the “select” tag describes the output format of the search result.
【0216】検索には、単純検索と概念検索とがある。
単純検索とは、クエリ中に指定された検索条件を満たす
情報を検索・抽出するものであり、概念検索とは、クエ
リ中に指定された概念情報を利用して、クエリ中に指定
された検索条件を満たす情報を検索・抽出するものであ
る。The search includes a simple search and a concept search.
Simple search is to search and extract information that satisfies the search condition specified in the query. Concept search is the search specified in the query using the concept information specified in the query. It searches and extracts information that satisfies the conditions.
【0217】図40は、単純検索のクエリの例を示した
ものである。図40のクエリは、例えば、図14に示し
たような状態の構造化文書データベースに対し、「特許
DB」アークが示すノード以下に格納されている「特
許」情報の文書群において、「1999年でかつ、「P
C」のような内容の「要約」という要素をもつ文書
(「特許」情報)の「タイトル」を列挙せよ」という検
索要求を意味している。FIG. 40 shows an example of a simple search query. The query in FIG. 40 is, for example, in the structured document database in a state as shown in FIG. 14, in the document group of “patent” information stored under the node indicated by the “patent DB” arc, “1999” And "P
C "means a search request to enumerate the" title "of a document (" patent "information) having an element of" summary "such as" C ".
【0218】「kf:from」タグから始まる要素の
記述により、変数「$t」、「$y」、「$s」に、そ
れぞれ「特許」情報の「タイトル」、「年」、「要約」
という文書要素の値が代入される。According to the description of the element starting from the “kf: from” tag, the “title”, “year”, and “summary” of the “patent” information are added to the variables “$ t”, “$ y”, and “$ s”, respectively.
Is assigned.
【0219】「kf:where」タグから始める要素
の記述により、変数「$y」=「1999」という比較
がなされる。また、コンポーネント「MyLike」は
変数「$s」と「PC」を引数として、「PC」と類似
する値の変数「$s」を検知するための関数である。The description of the element starting from the “kf: where” tag makes a comparison that the variable “$ y” = “1999”. The component “MyLike” is a function for detecting a variable “$ s” having a value similar to “PC” using the variables “$ s” and “PC” as arguments.
【0220】「kf:from」タグから始まる要素の
記述により、変数「$t」が出力値として利用される。By describing the element starting with the “kf: from” tag, the variable “$ t” is used as an output value.
【0221】なお、「kf:star」タグは構造の曖
昧表現であり、例えば「<特許><kf:star><
年>」は「タグ名が「特許」である要素の子孫の要素と
していずれかに存在し、タグ名が「年」である要素」を
意味する。The “kf: star” tag is an ambiguous expression of the structure, for example, “<patent><kf:star><
"Year>" means "an element which exists as a descendant element of an element whose tag name is" patent "and whose tag name is" year "".
【0222】図41に図40の単純検索のクエリを用い
た検索結果を示す。この検索結果もXML文書である。FIG. 41 shows a search result using the simple search query of FIG. This search result is also an XML document.
【0223】図42は、概念検索のクエリの例を示した
ものである。図42のクエリは、例えば図18,図19
に示すような状態の構造化文書データベースに対し、
「特許DB」アークが示すノード以下に格納されている
「特許」情報の文書群に対し、「概念DB」アークが示
すノード以下に格納されている「概念」情報を利用して
検索するための検索要求である。ここで、概念「周辺装
置」の値をもつタグの子要素の値には、概念「SCS
I」、「メモリ」、「HDD」などがあるものとする。
また、図18には示していないが、各「特許」情報の構
成要素には、「キーワード」タグから始める要素も存在
するものとする。FIG. 42 shows an example of a concept search query. The query shown in FIG.
The structured document database in the state shown in
For searching for a document group of "patent" information stored under the node indicated by the "patent DB" arc using "concept" information stored under the node indicated by the "concept DB" arc Search request. Here, the value of the child element of the tag having the value of the concept “peripheral device” includes the concept “SCS”.
I "," memory "," HDD ", and the like.
Although not shown in FIG. 18, it is assumed that each component of the “patent” information includes an element starting with a “keyword” tag.
【0224】すなわち、図42のクエリは、「概念「周
辺装置」以下の概念のいずれかを「キーワード」という
要素の値にもつ文書(「特許」情報)の「タイトル」を
列挙せよ」という検索要求を意味している。That is, the query shown in FIG. 42 retrieves “list the titles” of documents (“patent” information) having any of the concepts below the concept “peripheral device” as the value of the element “keyword”. Means request.
【0225】「kf:from」タグから始まる要素の
記述により、変数「$t」、変数「$k」に、それぞ
れ、「特許」情報の「タイトル」、「キーワード」とい
う要素の値が代入される。また、変数「$x」は「概
念」情報として「周辺装置」の値をもつタグの子要素の
値(「SCSI」、「メモリ」、「HDD」など)が代
入される。According to the description of the element starting from the “kf: from” tag, the values of the “title” and “keyword” elements of the “patent” information are substituted into the variable “$ t” and the variable “$ k”, respectively. You. The value of the child element of the tag having the value of “peripheral device” (“SCSI”, “memory”, “HDD”, etc.) is substituted for the variable “$ x” as “concept” information.
【0226】「kf:where」タグから始める要素
の記述により、「$k」=「周辺装置」もしくは「$
k」=「$x」という比較がなされる。According to the description of the element starting from the “kf: where” tag, “$ k” = “peripheral device” or “$
A comparison is made that “k” = “$ x”.
【0227】次に、図1の構造化文書管理システムの文
書検索処理動作について、図43に示すフローチャート
を参照して説明する。Next, the document search processing operation of the structured document management system of FIG. 1 will be described with reference to the flowchart shown in FIG.
【0228】図31に示した画面上で、ユーザが「XM
L検索Win」をマウス等のポインティングデバイスな
どを用いて選択すると、図44に示すような文書検索を
行うためのユーザインタフェースとしての画面が表示さ
れる。[0228] On the screen shown in FIG.
When "L search Win" is selected using a pointing device such as a mouse, a screen as a user interface for performing a document search as shown in FIG. 44 is displayed.
【0229】図44の検索画面において、領域W1に
は、前述同様、構造化文書データベースの現在のツリー
構造の要素名(タグ名)がユーザが理解可能なように簡
略的に表示されてている。In the search screen of FIG. 44, the element name (tag name) of the current tree structure of the structured document database is simply displayed in the area W1 so that the user can understand it, as described above. .
【0230】領域W2は、検索対象の範囲(ツリー構造
上の検索範囲)や、検索条件などを入力するための領域
である。領域W3には、検索結果が表示される。The area W2 is an area for inputting a search target range (a search range in a tree structure), a search condition, and the like. The search result is displayed in the area W3.
【0231】例えば、「「uix://root」以下
の「特許」を先頭タグに持つ文書の中から、「タイト
ル」タグに「文書」という文字列を含み、「1998」
年以降に作成された文書を検索せよ」という検索要求の
場合には、領域W1から「root」をマウス等で選択
して検索対象の範囲として、構造化文書パスを入力す
る。そして、トップノードとして、「特許」を入力する
(この場合、領域W1から「特許」をマウス等で選択す
ることにより入力してもよい)。また、検索条件とし
て、「「タイトル」という要素の値に「文書」という文
字列を含む」「「年」という要素の値が「1998」以
上である」という内容を予め設定されたデータ入力領域
に入力すればよい。For example, among documents having a heading “patent” under “uix: // root”, a character string “document” is included in a “title” tag, and “1998”
In the case of a search request of "search for documents created after the year", "root" is selected from the area W1 with a mouse or the like, and a structured document path is input as a search target range. Then, "patent" is input as the top node (in this case, "patent" may be input by selecting the "patent" from the area W1 with a mouse or the like). In addition, as a search condition, the contents of “the value of the element“ title ”includes the character string of“ document ”” and “the value of the element“ year ”is“ 1998 ”or more” are set in the preset data input area. Should be entered.
【0232】その後、「検索」ボタンB21を選択する
ことにより、例えば、図45に示すようなクエリが、当
該クエリを構造化文書データベース上に格納するための
追加コマンドとともに構造化文書管理システムへ送信さ
れる。クエリの格納場所は、予め定められており、シス
テム側が自動的に、この追加コマンドのパラメータを設
定することとなる。例えば、構造化文書データベースが
図18に示した状態のとき、当該クエリの格納場所を表
すパラメータとしての構造化文書パスは、「uix:/
/root/クエリDB」となる。また、追加コマンド
のもう一方のパラメータは、当該クエリ文書である。Thereafter, by selecting the "search" button B21, for example, a query as shown in FIG. 45 is transmitted to the structured document management system together with an additional command for storing the query in the structured document database. Is done. The storage location of the query is determined in advance, and the system automatically sets the parameters of this additional command. For example, when the structured document database is in the state shown in FIG. 18, the structured document path as a parameter indicating the storage location of the query is “uix: //
/ Root / query DB ". The other parameter of the additional command is the query document.
【0233】要求受付部11は、上記クエリを受け付け
ると(ステップS101)、当該クエリを検索要求処理
部3へ渡す。そして、当該クエリ文書を格納するための
追加コマンドのパラメータを文書格納部21へ渡す。こ
の追加コマンドの処理を、前述同様に行って、当該クエ
リは、文書記憶部5に格納される。Upon receiving the above query (step S101), the request receiving unit 11 passes the query to the search request processing unit 3. Then, the parameter of the additional command for storing the query document is passed to the document storage unit 21. This additional command is processed in the same manner as described above, and the query is stored in the document storage unit 5.
【0234】例えば、図42に示すようなクエリの場
合、構造化文書データベースには、図46に示すように
展開されて、構造化文書パス「uix://root/
クエリDB」の示す「#301」ノード以下にリンクさ
れる。For example, in the case of a query as shown in FIG. 42, the structure is expanded in the structured document database as shown in FIG. 46, and the structured document path “uix: // root /
It is linked to a node under “# 301” node indicated by “query DB”.
【0235】一方、検索要求処理部3では、受け取った
クエリを基に、データアクセス部4を通してインデック
ス記憶部6,文書記憶部5にアクセスし、検索要求に合
致する文書集合などを取得して、クエリの中で要求され
た情報を抽出して結果処理部12を介して出力する。On the other hand, the search request processing unit 3 accesses the index storage unit 6 and the document storage unit 5 through the data access unit 4 based on the received query, and acquires a document set that matches the search request. The information requested in the query is extracted and output via the result processing unit 12.
【0236】例えば、上記クエリの場合、まず、「「タ
イトル」タグに「文書」という文字列を含む」という条
件に合致するものを検索することが検索対象を絞り込む
上で効率がよい。そこで、図10に示したようなデータ
生起インデックスを用いて、「文書」という文字列にリ
ンクされているノード(文書オブジェクト)のオブジェ
クトIDを得る。そして、そのそれぞれについて、文書
オブジェクトツリーを上流側に1つ遡り、「タイトル」
というタグ名にたどり着いたときは、更に上流に辿って
いき、「特許」というタグ名にたどり着いたときは、そ
のノード以下の文書オブジェクトツリーOt11を抽出
する。For example, in the case of the above query, it is efficient to first search for a query that satisfies the condition that “the character string“ document ”is included in the“ title ”tag”. Therefore, the object ID of the node (document object) linked to the character string “document” is obtained using the data occurrence index as shown in FIG. Then, for each of them, the document object tree is traced back to the upstream side by one, and “Title”
When it reaches the tag name of "patent", the document object tree Ot11 below that node is extracted when it reaches the tag name of "patent".
【0237】次に、この抽出された複数の文書オブジェ
クトツリーOt11の中から、さらに、「年」という要
素の値が「1998」年以上の文書オブジェクトツリー
Ot12を抽出する。Next, from the plurality of extracted document object trees Ot11, a document object tree Ot12 in which the value of the element “year” is “1998” or more is extracted.
【0238】この文書オブジェクトツリーOt12が上
記クエリの内容に適合する文書となる。さらに上記クエ
リの要求内容に従えば、各文書オブジェクトツリーOt
12のトップノードへの構造化文書パスを求める(ステ
ップS102)。This document object tree Ot12 is a document that matches the contents of the above query. Further, according to the request contents of the above query, each document object tree Ot
Then, a structured document path to the top node No. 12 is obtained (step S102).
【0239】なお、上記検索処理は、上記した方法に限
るものではなく、インデックス情報を用いた様々な効率
のよい検索方法が可能である。Note that the above-described search processing is not limited to the above-described method, and various efficient search methods using index information are possible.
【0240】検索要求処理部3は、ステップS102で
得られた結果を統合して、検索結果としてのXML文書
を作成する(ステップS103)。The search request processing unit 3 integrates the results obtained in step S102 to create an XML document as a search result (step S103).
【0241】例えば、検索結果のXML文書は、 <out> <result> uix://root/特許DB/特許[0] </result> <result> uix://root/特許DB/特許[2] </result> </out> となる。For example, the XML document of the search result is as follows: <out> <result> ux: // root / patent DB / patent [0] </ result> <result> uix: // root / patent DB / patent [2] </ Result> </ out>
【0242】検索要求処理部3は、検索結果処理部12
を介して、上記XML文書をスタイルシートとともに、
要求元のクライアント端末に返す(ステップS10
4)。The search request processing unit 3 includes the search result processing unit 12
Through the XML document with the style sheet,
Return to the requesting client terminal (step S10
4).
【0243】クライアント端末では、図11に示したX
ML文書を、スタイルシートを用いてHTMLデータに
変換して、例えば、図44に示すように、領域W12に
表示する。In the client terminal, X shown in FIG.
The ML document is converted into HTML data using a style sheet, and is displayed in the area W12, for example, as shown in FIG.
【0244】同様にして、スキーマの検索も行える。Similarly, a schema search can be performed.
【0245】例えば、「「uix://root」以下
の「schema」を先頭タグに持つ文書の中から、
「特許」と「要約」というタグ名を持つスキーマを検索
せよ」という検索要求の場合には、図47に示すよう
に、領域W1から「root」をマウス等で選択して検
索対象の範囲として、構造化文書パスを入力する。そし
て、トップノードとして、「#schema」を入力す
る。また、検索条件として、「要素の属性名に「特許」
という文字列を含む」「要素の属性名に「要約」という
文字列を含む」という内容を予め設定されたデータ入力
領域に入力すればよい。For example, from among documents having “schema” at the top of “uix: // root”,
In the case of a search request of "search for a schema having tag names of" patent "and" summary "", as shown in FIG. 47, "root" is selected from the area W1 with a mouse or the like and set as a search target range. , Enter the structured document path. Then, “#schema” is input as the top node. In addition, as a search condition, "patent"
What is necessary is to input the content "includes the character string""and" includes the character string "abstract" in the attribute name of the element "into the preset data input area.
【0246】その後、「検索」ボタンB21を選択する
ことにより、上記検索要求を記述したクエリ(図48参
照)が、当該クエリを構造化文書データベース上に格納
するための追加コマンドとともに構造化文書管理システ
ムへ送信される。Thereafter, by selecting the "search" button B21, the query describing the above search request (see FIG. 48) is added to the structured document database together with an additional command for storing the query in the structured document database. Sent to the system.
【0247】さて、上記クエリの場合、例えば、「「#
schema」を先頭タグに持つ」という条件に合致す
るものを検索する。そこで、図9に示したような要素名
称生起インデックスを用いて、「#schema」とい
う要素にリンクされているノードの(文書オブジェク
ト)のオブジェクトIDを得る。そして、そのそれぞれ
について、文書オブジェクトツリーを下流側にアークを
辿っていき、属性名が「特許」と「要約」いう要素にた
どり着いたときは、当該「#schema」を先頭タグ
にもつ文書オブジェクトツリーOt21を抽出する。こ
の文書オブジェクトツリーOt21が上記クエリの内容
に適合する文書となる。さらに、図48に示したクエリ
の要求内容に従えば、各文書オブジェクトツリーOt2
1のトップノードへの構造化文書パスを求める。By the way, in the case of the above query, for example, "[#
A search that matches the condition of “having“ schema ”as the first tag” ”is performed. Then, the object ID of the node (document object) linked to the element “#schema” is obtained using the element name occurrence index as shown in FIG. Then, for each of them, the document object tree is traced to the downstream side, and when the attribute name reaches the element “patent” and “summary”, the document object tree having the head tag “#schema” Extract Ot21. The document object tree Ot21 is a document that matches the content of the query. Further, according to the request content of the query shown in FIG. 48, each document object tree Ot2
1 to determine the structured document path to the top node.
【0248】検索要求処理部3は、文書オブジェクトツ
リーOt21が複数あれば、それぞれのトップノードへ
の構造化文書パスをまとめて、検索結果としてのXML
文書を作成し、検索結果処理部12を介して、上記XM
L文書をスタイルシートとともに、要求元のクライアン
ト端末に返す。If there are a plurality of document object trees Ot21, the search request processing unit 3 puts together the structured document paths to the respective top nodes, and outputs XML as a search result.
A document is created, and the above-mentioned XM
The L document is returned to the requesting client terminal together with the style sheet.
【0249】クライアント端末では、検索結果として受
け取ったXML文書を、スタイルシートを用いてHTM
Lデータに変換して、例えば、図44に示すように、領
域W12に表示する。At the client terminal, the XML document received as a search result is converted into an HTM using a style sheet.
The data is converted into L data and displayed in the area W12, for example, as shown in FIG.
【0250】クライアント端末では、検索結果の中の1
つのスキーマを選択して、表示させると、例えば、図3
8に示すような文書の格納/削除を行うための画面とと
もに、その領域W3に、「特許」情報のデータ入力領域
が各要素毎に設定されて表示される。At the client terminal, one of the search results
When one schema is selected and displayed, for example, FIG.
Along with a screen for storing / deleting a document as shown in FIG. 8, a data input area of “patent” information is set and displayed for each element in the area W3.
【0251】ユーザは、このデータ入力領域にデータを
入力することで、スキーマにより定義された文書構造の
格納文書が容易に作成することができる。The user can easily create a stored document having a document structure defined by the schema by inputting data into this data input area.
【0252】例えば、図38の領域W3に入力した「特
許」情報の格納先として、領域W1で「特許DB」をマ
ウス等を用いて選択すると、領域W2に構造化文書パス
として、「uix://root/特許DB」が表示さ
れる。その後、「登録」ボタンB1を選択すると、「a
ppendXML(“uix://root/特許D
B”,“<特許>…</特許>”)」なる追加コマンド
が構造化文書管理システムへ送信される。For example, when “patent DB” is selected in the area W1 as a storage destination of the “patent” information input in the area W3 in FIG. 38 by using a mouse or the like, “uix: // root / patent DB "is displayed. After that, when the “register” button B1 is selected, “a”
ppendXML ("uix: // root / Patent D
B ","<patent> ... </ patent>")" are transmitted to the structured document management system.
【0253】この場合、格納文書は、予めスキーマに従
って入力されたものなので、図20のステップS10の
妥当性チェックでエラーとなることはない。In this case, since the stored document has been input in advance according to the schema, no error occurs in the validity check in step S10 in FIG.
【0254】同様にして、クエリの検索も行える。クエ
リを検索して、検索結果として得られた既存のクエリを
加工して、再利用することもできる(クエリの再利
用)。In a similar manner, a query can be searched. By searching for a query, an existing query obtained as a search result can be processed and reused (query reuse).
【0255】クエリの検索は、前述したような構造化文
書の検索と同様にして行われ、その検索範囲は、クエリ
群の格納されている構造化データベース上の一部の文書
オブジェクトツリーとなる。The search for the query is performed in the same manner as the search for the structured document as described above, and the search range is a part of the document object tree on the structured database in which the query group is stored.
【0256】例えば、図18に示したような状態の構造
化文書データベースから、「kf:from」タグに
「特許DB」を含むクエリを検索する場合について説明
する。そのような検索要求を記述したクエリを図49に
示す。For example, a case will be described in which a query including “patent DB” in the “kf: from” tag is searched from the structured document database in the state as shown in FIG. FIG. 49 shows a query describing such a search request.
【0257】図49に示すクエリは、「「uix://
root/クエリDB」の示す「#301」ノード以下
に存在するクエリの中から「kf:from」タグに
「特許DB」を含むクエリを検索し、その内容(タグ名
が「query」である要素以下の文書オブジェクトツ
リーの文書)を列挙せよ」を意味するものである。[0257] The query shown in FIG.
A query that includes “patent DB” in the “kf: from” tag is searched from among the queries existing under the “# 301” node indicated by the “root / query DB”, and the content (the element whose tag name is “query”) is searched. Enumerate the following document object tree).
【0258】なお、「kf:as」タグの内容で変数
「$elt」に、「kf:from」タグに「特許D
B」を含むクエリのタグ名が「query」である要素
以下の文書オブジェクトツリーが代入される。Note that the contents of the “kf: as” tag include the variable “$ elt” and the “kf: from” tag includes “patent D”.
The document object tree below the element whose tag name of the query including "B" is "query" is substituted.
【0259】このクエリを検索要求処理部3が処理する
際には、前述同様にして、例えば、図9に示したような
要素名称生起インデックスを用いて、「kf:fro
m」という要素にリンクされているノードの(文書オブ
ジェクト)のオブジェクトIDを得る。そして、そのそ
れぞれについて、文書オブジェクトツリーを下流側にア
ークを辿っていき、「特許」というタグ名にたどり着い
たときは、さらに、上流側にアークを辿って「quer
y」というタグ名に辿りついたとき、当該「quer
y」を先頭タグにもつ文書オブジェクトツリーOt31
を抽出する。この文書オブジェクトツリーOt31が上
記クエリの内容に適合する文書となる。When the query is processed by the search request processing unit 3, similarly to the above, for example, using the element name occurrence index as shown in FIG.
The object ID of the (document object) of the node linked to the element "m" is obtained. Then, for each of them, the document object tree is traced downstream to the arc, and when the tag name "patent" is reached, the arc is further traced upstream to "quer".
When the tag name "y" is reached,
document object tree Ot31 having "y" as the first tag
Is extracted. This document object tree Ot31 is a document that matches the content of the query.
【0260】複数の文書オブジェクトツリーOt31が
検索されたら、それらを統合して、XML文書を作成し
て、それをスタイルシートとともにクライアント端末へ
返す。When a plurality of document object trees Ot31 are retrieved, they are integrated to create an XML document, and return it to the client terminal together with the style sheet.
【0261】クライアント端末では、検索結果の中の1
つのクエリを選択して、表示させると、例えば、図44
に示した検索画面の領域W11に、各データ入力領域に
データの入力された状態で、当該クエリに記述された検
索要求の内容が表示される。In the client terminal, one of the search results
When one query is selected and displayed, for example, FIG.
The content of the search request described in the query is displayed in the area W11 of the search screen shown in (1) in a state where data is input to each data input area.
【0262】ユーザは、この状態から、「「uix:/
/root」以下の「特許」を先頭タグに持つ文書の中
から、「タイトル」タグに「文書」という文字列を含
み、「1998」年以降に作成された文書を検索せよ」
という当該クエリに記述された検索要求中の「文書」を
「XML」に変更して、「検索」ボタンB21を選択す
れば、「「uix://root」以下の「特許」を先
頭タグに持つ文書の中から、「タイトル」タグに「XM
L」という文字列を含み、「1998」年以降に作成さ
れた文書を検索せよ」という意味のクエリが構造化文書
管理システムへ送信される。[0262] From this state, the user can select "" ux: //
Search for documents created after "1998" that contain the character string "document" in the "title" tag from among the documents having "patent" at the top tag under "/ root". "
"Document" in the search request described in the query is changed to "XML" and the "Search" button B21 is selected. Then, "Patent" under "uix: // root" is set as the first tag. From the documents you have, add "XM
A query including a character string "L" and meaning "search for documents created after 1998" is transmitted to the structured document management system.
【0263】以上説明したように、図1の構造化文書管
理システムでは、構造化文書データベース上に登録され
る文書構造が異なる膨大な数のXML文書群(コンテン
ツ文書、スキーマ文書、クエリ文書など)を、図18,
図19に示すように、「root」タグを先頭に持つツ
リー状の1つの巨大なXML文書として取り扱う。従っ
て、文書構造が異なる、様々なスキーマを持つ膨大な数
の文書の中から検索条件に合致する文書を容易に検索で
きる。As described above, in the structured document management system of FIG. 1, a huge number of XML documents (content documents, schema documents, query documents, etc.) having different document structures registered in the structured document database From FIG. 18,
As shown in FIG. 19, it is handled as one huge XML document in a tree shape having a “root” tag at the top. Therefore, it is possible to easily search for a document that meets the search condition from a vast number of documents having various schemas and different document structures.
【0264】また、検索に用いるクエリも構造化文書で
あるので、構造化文書データベースにログとして格納す
ることにより、過去のクエリを再利用するようなアプリ
ケーションも容易に構築することができる。Also, since the query used for the search is a structured document, by storing it as a log in the structured document database, an application that reuses a past query can be easily constructed.
【0265】(3)適用例 次に、上記概念検索の特許調査への適用例について説明
する。(3) Application Example Next, an application example of the above-described concept search to a patent search will be described.
【0266】図50は、特許調査における構造化文書デ
ータベースの一例であり、「特許」情報の他に、「概
念」情報も格納している。FIG. 50 shows an example of a structured document database in patent search, which stores "concept" information in addition to "patent" information.
【0267】特許調査において、最も重要となってくる
作業は、関連する「特許」情報を収集し、「特許」情報
を様々な観点から分析し、特許マップ(図54参照)を
作成することである。特許マップを作成するために、従
来、特許マップにおける縦軸、横軸を予め決定し、それ
に従い、縦軸に並ぶ任意の項目と横軸に並ぶ任意の項目
とを検索条件とした検索を逐次行うという方法がとら
れ、この部分に非常に莫大なコストがかかっていた。し
かし、構造化文書管理システムを用いることで、この部
分のコストを大幅に減少させることが可能となる。The most important work in a patent search is to collect relevant “patent” information, analyze the “patent” information from various viewpoints, and create a patent map (see FIG. 54). is there. Conventionally, in order to create a patent map, the vertical axis and the horizontal axis in the patent map are determined in advance, and accordingly, a search is sequentially performed using any item on the vertical axis and any item on the horizontal axis as search conditions. It was done in a way that was very costly. However, by using the structured document management system, the cost of this part can be significantly reduced.
【0268】なお、ここで、マップとは、縦軸(y軸)
に並ぶ任意の項目と横軸(x軸)に並ぶ任意の項目とを
検索条件とした検索結果をx軸とy軸とを分類軸として
分類整理するものである。Here, the map means the vertical axis (y-axis).
Are sorted and arranged using the x-axis and the y-axis as the classification axes, with the search result using the arbitrary items arranged in a row and the arbitrary items arranged in the horizontal axis (x-axis) as search conditions.
【0269】構造化文書管理システムで、クライアント
端末のユーザが図54に示すような特許マップを作成し
ようとする場合、ユーザは、クライアント端末上の表示
装置に表示される図50に示すような構造化文書データ
ベースの現在のツリー構造を参照して、図51に示すよ
うな検索画面上に、分析対象の範囲とする「特許」情報
のパスと、分析の軸(例えば、x軸、y軸)となる要素
を、それぞれ領域W21、W22に入力する。分析の軸
となる要素は、構造化文書データベース内の「特許」情
報の要素、「概念」情報の要素のいずれであってもよ
い。In the structured document management system, when a user of a client terminal intends to create a patent map as shown in FIG. 54, the user is required to make a structure as shown in FIG. 50 displayed on a display device on the client terminal. With reference to the current tree structure of the structured document database, on the search screen shown in FIG. 51, the path of the “patent” information to be analyzed and the axis of analysis (for example, x-axis and y-axis) Are input to the areas W21 and W22, respectively. The element serving as the axis of the analysis may be either the element of “patent” information or the element of “concept” information in the structured document database.
【0270】例えば、図51では、x軸に「機能」、y
軸に「技術」という「概念」情報の要素を入力してい
る。For example, in FIG. 51, “function” and y are plotted on the x-axis.
The element of "concept" information called "technology" is input to the axis.
【0271】その後、ユーザは、「実行」ボタンB31
を選択すると、クライアント端末から図1の構造化文書
管理システムへ、図52に示したようなクエリが送出さ
れる。[0271] Thereafter, the user presses the "execute" button B31.
When is selected, a query as shown in FIG. 52 is sent from the client terminal to the structured document management system of FIG.
【0272】この場合のクエリには、「「特許DB」ア
ークが示すノード以下に格納されている「特許」情報の
文書群の中から、「概念DB」アークが示すノード以下
に格納されている、概念「機能」の子要素のいずれかと
概念「技術」の子要素のいずれかとを、「キーワード」
や「要約」などの要素の値に含む「特許」情報を検索せ
よ。検索結果として、「機能」の子要素と「技術」の子
要素と、それらに対応する「特許」情報の「公開番号」
との組を列挙せよ。」という意味の検索要求である。In the query in this case, from the document group of the “patent” information stored under the node indicated by the “patent DB” arc, the query is stored under the node indicated by the “concept DB” arc. , One of the child elements of the concept "function" and one of the child elements of the concept "technology"
Search for "patent" information that is included in the value of elements such as and "summary". As the search result, the child element of "function" and the child element of "technology" and the "public number" of the "patent" information corresponding to them
List the pairs with Is a search request.
【0273】概念「機能」には、「検索」「格納」…
「分析支援」という子要素があり、概念「技術」には、
「実装データベース」「反構造データベース」「自然言
語処理」…という子要素があるものとする。The concepts “function” include “search”, “store”, and so on.
There is a child element called "analysis support", and the concept "technology"
It is assumed that there are child elements such as “implementation database”, “anti-structure database”, and “natural language processing”.
【0274】上記クエリを受けた構造化文書検索システ
ムの検索要求処理部3では、例えば、図10に示したよ
うなデータ生起インデックスを用いて、概念「機能」の
各子要素(文字列)にリンクされているノード(文書オ
ブジェクト)のオブジェクトIDを得る。そして、その
それぞれについて、文書オブジェクトツリーを上流側に
遡り、「特許」というタグにたどり着いたときは、さら
に、そのノード以下の文書オブジェクトツリーを下流側
に辿って概念「技術」の子要素(文字列)のいずれかに
リンクされているタグ名にたどり着いたときは、当該文
書オブジェクトツリーと、その「公開番号」タグにリン
クされている文字列(要素値)を抽出する。このように
して、抽出された「特許」情報のそれぞれについて、対
応の「機能」の子要素と「技術」の子要素と「公開番
号」との組を統合して、図53に示すような検索結果と
してのXML文書を作成、要求元のクライアント端末
へ、所定のスタイルシートとともに返す。The search request processing unit 3 of the structured document search system having received the above query uses, for example, a data occurrence index as shown in FIG. 10 to convert each child element (character string) of the concept “function”. The object ID of the linked node (document object) is obtained. Then, for each of them, when the document object tree is traced upstream to the tag “patent”, the document object tree below that node is traced downstream, and the child element (character) of the concept “technology” is further traced. When the tag name linked to any of the columns is reached, the document object tree and the character string (element value) linked to the “public number” tag are extracted. In this way, for each of the extracted “patent” information, the corresponding set of the child element of “function”, the child element of “technology” and the “public number” is integrated as shown in FIG. An XML document as a search result is created and returned to the requesting client terminal together with a predetermined style sheet.
【0275】これらを受け取ったクライアント端末の表
示装置には、図54に示したような表形式の特許マップ
が表示されることになる。[0275] The display device of the client terminal that has received these displays a patent map in the form of a table as shown in FIG.
【0276】このように、所望の概念を「軸」として指
定するだけで、構造化文書データベースに蓄積された情
報を「軸」として指定された概念に基づき集計・分類し
て、マップ表示するこたが容易に行える。すなわち、構
造化文書データベースに蓄積された情報を、「概念」情
報を用いて様々な観点で集計・分類することが容易に行
える。As described above, by simply designating a desired concept as an "axis", information accumulated in the structured document database is tabulated and classified based on the concept designated as an "axis" and displayed on a map. But can be done easily. That is, the information stored in the structured document database can be easily tabulated and classified from various viewpoints using the “concept” information.
【0277】(本発明の実施形態の説明−構造化文書の
編集)以下、本発明の実施の形態について図面を参照し
て説明する。(Explanation of Embodiment of the Present Invention—Editing of Structured Document) Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
【0278】上記構造化文書データベースに格納されて
いる構造化文書は、書き換えが許可されていないとす
る。このような場合であっても、ユーザは、個々の利用
目的に応じて、クライアント端末102を介して上記構
造化文書データベースから検索した構造化文書を編集、
加工したという要望がある。It is assumed that the structured document stored in the structured document database is not allowed to be rewritten. Even in such a case, the user edits the structured document retrieved from the structured document database via the client terminal 102 according to the individual purpose of use,
There is a request that it has been processed.
【0279】上記構造化文書データベースから検索した
構造化文書に付け加えたい情報としては、例えば、個人
的な評価、日報における(案件処理の)緊急度、人事デ
ータにおける重要人物度、その他、複数の特定のユーザ
からなるユーザグループ内では共有したいが、それ以外
のユーザには秘密にしておきたい情報などがある。Information to be added to the structured document retrieved from the structured document database includes, for example, personal evaluation, urgency (of case processing) in daily report, important person degree in personnel data, and a plurality of specific There is information that the user wants to share within the user group consisting of the users, but other users want to keep secret.
【0280】以下、構造化文書への書き換えが不可能な
場合、構造化文書データべースに対しては何ら操作を行
わずに、構造化文書への編集(加工)が行え、その編集
した結果を含めて、文書の検索を可能にする構造化文書
編集機能について説明する。In the following, when rewriting to a structured document is not possible, the structured document can be edited (processed) without performing any operation on the structured document database. A structured document editing function that enables a search for a document including a result will be described.
【0281】図55は、上記したような機能を実現する
ためのクライアント端末102の構成例を示したもので
ある。FIG. 55 shows an example of the configuration of the client terminal 102 for realizing the functions described above.
【0282】図55に示したクライアント端末102
は、図2に示したように、WWW(World Wid
e Web)のバックエンドで動作する、図1に示した
構成の構造化文書管理システム100に対し、アクセス
する場合を示している。また、図55に示したクライア
ント端末102の各構成部の機能を、WWWブラウザ1
03にアドインして実現することもできる。The client terminal 102 shown in FIG.
Is a WWW (World Wid) as shown in FIG.
1 shows a case in which a structured document management system 100 that operates on the back end of eWeb) and has the configuration shown in FIG. 1 is accessed. The function of each component of the client terminal 102 shown in FIG.
03 can also be implemented.
【0283】図55の場合、クライアント端末102と
WWWサーバ101とは、図2と同様、例えば、HTT
P(Hyper Text Transfer Pro
tocol)で通信し、また、WWWサーバ101と構
造化文書管理システム100とは、CGI(Commo
n Gateway Interface)またはCO
M(Component Object Model)
などで通信している場合を示している。In the case of FIG. 55, the client terminal 102 and the WWW server 101 are, for example,
P (Hyper Text Transfer Pro)
The WWW server 101 and the structured document management system 100 communicate with each other by CGI (Commo).
n Gateway Interface) or CO
M (Component Object Model)
It shows a case where communication is performed by, for example.
【0284】図55に示した構成において、クライアン
ト端末102は、ユーザタグ登録部201、検索要求入
力部202,検索結果表示処理部203,文書編集部2
04,拡張文書検索要求入力部205,ユーザタグ記憶
部206,追加文書抽出部207,検索要求分離部20
8,追加文書検索部209,追加文書記憶部210,文
書合成部211から構成されている。In the configuration shown in FIG. 55, the client terminal 102 includes a user tag registration unit 201, a search request input unit 202, a search result display processing unit 203, and a document editing unit 2.
04, extended document search request input unit 205, user tag storage unit 206, additional document extraction unit 207, search request separation unit 20
8, an additional document search unit 209, an additional document storage unit 210, and a document synthesis unit 211.
【0285】図55に示した構成のクライアント端末1
02を用いて、ユーザは、まず、個人利用のためのタ
グ、すなわち、ユーザタグを登録し、このユーザタグで
囲まれた新たな構成要素を、構造化文書データベースか
ら読み出された構造化文書に追加することにより、当該
構造化文書の編集を行う。その際、ユーザ側から見れ
ば、構造化文書には新たな構成要素が追加して、実際に
当該構造化文書自体を編集したことになるが、この編集
によっては構造化文書データベースに対し何ら操作を行
うことはないので、構造化文書データベースからみれ
ば、単に、格納済みの構造化文書を読み出してクライア
ント端末102に提供しているにすぎない。すなわち、
構造化文書データベースに格納されている構造化文書が
書き換えられることはない。The client terminal 1 having the configuration shown in FIG.
02, the user first registers a tag for personal use, that is, a user tag, and adds a new component surrounded by the user tag to the structured document read from the structured document database. To edit the structured document. At this time, from the user's point of view, a new component is added to the structured document, and the structured document itself is actually edited. However, depending on this editing, no operation is performed on the structured document database. Therefore, from the viewpoint of the structured document database, the stored structured document is simply read and provided to the client terminal 102. That is,
The structured document stored in the structured document database is not rewritten.
【0286】なお、新たな構成要素の(構造化文書にお
ける)追加位置は、予め定められた固定位置とし、ここ
では、構造化文書の最後の構成要素としてこの新たな構
成要素を追加するものとする。なお、新たな構成要素の
追加位置を上記したように「最後」とする場合に限ら
ず、先頭、すなわち、最初の構成要素として追加するよ
うにしてもよいし、場合によっては、上から2番目、3
番目、…の構成要素として、構造化文書の中間に追加す
るようにしてもよい。本発明においては、新たな構成要
素の追加位置を特に限定するものではないが、好ましく
は、本実施形態のように、最後の構成要素として、構造
化文書の最後に追加することが望ましい。[0286] The addition position of the new component (in the structured document) is a predetermined fixed position. Here, it is assumed that the new component is added as the last component of the structured document. I do. Note that the addition position of the new component is not limited to the “last” as described above, but may be added as the first component, that is, the first component, or in some cases, the second component from the top. , 3
Third,... May be added in the middle of the structured document. In the present invention, the position at which a new component is added is not particularly limited, but it is preferable to add the last component to the end of the structured document as the last component as in the present embodiment.
【0287】構造化文書に追加された、ユーザタグで囲
まれた新たな構成要素を含むXML形式の構造化文書を
追加文書と呼ぶ。[0287] An XML-structured document including new components surrounded by a user tag added to the structured document is called an additional document.
【0288】上記編集結果を検索にも反映するために、
上記新たな構成要素(を含む追加文書)を、その新たな
構造化文書が追加される構造化文書に対応付けて記憶し
ておく。In order to reflect the above-mentioned editing result in the search,
The new component (including the additional document) is stored in association with the structured document to which the new structured document is added.
【0289】検索時には、新たな構成要素に基づく検索
条件の指定も可能となる。この場合、ユーザから指定さ
れた検索条件などのが記述されたクエリ(拡張クエリ)
をそのまま構造化文書管理システム100に送出するこ
とはできないので、当該クエリから新たな構成要素を指
定した検索条件などの記述を取り除いてから、構造化文
書管理システム100にクエリを送出する。同時に、新
たな構成要素を指定した検索条件を満たす追加文書を検
索するための追加文書用のクエリも作成して、この追加
文書用クエリを用いて、追加文書の検索を行う。At the time of search, it is possible to specify search conditions based on new components. In this case, a query (extended query) that describes search conditions specified by the user, etc.
Cannot be sent to the structured document management system 100 as it is, the query such as a search condition specifying a new component is removed from the query, and then the query is sent to the structured document management system 100. At the same time, a query for an additional document for searching for an additional document that satisfies the search condition specifying the new component is also created, and the additional document is searched using the query for the additional document.
【0290】そして、構造化文書管理システム100か
ら送られてきた検索結果としての構造化文書に、追加文
書の検索結果として得られた追加文書を合成した後、拡
張文書としてユーザに提示する。Then, after the additional document obtained as a search result of the additional document is combined with the structured document as the search result sent from the structured document management system 100, it is presented to the user as an extended document.
【0291】ユーザタグ登録部201は、ユーザタグ
(タグ名と、その取り得る値(の範囲))をユーザタグ
記憶部206に登録するためのものである。The user tag registration section 201 is for registering a user tag (tag name and its possible value (range)) in the user tag storage section 206.
【0292】検索要求入力部202は、ユーザから入力
された検索対象の範囲や、検索要求等に基づき、構造化
文書管理システム100へそのまま送信可能な(通常
の)クエリを生成する。The search request input unit 202 generates a (normal) query that can be transmitted to the structured document management system 100 as it is, based on the search target range input by the user, the search request, and the like.
【0293】拡張文書検索要求入力部205は、ユーザ
から入力された検索対象の範囲や、検索要求等に基づ
き、拡張クエリを生成する。The extended document search request input unit 205 generates an extended query based on a search target range input by a user, a search request, and the like.
【0294】検索結果表示処理部203は、構造化文書
管理システムで上記通常のクエリを実行した結果得られ
た検索結果や、上記拡張クエリを実行した結果得られた
検索結果を、クライアント端末102の表示装置に表示
するための処理を行う。[0294] The search result display processing unit 203 converts the search result obtained as a result of executing the above-mentioned ordinary query in the structured document management system and the search result obtained as a result of executing the above-mentioned extended query into the client terminal 102. Processing for displaying on the display device is performed.
【0295】その際、構造化文書管理システムから当該
検索結果とともに送られてくるスタイルシートを用いて
当該検索結果を表示するようにしてもよいが、この場合
に限らず、予め定められたスタイルで、検索結果を表示
するようにしてもよい。また、後述するように、検索結
果として拡張文書を表示する際には、当該スタイルシー
トを拡張文書対応に変更して用いるようにしてもよい。At this time, the search result may be displayed using a style sheet sent together with the search result from the structured document management system. However, the present invention is not limited to this case. Alternatively, the search result may be displayed. Further, as described later, when displaying an extended document as a search result, the style sheet may be changed to be used for the extended document.
【0296】文書編集部204は、ユーザタグ記憶部2
06に登録したユーザタグを用いて新たな構成要素を作
成して、それを構造化文書管理システムで上記通常のク
エリを実行した結果得られた構造化文書に追加すること
により、構造化文書データベースに格納されている構造
化文書を編集するためのものである。The document editing unit 204 stores the user tag storage unit 2
A new structured element is created using the user tag registered in 06, and is added to the structured document obtained as a result of executing the above-mentioned ordinary query in the structured document management system. This is for editing a structured document stored in.
【0297】追加文書抽出部207は、文書編集部20
4で構造化文書に追加された新たな構成要素を取出し、
それに、この新たな構成要素が追加された構造化文書の
文書IDを加えて、XML形式の構造化文書である追加
文書を作成する。ここで作成された追加文書は、追加文
書記憶部210に記憶される。[0297] The additional document extraction unit 207
Take out the new component added to the structured document in step 4,
Then, the document ID of the structured document to which the new component has been added is added to create an additional document that is a structured document in the XML format. The additional document created here is stored in the additional document storage unit 210.
【0298】検索要求分離部208は、拡張文書検索要
求入力部205で生成された拡張クエリからユーザタグ
を指定した検索条件を取り除いた通常のクエリと、追加
文書用のクエリとを生成する。[0298] The search request separating unit 208 generates a normal query obtained by removing the search condition designating the user tag from the expanded query generated by the expanded document search request input unit 205, and a query for an additional document.
【0299】追加文書検索部209は、追加文書用クエ
リに基づき、当該クエリに記述された検索条件を満たす
追加文書を追加文書記憶部210から検索する。The additional document search unit 209 searches the additional document storage unit 210 for an additional document that satisfies the search conditions described in the query based on the query for additional document.
【0300】文書合成部211は、追加文書用クエリを
実行して得られた追加文書と、通常のクエリを実行して
得られた構造化文書とを合成して、拡張文書を作成す
る。The document synthesizing unit 211 synthesizes the additional document obtained by executing the query for additional document and the structured document obtained by executing the ordinary query to create an extended document.
【0301】ここで、構造化文書管理システム100の
文書記憶部5に格納されている構造化文書データベース
は、現在、図56に示すような状態である場合を考え
る。Here, it is assumed that the structured document database stored in the document storage unit 5 of the structured document management system 100 is in a state as shown in FIG.
【0302】なお、図56に示した構造化文書データベ
ースの構造化文書の格納状態は、ノードやアークを簡略
化し、ノードをオブジェクトIDではなく要素名や属性
名で表して文書オブジェクトツリーの構造、しいてい
は、構造化文書データベースの構造を示している。The storage state of the structured document in the structured document database shown in FIG. 56 is such that nodes and arcs are simplified, and nodes are represented by element names and attribute names instead of object IDs. Mostly, it shows the structure of the structured document database.
【0303】図56において、「root」ノード以下
には、「特許DB」ノードがある。「特許DB」ノード
以下には、図57に示すような文書構造の複数の「特
許」情報が格納されている。In FIG. 56, there is a “patent DB” node below the “root” node. Under the “patent DB” node, a plurality of “patent” information having a document structure as shown in FIG. 57 is stored.
【0304】図57に示すように、「特許」情報は、
「特許」タグから始まる要素をルート(根)とし、その子
要素として「文書ID」「タイトル」、「出願人」、
「出願番号」、「要約」タグから始まる要素集合が存在
する。文書IDは、構造化文書データベースに格納され
ている全ての構造化文書のそれぞれを識別するための識
別情報であり、各構造化文書を構造化文書データベース
に格納する際に、追加される構成要素である。文書ID
は、システム100側で自動的に発番して追加する構成
要素であってもよい。As shown in FIG. 57, the “patent” information is
The element starting from the “patent” tag is the root, and its child elements are “document ID”, “title”, “applicant”,
There is a set of elements starting with the “application number” and “summary” tags. The document ID is identification information for identifying each of all the structured documents stored in the structured document database, and is added when each structured document is stored in the structured document database. It is. Document ID
May be a component automatically numbered and added by the system 100 side.
【0305】さて、図55に示した構成のクライアント
端末102の処理動作について、図76〜図77に示す
フローチャートに従って説明する。Now, the processing operation of the client terminal 102 having the configuration shown in FIG. 55 will be described with reference to the flowcharts shown in FIGS.
【0306】まず、図76に示すフローチャートに従っ
て、文書編集処理について説明する。First, the document editing process will be described with reference to the flowchart shown in FIG.
【0307】(ステップS201)ユーザタグ登録部2
01は、ユーザが、例えば、個人利用のための情報を、
構造化文書データベース上の構造化文書に追加するため
に用いる新たな構成要素の要素名(ユーザタグ名)と、
その要素のとりえる値の(範囲)とを登録するためのも
のである。(Step S201) User tag registration section 2
01 indicates that the user has, for example, information for personal use,
An element name (user tag name) of a new component used for adding to the structured document on the structured document database,
This is for registering the value (range) of the element.
【0308】ユーザタグ登録部201からは、クライア
ント端末102の表示装置に、例えば、図58に示すよ
うなユーザタグ登録画面が表示される。この画面上に、
所望の要素名(タグ名)と、その取り得る値(の範囲)
とを入力して、「登録」ボタンB101をマウス等でク
リックすることで、ユーザタグの登録が行える。The user tag registration section 201 displays a user tag registration screen as shown in FIG. 58 on the display device of the client terminal 102, for example. On this screen,
Desired element name (tag name) and its possible values (range)
Is input, and the "registration" button B101 is clicked with a mouse or the like, whereby the user tag can be registered.
【0309】図58では、1人のユーザにつき、3つま
でのユーザタグの登録が可能となっている。タグ名の入
力領域W101〜W103に所望のタグ名を入力し、そ
のそれぞれについて、そのとりえる値(の範囲)を入力
領域W104〜W106に入力する。例えば、図58で
は、「評価」というタグ名と、その取り得る値として、
「A」、「B」、「C」、「D」、「E」が入力され、
「処理形態」というタグ名には、その取り得る値とし
て、「公開まで」、「審査請求」、「外国出願」が入力
されている。In FIG. 58, up to three user tags can be registered for one user. Desired tag names are entered in the tag name input areas W101 to W103, and possible values (ranges) of the respective tag names are input to the input areas W104 to W106. For example, in FIG. 58, as a tag name “evaluation” and its possible values,
"A", "B", "C", "D", "E" are input,
In the tag name “processing form”, “until disclosure”, “request for examination”, and “foreign application” are input as possible values.
【0310】なお、各ユーザタグの登録領域には、それ
ぞれ「オプション」ボタンB102〜B104が設けら
れているが、これは、各ユーザタグの要素に子要素を設
定する場合に用いる。例えば、ユーザタグとして「閲覧
日」を登録したとする。この「閲覧日」要素の子要素と
して、「年」、「月」、「日」を登録したい場合には、
この「オプション」ボタンをクリックしてから、これら
を登録すればよい。[0310] In the registration area of each user tag, "option" buttons B102 to B104 are provided, respectively. This button is used when a child element is set as an element of each user tag. For example, it is assumed that “view date” is registered as a user tag. If you want to register "year", "month", and "day" as child elements of this "view date" element,
After clicking the "option" button, these may be registered.
【0311】さて、図58に示したユーザタグ登録画面
上に、所望のユーザタグと、その取り得る値(の範囲)
を入力した後、「登録」ボタンB101をクリックする
と、ユーザタグ記憶部206には、当該ユーザの識別情
報としてのユーザIDに対応付けて、図59に示したよ
うに、ユーザタグが登録される。Now, on the user tag registration screen shown in FIG. 58, a desired user tag and its possible value (range)
After clicking "Register" button B101, the user tag is registered in the user tag storage unit 206 in association with the user ID as the identification information of the user as shown in FIG. .
【0312】図59において、ユーザタグ記憶部206
には、ユーザIDに対応付けて、当該ユーザが登録した
ユーザタグ名と、その取り得る値(の範囲)とが記憶さ
れている。In FIG. 59, the user tag storage unit 206
Stores a user tag name registered by the user and a possible value (range thereof) in association with the user ID.
【0313】(ステップS202)図55の検索要求入
力部202は、構造化文書管理システム100に対す
る、ユーザタグの指定を含まない、通常の検索要求を行
うためのクエリを生成するためのものである。(Step S202) The search request input unit 202 in FIG. 55 is for generating a query for performing a normal search request to the structured document management system 100 without specifying a user tag. .
【0314】検索要求入力部202からは、クライアン
ト端末102の表示装置に、例えば、図60に示すよう
な検索画面が表示される。The search request input unit 202 displays a search screen as shown in FIG. 60 on the display device of the client terminal 102, for example.
【0315】図60に示した検索画面上の領域W111
には、構造化文書データベースの現在のツリー構造の要
素名(タグ名)がユーザが理解可能なように簡略的に表
示されてている。Area W111 on search screen shown in FIG. 60
, The element names (tag names) of the current tree structure of the structured document database are simply displayed so that the user can understand them.
【0316】領域W112〜W116は、検索対象の範
囲(ツリー構造上の検索範囲)や、検索条件などを入力
するための領域である。Areas W112 to W116 are areas for inputting a search target range (a search range in a tree structure), a search condition, and the like.
【0317】例えば、「「uix://root/特許
DB」以下に格納されている文書の中から、「出願人」
タグに「T社」という文字列を含む文書を検索せよ」と
いう検索要求の場合には、領域W111から「特許D
B」をマウス等で選択することにより、検索対象の範囲
と指定する構造化文書パスの入力領域W112に、「u
ix://root/特許DB」が入力する。また、検
索条件として、「「出願人」という要素の値に「T社」
という文字列を含む」という内容を設定するために、タ
グ名の入力領域W113に「出願人」、その値の入力領
域W114に「T社」を入力すればよい。例えば、タグ
名を入力する際には、その入力領域のリストボックスの
ボタンをクリックして、リストボックスを表示させ、そ
の中から所望のタグ名を選択するようにしてもよい。こ
の場合、リストボックスには、構造化文書データベース
に現在格納されている全ての構造化文書の各構成要素の
タグ名が表示される。For example, among the documents stored under “uiix: // root / patent DB”, “applicant”
In the case of a search request for searching for a document that includes a character string of "T company" in the tag, the "patent D"
By selecting "B" with a mouse or the like, "u" appears in the input area W112 of the structured document path to be specified as the search target range.
ix: // root / patent DB ". Also, as a search condition, the value of the element “Applicant”
In this case, “Applicant” may be input in the tag name input area W113 and “Company T” may be input in the value input area W114. For example, when inputting a tag name, a button of a list box in the input area may be clicked to display a list box, and a desired tag name may be selected from the list box. In this case, the list box displays the tag names of the components of all the structured documents currently stored in the structured document database.
【0318】その後、「検索実行」ボタンB111を選
択することにより、例えば、「「uix://root
/特許DB」以下に格納されている文書の中から、「出
願人」タグに「T社」という文字列を含む文書を検索せ
よ」という内容のクエリが構造化文書管理システム10
0へ送信される。このとき、当該クエリを構造化文書デ
ータベース上に格納するための追加コマンドとともに構
造化文書管理システムへ送信されてもよい。Thereafter, by selecting the “execute search” button B111, for example, “Uix: // root
/ Patent DB ", the structured document management system 10 executes a query with a content of" search for documents containing the character string "T company" in the "applicant" tag from among the documents stored under "patent DB".
Sent to 0. At this time, the query may be transmitted to the structured document management system together with an additional command for storing the query on the structured document database.
【0319】このようなクエリを受け取った構造化文書
管理システム100からは、当該クエリを実行して、そ
の検索結果をスタイルシートとともに、要求元のクライ
アント端末102へ送り返す。クライアント端末102
では、検索結果表示処理部203で上記検索結果として
のXML文書をスタイルシートを用いてHTMLデータ
に変換して、クライアント端末102の表示装置に表示
する。[0319] The structured document management system 100 that has received such a query executes the query and sends back the search result together with the style sheet to the requesting client terminal 102. Client terminal 102
Then, the search result display processing unit 203 converts the XML document as the search result into HTML data using a style sheet and displays it on the display device of the client terminal 102.
【0320】なお、検索結果表示処理部203で検索結
果を表示する際の処理には、構造化文書管理システム1
00から当該検索結果とともに送られてきたスタイルシ
ートを必ずしも用いる必要はない。予め定められたスタ
イルで、検索結果を表示するようにしてもよい。また、
後述するように、検索結果として拡張文書を表示する際
には、当該スタイルシートを拡張文書対応に変更して用
いるようにしてもよい。[0320] The processing for displaying the search result in the search result display processing unit 203 includes the structured document management system 1
It is not always necessary to use the style sheet sent together with the search result from 00. The search results may be displayed in a predetermined style. Also,
As will be described later, when displaying an extended document as a search result, the style sheet may be changed and used in correspondence with the extended document.
【0321】さて、上記クエリを実行した結果として、
クライアント端末102の表示装置には、図61に示す
ような、上記検索条件を満たす構造化文書の文書IDの
一覧が表示される。この一覧から、ユーザが所望の文書
ID、例えば「DOC100」を選択することにより、
当該文書IDの内容が、例えば、図62に示したように
表示される。Now, as a result of executing the above query,
On the display device of the client terminal 102, a list of document IDs of structured documents satisfying the above search condition is displayed as shown in FIG. By selecting a desired document ID, for example, “DOC100” from the list,
The contents of the document ID are displayed, for example, as shown in FIG.
【0322】図62では、文書ID「DOC100」の
「特許」情報をその各構成要素毎に、その要素名(タグ
名)に対応付けて表示している。In FIG. 62, the “patent” information of the document ID “DOC100” is displayed for each component in association with the element name (tag name).
【0323】(ステップS203)文書編集部204
は、構造化文書データベースから検索して得られた構造
化文書に対し、ユーザタグを用いて編集を行うためのも
のである。ここでいう編集とは、前述したように、構造
化文書にユーザタグにて囲まれた新たな構成要素を追加
することである。(Step S203) Document Editing Unit 204
Is for editing a structured document retrieved from a structured document database using a user tag. The editing here means adding a new component surrounded by a user tag to the structured document as described above.
【0324】新たな構成要素の(構造化文書における)
追加位置は、予め定められた固定位置とし、ここでは、
構造化文書の最後の構成要素としてこの新たな構成要素
を追加するものとする。New component (in structured documents)
The additional position is a predetermined fixed position.
This new component is added as the last component of the structured document.
【0325】例えば、図62に示した検索結果閲覧画面
上に表示されている構造化文書に対し、編集を行う場
合、当該画面上に設けられている「編集」ボタンB12
1をマウス等でクリックすればよい。すると、クライア
ント端末102の表示装置には、文書編集部204か
ら、図63に示すような文書編集画面が提供される。For example, when editing a structured document displayed on the search result browsing screen shown in FIG. 62, an "edit" button B12 provided on the screen is provided.
1 may be clicked with a mouse or the like. Then, a document editing screen as shown in FIG. 63 is provided from the document editing unit 204 to the display device of the client terminal 102.
【0326】図63に示した文書編集画面には、先の検
索結果閲覧画面に表示されていた文書ID「DOC10
0」の構造化文書の各構成要素の他に新たな構成要素を
追加するための入力領域W131〜W136が表示され
ている。ここでは、1人のユーザに3つまでのユーザタ
グの登録が許されているから、最高3つまでの新たな構
成要素が追加可能になっている。In the document editing screen shown in FIG. 63, the document ID “DOC10” displayed on the previous search result browsing screen is displayed.
Input areas W131 to W136 for adding new components in addition to the components of the structured document “0” are displayed. Here, since one user can register up to three user tags, up to three new components can be added.
【0327】ユーザは、図63の文書編集画面上で、当
該構造化文書に、ユーザタグ名が「評価」の構成要素を
追加する場合、まず、入力領域W131に「評価」を入
力し、入力領域W132に、その値として、例えば、
「A」を入力すればよい。When adding a component having the user tag name “Evaluation” to the structured document on the document editing screen of FIG. 63, the user first inputs “Evaluation” in the input area W131, and inputs the evaluation. In the area W132, as the value, for example,
What is necessary is just to input "A".
【0328】この場合も、タグ名を入力するときは、入
力領域W131に設けられているリストボックスのボタ
ンをクリックして、図64(a)に示すような、当該ユ
ーザが登録したユーザタグ名を一覧表示したリストボッ
クスを表示させ、その中から所望のタグ名を選択するよ
うにしてもよい。この場合、リストボックスには、ユー
ザタグ記憶部206から当該ユーザのユーザIDに対応
つけられて記憶されたユーザタグ名が読み出されて表示
される。Also in this case, when inputting the tag name, the user clicks the button of the list box provided in the input area W131, and enters the user tag name registered by the user as shown in FIG. May be displayed, and a desired tag name may be selected from the list box. In this case, a user tag name stored in association with the user ID of the user is read from the user tag storage unit 206 and displayed in the list box.
【0329】同様にして、要素値を入力する際も、入力
領域W132に設けられているリストボックスのボタン
をクリックして、図64(b)に示すような、当該ユー
ザが登録した当該タグ名の要素値を一覧表示したリスト
ボックスを表示させ、その中から所望の要素値を選択す
るようにしてもよい。この場合、リストボックスには、
ユーザタグ記憶部206から当該ユーザのユーザIDに
対応つけられて記憶されたユーザタグ名対応の要素値が
読み出されて表示される。Similarly, when inputting the element value, the user clicks the button of the list box provided in the input area W132 to display the tag name registered by the user as shown in FIG. May be displayed in a list box in which the element values are displayed in a list, and a desired element value may be selected from the list box. In this case, the list box contains
An element value corresponding to the user tag name stored in association with the user ID of the user is read from the user tag storage unit 206 and displayed.
【0330】図63に示したように、文書編集画面上
で、当該構造化文書に、ユーザタグ名が「評価」の構成
要素の入力を行った後、「編集完了」ボタンB131を
マウス等でクリックすることにより、当該構造化文書の
編集が終了する。As shown in FIG. 63, after inputting the component having the user tag name “Evaluation” into the structured document on the document editing screen, the “Edit Complete” button B131 is clicked with a mouse or the like. By clicking, the editing of the structured document ends.
【0331】(ステップS204)「編集完了」ボタン
B131がクリックされると、図55の追加文書抽出部
207は、文書編集画面上で追加された新たな構成要素
から追加文書を抽出する。(Step S204) When the “edit completed” button B131 is clicked, the additional document extraction unit 207 in FIG. 55 extracts an additional document from new components added on the document edit screen.
【0332】すなわち、追加文書抽出部207は、追加
された新たな構成要素(例えば、ここでは、<評価>A
</評価>)を取出し、それに、この新たな構成要素の
追加された構造化文書の文書ID(例えば、ここでは、
<文書ID>DOC100</文書ID>)を加えて、
図65に示したようなXML形式の追加文書を作成す
る。That is, the additional document extracting unit 207 adds the new component (for example, <evaluation> A
</ Evaluation>) and the document ID of the structured document to which this new component has been added (for example, here,
<Document ID> DOC100 </ document ID>)
An additional document in an XML format as shown in FIG. 65 is created.
【0333】(ステップS205)図65に示したよう
な追加文書は、追加文書記憶部210に記憶される。(Step S205) The additional document as shown in FIG. 65 is stored in the additional document storage unit 210.
【0334】追加文書記憶部210には、各追加文書
が、図66に示すように、各ユーザ毎に追加文書の論理
構造に基づくツリー構造状に格納されている。この追加
文書記憶部210における追加文書を記憶するためのデ
ータ構造は、構造化文書管理システム100の構造化文
書データベースと同様であってもよい。As shown in FIG. 66, the additional document storage unit 210 stores each additional document in a tree structure based on the logical structure of the additional document for each user. The data structure for storing the additional document in the additional document storage unit 210 may be the same as the structured document database of the structured document management system 100.
【0335】なお、本発明では、追加文書を記憶する際
のデータ構造は特に限定するものではないので、上記し
たように、追加文書をXML形式の構造化文書として記
憶する以外に、例えば、新たな構成要素であるユーザタ
グ名と、その値とを、当該新たな構成要素の追加される
構造化文書の文書IDや、ユーザIDとともに、テーブ
ル形式記憶するようにしてもよい。要は、追加文書記憶
部210では、少なくとも、新たな構成要素を、その所
有者であるユーザと、当該新たな構成要素の追加される
構造化文書とに対応つけて記憶するようになっていれば
よい。ただし、検索の効率を考慮すると、本実施形態の
ように、XML形式の構造化文書として、構造化文書管
理システム100の構造化文書データベースと同様なデ
ータ構造にて記憶することが望ましい。In the present invention, since the data structure for storing the additional document is not particularly limited, for example, in addition to storing the additional document as a structured document in the XML format, The user tag name and its value, which are important components, may be stored in a table format together with the document ID and user ID of the structured document to which the new component is added. The point is that the additional document storage unit 210 stores at least a new component in association with the user who owns the new component and the structured document to which the new component is added. I just need. However, in consideration of the search efficiency, it is desirable to store the structured document in the XML format in the same data structure as the structured document database of the structured document management system 100 as in the present embodiment.
【0336】例えば、図66に示すような追加文書記憶
部210のデータ構造において、ユーザID「abc」
のユーザ対応の追加文書の格納領域の構造化文書パスは
「uix://root/ユーザabc」となる。図6
5に示した追加文書は、図66では、構造化文書パス
「uix://root/ユーザabc/追加文書
[2]」と表すことのできる格納領域に格納されてい
る。For example, in the data structure of the additional document storage unit 210 as shown in FIG. 66, the user ID “abc”
The structured document path of the storage area of the additional document corresponding to the user is “uix: // root / userabc”. FIG.
In FIG. 66, the additional document shown in FIG. 5 is stored in a storage area that can be expressed as a structured document path “ux: // root / userabc / additional-document [2]”.
【0337】次に、図77に示すフローチャートに従っ
て、図55のクライアント端末102の拡張文書の検索
処理動作について説明する。Next, the operation of the client terminal 102 shown in FIG. 55 for searching for an extended document will be described with reference to the flowchart shown in FIG. 77.
【0338】(ステップS211)図55の拡張文書検
索要求入力部205は、以上のようにして、構造化文書
データベースから検索された構造化文書に新たな構成要
素を追加した結果である拡張文書の検索を行うためのも
のである。(Step S211) The extended document search request input unit 205 shown in FIG. 55 executes the processing of the extended document as a result of adding a new component to the structured document retrieved from the structured document database as described above. It is for searching.
【0339】この拡張文書の検索を行うための検索画面
は、例えば、検索要求入力部202から提供される図6
0に示したような検索画面上に設けられた「拡張文書検
索」ボタンB113がマウス等でクリックされたとき、
拡張文書検索要求入力部205から提供される。A search screen for searching for an extended document is provided, for example, by the search request input unit 202 shown in FIG.
When the "extended document search" button B113 provided on the search screen as shown in FIG.
It is provided from the extended document search request input unit 205.
【0340】拡張文書要求入力部205からは、クライ
アント端末102の表示装置に、例えば、図67に示す
ような拡張文書検索画面が表示される。The extended document request input unit 205 displays an extended document search screen as shown in FIG. 67 on the display device of the client terminal 102, for example.
【0341】図67に示す拡張文書検索画面には、図6
0に示した検索画面のように、構造化文書データベース
に基づく検索対象の範囲(ツリー構造上の検索範囲)
や、検索条件などを入力するための領域W142〜W1
46以外に、ユーザタグを指定した検索条件を入力する
ため領域W147〜W152が設けられている。The extended document search screen shown in FIG.
Like the search screen shown in FIG. 0, the search target range based on the structured document database (search range on the tree structure)
And areas W142 to W1 for inputting search conditions and the like
In addition to 46, areas W147 to W152 are provided for inputting search conditions specifying a user tag.
【0342】図67に示した拡張文書検索画面上の領域
W141には、構造化文書データベースの現在のツリー
構造の要素名(タグ名)がユーザが理解可能なように簡
略的に表示されてている。In the area W141 on the extended document search screen shown in FIG. 67, the element names (tag names) of the current tree structure of the structured document database are simply displayed so that the user can understand them. I have.
【0343】領域W142〜W152は、検索対象の範
囲(ツリー構造上の検索範囲)や、検索条件などを入力
するための領域である。The areas W142 to W152 are areas for inputting a search target range (search range in a tree structure), a search condition, and the like.
【0344】例えば、「「uix://root/特許
DB」以下に格納されている文書の中から、「出願人」
タグに「T社」という文字列を含み、かつ、「評価」タ
グに「A」という文字列を含む文書を検索せよ」という
検索要求の場合には、領域W141から「特許DB」を
マウス等で選択することにより、検索対象の範囲と指定
する構造化文書パスの入力領域W142に、「uix:
//root/特許DB」が入力する。For example, among the documents stored under “ux: // root / patent DB”, “applicant”
In the case of a search request to search for a document that includes the character string “Company T” in the tag and also includes the character string “A” in the “Evaluation” tag ”, the“ patent DB ”is moved from the area W141 to the mouse or the like. In the input area W142 of the structured document path to be designated as the search target range, "uix:
// root / patent DB ".
【0345】また、検索条件として、「「出願人」とい
う要素の値に「T社」という文字列を含む」という内容
を設定するために、タグ名の入力領域W143に「出願
人」、その値の入力領域W144に「T社」を入力すれ
ばよい。例えば、タグ名を入力する際には、その入力領
域のリストボックスのボタンをクリックして、リストボ
ックスを表示させ、その中から所望のタグ名を選択する
ようにしてもよい。この場合、リストボックスには、構
造化文書データベースに現在格納されている全ての構造
化文書の各構成要素のタグ名が表示される。Also, in order to set the content of “the value of the element“ applicant ”includes the character string“ T company ”” as a search condition, “applicant” is entered in the tag name input area W143. What is necessary is just to input "T company" in the value input area W144. For example, when inputting a tag name, a button of a list box in the input area may be clicked to display a list box, and a desired tag name may be selected from the list box. In this case, the list box displays the tag names of the components of all the structured documents currently stored in the structured document database.
【0346】また、検索条件として、「ユーザタグ名
「評価」という要素の値に「A」という文字列を含む」
という内容を設定するために、ユーザタグ名の入力領域
W147に「評価」、その値の入力領域W148に
「A」を入力すればよい。例えば、ユーザタグ名を入力
する際には、その入力領域のリストボックスのボタンを
クリックして、図64(a)に示すような、当該ユーザ
が登録したユーザタグ名を一覧表示したリストボックス
を表示させ、その中から所望のタグ名を選択するように
してもよい。この場合、リストボックスには、ユーザタ
グ記憶部206から当該ユーザのユーザIDに対応つけ
られて記憶されたユーザタグ名が読み出されて表示され
る。As a search condition, “the value of the element“ user tag name “evaluation” includes the character string “A” ””
What is necessary is to input “evaluation” in the user tag name input area W147 and “A” in the value input area W148 in order to set the content. For example, when inputting a user tag name, the user clicks a button in the list box in the input area to display a list box in which the user tag names registered by the user are displayed as shown in FIG. You may make it display and select a desired tag name from it. In this case, a user tag name stored in association with the user ID of the user is read from the user tag storage unit 206 and displayed in the list box.
【0347】同様にして、要素値を入力する際も、入力
領域W147に設けられているリストボックスのボタン
をクリックして、図64(b)に示すような、当該ユー
ザが登録した当該タグ名の要素値を一覧表示したリスト
ボックスを表示させ、その中から所望の要素値を選択す
るようにしてもよい。この場合、リストボックスには、
ユーザタグ記憶部206から当該ユーザのユーザIDに
対応つけられて記憶されたユーザタグ名対応の要素値が
読み出されて表示される。Similarly, when inputting the element value, the user clicks the button of the list box provided in the input area W147 to display the tag name registered by the user as shown in FIG. May be displayed in a list box in which the element values are displayed in a list, and a desired element value may be selected from the list box. In this case, the list box contains
An element value corresponding to the user tag name stored in association with the user ID of the user is read from the user tag storage unit 206 and displayed.
【0348】(ステップS212)その後、「検索実
行」ボタンB141を選択することにより、例えば、図
68に示すような、「「uix://root/特許D
B」以下に格納されている文書の中から、「出願人」タ
グに「T社」という文字列を含み、かつ、「評価」タグ
に「A」という文字列を含む文書を検索せよ」という内
容のユーザタグを指定した検索条件を含むクエリ(ここ
では、これを通常のクエリと区別するために拡張クエリ
と呼ぶ)が生成される。(Step S212) Thereafter, by selecting the “execute search” button B141, for example, as shown in FIG. 68, “Uix: // root / Patent D
B. Search for documents that contain the character string "T company" in the "Applicant" tag and the character string "A" in the "Evaluation" tag from the documents stored under "B". A query including a search condition specifying the user tag of the content (here, called an extended query to distinguish it from a normal query) is generated.
【0349】なお、拡張クエリは、ユーザタグを指定し
た検索条件の記述を含み以外は、通常のクエリと同様で
ある。Note that the extended query is the same as a normal query except that it includes a description of a search condition specifying a user tag.
【0350】(ステップS213)図68に示したクエ
リには、10行目と15行目に、ユーザタグを指定した
検索条件が含まれているので、このままでは、構造化文
書管理システムへは送ることができない。(Step S213) Since the query shown in FIG. 68 contains the search condition specifying the user tag in the 10th and 15th lines, the query is sent to the structured document management system as it is. Can not do.
【0351】そこで、図55の検索要求分離部208
は、拡張文書検索要求入力部205で生成された、例え
ば、図68に示したような拡張クエリからユーザタグを
指定した検索条件を取り除いた通常のクエリと、追加文
書用のクエリをとを生成する。Therefore, the search request separating unit 208 shown in FIG.
Generates, for example, a normal query in which a search condition specifying a user tag is removed from the extended query shown in FIG. 68 and a query for an additional document, which are generated by the extended document search request input unit 205, for example. I do.
【0352】拡張クエリから通常のクエリを生成するた
めには、単純に、当該ユーザタグを指定した検索条件の
記述を削除すればよい。In order to generate a normal query from the extended query, the description of the search condition specifying the user tag may be simply deleted.
【0353】例えば、図68に示した拡張クエリの記述
のうち、10行目と15行目を削除すれば、図69に示
したような、構造化文書管理システム100へ送出する
ための通常のクエリを生成することができる。For example, if the 10th and 15th lines are deleted from the description of the extended query shown in FIG. 68, an ordinary query for sending to the structured document management system 100 as shown in FIG. Queries can be generated.
【0354】一方、追加文書用のクエリを生成するため
に、検索要求分離部208は、数種類のクエリのテンプ
レートを予め記憶しているものとする。On the other hand, in order to generate a query for an additional document, it is assumed that search request separating section 208 previously stores templates of several types of queries.
【0355】例えば、図68に示したクエリは、「「u
ix://root/特許DB」以下に格納されている
文書の中から、「出願人」タグに「T社」という文字列
を含み、かつ、「評価」タグに「A」という文字列を含
む文書を検索せよ」という内容のものであったが、クエ
リは、一般的に、検索対象の範囲(上記クエリの場合、
「uix://root/特許DB」)と、構造化文書
の構成要素(上記クエリの場合、「出願人」と「評
価」)とその値(上記クエリの場合、「T社」と
「A」)とを指定した少なくとも1つの検索条件(上記
クエリの場合、2つの検索条件がある)の記述から構成
されている。For example, the query shown in FIG.
ix: / root / patent DB ”, the“ applicant ”tag contains the character string“ T company ”, and the“ evaluation ”tag contains the character string“ A ”. Search for documents that contain ", but the query is generally limited to the scope of the search (in the case of the above query,
“Ux: // root / patent DB”), the components of the structured document (“applicant” and “evaluation” in the case of the above query) and their values (“T company” and “A” in the above query) )) (In the case of the above query, there are two search conditions).
【0356】そこで、図70に示すような、追加文書用
クエリのテンプレートを予め作成しておく。図70に示
した追加用文書用クエリのテンプレートは、クエリの記
述のうち検索対象の範囲を記述する部分(t1)と、検
索条件としての構成要素を記述する部分(t2,t
3)、構成要素の値を記述する部分(t4,t5)に、
拡張クエリを介してユーザにより指定された検索対象の
範囲と、検索条件としての構成要素とその値とを代入す
れば、即、クエリとして実際に実行可能となるものであ
る。Therefore, a template for an additional document query as shown in FIG. 70 is created in advance. The template of the query for additional document shown in FIG. 70 includes a part (t1) describing the range of the search target in the description of the query and a part (t2, t) describing the component as the search condition.
3) In the part (t4, t5) that describes the value of the component,
By substituting the range of the search target specified by the user via the extended query and the components and their values as the search condition, the query can be actually executed immediately.
【0357】図70に示した追加文書用クエリのテンプ
レートは、検索条件が2つある場合のテンプレートであ
るが、検索条件の数に応じて複数のテンプレートを予め
用意するようにしてもよい。The template for the additional document query shown in FIG. 70 is a template when there are two search conditions, but a plurality of templates may be prepared in advance according to the number of search conditions.
【0358】例えば、図68に示した拡張クエリの場
合、ユーザタグを指定した検索条件は1つのみであるの
で、検索要求分離部208は図71に示すような検索条
件が1つの追加文書用クエリのテンプレートを用いる。For example, in the case of the extended query shown in FIG. 68, since there is only one search condition specifying the user tag, the search request separating unit 208 sets the search condition as shown in FIG. Use a query template.
【0359】図71のテンプレート中、検索対象の範囲
を記述する部分t1には、検索要求を行ったユーザ(例
えばユーザIDが「abc」であるユーザ)対応に予め
定められた追加文書記憶部210の追加文書の格納場所
を指定するための「「uix://root/ユーザa
bc」が代入される。また、検索条件としての構成要素
を記述する部分t2には、図68の拡張クエリ中にある
ユーザタグのタグ名、すなわち、「評価」が代入され
る。さらに、当該構成要素の値を記述する部分t4に
は、図68の拡張クエリ中にあるユーザタグ「評価」に
対し指定された値「A」が代入される。In the template of FIG. 71, a portion t1 describing the range of the search target includes an additional document storage unit 210 predetermined for the user who made the search request (for example, the user whose user ID is "abc"). "Uix: // root / user a" to specify the storage location of the additional document
bc ”is assigned. Also, the tag name of the user tag in the extended query of FIG. 68, that is, “evaluation” is substituted into the portion t2 describing the component as the search condition. Further, the value “A” specified for the user tag “evaluation” in the extended query in FIG. 68 is substituted into the part t4 describing the value of the component.
【0360】その結果、図72に示すような追加文書用
クエリが生成される。As a result, an additional document query as shown in FIG. 72 is generated.
【0361】図72に示した追加文書用クエリは、
「「uix://root/ユーザabc」以下に格納
されている追加文書の中から、「評価」タグに「A」と
いう文字列を含む文書を検索せよ」という内容のもので
ある。The additional document query shown in FIG. 72 is
The content is that "search for documents containing the character string" A "in the" evaluation "tag from the additional documents stored under" ux: // root / user abc "."
【0362】(ステップS214)例えば、図68に示
したような拡張クエリから生成された図69に示したよ
うな通常のクエリは、構造化文書管理システムへ送信さ
れ、当該クエリに基づき、図43に示したようにして、
構造化文書データベースに対し検索が実行される。(Step S214) For example, a normal query as shown in FIG. 69 generated from the extended query as shown in FIG. 68 is transmitted to the structured document management system, and based on the query, a normal query as shown in FIG. As shown in
A search is performed on the structured document database.
【0363】(ステップS215)一方、図68に示し
たような拡張クエリから生成された図72に示したよう
な追加文書用クエリは、図55の追加文書検索部209
へ渡される。(Step S215) On the other hand, the additional document query as shown in FIG. 72 generated from the extended query as shown in FIG.
Passed to
【0364】図55の追加文書検索部209は、受け取
った図72に示したような追加文書用クエリに基づき、
当該クエリに記述された検索条件を満たす追加文書を追
加文書記憶部210から検索する。The additional document search unit 209 in FIG. 55 receives the additional document query as shown in FIG.
The additional document storage unit 210 is searched for an additional document that satisfies the search condition described in the query.
【0365】追加文書検索部209では、追加文書を図
66に示したようなデータ構造にて格納している。そこ
で、追加文書検索部209は、追加文書用クエリで、検
索対象の範囲として指定された構造化文書パス(例え
ば、図72のクエリの場合「uix://root/ユ
ーザabc」)で表される論理的な格納領域に格納され
ている追加文書の中から、「評価」タグに「A」という
文字列を含む追加文書を検索する。The additional document search unit 209 stores the additional document in a data structure as shown in FIG. Therefore, the additional document search unit 209 uses the structured document path specified as the search target range in the additional document query (for example, “ux: // root / user abc” in the case of the query in FIG. 72). From the additional documents stored in the logical storage area, an additional document including the character string "A" in the "evaluation" tag is searched.
【0366】(ステップS216、S217)さて、図
55の文書合成部211では、構造化文書管理システム
100で、例えば、図69に示したような通常のクエリ
を実行して得られた検索結果を受け取るとともに、追加
文書検索部209で、例えば図72に示したような追加
文書用クエリを実行して得られた検索結果を受け取る。(Steps S216 and S217) The document synthesizing unit 211 shown in FIG. 55 uses the structured document management system 100 to execute, for example, a search result obtained by executing a normal query as shown in FIG. 69. At the same time, the additional document search unit 209 receives a search result obtained by executing an additional document query as shown in FIG. 72, for example.
【0367】例えば、図72に示したような追加文書用
クエリを実行して得られた検索結果として、図65に示
した追加文書が得られ、図69に示したような通常のク
エリを実行して得られた検索結果として、図57に示し
たような構造化文書が得られたとする。For example, as a search result obtained by executing a query for an additional document as shown in FIG. 72, an additional document as shown in FIG. 65 is obtained, and a normal query as shown in FIG. 69 is executed. It is assumed that a structured document as shown in FIG. 57 is obtained as a search result obtained as a result.
【0368】(ステップS218〜ステップS219)
文書合成部211は、当該追加文書と、当該構造化文書
の構成要素として含まれている「文書ID」を取出す。
この場合、両者の「文書ID」の値が同じ「DOC10
0」であるので、図57の構造化文書の最後の構成要素
として、図65の追加文書にあるユーザタグ「評価」の
構成要素「<評価>a</評価>」を追加・合成し、図
73に示すようなXML文書である拡張文書を作成す
る。(Steps S218 to S219)
The document synthesizing unit 211 extracts the additional document and the “document ID” included as a component of the structured document.
In this case, the value of the “document ID” is the same “DOC10
Since it is "0", the component "<evaluation> a </ evaluation>" of the user tag "evaluation" in the additional document of FIG. 65 is added and synthesized as the last component of the structured document of FIG. An extended document which is an XML document as shown in FIG. 73 is created.
【0369】なお、拡張文書を作成する際の、新たな構
成要素の(構造化文書における)追加位置は、編集時の
場合と同様で、予め定められた固定位置とし、ここで
は、構造化文書の最後の構成要素としてこの新たな構成
要素を追加するものとする。なお、新たな構成要素の追
加位置を上記したように「最後」とする場合に限らず、
先頭、すなわち、最初の構成要素として追加するように
してもよいし、場合によっては、上から2番目、3番
目、…の構成要素として、構造化文書の中間に追加する
ようにしてもよい。本発明においては、新たな構成要素
の追加位置を特に限定するものではないが、好ましく
は、本実施形態のように、最後の構成要素として、構造
化文書の最後に追加することが望ましい。[0369] Note that, when an extended document is created, the new component (in the structured document) is added at a predetermined fixed position in the same manner as in the case of editing. This new component is added as the last component of. It should be noted that the addition position of the new component is not limited to the “last” as described above,
.. May be added as the first component, that is, the first component, or in some cases, the second, third,... In the present invention, the position at which a new component is added is not particularly limited, but it is preferable to add the last component to the end of the structured document as the last component as in the present embodiment.
【0370】文書ID「DOC108」の構造化文書に
も、それに対応の追加文書が検索されたとすると、上記
同様にして、拡張文書を作成する。If an additional document corresponding to the structured document having the document ID "DOC108" is found, an extended document is created in the same manner as described above.
【0371】このようようにして作成された拡張文書群
が、例えば図68に示したような拡張クエリの実行結果
である検索結果として、検索結果表示処理部203へ渡
される。The extended document group created in this way is passed to the search result display processing unit 203 as a search result as an execution result of the extended query as shown in FIG. 68, for example.
【0372】(ステップS220)検索結果表示処理部
203では、まず、拡張文書の文書IDの一覧を、例え
ば、図74に示すような検索結果一覧画面上に表示す
る。この検索結果一覧画面には、拡張文書の文書IDと
して、例えば、「DOC100」と「DOC108」が
表示されている。この中から、ユーザが、例えば、「D
OC100」をマウス等でクリックして選択することに
より、当該文書IDの拡張文書の内容が図75に示した
ように表示される。(Step S220) The search result display processing section 203 first displays a list of document IDs of extended documents on a search result list screen as shown in FIG. 74, for example. On the search result list screen, for example, “DOC100” and “DOC108” are displayed as the document IDs of the extended documents. From among these, the user, for example, "D
By clicking and selecting "OC100" with a mouse or the like, the contents of the extended document of the document ID are displayed as shown in FIG.
【0373】図75に示した検索結果閲覧画面には、文
書ID「DOC100」の「特許」情報の拡張文書の内
容が、その各構成要素毎に、その要素名(タグ名)に対
応付けて表示している。この場合、ユーザタグ「評価」
の構成要素も表示されている。すなわち、文書編集部2
04での編集結果が反映されて表示されている。On the search result browsing screen shown in FIG. 75, the content of the extended document of the “patent” information of the document ID “DOC100” is associated with the element name (tag name) for each component. it's shown. In this case, the user tag "Evaluation"
Are also displayed. That is, the document editing unit 2
04 is displayed reflecting the editing result.
【0374】以上の説明は、クライアント端末102が
上記全ての構造化文書編集機能をもつ場合であるが、こ
の場合に限らず、例えば、図78に示すように、クライ
アント端末102,構造化文書管理システム100と互
いに通信可能なように所定のネットワークに接続された
構造化文書編集装置301を設け、この構造化文書編集
装置301に、図55のクライアント端末102の持つ
機能の一部を持たせるようにしてもよい。In the above description, the client terminal 102 has all of the above structured document editing functions. However, the present invention is not limited to this case. For example, as shown in FIG. A structured document editing device 301 connected to a predetermined network so as to be able to communicate with the system 100 is provided, and this structured document editing device 301 is provided with some of the functions of the client terminal 102 in FIG. It may be.
【0375】この場合のクライアント端末102と、構
造化文書編集装置310の構成を図79に示す。なお、
図55と同一部分には同一符号を付し、異なる部分につ
いて説明する。すなわち、クライアント端末102は、
ユーザタグ登録部201、検索要求入力部202,検索
結果表示処理部203,文書編集部204,拡張文書検
索要求入力部205を有し、構造化文書編集装置301
は、記憶部206,追加文書抽出部207,検索要求分
離部208,追加文書検索部209,追加宇文書記憶部
210,文書合成部211を有している。FIG. 79 shows the configuration of the client terminal 102 and the structured document editing device 310 in this case. In addition,
55 are given the same reference numerals, and different parts will be described. That is, the client terminal 102
The structured document editing apparatus 301 includes a user tag registration unit 201, a search request input unit 202, a search result display processing unit 203, a document editing unit 204, and an extended document search request input unit 205.
Has a storage unit 206, an additional document extraction unit 207, a search request separation unit 208, an additional document search unit 209, an additional document storage unit 210, and a document synthesis unit 211.
【0376】各クライアント端末102には、データの
入力や表示のための機能部だけを持たせ、構造化文書編
集装置301には、複数のユーザで共有可能な機能部を
持たせ、各クライアント端末102から送られてきたク
エリ(通常のクエリ、拡張クエリ)に対する処理やユー
ザタグなどの処理をしたり、構造化文書管理システムか
らの検索結果を処理したり等する。Each client terminal 102 has only a functional unit for inputting and displaying data, and the structured document editing apparatus 301 has a functional unit that can be shared by a plurality of users. It processes the query (normal query, extended query) sent from the server 102, processes a user tag, and processes a search result from the structured document management system.
【0377】このような構成により、クライアント端末
102のユーザタグ登録部201,検索要求入力部20
2,文書編集部204,拡張文書検索要求入力部205
を用いて、ユーザタグの登録や、検索要求を行う際に
は、必ず、構造化文書編集装置301を経由するように
なっている。With such a configuration, the user tag registration unit 201 and the search request input unit 20 of the client terminal 102
2. Document editing unit 204, extended document search request input unit 205
When a user tag is registered or a search request is made by using the structured document editing apparatus 301, the user tag is always sent.
【0378】図55に示した構成では、ユーザタグ記憶
部206や、追加文書記憶部210には、1人のユーザ
のみのユーザタグや、追加文書が格納されていればよか
った。しかし、図79に示した構造化文書編集装置30
1は、複数のユーザで共有されるため、ユーザタグ記憶
部206や、追加文書記憶部210には、必ず、複数の
ユーザのユーザタグや追加文書が格納されている。ま
た、クライアント端末102からの各種コマンドメッセ
ージなどから各ユーザを識別するためのユーザIDを取
り出してから、これらユーザタグ記憶部206、追加文
書記憶部210にアクセスする必要がある。In the configuration shown in FIG. 55, the user tag storage unit 206 and the additional document storage unit 210 need only store a user tag of only one user and an additional document. However, the structured document editing device 30 shown in FIG.
Since 1 is shared by a plurality of users, the user tag storage unit 206 and the additional document storage unit 210 always store user tags and additional documents of a plurality of users. Further, it is necessary to extract a user ID for identifying each user from various command messages from the client terminal 102 or the like, and then access the user tag storage unit 206 and the additional document storage unit 210.
【0379】その他、構造化文書編集装置301の持つ
各機能部の処理動作は、前述同様である。The processing operations of the respective functional units of the structured document editing apparatus 301 are the same as those described above.
【0380】以上説明したように、上記実施形態によれ
ば、構造化文書管理システム100およびWWWサーバ
101の構成は一切変更することなく、しかも、構造化
文書データベースに対しては何ら操作を行う必要なく、
書き換えが許可されていない構造化文書データべース上
の構造化文書への編集(加工)と、その編集した結果を
含めた構造化文書の検索が容易に行える。As described above, according to the above embodiment, the structure of the structured document management system 100 and the WWW server 101 need not be changed at all, and no operation is required for the structured document database. Not
It is possible to easily edit (process) a structured document on a structured document database for which rewriting is not permitted and search for a structured document including the edited result.
【0381】また、構造化文書データベースに対しては
何ら操作を行っていないにもかかわらず、ユーザから
は、構造化文書データベースに格納されていた構造化文
書を直接加工したかのごとく、編集した内容のまま、構
造化文書の検索、表示が可能となる。[0381] Even though no operation was performed on the structured document database, the user edited the structured document stored in the structured document database as if it were directly processed. The structured document can be searched and displayed as it is.
【0382】単なるメモを構造化文書に付加するのとは
異なり、構造化文書に新たな構成要素を追加するという
形態で構造化文書の編集が行えるので、個人的な利用目
的で利用する各種情報(例えば、評価、日報における
(案件処理の)緊急度、人事データにおける重要人物度
など)や、複数の特定のユーザからなるユーザグループ
内では共有したいが、それ以外のユーザには秘密にして
おきたい情報などをユーザタグを用いて書き込むことに
より、一般公開されている情報(構造化文書データベー
スに格納されている構造化文書)を用いて限定された範
囲内のユーザにのみ(個人的な利用を含む)公開可能な
情報(拡張文書)を作成することが容易に行える。Unlike adding a simple memo to a structured document, the structured document can be edited in the form of adding a new component to the structured document, so that various types of information used for personal use purposes can be edited. (For example, urgency in evaluation, daily report (of matter processing), important person in personnel data, etc.) or within a user group consisting of multiple specific users, but keep it secret to other users By writing desired information using a user tag, only users within a limited range using publicly available information (structured documents stored in a structured document database) (personal use) Can be easily created (including extended documents).
【0383】また、ユーザタグを用いて、1つの構造化
文書内で、一般公開可能な情報と限定された範囲内のユ
ーザのみに公開可能な情報とを混在させることもでき
る。[0383] Further, using a user tag, information that can be made publicly available and information that can be made open only to users within a limited range can be mixed in one structured document.
【0384】なお、上記実施形態では、構造化文書デー
タベースに格納されている構造化文書には、全て、文書
IDが与えられていることを前提に、この文書IDを用
いて、追加文書をその追加先の構造化文書に対応付ける
ようになっているが、この場合に限らず、ポインタを用
いて対応付けることも可能である。In the above embodiment, it is assumed that a document ID is given to all structured documents stored in the structured document database, and an additional document is used by using this document ID. The association is made with the structured document at the addition destination. However, the invention is not limited to this case, and the association can be made using a pointer.
【0385】この場合は、各構造化文書が文書IDを持
つ必要がない(すなわち、各構造化文書には「文書I
D」タグが存在しない)。例えば、(新たな構成要素を
追加する編集操作が行われた)各構造化文書毎に、当該
構造化文書の編集操作を行ったユーザID対応の2種類
のポインタを登録したテーブルを持たせておく。このテ
ーブルは、例えば、追加文書記憶部210に格納されて
いてもよい。一方のポインタ値として、例えば、当該構
造化文書の構造化文書パスを格納し、他方のポインタ値
として、追加文書記憶部210に記憶されている追加文
書の格納領域へのポインタ値を格納すればよい。In this case, it is not necessary for each structured document to have a document ID (that is, each structured document has “Document I
D "tag is not present). For example, for each structured document (in which an editing operation for adding a new component is performed), a table in which two types of pointers corresponding to the user ID of the editing operation of the structured document are registered is provided. deep. This table may be stored in the additional document storage unit 210, for example. As one pointer value, for example, the structured document path of the structured document is stored, and as the other pointer value, a pointer value to the storage area of the additional document stored in the additional document storage unit 210 is stored. Good.
【0386】なお、本発明の実施の形態に記載した本発
明の手法は、コンピュータに実行させることのできるプ
ログラムとして、磁気ディスク(フロッピー(登録商
標)ディスク、ハードディスクなど)、光ディスク(C
D−ROM、DVDなど)、半導体メモリなどの記録媒
体に格納して頒布することもできる。The method of the present invention described in the embodiment of the present invention can be implemented as a program that can be executed by a computer, such as a magnetic disk (floppy (registered trademark) disk, hard disk, etc.), an optical disk (C
D-ROMs, DVDs, etc.) and storage media such as semiconductor memories for distribution.
【0387】なお、本発明は、上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。さらに、上記実
施形態には種々の段階の発明は含まれており、開示され
る複数の構成用件における適宜な組み合わせにより、種
々の発明が抽出され得る。例えば、実施形態に示される
全構成要件から幾つかの構成要件が削除されても、発明
が解決しようとする課題の欄で述べた課題(の少なくと
も1つ)が解決でき、発明の効果の欄で述べられている
効果(のなくとも1つ)が得られる場合には、この構成
要件が削除された構成が発明として抽出され得る。[0387] The present invention is not limited to the above-described embodiment, and can be variously modified at the stage of implementation without departing from the scope of the invention. Furthermore, the above embodiments include inventions at various stages, and various inventions can be extracted by appropriate combinations of a plurality of disclosed configuration requirements. For example, even if some components are deleted from all the components shown in the embodiments, (at least one of) the problems described in the column of the problem to be solved by the invention can be solved, and the effect of the invention can be solved. If at least one of the effects described in (1) is obtained, a configuration from which this component is deleted can be extracted as an invention.
【0388】[0388]
【発明の効果】以上説明したように、本発明によれば、
構造化文書を提供する側(例えば、構造化文書管理シス
テムおよびWWWサーバ)の構成は一切変更することな
く、しかも、構造化文書データベースに対しては何ら操
作を行う必要なく、書き換えが許可されていない構造化
文書データべース上の構造化文書への編集(加工)と、
その編集した結果を含めた構造化文書の検索が容易に行
える。As described above, according to the present invention,
Rewriting is permitted without changing the configuration of the side that provides the structured document (for example, the structured document management system and the WWW server) without performing any operation on the structured document database. Editing (processing) to structured documents on a structured document database without
A structured document including the edited result can be easily searched.
【図1】本発明の実施形態に係る構造化文書管理システ
ムの構成例を示した図。FIG. 1 is a diagram showing a configuration example of a structured document management system according to an embodiment of the present invention.
【図2】図1に示した構造化文書管理システムの一利用
形態を示したもので、WWWのバックエンドで、構造化
文書管理システムが動作している場合を示した図。FIG. 2 is a diagram showing one use form of the structured document management system shown in FIG. 1, showing a case where the structured document management system is operating on the back end of WWW.
【図3】XMLで記述された構造化文書の一例を示した
図。FIG. 3 is a diagram showing an example of a structured document described in XML.
【図4】図3の構造化文書の文書構造を模式的に示した
図。FIG. 4 is a diagram schematically showing a document structure of the structured document of FIG. 3;
【図5】追加コマンドの機能を説明するための図で、構
造化文書データベースの初期状態に追加コマンドを実行
した場合について示している。FIG. 5 is a diagram for explaining the function of the additional command, and shows a case where the additional command is executed in an initial state of the structured document database.
【図6】図5(b)に示した状態の構造化文書データベ
ースに対し、取得コマンドを実行した場合の処理結果を
示した図。FIG. 6 is a view showing a processing result when an acquisition command is executed on the structured document database in the state shown in FIG. 5B;
【図7】図5(b)に示した状態の構造化文書データベ
ースに対し、追加コマンドを実行して1つの「特許」情
報の文書オブジェクトツリーを追加した場合を示してい
る。FIG. 7 illustrates a case where a document object tree of one “patent” information is added by executing an addition command to the structured document database in the state illustrated in FIG. 5B.
【図8】図5(b)に示した状態の構造化文書データベ
ースに対し、追加コマンドを実行して3つの「特許」情
報の文書オブジェクトツリーを追加した場合を示してい
る。FIG. 8 shows a case where an add command is executed to add a document object tree of three pieces of “patent” information to the structured document database in the state shown in FIG. 5B.
【図9】要素名生起インデックスの格納例を示した図。FIG. 9 is a diagram showing a storage example of an element name occurrence index.
【図10】データ生起インデックスの格納例を示した
図。FIG. 10 is a diagram showing a storage example of a data occurrence index.
【図11】図8に示した状態の構造化文書データベース
に対して、3つの「特許」情報を取り出すための取得コ
マンドを実行した場合の実行結果を示した図。FIG. 11 is a view showing an execution result when an acquisition command for extracting three pieces of “patent” information is executed on the structured document database in the state shown in FIG. 8;
【図12】XML文書の文書構造を定義するスキーマの
一例を示した図。FIG. 12 is a diagram showing an example of a schema that defines the document structure of an XML document.
【図13】図8に示した状態の構造化文書データベース
に、スキーマ格納コマンドを実行して、図12に示した
スキーマを追加格納(設定)した場合を示した図。13 is a diagram illustrating a case where a schema storage command is executed in the structured document database in the state illustrated in FIG. 8 to additionally store (set) the schema illustrated in FIG. 12;
【図14】スキーマが設定されて、スキーマが存在して
いる旨の属性値のセットされた文書オブジェクトツリー
を示した図。FIG. 14 is a view showing a document object tree in which a schema is set and an attribute value indicating that the schema exists is set.
【図15】各オブジェクトファイルに、スキーマが存在
している旨の属性値が格納されている様子を概念的に示
した図。FIG. 15 is a diagram conceptually showing a state in which an attribute value indicating that a schema exists is stored in each object file.
【図16】必要に応じて検索で使用される概念階層を構
造化文書で表現した例を示した図。FIG. 16 is a diagram showing an example in which a concept hierarchy used in a search is represented by a structured document as needed.
【図17】必要に応じて検索で使用される概念階層を構
造化文書で表現した例を示した図。FIG. 17 is a diagram showing an example in which a concept hierarchy used in a search is represented by a structured document as needed.
【図18】図8に示した状態の構造化文書データベース
に対し、追加コマンドを実行して、図16,図17に示
した「概念」情報の文書オブジェクトツリーを追加した
場合を示した図。FIG. 18 is a diagram showing a case where an addition command is executed on the structured document database in the state shown in FIG. 8 to add a document object tree of “concept” information shown in FIGS. 16 and 17;
【図19】図8に示した状態の構造化文書データベース
に対し、追加コマンドを実行して、図16,図17に示
した「概念」情報の文書オブジェクトツリーを追加した
場合を示した図。19 is a diagram showing a case where an addition command is executed on the structured document database in the state shown in FIG. 8 to add a document object tree of “concept” information shown in FIGS. 16 and 17;
【図20】図1の構造化文書管理システムの文書格納処
理動作について説明するためのフローチャート。FIG. 20 is a flowchart for explaining a document storage processing operation of the structured document management system of FIG. 1;
【図21】図20のステップS9の処理(合成文書作成
部の処理)について説明するためのフローチャートFIG. 21 is a flowchart for explaining the processing of step S9 in FIG. 20 (processing by the composite document creating unit);
【図22】追加コマンド中のパラメータの格納文書の文
書オブジェクトツリーを構造化文書データベースから取
得した文書オブジェクトツリーに挿入して得られた合成
文書の文書オブジェクトツリーをXML文書に変換した
結果であって、テンポラリファイルAに格納される合成
文書の一例を示した図。FIG. 22 shows a result of converting a document object tree of a synthesized document obtained by inserting a document object tree of a document storing a parameter in an additional command into a document object tree obtained from a structured document database into an XML document. FIG. 3 is a diagram showing an example of a composite document stored in a temporary file A.
【図23】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。FIG. 23 is a view showing an example of a schema document stored in a temporary file B and acquired from a structured document database.
【図24】テンポラリファイルAに格納される合成文書
の他の例を示した図。FIG. 24 is a diagram showing another example of the composite document stored in the temporary file A.
【図25】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。FIG. 25 is a view showing an example of a schema document stored in a temporary file B and acquired from a structured document database.
【図26】図1の構造化文書管理システムの文書取得処
理動作について説明するためのフローチャート。FIG. 26 is a flowchart for explaining a document acquisition processing operation of the structured document management system of FIG. 1;
【図27】図1の構造化文書管理システムの文書削除処
理動作について説明するためのフローチャート。FIG. 27 is a flowchart for explaining a document deletion processing operation of the structured document management system of FIG. 1;
【図28】図27のステップS46の処理(合成文書作
成部の処理(削除コマンド用))について説明するため
のフローチャート。FIG. 28 is a flowchart for explaining the processing of step S46 in FIG. 27 (processing by the synthetic document creation unit (for a delete command));
【図29】テンポラリファイルAに格納される合成文書
のさらに他の例であって、削除コマンドの実行時に作成
される合成文書の一例を示した図。FIG. 29 is a view showing still another example of the composite document stored in the temporary file A, which is an example of the composite document created when the delete command is executed.
【図30】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。FIG. 30 is a diagram showing an example of a schema document stored in a temporary file B and acquired from a structured document database.
【図31】ユーザインタフェースとしての画面の表示例
を示した図。FIG. 31 is a view showing a display example of a screen as a user interface.
【図32】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。FIG. 32 is a diagram showing a display example of a screen as a user interface for storing / deleting a document.
【図33】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。FIG. 33 is a view showing a display example of a screen as a user interface for storing / deleting a document.
【図34】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。FIG. 34 is a view showing a display example of a screen as a user interface for storing / deleting a document.
【図35】妥当性のチェックでエラーとなっときにクラ
イアント端末へ返すメッセージの表示例を表示例を示し
た図。FIG. 35 is a view showing a display example of a display example of a message returned to the client terminal when an error occurs in the validity check.
【図36】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示したもので、文書取
得動作を説明するための図。FIG. 36 is a diagram illustrating a display example of a screen as a user interface for storing / deleting a document, and illustrating a document acquisition operation.
【図37】スキーマの設定を行うためのユーザインタフ
ェースとしての画面の表示例を示したもので、スキーマ
の設定動作を説明するための図。FIG. 37 is a diagram illustrating a display example of a screen as a user interface for setting a schema, and illustrating a schema setting operation.
【図38】スキーマの取得するためのユーザインタフェ
ースとしての画面の表示例を示したもので、取得された
スキーマの表示例を示している。FIG. 38 illustrates a display example of a screen as a user interface for acquiring a schema, and illustrates a display example of an acquired schema.
【図39】クエリ(XML文書)の一例を示した図。FIG. 39 is a view showing an example of a query (XML document).
【図40】単純検索のクエリ(XML文書)の一例を示
した図。FIG. 40 is a diagram showing an example of a simple search query (XML document).
【図41】図40の単純検索のクエリを用いた検索結果
(XML文書)を示した図。FIG. 41 is a diagram showing a search result (XML document) using the simple search query of FIG. 40;
【図42】概念検索のクエリ(XML文書)の一例を示
した図。FIG. 42 is a view showing an example of a query (XML document) for concept search.
【図43】図1の構造化文書管理システムの文書検索処
理動作について説明するためのフローチャート。FIG. 43 is a flowchart for explaining a document search processing operation of the structured document management system of FIG. 1;
【図44】文書検索を行うためのユーザインタフェース
としての画面の表示例を示した図。FIG. 44 is a view showing a display example of a screen as a user interface for performing a document search.
【図45】図44に示した画面上から入力された情報に
基づき作成されるクエリを示した図。FIG. 45 is an exemplary view showing a query created based on information input from the screen shown in FIG. 44;
【図46】図42に示したクエリの構造化文書データベ
ース内における格納例を示した図。FIG. 46 is a view showing a storage example of the query shown in FIG. 42 in the structured document database.
【図47】文書検索を行うためのユーザインタフェース
としての画面の表示例であって、スキーマの検索処理動
作を説明するための図。FIG. 47 is a display example of a screen as a user interface for performing a document search, and is a diagram for explaining a schema search processing operation.
【図48】スキーマ検索のクエリの一例を示した図。FIG. 48 is a diagram showing an example of a schema search query.
【図49】クエリを検索するためのクエリの一例を示し
た図。FIG. 49 is a diagram showing an example of a query for searching for a query.
【図50】特許調査における構造化文書データベースの
一例を示した図。FIG. 50 is a diagram showing an example of a structured document database in a patent search.
【図51】概念検索のための入力画面の表示例を示した
図。FIG. 51 is a view showing a display example of an input screen for concept search.
【図52】図51に示した入力画面上の入力情報に対応
するクエリを示した図。FIG. 52 is a view showing a query corresponding to input information on the input screen shown in FIG. 51;
【図53】図52に示したクエリに対応する検索結果と
してのXML文書を示した図。FIG. 53 is a view showing an XML document as a search result corresponding to the query shown in FIG. 52;
【図54】特許マップの一例を示した図。FIG. 54 is a diagram showing an example of a patent map.
【図55】第2の実施形態に係るクライアント端末の構
成例であって、構造化文書データべースに対しては何ら
操作を行わずに、構造化文書への編集(加工)が行え、
その編集した結果を含めて、文書の検索を可能にする構
造化文書編集機能を有したクライアント端末の構成例を
示した図。FIG. 55 is a configuration example of a client terminal according to the second embodiment, in which a structured document can be edited (processed) without performing any operation on the structured document database;
FIG. 9 is a diagram showing a configuration example of a client terminal having a structured document editing function that enables a document search including the edited result.
【図56】構造化文書データベースの一例を示した図。FIG. 56 is a diagram showing an example of a structured document database.
【図57】構造化文書の一例であって、「特許」情報を
示した図。FIG. 57 is an example of a structured document showing “patent” information.
【図58】ユーザタグ登録画面の表示例を示した図。FIG. 58 is a view showing a display example of a user tag registration screen.
【図59】ユーザタグ記憶部のユーザタグの記憶例を示
した図。FIG. 59 is a view showing a storage example of a user tag in a user tag storage unit.
【図60】検索画面の表示例を示した図。FIG. 60 is a view showing a display example of a search screen.
【図61】検索結果一覧画面の表示例を示した図。FIG. 61 is a view showing a display example of a search result list screen.
【図62】検索結果閲覧画面の表示例を示した図。FIG. 62 is a view showing a display example of a search result browsing screen.
【図63】文書編集画面の表示例を示した図。FIG. 63 is a view showing a display example of a document editing screen.
【図64】検索条件として、ユーザタグや、その値を指
定する際に表示されるリストボックスの表示例を示した
図。FIG. 64 is a view showing a display example of a list box displayed when a user tag and its value are specified as search conditions.
【図65】追加文書の一例を示した図。FIG. 65 is a diagram showing an example of an additional document.
【図66】追加文書記憶部の追加文書を格納するための
データ構造を示した図。FIG. 66 is a view showing a data structure for storing an additional document in an additional document storage unit.
【図67】拡張文書検索画面の表示例を示した図。FIG. 67 is a view showing a display example of an extended document search screen.
【図68】拡張クエリの一例を示した図。FIG. 68 is a diagram showing an example of an extended query.
【図69】図68の拡張クエリから生成された通常のク
エリを示した図。FIG. 69 is a view showing a normal query generated from the extended query of FIG. 68;
【図70】検索要求分離部が記憶する追加文書用クエリ
のテンプレートの一例を示した図。FIG. 70 is a view showing an example of an additional document query template stored in the search request separating unit.
【図71】検索要求分離部が記憶する追加文書用クエリ
のテンプレートの他の例を示した図。FIG. 71 is a view showing another example of a template of an additional document query stored in the search request separating unit.
【図72】図68の拡張クエリから生成された追加文書
用クエリを示した図。FIG. 72 is a diagram showing a query for an additional document generated from the extended query of FIG. 68.
【図73】拡張文書の一例を示した図。FIG. 73 is a view showing an example of an extended document.
【図74】検索結果一覧画面の表示例を示した図。FIG. 74 is a view showing a display example of a search result list screen.
【図75】検索結果閲覧画面の表示例であって、拡張文
書の表示例を示した図。FIG. 75 is a display example of a search result browsing screen, showing a display example of an extended document.
【図76】文書編集処理動作を説明するためのフローチ
ャート。FIG. 76 is a flowchart for explaining the document editing processing operation;
【図77】拡張文書の検索処理動作を説明するためのフ
ローチャート。FIG. 77 is a flowchart for describing an extended document search processing operation.
【図78】構造化文書編集装置の位置づけを説明するた
めの図。FIG. 78 is a view for explaining the positioning of the structured document editing device.
【図79】クライアント端末と構造化文書編集装置の構
成例を示した図。FIG. 79 is a view showing a configuration example of a client terminal and a structured document editing device.
1…要求制御部 2…アクセス要求処理部 3…検索要求処理部 4…データアクセス部 5…文書記憶部 6…インデックス記憶部 11…受付要求部 12…結果処理部 21…文書格納部 22…文書取得部 23…文書削除部 41…文書オブジェクトツリー格納部 42…文書オブジェクトツリー削除部 43…文書オブジェクトツリー取得部 44…文書文字列取得部 45…パスから文書オブジェクトツリー取得部 46…文書パーサ 47…合成文書作成部 48…インデックス更新部 100…構造化文書管理システム 101…WWWサーバ 102…クライアント端末 103…WWWブラウザ 201…ユーザタグ登録部 202…検索要求入力部 203…検索結果表示処理部 204…文書編集部 205…拡張文書検索要求入力部 206…ユーザタグ記憶部 207…追加文書抽出部 208…検索要求分離部 209…追加文書検索部 210…追加文書記憶部 211…文書合成部 301…構造化文書編集装置 DESCRIPTION OF SYMBOLS 1 ... Request control part 2 ... Access request processing part 3 ... Search request processing part 4 ... Data access part 5 ... Document storage part 6 ... Index storage part 11 ... Reception request part 12 ... Result processing part 21 ... Document storage part 22 ... Document Acquisition unit 23 Document deletion unit 41 Document object tree storage unit 42 Document object tree deletion unit 43 Document object tree acquisition unit 44 Document character string acquisition unit 45 Document object tree acquisition unit from path 46 Document parser 47 Synthetic document creation unit 48 Index update unit 100 Structured document management system 101 WWW server 102 Client terminal 103 WWW browser 201 User tag registration unit 202 Search request input unit 203 Search result display processing unit 204 Document Editing unit 205: Extended document search request input unit 206: User Storage unit 207 additional document extraction unit 208 search request separation unit 209 additional document search unit 210 additional document storage unit 211 document synthesis unit 301 structured document editing device
フロントページの続き (72)発明者 金輪 拓也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 新名 博 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 服部 雅一 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B075 ND35 NK43 NR03 NR20 PQ02 PQ32 Continuing from the front page (72) Inventor Takuya Kanawa 1 Toshiba R & D Center, Komukai, Kawasaki-shi, Kanagawa Prefecture (72) Inventor Hiroshi Niina 1 Toshiba-cho, Komukai-shi, Kawasaki-shi, Kanagawa Address Toshiba R & D Center (72) Inventor Masakazu Hattori 1 Tokoba R & D Center, Komukai Toshiba-cho, Yuki-ku, Kawasaki-shi, Kanagawa F-term (Reference) 5B075 ND35 NK43 NR03 NR03 NR20
Claims (10)
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成して、この
作成された新たな構成要素を該構造化文書に対応付けて
記憶し、 前記構造化文書データベースから検索された前記構造化
文書に前記新たな構成要素が対応付けられているとき
は、該構造化文書に該新たな構成要素を追加して表示す
ることを特徴とする構造化文書編集方法。1. A new component to be added to a structured document including a plurality of components stored in a structured document database having a hierarchical logical structure is created, and the created new configuration is created. Storing the element in association with the structured document; and when the new component is associated with the structured document retrieved from the structured document database, the new configuration is added to the structured document. A structured document editing method characterized by adding and displaying elements.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成して、この
作成された新たな構成要素を該構造化文書に対応付けて
記憶手段に記憶し、 前記構成要素とその値を検索条件に含む検索要求に基づ
き、前記記憶手段で記憶された新たな構成要素を検索す
るための第1の検索要求と、前記構造化文書データベー
スに格納された構造化文書を検索するための第2の検索
要求とを生成し、 前記第2の検索要求に基づき前記構造化文書データベー
スから検索された構造化文書に前記第1の検索要求に基
づき検索された新たな構成要素が対応付けられていると
きは、該構造化文書に該新たな構成要素を追加して表示
することを特徴とする構造化文書編集方法。2. A new component to be added to a structured document including a plurality of components stored in a structured document database having a hierarchical logical structure is created, and the created new configuration is created. A first element for correlating an element with the structured document and storing the element in a storage unit based on a search request that includes the element and its value in a search condition; And a second search request for searching for a structured document stored in the structured document database, and a structure searched from the structured document database based on the second search request When a new component retrieved based on the first retrieval request is associated with the structured document, the new component is added to the structured document and displayed. Document Method.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成して、この
作成された新たな構成要素を該構造化文書に対応付けて
記憶する手段と、 前記構造化文書データベースから検索された前記構造化
文書に前記新たな構成要素が対応付けられているとき
は、該構造化文書に該新たな構成要素を追加して表示す
る手段と、 を具備したことを特徴とする構造化文書編集装置。3. A new component to be added to a structured document including a plurality of components stored in a structured document database having a hierarchical logical structure is created, and the created new configuration is created. Means for storing an element in association with the structured document; and when the new component is associated with the structured document retrieved from the structured document database, the new A structured document editing apparatus, comprising: means for adding and displaying various components.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成する作成手
段と、 前記作成された新たな構成要素を、その新たな構成要素
が追加される前記構造化文書に対応付けて記憶する記憶
手段と、 前記構成要素とその値を検索条件に含む検索要求に基づ
き、前記記憶手段で記憶された新たな構成要素を検索す
るための第1の検索要求と、前記構造化文書データベー
スに格納された構造化文書を検索するための第2の検索
要求とを生成する第1の生成手段と、 前記第2の検索要求に基づき前記構造化文書データベー
スから検索された構造化文書に前記第1の検索要求に基
づき検索された新たな構成要素が対応付けられていると
きは、該構造化文書に該新たな構成要素を追加して、表
示用の構造化文書を作成する第2の生成手段と、 前記生成された表示用の構造化文書を表示する表示手段
と、 を具備したこを特徴とする構造化文書編集装置。4. A creating means for creating a new component to be added to a structured document composed of a plurality of components stored in a structured document database having a hierarchical logical structure; Means for storing the structural elements in association with the structured document to which the new structural elements are added; and storing in the storage means based on a search request including the structural elements and their values in a search condition. First generation means for generating a first search request for searching for a new constituent element and a second search request for searching for a structured document stored in the structured document database; When a new component searched based on the first search request is associated with a structured document searched from the structured document database based on the second search request, the structured document is A second generation unit that adds the new component to the display unit to create a structured document for display; and a display unit that displays the generated structured document for display. Structured document editing device.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を該構造化文書に
対応付けて記憶する記憶手段と、 前記構成要素とその値を検索条件に含む検索要求を受け
付けたとき、この検索要求に基づき、前記記憶手段で記
憶された新たな構成要素を検索するための第1の検索要
求と、前記構造化文書データベースに格納された構造化
文書を検索するための第2の検索要求とを生成する第1
の生成手段と、 前記第2の検索要求に基づき前記構造化文書データベー
スから検索された構造化文書に前記第1の検索要求に基
づき検索された新たな構成要素が対応付けられていると
きは、該構造化文書に該新たな構成要素を追加して表示
用の構造化文書を生成する第2の生成手段と、 を具備したことを特徴とする構造化文書編集装置。5. A storage for storing a new component to be added to a structured document including a plurality of components stored in a structured document database having a hierarchical logical structure in association with the structured document. Means, when a search request including the component and its value in a search condition is received, a first search request for searching for a new component stored in the storage unit based on the search request; A second search request for searching for a structured document stored in the structured document database;
Generating means, and when a new component searched based on the first search request is associated with a structured document searched from the structured document database based on the second search request, And a second generation unit for adding the new component to the structured document to generate a structured document for display. A structured document editing apparatus, comprising:
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を該構造化文書に
対応付けて記憶手段に記憶し、前記構成要素とその値を
検索条件に含む検索要求を受け付けたとき、この検索要
求に基づき、前記記憶手段に記憶された新たな構成要素
を検索するための第1の検索要求と、前記構造化文書デ
ータベースに格納された構造化文書を検索するための第
2の検索要求とを生成し、前記第2の検索要求に基づき
前記構造化文書データベースから検索された構造化文書
に前記第1の検索要求に基づき検索された新たな構成要
素が対応付けられているときは、該構造化文書に該新た
な構成要素を追加して表示用の構造化文書を生成する構
造化文書編集装置と互いに通信を行って、前記構造化文
書データベースに格納されている構造化文書の編集およ
び検索を行う端末装置であって、 前記構造化文書データベースに格納されている構造化文
書に追加する新たな構成要素を作成する作成手段と、 前記構造化文書編集装置の前記記憶手段に、前記作成手
段で作成された新たな構成要素を登録する登録手段と、 前記構造化文書編集装置に、前記構成要素とその値を検
索条件に含む前記検索要求を送信する送信手段と、 前記検索要求に基づく検索結果として、前記構造化文書
編集装置から送信されてきた前記表示用の構造化文書を
受信して表示する表示手段と、 を具備したことを特徴とする端末装置。6. A new component to be added to a structured document composed of a plurality of components stored in a structured document database having a hierarchical logical structure and associated with the structured document in a storage means. A first search request for searching for a new component stored in the storage unit based on the search request when storing and receiving a search request including the component and its value in a search condition; And generating a second search request for searching for a structured document stored in the structured document database, and adding the second search request to the structured document searched from the structured document database based on the second search request. When a new component found based on the first search request is associated with the structured document, the structured document editing apparatus adds the new component to the structured document to generate a structured document for display. When A terminal device for communicating with each other to edit and search a structured document stored in the structured document database, and a new configuration for adding to the structured document stored in the structured document database Creating means for creating an element; registering means for registering the new component created by the creating means in the storage means of the structured document editing device; and Transmitting means for transmitting the search request including the value in the search condition; and receiving and displaying the structured document for display transmitted from the structured document editing apparatus as a search result based on the search request. A terminal device, comprising: display means.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成して、この
作成された新たな構成要素を該構造化文書に対応付けて
記憶手段に記憶させるための処理、 前記構造化文書データベースから検索された前記構造化
文書に前記新たな構成要素が対応付けられているとき
は、該構造化文書に該新たな構成要素を追加して表示す
るための処理と、 をコンピュータに実行させるためのプログラム。7. A new component to be added to a structured document including a plurality of components stored in a structured document database having a hierarchical logical structure is created, and the created new configuration is created. Processing for storing an element in the storage unit in association with the structured document; and when the new component is associated with the structured document retrieved from the structured document database, the A process for adding the new component to the document and displaying the document, and a program for causing a computer to execute the process.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を作成するための
処理と、 前記作成された新たな構成要素を、その新たな構成要素
が追加される前記構造化文書に対応付けて記憶手段に記
憶させるための処理と、 前記構成要素とその値を検索条件に含む検索要求に基づ
き、前記記憶手段で記憶された新たな構成要素を検索す
るための第1の検索要求と、前記構造化文書データベー
スに格納された構造化文書を検索するための第2の検索
要求とを生成するための処理と、 前記第2の検索要求に基づき前記構造化文書データベー
スから検索された構造化文書に、前記第1の検索要求に
基づき検索された新たな構成要素が対応付けられている
ときは、該構造化文書に該新たな構成要素を追加して、
表示用の構造化文書を作成するための処理と、 前記生成された表示用の構造化文書を表示するための処
理と、 をコンピュータに実行させるためのプログラム。8. A process for creating a new component to be added to a structured document composed of a plurality of components stored in a structured document database having a hierarchical logical structure; and Processing for storing a new component in the storage unit in association with the structured document to which the new component is added; and a search request including the component and its value in a search condition. A first search request for searching for a new component stored in the storage unit and a second search request for searching for a structured document stored in the structured document database; Processing, and when a new component searched based on the first search request is associated with a structured document searched from the structured document database based on the second search request. Adding the new component to the structured document,
A program for causing a computer to execute: a process for creating a structured document for display; and a process for displaying the generated structured document for display.
データベースに格納されている複数の構成要素からなる
構造化文書に追加する新たな構成要素を該構造化文書に
対応付けて記憶手段に記憶させるための処理と、 前記構成要素とその値を検索条件に含む検索要求を受け
付けたとき、この検索要求に基づき、前記記憶手段で記
憶された新たな構成要素を検索するための第1の検索要
求と、前記構造化文書データベースに格納された構造化
文書を検索するための第2の検索要求とを生成するため
の処理と、 前記第2の検索要求に基づき前記構造化文書データベー
スから検索された構造化文書に前記第1の検索要求に基
づき検索された新たな構成要素が対応付けられていると
きは、該構造化文書に該新たな構成要素を追加して表示
用の構造化文書を生成するための処理と、 をコンピュータに実行させるためのプログラム。9. A new component to be added to a structured document composed of a plurality of components stored in a structured document database having a hierarchical logical structure is associated with the structured document and stored in the storage means. A process for storing, and a first request for searching for a new component stored in the storage means based on the search request when a search request including the component and its value in a search condition is received. Processing for generating a search request and a second search request for searching a structured document stored in the structured document database; and searching from the structured document database based on the second search request When the new structured element searched based on the first search request is associated with the structured document obtained, the new structured element is added to the structured document and a structured sentence for display is added. Program for executing a processing for generating, to the computer.
書データベースに格納されている複数の構成要素からな
る構造化文書に追加する新たな構成要素を該構造化文書
に対応付けて記憶手段に記憶し、前記構成要素とその値
を検索条件に含む検索要求を受け付けたとき、この検索
要求に基づき、前記記憶手段に記憶された新たな構成要
素を検索するための第1の検索要求と、前記構造化文書
データベースに格納された構造化文書を検索するための
第2の検索要求とを生成し、前記第2の検索要求に基づ
き前記構造化文書データベースから検索された構造化文
書に前記第1の検索要求に基づき検索された新たな構成
要素が対応付けられているときは、該構造化文書に該新
たな構成要素を追加して表示用の構造化文書を生成する
構造化文書編集装置と互いに通信を行って、前記構造化
文書データベースに格納されている構造化文書の編集お
よび検索を行うための処理をコンピュータに実行させる
ためのプログラムであって、 前記構造化文書データベースに格納されている構造化文
書に追加する新たな構成要素を作成するための処理と、 前記構造化文書編集装置の前記記憶手段に、前記作成さ
れた新たな構成要素を登録するための処理と、 前記構造化文書編集装置に、前記構成要素とその値を検
索条件に含む前記検索要求を送信するための処理と、 前記検索要求に基づく検索結果として、前記構造化文書
編集装置から送信されてきた前記表示用の構造化文書を
受信して表示するための処理と、 をコンピュータに実行させるためのプログラム。10. A new component to be added to a structured document composed of a plurality of components stored in a structured document database having a hierarchical logical structure and associated with the structured document in a storage means. A first search request for searching for a new component stored in the storage unit based on the search request when storing and receiving a search request including the component and its value in a search condition; And generating a second search request for searching for a structured document stored in the structured document database, and adding the second search request to the structured document searched from the structured document database based on the second search request. When a new component found based on the first search request is associated with the structured document, the structured document editing apparatus adds the new component to the structured document to generate a structured document for display. And a program for causing a computer to execute a process for editing and searching for a structured document stored in the structured document database, the program being stored in the structured document database. A process for creating a new component to be added to the structured document that is present; a process for registering the created new component in the storage unit of the structured document editing apparatus; A process for transmitting the search request including the component and its value in a search condition to the document editing device; and a display result transmitted from the structured document editing device as a search result based on the search request. A process for receiving and displaying the structured document of, and a program for causing a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001098189A JP3842576B2 (en) | 2001-03-30 | 2001-03-30 | Structured document editing method and structured document editing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001098189A JP3842576B2 (en) | 2001-03-30 | 2001-03-30 | Structured document editing method and structured document editing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002297662A true JP2002297662A (en) | 2002-10-11 |
JP3842576B2 JP3842576B2 (en) | 2006-11-08 |
Family
ID=18951864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001098189A Expired - Fee Related JP3842576B2 (en) | 2001-03-30 | 2001-03-30 | Structured document editing method and structured document editing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3842576B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004342091A (en) * | 2003-04-07 | 2004-12-02 | Thomson Licensing Sa | Database model for hierarchical data format |
WO2008041367A1 (en) * | 2006-09-29 | 2008-04-10 | Justsystems Corporation | Document searching device, document searching method, document searching program |
JP2008181506A (en) * | 2006-12-28 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, information processing system, program and computer-readable storage medium |
JP2008282114A (en) * | 2007-05-09 | 2008-11-20 | Profield Co Ltd | Information processor, server device, information processing system, information processing method, and program |
JP2019021266A (en) * | 2017-07-21 | 2019-02-07 | 富士通株式会社 | Storage control program, storage control device, and storage control method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11379881B1 (en) * | 2017-03-03 | 2022-07-05 | Servemotion, Inc. | Systems and methods for providing video header bidding to a publisher |
-
2001
- 2001-03-30 JP JP2001098189A patent/JP3842576B2/en not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004342091A (en) * | 2003-04-07 | 2004-12-02 | Thomson Licensing Sa | Database model for hierarchical data format |
JP4561150B2 (en) * | 2003-04-07 | 2010-10-13 | トムソン ライセンシング | A database model for hierarchical data formats. |
WO2008041367A1 (en) * | 2006-09-29 | 2008-04-10 | Justsystems Corporation | Document searching device, document searching method, document searching program |
JP2008090404A (en) * | 2006-09-29 | 2008-04-17 | Just Syst Corp | Document retrieval apparatus, method and program |
JP2008181506A (en) * | 2006-12-28 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, information processing system, program and computer-readable storage medium |
JP2009134755A (en) * | 2006-12-28 | 2009-06-18 | Canon Marketing Japan Inc | Information processor, control method thereof, information processing system, program, and computer readable recording medium |
JP2008282114A (en) * | 2007-05-09 | 2008-11-20 | Profield Co Ltd | Information processor, server device, information processing system, information processing method, and program |
JP2019021266A (en) * | 2017-07-21 | 2019-02-07 | 富士通株式会社 | Storage control program, storage control device, and storage control method |
JP7044967B2 (en) | 2017-07-21 | 2022-03-31 | 富士通株式会社 | Storage control program, storage control device and storage control method |
Also Published As
Publication number | Publication date |
---|---|
JP3842576B2 (en) | 2006-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3842573B2 (en) | Structured document search method, structured document management apparatus and program | |
JP3842577B2 (en) | Structured document search method, structured document search apparatus and program | |
Hogue et al. | Thresher: automating the unwrapping of semantic content from the world wide web | |
Frischmuth et al. | Ontowiki–an authoring, publication and visualization interface for the data web | |
US20080183689A1 (en) | Search method and apparatus for plural databases | |
JPH11242676A (en) | Method for registering structured document, method for retrieving structured document, and portable medium used in these methods | |
JP2001167087A (en) | Device and method for retrieving structured document, program recording medium for structured document retrieval and index preparing method for structured document retrieval | |
KR20090028758A (en) | Methods and apparatus for reusing data access and presentation elements | |
JP4042830B2 (en) | Content attribute information normalization method, information collection / service provision system, and program storage recording medium | |
JP2005190163A (en) | Method, apparatus and program for retrieving structured data | |
JP3914081B2 (en) | Access authority setting method and structured document management system | |
KR100522186B1 (en) | Methods for dynamically building the home page and Apparatus embodied on the web therefor | |
JP3842576B2 (en) | Structured document editing method and structured document editing system | |
JP3842572B2 (en) | Structured document management method, structured document management apparatus and program | |
Yu et al. | Metadata management system: design and implementation | |
JPH10187680A (en) | Document repository device managed by word, sentence and grain degree of part | |
JP2003316783A (en) | Heterogeneous semi-structured information integration/ retrieval device, method and program, and recording medium with program recorded thereon | |
CN1326078C (en) | Forming method for package device | |
JP3842574B2 (en) | Information extraction method, structured document management apparatus and program | |
JP2003288332A (en) | Method and system for supporting structured document creation | |
JP3842575B2 (en) | Structured document search method, structured document management apparatus and program | |
JP2004118543A (en) | Method for retrieving structured document, and method, device and program for supporting retrieval | |
JP2003288365A (en) | Additive information management method and additive information management system | |
KR20050114947A (en) | Apparatus and methd for constructing ontology of product data using resource description framework | |
Škrbić et al. | Bibliographic records editor in XML native environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060810 |
|
LAPS | Cancellation because of no payment of annual fees |