JPH1115843A - Device and method for retrieving sgml document - Google Patents

Device and method for retrieving sgml document

Info

Publication number
JPH1115843A
JPH1115843A JP16728497A JP16728497A JPH1115843A JP H1115843 A JPH1115843 A JP H1115843A JP 16728497 A JP16728497 A JP 16728497A JP 16728497 A JP16728497 A JP 16728497A JP H1115843 A JPH1115843 A JP H1115843A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
sgml
sql
information
search
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16728497A
Other languages
Japanese (ja)
Inventor
Eiji Nagamura
栄治 永村
Original Assignee
Toshiba Corp
株式会社東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To provide an SGML document retrieving device capable of retrieving an SGML document recorded in a data base by an SQL to be a general relational data base language. SOLUTION: At the time of inputting an SQL describing an SGML document retrieving instruction, an SQL analysis part 11 analyzes the SQL, separates the SQL into SQL information and SGML information and transfers the SGML information and the SQL analytical information respectively to an SGML analysis part 12 and a data access part 13. The SGML analysis part 12 extracts a tag identifier and a regrieving phrase from the SGML information and transfers the extracted contents to the data access part 13 as SGML analytical information. The data access part 13 detects an SGML document including the retrieving phrase in a tag sentence specified by the tag identifier and coincident with a condition specified by the SQL information from a user data base 17 and returns the detected result.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】この発明は、データベースに登録されたSGML(Standard Genera BACKGROUND OF THE INVENTION SGML this invention, which has been registered in the database (Standard Genera
lized Markup Language)文書を汎用的な関係データベース言語であるSQLで検索可能とするSGML文書検索装置およびSGML文書検索方法に関する。 About lized Markup Language) SGML document search apparatus and SGML document search method which allows retrieving documents in SQL is a generic relational database language.

【0002】 [0002]

【従来の技術】近年、オフィスなどへのコンピュータの普及は目覚ましく、このオフィス環境で取り扱われる文書の多くが、コンピュータ上で動作する文書作成ソフトウェアなどのアプリケーションプログラムで作成される程である。 In recent years, the spread of computer of office to such is remarkable, many of the documents that are handled in this office environment, it is enough to be created by the application program, such as document creation software that runs on the computer. また、通信技術の向上に伴なって、文書作成ソフトウェアなどで作成された電子文書をネットワークを介してコンピュータ相互間で直接に送受信するといったことが頻繁に行なわれるようになってきている。 Also, becomes accompanied to the improvement of communication technology, has come to be frequently performed things like sending and receiving directly to an electronic document written in, for example, document creation software among computer-to-computer over a network.

【0003】このように、コンピュータで文書を取り扱かう機会が増えたことから、コンピュータで解析が可能であり、かつ人間にとっても可読性のよいSGML文書が開発されるに至った。 [0003] In this way, from the fact that more opportunities will squeezed take the document on a computer, it can be analyzed by a computer, and has led to good SGML document of readability is also developed for humans. このSGML文書は、文書が章、節および段落などといった要素の木構造により表現されることに着目して開発されたものであり、その木構造に含まれる要素(タグ)の名前とそれらの構造上の関係とをDTD(Document Type Defi The SGML document, document chapter has been developed by paying attention to be expressed by a tree structure, such as such elements sections and paragraphs, names and their elements (tags) that are included in the tree structure construction and on the relationship DTD (Document Type Defi
nition:文書型定義)で定義することによって、 nition: by defining it in the document type definition),
ハードウェアおよびソフトウェアのいずれにも依存しない汎用的な電子文書として取り扱かうことを可能としている。 Is it possible that you squeezed taken as a general-purpose electronic documents that do not depend on any of the hardware and software.

【0004】ところで、従来、このSGML文書をデータベースに登録しておき、たとえばアプリケーションプログラムなどから検索するような場合には、まず、そのアプリケーションプログラムは、指定されたタグと語句とを文中に含むSGML文書をデータベースから取り出し、さらに、その取り出したSGML文書を解析して、 Meanwhile, conventionally, SGML may be registered the SGML document into the database, if for example such as Search application programs, first, the application program including the specified tag and phrases in the text retrieves the document from the database, further analyzes the SGML document taken out,
指定されたタグ中にその語句が含まれている場合に、該当するSGML文書と判定するといったことを行なっていた。 If during the specified tag contains the phrase, it had done the like to determine the appropriate SGML document.

【0005】 [0005]

【発明が解決しようとする課題】しかしながら、このような方法では、アプリケーションプログラム自身がSG The object of the invention is to be Solved] However, in such a method, the application program itself SG
ML文書の構文や内容を意識する必要があり、また、S There is a need to be aware of the syntax and content of the ML document, also, S
GML文書の解析や、その解析結果とデータベースから返却される検索結果との比較など、アプリケーションプログラムの処理が複雑になるといった問題があった。 Analysis and the GML documents, comparison of the search results to be returned from the analysis results and the database, there is a problem processing of the application program becomes complicated.

【0006】この発明はこのような実情に鑑みてなされたものであり、データベースに登録されたSGML文書を汎用的な関係データベース言語であるSQLで検索可能とするSGML文書検索装置およびSGML文書検索方法を提供することを目的とする。 [0006] The present invention has been made in view of such circumstances, SGML document search apparatus and SGML document search method which enables retrieval of SGML documents registered in the database in SQL is a generic relational database language an object of the present invention is to provide a.

【0007】 [0007]

【課題を解決するための手段】この発明は、前述した目的を達成するために、少なくともSGML文書の識別番号または識別子およびタグ文を保持する検索テーブルを設け、登録指示されたSGML文書の識別番号または識別子およびこのSGML文書に含まれるタグ文をこの検索テーブルに登録しておき、たとえばアプリケーションプログラムなどからSGML文書の検索指示を受け取ったときに、その検索指示を記述したSQLを解析してS SUMMARY OF THE INVENTION The present invention, in order to achieve the object described above, provided the search table which holds the identification number or identifier and tag statements at least SGML document, the identification number of the SGML documents registration instruction or a tag statements contained in the identifier and the SGML document may be registered in this search table, for example, when it receives a search instruction SGML document from an application program, by analyzing the SQL describing the search instruction S
QL情報とSGML情報とに分離し、この分離されたS Separated into QL information and SGML information is the separation S
GML情報からタグ識別子と検索語句とを得て、その得られたタグ識別子で示されるタグの文中に検索語句を含み、かつSQL情報で指定される条件に合致するSGM Obtaining a search term and the tag identifier from GML information includes search terms in the text of the tag indicated by the obtained tag identifier, and matching the condition specified in the SQL information SGM
L文書を、(1)検索テーブルから該当するSGML文書の識別番号を抽出し、(2)この検索テーブルから抽出した識別番号を検索キーにデータベースから検出するようにしたものである。 The L document, (1) extracts the identification number of the SGML document to be relevant from the search table, but which is adapted to detect from (2) database identification number extracted from the search table to the search key.

【0008】この発明によれば、たとえばアプリケーションプログラム自身はSGML文書の構成やタグの位置などを意識する必要がなくなり、SQLという標準インタフェースでSGML文書をタグ指定で検索指示することが可能となる。 [0008] According to the invention, for example, the application program itself does not need to be aware of the position or the like of the structure and tags SGML document, it is possible to search indicated by the tag specified SGML documents with standard interface called SQL.

【0009】 [0009]

【発明の実施の形態】以下、図面を参照してこの発明の実施形態を説明する。 DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, with reference to the drawings illustrating an embodiment of the present invention. 図1は、この実施形態に係るSG 1, according to this embodiment SG
ML文書検索装置の機能ブロック図である。 It is a functional block diagram of the ML document search apparatus. 図1に示したように、このSGML文書検索装置10は、SQL解析部11、SGML解析部12およびデータアクセス部13の各処理部と、DTD情報14、タグリスト15、 As shown in FIG. 1, the SGML document search apparatus 10 includes a respective processor of the SQL analysis unit 11, SGML analyzer 12 and the data access unit 13, DTD information 14, the tag list 15,
タグ中文書テーブル16およびユーザデータベース17 Tag in the document table 16 and the user database 17
の各データとを備えてなる。 Comprising a respective data. なお、この各処理部は、S Incidentally, the respective processing unit, S
GML文書検索装置10が構築されるコンピュータのC C computer that GML document search apparatus 10 is constructed
PUによって実行制御されるプログラムとして構成されるものであり、また、各データは、そのコンピュータが備える磁気ディスクやシステムメモリなどの記憶装置上に保持されるものである。 Are those being configured as a program execution control by the PU, also the data is intended to be held on a storage device such as a magnetic disk or system memory of the the computer.

【0010】SQL解析部11は、アプリケーションプログラム1から送信されるSQLを解析してSGML情報とSQL解析情報とに分離し、SGML情報をSGM [0010] SQL parser 11 separates and analyzes the SQL that is sent from the application program 1 to the SGML information and SQL analysis information, SGM the SGML information
L解析部12に、SQL解析情報をデータアクセス部1 To L analysis section 12, the data access unit 1 a SQL analysis information
3にそれぞれ引き渡すものである。 It is intended to deliver each to 3. SGML解析部12 SGML analysis section 12
は、SQL解析部11から受け取ったSGML情報を解析し、このSGML情報からタグ識別子と検索語句とを抽出してSGML解析情報としてデータアクセス部13 Analyzes the SGML information received from the SQL analysis unit 11, the data access section 13 as SGML analysis information by extracting a search term and the tag identifier from the SGML information
に引き渡すものである。 It is intended to deliver to. そして、データアクセス部13 Then, the data access unit 13
は、SQL解析部11から受け取ったSQL解析情報とSGML解析部12から受け取ったSGML解析情報とに基づき、DTD情報14、タグリスト15、タグ中文書テーブル16およびユーザデータベース17へ各種データを登録したり、DTD情報14、タグリスト15およびタグ中文書テーブル16を参照してユーザデータベース17から該当するSGML文書を検出したりするものである。 , Based on the SQL analysis information received from the SQL parser 11 and SGML analysis information received from the SGML analyzer 12, to register various data to DTD information 14, the tag list 15, the tag in the document table 16 and the user database 17 or is for and detect the SGML document relevant from the user database 17 by referring to the DTD information 14, the tag list 15 and the tag in the document table 16.

【0011】DTD情報14は、ユーザデータベース1 [0011] DTD information 14, a user database 1
7に登録されるSGML文書で用いられるタグの構造上の関係を保持し、また、タグリスト15は、SGML文書で用いられるタグを定義する。 Holding the structural relationship of the tags used in the SGML document to be registered in the 7, The tag list 15 defines the tags to be used in the SGML document. そして、タグ中文書テーブル16は、タグリスト15に基づいて作成され、ユーザデータベース17に登録されるSGML文書の各タグ中の文書を保持するものである。 Then, the tag in the document table 16 is created based on the tag list 15 is to hold the document in each tag in the SGML document to be registered in the user database 17. そして、ユーザデータベース17は、ユーザごとにユーザテーブルを設定し、この設定したユーザテーブルにSGML文書の識別番号、登録日付および本文を格納するものである。 Then, the user database 17, sets the user table for each user, the identification number of the SGML document to the user table to the set, and stores the creation date and body.

【0012】次に、この実施形態のSGML文書検索装置10の動作原理を「定義」、「登録」および「検索」 [0012] Next, "definition" of the operating principle of the SGML document search apparatus 10 of this embodiment, the "registration" and "search"
の順に分説する。 For dividing theory of the order. なお、このSGML文書検索装置10 In addition, the SGML document retrieval apparatus 10
は、ユーザデータベース17に設定される図2に示したユーザテーブル(UT1)に対してSGML文書の検索を実行するものとする。 It shall perform a search for the SGML document to a user table (UT1) shown in FIG. 2 to be set in the user database 17. ここで、本文はSGML文書の列であり、番号は一意なキーであるとする。 Here, the body is a column of SGML document, the number is assumed to be a unique key.

【0013】(1)定義 ここでは、図2に示したユーザテーブル(UT1)の文書列にSGML属性を付加するために、アプリケーションプログラム1から以下のSQLが送信されたものとする。 [0013] (1) defined here, in order to add the SGML attribute in the document column of the user table (UT1) shown in FIG. 2, the following SQL application program 1 is assumed to have been transmitted.

【0014】 ALTER TABLE UT1 ADD ( 文書 SGML(1000) KEY=番号 DTDFILE=UT1.DTD TAGLIST=UT1.LST ) このSQLは、SQL解析部11からデータアクセス部13に引き渡され、一方、データアクセス部13では、 [0014] ALTER TABLE UT1 ADD (document SGML (1000) KEY = number DTDFILE = UT1.DTD TAGLIST = UT1.LST) This SQL is passed from the SQL analysis unit 11 to the data access section 13, whereas, the data access section 13 In,
タグリスト15を参照し、このタグリスト15に定義されたタグをフィールドにもつタグ中文書テーブル16を作成する。 Referring to tag list 15, to create a tag in the document table 16 with tags defined in the tag list 15 in the field. ここでは、タグリスト15に「TAG1」および「TAG2」の2つのタグが定義されているものとする。 Here, it is assumed that two tags of "TAG1" and "TAG2" is defined in the tag list 15. その結果、データアクセス部13は、図3に示したタグ中文書テーブル(TGT1)を作成する。 As a result, the data access unit 13 creates a document table (TGT1) in tag shown in FIG.

【0015】(2)登録 次に、図4乃至図7を参照してSGML文書の登録動作を説明する。 [0015] (2) registration will now be described operation of registering SGML documents with reference to FIGS. ここでは、アプリケーションプログラム1 In this case, the application program 1
からユーザデータベース17のユーザテーブル(UT From the user table in the user database 17 (UT
1)に対して以下のようなSGML文書の登録指示を記述したSQLが送信されたものとする(図4の(1))。 1) SQL describing the registration instruction of the SGML document as follows for the assumed transmitted (in FIG. 4 (1)).

【0016】 [0016] ここで、SGML文書Aは、図5に示すような構成であるものとする。 Here, SGML document A is assumed to be configured as shown in FIG.

【0017】このSQLは、SQL解析部11でUT1 [0017] This SQL, the SQL analysis unit 11 UT1
の本文がSGML列属性であると認識され、SGML文書がSGML解析部12に引き渡される(図4の(2))。 Text is recognized as SGML column attributes, SGML document is delivered to the SGML analyzer 12 (of FIG. 4 (2)). 一方、このSGML文書(SGML文書A) On the other hand, the SGML document (SGML document A)
を受け取ったSGML解析部12では、その内容を解析してタグ識別子とタグ中文書とを抽出し、データアクセス部13に引き渡す。 In SGML analyzing unit 12 receives and extracts the tag identifier and a tag in the document by analyzing the content, transfers the data to the data access section 13. そして、データアクセス部13 Then, the data access unit 13
は、この受け取ったタグ識別子とタグ中文書とをタグ中文書テーブル(TGT1)16に格納する(図4の(3))。 Stores and the received tag identifier and tag in the document to tag the document table (TGT1) 16 (in FIG. 4 (3)). 図6には、このときのタグ中文書テーブル(TGT1)16の格納状態が示されている。 Figure 6 is a storage state of the tag in the document table (TGT1) 16 at this time is shown.

【0018】また、データアクセス部13は、SQL解析部11から受け取ったSQL解析情報(登録データ) [0018] In addition, the data access unit 13, SQL analysis information received from the SQL analysis unit 11 (registration data)
をユーザデータベース17のユーザテーブル(UT1) The user table in the user database 17 (UT1)
に登録する(図4の(4))。 Registered in ((4 in FIG. 4)). 図7には、このときのユーザテーブル(UT1)の格納状態が示されている。 Figure 7 shows a storage state of the user table (UT1) at this time.

【0019】(3)検索 次に、図8乃至図11を参照してSGML文書の検索動作を説明する。 [0019] (3) Find Next, the search operation of the SGML documents with reference to FIGS. 8-11. なお、このとき、ユーザデータベース1 It should be noted that, this time, the user database 1
7のユーザテーブル(UT1)は図9に示す状態にあり、また、タグ中文書テーブル(TGT1)16は図1 7 user table (UT1) is in the state shown in FIG. 9, The tag in the document table (TGT1) 16 Figure 1
0に示す状態にあるものとする。 It shall in the state shown in 0. そして、ここでは、アプリケーションプログラム1から以下のようなSQL And here, such as the following from the application program 1 SQL
(ユーザデータベース17のユーザテーブル(UT1) (User table in the user database 17 (UT1)
に登録されたSGML文書の検索指示を記述したSQ SQ describing the search instruction of the registered SGML document to
L)が送信されたものとする(図8の(1))。 L) is the one sent ((1 in FIG. 8)).

【0020】 SELECT FROM UT1 WHERE 日付 > 19960401 AND CONTAINS(本文,TAG(´TAG2´,´コンピュータ´)) このSQLは、SQL解析部11でUT1の本文がSG [0020] SELECT FROM UT1 WHERE date> 19960401 AND CONTAINS (text, TAG ('TAG2', 'computer')) This SQL, the body of UT1 in the SQL analysis unit 11 SG
ML列属性であると認識され、SGML情報がSGML Is recognized as an ML column attributes, SGML information is SGML
解析部12に引き渡される(図4の(2))。 Is delivered to the analyzing unit 12 (in FIG. 4 (2)). 一方、このこのSGML情報を受け取ったSGML解析部12では、その内容を解析してタグ識別子と検索語句とを抽出し、データアクセス部13に引き渡す(図4の(3))。 On the other hand, in the SGML analyzer 12 has received the this SGML information, extracts the search term and the tag identifier by analyzing the content, transfers the data to the data access section 13 (in FIG. 4 (3)). そして、データアクセス部13では、まず、 Then, the data access unit 13, first,
タグ中文書テーブル(TGT1)16からタグ識別子(TAG2)に検索語句(´コンピュータ´)を含むレコード集合を検索して図11に示すようなテンポラリキーリスト(TKY1)18を作成し、このテンポラリキーリスト(TKY1)18とユーザデータベース17のユーザテーブル(UT1)とを掛け合わせた結果(下記SQLの結果)をアプリケーションプログラム1に返却する(図4の(4))。 Searching for the record set containing the search term from the tag in the document table (TGT1) 16 in the tag identifier (TAG2) ( 'computer') to create a temporary key list (TKY1) 18 as shown in FIG. 11, the temporary key list (TKY1) 18 and a user table (UT1) the user database 17 result and multiplied by the (following SQL results) returns to the application program 1 ((4 in FIG. 4)).

【0021】 SELECT FROM UT1 日付 > 19960401 AND 番号 IN(SELECT KEY FROM TKY1) すなわち、この実施形態のSGML文書検索装置10を適用すれば、アプリケーションプログラム1はSGML [0021] SELECT FROM UT1 date> 19,960,401 the AND ID IN (SELECT KEY FROM TKY1) That is, by applying the SGML document search apparatus 10 of this embodiment, the application program 1 SGML
文書の構成やタグの位置などを意識する必要がなくなり、SQLという標準インタフェースでSGML文書をタグ指定で検索指示することが可能となる。 There is no need to be aware of such as the position of the configuration and tag of the document, it is possible to search instruction SGML documents in the tag specified in the standard interface called SQL.

【0022】 [0022]

【発明の効果】以上詳述したように、この発明によれば、データベースに登録されたSGML文書を汎用的な関係データベース言語であるSQLで検索できるようになるために、このSGML文書を検索するアプリケーションプログラムなどはSGML文書の構成やタグの位置などを意識する必要がなくなり、その処理を単純化することが可能となる。 As described above in detail, according to the present invention, in order to become the SGML documents registered in the database can be searched by SQL is a generic relational database language, to search for the SGML document such as an application program does not need to be aware of the position or the like of the structure and tags SGML document, it is possible to simplify the process.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】この発明の実施形態に係るSGML文書検索装置の機能ブロック図。 Figure 1 is a functional block diagram of the SGML document search apparatus according to the embodiment of the present invention.

【図2】同実施形態のユーザデータベースに設定されるユーザテーブル(UT1)の格納形式を示す図。 It shows a storage format of Figure 2 the user table set in the user database of the embodiment (UT1).

【図3】同実施形態のタグ中文書テーブル(TGT1) [3] the document table in the tag of the embodiment (TGT1)
の格納形式を示す図。 It illustrates the storage format.

【図4】同実施形態のSGML文書の登録動作を説明する図。 Figure 4 illustrates a registration operation of the SGML document of the embodiment.

【図5】同実施形態のSGML文書Aの構成を示す図。 5 is a diagram showing a configuration of an SGML document A of the embodiment.

【図6】同実施形態のタグ中文書テーブル(TGT1) [6] the document table in the tag of the embodiment (TGT1)
の格納状態を示す図。 It shows a storage state.

【図7】同実施形態のユーザテーブル(UT1)の格納状態を示す図。 7 is a diagram showing a storage state of the user table (UT1) of the embodiment.

【図8】同実施形態のSGML文書の検索動作を説明する図。 Figure 8 illustrates a search operation of the SGML document of the embodiment.

【図9】同実施形態のユーザテーブル(UT1)の格納状態を示す図。 9 is a diagram showing a storage state of the user table (UT1) of the embodiment.

【図10】同実施形態のタグ中文書テーブル(TGT [10] the document table in the tag of the embodiment (TGT
1)の格納状態を示す図。 It shows a storage state of 1).

【図11】同実施形態のテンポラリキーリスト(TKY [11] of the same embodiment temporary key list (TKY
1)の格納状態を示す図。 It shows a storage state of 1).

【符号の説明】 DESCRIPTION OF SYMBOLS

10…SGML文書検索装置、11…SQL解析部、1 10 ... SGML document retrieval apparatus, 11 ... SQL analysis unit, 1
2…SGML解析部、13…データアクセス部、14… 2 ... SGML analysis section, 13 ... data access unit, 14 ...
DTD情報、15…タグリスト、16…タグ中文書テーブル、17…ユーザデータベース。 DTD information, 15 ... tag list, 16 ... tags in the document table, 17 ... user database.

Claims (7)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 データベースに登録されたSGML文書を検索するSGML文書検索装置において、 タグ識別子および検索語句を含む前記SGML文書の検索指示を記述したSQLを入力するSQL入力手段と、 前記SQL入力手段により入力されたSQLを解析してSQL情報とSGML情報とに分離するSQL解析手段と、 前記SQL解析手段により分離されたSGML情報からタグ識別子と検索語句とを得るSGML解析手段と、 前記SGML解析手段により得られたタグ識別子で示されるタグの文中に前記検索語句を含み、かつ前記SQL 1. A SGML document search apparatus for searching the SGML document registered in the database, the SQL input means for inputting a SQL describing the search instruction of the SGML document including a tag identifier and a search term, the SQL input means and SGML analyzing means for obtaining the search term a tag identifier from the SGML information and SQL analyzing means is separated into a SQL information and SGML information by analyzing the input SQL, separated by the SQL analysis means by the SGML analysis in the text of the tag indicated by the tag identifier obtained by means comprises said search terms, and the SQL
    情報で指定される条件に合致するSGML文書を前記データベースから検出するデータベース検索手段とを具備してなることを特徴とするSGML文書検索装置。 SGML document search apparatus characterized by the SGML document formed by and a database retrieval means for detecting from the database that match the conditions specified by the information.
  2. 【請求項2】 前記SQL入力手段は、前記SGML文書の登録指示を記述したSQLを入力する手段を有し、 前記SGML解析手段は、予め指定されたDTD情報に基づき、前記SQL解析手段により分離されたSGML Wherein said SQL input means comprises means for inputting a SQL describing the registration instruction of the SGML document, the SGML analyzing means, based on pre-specified DTD information, separated by the SQL analysis unit SGML that is
    情報からタグ文を得る手段を有し、 少なくともSGML文書の識別番号または識別子およびタグ文を保持する検索テーブルと、 前記登録指示されたSGML文書の識別番号または識別子および前記SGML解析手段により得られたタグ文を前記検索テーブルに登録するデータベース登録手段とをさらに具備してなることを特徴とする請求項1記載のS And means for obtaining a tag statement from the information, a lookup table for holding the identification number or identifier and tag statements at least SGML document, obtained by the identification number or identifier and the SGML analyzing means of said registered indicated SGML document S according to claim 1, characterized in that formed by comprising further a database registration means for registering the search table Tagubun
    GML文書検索装置。 GML document retrieval apparatus.
  3. 【請求項3】 前記データベース検索手段は、前記SG Wherein the database search unit, the SG
    ML解析手段により得られたタグ識別子で示されるタグの文中に前記検索語句を含むSGML文書を前記検索テーブルによって特定する請求項2記載のSGML文書検索装置。 SGML document search apparatus according to claim 2, wherein the identifying by the lookup table SGML documents containing the search terms in the text of the tag indicated by the tag identifier obtained by the ML analysis means.
  4. 【請求項4】 データベースに登録されたSGML文書を検索するSGML文書検索方法において、 タグ識別子および検索語句を含む前記SGML文書の検索指示を記述したSQLを入力するステップと、 前記入力されたSQLを解析してSQL情報とSGML 4. A SGML document search method for searching a SGML document registered in the database, inputting the SQL describing the search instruction of the SGML document including a tag identifier and a search phrase, the inputted SQL SQL information and SGML and analysis
    情報とに分離するステップと、 前記分離されたSGML情報からタグ識別子と検索語句とを得るステップと、 前記得られたタグ識別子で示されるタグの文中に前記検索語句を含み、かつ前記SQL情報で指定される条件に合致するSGML文書を前記データベースから検出するステップとからなることを特徴とするSGML文書検索方法。 Includes a step of separating the information, and obtaining the search term a tag identifier from the separated SGML information, the search phrase in the text of the tag indicated by the obtained tag identifier, and in the SQL information SGML document search method SGML documents that match the conditions specified characterized by comprising the step of detecting from the database.
  5. 【請求項5】 SGML文書の識別番号または識別子およびタグ文を保持する検索テーブルを有し、データベースに登録されたSGML文書を検索するSGML文書検索方法において、 タグ識別子および検索語句を含む前記SGML文書の検索指示を記述したSQLを入力するステップと、 前記入力されたSQLを解析してSQL情報とSGML 5. A has a lookup table for holding the identification number or identifier and tag statements SGML document, the SGML document retrieval method for retrieving SGML document registered in the database, the SGML document including a tag identifier and search phrases inputting the describing the search instruction SQL, SQL information by analyzing the inputted SQL and SGML
    情報とに分離するステップと、 前記分離されたSGML情報からタグ識別子と検索語句とを得るステップと、 前記得られたタグ識別子で示されるタグの文中に前記検索語句を含み、かつ前記SQL情報で指定される条件に合致するSGML文書を前記検索テーブルによって前記データベースから検出するステップとからなることを特徴とするSGML文書検索方法。 Includes a step of separating the information, and obtaining the search term a tag identifier from the separated SGML information, the search phrase in the text of the tag indicated by the obtained tag identifier, and in the SQL information SGML document search method SGML documents that match the conditions specified by the retrieval table characterized by comprising the step of detecting from the database.
  6. 【請求項6】 データベースに登録されたSGML文書を検索するプログラムであって、 タグ識別子および検索語句を含む前記SGML文書の検索指示を記述したSQLを入力し、 前記入力されたSQLを解析してSQL情報とSGML 6. A program for searching the SGML document registered in the database, type the SQL describing the search instruction of the SGML document including a tag identifier and a search term, by analyzing the inputted SQL SQL information and SGML
    情報とに分離し、 前記分離されたSGML情報からタグ識別子と検索語句とを得て、 前記得られたタグ識別子で示されるタグの文中に前記検索語句を含み、かつ前記SQL情報で指定される条件に合致するSGML文書を前記データベースから検出するようにコンピュータを動作させるプログラムを記録したコンピュータ読取り可能な記録媒体。 Separated into information, from said separated SGML information to obtain a search term and the tag identifier includes the search terms in the text of the tag indicated by the obtained tag identifier, and is designated by the SQL information a computer-readable recording medium that the SGML document recording a program for operating a computer to detect from the database that matches the conditions.
  7. 【請求項7】 SGML文書の識別番号または識別子およびタグ文を保持する検索テーブルを有するコンピュータ上でデータベースに登録されたSGML文書を検索するプログラムであって、 タグ識別子および検索語句を含む前記SGML文書の検索指示を記述したSQLを入力し、 前記入力されたSQLを解析してSQL情報とSGML 7. A program for searching the SGML document registered in a database on a computer having a search table holding the identification number or identifier and tag statements SGML document, the SGML document including a tag identifier and search phrases the search instruction type the SQL described, SQL information and SGML by analyzing the inputted SQL
    情報とに分離し、 前記分離されたSGML情報からタグ識別子と検索語句とを得て、 前記得られたタグ識別子で示されるタグの文中に前記検索語句を含み、かつ前記SQL情報で指定される条件に合致するSGML文書を前記検索テーブルによって前記データベースから検出するように前記コンピュータを動作させるプログラムを記録したコンピュータ読取り可能な記録媒体。 Separated into information, from said separated SGML information to obtain a search term and the tag identifier includes the search terms in the text of the tag indicated by the obtained tag identifier, and is designated by the SQL information the computer readable recording medium recording a program for operating the computer to detect the SGML document from the database by the search table that matches the conditions.
JP16728497A 1997-06-24 1997-06-24 Device and method for retrieving sgml document Pending JPH1115843A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16728497A JPH1115843A (en) 1997-06-24 1997-06-24 Device and method for retrieving sgml document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16728497A JPH1115843A (en) 1997-06-24 1997-06-24 Device and method for retrieving sgml document

Publications (1)

Publication Number Publication Date
JPH1115843A true true JPH1115843A (en) 1999-01-22

Family

ID=15846910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16728497A Pending JPH1115843A (en) 1997-06-24 1997-06-24 Device and method for retrieving sgml document

Country Status (1)

Country Link
JP (1) JPH1115843A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6853992B2 (en) 1999-12-14 2005-02-08 Fujitsu Limited Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents
US7054854B1 (en) 1999-11-19 2006-05-30 Kabushiki Kaisha Toshiba Structured document search method, structured document search apparatus and structured document search system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054854B1 (en) 1999-11-19 2006-05-30 Kabushiki Kaisha Toshiba Structured document search method, structured document search apparatus and structured document search system
US6853992B2 (en) 1999-12-14 2005-02-08 Fujitsu Limited Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents

Similar Documents

Publication Publication Date Title
US5826258A (en) Method and apparatus for structuring the querying and interpretation of semistructured information
US5123103A (en) Method and system of retrieving program specification and linking the specification by concept to retrieval request for reusing program parts
US6356903B1 (en) Content management system
US6658408B2 (en) Document information management system
US6721736B1 (en) Methods, computer system, and computer program product for configuring a meta search engine
US7092871B2 (en) Tokenizer for a natural language processing system
US5541838A (en) Translation machine having capability of registering idioms
US6947947B2 (en) Method for adding metadata to data
US6968332B1 (en) Facility for highlighting documents accessed through search or browsing
US5303150A (en) Wild-card word replacement system using a word dictionary
US20060282414A1 (en) Question answering system, data search method, and computer program
US20050125720A1 (en) Programmable object model for namespace or schema library support in a software application
Strötgen et al. Multilingual and cross-domain temporal tagging
US20020091688A1 (en) Computer method and apparatus for extracting data from web pages
US20040172584A1 (en) Method and system for enhancing paste functionality of a computer software application
US20040073874A1 (en) Device for retrieving data from a knowledge-based text
US7739588B2 (en) Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
US6446035B1 (en) Finding groups of people based on linguistically analyzable content of resources accessed
US7412643B1 (en) Method and apparatus for linking representation and realization data
US6279006B1 (en) Structured data management system and computer-readable recording medium storing structured data management program
Franzén et al. Protein names and how to find them
US20020178008A1 (en) Method and system for applying input mode bias
US5950184A (en) Indexing a database by finite-state transducer
US20040123233A1 (en) System and method for automatic tagging of ducuments
US20030078766A1 (en) Information retrieval by natural language querying