JP3643943B2 - 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体 - Google Patents

構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体 Download PDF

Info

Publication number
JP3643943B2
JP3643943B2 JP10215997A JP10215997A JP3643943B2 JP 3643943 B2 JP3643943 B2 JP 3643943B2 JP 10215997 A JP10215997 A JP 10215997A JP 10215997 A JP10215997 A JP 10215997A JP 3643943 B2 JP3643943 B2 JP 3643943B2
Authority
JP
Japan
Prior art keywords
document
input
search
elements
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10215997A
Other languages
English (en)
Other versions
JPH10293764A (ja
Inventor
正智 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10215997A priority Critical patent/JP3643943B2/ja
Publication of JPH10293764A publication Critical patent/JPH10293764A/ja
Application granted granted Critical
Publication of JP3643943B2 publication Critical patent/JP3643943B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えば SGML (Standard Generalized Markup Language :ISO 8879)で記述された文書のように、文書を構成するエレメントの名称、及びエレメントの階層構造が定義された構造化文書が蓄積されているデータベースに対する検索方法、検索システム及びそのデータベースに対する検索のコンピュータプログラムが記録されている記録媒体に関する。
【0002】
【従来の技術】
アメリカでは、国防総省、多くの学術研究機関がSGMLを導入しており、民生利用も拡大している。また、インターネットで人気が高いWWW (World-Wide Web)で流通しているコンテンツも、HTML (Hyper Text Markup Language) で記述された構造化文書である。
また、インターネット/イントラネットの普及により、インターネットの場合は世界中の文書に、イントラネットの場合は会社のようなグループ内の文書にネットワークを通じてアクセスできるようになっている。
【0003】
特にイントラネットの普及で、社内文書のような定型文書が電子化されて蓄積されるようになり、ペーパーレス化が促進されている。アメリカ国防総省が、企業活動に関わるすべての情報を電子化してオンライン上で情報交換できるようにしようと展開しているCALS (Continuous Acquisition and Life-cycle Support)プロジェクトでは、情報交換にSGMLを採用しているので、構造化文書はより一般的になると考えられる。
【0004】
構造化文書は論理構造を持っているため、この論理構造を利用することで検索が高速にしかも容易に行える。即ち、SGML文書は文書型定義 (DTD)により文書の構造が定義され、その構造は図11に示すようなツリー構造で表される。従って、例えば、「レポート」というエレメントが「宛先」「タイトル」「本文」「担当」及び「発信元」のエレメントから構成され、これらの中の「本文」が「概要」及び「詳細」のエレメントから構成されている文書構造を持つ文書群から、「○○さん」を宛先として発信されたレポートを検索する場合、全文を検索の対象としなくても、「宛先」のエレメントを指定し、「○○さん」をキーワードとして検索すればよい。
【0005】
【発明が解決しようとする課題】
しかし、構造化文書において上述のような検索を行おうとする場合、ユーザは、キーワードを与えるときに検索対象とすべき文書構造を指定しなければならないので構造化文書の文書構造を把握しておく必要がある。
【0006】
例えば、ユーザは、図11のような8つのエレメントからなるツリー構造のノード毎に付けられているタグ名(エレメント名)を把握して、「○○さん」に発信されたレポートを検索する場合は、「宛先」というエレメント名が検索対象であることを指定し、「○○さん」をキーワードとして入力してやらなければならない。
【0007】
従って、このような検索手法は、高速に検索ができるにもかかわらず、構造化文書の文書構造を把握しておかなければならないという負担が大きいため、ユーザは、従来の全文検索の手法、リレーショナルデータベースの検索手法等を用いる方が検索が容易であると感じる。
【0008】
本発明はこのような問題点を解決するためになされたものであって、構造化文書の文書構造の図式をエレメント名を用いてユーザに示し、図式上のエレメント名に対してユーザがキーワードを入力したエレメントを対象として検索することにより、文書構造がユーザにとって未知である構造化文書を検索する場合であっても、検索対象のエレメントの指定、及びそのエレメントに対するキーワードの入力が容易であって、検索が短時間で行える構造化文書データベースの検索方法、検索システム及び構造化文書データベース検索のコンピュータプログラムが記録されている記録媒体の提供を目的とする。
【0009】
【課題を解決するための手段】
図1は本発明の構造化文書データベース検索方法を実施するシステムの構成図である。
表示装置1は、エレメント名を用いた、エレメントの内容のレイアウト位置を規定した文書フォーマット図、構造化文書の文書構造の所定の階層の構造、又はエレメントの階層構造の構造図といった、構造化文書の文書構造の図式と図式上のエレメント名に対するキーワードの入力画面、検索対象のエレメントがキーワードを入力されたエレメントだけであるか、下位の階層のエレメントを含むかを指定し、またOR、AND の検索条件を指定する画面、検索結果をディスプレイに表示する。
【0010】
キーボード、マウス等からなる入力装置2は、画面に表示された文書構造の図式上のエレメント名に対してキーワードを入力する手段、またキーワードの入力方法を指定する手段、検索条件を指定する手段、各種入力画面の表示命令を入力する手段、及び検索の実行命令を入力する手段である。
【0011】
インタフェースモジュール3は、入力装置2を用いた、ユーザによるキーワード、検索条件等の入力フォームを作成して表示装置1に表示させたり、表示に対する入力装置2からのユーザの入力を受け付け、その入力から問い合わせ(クエリ)言語を作成してサーチエンジン4に渡す。
【0012】
サーチエンジン4は渡された問い合わせ言語により、構造化文書が蓄積されているドキュメントDB(データベース)7に対して検索を行う。SGMLパーサ5はDTD を基に、SGML文書を構文解析(パース)してその妥当性を検証し、SGML文書のエンティティツリーを作成する。
【0013】
エンティティマネージャ6は構文解析した結果をドキュメントDB7へ格納し、文書の実体を管理する。ドキュメントDB7には、ドキュメントを構成するエレメントの名称及びエレメントの階層構造がDTD により定義された構造化文書がエレメントに分割されて蓄積されている。
上述のSGMLパーサ5、エンティティマネージャ6、及びドキュメントDB7によって構成されるSGMLシステムは、構造化文書を構文解析し、エレメントに分割して格納する機能を提供する。
【0014】
スタイルシートDB9は、SGML文書のDTD に応じた文書成形の規則を定めたスタイルシートが蓄積されている。
DSSSL エンジン8は、構文解析されたSGML文書を、スタイルシートDB9に蓄積されている、SGML文書のDTD に応じた文書成形の規則を定めたスタイルシートに沿って表示するための文書成形を行う。
上述のDSSSL エンジン8及びスタイルシートDB9によって構成されるDSSSL システムは、SGML文書を表示するための機能を提供する。
【0015】
インタフェースモジュール3は、SGMLシステム(5,6,7) から文書構造を読み出し、表示形式に沿って表示装置1に入力フォームを出力し、またDSSSL システム(8,9) と連携してキーワードを取得する。
サーチエンジン4はSGMLシステム(5,6,7) 及びDSSSL システム(8,9) と連携して、与えられたクエリに応じて検索を行う。
【0016】
本発明の構造化文書データベース検索方法、構造化文書検索システム及び記録媒体は、インタフェースモジュール3が、ドキュメントDB7に蓄積されているDTD 、及びスタイルシートDB9に蓄積されているそのDTD のスタイルシートによって、エレメントの内容のレイアウト位置を規定した文書フォーマット図を、表示装置1に、例えば枠組みで表示し、文書フォーマット図のレイアウト位置の上下左右等、レイアウト位置に対応付けたキーワードの入力を受け付け、キーワードが入力されたレイアウト位置によって検索対象のエレメントを識別する。サーチエンジン4は、入力されたキーワードに基づいて、ドキュメントDB7に蓄積されているドキュメントの中の、インタフェースモジュール3が識別したエレメントの内容を検索し、文書を獲得する。
【0017】
また、本発明の構造化文書データベース検索方法、構造化文書検索システム及び記録媒体は、インタフェースモジュール3が、ドキュメントDB7に蓄積されているDTD によって、まずエレメントの階層構造のうち、所定の階層に属するエレメント名とその階層関係を表す情報とを表示装置1に表示し、表示したエレメント名及びその階層関係を表す情報とに基づく、エレメント名を表示すべき階層の指定を受け付け、指定された階層のエレメント名を、その階層関係を表す情報とともに表示装置1に表示し、エレメント名に対応付けた、例えばダイアログボックスへのキーワードの入力を受け付け、キーワードが入力されたエレメント名によって検索対象のエレメントを識別する。サーチエンジン4は、入力されたキーワードに基づいて、ドキュメントDTD 7に蓄積されているドキュメントの中の、インタフェースモジュール3が識別したエレメントの内容を検索し、文書を獲得する。
【0018】
さらに、本発明の構造化文書データベース検索方法、構造化文書検索システム及び記録媒体は、インタフェースモジュール3が、ドキュメントDB7に蓄積されているDTD によって、検索対象のエレメントを含む文書を構成する全てのエレメントのエレメント名を用いて、エレメントの階層構造を示す構造図を表示し、この構造図のエレメント名に対応付けた、例えばダイアログボックスへのキーワードの入力を受け付け、キーワードが入力されたエレメント名によって検索対象のエレメントを識別する。サーチエンジン4は、入力されたキーワードに基づいて、ドキュメントDTD 7に蓄積されているドキュメントの中の、インタフェースモジュール3が識別したエレメントの内容を検索し、文書を獲得する。
【0019】
従って、本発明の構造化文書データベース検索方法、構造化文書検索システム及び記録媒体は、文書構造がユーザにとって未知である構造化文書を検索する場合であっても、検索対象のエレメントの指定、及びそのエレメントに対するキーワードの入力が容易であって、検索を短時間で行うことができる。
【0020】
【発明の実施の形態】
以下に、本発明の構造化文書データベース検索方法(以下、本発明方法という)を図に基づいて説明する。
まず、本発明方法に、前述の文書フォーマット図であるスタイル情報を用いる場合について、図2のキーワード入力の説明図、図3のフローチャート、及び図4のキーワード入力例の図に基づき説明する。
【0021】
SGMLでは文書型定義(DTD) で文書の型、即ち、章、節、項といった文書構造を定義する。インタフェースモジュール3は、ドキュメントDB7に格納されているSGML文書のDTD を読み出し、「レポート」「手紙」といった、ツリー構造の最上位の階層のエレメントを一覧表示する。
【0022】
ユーザは、画面に一覧表示されたDTD の中から、検索する文書の型に合ったDTD として、例えば「レポート」を選択して、スタイル情報を表示すべきDTD を決定する(ステップS1)。DSSSL エンジン8は、決定されたDTD 、本例では「レポート」の文書成形の規則を定めたスタイルシートをスタイルシートDB9から読み込み(ステップS2)、フローオブジェクトを生成して、図2に示すような「レポート」の文書フォーマット図を表示装置1に表示する(ステップS3)。
【0023】
この文書フォーマット図により、ユーザはその文書構造を知らなくても、「レポート」が、「宛先」「発信元」「タイトル」「本文」及び「担当」のエレメントから構成され、「本文」が「概要」及び「詳細」のエレメントから構成されていることと、それぞれのエレメントの内容の表示されるレイアウト位置がどの辺りであるかを、その枠組みで視覚的に把握することができる。
【0024】
インタフェースモジュール3は、表示された文書フォーマット図に対してキーワードの入力があるか否かを監視し(ステップS4)、キーワードが入力された場合は、その入力位置から、キーワードが入力されたエレメントを判定する。
インタフェースモジュール3は、入力されたキーワードからクエリを作成してサーチエンジン4に渡す(ステップS5)。サーチエンジン4はインタフェースモジュール3から渡されたクエリにより、ドキュメントDB7の中の検索対象のエレメントの内容を検索して目的の文書を獲得する(ステップS6)。
【0025】
このとき、図4に示すように、複数のエレメントに対するキーワードの入力が可能である。複数のエレメントに対してキーワードが入力された場合、インタフェースモジュール3は、入力された複数のキーワードとデフォルトで設定されている検索条件(OR検索又はAND 検索)とからクエリを作成するか、又は、図4に示すように、検索条件の入力画面を表示してユーザに選択を促し、選択された検索条件と入力されたキーワードとからクエリを作成する。
【0026】
例えば、「タイトル」エレメントにキーワード「見積もり」が、また「担当」エレメントにキーワード「富士太郎」が入力され、AND 検索を行う場合は、「タイトル」エレメントの中に文字列「見積もり」が含まれるとともに、「担当」エレメントの中に文字列「富士太郎」が含まれる文書を検索する。
上述の入力でOR検索を行う場合は、エレメント「タイトル」の中に文字列「見積もり」が含まれるか、又はエレメント「担当」の中に文字列「富士太郎」が含まれる文書を検索する。
【0027】
図4は、検索条件の指定においてエレメント間の関係( and ,or) を表したリンクを別のリンクの対象とする場合の入力例を示している。
「宛先」エレメントにキーワード「経理」、「発信元」エレメントにキーワード「経理」、「タイトル」エレメントにキーワード「見積もり」、「担当」エレメントにキーワード「富士太郎」が入力されている。
【0028】
入力したキーワードによって、「AND 検索」「OR検索」「複合検索」のいずれを実行するかをユーザに選択させるために、例えばボタン、メニュー等を表示する。さらに「複合検索」においては「AND リンク」「ORリンク」のいずれを設定するかをユーザに選択させるためのボタン、メニュー等を表示する。
【0029】
例えば、ユーザが、ボタン、メニュー等の「複合検索」及び「AND リンク」を選択し、ポインタPによって「発信元」、「タイトル」、及び「担当」エレメントを指定すると、これらのエレメントが、例えば実線で結ばれ、AND リンクが設定されたことが表示される。
次に、ユーザが「ORリンク」を選択し、AND リンクの実線と、「宛先」エレメントをポインタPによって指定すると、AND リンクの実線と「宛先」エレメントとが、例えば破線で結ばれ、ORリンクが設定されたことが表示される。
【0030】
以上の設定の結果、「発信元」エレメントに文字列「経理」が含まれ、かつ「タイトル」エレメントに文字列「見積もり」が含まれ、かつ「担当」エレメントに文字列「富士太郎」が含まれる文書か、又は「宛先」エレメントに文字列「経理」が含まれる文書を検索するクエリが作成される。
【0031】
さらに、検索条件として、キーワードが入力されたエレメントだけを検索対象とする「単体検索」か、そのエレメントの下位の階層のエレメントも検索対象に含む「階層検索」かを選択することもできるようになっている。
【0032】
なお、検索条件の選択方法はメニュー、ボタンに限定されるものではなく、文字入力、番号選択等の他の選択方法も可能である。
また、複合検索におけるAND リンク、ORリンクの別を表す方法は実線、破線等の線種による方法に限らず、線の色を変える、AND/ORの文字で表示する等の他の方法であってもよい。さらに、必ずしも表示しなくてもよい。
【0033】
次に、本発明方法にエレメント構造情報のみを用いる場合について、図5のキーワード入力の説明図、図6のフローチャート、及び図7のキーワード入力例の図に基づいて説明する。
前述の場合と同様に、インタフェースモジュール3は、ドキュメントDB7に格納されているSGML文書のDTD を読み出し、「レポート」「手紙」といった、ツリー構造の最上位の階層の一覧を表示するが、本例ではリスト形式で表示する(ステップS11)。
【0034】
ユーザは、画面にリスト形式で一覧表示されたDTD の中から、検索する文書の型に合ったDTD を決定する(ステップS12)。このとき、インタフェースモジュール3は、例えば「レポート」の文字列上がクリックされたか、又は「レポート」の欄に設けられた、下位の階層が存在することを示すマークがクリックされたかを識別して、エレメントが選択されたか否かを判定する(ステップS13)。
エレメントの欄のマークがクリックされた場合、「レポート」の下位の階層の「宛先」「タイトル」…のエレメント名(タグ名)をリスト形式で表示する(ステップS14)。
【0035】
「レポート」の階層の場合と同様、下位の階層のエレメントの文字列上がクリックされたか、又はエレメントの欄に設けられているマークがクリックされたかを識別して、エレメントが選択されたか否かを判定する(ステップS13)。
例えば、「本文」のエレメントの欄のマークがクリックされた場合は、さらに下位の階層のタグリストを表示する(ステップS14)。
【0036】
一方、エレメントの文字列がクリックされた場合は、キーワードの入力画面を表示し、カーソルを点滅させてキーワードの入力待ちとなる(ステップS15)。キーワードが入力されると、検索の開始が指示されたか否かをチェックし(ステップS16)、検索の開始が指示されない場合はステップS13に戻って、ユーザからの次の入力待ちになる。
【0037】
前述の場合と同様、入力したキーワードによって、「AND 検索」「OR検索」「複合検索」のいずれを実行するかをユーザに選択させるために、例えばボタン、メニュー等を表示する。さらに「複合検索」においては「AND リンク」「ORリンク」のいずれを設定するかをユーザに選択させるためのボタン、メニュー等を表示する。
また、前述の場合と同様、検索条件として、キーワードが入力されたエレメントだけを検索対象とする「単体検索」か、そのエレメントの下位の階層のエレメントも検索対象に含む「階層検索」かを選択することもできるようになっている。
【0038】
検索の開始が指示されると、インタフェースモジュール3は、入力されたキーワードからクエリを作成して(ステップS17)サーチエンジン4に渡し、サーチエンジン4はインタフェースモジュール3から渡されたクエリにより、ドキュメントDB7の中の検索対象のエレメントの内容を検索して目的の文書を獲得する(ステップS18)。
【0039】
このとき、図7に示すように、複数のエレメントに対するキーワードの入力が可能である。複数のエレメントに対してキーワードが入力された場合、インタフェースモジュール3は、入力された複数のキーワードとデフォルトで設定されている検索条件(OR検索又はAND 検索)とからクエリを作成するか、又は、図7に示すように、検索条件の入力画面を表示してユーザに選択を促し、選択された検索条件と入力されたキーワードとからクエリを作成する。
【0040】
図7のようなキーワード入力で、AND 検索と単体検索とが選択された場合、「レポート」エレメントに文字列「経理」が含まれ、かつ「タイトル」エレメントに文字列「見積もり」が含まれ、かつ「本文」エレメントに文字列「FMV 」が含まれる文書を検索するクエリが作成される。
【0041】
また図7のようなキーワード入力で、OR検索と単体検索とが選択された場合、「レポート」エレメントに文字列「経理」が含まれるか、又は「タイトル」エレメントに文字列「見積もり」が含まれるか、又は「本文」エレメントに文字列「FMV 」が含まれる文書を検索するクエリが作成される。
なお、各エレメントに与えるキーワードにAND 、OR、正規表現を記述することもできる。
【0042】
図7のようなキーワード入力で、AND 検索と階層検索とが選択された場合、「レポート」エレメントより下位のエレメントに文字列「経理」が含まれ、かつ「タイトル」エレメントに文字列「見積もり」が含まれ、かつ「本文」エレメントより下位のエレメントに文字列「FMV 」が含まれる文書を検索するクエリが作成される。
【0043】
以上のように、本例の場合は階層順を追ってエレメントの構造図を表示していくので、一画面でエレメントの構造を表示できない巨大な構造の構造化文書に対しても、目的のエレメントにキーワードをスムーズに与えることができる。
【0044】
次に、本発明方法にエレメント構造情報のみを用いる他の場合について、図8のキーワード入力の説明図、図9のフローチャート、及び図10のキーワード入力例の図に基づいて説明する。
前述の場合と同様に、インタフェースモジュール3は、ドキュメントDB7に格納されているSGML文書のDTD を読み出し「レポート」「手紙」といった、ツリー構造の最上位の階層のエレメントを一覧表示する。
【0045】
ユーザは、画面にリスト形式で一覧表示されたDTD の中から、検索する文書の型に合ったDTD を決定する(ステップS21)。DSSSL エンジン8は、決定されたDTD 、本例では「レポート」の文書成形の規則を定めたスタイルシートをスタイルシートDB9から読み込み、フローオブジェクトを生成して、図8に示すような、「レポート」のツリー構造の構造図を表示装置1に表示する(ステップS22)。
【0046】
この構造図により、ユーザはその文書構造を知らなくても、「レポート」が、「宛先」「発信元」「タイトル」「本文」及び「担当」のエレメントから構成され、「本文」が「概要」及び「詳細」のエレメントから構成されていることを把握することができる。
【0047】
インタフェースモジュール3は検索の開始が指示されたか否かをチェックし(ステップS23)、検索開始が指示されない場合は、表示した構造図のエレメントに対する選択入力待ちとなる(ステップS24)。
いずれかのエレメントが選択されると、そのエレメントに対応付けて、キーワードの入力画面を表示し、カーソルを点滅させてキーワードの入力待ちとなる(ステップS25)。
【0048】
キーワードが入力されると、検索の開始が指示されたか否かをチェックし(ステップS23)、検索の開始が指示されない場合は、表示した構造図のエレメントに対する選択入力待ちとなる(ステップS24)。
いずれかのエレメントが選択されると、そのエレメントに対応付けて、キーワードの入力画面を表示し、カーソルを点滅させてキーワードの入力待ちとなる(ステップS25)。
【0049】
検索の開始が指示されると、インタフェースモジュール3は、入力されたキーワードからクエリを作成してサーチエンジン4に渡し(ステップS26)、サーチエンジン4はインタフェースモジュール3から渡されたクエリにより、ドキュメントDB7の中の検索対象のエレメントの内容を検索して目的の文書を獲得する(ステップS27)。
【0050】
前述の場合と同様、入力したキーワードによって、「AND 検索」「OR検索」「複合検索」のいずれを実行するかをユーザに選択させるために、例えばボタン、メニュー等を表示する。さらに「複合検索」においては「AND リンク」「ORリンク」のいずれを設定するかをユーザに選択させるためのボタン、メニュー等を表示する。
【0051】
また、前述の場合と同様、検索条件として、キーワードが入力されたエレメントだけを検索対象とする「単体検索」か、そのエレメントの下位の階層のエレメントも検索対象に含む「階層検索」かを選択することもできるようになっている。
なお、各エレメントに与えるキーワードにAND 、OR、正規表現を記述することができる。
【0052】
このとき、図10に示すように、複数のエレメントに対するキーワードの入力が可能である。複数のエレメントに対してキーワードが入力された場合、インタフェースモジュール3は、入力された複数のキーワードとデフォルトで設定されている検索条件(OR検索又はAND 検索)とからクエリを作成するか、又は、図10に示すように、検索条件の入力画面を表示してユーザに選択を促し、選択された検索条件と入力されたキーワードとからクエリを作成する。
【0053】
図10のようなキーワード入力で、AND 検索と単体検索とが選択された場合、「タイトル」エレメントに文字列「見積もり」が含まれ、かつ「担当」エレメントに文字列「富士太郎」が含まれる文書を検索するクエリが作成される。
また図10のようなキーワード入力で、OR検索と単体検索とが選択された場合、「タイトル」エレメントに文字列「見積もり」が含まれるか、又は「担当」エレメントに文字列「富士太郎」が含まれる文書を検索するクエリが作成される。
【0054】
なお、上述のようなキーワード入力のいずれかをユーザに選択させるメニュー画面を設けてもよい。
【0055】
【発明の効果】
以上のように、本発明の構造化文書データベースの検索方法、検索システム及び記録媒体は、構造化文書の文書構造の図式をエレメント名を用いてユーザに示し、図式上のエレメント名に対してユーザがキーワードを入力したエレメントを対象として検索するので、文書構造がユーザにとって未知である構造化文書を検索する場合であっても、検索対象のエレメントの指定、及びそのエレメントに対するキーワードの入力が容易であって、検索が短時間で行えるという優れた効果を奏する。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】スタイル情報を用いたキーワード入力の説明図である。
【図3】図2による検索方法のフローチャートである。
【図4】スタイル情報を用いたキーワード入力例の図である。
【図5】構造情報を用いたキーワード入力の説明図(その1)である。
【図6】図5による検索方法のフローチャートである。
【図7】図5の構造情報を用いたキーワード入力例の図である。
【図8】構造情報を用いたキーワード入力の説明図(その2)である。
【図9】図8による検索方法のフローチャートである。
【図10】図8の構造情報を用いたキーワード入力例の図である。
【図11】構造化文書の構造の一例の図である。
【符号の説明】
1 表示装置
2 入力装置
3 インタフェースモジュール
4 サーチエンジン
5 SGMLパーサ
6 エンティティマネージャ
7 ドキュメントDB
8 DSSSL エンジン
9 スタイルシートDB

Claims (7)

  1. 文書を構成するエレメントの名称、及びエレメントの階層構造が記憶手段に記憶され、文書におけるエレメントの内容の表示方法を規定する文書の成形規則が関連付けられた構造化文書が構造的に分割されて蓄積されている構造化文書データベースに対してコンピュータが行う構造化文書データベース検索方法において、
    前記コンピュータは、
    入力手段を介して指定された文書を構成するエレメントの名称及びエレメントの階層構造を、前記構造化文書データベースから取得し、
    前記構造化文書データベースに記憶された文書のエレメントの内容の表示方法を規定する成形規則に基づいて、文書のエレメントの内容が表示される一又は複数の表示位置、及び該表示位置に設けた入力可能領域を設定し、該入力可能領域と文書のエレメントの名称とを対応付けたレイアウトを生成し、
    前記生成したレイアウトを設定した表示位置に表示し、
    いずれかの前記入力可能領域にキーワードが入力された旨を検知した場合、入力されたキーワードと、入力された入力可能領域に対応付けられたエレメントの名称を特定し、
    入力されたキーワードに基づいて、特定されたエレメントの名称に対応付けて記憶されている内容を前記構造化文書データベースから検索し、キーワードが含まれている文書を獲得することを特徴とする構造化文書データベース検索方法。
  2. キーワードの入力方法の指定を受け付け、指定された入力方法に基づいてキーワードの入力を受け付けることを特徴とする請求項1記載の構造化文書データベース検索方法。
  3. 識別したエレメントに加え、該エレメントの下位の階層に属するエレメントを検索対象とする請求項1又は2記載の構造化文書データベース検索方法。
  4. 検索対象のエレメントが複数の場合、AND検索又はOR検索のいずれかの検索条件で検索を実行する請求項1乃至のいずれかに記載の構造化文書データベース検索方法。
  5. 検索対象のエレメントが複数の場合、AND検索及び/又はOR検索の指定を受け付け、指定された検索条件で検索を実行する請求項1乃至3のいずれかに記載の構造化文書データベース検索方法。
  6. 文書を構成するエレメントの名称、及びエレメントの階層構造が記憶手段に記憶され、文書におけるエレメントの内容の表示方法を規定する文書の成形規則が関連付けられた構造化文書が構造的に分割されて蓄積されているコンピュータが行う構造化文書データベース検索システムにおいて、
    前記コンピュータは、
    入力手段を介して指定された文書を構成するエレメントの名称及びエレメントの階層構造を、前記構造化文書データベースから取得する手段と、
    前記構造化文書データベースに記憶された文書のエレメントの内容の表示方法を規定する成形規則に基づいて、文書のエレメントの内容が表示される一又は複数の表示位置、及び該表示位置に設けた入力可能領域を設定し、該入力可能領域と文書のエレメントの名称とを対応付けたレイアウトを生成する手段と、
    前記生成したレイアウトを設定した表示位置に表示する手段と、
    いずれかの前記入力可能領域にキーワードが入力された旨を検知した場合、入力されたキーワードと、入力された入力可能領域に対応付けられたエレメントの名称を特定する手段と、
    入力されたキーワードに基づいて、特定されたエレメントの名称に対応付けて記憶されている内容を前記構造化文書データベースから検索し、キーワードが含まれている文書を獲得する手段と
    を備えたことを特徴とする構造化文書データベース検索システム。
  7. 文書を構成するエレメントの名称、及びエレメントの階層構造が記憶手段に記憶され、文書におけるエレメントの内容の表示方法を規定する文書の成形規則が関連付けられた構造化文書が構造的に分割されて蓄積されている構造化文書データベースに対して検索を実行するコンピュータでの読み取りが可能なプログラムコード手段を格納しており、前記コンピュータでの使用が可能な記録媒体において、
    前記プログラムコード手段が、前記コンピュータに、
    入力手段を介して指定された文書を構成するエレメントの名称及びエレメントの階層構造を、前記構造化文書データベースから取得するコード手段と、
    前記構造化文書データベースに記憶された文書のエレメントの内容の表示方法を規定する成形規則に基づいて、文書のエレメントの内容が表示される一又は複数の表示位置、及び該表示位置に設けた入力可能領域を設定し、該入力可能領域と文書のエレメントの名称とを対応付けたレイアウトを生成するコード手段と、
    前記生成したレイアウトを設定した表示位置に表示するコード手段と、
    いずれかの前記入力可能領域にキーワードが入力された旨を検知した場合、入力されたキーワードと、入力された入力可能領域に対応付けられたエレメントの名称を特定するコード手段と、
    入力されたキーワードに基づいて、特定されたエレメントの名称に対応付けて記憶されている内容を前記構造化文書データベースから検索し、キーワードが含まれている文書を獲得するコード手段と
    を含むことを特徴とする記録媒体。
JP10215997A 1997-04-18 1997-04-18 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体 Expired - Fee Related JP3643943B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10215997A JP3643943B2 (ja) 1997-04-18 1997-04-18 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10215997A JP3643943B2 (ja) 1997-04-18 1997-04-18 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体

Publications (2)

Publication Number Publication Date
JPH10293764A JPH10293764A (ja) 1998-11-04
JP3643943B2 true JP3643943B2 (ja) 2005-04-27

Family

ID=14319957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10215997A Expired - Fee Related JP3643943B2 (ja) 1997-04-18 1997-04-18 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3643943B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3784060B2 (ja) 2003-01-10 2006-06-07 インターナショナル・ビジネス・マシーンズ・コーポレーション データベース検索システム、その検索方法及びプログラム
CN105335383B (zh) * 2014-06-30 2019-12-24 百度在线网络技术(北京)有限公司 输入信息的处理方法及装置

Also Published As

Publication number Publication date
JPH10293764A (ja) 1998-11-04

Similar Documents

Publication Publication Date Title
JP3842573B2 (ja) 構造化文書検索方法、構造化文書管理装置及びプログラム
US7293018B2 (en) Apparatus, method, and program for retrieving structured documents
US6594669B2 (en) Method for querying a database in which a query statement is issued to a database management system for which data types can be defined
US6442576B1 (en) Searching for documents with multiple element types
US20080027933A1 (en) System and method for location, understanding and assimilation of digital documents through abstract indicia
JP2004518207A (ja) 照会条件、計算、公式および数式の編集
TW201250492A (en) Method and system of extracting web page information
JP2006525601A (ja) 概念ネットワーク
JPH07319917A (ja) 文書データべース管理装置および文書データべースシステム
KR100403947B1 (ko) 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물
JPH08305729A (ja) ネットワーク情報フィルタリングシステム
JP3832693B2 (ja) 構造化文書検索表示方法及び装置
JP4084647B2 (ja) 情報検索システム、情報検索方法及び情報検索プログラム
JPH1097541A (ja) 文書ブラウズ支援システムおよび文書処理システム
JP3914081B2 (ja) アクセス権限設定方法および構造化文書管理システム
JP3643943B2 (ja) 構造化文書データベース検索方法、構造化文書データベース検索システム及び記録媒体
JPH10124518A (ja) 優先アクセスウェブブラウジング処理装置
JP3842576B2 (ja) 構造化文書編集方法及び構造化文書編集システム
JP3842572B2 (ja) 構造化文書管理方法および構造化文書管理装置およびプログラム
JPH11288412A (ja) 文書作成方法及びシステム及び文書作成プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09245052A (ja) 構造化文書処理装置
WO2001029709A1 (en) System and method for location, understanding and assimilation of digital documents through abstract indicia
JP2004118543A (ja) 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
JP3842574B2 (ja) 情報抽出方法および構造化文書管理装置およびプログラム
JP2005011301A (ja) 文書処理装置及び文書処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140210

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees