JP3630062B2 - 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体 - Google Patents

半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP3630062B2
JP3630062B2 JP2000043427A JP2000043427A JP3630062B2 JP 3630062 B2 JP3630062 B2 JP 3630062B2 JP 2000043427 A JP2000043427 A JP 2000043427A JP 2000043427 A JP2000043427 A JP 2000043427A JP 3630062 B2 JP3630062 B2 JP 3630062B2
Authority
JP
Japan
Prior art keywords
search
semi
structured document
document
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000043427A
Other languages
English (en)
Other versions
JP2001236352A (ja
Inventor
孝志 林
裕一 飯塚
史朗 春日
源吾 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000043427A priority Critical patent/JP3630062B2/ja
Publication of JP2001236352A publication Critical patent/JP2001236352A/ja
Application granted granted Critical
Publication of JP3630062B2 publication Critical patent/JP3630062B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体に係り、特に、表形式で表現されるリレーショナルデータベース等を扱う検索言語を用いて文書要素及びその階層構造で表現される半構造化文書内の情報を検索するための半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体に関する。
【0002】
詳しくは、文書における要素間の関係を保持することで、検索要求時に検索式で指定された項目に対して、文書から値を取得し、動的に表を作成し、条件処理を行うことで検索を実行し得る検索言語による半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体に関する。
【0003】
【従来の技術】
近年、XML(eXtensible Markup Language: 拡張可能なマーク付言語) が、情報流通フォーマットとして注目を集めており、電子商取引への応用が期待されている。そこで、XML文書を効率良く検索する技術が必要となってきている。XML文書は、文書要素及びその階層構造により表現される。XML文書に対する検索言語は、XQLや、XML−QLなどが提案されているが、標準化されていない。一方、情報を管理・検索する既存のシステムの中ではデータベースが重要な役割を果しており、特に、リレーショナルデータベースが普及している。
【0004】
リレーショナルデータベースを扱う言語の基準規格としてSQLが広く世の中で使われている。
【0005】
【発明が解決しようとする課題】
しかしながら、情報源としてXML文書とリレーショナルデータベースとが共に存在することは以下のような問題を生じている。
【0006】
(1) 検索インタフェースの不統一性
表形式のリレーショナルデータベースが普及しており、検索言語としてSQLを用いるアプリケーションが多く存在している。このようなアプリケーションから階層構造により表現されるXML文書内の情報検索が行えない。
【0007】
(2) 検索効率の悪化
所望の情報がリレーショナルデータベースとXML文書に分散している場合、各々の情報源から検索する必要があり、効率が非常に悪い。
【0008】
(3) 検索結果の不統一性
各々の情報源からの検索結果の形式が不統一なため、検索結果の比較が困難である。
【0009】
本発明は、上記の点に鑑みなされたもので、従来のSQLを用いて、検索要求時にSQLで指定された項目に対して、XML文書から値を取得し、動的に表を作成し、条件処理を行うことで検索を実行し得るSQLによるXML文書内情報を検索することが可能な半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体を提供することを目的とする。
【0010】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0012】
本発明(請求項)は、文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索する半構造化文書検索装置における、半構造化文書検索方法であって、
検索言語解析手段において、入力された表形式で表現されるリレーショナルデータベースを含むデータベースの検索を行なうための検索言語を解析する検索言語解析過程(ステップ1)と、
半構造化文書解析手段において、情報源から読み込まれた文書要素及び該文書要素の階層構造で表現される半構造化文書の構文を解析する半構造化文書解析過程(ステップ2)と、
グルーピング手段において、検索言語解析手段により解析された検索項目に対応する半構造化文書の解析結果にグルーピング番号を付与するグルーピング過程(ステップ3)と、
全検索手段において、半構造化文書解析過程で解析された半構造化文書の結果に基づいて、検索言語で指定された項目に対応する要素の半構造化文書階層構造上の位置を取得し、グルーピング番号が付与された全項目に共通する親要素名を検出し、グループ間で直積をとり、結果リストを生成する全検索手段(ステップ4)と、
関係代数演算手段において、結果リストに対して関係代数演算を行ない、該結果リストに対して条件の比較を行い、条件を満たした結果のみを検索結果として返却する関係代数演算過程(ステップ5)と、を行なう。
【0013】
本発明(請求項)は、全検索過程において、
全検索手段は、検索言語の検索式に半構造化文書のJOINを指定し、複数の半構造化文書における半構造化文書内情報をJOINし、ひとつの表形式で返却する。
【0014】
本発明(請求項)は、全検索過程において、
全検索手段は、検索言語の検索式に半構造化文書のUNIONを指定し、
複数の半構造化文書における半構造化文書内情報をUNIOINし、ひとつの表形式で返却する。
【0015】
図2は、本発明の原理構成図である。
【0016】
本発明(請求項)は、文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索するための、半構造化文書検索装置であって、
入力された表形式で表現されるリレーショナルデータベースを含むデータベースの検索を行なうための検索言語を解析する検索言語解析手段110と、
情報源から読み込まれた文書要素及び該文書要素の階層構造で表現される半構造化文書の構文を解析する半構造化文書解析手段120と、
検索言語解析手段110により解析された検索項目に対応する半構造化文書の解析結果にグルーピング番号を付与するグルーピング手段130と、
半構造化文書解析手段120で解析された半構造化文書の結果に基づいて、検索言語で指定された項目に対応する要素の半構造化文書階層構造上の位置を取得し、グルーピング番号が付与された全項目に共通する親要素名を検出し、グループ間で直積をとり、結果リストを生成する全検索手段140と、
結果リストに対して関係代数演算を行ない、該結果リストに対して条件の比較を行い、条件を満たした結果のみを検索結果として返却する関係代数演算手段150と、を有する。
【0018】
本発明(請求項)は、全検索手段140において、検索言語の検索式に半構造化文書のJOINを指定し、複数の半構造化文書における半構造化文書内情報をJOINする手段を含む。
【0019】
本発明(請求項)は、全検索手段140において、検索言語の検索式に反抗増加文書のUNIONを指定し、複数の半構造化文書における半構造化文書内情報をUNIONする手段を含む。
【0020】
本発明(請求項)は、文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索するための、半構造化文書検索プログラムを格納した記憶媒体であって、
請求項1乃至3記載の半構造化文書検索方法を実現するための処理をコンピュータに実行させるプログラムを格納した記憶媒体である。
【0023】
上記のように、本発明では、XML文書における要素間の関係を保持しておき、SQL文で指定された項目は、XML文書の要素に対応し、検索要求時にSQLで指定された項目に対して、XML文書から値を取得し、動的に表を作成し、取得した表において条件処理を必要とする場合には、条件処理を施し、統一フォーマットの検索結果を出力するため、XML文書内の情報を一つの表形式で返却する、XML文書情報の検索を行うことが可能となる。
【0024】
また、本発明では、SQL文で指定された複数のXML文書に対して、XML文書の要素間の関係を保持し、それぞれ前述の処理を行い、条件処理を必要とする場合には、条件処理を施し、動的に作成された複数の表の間でJOINし、複数のXML文書内の情報を一つの表形式で返却する、複数XML文書情報の検索を行うことが可能となる。
【0025】
また、本発明では、SQL文で指定された複数のXML文書に対して、XML文書の要素間の関係を保持し、それぞれ前述の手段を行い、条件処理を必要とする場合には、条件処理を施し、動的に作成された表の間でUNIONし、複数のXML文書内の情報を一つの表形式で返却する、複数XML文書情報の検索を行うことが可能となる。
【0026】
【発明の実施の形態】
まず、以下の説明において使用される用語について説明する。
【0027】
SQL文:リレーショナルデータベースを扱うための言語であり、同様の文法でXML文書を扱う。
【0028】
要素:<要素名>要素の内容</要素名>で表されるXML文書の内容の単位項目:SQL文の句で指定される。以下の説明でのSQL文ではXML文書の要素名を指定する。複数のXML文書に同一の要素名が存在しても、予めファイル名で区別しておき、一意に指定可能。
【0029】
属性:XML文において要素に付けられた付属情報。
【0030】
1対1関係:XML文書の同一階層において、ある要素が存在するときに、必ず対応する要素が存在する関係。
【0031】
グルーピング番号:検索項目に対する関係を表すグループを識別するために付与された番号、検索項目のグルーピング番号が同一である場合、その関係は1対1関係となる。
【0032】
本発明では、既存のリレーショナルデータベースで管理されている情報と同様に、XML文書を扱い、複数のXML文書内の情報をSQLにより効率的に検索するシステムを構築するために以下の点について解決する。
【0033】
(1) 検索インタフェースの統一:
検索言語としてSQLを用いることで、従来のアプリケーションからXML文書内情報の検索を行えるようにする。
【0034】
(2) 複数のXML文書からの検索:
複数のXML文書におけるXML文書内情報をJOINやUNIONし、一つの表形式で返却する検索方法を用いる。
【0035】
(3) 検索結果の統一:
XML文書からの検索結果を表形式とすることで、既存のリレーショナルデータベースから検索結果を統一する。
【0036】
上記の内容を行うために、階層構造モデルをリレーショナルモデルに写像する必要がある。このためには、検索する前に一括してXML文書を階層構造に従い分割し、リレーショナルデータベースに格納する方式が考えられる。しかし、XML文書を一括してリレーショナルモデルに変換する方式では、検索が高速に行えるといった性能的なメリットがある反面、文書の論理構造のわずかな変化がデータベーススキーマに影響を及ぼすために、構造の変更が多い文書の管理には不向きである。そこで、内容・構造が変更される可能性が高いXML文書内の情報をSQLにより検索するシステムを構築するためには、以下の点を解決する必要がある。
【0037】
(4) 動的なリレーショナルモデルへの写像:
検索要求時にSQLで指定された項目に対して、XML文書から要素の値を取得し、動的にリレーショナルモデルに写像していく。
【0038】
図3は、本発明のデータベース検索言語による半構造化文書内情報の検索装置の構成を示す。
【0039】
ユーザは、検索装置100にアプリケーションプログラム300を介して、SQL検索文を入力し、検索装置100は、XML文書200内からSQL検索文に指定された情報を検索し、検索装置100は、XML文書200内からSQL検索文に指定された情報を検索し、検索装置100は、アプリケーションプログラム300に検索結果を表形式で返却するものである。
【0040】
同図に示す検索装置100は、SQL文解析モジュール110、XMLパーサ120、グルーピングモジュール130、全検索モジュール140、関係代数演算処理モジュール150から構成される。
【0041】
SQL文解析モジュール110は、アプリケーションプログラム300から入力されるSQL文を解析し、検索結果項目、検索条件項目や関係代数演算項目、検索対象情報源を抽出する。
【0042】
XMLパーサ120は、検索対象情報源に指定されたXML文書を読み込み、XML文書の構文解析を行い、要素を階層構造に展開する。
【0043】
グルーピングモジュール130は、グルーピング番号を付与する。
【0044】
全検索処理モジュール140は、検索条件項目に指定された項目に対応するXML文書の要素の値を抽出する。
【0045】
関係代数演算処理モジュール150は、検索条件項目や関係代数演算項目に基づいて、抽出されたXML文書の値に対して処理を行い、検索結果を得る。
【0046】
上記SQLによるXML文書内情報の検索装置100は、
(1)SQL文解析処理;
(2)XML文書解析処理
(3)グルーピング処理
(4)全検索処理
(5)関係代数演算処理;
の5段階の処理を実施する。
【0047】
【実施例】
以下、図面と共に本発明の実施例を説明する。
【0048】
検索装置100の前述の(1)から(5)の処理を図4に示すXML文書と図5に示すSQL文を用いて説明する。
【0049】
図6は、本発明の検索処理のフローチャートである。
【0050】
ステップ100) SQL文解析処理:
上記SQL文解析モジュール110にアプリケーションプログラムを介して、図5に示すSQL文が入力される。SQL文が解析され、検索結果項目を示すSELECT項目、検索条件項目を示すWHERE項目、検索対象情報源を示すFROM項目を抽出する。図5のSQL文は、図4のXML文書の“reciple−book”要素以下の含まれる情報を検索対象となる表として指定し、ing 要素が“バター”という検索条件で要素「name」、要素「ing 」、要素「amount」を結果として並べた表形式で返却する問い合わせを示す。
【0051】
ステップ200) XML文書解析処理:
上記のXMLパーサ120によってSQL文のFROM項目で指定されたXML文書を読み込み、その構文を解析する。図4のXML文書の要素を階層構造に展開した様子を図7に示す。
【0052】
ステップ300) グルーピング処理:
上記グルーピングモジュール130によって検索項目に対してグルーピング番号を付与する。1対1関係はXML文書の文書型定義で参照される。図5のSQL文の場合、
文書型定義:<!ELEMENT in−list(ing,amout)+>
となっており、検索項目の要素ing と要素amountが1対1関係である。従って、同一のグルーピング番号が付与される。
【0053】
文書型定義がない場合はXMLパーサ400によって解析されたXML文書の階層構造の親子関係から1対1関係を推定する。これは、図7の階層構造において同一階層の検索項目の要素ing と要素amountとが必ず1対1で存在することがわかる。図5のSQL文の検索項目に対してグルーピング番号を付与した例を表1に示す。
【0054】
【表1】
Figure 0003630062
図8のXML文書に示すように文書型定義がない場合は、XMLパーサ120によって解析されたXML文書の階層構造の親子関係を利用して、検索項目に対してグルーピング番号を付与する。
【0055】
以下にその具体的な手順を示す。
・ SQL文で指定された検索項目に対応するXML文書の要素に対して、XML文書内での出現順に番号を付与する。図8のXML文書では、name要素に0、ing 要素に1、amount要素に2が付与される。
・ XML文書をXMLパーサ120により解析する。これは、図8のXML文書では図7のように解析される。同一階層の場合、XML文書の要素は、順に左側から並べられる。
・ 1対1の関係があれば、同じ番号にして、これをグルーピング番号とするing 要素とamount要素は、図7の階層構造において同一階層上の繰り返しの関係にあり、必ず1対1で存在することがわかるので、amount要素の番号を1にしてグルーピング番号とする(表1に示す文書型定義がある場合のグルーピング番号と同一になる)。
【0056】
ステップ400) 全検索処理:
前述の全検索処理モジュール140で行われる処理である。図9は、本発明の一実施例の全検索処理のフローチャートである。
【0057】
前述のXMLパーサ120で解析された結果を元に、SQL文で指定されたSELECT項目とWHERE項目に対応する要素のXML文書階層構造上の位置を取得する(ステップ401)。図4のXML文書の場合、表2に示すようになる。
【0058】
【表2】
Figure 0003630062
以上の取得結果より、全項目に共有する親要素名を検出する(ステップ402)。表2の場合、/recipe となる。
次に、グループ中で共通の親を取得する(ステップ403)。グループ0にとっては、/recipe 、グループ0 にとっては、/ing−list となる。
【0059】
グループ内の共通の親からたどって、SQL文で指定された項目に対応するXML文書の要素の値を取得する処理をグループ内の項目数分繰り返す。このとき、属性がある場合には、属性を要素と1対1で取得する。グループの数分、上記処理を繰り返し(ステップ404)、グループ間で直積をとる(ステップ405)。上記処理を共通の親の数分繰り返す。図4のXML文書に対して図5のSQL分で値を取得し、直積をとった結果を表3、表4に示す。
【0060】
【表3】
Figure 0003630062
【0061】
【表4】
Figure 0003630062
直積をとって作られた全レコードから結果リストを生成する。結果リストの例を表5に示す。
【0062】
【表5】
Figure 0003630062
ステップ500) 関係代数演算処理:
前述の関係代数演算処理モジュール150を用いて、全検索処理(ステップ400)で得られた結果リスト(表5)に対して関係代数演算を行う。図5のSQL分の場合、SQL分解析処理(ステップ100)で検索条件項目を示すWHERE項目が抽出されているので、全検索処理(ステップ400)で得られた結果リスト(表5)に対して条件の比較を行う。条件が「偽」の場合は削除を行い、条件を満たした結果のみを残す。表6に最終的な結果を示す。
【0063】
【表6】
Figure 0003630062
次に、SQL文で指定された複数のXML文書に対して検索を行い、一つの表形式で返却する具体例について説明する。
【0064】
(1) JOINの場合:
アプリケーションプログラム300を介して、入力されたSQL文をSQL文解析モジュール110が解析する。図10にJOINを含んだSQL文を示す。検索対象情報源を示すFROM項目に複数のXML文書名あるいは、別名を付与された同一のXML文書が指定されている。
【0065】
SQL文解析モジュール110は、入力されたSQL文をFROM項目に指定されているXML文書の数に分解する。図10のSQL文を分解して得られた複数のSQL文を図11、図12に示す。
【0066】
図11のSQL文は、図4のXML文書のrecipe−book 要素以下に含まれる情報を検索対象となる表として指定する。
【0067】
図12のSQL文は、図13のXML文書の要素以下に含まれる情報を検索対象となる表として指定する。
【0068】
そして、上記の実施例で述べたSQLによるXML文書内情報の検索をそれぞれのXML文書について行い、動的に表を作成する。
【0069】
上記の関係代数演算処理モジュール150によって、作成された複数の表の間でJOINし、複数のXML文書内の情報を一つの表形式で返却する。表7に最終的な結果を示す。
【0070】
【表7】
Figure 0003630062
(2) UNIONの場合:
アプリケーションプログラム300を介して入力されたSQL文をSQL文解析モジュール110が解析する。図14にUNIONを含んだSQL文を示す。SQL文解析モジュール110は、UNIONで結ばれた複数のSQL文を分解する。図14のSQL文を分解して得られた複数のSQL文を図15、図16に示す。
【0071】
そして、上記の実施例で述べたSQLによるXML文書内情報の検索をそれぞれのSQL文について行い、動的に表を作成する。
【0072】
上記、関係代数演算処理モジュール150によって、作成された複数の表の間でUNIONし、複数のXML文書内の情報を一つの表形式で返却する。表8に最終的な結果を示す。
【0073】
【表8】
Figure 0003630062
また、上記の実施例では、図3に示す検索装置の構成に基づいて説明したが、同図に示す、SQL文解析モジュール110、XMLパーサ120、グルーピングモジュール130、全検索処理モジュール140、関係代数演算処理モジュール150をプログラムとして構築し、検索装置として利用されるコンピュータに接続されるディスク装置や、フロッピーディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。
【0074】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【0075】
【発明の効果】
上述のように、本発明によれば、検索言語としてSQLを用いることで、従来のアプリケーションからXML文書内情報の検索が可能となる。複数のXML文書におけるXML文書内情報をJOINやUNIONし、一つの表形式で返却する検索が可能となる。また、XML文書からの検索結果を表形式とするとで、既存のリレーショナルデータベースからの検索結果と統一することができる。
【0076】
また、検索要求時にSQL文で指定された項目に対応するXML文書要素の値を取得し、動的に表を作成し、条件処理を行うことで、内容・構造が変更される可能性が高いXML文書内の情報検索が可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明のデータベース検索言語による半構造化文書内情報の検索装置の構成図である。
【図4】本発明の一実施例のXML文書の例(その1)である。
【図5】本発明の一実施例のSQL文の例である。
【図6】本発明の一実施例の検索処理のフローチャートである。
【図7】本発明の一実施例のXML文書の要素を階層構造に展開した例である。
【図8】本発明の一実施例の文書型定義がないXML文書の例である。
【図9】本発明の一実施例の全検索処理のフローチャートである。
【図10】本発明の一実施例のJOINを含んだSQL文の例である。
【図11】本発明の一実施例の図10のSQL文を分解して得られたSQL文の例(その1)である。
【図12】本発明の一実施例の図10のSQL文を分解して得られたSQL文の例(その2)である。
【図13】本発明の一実施例のXML文書の例(その2)である。
【図14】本発明の一実施例のUNIONを含んだSQL文の例である。
【図15】本発明の一実施例の図14のSQL文を分解して得られたSQL文の例(その1)である。
【図16】本発明の一実施例の図14のSQL文を分解して得られたSQL文の例(その2)である。
【符号の説明】
100 検索装置
110 検索言語解析手段、SQL文解析モジュール
120 半構造化文書解析手段、XMLパーサ
130 グルーピング手段、グルーピングモジュール
140 全検索手段、全検索処理モジュール
150 関係代数演算手段、関係代数演算処理モジュール
200 XML文書
300 アプリケーションプログラム

Claims (7)

  1. 文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索する半構造化文書検索装置における、半構造化文書検索方法であって、
    検索言語解析手段において、入力された表形式で表現されるリレーショナルデータベースを含むデータベースの検索を行なうための検索言語を解析する検索言語解析過程と、
    半構造化文書解析手段において、情報源から読み込まれた文書要素及び該文書要素の階層構造で表現される半構造化文書の構文を解析する半構造化文書解析過程と、
    グルーピング手段において、前記検索言語解析手段により解析された検索項目に対応する前記半構造化文書の解析結果にグルーピング番号を付与するグルーピング過程と、
    全検索手段において、前記半構造化文書解析過程で解析された半構造化文書の結果に基づいて、前記検索言語で指定された項目に対応する要素の半構造化文書階層構造上の位置を取得し、前記グルーピング番号が付与された全項目に共通する親要素名を検出し、グループ間で直積をとり、結果リストを生成する全検索手段と、
    関係代数演算手段において、前記結果リストに対して関係代数演算を行ない、該結果リストに対して条件の比較を行い、条件を満たした結果のみを検索結果として返却する関係代数演算過程と、を行なうことを特徴とする半構造化文書検索方法。
  2. 前記全検索過程において、
    前記全検索手段は、前記検索言語の検索式に半構造化文書のJOINを指定し、複数の半構造化文書における半構造化文書内情報をJOINし、ひとつの表形式で返却する請求項記載の半構造化文書検索方法。
  3. 前記全検索過程において、
    前記全検索手段は、前記検索言語の検索式に半構造化文書のUNIONを指定し、
    複数の半構造化文書における半構造化文書内情報をUNIOINし、ひとつの表形式で返却する請求項記載の半構造化文書検索方法。
  4. 文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索するための、半構造化文書検索装置であって、
    入力された表形式で表現されるリレーショナルデータベースを含むデータベースの検索を行なうための検索言語を解析する検索言語解析手段と、
    情報源から読み込まれた文書要素及び該文書要素の階層構造で表現される半構造化文書の構文を解析する半構造化文書解析手段と、
    前記検索言語解析手段により解析された検索項目に対応する前記半構造化文書の解析結果にグルーピング番号を付与するグルーピング手段と、
    前記半構造化文書解析手段で解析された半構造化文書の結果に基づいて、前記検索言語で指定された項目に対応する要素の半構造化文書階層構造上の位置を取得し、前記グルーピング番号が付与された全項目に共通する親要素名を検出し、グループ間で直積をとり、結果リストを生成する全検索手段と、
    前記結果リストに対して関係代数演算を行ない、該結果リストに対して条件の比較を行い、条件を満たした結果のみを検索結果として返却する関係代数演算手段と、
    を有することを特徴とする半構造化文書検索装置。
  5. 前記全検索手段は、
    前記検索言語の検索式に半構造化文書のJOINを指定し、複数の半構造化文書における半構造化文書内情報をJOINする手段を含む請求項記載の半構造化文書検索装置。
  6. 前記全検索手段は、
    前記検索言語の検索式に反抗増加文書のUNIONを指定し、複数の半構造化文書における半構造化文書内情報をUNIONする手段を含む請求項記載の半構造化文書検索装置。
  7. 文書要素及び該文書要素の階層構造で表現される半構造化文書内情報を検索するための、半構造化文書検索プログラムを格納した記憶媒体であって、
    前記請求項1乃至3記載の半構造化文書検索方法を実現するための処理をコンピュータに実行させるプログラムを格納したことを特徴とする半構造化文書検索プログラムを格納した記憶媒体。
JP2000043427A 2000-02-21 2000-02-21 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体 Expired - Fee Related JP3630062B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000043427A JP3630062B2 (ja) 2000-02-21 2000-02-21 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000043427A JP3630062B2 (ja) 2000-02-21 2000-02-21 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2001236352A JP2001236352A (ja) 2001-08-31
JP3630062B2 true JP3630062B2 (ja) 2005-03-16

Family

ID=18566348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000043427A Expired - Fee Related JP3630062B2 (ja) 2000-02-21 2000-02-21 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3630062B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100487738B1 (ko) * 2001-12-26 2005-05-06 한국전자통신연구원 데이터베이스 질의어와 밀결합된 엑스.엠.엘 질의어를지원하는 엑스.엠.엘 문서 검색장치 및 그 방법
JP2003271668A (ja) * 2002-03-15 2003-09-26 Toshiba Corp 構造化データ管理プログラム及び方法並びに装置
JP2003316783A (ja) * 2002-04-24 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> 異種半構造化情報源統合検索装置、方法、プログラム及び該プログラムを記録した記録媒体
KR100456027B1 (ko) * 2002-12-10 2004-11-08 한국전자통신연구원 지-에프큐엘을 이용한 이비엑스엠엘 필터질의 변환 장치및 방법
JP2004348479A (ja) * 2003-05-22 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索装置、検索方法、検索プログラム、および検索プログラム記録媒体
WO2007134278A2 (en) * 2006-05-15 2007-11-22 Xsprada Corporation Systems and methods for data storage and retrieval
KR100898465B1 (ko) * 2007-04-26 2009-05-21 엔에이치엔(주) 웹로그의 시계열 분석을 위한 데이터 저장 및 조회 방법그리고 상기 방법을 수행하는 시스템
JP5974746B2 (ja) * 2012-09-11 2016-08-23 コニカミノルタ株式会社 データ検索プログラム及びデータ検索装置
CN111078947B (zh) * 2019-11-19 2023-06-02 太极计算机股份有限公司 基于xml的领域要素提取配置语言系统
CN111597205B (zh) * 2020-05-26 2024-02-13 北京金堤科技有限公司 模板配置方法、信息提取方法、装置以及电子设备、介质

Also Published As

Publication number Publication date
JP2001236352A (ja) 2001-08-31

Similar Documents

Publication Publication Date Title
US9436779B2 (en) Techniques of efficient XML query using combination of XML table index and path/value index
US9152735B2 (en) Method and apparatus for composing XSL transformations with XML publishing views
US8862636B2 (en) Scalable algorithms for mapping-based XML transformation
US6832219B2 (en) Method and system for storing and querying of markup based documents in a relational database
US5873079A (en) Filtered index apparatus and method
Jensen et al. Converting XML DTDs to UML diagrams for conceptual data integration
US8145641B2 (en) Managing feature data based on spatial collections
US20080033976A1 (en) Metadata management for a data abstraction model
JP2005521954A (ja) リレーショナルデータベースをクエリーする方法および装置
JP2001147933A (ja) 構造化文書検索方法、構造化文書検索装置及び構造化文書検索システム
Comyn-Wattiau et al. Model driven reverse engineering of NoSQL property graph databases: The case of Neo4j
Mani et al. XML to relational conversion using theory of regular tree grammars
US7542962B2 (en) Information retrieval method for optimizing queries having maximum or minimum function aggregation predicates
US20090106289A1 (en) Array Generation Method And Array Generation Program
JP3630062B2 (ja) 半構造化文書検索方法及び装置及び半構造化文書検索プログラムを格納した記憶媒体
Jiang et al. Mapping-driven XML transformation
JP2005521953A (ja) リレーショナルデータベースをクエリーする方法および装置
US7761461B2 (en) Method and system for relationship building from XML
CN111475534B (zh) 一种数据查询方法及相关设备
KR101221306B1 (ko) 데이터 구조를 항해하기 위한 방법 및 시스템
Hollander et al. Storing and Querying Probabilistic XML Using a Probabilistic Relational DBMS.
US20070150458A1 (en) System for extending data query using ontology, and method therefor
Rys State-of-the-art XML support in RDBMS: Microsoft SQL server's XML features
JP4724177B2 (ja) Xmlデータにアクセスするためのインデックス
Li et al. GML storage: a spatial database approach

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041207

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121224

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees