JP4028410B2 - 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 - Google Patents

関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 Download PDF

Info

Publication number
JP4028410B2
JP4028410B2 JP2003039719A JP2003039719A JP4028410B2 JP 4028410 B2 JP4028410 B2 JP 4028410B2 JP 2003039719 A JP2003039719 A JP 2003039719A JP 2003039719 A JP2003039719 A JP 2003039719A JP 4028410 B2 JP4028410 B2 JP 4028410B2
Authority
JP
Japan
Prior art keywords
route
information
document
lookup
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003039719A
Other languages
English (en)
Other versions
JP2004030569A (ja
Inventor
孝燮 申
▲ヒェ▼受 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004030569A publication Critical patent/JP2004030569A/ja
Application granted granted Critical
Publication of JP4028410B2 publication Critical patent/JP4028410B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Description

【0001】
【発明の属する技術分野】
本発明は関係型データベースにおいてユーザの質疑表現方法の違いと無関係に安定的に質疑を処理することのできる拡張マークアップ言語(XML:Extended Markup Language)インデックス方法である経路インデックスルックアップ方法に係り、経路ルックアップテーブル及び拡張幹線テーブルの構造を提示し、これらテーブルを用いて任意の長さの正規経路式をただ一回のジョイン演算により処理可能にする方法を提供する。
【0002】
インターネットにおいて情報交換の標準言語として提案されたXMLはコンピュータ及びネットワークシステム(SyncML,UPnP)においてはもとより、生物情報(BSML,BioML)、電子商取引き(ebXML,ECML)、電子文書交換(XML−EDI)、地理情報及び全域位置システム(GPS:Global Positioning System)(GML,NVML)、マルチメディア(MPEG−7,IML)、エンターテイメント(MusicXML,GML)、教育(LMML,TML)、医療(CTDM,TDL)、出版(BiblioML,DocBook)、テレビ放送(TV−Anytime)など、産業全分野において幅広く用いられている。
【0003】
各応用分野においてXMLにより記述されたデータが関係型データベースや客体指向型データベースなど既存のデータベースにおける定形的なデータと異なる点の一つは、データ構造が半構造的であるということである。すなわち、XMLは、応用分野に合うデータ構造を表わす様式(DTD:Document Type Definition)は定義するが、その様式に厳しく従わなくても良いという半構造的な特性を有する。
【0004】
XMLの半構造的な特性は、相異なる情報ソース間のデータ表現及び交換において融通性を提供できるという長所がある。XMLが多くの応用分野において標準言語として用いられる理由の一つも、データ表現が容易であるということに加えて、このような半構造的な特性によるためであると見られる。
XMLの半構造的な特性のゆえに、XMLにて文書を作成する著作者は定義されたDTDから外れてXMLのデータを変形して生成することが許容されるだけではなく、XMLにて作成された文書のユーザもまたXMLデータの正確な構造が分からなくてもデータに対する検索を行うことができる。
【0005】
XMLの半構造的な特性に基づく検索はユーザが検索しようとするデータを表わしたXMLの文書構造が正確に分からない時に有用である。例えば、ウェブにおいて特定分野のXMLにて作成された文書を検索する時、ユーザはその特定分野のスキーマを正確に反映していない部分的な知識でも文書に関する質疑結果を得ることができる。
【0006】
ユーザのXMLデータに関する半構造的な特性に基づく検索式はXMLの質疑語であるXQueryなどにおいて正規経路式質疑により表わせる。質疑を処理するシステム側面においてXMLの正規経路式質疑は、定形化したスキーマに基づくデータベース質疑とは異なって質疑条件に相当するデータの構造を正確に記述しないため、同じ条件を表わす質疑がユーザの質疑記述方法によって異なる質疑として解釈されて行われる場合がある。従って、XMLを処理するシステムが正規経路式質疑を解釈して最適化する方法によって質疑処理性能に多くの違いを示す恐れがある。
【0007】
XML文書を関係型データベースに貯蔵する方法は、代表的に、幹線技法とアトリビュート技法とに大別できる。幹線技法はXML文書に関するスキーマ情報がない場合にも一般的にそのXML文書を貯蔵して処理できるという長所があるものの、相対的に大きい幹線テーブルに関する経路式の長さだけの重なったセルフジョインにより性能低下が起こりうる。ジョイン演算はテーブル内のエレメント間の関係を求める演算を言い、セルフジョインは同じテーブル内においてエレメント間の関係を求める演算を言う。
【0008】
アトリビュート技法はXML文書のスキーマ情報が予め知られている時、エンティティ単位にテーブルを生成して処理する方法である。従って、幾つかのテーブルにデータを分割して貯蔵する効果があり、幹線技法に比べてその性能を高めることができるが、XMLスキーマによってはテーブルの数が多過ぎたり、不要にデータが断片化したりするという短所がある。
【0009】
かかる問題点を補完するために、スキーマのないXML文書を貯蔵するために、データマイニング方法を用いて分離可能なテーブルの種類及び数を定める方法に関する研究が進んできた。幹線技法及びアトリビュート技法ともに基本的には経路式を処理する方法であり、経路式の長さだけテーブル間のジョイン演算が必要である。また、正規経路式を処理するのに適した構造を有していない。
【0010】
幹線技法のうちタッグの開始及び終了オフセットの情報を用いて正規経路式を処理する方法があるが、経路式が長い場合に効率的ではなく、ユーザによる質疑記述方法によって質疑処理性能が左右されるという短所がある。
XMLデータに関する経路式インデックス方法としてインデックスファブリックと呼ばれる方法があるが、これはXML文書に存在する各種の経路に関するインデックスを一つのインデックス構造において管理できるという特徴を有する。このインデックス構造は関係型データベースを支援するためにさらなる拡張を行った構造である。インデックスファブリックにおいては、特定の正規経路式を処理するためにその特定経路を人工経路の形でインデックス構造に明らかに付加しなければならない。本発明による経路ルックアップテーブルはインデックスファブリックにおいて正規経路式を処理するのにも適用できる。
【0011】
そして、インデックスの役割を果たすテーブル構造が提示されている。しかし、この方法をXMLの経路式インデックスに直ちに適用する時の問題点は、インデックステーブルの数が増えるか、あるいは断片化するということである。XMLデータに対する経路式処理はツリーを巡回するという点で客体指向型データベースにおける経路式処理方法と類似している。
【0012】
【発明が解決しようとする課題】
前記問題を解決するために、本発明においては、関係型データベースにおいてXMLにて表わされた正規経路式質疑をユーザの表現方法の違いを問わずに同じ方法により解釈し、効率良いXMLインデックス方法を提供することを目的とする。
詳細には、既存の方法において正規経路式が長くなるほど質疑処理性能が落ちるのとは異なって、正規経路式の長さと無関係に一回のジョインにて任意の正規経路式を処理することのできるXMLインデックス方法を提供する。また、関係型データベースシステムエンジンの変形なしに用いることのできるテーブル及びBツリーに基づくXMLインデックステーブル資料構造を提供することを目的とする。
【0013】
【課題を解決するための手段】
前記目的を達成するために、本発明においては、経路インデックスルックアップ装置における経路インデックスルックアップ方法であって、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書から前記経路インデックスルックアップ装置の経路ルックアップテーブル貯蔵部が複数の前記経路情報を抽出する段階と、前記複数の経路情報の各々に対応する経路識別子(ID)情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて前記経路ルックアップテーブル貯蔵部が経路ルックアップテーブルに貯蔵する段階と、前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからソースID情報及びターゲットID情報を入力されて前記経路インデックスルックアップ装置の拡張幹線テーブル貯蔵部が拡張幹線テーブルに貯蔵する段階と、ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されて前記経路インデックスルックアップ装置の経路ID検索部がこれと一致する経路情報前記経路ルックアップテーブルから捜し出して前記経路に対応する経路ID情報を求める段階と、前記経路インデックスルックアップ装置の経路情報判断及び出力部が前記段階において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出す段階とを含む経路インデックスルックアップ方法を提供する。
【0014】
前記目的を達成するために、本発明においては、前記方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体を提供する。
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書において、前記複数の経路情報の各々に対応する経路ID情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて経路ルックアップテーブルに貯蔵する経路ルックアップテーブル貯蔵部と、前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからソースID情報及びターゲットID情報を入力されて拡張幹線テーブルに貯蔵する拡張幹線テーブル貯蔵部と、ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されてこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記経路に対応する経路ID情報を求める経路ID検索部と、前記経路ID検索部において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出して出力する経路情報判断及び出力部とを備える経路インデックスルックアップ装置を提供する。
【0015】
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書を関係型データベースに貯蔵するのに用いられる資料構造において、前記文書内において検索しようとする情報が貯蔵されている経路の名前を表わす経路名情報と、前記経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、文書内の様々な経路に関するソースID情報及びターゲットID情報を貯蔵している拡張幹線テーブルに前記経路がインデックスされているか否かを表わすインデックスフラグ情報とを備え、ユーザから捜し出そうとする情報に関する検索式である正規経路式が入力されればこれと一致する経路情報に関する経路名情報を捜し出してこれと対応する経路ID情報を出力する経路ルックアップテーブルを提供する。
【0016】
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書を関係型データベースに貯蔵するのに用いられる資料構造において、前記文書内において検索しようとする情報が貯蔵されている経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、Elementsテーブルのタップルを参照するソースIDと、ElementsテーブルまたはTextsテーブルのタップルを参照するターゲットIDとを備え、ユーザから捜し出そうとする情報に関する経路ID情報が入力されればこれと対応するソースID情報及びターゲットID情報を出力する拡張幹線テーブルを提供する。
従って、本発明においては、ユーザ質疑の形に対して依存的な性能を示す既存の技法とは異なって、ユーザの質疑表現とは独立的に正規経路式を安定的で且つ速く処理することのできる経路インデックスルックアップ方法を提供する。
【0017】
【発明の実施の形態】
以下、添付した図面に基づき、本発明による好適な一実施形態について詳細に説明する。
正規経路式とは、ユーザがXML文書内の接近しようとするあるエンティティの経路を指定する時、その経路を全て並べることなく、縮約して表わす経路式を言う。
【0018】
図1Aないし図1Bは、TV−Anytimeのメタデータ規格の一部を表わすXMLにて作成された文書の一実施形態である。
TV−AnytimeのメタデータはTV放送番組に関する情報を表わすが、プログラムID programId、題目Title、要約情報Synopsis、キーワードKeywords、ジャンルGenre、キャスティング情報CastListなどを含んでいる。図1Aは、 TV−AnytimeのXMLにて作成された文書の例を示し、図1Bは、文書の内容をツリーの形で表わしたものである。
【0019】
図1Bから分かるように、TV放送システムのように一般ビジネス応用分野におけるXML文書構造はツリーが極めて深くて複雑であるため、ユーザは文書に対する検索を要請する時、正確な経路を記述し難い。例えば、本例においてユーザが特定番組に登場する俳優の名前を検索する時、
/ProgramInformation/BasicDescription/CastList/CastMember/Agent/Name
のようにルートエレメントから名称エレメントまでの経路を全て並べた絶対経路式にて記述しても良いが、
/ProgramInformation//CastList//Agent/Name
のようにユーザが必要であると思うエレメント名前よりなる正規経路式にてさらに簡単に記述することができる。前記絶対経路式において記号‘/’はXML文書上において直接的な親子の関係を表わすのに対し、記号‘//’は親子関係の意味を拡張して一般的な先祖−子孫の関係を表わす。記号‘//’で表わされる先祖−子孫の関係は正規経路式のための代表関係の一つである。
【0020】
図2は、正規経路式において用いられる主な記号及びその意味を示す図面である。
すなわち、XML質疑語であって、ワールドワイドウェブコンソーシアム(W3C)においてXML標準言語として提案されたXQuery上において正規経路式のための主要記号及びその意味を示すものである。一つの絶対経路式は図2に示された記号を用いて様々な正規経路式にて表わせる。
【0021】
例えば、前記絶体経路式
/ProgramInformation/BasicDescription/CastList/CastMembr/Agent/Nammeは、
前記正規経路式/ProgramInformation//CasrList//Agent/Nameを含めて下記のように様々な正規経路式にて表せる。
Figure 0004028410
【0022】
中でも前記正規経路式//CastMember//Nameは、前記絶対経路式と比較して同じ内容を簡単に表わしている。このように正規経路式入り質疑においては、同じ内容がユーザにより異なって表わされる場合がある。このため、正規経路式質疑を処理するシステムはユーザ質疑を解釈する方法によってその性能に多くの違いが生じうる。
【0023】
従来に提案された方法においては、関係型データベースにおいてXML文書に関する正規経路式質疑を処理するために、下記の如く2つのテーブル構造を提案した。
Elements(term, docno, begin, end, level)
Texts(term, docno, wordno, level)
【0024】
Elementsテーブルは、XML文書においてタッグとして指定されたエレメント及びアトリビュートを個々のタップルとして貯蔵する。termはタッグの名前を、docnoはタッグの属する文書IDを、begin及びendは文書内においてtermの属するタッグのオフセット範囲を、levelは文書内においてエレメントの重なった回数、すなわち、先祖の数を各々表わす。
【0025】
TextsテーブルはXML文書においてタッグ内に含まれた値を個々のタップルとして貯蔵する。docnoはある値の属するIDを、wordnoは該当値の文書内のオフセットを、levelは文書内において重なった回数を各々表わす。このような貯蔵構造下において、正規経路式はエレメントのオフセット値及びレベル値を用いたElementsテーブルに対するセルフジョインにより処理される。
【0026】
図3は、前記Elementsテーブル及びTextsテーブル構造を用いて各エレメントを表わした一実施形態である。
すなわち、sectionというエレメントについて説明すれば、(1,1:23,0),(1,8:22,1),(1,14:21,2)があるが、最初の(1,1,1)はdocnoを表わし、1:23, 8:22, 14:21は開始及び終了を表わし、最後の数字0, 1, 2はレベルを表わす。
【0027】
すなわち、従来の方法において、正規経路式はElementsテーブルに対するセルフジョインにより処理される。例えば、前記正規経路式//CastMember//Nameは下記の如きSQL質疑として表わされて処理される。
Select e1
From Elements e1, Elements e2
Where e1. term=‘CastMember’
And e2. term=‘Name’
And e1. begin<e2. begin
And e1. end>e2. end
And e1. docno=e2. docno
【0028】
この質疑はCastMemberを代表するElementsテーブル及びNameを代表するElementsテーブルのセルフジョインにより処理される。先祖−子孫の関係を表わす‘//’に対し、ジョイン条件には両エレメント間のオフセット包含関係となる。
すなわち、XML文書上における両エレメントA及びBに対し、AのbeginオフセットがBのbeginオフセットより小さく、AのendオフセットがBのendオフセットより大きい時、A//Bという正規経路式が満足される。前記質疑においては両エレメントCastMember及びNameに対し、CastMemberのbeginオフセットがNameのbeginオフセットより小さく、 CastMemberのendオフセットがNameのendオフセットより大きいという条件を表わしている。
【0029】
既存に提案されている正規経路式処理方法の共通した問題点は、システムの質疑処理性能がユーザによる正規経路式の記述方法に対して依存的であるというところにある。すなわち、正規経路式に幾つのタッグが指定されたかによってその正規経路式を処理するために必要なジョインの回数が決まる。
前述したように、同じ絶対経路式に対して様々な正規経路式があり、それによりジョインの回数も変わる。
【0030】
すなわち、同じ内容を表わす正規経路式のうち//CastMember//Nameは、ジョインが一回のみ必要であるが
/ProgramInformation/BasicDescription/CastList/CastMember/Agent/Nameは、ジョインが5回行われなければならない。
そして、同じ質疑における正規経路式
/ProgramInformation//CastList//Agent/Nameに対し、3回のジョイン演算が必要となる。
このように、従来の技術においては、実際の応用分野に適用するのに多くの難点があった。このため、XML文書を貯蔵して検索する問題がXMLを取り扱う応用分野における技術的なボトルネックであった 。
【0031】
これに対し、本発明において提示する経路インデックスルックアップ方法は既存に提案されたElementsテーブル及びTextsテーブルに加え、下記の如き2種のテーブル構造を追加してXML文書をインデックスする。
PathLookup(pathname, pathid, indexflag)
ExtendedEdge(pathid, sorid, tarid)
経路ルックアップテーブルはXML文書をパーシングした時に発生可能な経路をタップルとして貯蔵する。
【0032】
pathnameは経路の名前を表わし、pathidはその経路に関するIDであり、indexflagは該当経路が拡張幹線テーブルにおいてインデックスされているか否かを表わす。拡張幹線テーブルは経路の長さが1以上である経路のインデックス情報を貯蔵する。pathidは経路ルックアップテーブルにおけるタップルを示す経路IDを、sorid(source id)及びtarid(target id)はElementsテーブルにおけるエレメントIDを各々表わす。
【0033】
XMLにて作成された文書をデータベースに入力する時、全ての可能な経路名を選択してそれらをIDと共に経路ルックアップテーブルにタップルとして貯蔵する。XMLにて作成された文書に関する経路はその文書をパーシングする時に抽出することができるので、該当文書のためのDTDあるいはXMLスキーマが別途に必要ではない。
【0034】
XMLにて作成された文書構造を表わすツリーにおいて、ルートからのレベルがkであるノードAに対する可能な長さが1以上である経路のうちAで終わる経路の数はk個存在しうる。ここで注目すべき点は、ある文書に関する経路抽出に際し、以前の文書において生じた経路は重なって入力されないため、構造が類似した大容量のXMLにて作成された文書をデータベースに入力しても経路ルックアップテーブルはあまり大きくならないということである。
【0035】
経路ルックアップテーブルはユーザが入力した正規経路式を実際のXMLデータ空間に存在する経路に迅速に変換するためのインデックスの役割を果たす。ユーザが記述した正規経路式を経路ルックアップテーブルに貯蔵されている経路にマッピングする演算はSQL(Structured Query Language)のlike構文にて処理される。
【0036】
正規経路式のSQLのlike構文へのマッピングを容易にするために、経路名を経路ルックアップテーブルに貯蔵する時には、経路の各ノードにタッグを付けて貯蔵する。例えば、経路‘A/B/C’は‘<A><B><C>’のように貯蔵される。
図4は、正規経路式に関するSQLのlike構文である。
【0037】
図4の構文を用い経路ルックアップテーブルにおいて経路を検索するために、前記で例として取られた正規経路式/ProgramInformation//CastList//Agent/Nameに関するSQL構文を作成すれば、下記の通りである。
Figure 0004028410
【0038】
以下では、拡張幹線テーブルについて説明する。拡張幹線テーブルはXMLにて作成された文書上の経路を速く処理するための経路インデックステーブルである。各タップルは経路ルックアップのための経路IDを有しており、経路ルックアップテーブルのタップルを参照する。
各経路のソースID sorid及びターゲットID taridを指定するフィールド値はElementsテーブルのタップルを参照する。ターゲットID taridがエレメントの代わりにテキストを指定する時にはターゲットID taridはTextsテーブルのタップルを参照する。注目すべき点は、以前の幹線技法などで繰り返しジョインを通じて経路を処理するのとは異なって、拡張幹線テーブルは極めて長い経路の場合にもさらなるジョイン演算無しにも一回に接近できる構造を有するということである。
【0039】
図5は、XML文書に関する経路ルックアップテーブル及び拡張幹線テーブルの構成の一実施形態である。
すなわち、図5Aの如きXML文書がある時、図5Bは経路ルックアップテーブルを、図5Cは拡張幹線テーブルの構成例を各々示している。換言すれば、図5Aは入力される文書の構造を示し、図5Bは文書入力時に新しく生じる経路に対して作成された経路ルックアップテーブルを示す。経路ルックアップテーブルのインデックスフラグindexflagフィールドは該当経路が拡張幹線テーブルにインデックスされているか否かを表わす。
【0040】
図5Bにおいて、経路/A/B/C及び/A/B/Dに対してのみ拡張幹線テーブルにおいてインデックスされているということが分かる。拡張幹線テーブルはXMLにて作成された文書のノード数の自乗に比例するため、全ての経路をインデックスすればテーブルが大きすぎるため、インデックスする経路を区分し、その区分された経路のみを貯蔵するための方法である。
【0041】
図5Cの拡張幹線テーブルにおいては、図5Bの経路ルックアップテーブルのインデックスフラグindexflagにおいて指定された経路/A/B/C及び/A/B/Dに関する実際の経路インスタンスを貯蔵する。
拡張幹線テーブルにおいては、与えられた正規経路式に対して経路ルックアップテーブルにおいて捜し出された経路IDをもって指定されたタップルが接近されるため、このテーブルに対して経路IDをキーフィールドとして指定し、このフィールドにBツリーインデックスを用いれば極めて早く接近することができる。
【0042】
経路インデックスルックアップ方法における正規経路式の処理は下記の通りである。まず、与えられた正規経路式について可能な経路式を経路ルックアップテーブルから捜し出してそれらの経路IDを求める。次に、求められた経路IDに対応するソースID及びターゲットIDを拡張幹線テーブルから得る。これら2段階の演算は、経路IDをジョインキーとするジョイン演算により表わせる。
【0043】
図6は、経路インデックスルックアップ方法の構造を示す図面である。
図6に示されたように、経路インデックスルックアップ方法においては、ユーザが表わす正規経路式の形と無関係に該当正規経路式を経路ルックアップテーブルに対するテーブル検索及び拡張幹線テーブルに対するBツリー検索演算により処理する。
【0044】
前述した例において、TV放送用XML文書に関する正規経路式のうち/ProgramInformation//CastList//Agent/Nameを既存の方法により処理するSQL構文は下記の通りである。
Figure 0004028410
【0045】
従って、前記のように3回のジョイン演算入りの質疑文により表わされるのに対し、経路インデックスルックアップ方法を通じたSQL構文は下記のように一回のジョインにより処理される。
Figure 0004028410
【0046】
図7は、正規経路式質疑に関する経路インデックスルックアップ方法のフローチャートである。
まず、XMLにて作成された文書から抽出可能な全ての経路名を抽出して経路ID情報及びインデックスフラグ情報と共に経路ルックアップテーブルに貯蔵する(ステップ710)。そして、前記各々の経路IDに対してソースID及びターゲットIDを拡張幹線テーブルに貯蔵する(ステップ720)。
【0047】
次には、正規経路式を入力され(ステップ730)、これに対応する経路式を経路ルックアップテーブルにおいて検索して経路IDを求める(ステップ740)。この時、SQLのlike構文を用いて経路ルックアップテーブルにおいて経路IDを求める。そして、求められた経路IDをジョインキーとするジョイン演算により表わして行う。
【0048】
そして、前記段階において求められた経路IDを検索キーとして拡張幹線テーブルを検索し、経路のソースID及びターゲットIDを求める(ステップ750)。この時、拡張幹線テーブルに対するBツリー検索演算により行われる。図8は、正規経路式質疑に関する経路インデックスルックアップ装置を示す図面である。
【0049】
経路インデックスルックアップ装置は、経路ルックアップテーブル貯蔵部810と、拡張幹線テーブル貯蔵部820と、経路ID検索部830及び経路情報判断及び出力部840を備えてなる。
経路ルックアップテーブル貯蔵部810は、XMLにて作成された文書から複数の経路情報を抽出し、ユーザから入力された経路ID情報及びインデックスフラグ情報と共に貯蔵する。貯蔵形態はテーブル形態であり、図5Bの通りである。
【0050】
拡張幹線テーブル貯蔵部820は、前記各々の経路IDに対してユーザからソースID情報及びターゲットID情報を入力されて貯蔵する。貯蔵形態はテーブル形態であり、図5Cの通りである。
経路ID検索部830は、ユーザから正規経路式情報を入力されてこれと一致する経路を前記経路ルックアップテーブル貯蔵部から捜し出し、所望の経路に相当する経路ID情報を求める。
【0051】
経路情報判断及び出力部840は、前記経路ID検索部830において求められた経路ID情報を検索キーとしてこれと一致する経路情報を前記拡張幹線テーブル貯蔵部820から捜し出し、経路のソースID情報及びターゲットID情報を求めて出力する。
そして、正規経路式質疑に対して本発明が提供する経路インデックスルックアップ方法の性能をオフセットを用いたジョイン技法の性能と比較した。実験に用いられたデータはTV放送システムの文書1200個を関係型データベースシステムに入力した。入力済みのElementsテーブルのノード数は約1,000,000であった。
【0052】
図9は、実験に用いられた正規経路式テーブルである。
実験においては、図9に示されたように、ノード数が2ないし9である正規経路式を処理するのにかかる反応時間を測定した。
図10は、正規経路式のノード数による反応時間グラフである。
オフセットジョインはオフセット値に基づくジョイン技法における反応時間を、経路ルックアップは経路インデックスルックアップ技法における反応時間を各々表わす。
【0053】
図10から分かるように、既存のオフセットを用いたジョイン技法は正規経路式が長くなるほど反応時間が延びるのに対し、本発明が提供する経路インデックス方法は正規経路式の長さに敏感ではなく、平均的に良好な性能を示している。ノード数が2である時、すなわち、オフセットジョインにおいてジョインが一回生じる場合にも経路ルックアップ方法がさらに良好な性能を示す理由は、経路ルックアップ技法においてはBツリーを用い拡張幹線テーブルから該当経路式に対するタップルへと早く接近するからである。これに対し、オフセットジョインは、オフセット間の包含関係を用いたジョインであるため、その反応時間がさらに長い。
【0054】
一方、前記本発明の実施形態はコンピュータにて実行可能なプログラムにて作成でき、コンピュータにて読取り可能な記録媒体を用いて前記プログラムを動作させる汎用のデジタルコンピュータにより具現できる。
また、上述した本発明の実施形態において用いられたデータの構造はコンピュータにて読取り可能な記録媒体に各種の手段を通じて記録できる。
【0055】
前記コンピュータにて読取り可能な記録媒体はマグネチック貯蔵媒体(例えば、ROM、フロッピーディスク、ハードディスクなど)、光学的な判読媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを介した伝送)などの貯蔵媒体を含む。
以上、本発明についてその好適な実施形態を中心に調べてみた。本発明が属する技術分野における当業者であれば、本発明が本発明の本質的な特性から逸脱しない範囲内において変形された形態にて具現できるということが理解できるであろう。よって、開示された実施形態は限定的な観点ではなく説明的な観点から考慮さるべきである。本発明の範囲は前記詳細な説明ではなく特許請求の範囲上に現れており、それと同等な範囲内にあるあらゆる違いは本発明に含まれたものとして解釈さるべきである。
【0056】
【発明の効果】
上述したように、本発明は、XMLにて作成された質疑形式のうち核心的な正規経路式質疑に対してユーザ質疑の形式と無関係にただ一回のジョインにより処理できる方法を提供することにより、デジタルTVの電子番組表の情報インデックス及び検索エンジンとそれ以外の様々な分野のXML貯蔵が必要な情報機器に有用であるという効果がある。
【0057】
また、本発明は、XMLにて作成された文書を関係型データベースに効率良くインデックスして貯蔵することにより、XMLの核心的なユーザ質疑形式である正規経路式質疑をユーザによる記述形式と無関係に安定的で且つ速く処理できる効果がある。特に、既存の方法はユーザによる質疑の記述形式に依存的であるために性能が不安定であるのに対し、本発明はユーザ質疑形式と無関係にただ一回のジョインにより処理できるという長所を有する。
【図面の簡単な説明】
【図1A】 TV放送システムのメタデータ規格の一部を表わすXMLにて作成された文書の一実施形態の図である。
【図1B】 TV放送システムのメタデータ規格の一部を表わすXMLにて作成された文書に対するツリー構造を表す図である。
【図2】 正規経路式において用いられる主要記号及びその意味を示す図面である。
【図3】 Elements及びTextsテーブル構造を用いて各エレメントを表わした一実施形態である。
【図4】 正規経路式に対するSQLのlike構文である。
【図5A】 入力されたXML文書の一実施形態の図である。
【図5B】 本発明のXML文書に対する経路ルックアップテーブル構成の一実施形態の図である。
【図5C】 本発明のXML文書に対する拡張幹線テーブルの構成の一実施形態の図である。
【図6】 本発明の経路インデックスルックアップ方法の構造を示す図面である。
【図7】 本発明の正規経路式質疑に関する経路インデックスルックアップ方法のフローチャートである。
【図8】 本発明の正規経路式質疑に関する経路インデックスルックアップ装置を示す図面である。
【図9】 本発明の実験に用いられた正規経路式テーブルである。
【図10】 本発明の正規経路式のノード数による反応時間グラフである。
【符号の説明】
810…経路ルックアップテーブル貯蔵部
820…拡張線テーブル貯蔵部
830…経路ID検索部
840…経路情報判断及び出力部

Claims (5)

  1. 経路インデックスルックアップ装置における経路インデックスルックアップ方法であって、
    (a)拡張マークアップ言語(XML)を含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書から前記経路インデックスルックアップ装置の経路ルックアップテーブル貯蔵部が複数の前記経路情報を抽出する段階と、
    (b)前記複数の経路情報の各々に対応する経路識別子(ID)情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて前記経路ルックアップテーブル貯蔵部が経路ルックアップテーブルに貯蔵する段階と、
    (c)前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからElementsテーブルのタップルを参照するソースID情報及びElementsテーブルまたはTextsテーブルのタップルを参照するターゲットID情報を入力されて前記経路インデックスルックアップ装置の拡張幹線テーブル貯蔵部が拡張幹線テーブルに貯蔵する段階と、
    (d)ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されて、前記経路インデックスルックアップ装置の経路ID検索部がこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記捜し出そうとする情報が貯蔵されている経路に対応する経路ID情報を求める段階と、
    (e)前記経路インデックスルックアップ装置の経路情報判断及び出力部が前記(d)段階において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出す段階と
    を含み、
    前記経路ルックアップテーブルは、前記文書の構造を表わすツリーにおいてルートからのレベルがkであるノードに対する長さが1以上の経路情報のうち前記ノードで終わる経路情報がk個存在し、
    前記Elementsテーブルの個々のタップルは、タッグの名前、前記タッグの属する文書ID、前記文書内における前記タッグのオフセット範囲、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含み、
    前記Textsテーブルの個々のタップルは、前記タッグ内に含まれた値、前記値の属する文書ID、前記文書内における前記値のオフセット、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含む経路インデックスルックアップ方法。
  2. 前記経路ルックアップテーブルに貯蔵された経路情報は、
    前記文書内において検索しようとする情報が貯蔵されている経路の名前を表わす経路名情報と、
    前記経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、
    文書内の様々な経路に関するソースID情報及びターゲットID情報を貯蔵している拡張幹線テーブルに前記経路がインデックスされているか否かを表わすインデックスフラグ情報と
    を備えることを特徴とする請求項1に記載の経路インデックスルックアップ方法。
  3. 前記拡張幹線テーブルは、
    前記文書内において検索しようとする情報が貯蔵されている経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、
    Elementsテーブルのタップルを参照するソースIDと、
    ElementsテーブルまたはTextsテーブルのタップルを参照するターゲットIDと
    を備えることを特徴とする請求項1に記載の経路インデックスルックアップ方法。
  4. 請求項1から3のいずれか1項に記載の方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体。
  5. XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書において、
    前記複数の経路情報の各々に対応する経路ID情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて経路ルックアップテーブルに貯蔵する経路ルックアップテーブル貯蔵部と、
    前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからElementsテーブルのタップルを参照するソースID情報及びElementsテーブルまたはTextsテーブルのタップルを参照するターゲットID情報を入力されて拡張幹線テーブルに貯蔵する拡張幹線テーブル貯蔵部と、
    ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されてこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記捜し出そうとする情報が貯蔵されている経路に対応する経路ID情報を求める経路ID検索部と、
    前記経路ID検索部において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出して出力する経路情報判断及び出力部とを備え、
    前記経路ルックアップテーブルは、前記文書の構造を表わすツリーにおいてルートからのレベルがkであるノードに対する長さが1以上の経路情報のうち前記ノードで終わる経路情報がk個存在し、
    前記Elementsテーブルの個々のタップルは、タッグの名前、前記タッグの属する文書ID、前記文書内における前記タッグのオフセット範囲、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含み、
    前記Textsテーブルの個々のタップルは、前記タッグ内に含まれた値、前記値の属する文書ID、前記文書内における前記値のオフセット、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含む経路インデックスルックアップ装置。
JP2003039719A 2002-05-08 2003-02-18 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 Expired - Fee Related JP4028410B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0025398A KR100484138B1 (ko) 2002-05-08 2002-05-08 관계형 데이터베이스에서 정규 경로식 질의를 처리하는xml 인덱싱 방법과 자료구조

Publications (2)

Publication Number Publication Date
JP2004030569A JP2004030569A (ja) 2004-01-29
JP4028410B2 true JP4028410B2 (ja) 2007-12-26

Family

ID=29398487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003039719A Expired - Fee Related JP4028410B2 (ja) 2002-05-08 2003-02-18 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造

Country Status (4)

Country Link
US (1) US7139746B2 (ja)
JP (1) JP4028410B2 (ja)
KR (1) KR100484138B1 (ja)
CN (1) CN1230771C (ja)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7366708B2 (en) 1999-02-18 2008-04-29 Oracle Corporation Mechanism to efficiently index structured data that provides hierarchical access in a relational database system
US7127469B2 (en) * 2002-06-13 2006-10-24 Mark Logic Corporation XML database mixed structural-textual classification system
EP1552427A4 (en) 2002-06-13 2009-12-16 Mark Logic Corp PARENT-CHILD QUERY INDEX FOR XML DATA BANKS
KR100497362B1 (ko) * 2002-08-22 2005-06-23 삼성전자주식회사 전자 프로그램 가이드 정보 변환 장치 및 방법
WO2004019225A1 (ja) * 2002-08-26 2004-03-04 Fujitsu Limited 状況付情報を処理する装置および方法
US7698642B1 (en) 2002-09-06 2010-04-13 Oracle International Corporation Method and apparatus for generating prompts
KR100493882B1 (ko) * 2002-10-23 2005-06-10 삼성전자주식회사 Xml 데이터 검색을 위한 질의 처리 방법
KR100558765B1 (ko) * 2002-11-14 2006-03-10 한국과학기술원 적응형 경로 인덱스를 이용한 xml 질의 수행 방법
US7174346B1 (en) * 2003-07-31 2007-02-06 Google, Inc. System and method for searching an extended database
US7490093B2 (en) * 2003-08-25 2009-02-10 Oracle International Corporation Generating a schema-specific load structure to load data into a relational database based on determining whether the schema-specific load structure already exists
US7814047B2 (en) 2003-08-25 2010-10-12 Oracle International Corporation Direct loading of semistructured data
US8694510B2 (en) 2003-09-04 2014-04-08 Oracle International Corporation Indexing XML documents efficiently
US8229932B2 (en) * 2003-09-04 2012-07-24 Oracle International Corporation Storing XML documents efficiently in an RDBMS
KR100541531B1 (ko) * 2003-12-24 2006-01-10 한국전자통신연구원 객체 지향 디비엠에스에서 경로식의 부질의 변환을 통한 질의 처리 방법
JP4046086B2 (ja) * 2004-01-21 2008-02-13 トヨタ自動車株式会社 可変圧縮比内燃機関
US8825702B2 (en) * 2004-02-24 2014-09-02 Oracle International Corporation Sending control information with database statement
JP2007531151A (ja) * 2004-04-02 2007-11-01 サムスン エレクトロニクス カンパニー リミテッド ツリーパスフィルタリング機能を持つxmlプロセッサー、ツリーパスフィルタリング方法及びその方法を行うためのプログラムが保存された記録媒体
US7366735B2 (en) * 2004-04-09 2008-04-29 Oracle International Corporation Efficient extraction of XML content stored in a LOB
US7499915B2 (en) * 2004-04-09 2009-03-03 Oracle International Corporation Index for accessing XML data
US7493305B2 (en) * 2004-04-09 2009-02-17 Oracle International Corporation Efficient queribility and manageability of an XML index with path subsetting
US7440954B2 (en) * 2004-04-09 2008-10-21 Oracle International Corporation Index maintenance for operations involving indexed XML data
US7398265B2 (en) * 2004-04-09 2008-07-08 Oracle International Corporation Efficient query processing of XML data using XML index
CA2561734C (en) 2004-04-09 2013-08-13 Oracle International Corporation Index for accessing xml data
US7603347B2 (en) * 2004-04-09 2009-10-13 Oracle International Corporation Mechanism for efficiently evaluating operator trees
US7930277B2 (en) 2004-04-21 2011-04-19 Oracle International Corporation Cost-based optimizer for an XML data repository within a database
CN100440218C (zh) * 2004-06-16 2008-12-03 甲骨文国际公司 Lob中存储的xml内容的有效提取
EP1759315B1 (en) * 2004-06-23 2010-06-30 Oracle International Corporation Efficient evaluation of queries using translation
US7516121B2 (en) * 2004-06-23 2009-04-07 Oracle International Corporation Efficient evaluation of queries using translation
US8566300B2 (en) * 2004-07-02 2013-10-22 Oracle International Corporation Mechanism for efficient maintenance of XML index structures in a database system
US7885980B2 (en) * 2004-07-02 2011-02-08 Oracle International Corporation Mechanism for improving performance on XML over XML data using path subsetting
US7668806B2 (en) * 2004-08-05 2010-02-23 Oracle International Corporation Processing queries against one or more markup language sources
US7685137B2 (en) * 2004-08-06 2010-03-23 Oracle International Corporation Technique of using XMLType tree as the type infrastructure for XML
CN100382550C (zh) * 2004-09-01 2008-04-16 恒生电子股份有限公司 联机处理系统中共享数据的处理方法
KR100673447B1 (ko) * 2004-11-04 2007-01-24 엘지전자 주식회사 세탁기
US7849106B1 (en) 2004-12-03 2010-12-07 Oracle International Corporation Efficient mechanism to support user defined resource metadata in a database repository
US7921076B2 (en) 2004-12-15 2011-04-05 Oracle International Corporation Performing an action in response to a file system event
CN100410933C (zh) * 2004-12-29 2008-08-13 复旦大学 一种基于xml数据的高效路径索引方法
KR100666942B1 (ko) * 2005-01-07 2007-01-11 삼성전자주식회사 관계형 dbms를 이용한 xml 데이터 관리 방법
KR100612376B1 (ko) * 2005-01-31 2006-08-16 인하대학교 산학협력단 통합패스의 노드범위를 이용한 엑스엠엘 인덱스 시스템 및방법
US7523131B2 (en) 2005-02-10 2009-04-21 Oracle International Corporation Techniques for efficiently storing and querying in a relational database, XML documents conforming to schemas that contain cyclic constructs
US8346737B2 (en) 2005-03-21 2013-01-01 Oracle International Corporation Encoding of hierarchically organized data for efficient storage and processing
US20060235839A1 (en) * 2005-04-19 2006-10-19 Muralidhar Krishnaprasad Using XML as a common parser architecture to separate parser from compiler
KR100714693B1 (ko) * 2005-06-07 2007-05-04 삼성전자주식회사 소프트웨어 모듈의 독립성을 보장하는 데이터베이스어플리케이션을 구현하는 시스템 및 방법
WO2007006057A1 (en) * 2005-07-06 2007-01-11 The Cleveland Clinic Foundation Apparatus and method for replacing a cardiac valve
US8762410B2 (en) * 2005-07-18 2014-06-24 Oracle International Corporation Document level indexes for efficient processing in multiple tiers of a computer system
KR100775234B1 (ko) * 2005-09-26 2007-11-12 엘지전자 주식회사 방송프로그램 정보 제공 시스템
US8073841B2 (en) 2005-10-07 2011-12-06 Oracle International Corporation Optimizing correlated XML extracts
JP2007108905A (ja) * 2005-10-12 2007-04-26 Fuji Xerox Co Ltd ファイルサーバ、ファイル提供方法及びプログラム
US7685138B2 (en) * 2005-11-08 2010-03-23 International Business Machines Corporation Virtual cursors for XML joins
US8949455B2 (en) 2005-11-21 2015-02-03 Oracle International Corporation Path-caching mechanism to improve performance of path-related operations in a repository
WO2007065207A1 (en) * 2005-12-06 2007-06-14 National Ict Australia Limited A succinct index structure for xml
US8015165B2 (en) * 2005-12-14 2011-09-06 Oracle International Corporation Efficient path-based operations while searching across versions in a repository
CN1790335A (zh) * 2005-12-19 2006-06-21 无锡永中科技有限公司 Xml文件数据存取的方法
US7472140B2 (en) * 2005-12-20 2008-12-30 Oracle International Corporation Label-aware index for efficient queries in a versioning system
US7543004B2 (en) 2005-12-22 2009-06-02 Oracle International Corporation Efficient support for workspace-local queries in a repository that supports file versioning
US7533136B2 (en) 2005-12-22 2009-05-12 Oracle International Corporation Efficient implementation of multiple work areas in a file system like repository that supports file versioning
US7933928B2 (en) 2005-12-22 2011-04-26 Oracle International Corporation Method and mechanism for loading XML documents into memory
US7730032B2 (en) 2006-01-12 2010-06-01 Oracle International Corporation Efficient queriability of version histories in a repository
JPWO2007081017A1 (ja) * 2006-01-13 2009-06-11 株式会社ジャストシステム 文書処理装置
US7596548B2 (en) 2006-01-20 2009-09-29 International Business Machines Corporation Query evaluation using ancestor information
US20070174241A1 (en) * 2006-01-20 2007-07-26 Beyer Kevin S Match graphs for query evaluation
KR100678123B1 (ko) * 2006-02-10 2007-02-02 삼성전자주식회사 관계형 데이터베이스에서의 xml 데이터 저장 방법
US9229967B2 (en) * 2006-02-22 2016-01-05 Oracle International Corporation Efficient processing of path related operations on data organized hierarchically in an RDBMS
US7945559B2 (en) * 2006-03-22 2011-05-17 Microsoft Corporation Completion of partially specified paths
US8510292B2 (en) 2006-05-25 2013-08-13 Oracle International Coporation Isolation for applications working on shared XML data
US7499909B2 (en) 2006-07-03 2009-03-03 Oracle International Corporation Techniques of using a relational caching framework for efficiently handling XML queries in the mid-tier data caching
US20080033967A1 (en) * 2006-07-18 2008-02-07 Ravi Murthy Semantic aware processing of XML documents
US7933935B2 (en) 2006-10-16 2011-04-26 Oracle International Corporation Efficient partitioning technique while managing large XML documents
US7797310B2 (en) * 2006-10-16 2010-09-14 Oracle International Corporation Technique to estimate the cost of streaming evaluation of XPaths
US7739251B2 (en) * 2006-10-20 2010-06-15 Oracle International Corporation Incremental maintenance of an XML index on binary XML data
US8010889B2 (en) * 2006-10-20 2011-08-30 Oracle International Corporation Techniques for efficient loading of binary XML data
US7747610B2 (en) * 2006-11-10 2010-06-29 Sybase, Inc. Database system and methodology for processing path based queries
US9436779B2 (en) * 2006-11-17 2016-09-06 Oracle International Corporation Techniques of efficient XML query using combination of XML table index and path/value index
US7840590B2 (en) * 2006-12-18 2010-11-23 Oracle International Corporation Querying and fragment extraction within resources in a hierarchical repository
US20080147615A1 (en) * 2006-12-18 2008-06-19 Oracle International Corporation Xpath based evaluation for content stored in a hierarchical database repository using xmlindex
US7552119B2 (en) * 2006-12-20 2009-06-23 International Business Machines Corporation Apparatus and method for skipping XML index scans with common ancestors of a previously failed predicate
US7716210B2 (en) 2006-12-20 2010-05-11 International Business Machines Corporation Method and apparatus for XML query evaluation using early-outs and multiple passes
US7860899B2 (en) * 2007-03-26 2010-12-28 Oracle International Corporation Automatically determining a database representation for an abstract datatype
US7908301B2 (en) * 2007-03-30 2011-03-15 Infosys Technologies Ltd. Efficient XML joins
US7814117B2 (en) * 2007-04-05 2010-10-12 Oracle International Corporation Accessing data from asynchronously maintained index
US7693911B2 (en) * 2007-04-09 2010-04-06 Microsoft Corporation Uniform metadata retrieval
KR100864537B1 (ko) * 2007-04-24 2008-10-21 고려대학교 산학협력단 트리 레이블을 이용한 확장성 표시 언어 문서의 질의 처리 방법, 및 그 질의 처리 장치
US7836098B2 (en) 2007-07-13 2010-11-16 Oracle International Corporation Accelerating value-based lookup of XML document in XQuery
US7840609B2 (en) 2007-07-31 2010-11-23 Oracle International Corporation Using sibling-count in XML indexes to optimize single-path queries
JP5264905B2 (ja) * 2007-08-03 2013-08-14 韓國電子通信研究院 マルチメディア検索のためのクエリ表現装置および方法
EP2031520A1 (en) * 2007-09-03 2009-03-04 Software Ag Method and database system for pre-processing an XQuery
JP5347965B2 (ja) * 2007-09-07 2013-11-20 日本電気株式会社 Xmlデータ処理システム、該システムに用いられるデータ処理方法及びxmlデータ処理制御プログラム
US20090138500A1 (en) * 2007-10-12 2009-05-28 Yuan Zhiqiang Method of compact display combined with property-table-view for a complex relational data structure
US7991768B2 (en) 2007-11-08 2011-08-02 Oracle International Corporation Global query normalization to improve XML index based rewrites for path subsetted index
US8250062B2 (en) 2007-11-09 2012-08-21 Oracle International Corporation Optimized streaming evaluation of XML queries
US8543898B2 (en) 2007-11-09 2013-09-24 Oracle International Corporation Techniques for more efficient generation of XML events from XML data sources
US9842090B2 (en) 2007-12-05 2017-12-12 Oracle International Corporation Efficient streaming evaluation of XPaths on binary-encoded XML schema-based documents
US7865502B2 (en) * 2008-04-10 2011-01-04 International Business Machines Corporation Optimization of extensible markup language path language (XPATH) expressions in a database management system configured to accept extensible markup language (XML) queries
KR100956921B1 (ko) * 2008-04-28 2010-05-11 권순용 데이터베이스 액세스 방법
US8429196B2 (en) 2008-06-06 2013-04-23 Oracle International Corporation Fast extraction of scalar values from binary encoded XML
US8024325B2 (en) * 2008-06-25 2011-09-20 Oracle International Corporation Estimating the cost of XML operators for binary XML storage
US8407209B2 (en) * 2008-07-23 2013-03-26 Oracle International Corporation Utilizing path IDs for name and namespace searches
US7958112B2 (en) 2008-08-08 2011-06-07 Oracle International Corporation Interleaving query transformations for XML indexes
CA2735284A1 (en) * 2008-08-29 2010-03-04 Anders E. Eriksson Prefix delegation in a communication network
US8219563B2 (en) 2008-12-30 2012-07-10 Oracle International Corporation Indexing mechanism for efficient node-aware full-text search over XML
US8126932B2 (en) * 2008-12-30 2012-02-28 Oracle International Corporation Indexing strategy with improved DML performance and space usage for node-aware full-text search over XML
US10108432B1 (en) * 2009-04-16 2018-10-23 Intuit Inc. Generating a script based on user actions
US8549398B2 (en) 2009-09-17 2013-10-01 International Business Machines Corporation Method and system for handling non-presence of elements or attributes in semi-structured data
CN102893281A (zh) * 2010-05-14 2013-01-23 日本电气株式会社 信息搜索设备、信息搜索方法、计算机程序和数据结构
CN102033954B (zh) * 2010-12-24 2012-10-17 东北大学 关系数据库中可扩展标记语言文档全文检索查询索引方法
US9842111B2 (en) * 2013-12-22 2017-12-12 Varonis Systems, Ltd. On-demand indexing
CN105426349A (zh) * 2015-11-03 2016-03-23 北京锐安科技有限公司 一种逻辑表达式的传输交换方法及装置
WO2018182058A1 (ko) 2017-03-28 2018-10-04 (주)리얼타임테크 관계형 데이터베이스의 조인 방법
CN107908725A (zh) * 2017-11-14 2018-04-13 中国银行股份有限公司 一种批量数据校验方法、装置和系统
CN108804593B (zh) * 2018-05-28 2019-06-18 西安理工大学 基于图谱和可达路径数的无向加权图的子图查询方法
KR102062139B1 (ko) * 2018-05-30 2020-02-11 이재현 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치
KR102195836B1 (ko) * 2019-02-07 2020-12-28 주식회사 티맥스티베로 인덱스 관리 방법
CN111290805B (zh) * 2020-03-12 2023-08-18 深圳市我能成才企业管理有限公司 一种聚合功能快捷调用方法及系统
US11868746B2 (en) 2021-09-02 2024-01-09 Kinaxis Inc. System and method for transition of static schema to dynamic schema

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3492247B2 (ja) * 1999-07-16 2004-02-03 富士通株式会社 Xmlデータ検索システム
US6721727B2 (en) * 1999-12-02 2004-04-13 International Business Machines Corporation XML documents stored as column data
JP2001282856A (ja) * 2000-03-31 2001-10-12 Toshiba Corp インデックス作成方法、インデックス表示方法、インデックス検索方法及びインデックス作成装置
JP2001297104A (ja) * 2000-04-11 2001-10-26 Canon Inc データ保管装置、方法及び記憶媒体
JP3651768B2 (ja) * 2000-05-18 2005-05-25 富士通株式会社 文書ファイル検索システム
WO2001093599A2 (en) * 2000-06-01 2001-12-06 Wisengine Inc. Method and apparatus for unified query interface for network information
US6745206B2 (en) * 2000-06-05 2004-06-01 International Business Machines Corporation File system with access and retrieval of XML documents
US6912538B2 (en) * 2000-10-20 2005-06-28 Kevin Stapel System and method for dynamic generation of structured documents
US6804677B2 (en) * 2001-02-26 2004-10-12 Ori Software Development Ltd. Encoding semi-structured data for efficient search and browsing
US6901410B2 (en) * 2001-09-10 2005-05-31 Marron Pedro Jose LDAP-based distributed cache technology for XML
KR100831551B1 (ko) * 2001-09-28 2008-05-22 주식회사 케이티 관계형 데이터베이스를 이용해 문서를 저장, 검색 및 복구하는 장치 및 그 방법
US6826568B2 (en) * 2001-12-20 2004-11-30 Microsoft Corporation Methods and system for model matching

Also Published As

Publication number Publication date
CN1230771C (zh) 2005-12-07
US20030212662A1 (en) 2003-11-13
KR100484138B1 (ko) 2005-04-18
CN1457003A (zh) 2003-11-19
KR20030087370A (ko) 2003-11-14
JP2004030569A (ja) 2004-01-29
US7139746B2 (en) 2006-11-21

Similar Documents

Publication Publication Date Title
JP4028410B2 (ja) 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造
US8255394B2 (en) Apparatus, system, and method for efficient content indexing of streaming XML document content
US6950815B2 (en) Content management system and methodology featuring query conversion capability for efficient searching
US7318063B2 (en) Managing XML documents containing hierarchical database information
KR101066628B1 (ko) 계층적 데이터 포맷의 데이터베이스 모델
US7478100B2 (en) Method and mechanism for efficient storage and query of XML documents based on paths
US20110179085A1 (en) Using Node Identifiers In Materialized XML Views And Indexes To Directly Navigate To And Within XML Fragments
US20040128615A1 (en) Indexing and querying semi-structured documents
US20130297657A1 (en) Apparatus and Method for Forming and Using a Tree Structured Database with Top-Down Trees and Bottom-Up Indices
US20070150458A1 (en) System for extending data query using ontology, and method therefor
US8930348B2 (en) Isolation for applications working on shared XML data
JP4724177B2 (ja) Xmlデータにアクセスするためのインデックス
US20090182722A1 (en) Method and system for navigation of a data structure
KR100941971B1 (ko) 멀티미디어 검색을 위한 질의 표현 장치 및 방법
KR100961444B1 (ko) 멀티미디어 콘텐츠를 검색하는 방법 및 장치
JP2010267081A (ja) 情報検索方法及び装置及びプログラム
Yaginuma et al. Metadata elements for digital news resource description
KR100904890B1 (ko) 임베디드 멀티미디어 기기에 적합한 mpeg-7메타-데이터 저장 방법
Yaginuma et al. Design of metadata elements for digital news articles in the Omnipaper project
JP3498926B2 (ja) 文書データベース管理システム
Gasch XML Schema driven Database Management of Speech Corpus Metadata
JP5225022B2 (ja) Xmlデータ検索方法及び装置及びプログラム
JP2012032858A (ja) 文書検索装置の動作方法およびこれをコンピュータに実行させるためのコンピュータプログラム
Noonan Pruning XML trees for XPath query optimisation
Yang et al. XKFilter: A Keyword Filter on XML Stream

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070223

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070718

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071011

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees