JP4028410B2 - 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 - Google Patents
関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 Download PDFInfo
- Publication number
- JP4028410B2 JP4028410B2 JP2003039719A JP2003039719A JP4028410B2 JP 4028410 B2 JP4028410 B2 JP 4028410B2 JP 2003039719 A JP2003039719 A JP 2003039719A JP 2003039719 A JP2003039719 A JP 2003039719A JP 4028410 B2 JP4028410 B2 JP 4028410B2
- Authority
- JP
- Japan
- Prior art keywords
- route
- information
- document
- lookup
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4332—Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
Description
【発明の属する技術分野】
本発明は関係型データベースにおいてユーザの質疑表現方法の違いと無関係に安定的に質疑を処理することのできる拡張マークアップ言語(XML:Extended Markup Language)インデックス方法である経路インデックスルックアップ方法に係り、経路ルックアップテーブル及び拡張幹線テーブルの構造を提示し、これらテーブルを用いて任意の長さの正規経路式をただ一回のジョイン演算により処理可能にする方法を提供する。
【0002】
インターネットにおいて情報交換の標準言語として提案されたXMLはコンピュータ及びネットワークシステム(SyncML,UPnP)においてはもとより、生物情報(BSML,BioML)、電子商取引き(ebXML,ECML)、電子文書交換(XML−EDI)、地理情報及び全域位置システム(GPS:Global Positioning System)(GML,NVML)、マルチメディア(MPEG−7,IML)、エンターテイメント(MusicXML,GML)、教育(LMML,TML)、医療(CTDM,TDL)、出版(BiblioML,DocBook)、テレビ放送(TV−Anytime)など、産業全分野において幅広く用いられている。
【0003】
各応用分野においてXMLにより記述されたデータが関係型データベースや客体指向型データベースなど既存のデータベースにおける定形的なデータと異なる点の一つは、データ構造が半構造的であるということである。すなわち、XMLは、応用分野に合うデータ構造を表わす様式(DTD:Document Type Definition)は定義するが、その様式に厳しく従わなくても良いという半構造的な特性を有する。
【0004】
XMLの半構造的な特性は、相異なる情報ソース間のデータ表現及び交換において融通性を提供できるという長所がある。XMLが多くの応用分野において標準言語として用いられる理由の一つも、データ表現が容易であるということに加えて、このような半構造的な特性によるためであると見られる。
XMLの半構造的な特性のゆえに、XMLにて文書を作成する著作者は定義されたDTDから外れてXMLのデータを変形して生成することが許容されるだけではなく、XMLにて作成された文書のユーザもまたXMLデータの正確な構造が分からなくてもデータに対する検索を行うことができる。
【0005】
XMLの半構造的な特性に基づく検索はユーザが検索しようとするデータを表わしたXMLの文書構造が正確に分からない時に有用である。例えば、ウェブにおいて特定分野のXMLにて作成された文書を検索する時、ユーザはその特定分野のスキーマを正確に反映していない部分的な知識でも文書に関する質疑結果を得ることができる。
【0006】
ユーザのXMLデータに関する半構造的な特性に基づく検索式はXMLの質疑語であるXQueryなどにおいて正規経路式質疑により表わせる。質疑を処理するシステム側面においてXMLの正規経路式質疑は、定形化したスキーマに基づくデータベース質疑とは異なって質疑条件に相当するデータの構造を正確に記述しないため、同じ条件を表わす質疑がユーザの質疑記述方法によって異なる質疑として解釈されて行われる場合がある。従って、XMLを処理するシステムが正規経路式質疑を解釈して最適化する方法によって質疑処理性能に多くの違いを示す恐れがある。
【0007】
XML文書を関係型データベースに貯蔵する方法は、代表的に、幹線技法とアトリビュート技法とに大別できる。幹線技法はXML文書に関するスキーマ情報がない場合にも一般的にそのXML文書を貯蔵して処理できるという長所があるものの、相対的に大きい幹線テーブルに関する経路式の長さだけの重なったセルフジョインにより性能低下が起こりうる。ジョイン演算はテーブル内のエレメント間の関係を求める演算を言い、セルフジョインは同じテーブル内においてエレメント間の関係を求める演算を言う。
【0008】
アトリビュート技法はXML文書のスキーマ情報が予め知られている時、エンティティ単位にテーブルを生成して処理する方法である。従って、幾つかのテーブルにデータを分割して貯蔵する効果があり、幹線技法に比べてその性能を高めることができるが、XMLスキーマによってはテーブルの数が多過ぎたり、不要にデータが断片化したりするという短所がある。
【0009】
かかる問題点を補完するために、スキーマのないXML文書を貯蔵するために、データマイニング方法を用いて分離可能なテーブルの種類及び数を定める方法に関する研究が進んできた。幹線技法及びアトリビュート技法ともに基本的には経路式を処理する方法であり、経路式の長さだけテーブル間のジョイン演算が必要である。また、正規経路式を処理するのに適した構造を有していない。
【0010】
幹線技法のうちタッグの開始及び終了オフセットの情報を用いて正規経路式を処理する方法があるが、経路式が長い場合に効率的ではなく、ユーザによる質疑記述方法によって質疑処理性能が左右されるという短所がある。
XMLデータに関する経路式インデックス方法としてインデックスファブリックと呼ばれる方法があるが、これはXML文書に存在する各種の経路に関するインデックスを一つのインデックス構造において管理できるという特徴を有する。このインデックス構造は関係型データベースを支援するためにさらなる拡張を行った構造である。インデックスファブリックにおいては、特定の正規経路式を処理するためにその特定経路を人工経路の形でインデックス構造に明らかに付加しなければならない。本発明による経路ルックアップテーブルはインデックスファブリックにおいて正規経路式を処理するのにも適用できる。
【0011】
そして、インデックスの役割を果たすテーブル構造が提示されている。しかし、この方法をXMLの経路式インデックスに直ちに適用する時の問題点は、インデックステーブルの数が増えるか、あるいは断片化するということである。XMLデータに対する経路式処理はツリーを巡回するという点で客体指向型データベースにおける経路式処理方法と類似している。
【0012】
【発明が解決しようとする課題】
前記問題を解決するために、本発明においては、関係型データベースにおいてXMLにて表わされた正規経路式質疑をユーザの表現方法の違いを問わずに同じ方法により解釈し、効率良いXMLインデックス方法を提供することを目的とする。
詳細には、既存の方法において正規経路式が長くなるほど質疑処理性能が落ちるのとは異なって、正規経路式の長さと無関係に一回のジョインにて任意の正規経路式を処理することのできるXMLインデックス方法を提供する。また、関係型データベースシステムエンジンの変形なしに用いることのできるテーブル及びBツリーに基づくXMLインデックステーブル資料構造を提供することを目的とする。
【0013】
【課題を解決するための手段】
前記目的を達成するために、本発明においては、経路インデックスルックアップ装置における経路インデックスルックアップ方法であって、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書から前記経路インデックスルックアップ装置の経路ルックアップテーブル貯蔵部が複数の前記経路情報を抽出する段階と、前記複数の経路情報の各々に対応する経路識別子(ID)情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて前記経路ルックアップテーブル貯蔵部が経路ルックアップテーブルに貯蔵する段階と、前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからソースID情報及びターゲットID情報を入力されて前記経路インデックスルックアップ装置の拡張幹線テーブル貯蔵部が拡張幹線テーブルに貯蔵する段階と、ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されて前記経路インデックスルックアップ装置の経路ID検索部がこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記経路に対応する経路ID情報を求める段階と、前記経路インデックスルックアップ装置の経路情報判断及び出力部が前記段階において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出す段階とを含む経路インデックスルックアップ方法を提供する。
【0014】
前記目的を達成するために、本発明においては、前記方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体を提供する。
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書において、前記複数の経路情報の各々に対応する経路ID情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて経路ルックアップテーブルに貯蔵する経路ルックアップテーブル貯蔵部と、前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからソースID情報及びターゲットID情報を入力されて拡張幹線テーブルに貯蔵する拡張幹線テーブル貯蔵部と、ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されてこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記経路に対応する経路ID情報を求める経路ID検索部と、前記経路ID検索部において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出して出力する経路情報判断及び出力部とを備える経路インデックスルックアップ装置を提供する。
【0015】
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書を関係型データベースに貯蔵するのに用いられる資料構造において、前記文書内において検索しようとする情報が貯蔵されている経路の名前を表わす経路名情報と、前記経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、文書内の様々な経路に関するソースID情報及びターゲットID情報を貯蔵している拡張幹線テーブルに前記経路がインデックスされているか否かを表わすインデックスフラグ情報とを備え、ユーザから捜し出そうとする情報に関する検索式である正規経路式が入力されればこれと一致する経路情報に関する経路名情報を捜し出してこれと対応する経路ID情報を出力する経路ルックアップテーブルを提供する。
【0016】
前記目的を達成するために、本発明においては、XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書を関係型データベースに貯蔵するのに用いられる資料構造において、前記文書内において検索しようとする情報が貯蔵されている経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、Elementsテーブルのタップルを参照するソースIDと、ElementsテーブルまたはTextsテーブルのタップルを参照するターゲットIDとを備え、ユーザから捜し出そうとする情報に関する経路ID情報が入力されればこれと対応するソースID情報及びターゲットID情報を出力する拡張幹線テーブルを提供する。
従って、本発明においては、ユーザ質疑の形に対して依存的な性能を示す既存の技法とは異なって、ユーザの質疑表現とは独立的に正規経路式を安定的で且つ速く処理することのできる経路インデックスルックアップ方法を提供する。
【0017】
【発明の実施の形態】
以下、添付した図面に基づき、本発明による好適な一実施形態について詳細に説明する。
正規経路式とは、ユーザがXML文書内の接近しようとするあるエンティティの経路を指定する時、その経路を全て並べることなく、縮約して表わす経路式を言う。
【0018】
図1Aないし図1Bは、TV−Anytimeのメタデータ規格の一部を表わすXMLにて作成された文書の一実施形態である。
TV−AnytimeのメタデータはTV放送番組に関する情報を表わすが、プログラムID programId、題目Title、要約情報Synopsis、キーワードKeywords、ジャンルGenre、キャスティング情報CastListなどを含んでいる。図1Aは、 TV−AnytimeのXMLにて作成された文書の例を示し、図1Bは、文書の内容をツリーの形で表わしたものである。
【0019】
図1Bから分かるように、TV放送システムのように一般ビジネス応用分野におけるXML文書構造はツリーが極めて深くて複雑であるため、ユーザは文書に対する検索を要請する時、正確な経路を記述し難い。例えば、本例においてユーザが特定番組に登場する俳優の名前を検索する時、
/ProgramInformation/BasicDescription/CastList/CastMember/Agent/Name
のようにルートエレメントから名称エレメントまでの経路を全て並べた絶対経路式にて記述しても良いが、
/ProgramInformation//CastList//Agent/Name
のようにユーザが必要であると思うエレメント名前よりなる正規経路式にてさらに簡単に記述することができる。前記絶対経路式において記号‘/’はXML文書上において直接的な親子の関係を表わすのに対し、記号‘//’は親子関係の意味を拡張して一般的な先祖−子孫の関係を表わす。記号‘//’で表わされる先祖−子孫の関係は正規経路式のための代表関係の一つである。
【0020】
図2は、正規経路式において用いられる主な記号及びその意味を示す図面である。
すなわち、XML質疑語であって、ワールドワイドウェブコンソーシアム(W3C)においてXML標準言語として提案されたXQuery上において正規経路式のための主要記号及びその意味を示すものである。一つの絶対経路式は図2に示された記号を用いて様々な正規経路式にて表わせる。
【0021】
例えば、前記絶体経路式
/ProgramInformation/BasicDescription/CastList/CastMembr/Agent/Nammeは、
前記正規経路式/ProgramInformation//CasrList//Agent/Nameを含めて下記のように様々な正規経路式にて表せる。
【0022】
中でも前記正規経路式//CastMember//Nameは、前記絶対経路式と比較して同じ内容を簡単に表わしている。このように正規経路式入り質疑においては、同じ内容がユーザにより異なって表わされる場合がある。このため、正規経路式質疑を処理するシステムはユーザ質疑を解釈する方法によってその性能に多くの違いが生じうる。
【0023】
従来に提案された方法においては、関係型データベースにおいてXML文書に関する正規経路式質疑を処理するために、下記の如く2つのテーブル構造を提案した。
Elements(term, docno, begin, end, level)
Texts(term, docno, wordno, level)
【0024】
Elementsテーブルは、XML文書においてタッグとして指定されたエレメント及びアトリビュートを個々のタップルとして貯蔵する。termはタッグの名前を、docnoはタッグの属する文書IDを、begin及びendは文書内においてtermの属するタッグのオフセット範囲を、levelは文書内においてエレメントの重なった回数、すなわち、先祖の数を各々表わす。
【0025】
TextsテーブルはXML文書においてタッグ内に含まれた値を個々のタップルとして貯蔵する。docnoはある値の属するIDを、wordnoは該当値の文書内のオフセットを、levelは文書内において重なった回数を各々表わす。このような貯蔵構造下において、正規経路式はエレメントのオフセット値及びレベル値を用いたElementsテーブルに対するセルフジョインにより処理される。
【0026】
図3は、前記Elementsテーブル及びTextsテーブル構造を用いて各エレメントを表わした一実施形態である。
すなわち、sectionというエレメントについて説明すれば、(1,1:23,0),(1,8:22,1),(1,14:21,2)があるが、最初の(1,1,1)はdocnoを表わし、1:23, 8:22, 14:21は開始及び終了を表わし、最後の数字0, 1, 2はレベルを表わす。
【0027】
すなわち、従来の方法において、正規経路式はElementsテーブルに対するセルフジョインにより処理される。例えば、前記正規経路式//CastMember//Nameは下記の如きSQL質疑として表わされて処理される。
Select e1
From Elements e1, Elements e2
Where e1. term=‘CastMember’
And e2. term=‘Name’
And e1. begin<e2. begin
And e1. end>e2. end
And e1. docno=e2. docno
【0028】
この質疑はCastMemberを代表するElementsテーブル及びNameを代表するElementsテーブルのセルフジョインにより処理される。先祖−子孫の関係を表わす‘//’に対し、ジョイン条件には両エレメント間のオフセット包含関係となる。
すなわち、XML文書上における両エレメントA及びBに対し、AのbeginオフセットがBのbeginオフセットより小さく、AのendオフセットがBのendオフセットより大きい時、A//Bという正規経路式が満足される。前記質疑においては両エレメントCastMember及びNameに対し、CastMemberのbeginオフセットがNameのbeginオフセットより小さく、 CastMemberのendオフセットがNameのendオフセットより大きいという条件を表わしている。
【0029】
既存に提案されている正規経路式処理方法の共通した問題点は、システムの質疑処理性能がユーザによる正規経路式の記述方法に対して依存的であるというところにある。すなわち、正規経路式に幾つのタッグが指定されたかによってその正規経路式を処理するために必要なジョインの回数が決まる。
前述したように、同じ絶対経路式に対して様々な正規経路式があり、それによりジョインの回数も変わる。
【0030】
すなわち、同じ内容を表わす正規経路式のうち//CastMember//Nameは、ジョインが一回のみ必要であるが
/ProgramInformation/BasicDescription/CastList/CastMember/Agent/Nameは、ジョインが5回行われなければならない。
そして、同じ質疑における正規経路式
/ProgramInformation//CastList//Agent/Nameに対し、3回のジョイン演算が必要となる。
このように、従来の技術においては、実際の応用分野に適用するのに多くの難点があった。このため、XML文書を貯蔵して検索する問題がXMLを取り扱う応用分野における技術的なボトルネックであった 。
【0031】
これに対し、本発明において提示する経路インデックスルックアップ方法は既存に提案されたElementsテーブル及びTextsテーブルに加え、下記の如き2種のテーブル構造を追加してXML文書をインデックスする。
PathLookup(pathname, pathid, indexflag)
ExtendedEdge(pathid, sorid, tarid)
経路ルックアップテーブルはXML文書をパーシングした時に発生可能な経路をタップルとして貯蔵する。
【0032】
pathnameは経路の名前を表わし、pathidはその経路に関するIDであり、indexflagは該当経路が拡張幹線テーブルにおいてインデックスされているか否かを表わす。拡張幹線テーブルは経路の長さが1以上である経路のインデックス情報を貯蔵する。pathidは経路ルックアップテーブルにおけるタップルを示す経路IDを、sorid(source id)及びtarid(target id)はElementsテーブルにおけるエレメントIDを各々表わす。
【0033】
XMLにて作成された文書をデータベースに入力する時、全ての可能な経路名を選択してそれらをIDと共に経路ルックアップテーブルにタップルとして貯蔵する。XMLにて作成された文書に関する経路はその文書をパーシングする時に抽出することができるので、該当文書のためのDTDあるいはXMLスキーマが別途に必要ではない。
【0034】
XMLにて作成された文書構造を表わすツリーにおいて、ルートからのレベルがkであるノードAに対する可能な長さが1以上である経路のうちAで終わる経路の数はk個存在しうる。ここで注目すべき点は、ある文書に関する経路抽出に際し、以前の文書において生じた経路は重なって入力されないため、構造が類似した大容量のXMLにて作成された文書をデータベースに入力しても経路ルックアップテーブルはあまり大きくならないということである。
【0035】
経路ルックアップテーブルはユーザが入力した正規経路式を実際のXMLデータ空間に存在する経路に迅速に変換するためのインデックスの役割を果たす。ユーザが記述した正規経路式を経路ルックアップテーブルに貯蔵されている経路にマッピングする演算はSQL(Structured Query Language)のlike構文にて処理される。
【0036】
正規経路式のSQLのlike構文へのマッピングを容易にするために、経路名を経路ルックアップテーブルに貯蔵する時には、経路の各ノードにタッグを付けて貯蔵する。例えば、経路‘A/B/C’は‘<A><B><C>’のように貯蔵される。
図4は、正規経路式に関するSQLのlike構文である。
【0037】
図4の構文を用い経路ルックアップテーブルにおいて経路を検索するために、前記で例として取られた正規経路式/ProgramInformation//CastList//Agent/Nameに関するSQL構文を作成すれば、下記の通りである。
【0038】
以下では、拡張幹線テーブルについて説明する。拡張幹線テーブルはXMLにて作成された文書上の経路を速く処理するための経路インデックステーブルである。各タップルは経路ルックアップのための経路IDを有しており、経路ルックアップテーブルのタップルを参照する。
各経路のソースID sorid及びターゲットID taridを指定するフィールド値はElementsテーブルのタップルを参照する。ターゲットID taridがエレメントの代わりにテキストを指定する時にはターゲットID taridはTextsテーブルのタップルを参照する。注目すべき点は、以前の幹線技法などで繰り返しジョインを通じて経路を処理するのとは異なって、拡張幹線テーブルは極めて長い経路の場合にもさらなるジョイン演算無しにも一回に接近できる構造を有するということである。
【0039】
図5は、XML文書に関する経路ルックアップテーブル及び拡張幹線テーブルの構成の一実施形態である。
すなわち、図5Aの如きXML文書がある時、図5Bは経路ルックアップテーブルを、図5Cは拡張幹線テーブルの構成例を各々示している。換言すれば、図5Aは入力される文書の構造を示し、図5Bは文書入力時に新しく生じる経路に対して作成された経路ルックアップテーブルを示す。経路ルックアップテーブルのインデックスフラグindexflagフィールドは該当経路が拡張幹線テーブルにインデックスされているか否かを表わす。
【0040】
図5Bにおいて、経路/A/B/C及び/A/B/Dに対してのみ拡張幹線テーブルにおいてインデックスされているということが分かる。拡張幹線テーブルはXMLにて作成された文書のノード数の自乗に比例するため、全ての経路をインデックスすればテーブルが大きすぎるため、インデックスする経路を区分し、その区分された経路のみを貯蔵するための方法である。
【0041】
図5Cの拡張幹線テーブルにおいては、図5Bの経路ルックアップテーブルのインデックスフラグindexflagにおいて指定された経路/A/B/C及び/A/B/Dに関する実際の経路インスタンスを貯蔵する。
拡張幹線テーブルにおいては、与えられた正規経路式に対して経路ルックアップテーブルにおいて捜し出された経路IDをもって指定されたタップルが接近されるため、このテーブルに対して経路IDをキーフィールドとして指定し、このフィールドにBツリーインデックスを用いれば極めて早く接近することができる。
【0042】
経路インデックスルックアップ方法における正規経路式の処理は下記の通りである。まず、与えられた正規経路式について可能な経路式を経路ルックアップテーブルから捜し出してそれらの経路IDを求める。次に、求められた経路IDに対応するソースID及びターゲットIDを拡張幹線テーブルから得る。これら2段階の演算は、経路IDをジョインキーとするジョイン演算により表わせる。
【0043】
図6は、経路インデックスルックアップ方法の構造を示す図面である。
図6に示されたように、経路インデックスルックアップ方法においては、ユーザが表わす正規経路式の形と無関係に該当正規経路式を経路ルックアップテーブルに対するテーブル検索及び拡張幹線テーブルに対するBツリー検索演算により処理する。
【0044】
前述した例において、TV放送用XML文書に関する正規経路式のうち/ProgramInformation//CastList//Agent/Nameを既存の方法により処理するSQL構文は下記の通りである。
【0045】
従って、前記のように3回のジョイン演算入りの質疑文により表わされるのに対し、経路インデックスルックアップ方法を通じたSQL構文は下記のように一回のジョインにより処理される。
【0046】
図7は、正規経路式質疑に関する経路インデックスルックアップ方法のフローチャートである。
まず、XMLにて作成された文書から抽出可能な全ての経路名を抽出して経路ID情報及びインデックスフラグ情報と共に経路ルックアップテーブルに貯蔵する(ステップ710)。そして、前記各々の経路IDに対してソースID及びターゲットIDを拡張幹線テーブルに貯蔵する(ステップ720)。
【0047】
次には、正規経路式を入力され(ステップ730)、これに対応する経路式を経路ルックアップテーブルにおいて検索して経路IDを求める(ステップ740)。この時、SQLのlike構文を用いて経路ルックアップテーブルにおいて経路IDを求める。そして、求められた経路IDをジョインキーとするジョイン演算により表わして行う。
【0048】
そして、前記段階において求められた経路IDを検索キーとして拡張幹線テーブルを検索し、経路のソースID及びターゲットIDを求める(ステップ750)。この時、拡張幹線テーブルに対するBツリー検索演算により行われる。図8は、正規経路式質疑に関する経路インデックスルックアップ装置を示す図面である。
【0049】
経路インデックスルックアップ装置は、経路ルックアップテーブル貯蔵部810と、拡張幹線テーブル貯蔵部820と、経路ID検索部830及び経路情報判断及び出力部840を備えてなる。
経路ルックアップテーブル貯蔵部810は、XMLにて作成された文書から複数の経路情報を抽出し、ユーザから入力された経路ID情報及びインデックスフラグ情報と共に貯蔵する。貯蔵形態はテーブル形態であり、図5Bの通りである。
【0050】
拡張幹線テーブル貯蔵部820は、前記各々の経路IDに対してユーザからソースID情報及びターゲットID情報を入力されて貯蔵する。貯蔵形態はテーブル形態であり、図5Cの通りである。
経路ID検索部830は、ユーザから正規経路式情報を入力されてこれと一致する経路を前記経路ルックアップテーブル貯蔵部から捜し出し、所望の経路に相当する経路ID情報を求める。
【0051】
経路情報判断及び出力部840は、前記経路ID検索部830において求められた経路ID情報を検索キーとしてこれと一致する経路情報を前記拡張幹線テーブル貯蔵部820から捜し出し、経路のソースID情報及びターゲットID情報を求めて出力する。
そして、正規経路式質疑に対して本発明が提供する経路インデックスルックアップ方法の性能をオフセットを用いたジョイン技法の性能と比較した。実験に用いられたデータはTV放送システムの文書1200個を関係型データベースシステムに入力した。入力済みのElementsテーブルのノード数は約1,000,000であった。
【0052】
図9は、実験に用いられた正規経路式テーブルである。
実験においては、図9に示されたように、ノード数が2ないし9である正規経路式を処理するのにかかる反応時間を測定した。
図10は、正規経路式のノード数による反応時間グラフである。
オフセットジョインはオフセット値に基づくジョイン技法における反応時間を、経路ルックアップは経路インデックスルックアップ技法における反応時間を各々表わす。
【0053】
図10から分かるように、既存のオフセットを用いたジョイン技法は正規経路式が長くなるほど反応時間が延びるのに対し、本発明が提供する経路インデックス方法は正規経路式の長さに敏感ではなく、平均的に良好な性能を示している。ノード数が2である時、すなわち、オフセットジョインにおいてジョインが一回生じる場合にも経路ルックアップ方法がさらに良好な性能を示す理由は、経路ルックアップ技法においてはBツリーを用い拡張幹線テーブルから該当経路式に対するタップルへと早く接近するからである。これに対し、オフセットジョインは、オフセット間の包含関係を用いたジョインであるため、その反応時間がさらに長い。
【0054】
一方、前記本発明の実施形態はコンピュータにて実行可能なプログラムにて作成でき、コンピュータにて読取り可能な記録媒体を用いて前記プログラムを動作させる汎用のデジタルコンピュータにより具現できる。
また、上述した本発明の実施形態において用いられたデータの構造はコンピュータにて読取り可能な記録媒体に各種の手段を通じて記録できる。
【0055】
前記コンピュータにて読取り可能な記録媒体はマグネチック貯蔵媒体(例えば、ROM、フロッピーディスク、ハードディスクなど)、光学的な判読媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを介した伝送)などの貯蔵媒体を含む。
以上、本発明についてその好適な実施形態を中心に調べてみた。本発明が属する技術分野における当業者であれば、本発明が本発明の本質的な特性から逸脱しない範囲内において変形された形態にて具現できるということが理解できるであろう。よって、開示された実施形態は限定的な観点ではなく説明的な観点から考慮さるべきである。本発明の範囲は前記詳細な説明ではなく特許請求の範囲上に現れており、それと同等な範囲内にあるあらゆる違いは本発明に含まれたものとして解釈さるべきである。
【0056】
【発明の効果】
上述したように、本発明は、XMLにて作成された質疑形式のうち核心的な正規経路式質疑に対してユーザ質疑の形式と無関係にただ一回のジョインにより処理できる方法を提供することにより、デジタルTVの電子番組表の情報インデックス及び検索エンジンとそれ以外の様々な分野のXML貯蔵が必要な情報機器に有用であるという効果がある。
【0057】
また、本発明は、XMLにて作成された文書を関係型データベースに効率良くインデックスして貯蔵することにより、XMLの核心的なユーザ質疑形式である正規経路式質疑をユーザによる記述形式と無関係に安定的で且つ速く処理できる効果がある。特に、既存の方法はユーザによる質疑の記述形式に依存的であるために性能が不安定であるのに対し、本発明はユーザ質疑形式と無関係にただ一回のジョインにより処理できるという長所を有する。
【図面の簡単な説明】
【図1A】 TV放送システムのメタデータ規格の一部を表わすXMLにて作成された文書の一実施形態の図である。
【図1B】 TV放送システムのメタデータ規格の一部を表わすXMLにて作成された文書に対するツリー構造を表す図である。
【図2】 正規経路式において用いられる主要記号及びその意味を示す図面である。
【図3】 Elements及びTextsテーブル構造を用いて各エレメントを表わした一実施形態である。
【図4】 正規経路式に対するSQLのlike構文である。
【図5A】 入力されたXML文書の一実施形態の図である。
【図5B】 本発明のXML文書に対する経路ルックアップテーブル構成の一実施形態の図である。
【図5C】 本発明のXML文書に対する拡張幹線テーブルの構成の一実施形態の図である。
【図6】 本発明の経路インデックスルックアップ方法の構造を示す図面である。
【図7】 本発明の正規経路式質疑に関する経路インデックスルックアップ方法のフローチャートである。
【図8】 本発明の正規経路式質疑に関する経路インデックスルックアップ装置を示す図面である。
【図9】 本発明の実験に用いられた正規経路式テーブルである。
【図10】 本発明の正規経路式のノード数による反応時間グラフである。
【符号の説明】
810…経路ルックアップテーブル貯蔵部
820…拡張幹線テーブル貯蔵部
830…経路ID検索部
840…経路情報判断及び出力部
Claims (5)
- 経路インデックスルックアップ装置における経路インデックスルックアップ方法であって、
(a)拡張マークアップ言語(XML)を含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書から前記経路インデックスルックアップ装置の経路ルックアップテーブル貯蔵部が複数の前記経路情報を抽出する段階と、
(b)前記複数の経路情報の各々に対応する経路識別子(ID)情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて前記経路ルックアップテーブル貯蔵部が経路ルックアップテーブルに貯蔵する段階と、
(c)前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからElementsテーブルのタップルを参照するソースID情報及びElementsテーブルまたはTextsテーブルのタップルを参照するターゲットID情報を入力されて前記経路インデックスルックアップ装置の拡張幹線テーブル貯蔵部が拡張幹線テーブルに貯蔵する段階と、
(d)ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されて、前記経路インデックスルックアップ装置の経路ID検索部がこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記捜し出そうとする情報が貯蔵されている経路に対応する経路ID情報を求める段階と、
(e)前記経路インデックスルックアップ装置の経路情報判断及び出力部が前記(d)段階において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出す段階と
を含み、
前記経路ルックアップテーブルは、前記文書の構造を表わすツリーにおいてルートからのレベルがkであるノードに対する長さが1以上の経路情報のうち前記ノードで終わる経路情報がk個存在し、
前記Elementsテーブルの個々のタップルは、タッグの名前、前記タッグの属する文書ID、前記文書内における前記タッグのオフセット範囲、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含み、
前記Textsテーブルの個々のタップルは、前記タッグ内に含まれた値、前記値の属する文書ID、前記文書内における前記値のオフセット、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含む経路インデックスルックアップ方法。 - 前記経路ルックアップテーブルに貯蔵された経路情報は、
前記文書内において検索しようとする情報が貯蔵されている経路の名前を表わす経路名情報と、
前記経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、
文書内の様々な経路に関するソースID情報及びターゲットID情報を貯蔵している拡張幹線テーブルに前記経路がインデックスされているか否かを表わすインデックスフラグ情報と
を備えることを特徴とする請求項1に記載の経路インデックスルックアップ方法。 - 前記拡張幹線テーブルは、
前記文書内において検索しようとする情報が貯蔵されている経路を互いに識別させる機能を果たす前記経路に関する識別情報を表わす経路ID情報と、
Elementsテーブルのタップルを参照するソースIDと、
ElementsテーブルまたはTextsテーブルのタップルを参照するターゲットIDと
を備えることを特徴とする請求項1に記載の経路インデックスルックアップ方法。 - 請求項1から3のいずれか1項に記載の方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体。
- XMLを含む所定の言語にて作成され、少なくとも一つ以上の表わされる情報までの経路情報を含む文書において、
前記複数の経路情報の各々に対応する経路ID情報及び前記経路情報の詳細が他の貯蔵場所に貯蔵されているか否かを表わすインデックスフラグ情報をユーザから入力されて経路ルックアップテーブルに貯蔵する経路ルックアップテーブル貯蔵部と、
前記インデックスフラグ情報が所定の値である場合、前記各々の経路IDについてユーザからElementsテーブルのタップルを参照するソースID情報及びElementsテーブルまたはTextsテーブルのタップルを参照するターゲットID情報を入力されて拡張幹線テーブルに貯蔵する拡張幹線テーブル貯蔵部と、
ユーザから捜し出そうとする情報に関する検索式である正規経路式を入力されてこれと一致する経路情報を前記経路ルックアップテーブルから捜し出して前記捜し出そうとする情報が貯蔵されている経路に対応する経路ID情報を求める経路ID検索部と、
前記経路ID検索部において求められた経路ID情報を検索キーとしてこれと一致する経路ID情報に対応するソースID情報及びターゲットID情報を前記拡張幹線テーブルから捜し出して出力する経路情報判断及び出力部とを備え、
前記経路ルックアップテーブルは、前記文書の構造を表わすツリーにおいてルートからのレベルがkであるノードに対する長さが1以上の経路情報のうち前記ノードで終わる経路情報がk個存在し、
前記Elementsテーブルの個々のタップルは、タッグの名前、前記タッグの属する文書ID、前記文書内における前記タッグのオフセット範囲、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含み、
前記Textsテーブルの個々のタップルは、前記タッグ内に含まれた値、前記値の属する文書ID、前記文書内における前記値のオフセット、前記文書内において前記タッグとして指定されたエレメントの重なった回数を含む経路インデックスルックアップ装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0025398A KR100484138B1 (ko) | 2002-05-08 | 2002-05-08 | 관계형 데이터베이스에서 정규 경로식 질의를 처리하는xml 인덱싱 방법과 자료구조 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004030569A JP2004030569A (ja) | 2004-01-29 |
JP4028410B2 true JP4028410B2 (ja) | 2007-12-26 |
Family
ID=29398487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003039719A Expired - Fee Related JP4028410B2 (ja) | 2002-05-08 | 2003-02-18 | 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7139746B2 (ja) |
JP (1) | JP4028410B2 (ja) |
KR (1) | KR100484138B1 (ja) |
CN (1) | CN1230771C (ja) |
Families Citing this family (114)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7366708B2 (en) | 1999-02-18 | 2008-04-29 | Oracle Corporation | Mechanism to efficiently index structured data that provides hierarchical access in a relational database system |
US7127469B2 (en) * | 2002-06-13 | 2006-10-24 | Mark Logic Corporation | XML database mixed structural-textual classification system |
EP1552427A4 (en) | 2002-06-13 | 2009-12-16 | Mark Logic Corp | PARENT-CHILD QUERY INDEX FOR XML DATA BANKS |
KR100497362B1 (ko) * | 2002-08-22 | 2005-06-23 | 삼성전자주식회사 | 전자 프로그램 가이드 정보 변환 장치 및 방법 |
WO2004019225A1 (ja) * | 2002-08-26 | 2004-03-04 | Fujitsu Limited | 状況付情報を処理する装置および方法 |
US7698642B1 (en) | 2002-09-06 | 2010-04-13 | Oracle International Corporation | Method and apparatus for generating prompts |
KR100493882B1 (ko) * | 2002-10-23 | 2005-06-10 | 삼성전자주식회사 | Xml 데이터 검색을 위한 질의 처리 방법 |
KR100558765B1 (ko) * | 2002-11-14 | 2006-03-10 | 한국과학기술원 | 적응형 경로 인덱스를 이용한 xml 질의 수행 방법 |
US7174346B1 (en) * | 2003-07-31 | 2007-02-06 | Google, Inc. | System and method for searching an extended database |
US7490093B2 (en) * | 2003-08-25 | 2009-02-10 | Oracle International Corporation | Generating a schema-specific load structure to load data into a relational database based on determining whether the schema-specific load structure already exists |
US7814047B2 (en) | 2003-08-25 | 2010-10-12 | Oracle International Corporation | Direct loading of semistructured data |
US8694510B2 (en) | 2003-09-04 | 2014-04-08 | Oracle International Corporation | Indexing XML documents efficiently |
US8229932B2 (en) * | 2003-09-04 | 2012-07-24 | Oracle International Corporation | Storing XML documents efficiently in an RDBMS |
KR100541531B1 (ko) * | 2003-12-24 | 2006-01-10 | 한국전자통신연구원 | 객체 지향 디비엠에스에서 경로식의 부질의 변환을 통한 질의 처리 방법 |
JP4046086B2 (ja) * | 2004-01-21 | 2008-02-13 | トヨタ自動車株式会社 | 可変圧縮比内燃機関 |
US8825702B2 (en) * | 2004-02-24 | 2014-09-02 | Oracle International Corporation | Sending control information with database statement |
JP2007531151A (ja) * | 2004-04-02 | 2007-11-01 | サムスン エレクトロニクス カンパニー リミテッド | ツリーパスフィルタリング機能を持つxmlプロセッサー、ツリーパスフィルタリング方法及びその方法を行うためのプログラムが保存された記録媒体 |
US7366735B2 (en) * | 2004-04-09 | 2008-04-29 | Oracle International Corporation | Efficient extraction of XML content stored in a LOB |
US7499915B2 (en) * | 2004-04-09 | 2009-03-03 | Oracle International Corporation | Index for accessing XML data |
US7493305B2 (en) * | 2004-04-09 | 2009-02-17 | Oracle International Corporation | Efficient queribility and manageability of an XML index with path subsetting |
US7440954B2 (en) * | 2004-04-09 | 2008-10-21 | Oracle International Corporation | Index maintenance for operations involving indexed XML data |
US7398265B2 (en) * | 2004-04-09 | 2008-07-08 | Oracle International Corporation | Efficient query processing of XML data using XML index |
CA2561734C (en) | 2004-04-09 | 2013-08-13 | Oracle International Corporation | Index for accessing xml data |
US7603347B2 (en) * | 2004-04-09 | 2009-10-13 | Oracle International Corporation | Mechanism for efficiently evaluating operator trees |
US7930277B2 (en) | 2004-04-21 | 2011-04-19 | Oracle International Corporation | Cost-based optimizer for an XML data repository within a database |
CN100440218C (zh) * | 2004-06-16 | 2008-12-03 | 甲骨文国际公司 | Lob中存储的xml内容的有效提取 |
EP1759315B1 (en) * | 2004-06-23 | 2010-06-30 | Oracle International Corporation | Efficient evaluation of queries using translation |
US7516121B2 (en) * | 2004-06-23 | 2009-04-07 | Oracle International Corporation | Efficient evaluation of queries using translation |
US8566300B2 (en) * | 2004-07-02 | 2013-10-22 | Oracle International Corporation | Mechanism for efficient maintenance of XML index structures in a database system |
US7885980B2 (en) * | 2004-07-02 | 2011-02-08 | Oracle International Corporation | Mechanism for improving performance on XML over XML data using path subsetting |
US7668806B2 (en) * | 2004-08-05 | 2010-02-23 | Oracle International Corporation | Processing queries against one or more markup language sources |
US7685137B2 (en) * | 2004-08-06 | 2010-03-23 | Oracle International Corporation | Technique of using XMLType tree as the type infrastructure for XML |
CN100382550C (zh) * | 2004-09-01 | 2008-04-16 | 恒生电子股份有限公司 | 联机处理系统中共享数据的处理方法 |
KR100673447B1 (ko) * | 2004-11-04 | 2007-01-24 | 엘지전자 주식회사 | 세탁기 |
US7849106B1 (en) | 2004-12-03 | 2010-12-07 | Oracle International Corporation | Efficient mechanism to support user defined resource metadata in a database repository |
US7921076B2 (en) | 2004-12-15 | 2011-04-05 | Oracle International Corporation | Performing an action in response to a file system event |
CN100410933C (zh) * | 2004-12-29 | 2008-08-13 | 复旦大学 | 一种基于xml数据的高效路径索引方法 |
KR100666942B1 (ko) * | 2005-01-07 | 2007-01-11 | 삼성전자주식회사 | 관계형 dbms를 이용한 xml 데이터 관리 방법 |
KR100612376B1 (ko) * | 2005-01-31 | 2006-08-16 | 인하대학교 산학협력단 | 통합패스의 노드범위를 이용한 엑스엠엘 인덱스 시스템 및방법 |
US7523131B2 (en) | 2005-02-10 | 2009-04-21 | Oracle International Corporation | Techniques for efficiently storing and querying in a relational database, XML documents conforming to schemas that contain cyclic constructs |
US8346737B2 (en) | 2005-03-21 | 2013-01-01 | Oracle International Corporation | Encoding of hierarchically organized data for efficient storage and processing |
US20060235839A1 (en) * | 2005-04-19 | 2006-10-19 | Muralidhar Krishnaprasad | Using XML as a common parser architecture to separate parser from compiler |
KR100714693B1 (ko) * | 2005-06-07 | 2007-05-04 | 삼성전자주식회사 | 소프트웨어 모듈의 독립성을 보장하는 데이터베이스어플리케이션을 구현하는 시스템 및 방법 |
WO2007006057A1 (en) * | 2005-07-06 | 2007-01-11 | The Cleveland Clinic Foundation | Apparatus and method for replacing a cardiac valve |
US8762410B2 (en) * | 2005-07-18 | 2014-06-24 | Oracle International Corporation | Document level indexes for efficient processing in multiple tiers of a computer system |
KR100775234B1 (ko) * | 2005-09-26 | 2007-11-12 | 엘지전자 주식회사 | 방송프로그램 정보 제공 시스템 |
US8073841B2 (en) | 2005-10-07 | 2011-12-06 | Oracle International Corporation | Optimizing correlated XML extracts |
JP2007108905A (ja) * | 2005-10-12 | 2007-04-26 | Fuji Xerox Co Ltd | ファイルサーバ、ファイル提供方法及びプログラム |
US7685138B2 (en) * | 2005-11-08 | 2010-03-23 | International Business Machines Corporation | Virtual cursors for XML joins |
US8949455B2 (en) | 2005-11-21 | 2015-02-03 | Oracle International Corporation | Path-caching mechanism to improve performance of path-related operations in a repository |
WO2007065207A1 (en) * | 2005-12-06 | 2007-06-14 | National Ict Australia Limited | A succinct index structure for xml |
US8015165B2 (en) * | 2005-12-14 | 2011-09-06 | Oracle International Corporation | Efficient path-based operations while searching across versions in a repository |
CN1790335A (zh) * | 2005-12-19 | 2006-06-21 | 无锡永中科技有限公司 | Xml文件数据存取的方法 |
US7472140B2 (en) * | 2005-12-20 | 2008-12-30 | Oracle International Corporation | Label-aware index for efficient queries in a versioning system |
US7543004B2 (en) | 2005-12-22 | 2009-06-02 | Oracle International Corporation | Efficient support for workspace-local queries in a repository that supports file versioning |
US7533136B2 (en) | 2005-12-22 | 2009-05-12 | Oracle International Corporation | Efficient implementation of multiple work areas in a file system like repository that supports file versioning |
US7933928B2 (en) | 2005-12-22 | 2011-04-26 | Oracle International Corporation | Method and mechanism for loading XML documents into memory |
US7730032B2 (en) | 2006-01-12 | 2010-06-01 | Oracle International Corporation | Efficient queriability of version histories in a repository |
JPWO2007081017A1 (ja) * | 2006-01-13 | 2009-06-11 | 株式会社ジャストシステム | 文書処理装置 |
US7596548B2 (en) | 2006-01-20 | 2009-09-29 | International Business Machines Corporation | Query evaluation using ancestor information |
US20070174241A1 (en) * | 2006-01-20 | 2007-07-26 | Beyer Kevin S | Match graphs for query evaluation |
KR100678123B1 (ko) * | 2006-02-10 | 2007-02-02 | 삼성전자주식회사 | 관계형 데이터베이스에서의 xml 데이터 저장 방법 |
US9229967B2 (en) * | 2006-02-22 | 2016-01-05 | Oracle International Corporation | Efficient processing of path related operations on data organized hierarchically in an RDBMS |
US7945559B2 (en) * | 2006-03-22 | 2011-05-17 | Microsoft Corporation | Completion of partially specified paths |
US8510292B2 (en) | 2006-05-25 | 2013-08-13 | Oracle International Coporation | Isolation for applications working on shared XML data |
US7499909B2 (en) | 2006-07-03 | 2009-03-03 | Oracle International Corporation | Techniques of using a relational caching framework for efficiently handling XML queries in the mid-tier data caching |
US20080033967A1 (en) * | 2006-07-18 | 2008-02-07 | Ravi Murthy | Semantic aware processing of XML documents |
US7933935B2 (en) | 2006-10-16 | 2011-04-26 | Oracle International Corporation | Efficient partitioning technique while managing large XML documents |
US7797310B2 (en) * | 2006-10-16 | 2010-09-14 | Oracle International Corporation | Technique to estimate the cost of streaming evaluation of XPaths |
US7739251B2 (en) * | 2006-10-20 | 2010-06-15 | Oracle International Corporation | Incremental maintenance of an XML index on binary XML data |
US8010889B2 (en) * | 2006-10-20 | 2011-08-30 | Oracle International Corporation | Techniques for efficient loading of binary XML data |
US7747610B2 (en) * | 2006-11-10 | 2010-06-29 | Sybase, Inc. | Database system and methodology for processing path based queries |
US9436779B2 (en) * | 2006-11-17 | 2016-09-06 | Oracle International Corporation | Techniques of efficient XML query using combination of XML table index and path/value index |
US7840590B2 (en) * | 2006-12-18 | 2010-11-23 | Oracle International Corporation | Querying and fragment extraction within resources in a hierarchical repository |
US20080147615A1 (en) * | 2006-12-18 | 2008-06-19 | Oracle International Corporation | Xpath based evaluation for content stored in a hierarchical database repository using xmlindex |
US7552119B2 (en) * | 2006-12-20 | 2009-06-23 | International Business Machines Corporation | Apparatus and method for skipping XML index scans with common ancestors of a previously failed predicate |
US7716210B2 (en) | 2006-12-20 | 2010-05-11 | International Business Machines Corporation | Method and apparatus for XML query evaluation using early-outs and multiple passes |
US7860899B2 (en) * | 2007-03-26 | 2010-12-28 | Oracle International Corporation | Automatically determining a database representation for an abstract datatype |
US7908301B2 (en) * | 2007-03-30 | 2011-03-15 | Infosys Technologies Ltd. | Efficient XML joins |
US7814117B2 (en) * | 2007-04-05 | 2010-10-12 | Oracle International Corporation | Accessing data from asynchronously maintained index |
US7693911B2 (en) * | 2007-04-09 | 2010-04-06 | Microsoft Corporation | Uniform metadata retrieval |
KR100864537B1 (ko) * | 2007-04-24 | 2008-10-21 | 고려대학교 산학협력단 | 트리 레이블을 이용한 확장성 표시 언어 문서의 질의 처리 방법, 및 그 질의 처리 장치 |
US7836098B2 (en) | 2007-07-13 | 2010-11-16 | Oracle International Corporation | Accelerating value-based lookup of XML document in XQuery |
US7840609B2 (en) | 2007-07-31 | 2010-11-23 | Oracle International Corporation | Using sibling-count in XML indexes to optimize single-path queries |
JP5264905B2 (ja) * | 2007-08-03 | 2013-08-14 | 韓國電子通信研究院 | マルチメディア検索のためのクエリ表現装置および方法 |
EP2031520A1 (en) * | 2007-09-03 | 2009-03-04 | Software Ag | Method and database system for pre-processing an XQuery |
JP5347965B2 (ja) * | 2007-09-07 | 2013-11-20 | 日本電気株式会社 | Xmlデータ処理システム、該システムに用いられるデータ処理方法及びxmlデータ処理制御プログラム |
US20090138500A1 (en) * | 2007-10-12 | 2009-05-28 | Yuan Zhiqiang | Method of compact display combined with property-table-view for a complex relational data structure |
US7991768B2 (en) | 2007-11-08 | 2011-08-02 | Oracle International Corporation | Global query normalization to improve XML index based rewrites for path subsetted index |
US8250062B2 (en) | 2007-11-09 | 2012-08-21 | Oracle International Corporation | Optimized streaming evaluation of XML queries |
US8543898B2 (en) | 2007-11-09 | 2013-09-24 | Oracle International Corporation | Techniques for more efficient generation of XML events from XML data sources |
US9842090B2 (en) | 2007-12-05 | 2017-12-12 | Oracle International Corporation | Efficient streaming evaluation of XPaths on binary-encoded XML schema-based documents |
US7865502B2 (en) * | 2008-04-10 | 2011-01-04 | International Business Machines Corporation | Optimization of extensible markup language path language (XPATH) expressions in a database management system configured to accept extensible markup language (XML) queries |
KR100956921B1 (ko) * | 2008-04-28 | 2010-05-11 | 권순용 | 데이터베이스 액세스 방법 |
US8429196B2 (en) | 2008-06-06 | 2013-04-23 | Oracle International Corporation | Fast extraction of scalar values from binary encoded XML |
US8024325B2 (en) * | 2008-06-25 | 2011-09-20 | Oracle International Corporation | Estimating the cost of XML operators for binary XML storage |
US8407209B2 (en) * | 2008-07-23 | 2013-03-26 | Oracle International Corporation | Utilizing path IDs for name and namespace searches |
US7958112B2 (en) | 2008-08-08 | 2011-06-07 | Oracle International Corporation | Interleaving query transformations for XML indexes |
CA2735284A1 (en) * | 2008-08-29 | 2010-03-04 | Anders E. Eriksson | Prefix delegation in a communication network |
US8219563B2 (en) | 2008-12-30 | 2012-07-10 | Oracle International Corporation | Indexing mechanism for efficient node-aware full-text search over XML |
US8126932B2 (en) * | 2008-12-30 | 2012-02-28 | Oracle International Corporation | Indexing strategy with improved DML performance and space usage for node-aware full-text search over XML |
US10108432B1 (en) * | 2009-04-16 | 2018-10-23 | Intuit Inc. | Generating a script based on user actions |
US8549398B2 (en) | 2009-09-17 | 2013-10-01 | International Business Machines Corporation | Method and system for handling non-presence of elements or attributes in semi-structured data |
CN102893281A (zh) * | 2010-05-14 | 2013-01-23 | 日本电气株式会社 | 信息搜索设备、信息搜索方法、计算机程序和数据结构 |
CN102033954B (zh) * | 2010-12-24 | 2012-10-17 | 东北大学 | 关系数据库中可扩展标记语言文档全文检索查询索引方法 |
US9842111B2 (en) * | 2013-12-22 | 2017-12-12 | Varonis Systems, Ltd. | On-demand indexing |
CN105426349A (zh) * | 2015-11-03 | 2016-03-23 | 北京锐安科技有限公司 | 一种逻辑表达式的传输交换方法及装置 |
WO2018182058A1 (ko) | 2017-03-28 | 2018-10-04 | (주)리얼타임테크 | 관계형 데이터베이스의 조인 방법 |
CN107908725A (zh) * | 2017-11-14 | 2018-04-13 | 中国银行股份有限公司 | 一种批量数据校验方法、装置和系统 |
CN108804593B (zh) * | 2018-05-28 | 2019-06-18 | 西安理工大学 | 基于图谱和可达路径数的无向加权图的子图查询方法 |
KR102062139B1 (ko) * | 2018-05-30 | 2020-02-11 | 이재현 | 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치 |
KR102195836B1 (ko) * | 2019-02-07 | 2020-12-28 | 주식회사 티맥스티베로 | 인덱스 관리 방법 |
CN111290805B (zh) * | 2020-03-12 | 2023-08-18 | 深圳市我能成才企业管理有限公司 | 一种聚合功能快捷调用方法及系统 |
US11868746B2 (en) | 2021-09-02 | 2024-01-09 | Kinaxis Inc. | System and method for transition of static schema to dynamic schema |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3492247B2 (ja) * | 1999-07-16 | 2004-02-03 | 富士通株式会社 | Xmlデータ検索システム |
US6721727B2 (en) * | 1999-12-02 | 2004-04-13 | International Business Machines Corporation | XML documents stored as column data |
JP2001282856A (ja) * | 2000-03-31 | 2001-10-12 | Toshiba Corp | インデックス作成方法、インデックス表示方法、インデックス検索方法及びインデックス作成装置 |
JP2001297104A (ja) * | 2000-04-11 | 2001-10-26 | Canon Inc | データ保管装置、方法及び記憶媒体 |
JP3651768B2 (ja) * | 2000-05-18 | 2005-05-25 | 富士通株式会社 | 文書ファイル検索システム |
WO2001093599A2 (en) * | 2000-06-01 | 2001-12-06 | Wisengine Inc. | Method and apparatus for unified query interface for network information |
US6745206B2 (en) * | 2000-06-05 | 2004-06-01 | International Business Machines Corporation | File system with access and retrieval of XML documents |
US6912538B2 (en) * | 2000-10-20 | 2005-06-28 | Kevin Stapel | System and method for dynamic generation of structured documents |
US6804677B2 (en) * | 2001-02-26 | 2004-10-12 | Ori Software Development Ltd. | Encoding semi-structured data for efficient search and browsing |
US6901410B2 (en) * | 2001-09-10 | 2005-05-31 | Marron Pedro Jose | LDAP-based distributed cache technology for XML |
KR100831551B1 (ko) * | 2001-09-28 | 2008-05-22 | 주식회사 케이티 | 관계형 데이터베이스를 이용해 문서를 저장, 검색 및 복구하는 장치 및 그 방법 |
US6826568B2 (en) * | 2001-12-20 | 2004-11-30 | Microsoft Corporation | Methods and system for model matching |
-
2002
- 2002-05-08 KR KR10-2002-0025398A patent/KR100484138B1/ko not_active IP Right Cessation
-
2003
- 2003-02-18 JP JP2003039719A patent/JP4028410B2/ja not_active Expired - Fee Related
- 2003-03-28 CN CNB031085261A patent/CN1230771C/zh not_active Expired - Fee Related
- 2003-05-05 US US10/428,933 patent/US7139746B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1230771C (zh) | 2005-12-07 |
US20030212662A1 (en) | 2003-11-13 |
KR100484138B1 (ko) | 2005-04-18 |
CN1457003A (zh) | 2003-11-19 |
KR20030087370A (ko) | 2003-11-14 |
JP2004030569A (ja) | 2004-01-29 |
US7139746B2 (en) | 2006-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4028410B2 (ja) | 関係型データベースにおいて正規経路式質疑を処理するxmlインデックス方法と資料構造 | |
US8255394B2 (en) | Apparatus, system, and method for efficient content indexing of streaming XML document content | |
US6950815B2 (en) | Content management system and methodology featuring query conversion capability for efficient searching | |
US7318063B2 (en) | Managing XML documents containing hierarchical database information | |
KR101066628B1 (ko) | 계층적 데이터 포맷의 데이터베이스 모델 | |
US7478100B2 (en) | Method and mechanism for efficient storage and query of XML documents based on paths | |
US20110179085A1 (en) | Using Node Identifiers In Materialized XML Views And Indexes To Directly Navigate To And Within XML Fragments | |
US20040128615A1 (en) | Indexing and querying semi-structured documents | |
US20130297657A1 (en) | Apparatus and Method for Forming and Using a Tree Structured Database with Top-Down Trees and Bottom-Up Indices | |
US20070150458A1 (en) | System for extending data query using ontology, and method therefor | |
US8930348B2 (en) | Isolation for applications working on shared XML data | |
JP4724177B2 (ja) | Xmlデータにアクセスするためのインデックス | |
US20090182722A1 (en) | Method and system for navigation of a data structure | |
KR100941971B1 (ko) | 멀티미디어 검색을 위한 질의 표현 장치 및 방법 | |
KR100961444B1 (ko) | 멀티미디어 콘텐츠를 검색하는 방법 및 장치 | |
JP2010267081A (ja) | 情報検索方法及び装置及びプログラム | |
Yaginuma et al. | Metadata elements for digital news resource description | |
KR100904890B1 (ko) | 임베디드 멀티미디어 기기에 적합한 mpeg-7메타-데이터 저장 방법 | |
Yaginuma et al. | Design of metadata elements for digital news articles in the Omnipaper project | |
JP3498926B2 (ja) | 文書データベース管理システム | |
Gasch | XML Schema driven Database Management of Speech Corpus Metadata | |
JP5225022B2 (ja) | Xmlデータ検索方法及び装置及びプログラム | |
JP2012032858A (ja) | 文書検索装置の動作方法およびこれをコンピュータに実行させるためのコンピュータプログラム | |
Noonan | Pruning XML trees for XPath query optimisation | |
Yang et al. | XKFilter: A Keyword Filter on XML Stream |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060905 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061205 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070223 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070320 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071011 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |