JP2003256455A - Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム - Google Patents
Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラムInfo
- Publication number
- JP2003256455A JP2003256455A JP2002059648A JP2002059648A JP2003256455A JP 2003256455 A JP2003256455 A JP 2003256455A JP 2002059648 A JP2002059648 A JP 2002059648A JP 2002059648 A JP2002059648 A JP 2002059648A JP 2003256455 A JP2003256455 A JP 2003256455A
- Authority
- JP
- Japan
- Prior art keywords
- xml document
- xml
- rdb
- schema
- mapping rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
索コストを減少させ、RDBスキーマ構造に合わせたS
QL問合せの生成を実現可能なXML文書格納/検索装
置を提供する。 【解決手段】 XML−RDBマッピングルール生成実
行手段12はXMLスキーマ記述言語によるXMLスキ
ーマ記述と検索対象となるXML文書要素の構造情報と
から、検索対象とならないXML文書要素をXML文書
要素のまま格納するというXML−RDBマッピングル
ールを生成する。XML文書格納手段13はそのマッピ
ングルールを基にXML文書の格納を行い、XML文書
検索手段14は検索、XML問合せ−SQL変換ルール
の生成を行うことによって、XML文書を効率的に格納
/検索する。
Description
索装置及びそれに用いるXML文書格納/検索方法並び
にそのプログラムに関し、特にXML(extensi
ble markup language)文書の格納
とその検索とを行う方法に関する。
索する場合には、RDB(relational da
tabase:リレーショナルデータベース)を利用す
る方法が考えられている。
文書を格納するための手法が、アイ・イー・イー・イー
・データ・エンジニアリング会誌の第22巻第3号の2
7〜34頁(IEEE Data Engineeri
ng Bulletin,Vol.22,No.3,p
p.27−34,Sep.1999)や、情報処理学会
論文誌:データベース、第40巻SIG3(TOD3)
号、115〜131頁、あるいは特開2001−346
19号公報、または特開2001−318935号公報
等に記載されている。この手法ではXML文書の構造と
値とを区別してテーブルに格納することによって、任意
の構造を持つXML文書の格納に対応している。
格納する手法が存在する。入力するXML文書のXML
スキーマ構造とリレーショナルスキーマとのマッピング
を行うことによって、格納するXML文書に対してリレ
ーショナルスキーマを生成することができる。
としては、特開2001−34513号公報に開示され
た技術があり、マッピングルールをスキーマを基に生成
する手法としては、特開2000−122903号公報
に開示された技術がある。
必要な情報と、検索結果として取出した後に利用する情
報とに分類することができる。例えば、 <report_info> <author>foo</author> <abstract>This report des
cribes ....</abstract> <urls> <url>http://....</url> <url>ftp://....</url> </urls> </report_info> というような報告書についての要約を記述したXML文
書の格納/検索について考える。この場合、<auth
or>要素の値としては著者の名前が記述され、<ab
stract>要素の値としては報告書の要約が記述さ
れている。
l>には、報告書が置かれているURL(unifor
m resource loator)が記述されてい
る。この時、著者名や要約は検索対象として有用である
が、URLは検索した後に報告書を取得するために必要
となるデータであって、検索時の必要性は無い。
tract>要素とは検索時に必要な情報であり、<u
rls>要素は検索結果として取出した後に利用する情
報であるというように分類できる。
ML文書格納/検索装置としての汎用性は損なわれる
が、特定の用途に対する利便性は向上する。そのような
用途において、従来技術ではXML文書を効率的に格納
/検索していない。
文書格納/検索方法では、文書全体を構文解析するコス
トと、構文解析後の全文書要素を格納するコストとがか
かるため、XML文書の格納コスト(格納処理時間やそ
の格納処理によるリソースの占有時間)が大きいという
問題がある。この場合、格納するXML文書の特長を活
かして格納コストを低減する既存技術は無い。
は、文書全体を検索対象としているため、XML文書の
検索コスト(検索処理時間やその検索処理によるリソー
スの占有時間)が大きいという問題がある。この場合、
格納するXML文書の特徴を活かして検索コストを低減
する既存技術は無い。
では、XML文書に対するXML問合せ言語とリレーシ
ョナルデータモデルに対するSQL(structur
edquery language)を自動的に変換す
る必要があるのに対して、系統的な方法が示されていな
いため、格納するXML文書の構造に合わせたXML問
合せ言語−SQL変換が困難であるという問題がある。
消し、XML文書の格納コスト及びXML文書の検索コ
ストを減少させ、RDBスキーマ構造に合わせたSQL
問合せの生成を実現することができるXML文書格納/
検索装置及びそれに用いるXML文書格納/検索方法並
びにそのプログラムを提供することにある。
格納/検索装置は、XML(extensiblema
rkup language)文書の少なくとも構造を
示す前記XML文書のスキーマとRDB(relati
onal database)の少なくとも構造を示す
前記RDBのスキーマとを基に検索対象のXML文書の
要素であるXML文書要素と前記RDBのスキーマとの
対応付けと非検索対象のXML文書の要素であるXML
文書要素をそのまま前記RDBに格納するという条件と
を含むマッピングルールを生成するXML−RDBマッ
ピングルール生成実行手段と、前記マッピングルールを
利用して前記XML文書の格納を行うXML文書格納手
段とを備えている。
は、XML(extensiblemarkup la
nguage)文書の少なくとも構造を示す前記XML
文書のスキーマとRDB(relational da
tabase)の少なくとも構造を示す前記RDBのス
キーマとを基に検索対象のXML文書の要素であるXM
L文書要素と前記RDBのスキーマとの対応付けと非検
索対象のXML文書の要素であるXML文書要素をその
まま前記RDBに格納するという条件とを含むマッピン
グルールを生成するステップと、前記マッピングルール
を利用して前記XML文書の格納を行うステップとを備
えている。
プログラムは、コンピュータに、XML(extens
ible markup language)文書の少
なくとも構造を示す前記XML文書のスキーマとRDB
(relational database)の少なく
とも構造を示す前記RDBのスキーマとを基に検索対象
のXML文書の要素であるXML文書要素と前記RDB
のスキーマとの対応付けと非検索対象のXML文書の要
素であるXML文書要素をそのまま前記RDBに格納す
るという条件とを含むマッピングルールを生成するXM
L−RDBマッピングルール生成実行処理と、前記マッ
ピングルールを利用して前記XML文書の格納を行うX
ML文書格納処理とを実行させている。
装置は、XML(extensible markup
language)スキーマ記述言語によるXMLス
キーマ記述と、検索対象のXML文書要素の構造情報と
から、非検索対象のXML文書要素をXML文書要素の
まま格納するというXML−RDB(relation
al database:リレーショナルデータベー
ス)マッピングルールを生成している。つまり、XML
−RDBマッピングルールは検索時に必要な情報である
検索対象のXML文書要素とRDBのスキーマとの対応
付けと、検索後に利用する情報である非検索対象のXM
L文書要素をそのままRDBに格納するという条件とか
らなる。
では、このXML−RDBマッピングルールを基にXM
L文書の格納、検索、XML問合せからSQL(str
uctured query language)の生
成を行っている。
ML文書の構造と、検索対象となるXML文書要素とが
規定されているという状況において、XML文書を効率
的に格納/検索する際の問題点(上述した問題点)を解
決し、XML文書の格納コスト及びXML文書の検索コ
ストを減少させ、RDBスキーマ構造に合わせたSQL
問合せの生成を実現することが可能となる。
面を参照して説明する。図1は本発明の一実施例による
XML文書格納/検索装置の構成を示すブロック図であ
る。図1において、XML文書格納/検索装置11は主
にコンピュータからなり、XML−RDBマッピングル
ール生成実行手段12と、XML文書格納手段13と、
XML文書検索手段14と、XML−RDBマッピング
ルール格納部15と、RDBスキーマ生成手段16と、
記録媒体20とから構成されている。
ーボード等の入力装置17とディスプレイ装置や印刷装
置等の出力装置18とに接続されるとともに、RDB1
10を管理するリレーショナルデータベースマネジメン
トシステム(RDBMS)19を介して、リレーショナ
ルテーブルを格納するRDB110に接続されている。
12は格納するXML文書のスキーマ情報と検索対象と
なるXML文書要素の構造情報とからXML−RDBマ
ッピングルール(以下、マッピングルールとする)を生
成して実行する。ここで、XML文書のスキーマとはX
ML文書要素の入れ子、繰返し等のXML文書の構造、
データ型、制約等を定義するものであり、またRDBス
キーマとはRDB中のテーブルの構成、データ型、制約
等を定義するものである。
ある検索対象のXML文書要素とRDBのスキーマとの
対応付けと、検索後に利用する情報である非検索対象の
XML文書要素をそのままRDBに格納するという条件
とを含む。この場合、検索対象のXML文書要素とRD
Bのスキーマとの対応付けとは、例えばXML文書のタ
グ名、値、属性名、属性値と、RDBのテーブル名、属
性名との対応付けを示す。
納し、XML文書検索手段14はXML文書を検索して
その検索結果を出力する。XML−RDBマッピングル
ール格納部15はマッピングルールを格納し、RDBス
キーマ生成手段16はマッピングルールからRDBスキ
ーマを生成する。
置11(コンピュータ)で実行されるプログラム、つま
りXML文書格納/検索装置11の各手段を実現するた
めのプログラムが格納されている。
ール生成実行手段12の構成を示すブロック図である。
図2において、XML−RDBマッピングルール生成実
行手段12はXMLスキーマ解析手段121と、検索対
象解析手段122と、文書要素分類手段123と、RD
Bスキーマ構成手段124と、XML−RDBマッピン
グルール導出手段125とから構成されている。
手段12は入力装置17から、自装置に格納するXML
文書のスキーマ情報と、検索対象のXML文書要素の構
造情報(以下、分類条件とする)とを受取る。
17から入力されたXMLスキーマ記述(自装置に格納
するXML文書のスキーマ情報)に対して構文解析を行
い、その構文が正しいと解析したXMLスキーマ記述を
文書要素分類手段123に渡す。検索対象解析手段12
2は入力装置17から入力された分類条件に対して構文
解析を行い、その構文が正しいと解析した分類条件を文
書要素分類手段123に渡す。
解析手段121及び検索対象解析手段122で構文が正
しいと解析されたXML文書のスキーマ情報及び分類条
件から、検索対象の文書要素と非検索対象の文書要素と
に分類し、その分類結果をRDBスキーマ構成手段12
4に渡す。
分類手段123での文書要素の分類結果からRDBスキ
ーマを構成し、そのスキーマ情報と文書要素の分類結果
とをXML−RDBマッピングルール導出手段125に
渡す。XML−RDBマッピングルール導出手段125
はRDBスキーマ構成手段124から渡されたRDBス
キーマ情報と文書要素の分類結果とからXMLスキーマ
とRDBスキーマとを対応付けるマッピングルールを導
出し、XML−RDBマッピングルール格納部15に格
納する。
XML文書検索手段14の構成を示すブロック図であ
る。図3において、XML文書格納手段13はXML文
書構文解析手段131と、検索対象判定手段132と、
格納命令生成手段133と、格納操作実行手段134と
から構成されている。また、XML文書検索手段14は
検索式解析手段141と、問合せ生成手段142と、問
合せ実行手段143と、XML文書生成手段144とか
ら構成されている。
文書を入力として受取る。XML文書構文解析手段13
1は入力されたXML文書の構文解析を行い、その構文
が正しいと解析したXML文書を検索対象判定手段13
2に渡す。
解析手段131で構文が正しいと解析されたXML文書
を、XML−RDBマッピングルール格納部15に格納
されたマッピングルールを基に検索対象のXML文書要
素と非検索対象のXML文書要素とに分別し、検索対象
のXML文書要素からRDBスキーマに対応付けられた
情報(タグ名、値、属性名、属性値)を取出して格納命
令生成手段133に渡し、非検索対象のXML文書要素
をそのまま格納命令生成手段133に渡す。
段132において分別されたXML文書要素(検索対象
のXML文書要素及び非検索対象のXML文書要素)を
それぞれRDB110に格納するためのSQLを生成
し、格納操作実行手段134に渡す。格納操作実行手段
134は格納命令生成手段133で生成されたSQLを
実行し、構文解析後のXML文書(検索対象のXML文
書要素及び非検索対象のXML文書要素)をRDB11
0に格納する。
ら入力され、XML文書の検索を行うための検索式を受
取る。検索式解析手段141は入力装置17から入力さ
れる検索式に対して構文解析を行い、その構文が正しい
と解析した検索式を問合せ生成手段142に渡す。
ッピングルール格納部15に格納されたマッピングルー
ルを基に、検索式解析手段141から受取った構文解析
後のXML文書に対する問合せ(検索式)からSQL問
合せを生成し、そのSQLを問合せ実行手段143に渡
す。尚、SQL問合せを生成する場合にはXML文書に
対する問合せからSQL問合せを生成するための変換ル
ール(検索に特化したルール)を生成し、その変換ルー
ルを基にSQL問合せを生成することも可能であり、こ
れに限定されない。
42で生成されたSQLを実行する。RDB110はS
QLが実行されると、その実行結果である結果集合をX
ML文書生成手段144に渡す。XML文書生成手段1
44はXML−RDBマッピングルール格納部15に格
納されたマッピングルールを基に、RDB110から得
た結果集合を基に検索結果のXML文書を生成し、その
XML文書を出力装置18に渡す。
Lスキーマの構造例を示す図であり、図5は本発明の一
実施例で用いられるXML文書例を示す図である。この
図4に示すXMLスキーマ構造及び図5に示すXML文
書を入力とした場合の本発明の一実施例の動作について
説明する。
ーマとマッピングルールとを導出する処理工程を示すフ
ローチャートである。この図6を参照して本発明の一実
施例によるRDBスキーマとマッピングルールとを導出
する処理工程について説明する。この処理工程は、図6
に示すように、繰返し行われる。尚、図6に示す処理は
XML文書格納/検索装置11が記録媒体20のプログ
ラムを実行することで実現される。
構造及びXML文書が入力装置17から入力されると、
XML文書のルート要素から要素の階層毎に要素の判定
を行う。まず、文書要素分類手段123はXMLスキー
マ解析手段121から入力されたXMLスキーマ情報の
中から未判定の文書要素を1つ選択する(図6ステップ
S1)。
段122から入力された検索対象となるXML文書要素
の構造情報を基に、選択された文書要素が検索対象の文
書要素であるか(図6ステップS2)、検索対象でかつ
繰り返しの文書要素であるか(図6ステップS3)、検
索対象でなくかつ子孫要素として検索対象となる要素を
含むかどうか(図6ステップS4)をそれぞれ判定す
る。
Bスキーマ構成手段124は格納するための属性を生成
し、XML−RDBマッピングルール導出手段125は
要素とRDBスキーマ構成手段124で生成された属性
との対応関係をマッピングルールとしてXML−RDB
マッピングルール格納部15に保存する(図6ステップ
S5)。
合、RDBスキーマ構成手段124が別テーブルを用意
し、格納するための属性を生成し、XML−RDBマッ
ピングルール導出手段125は要素とRDBスキーマ構
成手段124で生成された属性との対応関係をマッピン
グルールとして保存する(図6ステップS6)。
る要素を含む場合には、階層を1つ下げて要素判定処理
を行う(図6ステップS7)。要素が検索対象ではな
く、検索対象となる要素を含まない場合には、RDBス
キーマ構成手段124が格納するための属性を生成し、
XML−RDBマッピングルール導出手段125は要素
とRDBスキーマ構成手段124で生成された属性との
対応関係をマッピングルールとして保存する(図6ステ
ップS5)。
は、上記の要素判定処理を繰返す(図6ステップS8,
S1)。この時、テーブル情報と、どの要素をどのテー
ブルのどの属性に対応しているかを示すマッピングルー
ルとが作成される。
グルールの一例を示す図である。図7においては、上記
の処理工程で作成されたマッピングルールの一例を示し
ている。このマッピングルールは図4に示すXMLスキ
ーマの構造例に対して要素「business Ent
ity」の属性「business Key」と要素
「name」とが分類条件として与えられた場合の例を
示している。この場合、マッピングルールとしては図7
(a)に示すような検索対象のマッピングルールと、図
7(b)に示すような非検索対象のマッピングルールと
が作成される。
usiness Entity@business K
ey」が「business Entity」テーブル
の属性「business Key」に対応し、XML
文書の「businessEntity→name」が
「business Entity」テーブルの属性
「name」に対応していることを示している。
の「business Entity→descrip
tion」が「business Entity」テー
ブルの属性「description」に対応し、XM
L文書の「businessEntity→conta
cts」が「business Entity」テーブ
ルの属性「contacts」に対応していることを示
している。
書例に対するRDBスキーマの対応関係を示す図であ
る。これら図4と図5と図8とを参照して具体的なXM
Lスキーマ定義と、XML文書例に対するRDBスキー
マとの対応関係について説明する。
ame>と属性<businessKey>とが検索対
象であるとすると、business Entity
(businessKey,name,descrip
tion,contacts)(図8の71参照)とい
うRDBスキーマが導出される。
ピングルール、つまり、「business Enti
tyの属性<business Key>は、busi
ness Entityテーブルのbusiness
Keyに対応する」(図8の72参照)、「busin
ess Entityの子要素nameはbusine
ss Entityテーブルの属性nameに対応す
る」(図8の73参照)、「business Ent
ityの子要素descriptionは、busin
ess Entityテーブルのdescriptio
nに対応する」(図8の74参照)、「busines
s Entityの子要素contactsは、bus
iness Entityテーブルのcontacts
に対応する」(図7の75参照)というマッピングルー
ルが導出される。
を格納する処理工程を示すフローチャートであり、図1
0は本発明の一実施例による検索操作の処理工程を示す
フローチャートである。これら図9及び図10を参照し
て本発明の一実施例によるXML文書を格納する処理工
程及び検索操作の処理工程について説明する。尚、図9
及び図10に示す処理はXML文書格納/検索装置11
が記録媒体20のプログラムを実行することで実現され
る。
XML文書を入力として受取り、XML文書構文解析手
段131で構文解析を行い(図9ステップS11)、検
索体操判定手段132を用いてXML−RDBマッピン
グルールを基にXML文書の要素を検索対象の要素とそ
れ以外の非検索対象の要素とに分類し(図9ステップS
12)、検索対象の要素からRDBスキーマに対応付け
られた情報(タグ名、値、属性名、属性値)を取出す。
令生成手段133において、分類された要素(検索対象
の要素及び非検索対象の要素)をRDB110に格納す
るためのSQLを生成する。この場合、格納命令生成手
段133は検索対象の要素であれば(図9ステップS1
3)、検索対象の要素からRDBスキーマに対応付けら
れた情報(タグ名、値、属性名、属性値)を取出して格
納するためのSQLを生成する(図9ステップS1
4)。
象の要素であれば(図9ステップS13)、非検索対象
の要素をそのまま(XML文書のまま)格納するための
SQLを生成する(図9ステップS15)。格納命令生
成手段133はこれらステップS14,S15によって
全て要素を処理すると(図9ステップS16)、ステッ
プS14,S15で得たSQLを合成(マージ)して格
納操作実行手段34に渡す(図9ステップS17)。格
納操作実行手段34においては、格納命令生成手段13
3で生成されたSQLを実行してXML文書の格納を行
う(図9ステップS18)。格納処理後のテーブル例を
図7の76に示す。
17から入力される検索式を受取ると、検索式解析手段
141を用いて構文解析を行い(図10ステップS2
1)、問合せ生成手段142でXML−RDBマッピン
グルール格納部15に保存されているマッピングルール
を基に生成した、正しいと解析されたXML文書に対す
る問合せからSQL問合せの生成を行う(図10ステッ
プS22)。
せ実行手段143が問合せ生成手段142で生成された
SQLを実行することで、RDB110から結果集合を
受取ると(図10ステップS23)、XML−RDBマ
ッピングルール格納部15に保存されているマッピング
ルールを基に、XML文書生成手段144で結果集合か
ら結果のXML文書を生成する。
索対象の文書要素であれば(図10ステップS24)、
XML−RDBマッピングルール格納部15に保存され
ているマッピングルールを基に、元のXML文書の要素
を再構成する(図10ステップS25)。
対象の文書要素であれば(図10ステップS24)、結
果集合からXML文書の要素を取出す(図10ステップ
S26)。XML文書生成手段144はこれらステップ
S25,S26によって全て要素を処理すると(図10
ステップS27)、ステップS25,S26で得たXM
L文書の要素から検索結果のXML文書を生成して出力
装置18に渡す(図10ステップS28)。
むXML文書を取得せよ」という問合せは、 SELECT * FROM business Entity WHERE name like ’%A%’ というSQLに変換される。
の実行結果に対して、XML−RDBマッピングルール
格納部15に保存されているマッピングルールを適用し
て、XML文書に成型し直すことによって、図5に示す
XML文書が結果として返される。
うに、検索対象部分のみにおいて値を抽出するため、
「値の抽出コスト」と「値をテーブルに格納するコス
ト」とが減少するので、XML文書の格納コスト(格納
処理時間やその格納処理によるリソースの占有時間)を
減少させることができる。
の存在する階層毎にテーブルを用意しているため、図8
に示すように、検索対象となる要素の存在する階層が、
全階層より少ない場合にはテーブル数が最小となり、J
OIN操作の回数が減少するので、XML文書の検索コ
スト(検索処理時間やその検索処理によるリソースの占
有時間)を減少させることができる。
ッピングルールを基に、XML文書に対する問合せか
ら、本発明のRDBスキーマ構造に合わせたSQL問合
せの生成を実現することができる。
書の少なくとも構造を示すXML文書のスキーマとRD
Bの少なくとも構造を示すRDBのスキーマとを基に検
索対象のXML文書の要素であるXML文書要素とRD
Bのスキーマとの対応付けと非検索対象のXML文書の
要素であるXML文書要素をそのままRDBに格納する
という条件とを含むマッピングルールを生成し、そのマ
ッピングルールを利用してXML文書の格納を行うこと
によって、XML文書の格納コスト及びXML文書の検
索コストを減少させ、RDBスキーマ構造に合わせたS
QL問合せの生成を実現することができるという効果が
得られる。
装置の構成を示すブロック図である。
行手段の構成を示すブロック図である。
手段の構成を示すブロック図である。
の構造例を示す図である。
示す図である。
ピングルールとを導出する処理工程を示すフローチャー
トである。
ッピングルールの一例を示す図である。
るRDBスキーマの対応関係を示す図である。
処理工程を示すフローチャートである。
を示すフローチャートである。
Claims (21)
- 【請求項1】 XML(extensible mar
kup language)文書の少なくとも構造を示
す前記XML文書のスキーマとRDB(relatio
nal database)の少なくとも構造を示す前
記RDBのスキーマとを基に検索対象のXML文書の要
素であるXML文書要素と前記RDBのスキーマとの対
応付けと非検索対象のXML文書の要素であるXML文
書要素をそのまま前記RDBに格納するという条件とを
含むマッピングルールを生成するXML−RDBマッピ
ングルール生成実行手段と、前記マッピングルールを利
用して前記XML文書の格納を行うXML文書格納手段
とを有することを特徴とするXML文書格納/検索装
置。 - 【請求項2】 前記検索対象のXML文書要素が検索時
に必要な情報であり、前記非検索対象のXML文書要素
が検索後に利用する情報であることを特徴とする請求項
1記載のXML文書格納/検索装置。 - 【請求項3】 前記XML−RDBマッピングルール生
成実行手段は、前記XML文書のスキーマの構文解析を
行うXMLスキーマ解析手段と、前記検索対象のXML
文書要素の構造情報に対して構文解析を行う検索対象解
析手段と、格納するXML文書のスキーマと前記検索対
象のXML文書要素の構造情報とから前記検索対象のX
ML文書要素と前記非検索対象のXML文書要素とに分
類する文書要素分類手段と、前記XML文書要素の分類
結果から前記RDBのスキーマを構成するRDBスキー
マ構成手段と、前記RDBのスキーマと前記XML文書
の要素の分類結果とから前記マッピングルールを導出す
るXML−RDBマッピングルール導出手段とを含むこ
とを特徴とする請求項1または請求項2記載のXML文
書格納/検索装置。 - 【請求項4】 前記XML文書格納手段は、入力された
XML文書の構文解析を行うXML文書構文解析手段
と、前記マッピングルールを基に受取った構文解析後の
XML文書を前記検索対象のXML文書要素と前記非検
索対象のXML文書要素とに分別しかつ前記検索対象の
XML文書要素から前記RDBのスキーマに対応付けら
れた情報を取出す検索対象判定手段と、前記検索対象判
定手段において分別されたXML文書要素を前記RDB
に格納するためのSQL(structured qu
ery language)を生成する格納命令生成手
段と、前記SQLを実行する格納操作実行手段とを含む
ことを特徴とする請求項1から請求項3のいずれか記載
のXML文書格納/検索装置。 - 【請求項5】 前記RDBのスキーマに対応付けられた
情報がタグ名、値、属性名、属性値であることを特徴と
する請求項4記載のXML文書格納/検索装置。 - 【請求項6】 前記マッピングルールを利用して前記X
ML文書の検索と再構成とを行うXML文書検索手段を
含むことを特徴とする請求項1から請求項5のいずれか
記載のXML文書格納/検索装置。 - 【請求項7】 前記XML文書検索手段は、前記XML
文書の検索の検索式に対して構文解析を行う検索式解析
手段と、前記マッピングルールを基に前記XML文書に
対する問合せからSQL(structured qu
ery language)問合せを生成する問合せ生
成手段と、前記SQL問合せを実行する問合せ実行手段
と、前記問合せ実行手段の実行結果から前記マッピング
ルールを基に検索結果のXML文書を構成するXML文
書生成手段とを含むことを特徴とする請求項6記載のX
ML文書格納/検索装置。 - 【請求項8】 XML(extensible mar
kup language)文書の少なくとも構造を示
す前記XML文書のスキーマとRDB(relatio
nal database)の少なくとも構造を示す前
記RDBのスキーマとを基に検索対象のXML文書の要
素であるXML文書要素と前記RDBのスキーマとの対
応付けと非検索対象のXML文書の要素であるXML文
書要素をそのまま前記RDBに格納するという条件とを
含むマッピングルールを生成するステップと、前記マッ
ピングルールを利用して前記XML文書の格納を行うス
テップとを有することを特徴とするXML文書格納/検
索方法。 - 【請求項9】 前記検索対象のXML文書要素が検索時
に必要な情報であり、前記非検索対象のXML文書要素
が検索後に利用する情報であることを特徴とする請求項
8記載のXML文書格納/検索方法。 - 【請求項10】 前記マッピングルールを生成するステ
ップは、前記XML文書のスキーマの構文解析を行うス
テップと、前記検索対象のXML文書要素の構造情報に
対して構文解析を行うステップと、格納するXML文書
のスキーマと前記検索対象のXML文書要素の構造情報
とから前記検索対象のXML文書要素と前記非検索対象
のXML文書要素とに分類するステップと、前記XML
文書要素の分類結果から前記RDBのスキーマを構成す
るステップと、前記RDBのスキーマと前記XML文書
要素の分類結果とから前記マッピングルールを導出する
ステップとを含むことを特徴とする請求項8または請求
項9記載のXML文書格納/検索方法。 - 【請求項11】 前記XML文書の格納を行うステップ
は、入力されたXML文書の構文解析を行うステップ
と、前記マッピングルールを基に受取った構文解析後の
XML文書を前記検索対象のXML文書要素と前記非検
索対象のXML文書要素とに分別しかつ前記検索対象の
XML文書要素から前記RDBのスキーマに対応付けら
れた情報を取出すステップと、その分別されたXML文
書要素を前記RDBに格納するためのSQL(stru
ctured query language)を生成
するステップと、前記SQLを実行するステップとを含
むことを特徴とする請求項8から請求項10のいずれか
記載のXML文書格納/検索方法。 - 【請求項12】 前記RDBのスキーマに対応付けられ
た情報がタグ名、値、属性名、属性値であることを特徴
とする請求項11記載のXML文書格納/検索方法。 - 【請求項13】 前記マッピングルールを利用して前記
XML文書の検索と再構成とを行うステップを含むこと
を特徴とする請求項8から請求項12のいずれか記載の
XML文書格納/検索方法。 - 【請求項14】 前記XML文書の検索と再構成とを行
うステップは、前記XML文書の検索の検索式に対して
構文解析を行うステップと、前記マッピングルールを基
に前記XML文書に対する問合せからSQL(stru
cturedquery language)問合せを
生成するステップと、前記SQL問合せを実行するステ
ップと、その実行結果から前記マッピングルールを基に
検索結果のXML文書を構成するステップとを含むこと
を特徴とする請求項13記載のXML文書格納/検索方
法。 - 【請求項15】 コンピュータに、XML(exten
sible markup language)文書の
少なくとも構造を示す前記XML文書のスキーマとRD
B(relational database)の少な
くとも構造を示す前記RDBのスキーマとを基に検索対
象のXML文書の要素であるXML文書要素と前記RD
Bのスキーマとの対応付けと非検索対象のXML文書の
要素であるXML文書要素をそのまま前記RDBに格納
するという条件とを含むマッピングルールを生成するX
ML−RDBマッピングルール生成実行処理と、前記マ
ッピングルールを利用して前記XML文書の格納を行う
XML文書格納処理とを実行させるためのプログラム。 - 【請求項16】 前記検索対象のXML文書要素が検索
時に必要な情報であり、前記非検索対象のXML文書要
素が検索後に利用する情報であることを特徴とする請求
項15記載のプログラム。 - 【請求項17】 前記コンピュータに、前記XML−R
DBマッピングルール生成実行処理を実行させる際に、
前記XML文書のスキーマの構文解析を行うXMLスキ
ーマ解析処理と、前記検索対象のXML文書要素の構造
情報に対して構文解析を行う検索対象解析処理と、格納
するXML文書のスキーマ情報と前記検索対象のXML
文書要素の構造情報とから前記検索対象のXML文書要
素と前記非検索対象のXML文書要素とに分類する文書
要素分類処理と、前記XML文書要素の分類結果から前
記RDBのスキーマを構成するRDBスキーマ構成処理
と、前記RDBのスキーマと前記XML文書要素の分類
結果とから前記マッピングルールを導出するXML−R
DBマッピングルール導出処理とを実行させることを特
徴とする請求項15または請求項16記載のプログラ
ム。 - 【請求項18】 前記コンピュータに、前記XML文書
格納処理を実行させる際に、入力されたXML文書の構
文解析を行うXML文書構文解析処理と、前記マッピン
グルールを基に受取った構文解析後のXML文書を前記
検索対象のXML文書要素と前記非検索対象のXML文
書要素とに分別しかつ前記検索対象のXML文書要素か
ら前記RDBのスキーマに対応付けられた情報を取出す
検索対象判定処理と、この分別されたXML文書要素を
前記RDBに格納するためのSQL(structur
ed query language)を生成する格納
命令生成処理と、前記SQLを実行する格納操作実行処
理とを実行させることを特徴とする請求項15から請求
項17のいずれか記載のプログラム。 - 【請求項19】 前記RDBのスキーマに対応付けられ
た情報がタグ名、値、属性名、属性値であることを特徴
とする請求項18記載のプログラム。 - 【請求項20】 前記コンピュータに、前記マッピング
ルールを利用して前記XML文書の検索と再構成とを行
うXML文書検索処理とを実行させることを特徴とする
請求項15から請求項19のいずれか記載のプログラ
ム。 - 【請求項21】 前記コンピュータに、前記XML文書
検索処理を実行させる際に、前記XML文書の検索の検
索式に対して構文解析を行う検索式解析処理と、前記マ
ッピングルールを基に前記XML文書に対する問合せか
らSQL(structured query lan
guage)問合せを生成する問合せ生成処理と、前記
SQL問合せを実行する問合せ実行処理と、その実行結
果から前記マッピングルールを基に検索結果のXML文
書を構成するXML文書生成処理とを実行させることを
特徴とする請求項20記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002059648A JP4207438B2 (ja) | 2002-03-06 | 2002-03-06 | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002059648A JP4207438B2 (ja) | 2002-03-06 | 2002-03-06 | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003256455A true JP2003256455A (ja) | 2003-09-12 |
JP4207438B2 JP4207438B2 (ja) | 2009-01-14 |
Family
ID=28669239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002059648A Expired - Fee Related JP4207438B2 (ja) | 2002-03-06 | 2002-03-06 | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4207438B2 (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202850A (ja) * | 2004-01-19 | 2005-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2006119888A (ja) * | 2004-10-21 | 2006-05-11 | Toshiba Corp | 帳票データ変換装置、および帳票データ変換プログラム |
US7212410B2 (en) | 2004-01-16 | 2007-05-01 | Finisar Corporation | Actuator for small form-factor pluggable transceiver |
US7290012B2 (en) | 2004-01-16 | 2007-10-30 | International Business Machines Corporation | Apparatus, system, and method for passing data between an extensible markup language document and a hierarchical database |
WO2008027451A1 (en) * | 2006-08-30 | 2008-03-06 | Compsci Resources, Llc | Dynamic information retrieval system for xml-compliant data |
JP2008527575A (ja) * | 2005-01-13 | 2008-07-24 | トムソン グローバル リソーシーズ | 複数のクエリ言語を用いて情報を検索するシステム、方法およびソフトウェア |
US7418456B2 (en) | 2004-01-16 | 2008-08-26 | International Business Machines Corporation | Method for defining a metadata schema to facilitate passing data between an extensible markup language document and a hierarchical database |
US8201141B2 (en) | 2005-01-11 | 2012-06-12 | Samsung Electronics Co., Ltd. | Apparatus and method for creating control code for home network appliance according to resolution of control device |
US8230332B2 (en) | 2006-08-30 | 2012-07-24 | Compsci Resources, Llc | Interactive user interface for converting unstructured documents |
JP2012248049A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報分析装置、文書情報分析方法、文書情報分析プログラム |
WO2014109009A1 (ja) * | 2013-01-09 | 2014-07-17 | 株式会社日立製作所 | データベースの管理方法、管理計算機及び記憶媒体 |
JP2015508529A (ja) * | 2011-12-23 | 2015-03-19 | アミアト・インコーポレーテッド | 半構造データのためのスケーラブルな分析プラットフォーム |
JP2015158767A (ja) * | 2014-02-24 | 2015-09-03 | 富士通株式会社 | 情報処理装置,データ変換プログラム,及びデータ変換方法 |
US9582291B2 (en) | 2008-09-25 | 2017-02-28 | International Business Machines Corporation | Selecting a mapping that minimizes conversion costs |
WO2017221364A1 (ja) * | 2016-06-23 | 2017-12-28 | 株式会社日立製作所 | アダプタ生成装置及び方法 |
JP2018073116A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | 検索プログラム、検索装置および検索方法 |
US11200220B2 (en) | 2016-03-01 | 2021-12-14 | Advanced New Technologies Co., Ltd. | Efficient storage of user personal attributes for service provisioning |
-
2002
- 2002-03-06 JP JP2002059648A patent/JP4207438B2/ja not_active Expired - Fee Related
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7212410B2 (en) | 2004-01-16 | 2007-05-01 | Finisar Corporation | Actuator for small form-factor pluggable transceiver |
US7290012B2 (en) | 2004-01-16 | 2007-10-30 | International Business Machines Corporation | Apparatus, system, and method for passing data between an extensible markup language document and a hierarchical database |
US7418456B2 (en) | 2004-01-16 | 2008-08-26 | International Business Machines Corporation | Method for defining a metadata schema to facilitate passing data between an extensible markup language document and a hierarchical database |
US7822786B2 (en) | 2004-01-16 | 2010-10-26 | International Business Machines Corporation | Apparatus, system, and method for defining a metadata schema to facilitate passing data between an extensible markup language document and a hierarchical database |
US7912874B2 (en) | 2004-01-16 | 2011-03-22 | International Business Machines Corporation | Apparatus and system for defining a metadata schema to facilitate passing data between an extensible markup language document and a hierarchical database |
JP2005202850A (ja) * | 2004-01-19 | 2005-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2006119888A (ja) * | 2004-10-21 | 2006-05-11 | Toshiba Corp | 帳票データ変換装置、および帳票データ変換プログラム |
US8201141B2 (en) | 2005-01-11 | 2012-06-12 | Samsung Electronics Co., Ltd. | Apparatus and method for creating control code for home network appliance according to resolution of control device |
JP2008527575A (ja) * | 2005-01-13 | 2008-07-24 | トムソン グローバル リソーシーズ | 複数のクエリ言語を用いて情報を検索するシステム、方法およびソフトウェア |
US8230332B2 (en) | 2006-08-30 | 2012-07-24 | Compsci Resources, Llc | Interactive user interface for converting unstructured documents |
WO2008027451A1 (en) * | 2006-08-30 | 2008-03-06 | Compsci Resources, Llc | Dynamic information retrieval system for xml-compliant data |
US9582291B2 (en) | 2008-09-25 | 2017-02-28 | International Business Machines Corporation | Selecting a mapping that minimizes conversion costs |
US11194595B2 (en) | 2008-09-25 | 2021-12-07 | International Business Machines Corporation | Generation apparatus, program, and generation method |
JP2012248049A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報分析装置、文書情報分析方法、文書情報分析プログラム |
JP2015508529A (ja) * | 2011-12-23 | 2015-03-19 | アミアト・インコーポレーテッド | 半構造データのためのスケーラブルな分析プラットフォーム |
JP2017157229A (ja) * | 2011-12-23 | 2017-09-07 | アマゾン・テクノロジーズ・インコーポレーテッド | 半構造データのためのスケーラブルな分析プラットフォーム |
US10095732B2 (en) | 2011-12-23 | 2018-10-09 | Amiato, Inc. | Scalable analysis platform for semi-structured data |
JP5873935B2 (ja) * | 2013-01-09 | 2016-03-01 | 株式会社日立製作所 | データベースの管理方法、管理計算機及び記憶媒体 |
WO2014109009A1 (ja) * | 2013-01-09 | 2014-07-17 | 株式会社日立製作所 | データベースの管理方法、管理計算機及び記憶媒体 |
JP2015158767A (ja) * | 2014-02-24 | 2015-09-03 | 富士通株式会社 | 情報処理装置,データ変換プログラム,及びデータ変換方法 |
US11200220B2 (en) | 2016-03-01 | 2021-12-14 | Advanced New Technologies Co., Ltd. | Efficient storage of user personal attributes for service provisioning |
WO2017221364A1 (ja) * | 2016-06-23 | 2017-12-28 | 株式会社日立製作所 | アダプタ生成装置及び方法 |
JP2018073116A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | 検索プログラム、検索装置および検索方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4207438B2 (ja) | 2009-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101450358B1 (ko) | 구조형 지리적 데이터 검색 | |
JP4644420B2 (ja) | ネットワークを介してデータを検索及び提示する方法及びマシン可読記憶装置 | |
US7293018B2 (en) | Apparatus, method, and program for retrieving structured documents | |
JP2003256455A (ja) | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム | |
US7548933B2 (en) | System and method for exploiting semantic annotations in executing keyword queries over a collection of text documents | |
US8051371B2 (en) | Document analysis system and document adaptation system | |
JP4975783B2 (ja) | 階層構築方法および階層構築システム | |
US20150178273A1 (en) | Unsupervised Relation Detection Model Training | |
JP2004145794A (ja) | 構造化・階層化コンテンツ用処理装置、構造化・階層化コンテンツ用処理方法、及びプログラム | |
US20140280358A1 (en) | Machine for recognizing or generating jabba-type sequences | |
JP4247135B2 (ja) | 構造化文書記憶方法、構造化文書記憶装置、構造化文書検索方法 | |
US20050144153A1 (en) | Structured data retrieval apparatus, method, and computer readable medium | |
JP2000020537A (ja) | テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2010165272A (ja) | 情報処理方法、情報処理装置、及びプログラム | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
JP3617096B2 (ja) | 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法 | |
US20090307187A1 (en) | Tree automata based methods for obtaining answers to queries of semi-structured data stored in a database environment | |
US20040093333A1 (en) | Structured data retrieval apparatus, method, and program | |
JPH1145274A (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4103905B2 (ja) | 統合化検索システム | |
JP2003316783A (ja) | 異種半構造化情報源統合検索装置、方法、プログラム及び該プログラムを記録した記録媒体 | |
JP3747542B2 (ja) | 統合化検索装置 | |
JP2005316590A (ja) | 情報検索装置 | |
JP2003288365A (ja) | 付加情報管理方法及び付加情報管理システム | |
JP2009251845A (ja) | 検索結果評価装置及び検索結果評価方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080115 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080311 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20080410 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080512 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080529 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080930 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081013 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |