JP2003248675A - ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体 - Google Patents

ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体

Info

Publication number
JP2003248675A
JP2003248675A JP2002045959A JP2002045959A JP2003248675A JP 2003248675 A JP2003248675 A JP 2003248675A JP 2002045959 A JP2002045959 A JP 2002045959A JP 2002045959 A JP2002045959 A JP 2002045959A JP 2003248675 A JP2003248675 A JP 2003248675A
Authority
JP
Japan
Prior art keywords
structured document
schema
view
conversion
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002045959A
Other languages
English (en)
Inventor
Shiro Kasuga
史朗 春日
Tetsuo Sakata
哲夫 坂田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002045959A priority Critical patent/JP2003248675A/ja
Publication of JP2003248675A publication Critical patent/JP2003248675A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 所定のスキーマで蓄積されている構造化文書
の更新と検索を,独自のスキーマで行うことができるよ
うにし,データベース検索と構造変換のコストの低減を
可能にする。 【解決手段】 構造化文書に対する任意の構造と値の表
現形式をビューとして定義し,構造化文書蓄積装置10
に蓄積される構造化文書の蓄積スキーマとビューとの間
の構造と値の表現形式に関する変換規則をスキーマ辞書
23に登録する。アプリケーション30からの構造化文
書の挿入要求に対して,構造変換処理部21により変換
規則を用いて入力された構造化文書の構造と値の表現形
式を変換し,構造化文書蓄積装置10に蓄積する。ま
た,構造化文書の検索要求に対して,検索式変換処理部
22により変換規則を用いて検索式を蓄積スキーマに合
うように変換し,検索を行った後,検索結果をビューに
合わせて変換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,単一の構造でデー
タベースに蓄積された複数の構造化文書を,仮想的に任
意の構造と値の表現形式へ変換したようにユーザに見
せ,検索・挿入することを可能にしたビューによる構造
化文書処理方法,構造化文書処理装置,そのプログラム
およびそのプログラムの記録媒体に関するものである。
【0002】
【従来の技術】従来は,構造化文書データベースと,構
造化文書の構造変換機能とは,まったく分離しており,
データベースの検索・挿入と,構造変換とは,逐次的に
処理されていた。
【0003】従来の構造化文書の蓄積・検索システム
で,ユーザが任意の構造と表現形式で検索結果を得よう
とする場合,以下の2通りの方法がとられていた。 (1)蓄積されているすべての構造化文書を構造変換機
能により変換し,変換結果を一時記憶へ保存し,その
後,ユーザは一時記憶に対して検索式を適用して最終的
な検索結果を得る。 (2)ユーザが,データベースに蓄積されている構造化
文書のスキーマを意識して検索式を作成し,作成した検
索式を構造化文書の蓄積・検索システムに適用して結果
検索を取得し,その結果を構造変換機能により変換し,
最終的な検索結果を得る。
【0004】
【発明が解決しようとする課題】しかし,以上の従来の
方法では,それぞれ次のような問題があった。上記
(1)の方法の場合,どのような検索でもすべての構造
化文書の構造変換が必要であり,処理効率が悪い。上記
(2)の方法の場合,ユーザがデータベースに蓄積され
ている構造化文書のスキーマを意識して検索式を作成す
る必要があり,ユーザの負担が大きい。
【0005】また,どちらの従来の構造化文書蓄積・検
索システムでも,任意の構造と表現形式で構造化文書を
挿入することはできなかった。
【0006】電子商取引システムの例に従って,本発明
の背景と従来技術およびその問題点を説明する。
【0007】近年,情報流通のフォーマットとして利用
されるようになったXML(eXtensible Markup Langua
ge)が注目を集めている。XMLは優れたデータ表現力
と拡張性を備えており,企業間の電子商取引(EC)な
どへの応用が期待されている。
【0008】電子商取引において,企業間でXML電子
伝票をやり取りするためには,共通スキーマを用いる必
要がある。しかし,各企業のデータベースに格納された
XML電子伝票は,各企業の独自スキーマで記述される
ことが多いため,多量のXML電子伝票を相互にやりと
りするためには,独自スキーマと共通スキーマ間で構造
変換する必要がある。
【0009】従来,XMLの構造変換はデータベースの
外部で行われており,データベース検索と,検索結果の
構造変換は逐次的に処理されていた。そのため,データ
ベース検索の結果に,構造変換後に不要な情報が含まれ
ることになり,データベース検索と構造変換のコストが
上昇するという問題があった。
【0010】図31に,従来のB2B(Business to Bu
siness)集中型電子商取引システムの構成例を示す。現
在,中小規模のB2B電子商取引や,マーケットプレー
スのプラットフォームとして,図31に示すようなデー
タセンタ100による集中型のB2Bプラットフォーム
120が用いられている。300A〜300Cは,各企
業A〜Cの社内システムである。
【0011】図32に,従来のB2Bプラットフォーム
の例を示す。図32において,各企業のデータベース3
10A〜310Cに格納されたXML電子伝票は,各企
業の独自スキーマ311A〜311Cで記述されるた
め,XML電子伝票のスキーマを,各企業の独自スキー
マ311A〜311Cから共通スキーマ111に変換す
る必要がある。
【0012】このXML電子伝票をスキーマ変換する方
式として,図32に示すようにXML変換エンジン32
0A〜320Cを用いる方法がある。一般的にXML変
換は,W3Cにより標準化されたXML構造変換言語X
SLTにより記述でき,現在,多くのXSLTによるX
ML変換処理系が実装されている。
【0013】従来方式では,XMLデータベース110
とXSLTによるXML変換エンジン320A〜320
Cとが独立しているため,各企業がB2Bプラットフォ
ーム120にあるXMLデータベース110から,独自
スキーマ311A〜311Cで検索結果を得ようとする
場合,ユーザが,B2Bプラットフォーム120のXM
Lデータベース110に蓄積されているXML電子伝票
のスキーマを意識して検索式を作成し,さらにXMLデ
ータベース110の検索結果をXML変換エンジン32
0A〜320Cにより変換し,最終的な検索結果を得る
という処理が必要であった。
【0014】しかし,この方式では,次のような問題が
ある。 〔問題点1〕ユーザがデータベースに蓄積されているX
ML文書のスキーマを意識して検索式を作成する必要が
あるため,各企業のシステムと,B2Bプラットフォー
ムとの独立性が悪い。 〔問題点2〕共通スキーマは,各企業が必要とする情報
を漏れなく盛り込むため,構造が複雑になる傾向がある
が,個々の企業が検索する場合,変換後に必要でないX
MLの要素もXMLデータベースの検索結果として各企
業へ出力されるため,通信コストがかかる。 〔問題点3〕XSLTは記述が難しく,XML電子伝票
の変換には構造変換の機能が過剰であることに加え,値
の表現形式の変換機能が不足しており,現実の電子商取
引に対応できない。
【0015】本発明は,電子商取引システムに限られる
わけではないが,以上の問題点の解決を図り,例えば各
企業の独自スキーマをXMLビューとして定義し,XM
Lビューとデータベースのスキーマとの間の構造変換の
際に,構造変換に最適化したデータベース検索を行うこ
とで,データベース検索と構造変換のコストを低減でき
るようにすることを目的とする。
【0016】
【課題を解決するための手段】本発明は,上記課題を解
決するため,単一のスキーマ(以下,蓄積構造または蓄
積スキーマという)でデータベースに蓄積された構造化
文書を,その利用目的やアプリケーションにより,構造
と値の表現形式が異なる仮想的なスキーマ(以下,ビュ
ーという)に変換したように見せ,ビューに対して構造
化文書の検索・挿入を行うことを可能とする。また,ビ
ューを階層的に定義し,ビューに対するビューへの構造
化文書の検索・挿入を行うことを可能とする。
【0017】本発明の原理構成図を図1に示す。本シス
テムは,構造化文書を蓄積するデータベースである構造
化文書蓄積装置10と,構造化文書のビューを生成する
ビュー生成装置20と,構造化文書を処理するアプリケ
ーション30からなる。
【0018】ビュー生成装置20は,構造化文書蓄積装
置10の蓄積構造とビューの間で相互に構造化文書を変
換する構造変換処理部21と,ビューに対する検索式を
蓄積構造に対する検索式に変換する検索式変換処理部2
2と,蓄積構造とビューの定義,スキーマの階層関係の
定義,構造の変換と検索式の構造変換のルールを蓄積す
るスキーマ辞書(構造・検索変換ルール辞書)23から
なる。
【0019】スキーマ辞書23は,以下の情報を持つ。 (1) スキーマ情報 スキーマ情報は,単一の蓄積構造のスキーマと,複数の
ビューのスキーマの定義である。 (2) スキーマ階層情報 スキーマ階層情報は,スキーマの階層関係を表す親スキ
ーマと子スキーマの対応関係の一覧である。スキーマの
階層関係は木構造をとり,スキーマ階層情報は親スキー
マと子スキーマの組の集合からなる。より根(ルート)
寄りのスキーマを親スキーマとし,より葉(リーフ)寄
りのスキーマを子スキーマとする。スキーマの階層関係
において,蓄積構造を表すスキーマを木構造のルートに
する必要があり,ビューを表すスキーマは,任意の多段
の木構造をとることができる。 (3) 構造・検索式変換ルール 構造・検索式変換ルール(以下,変換ルールという)
は,スキーマの階層関係における親スキーマと子スキー
マの間で,構造化文書中の要素の対応を記述し,構造化
文書の構造と検索式を構造変換するためのルールであ
り,親スキーマの個々の要素と子スキーマの個々の要素
との一対一の対応関係の一覧で表される。 (4) 値の表現形式変換情報 値の表現形式変換情報は,構造化文書の値を親スキーマ
と子スキーマの間で変換するための情報である。
【0020】次に,本実施の形態における処理手順につ
いて,図2〜図5を用いて説明する。図2のフローチャ
ートに示すように,本処理手順は,スキーマ辞書の設定
ステップS10と,構造化文書の挿入(更新)ステップ
S20と,構造化文書の検索ステップS30の3段階に
分かれている。
【0021】複数の構造化文書を処理する場合,ステッ
プS10を初めに一度だけ行い,以降は個々の構造化文
書について任意の順序でステップS20,ステップS3
0を繰り返し行う。
【0022】図2に示すスキーマ辞書の設定ステップS
10の詳細について,図3に従って説明する。まず,ス
テップS11では,蓄積構造の作成を行う。ここでは,
ユーザが設計した単一の任意のスキーマを入力し,構造
化文書蓄積装置10に構造化文書を蓄積する際のスキー
マである蓄積構造と定め,スキーマ辞書23に登録す
る。
【0023】次に,ステップS12では,ビューの作成
を行う。ここでは,ユーザが設計した複数の任意のスキ
ーマを入力し,構造化文書を検索・挿入する際のスキー
マであるビューと定め,スキーマ辞書23に登録する。
【0024】ステップS13では,スキーマ階層情報の
作成を行う。ここでは,ユーザは,ステップS11とス
テップS12で作成した蓄積構造とビューを表すスキー
マの階層関係を設計し,その設計した情報を入力してス
キーマ階層情報としてスキーマ辞書23に登録する。
【0025】ステップS14では,変換ルールの作成を
行う。ここでは,ユーザが作成したスキーマ階層中で親
子関係にある親スキーマと子スキーマの間で,構造・検
索式を変換するルールを入力し,スキーマ辞書23に登
録する。
【0026】ステップS15では,表現形式変換情報の
作成を行う。ここでは,ユーザが作成した親スキーマと
子スキーマの間で構造化文書中の値の表現形式を変換す
る表現形式変換情報を入力し,スキーマ辞書23に登録
する。
【0027】次に,図2に示す構造化文書の挿入ステッ
プS20の詳細について,図4に従って説明する。
【0028】ステップS21では,ユーザからの構造化
文書の入力を行う。ユーザは,アプリケーション30を
通して,ステップS12で作成した複数のビューの中
の,任意の単一のビュー構造に従った「構造化文書」を
作成し,「構造化文書」とそのビュー名とをビュー生成
装置20へ入力する。
【0029】ステップS22では,変換経路情報の作成
を行う。構造変換処理部21は,スキーマ辞書23のス
キーマ階層情報を用いて,指定されたビューから蓄積構
造へ変換する経路(これを「変換経路情報」という)を
作成する。
【0030】ステップS23では,変換ルールの結合を
行う。構造変換処理部21は,前ステップS22で作成
した「変換経路情報」に従い,スキーマ辞書23の変換
ルールを結合し,指定のビューと蓄積構造との間の変換
ルール(これを「結合した変換ルール」という)を作成
する。
【0031】ステップS24では,構造化文書の構造変
換を行う。構造変換処理部21は,「結合した変換ルー
ル」を用いて,アプリケーション30から入力された
「構造化文書」を,「変換された構造化文書」へ構造変
換する。同時に,スキーマ辞書23の「表現形式変換情
報」を用いて,値の表現形式を変換する。
【0032】ステップS25では,変換された構造化文
書の蓄積を行う。構造変換処理部21は,「変換された
構造化文書」を構造化文書蓄積装置10に蓄積する。
【0033】次に,図2に示す構造化文書の検索ステッ
プS30の詳細について,図5に従って説明する。
【0034】まず,ステップS31では,ユーザが発行
した検索式を入力する。ユーザは,アプリケーション3
0を通して,ステップS12で作成したビュー内の,任
意のビューの構造に従った「検索式」を作成し,「検索
式」とそのビュー名とをビュー生成装置20へ入力す
る。
【0035】ステップS32では,変換経路情報の作成
を行う。構造変換処理部21は,スキーマ辞書23のス
キーマ階層情報を用いて,指定のビューから蓄積構造へ
変換する経路(「変換経路情報」)を作成する。
【0036】ステップS33では,変換ルールの結合を
行う。構造変換処理部21は,前ステップS32で作成
した「変換経路情報」に従い,スキーマ辞書23の変換
ルールを結合し,指定のビューと蓄積構造との間の変換
ルール(「結合した変換ルール」)を作成する。
【0037】ステップS34では,検索式の構造変換を
行う。検索式変換処理部22は,ユーザから受取った
「検索式」を,「結合した変換ルール」を用いて「変換
された検索式」に構造変換し,同時に,スキーマ辞書2
3の「表現形式変換情報」を用いて値の表現形式を変換
し,構造化文書蓄積装置10に出力する。
【0038】ステップS35では,検索を実行する。構
造化文書蓄積装置10は,「変換された検索式」を実行
し,「検索結果」を得る。次に,構造化文書蓄積装置1
0は,「検索結果」を構造変換処理部21へ出力する。
【0039】ステップS36では,検索結果の構造変換
を行う。構造変換処理部21は,「検索結果」を,「結
合した変換ルール」を用いて「変換された検索結果」に
構造変換し,同時に,スキーマ辞書23の「表現形式変
換情報」を用いて値の表現形式を変換し,アプリケーシ
ョン30に返却する。
【0040】ステップS37では,変換された検索結果
を返却する。アプリケーション30は,「変換された検
索結果」をユーザへ返却する。
【0041】上記のように,本発明は,蓄積構造とビュ
ーの間の変換ルールをあらかじめ辞書に登録し,この辞
書を用いて構造と検索式の構造と値の表現形式の変換を
行うことにより,蓄積構造に従って記述された構造化文
書を,ユーザの定義する任意のビューを通して検索・挿
入を行うことができる。
【0042】
【発明の実施の形態】本発明の実施の形態を以下に示
す。なお,本実施の形態では,構造化文書記述言語とし
てXML(eXtensible Markup Language:World Wide W
eb Consortiumにより規格化),スキーマ記述言語とし
てDTD(Document Type Definition:World Wide Web
Consortium により規格化),検索式記述言語としてX
Path(World Wide Web Consortium により規格化)
を用いる。また,特開平10−143539号公報の
「情報検索方法および情報検索システムおよび情報資源
辞書データを記録した記録媒体および情報検索プログラ
ムを記録した記録媒体」に述べられている値の表現形式
の変換手法を表現形式変換手法として用いる。
【0043】蓄積構造とビュー,ビューと別のビューと
の間で,値の日付の表記や重さの単位などの表現形式の
管理方法に違い(非互換性)が存在する。
【0044】本実施の形態では,各スキーマの表現形式
の違いをドメインという概念で管理し,表現形式の相互
変換を行う。ドメインの構成を図示すると,例えば図6
のように表現できる。ここで,「¥1,000」や「千
円」などの値の1つの表現形式を1つのドメインとみな
し,相互に変換可能なドメインの一群をドメイングルー
プと呼ぶ。図中のM1,M2,…,M6がそれぞれドメ
インである。
【0045】ドメイングループ中の1つのドメインを代
表とし,他のドメインとの間の変換手段(ドメイン変換
関数)を定義することで,すべての表現形式の相互変換
を可能にする。代表とするドメイン(図6ではドメイン
M1)を「グローバルドメイン」と呼ぶ。
【0046】ドメインの定義は,スキーマ辞書23にド
メイン名,ドメイングループ名,ドメイン間の変換関数
を設定し,スキーマの要素毎にドメイン名を対応付ける
ことで行う。以上の表現形式の相互変換については,特
開平10−143539号公報に記載されている技術を
用いることができる。
【0047】本実施の形態における手順は,図2で説明
したスキーマ辞書の設定ステップS10,構造化文書の
挿入ステップS20,構造化文書の検索ステップS30
の3段階に分かれている。
【0048】複数の構造化文書を処理する場合,ステッ
プS10を初めに一度だけ行い,以降は個々の構造化文
書について任意の順序でステップS20,ステップS3
0を繰り返し行う。
【0049】最初に,図3に示すスキーマ辞書の設定
(図2のステップS10)の実施の形態について,具体
例に従って説明する。
【0050】ステップS11の蓄積構造の作成では,ユ
ーザは,図7に示す「スキーマR」を蓄積構造と定め,
スキーマ辞書23に登録する。
【0051】ステップS12のビューの作成では,ユー
ザは,図8に示す「スキーマA」,図9に示す「スキー
マB」,図10に示す「スキーマC」をビューと定め,
スキーマ辞書23に登録する。
【0052】スキーマA,B,C,Rのスキーマ親子関
係(スキーマ階層)が,図11に示すとおりであったと
する。ステップS13のスキーマ階層情報の作成では,
ユーザは,図11のスキーマ親子関係を表すスキーマ階
層情報をスキーマ辞書23に登録する。図12は,その
スキーマ辞書23に登録されるスキーマ階層情報の例を
示している。
【0053】ステップS14の変換ルールの作成では,
ユーザは,「スキーマR」と「スキーマA」,「スキー
マA」と「スキーマB」,「スキーマR」と「スキーマ
C」の間で,図13に示す変換ルールを作成し,スキー
マ辞書23に登録する。
【0054】なお,図13において,“R:/product/par
ts/item ”は,スキーマRのXPath表記の要素“/p
roduct/parts/item ”を表す。また,“R:/product/par
ts/item/@type ”は,スキーマRの要素“/product/par
ts/item ”の属性“type”を表す。さらに図13におい
て,表の左側は親スキーマの要素,右側は子スキーマの
要素を表し,各行が一つの要素の対応関係を表している
ものとする。
【0055】ステップS15の表現形式変換情報の作成
では,ユーザは,蓄積構造とビュー,ビューと別のビュ
ーとの間で,値の表現形式が異なっている要素につい
て,図14に示す値の表現形式変換情報(ドメイン定
義)を作成し,スキーマ辞書23に登録する。
【0056】次に,図4に示す構造化文書の挿入(図2
のステップS20)の実施の形態について,具体例に従
って説明する。
【0057】ステップS21のユーザからの構造化文書
の入力では,ユーザは,アプリケーション30を通し
て,図15に示す「構造化文書D」を作成し,「構造化
文書D」と「構造化文書D」のビュー名「スキーマB」
を,ビュー生成装置20へ入力する。
【0058】ステップS22の変換経路情報の作成で
は,構造変換処理部21は,スキーマ辞書23のスキー
マ階層情報を用いて,アプリケーション30から入力さ
れたビュー名「スキーマB」から,蓄積構造「スキーマ
R」へ変換する経路を作成し,図16に示す「変換経路
情報」として出力する。これは,ビュー名「スキーマ
B」から,蓄積構造「スキーマR」へ変換するために
は,「スキーマB」から「スキーマA」へ変換し,「ス
キーマA」から実際の蓄積構造「スキーマR」へ変換す
ることを示している。
【0059】ステップS23の変換ルールの結合では,
構造変換処理部21は,図16に示す「変換経路情報」
に従い,スキーマ辞書23の図13に示す変換ルールを
結合し,図17に示すスキーマBから蓄積構造への変換
ルール(「結合した変換ルールX」)を作成する。
【0060】ステップ24の構造化文書の構造変換で
は,構造変換処理部21は,ユーザから受け取った「構
造化文書D」を,ステップS23で作成した「結合した
変換ルールX」を用いて,図18に示す「変換された構
造化文書D′」へ変換する。変換は,「結合した変換ル
ールX」に従い,ビューの要素を,蓄積構造の要素に置
き換えることにより行う。ここで,要素に図14に示す
表現形式変換情報が設定されている場合には,値の表現
形式の変換を行う。
【0061】ここでは,例えば「B: /商品 /価格」要素
は,ドメイングループが金額,ドメインがM6であり,
「R:/product/price」要素は,ドメイングループが金
額,ドメインがM4の形式であるので,「¥150,0
00」を「150,000」へ変換するような処理を行
う。最後に「変換された構造化文書D′」を構造化文書
蓄積装置10に出力する。
【0062】ステップS25の変換された構造化文書の
蓄積では,構造化文書蓄積装置10は,「蓄積された構
造化文書D′」を蓄積する。
【0063】次に,図5に示す構造化文書の検索ステッ
プS30の実施の形態について,具体例に従って説明す
る。
【0064】ステップS31のユーザが発行した検索式
の入力では,ユーザは,アプリケーション30を通し
て,図19に示す「検索式Q」を作成し,「検索式Q」
とビュー名「スキーマB」を,ビュー生成装置20へ入
力する。この「検索式Q」は,「“種別”属性が“ハー
ドディスク”である“構成品”要素の子要素である“機
能”要素」を取得することを意味している。
【0065】ステップS32の変換経路情報の作成で
は,構造変換処理部21は,スキーマ辞書23のスキー
マ階層情報を用いて,アプリケーション30から入力さ
れたビュー名「スキーマB」から,蓄積構造「スキーマ
R」へ変換する経路を作成し,前述した図16に示す
「変換経路情報」として出力する。
【0066】ステップS33の変換ルールの結合では,
構造変換処理部21は,「変換経路情報」に従い,スキ
ーマ辞書23の変換ルールを結合し,図17に示すスキ
ーマAから蓄積構造への変換ルール(「結合した変換ル
ールX」)を作成する。
【0067】ステップS34の検索式の構造変換では,
構造変換処理部21は,「結合した変換ルールX」を用
いて,アプリケーション30から入力された「検索式
Q」を,図20に示す「変換された検索式Q′」に変換
する。この変換は,「結合した変換ルールX」に従い,
ビューの要素を蓄積構造の要素に置き換えることにより
行う。図20に示す「変換された検索式Q′」は,
「“type”属性が“ハードディスク”である“item”要
素」を取得することを意味している。ここで,要素に図
14に示す表現形式変換情報が設定されている場合に
は,値の表現形式の変換を行う。
【0068】ステップS35の検索実行では,構造化文
書蓄積装置10は,「変換された検索式Q′」を実行
し,図21に示す「検索結果R」を得る。次に,「検索
結果R」を構造変換処理部21へ出力する。
【0069】ステップS36の検索結果の構造変換で
は,構造変換処理部21は,構造化文書蓄積装置10か
ら入力された「検索結果R」を,「結合した変換ルール
X」を用いて図22に示す「変換された検索結果R′」
に変換し,アプリケーション30に出力する。変換は,
「結合した変換ルールX」に従い,蓄積構造の要素をビ
ューの要素に置き換えることにより行う。ここで,要素
に図14に示す表現形式変換情報が設定されている場合
には,値の表現形式の変換を行う。
【0070】ステップS37の変換された検索結果の返
却では,アプリケーション30は,構造変換処理部21
から入力された「変換された検索結果R′」をユーザへ
返却する。
【0071】なお,ステップS24にて行った構造化文
書の構造変換について,図23を用いて説明する。この
とき,「結合した変換ルール」において,ビューのスキ
ーマを変換元のスキーマ,蓄積構造のスキーマを変換先
のスキーマとして処理を進める。
【0072】図4の構造化文書の構造変換ステップS2
4では,まず図23のステップS241により番号付け
を行う。ここでは,変換元の構造化文書Dに対して,そ
の木構造を例えば図24と表すとき,図25に示すよう
に,木構造中の個々の要素に行きがけ順で番号を付与す
る。
【0073】ステップS242の構造変換では,前ステ
ップS241で付与した番号の順に,各要素に注目し,
以下の手順(S242a〜c)を繰り返す。
【0074】ステップS242aのパスの取り出しで
は,注目する要素から,ルート要素に至るパスを取得す
る。例えば,図25の番号の要素のパスは「 /商品 /
構成品/種別」である。
【0075】ステップS242bのパスの変換では,前
ステップS242aで作成したパスをキーとして「結合
した変換ルール」から,変換先のパスを作成する。変換
元のパス「 /商品 /構成品 /種別」をキーとすると,変
換先のパス「/product/parts/item/@type 」が得られ
る。なお,ここで,指定のキーが「結合した変換ルー
ル」にない場合には,このパスを無視して次の要素に進
む。
【0076】ステップS242cの変換されたパスの配
置では,変換先のパスを変換先の木構造中に配置する。
例として,変換先のパス「/product/parts/item/@type
」は,図26の番の要素として配置する。このと
き,パスの途中の要素がない場合には,新たに作成す
る。図26の“/product/parts”要素は,番の要素を
配置する際に,同時に作成されたものである。
【0077】ステップS243の結果出力では,ステッ
プS242によって図27の木構造で示される構造化文
書が作成され,これを出力として本手順を終了する。
【0078】また,ステップS34にて行った検索式の
構造変換は,検索式を木構造ととらえ,ビューのスキー
マを変換元のスキーマ,蓄積構造のスキーマを変換先の
スキーマとし,図23のステップS241〜S243と
同等の処理を行うことで実現できる。例として「検索式
Q」は,図28に示す木構造ととらえ,図29に変換す
ることで,「構造化された検索式Q′」を得る。
【0079】また,ステップS36にて行った構造化文
書の構造変換は,蓄積構造のスキーマを変換元のスキー
マ,ビューのスキーマを変換先とし,図23のステップ
S241〜S243と同等の処理を行うことで実現でき
る。
【0080】また,アプリケーション30は「スキーマ
C」もビューとして利用できる。しかし,「スキーマ
C」は,「スキーマR」のすべての情報を表現していな
い。よって,「スキーマC」から「スキーマR」への変
換はできないため,アプリケーション30は,構造化文
書の検索をすることは可能であるが,構造化文書の挿入
をすることはできない(ビューは読み取り専用であ
る)。
【0081】[本発明の適用例]本発明のB2B(Busi
ness to Business)電子商取引システムへの適用例につ
いて説明する。
【0082】本システムは,図31および図32で述べ
た従来のB2B電子商取引システムの問題に対し,各企
業の独自スキーマをXMLビューとして定義し,XML
ビューとデータベースのスキーマ(蓄積スキーマとい
う)との間の構造変換の際に,構造変換に最適化したデ
ータベース検索を行うことで,データベース検索と構造
変換のコストを低減可能とする。
【0083】図30に,本発明のB2B電子商取引シス
テムへの適用例を示す。XML文書検索・変換システム
200は,図1に示すビュー生成装置20に相当するも
のである。XML文書検索・変換システム200におい
て,データセンタ100にあるXMLデータベース11
0に対して,各企業の独自スキーマ311A〜311C
に合ったXMLビュー211A〜211Cを定義し,各
企業の社内システム300A〜300Cで動作するアプ
リケーションは,それぞれXMLビュー211A〜21
1Cを通して,XMLデータベース110中のXML文
書の検索,更新を行うことができる。
【0084】そのため,XML文書検索・変換システム
200は,図1に示すビュー生成装置20が持つ構造変
換処理部21,検索式変換処理部22,スキーマ辞書2
3を備え,構造変換処理部21によってスキーマ辞書2
3を参照し,各XMLビュー211A〜211Cと蓄積
スキーマ210との間のスキーマ変換を行い,また,検
索式変換処理部22によってスキーマ辞書23を参照
し,XPpathで記述された検索式の変換を行う。
【0085】このXML文書検索・変換システム200
を,集中サーバであるデータセンタ100に設置し,各
企業A〜Cが個々のビューでアクセス可能とする。この
XML文書検索・変換システム200により,B2B電
子商取引に必要な下記の機能が実現され,既存システム
の問題点を解決することができる。
【0086】(a) 各企業A〜Cは,独自スキーマ311
A〜311CをXMLビュー211A〜211Cとして
XML文書検索・変換システム200に登録し,XML
ビュー211A〜211Cを通して検索・更新を行うこ
とができ,各企業A〜Cの社内システム300A〜30
0Cの独立性が向上する。
【0087】(b) 検索結果の出力に必要な部分だけをデ
ータセンタ100から各企業A〜Cに通信すればよいた
め,検索処理の処理速度が向上する。
【0088】(c) B2B電子商取引に必要不可欠な値の
変換が実現される。例えば,次のような値の変換を容易
に自動的に行うことが可能になる。
【0089】 ---------------------------------------------------------------- <重量>1000</重量> ←→ <重量>1Kg</重量> <価格>15,000</価格> ←→ <価格>15千円</価格> <年>2002</年> ←→ <年>H14</年> ----------------------------------------------------------------
【0090】
【発明の効果】以上のとおり,本発明では,以下のよう
な効果がある。 (a) 検索結果の出力に必要な部分だけを変換すればよい
ため,検索処理の処理速度の向上が図られる。 (b) 仮想的に定義されたビューに対して検索式を作成す
ればよいため,構造化文書の蓄積・検索において,デー
タベースのスキーマと,アプリケーションのスキーマと
を分離し,データベースとアプリケーションの独立した
開発を実現することができる。
【0091】以上のことから,本発明によって構造化文
書の二次利用が大幅に促進されることが期待できる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の実施の形態の処理手順を示すフローチ
ャートである。
【図3】スキーマ辞書の設定の処理フローチャートであ
る。
【図4】構造化文書の挿入の処理フローチャートであ
る。
【図5】構造化文書の検索の処理フローチャートであ
る。
【図6】ドメインの定義を説明する図である。
【図7】スキーマR(蓄積スキーマ)の例を示す図であ
る。
【図8】スキーマA(ビュー)の例を示す図である。
【図9】スキーマB(ビュー)の例を示す図である。
【図10】スキーマC(ビュー)の例を示す図である。
【図11】スキーマ階層の例を示す図である。
【図12】スキーマ階層情報の例を示す図である。
【図13】変換ルールの例を示す図である。
【図14】ドメイン定義の例を示す図である。
【図15】構造化文書Dの例を示す図である。
【図16】変換経路情報の例を示す図である。
【図17】結合した変換ルールXの例を示す図である。
【図18】変換された構造化文書D′の例を示す図であ
る。
【図19】検索式Qの例を示す図である。
【図20】変換された検索式Q′の例を示す図である。
【図21】検索結果Rの例を示す図である。
【図22】変換された検索結果R′の例を示す図であ
る。
【図23】構造化文書の挿入の例を示す図である。
【図24】構造化文書Dの木構造を示す図である。
【図25】構造化文書Dの木構造の行きがけ順を示す図
である。
【図26】構造変換途中の構造化文書D″の木構造を示
す図である。
【図27】構造変換された構造化文書D″の木構造を示
す図である。
【図28】検索式Qの木構造を示す図である。
【図29】構造変換された検索式Q″の木構造を示す図
である。
【図30】本発明の適用システムの例を示す図である。
【図31】従来の集中型B2B電子商取引システムの構
成例を示す図である。
【図32】従来のB2Bプラットフォームの例を示す図
である。
【符号の説明】
10 構造化文書蓄積装置 20 ビュー生成装置 21 構造変換処理部 22 検索式変換処理部 23 スキーマ辞書 30 アプリケーション

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数の構造化文書が単一の蓄積スキーマ
    で蓄積される構造化文書データベースを,前記蓄積スキ
    ーマとは異なる構造と値の表現形式でもって定義された
    仮想的なスキーマであるビューを通して更新する構造化
    文書の更新処理方法であって,前記構造化文書データベ
    ースに挿入する構造化文書とビュー指定情報とを入力す
    るステップと,前記蓄積スキーマと前記ビューとの間の
    あらかじめ登録された構造および値の表現形式に関する
    変換規則情報を用い,前記入力された構造化文書を前記
    蓄積スキーマに適合する構造に変換するとともに,前記
    入力された構造化文書の値の表現形式を前記蓄積スキー
    マの値の表現形式に変換するステップと,変換された構
    造化文書を前記構造化文書データベースに蓄積するステ
    ップとを有することを特徴とするビューによる構造化文
    書処理方法。
  2. 【請求項2】 請求項1に記載のビューによる構造化文
    書処理方法において,前記ビューを表すスキーマは前記
    蓄積スキーマをルートとする木構造の階層関係を持つよ
    うに定義することができ,前記変換規則情報として,前
    記蓄積スキーマと1段目のビューとの間の変換規則情報
    の他に,親子関係にあるビュー間の変換規則情報を持
    ち,前記入力された構造化文書を変換するにあたって,
    指定されたビューから前記蓄積スキーマへ変換する前記
    木構造における変換経路情報を作成するステップと,前
    記変換経路情報が複数の階層にわたるときに,経路上の
    各階層に対応する変換規則情報を結合するステップとを
    有し,前記入力された構造化文書を変換するステップで
    は,前記結合された変換規則情報を用いて変換すること
    を特徴とするビューによる構造化文書処理方法。
  3. 【請求項3】 複数の構造化文書が単一の蓄積スキーマ
    で蓄積される構造化文書データベースを,前記蓄積スキ
    ーマとは異なる構造と値の表現形式でもって定義された
    仮想的なスキーマであるビューを通して検索する構造化
    文書の検索処理方法であって,前記構造化文書データベ
    ースを検索する検索式とビュー指定情報とを入力するス
    テップと,前記蓄積スキーマと前記ビューとの間のあら
    かじめ登録された構造および値の表現形式に関する変換
    規則情報を用い,前記入力された検索式を前記蓄積スキ
    ーマに適合する構造の検索式に変換するとともに,前記
    入力された検索式の値の表現形式を前記蓄積スキーマの
    値の表現形式に変換するステップと,変換された検索式
    を用いて前記構造化文書データベースを検索するステッ
    プと,検索結果を前記変換規則情報を用いて前記ビュー
    の構造に変換するとともに,その値の表現形式を前記ビ
    ューの値の表現形式に変換するステップとを有すること
    を特徴とするビューによる構造化文書処理方法。
  4. 【請求項4】 請求項3に記載のビューによる構造化文
    書処理方法において,前記ビューを表すスキーマは前記
    蓄積スキーマをルートとする木構造の階層関係を持つよ
    うに定義することができ,前記変換規則情報として,前
    記蓄積スキーマと1段目のビューとの間の変換規則情報
    の他に,親子関係にあるビュー間の変換規則情報を持
    ち,前記入力された検索式を変換するにあたって,指定
    されたビューから前記蓄積スキーマへ変換する前記木構
    造における変換経路情報を作成するステップと,前記変
    換経路情報が複数の階層にわたるときに,経路上の各階
    層に対応する変換規則情報を結合するステップとを有
    し,前記入力された検索式を変換するステップおよび検
    索結果を変換するステップでは,前記結合された変換規
    則情報を用いて変換することを特徴とするビューによる
    構造化文書処理方法。
  5. 【請求項5】 複数の構造化文書が単一の蓄積スキーマ
    で蓄積される構造化文書データベースを,前記蓄積スキ
    ーマとは異なる構造と値の表現形式でもって定義された
    仮想的なスキーマであるビューを通して更新する構造化
    文書処理装置であって,あらかじめ登録された前記蓄積
    スキーマと前記ビューとの間の構造および値の表現形式
    に関する変換規則情報を記憶する手段と,前記構造化文
    書データベースに挿入する構造化文書とビュー指定情報
    とを入力する手段と,前記変換規則情報を用い,前記入
    力された構造化文書を前記蓄積スキーマに適合する構造
    に変換するとともに,前記入力された構造化文書の値の
    表現形式を前記蓄積スキーマの値の表現形式に変換する
    手段と,変換された構造化文書を前記構造化文書データ
    ベースに蓄積する手段とを備えることを特徴とするビュ
    ーによる構造化文書処理装置。
  6. 【請求項6】 請求項5に記載のビューによる構造化文
    書処理装置において,前記ビューを表すスキーマは前記
    蓄積スキーマをルートとする木構造の階層関係を持つよ
    うに定義することができ,前記変換規則情報を記憶する
    手段は,前記蓄積スキーマと1段目のビューとの間の変
    換規則情報の他に,親子関係にあるビュー間の変換規則
    情報を記憶し,前記入力された構造化文書を変換するに
    あたって,指定されたビューから前記蓄積スキーマへ変
    換する前記木構造における変換経路情報を作成する手段
    と,前記変換経路情報が複数の階層にわたるときに,経
    路上の各階層に対応する変換規則情報を結合する手段と
    を備え,前記入力された構造化文書を変換する手段で
    は,前記結合された変換規則情報を用いて変換すること
    を特徴とするビューによる構造化文書処理装置。
  7. 【請求項7】 複数の構造化文書が単一の蓄積スキーマ
    で蓄積される構造化文書データベースを,前記蓄積スキ
    ーマとは異なる構造と値の表現形式でもって定義された
    仮想的なスキーマであるビューを通して検索する構造化
    文書処理装置であって,あらかじめ登録された前記蓄積
    スキーマと前記ビューとの間の構造および値の表現形式
    に関する変換規則情報を記憶する手段と,前記構造化文
    書データベースを検索する検索式とビュー指定情報とを
    入力する手段と,前記変換規則情報を用い,前記入力さ
    れた検索式を前記蓄積スキーマに適合する構造の検索式
    に変換するとともに,前記入力された検索式の値の表現
    形式を前記蓄積スキーマの値の表現形式に変換する手段
    と,変換された検索式を用いて前記構造化文書データベ
    ースを検索する手段と,検索結果を前記変換規則情報を
    用いて前記ビューの構造に変換するとともに,その値の
    表現形式を前記ビューの値の表現形式に変換する手段と
    を備えることを特徴とするビューによる構造化文書処理
    装置。
  8. 【請求項8】 請求項7に記載のビューによる構造化文
    書処理装置において,前記ビューを表すスキーマは前記
    蓄積スキーマをルートとする木構造の階層関係を持つよ
    うに定義することができ,前記変換規則情報を記憶する
    手段は,前記蓄積スキーマと1段目のビューとの間の変
    換規則情報の他に,親子関係にあるビュー間の変換規則
    情報を記憶し,前記入力された検索式を変換するにあた
    って,指定されたビューから前記蓄積スキーマへ変換す
    る前記木構造における変換経路情報を作成する手段と,
    前記変換経路情報が複数の階層にわたるときに,経路上
    の各階層に対応する変換規則情報を結合する手段とを備
    え,前記入力された検索式を変換する手段および検索結
    果を変換する手段では,前記結合された変換規則情報を
    用いて変換することを特徴とするビューによる構造化文
    書処理装置。
  9. 【請求項9】 請求項6または請求項8に記載の構造化
    文書処理装置において,前記変換規則情報を記憶する手
    段は,前記蓄積スキーマおよび複数のビューのスキーマ
    の定義情報と,前記蓄積スキーマをルートとする木構造
    の前記蓄積スキーマおよび複数のビューのスキーマの階
    層関係を表す情報と,前記スキーマの階層関係における
    親スキーマと子スキーマとの間で,構造化文書中の要素
    の対応を記述し,構造化文書の構造または検索式を構造
    変換するための規則情報と,構造化文書の値を親スキー
    マと子スキーマとの間で変換するための値の表現形式変
    換情報とを記憶することを特徴とするビューによる構造
    化文書処理装置。
  10. 【請求項10】 複数の構造化文書が単一の蓄積スキー
    マで蓄積される構造化文書データベースを,前記蓄積ス
    キーマとは異なる構造と値の表現形式でもって定義され
    た仮想的なスキーマであるビューを通して更新または検
    索する構造化文書処理装置であって,あらかじめ登録さ
    れた前記蓄積スキーマと前記ビューとの間の構造および
    値の表現形式に関する変換規則情報を記憶する手段と,
    前記ビューを用いた構造化文書の挿入要求に対し,前記
    変換規則情報を用い,入力された構造化文書を前記蓄積
    スキーマに適合する構造と値の表現形式に変換し,前記
    構造化文書データベースに蓄積する手段と,前記ビュー
    を用いた構造化文書の検索要求に対し,前記変換規則情
    報を用い,入力された検索式を前記蓄積スキーマに適合
    した構造と値の表現形式の検索式に変換し,前記構造化
    文書データベースを検索し,その検索結果について前記
    変換規則情報を用い,前記ビューに適合した構造と値の
    表現形式の検索結果に変換して要求元へ返却する手段と
    を備えることを特徴とするビューによる構造化文書処理
    装置。
  11. 【請求項11】 請求項1から請求項4までのいずれか
    に記載のビューによる構造化文書処理方法を,コンピュ
    ータに実行させるための構造化文書処理プログラム。
  12. 【請求項12】 請求項1から請求項4までのいずれか
    に記載のビューによる構造化文書処理方法を,コンピュ
    ータに実行させるためのプログラムを記録したことを特
    徴とする構造化文書処理プログラムの記録媒体。
JP2002045959A 2002-02-22 2002-02-22 ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体 Pending JP2003248675A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002045959A JP2003248675A (ja) 2002-02-22 2002-02-22 ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002045959A JP2003248675A (ja) 2002-02-22 2002-02-22 ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体

Publications (1)

Publication Number Publication Date
JP2003248675A true JP2003248675A (ja) 2003-09-05

Family

ID=28659559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002045959A Pending JP2003248675A (ja) 2002-02-22 2002-02-22 ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体

Country Status (1)

Country Link
JP (1) JP2003248675A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007536639A (ja) * 2004-05-04 2007-12-13 フィッシャー−ローズマウント・システムズ・インコーポレーテッド プロセスコントロールデータにアクセスするための方法および装置
US8676786B2 (en) 2010-12-17 2014-03-18 Fujitsu Limited Computer product, data conversion apparatus, and conversion method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007536639A (ja) * 2004-05-04 2007-12-13 フィッシャー−ローズマウント・システムズ・インコーポレーテッド プロセスコントロールデータにアクセスするための方法および装置
US8676786B2 (en) 2010-12-17 2014-03-18 Fujitsu Limited Computer product, data conversion apparatus, and conversion method

Similar Documents

Publication Publication Date Title
Aumueller et al. Schema and ontology matching with COMA++
US8924415B2 (en) Schema mapping and data transformation on the basis of a conceptual model
Su et al. Automating the transformation of XML documents
US6834287B1 (en) Classification engine for managing attribute-based data
US7266549B2 (en) Optimization using a multi-dimensional data model
US6839714B2 (en) System and method for comparing heterogeneous data sources
US6604100B1 (en) Method for converting relational data into a structured document
US9558239B2 (en) Relational query planning for non-relational data sources
Visser et al. Enabling technologies for interoperability
US8234312B2 (en) Schema mapping and data transformation on the basis of layout and content
US20060265352A1 (en) Methods and apparatus for information integration in accordance with web services
Boyd et al. AutoMed: A BAV data integration system for heterogeneous data sources
US20030177481A1 (en) Enterprise information unification
US20020143742A1 (en) Apparatus, method, and program for retrieving structured documents
CN105849726A (zh) 用于高效地支持通过分层标记数据的即席查询的通用索引
US7668888B2 (en) Converting object structures for search engines
Martin et al. Increasing the financial transparency of european commission project funding
CN116795859A (zh) 数据分析方法、装置、计算机设备和存储介质
US7953742B2 (en) Three-phase single-pass efficient processing of Xquery update
US20050278353A1 (en) XML schema tool
JP2003248675A (ja) ビューによる構造化文書処理方法,構造化文書処理装置,そのプログラムおよびそのプログラムの記録媒体
Elmasri et al. Conceptual modeling for customized XML schemas
CN102646099B (zh) 模式匹配系统、模式映射系统及方法
Angelis et al. Generating and exploiting semantically enriched, integrated, linked and open museum data
JP2005056085A (ja) データ構造変換プログラム