JP2004102790A - オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 - Google Patents
オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2004102790A JP2004102790A JP2002265426A JP2002265426A JP2004102790A JP 2004102790 A JP2004102790 A JP 2004102790A JP 2002265426 A JP2002265426 A JP 2002265426A JP 2002265426 A JP2002265426 A JP 2002265426A JP 2004102790 A JP2004102790 A JP 2004102790A
- Authority
- JP
- Japan
- Prior art keywords
- ontology
- conversion
- slot
- message
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行う。
【解決手段】ゲートウェイGWは、例えば、メッセージを転送元ドメインD1から転送先ドメインD2ヘ転送する場合、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、該類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、さらに、該対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換する。
【選択図】 図1
【解決手段】ゲートウェイGWは、例えば、メッセージを転送元ドメインD1から転送先ドメインD2ヘ転送する場合、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、該類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、さらに、該対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、オントロジー、情報統合、Content−based network(以下、CBNと略す)、異種分散データベース、XML、分散処理、エージェントなどの技術に係り、特に、異なるオントロジーを有するエンドユーザ間でのメッセージ配送を実現するためのオントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体に関する。
【0002】
【従来の技術】
近年、Gnutella,JXTA等のP2Pネットワークが着目を浴びているが、それらの特徴の1つとして、それがアプリケーション層(overlay)のネットワークであることが挙げられる。この特徴によって、下位層であるIPの束縛から解放され、自由で柔軟な名前空間やネットワーク構成を実現可能としている。
【0003】
このようなアプリケーション層のネットワークの一形態として「Content−based network」が提案されている(例えば、非特許文献1、非特許文献2参照)。CBNとは、メッセージ内に記述されたメタ情報に基づいた内容指向の配送(routing)を行うネットワークのことである。従来型ネットワークにおいては、各ノードに対して一意にIP等のネットワークアドレスが付与され、メッセージは、そのヘッダにおいて指定されたネットワークアドレスを持つノードに対して配送される。これに対してCBNでは、各ノードは、自身が受信したいメッセージに関する条件を記述したフィルタをCBNに登録し、メッセージは、そのヘッダに記述されたメタ情報と合致するフィルタを登録しているノードに対して配送される。
【0004】
ところで、上述したCBNでは、広域(global)な環境に適用できることを主目標の1つに掲げており、その実現に際しては2つの大きな課題がある。1つ目は、ルーティングである。広域環境においてスケーラブルなメッセージ配送を実現できるルーティングアルゴリズムの考案が課題となる。そして、2つ目がオントロジーである。ここで、オントロジーとは、メタ情報とフィルタの構造(データモデル)や、用いる語彙を規定する仕様のことであり、CBNにおけるアドレス体系となる。CBNでは、まさにその内容指向な特性によって「内容の理論(Content−based AI)」であるとされるオントロジー工学の手法が活用できる(例えば、非特許文献3参照)。
【0005】
ところで、上述したCBNにおける具体的なオントロジーの課題として、特に広域環境を想定した場合、異なるオントロジーを有するエンドユーザ間でのメッセージ配送を実現するために、メッセージのオントロジー変換を実現する必要がある。なぜなら、従来型ネットワークにおいては、階層的で一意な標準アドレス体系をグローバルに規定することができたが、オントロジーに関してグローバルな標準体系を確立することは現実的でないためである。
【0006】
そこで、フレーム形式において同じ属性を表現しているスロットを自動的に対応付ける事例ベースのフレームマッピング方法として、EBFM(事例に基づくフレームマッピング)が知られている(例えば、非特許文献4参照)。
【0007】
また、文書とデータの混在を許す柔軟性に富むデータモデルであるXMLにおける、ボキャブラリ(スキーマ)変換技術も知られている(例えば、非特許文献5参照)。
【0008】
【非特許文献1】
星合隆成、小柳恵一、ビルゲスクバタール、久保田稔、柴田弘、酒井隆道、「意味情報ネットワークアーキテクチャ」、電子情報通信学会論文誌 BVol.J84−B No.3、2001年、pp.411−424
【非特許文献2】
カーザニガ・A(Carzaniga, A.)、ロセンブルム・D・S(Rosenblum, D.S.)、ウルフ・A・L(Wolf, A.L.)、「広域イベント通知サービスの設計と評価、コンピュータシステムのACMトランザクション(Design and Evaluation of a Wide−Area Event Notification Service, ACM Transactions on Computer Systems 19(3):)」、2001、332−383
【非特許文献3】
溝口理一郎、「オントロジー研究の基礎と応用」、人工知能学会誌 Vol.14 No.6、1999年
【非特許文献4】
伊藤史朗、上田隆也、池田裕治、「分散情報源に対する情報エージェントのための事例に基づくフレームマッピング」、電子情報通信学会論文誌 D−1 Vol.J81−D−I No.5、1998年、pp.433−442
【非特許文献5】
TIBCO XML Transform、インターネット<URL:http://www.tibco.com/solutions/products/extensibility/xmLtransform.jsp>
【0009】
【発明が解決しようとする課題】
【0010】
しかしながら、上述したEBFMでは、異なる情報源において共通の対象を表現した事例を同定し、スロット値の類似をもとにマッピングを行うものであり、複数のインスタンス事例および、共通の対象を表現した事例を必要とするという課題を有している。
【0011】
また、XMLのボキャブラリ(スキーマ)変換技術は、汎用的にさまざまな適用領域(例えば、商取引のトランザクション等)における変換を自動化することは容易でないため、これらの技術は人間による変換作業のサポートに主眼を置いている。ゆえに、人手を介することなくオントロジー変換を実現する問題に対しては、そのまま適用することはできないという課題を有している。
【0012】
この発明は上述した事情に鑑みてなされたもので、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことができるオントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体を提供することを目的とする。
【0013】
【課題を解決するための手段】
上述した問題点を解決するために、請求項1記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換装置において、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースと、変換元オントロジーと変換先オントロジーとを各ドメインから取得するオントロジー取得手段と、前記オントロジー取得手段により取得した、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、前記概念データベースを用いて算出する類似度算出手段と、前記類似度算出手段により算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定する対応決定手段と、前記対応決定手段により決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するオントロジー変換手段とを具備することを特徴とする。
【0014】
また、請求項2記載の発明では、請求項1記載のオントロジー変換装置において、前記類似度算出手段は、変換元オントロジーのスロットおよび変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得する構成語取得手段と、前記構成語取得手段により取得された構成語の概念ベクトルの加重平均ベクトルを算出する加重平均ベクトル算出手段と、前記加重平均ベクトル算出手段により算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とする内積算出手段とを具備することを特徴とする。
【0015】
また、請求項3記載の発明では、請求項1記載のオントロジー変換装置において、前記オントロジー変換手段は、メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換手段と、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換手段と、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換手段とを具備し、前記第1ないし第3の変換手段のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする。
【0016】
また、請求項4記載の発明では、請求項1記載のオントロジー変換装置において、前記類似度算出手段によって求められた類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いる指標手段を具備することを特徴とする。
【0017】
また、請求項5記載の発明では、請求項1記載のオントロジー変換装置において、前記オントロジー変換手段は、前記対応決定手段により決定された対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする。
【0018】
また、上述した問題点を解決するために、請求項6記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換方法において、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、該取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、該算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、該対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換することを特徴とする。
【0019】
また、請求項7記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得し、該構成語の概念ベクトルの加重平均ベクトルを算出し、該加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とすることを特徴とする。
【0020】
また、請求項8記載の発明では、請求項6記載のオントロジー変換方法において、前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする。
【0021】
また、請求項9記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いることを特徴とする。
【0022】
また、請求項10記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする。
【0023】
また、上述した問題点を解決するために、請求項11記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換プログラムにおいて、前記変換元オントロジーと前記変換先オントロジーとを各ドメインから取得するステップと、前記取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出するステップと、前記算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定するステップと、前記決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するステップとをコンピュータに実行させることを特徴とする。
【0024】
また、請求項12記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得するステップと、前記取得された構成語の概念ベクトルの加重平均ベクトルを算出するステップと、前記算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とするステップとをコンピュータに実行させることを特徴とする。
【0025】
また、請求項13記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換するステップをコンピュータに実行させることを特徴とする。
【0026】
また、請求項14記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いるステップをコンピュータに実行させることを特徴とする。
【0027】
また、請求項15記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換するステップをコンピュータに実行させることを特徴とする。
【0028】
また、上述した問題点を解決するために、請求項16記載の発明では、請求項11〜15のいずれかに記載のオントロジー変換プログラムを記録したことを特徴とする。
【0029】
この発明では、オントロジー取得手段により、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、類似度算出手段により、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、対応決定手段により、類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、オントロジー変換手段により、決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換する。したがって、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことが可能となる。
【0030】
【発明の実施の形態】
以下、図面を用いて本発明の実施の形態を説明する。
【0031】
A.実施形態の構成
図1は、本発明の実施形態による、CBNにおいてオントロジー変換を実現するためのアーキテクチャを示す概念図である。図1において、端末1は、メッセージ送信者により用いられるものであり、データとそのメタ情報(メタデータ)とから構成されたメッセージ3をCBNに対して送信する。また、端末2は、メッセージ受信者により用いられるものであり、予め、自身が受信したいメッセージに関する条件を記述したフィルタ(filter)4をCBNに登録しておく。CBNは、メッセージ3のヘッダにおいて指定されたメタ情報と合致するフィルタを登録しているメッセージ受信者(端末2)に対して、メッセージを配送する役目を担う。
【0032】
次に、CBNは、図1に示すように、オントロジーの一意性が保証された空間として規定されたドメインD1,D2、および該ドメインD1,D2間でメッセージを転送するゲートウェイGWから構成されている。ここで、オントロジーとは、メタ情報とフィルタの構造(データモデル)や、用いる語彙を規定する仕様のことであり、CBNにおけるアドレス体系となる。すなわち、ドメインD1,D2内においては、オントロジーを共有することで、メタ情報とフィルタ間の照合の正当性を確保する。
【0033】
ゲートウェイGWは、メッセージ3を転送する際に、オントロジー変換を行うことによってドメインD1,D2間のメッセージ共有(流通)を実現する。具体的には、ゲートウェイGWは、メッセージ3内のメタ情報に関して、転送元ドメイン(例えば、ドメインD1)から転送先ドメイン(例えば、ドメインD2)ヘのオントロジー変換を行うためのオントロジー変換機能を有する。
【0034】
A−2.オントロジー変換方式
上述した構成において、複数のドメインが存在する場合、3つのオントロジー変換方式が考えられる。以下、それぞれのオントロジー変換方式について図2ないし図4を参照して説明した後に、それらのオントロジー変換方式の特性に関する比較検討を行う。
【0035】
図2ないし図4は、いずれもドメインD1、D2、D3がゲートウェイGW1、GW2を介して直列に連結された状況下で、ドメインD1において送出されたメッセージがドメインD2、そしてドメインD3に転送される様子を示す概念図である。図示するメッセージの括弧内の符号は、このメッセージがどのドメインのオントロジーに基づいて記述されたものであるのかを示している。なお、ここでは、直線のトポロジを用いて説明を行っているが、以下の説明は、他のトポロジにおいても同様に成立する。
【0036】
A−2−1.第1のオントロジー変換方式
第1のオントロジー変換方式は、メッセージを常に標準オントロジー(共有オントロジー)に変換してから転送する方式である。図2において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを標準オントロジーヘと変換し、メッセージのコピーを、ドメインD2をトンネリングしてゲートウェイGW2に引き渡すと共に、本メッセージをドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2は、ゲートウェイGW1から受け取ったメッセージをドメインD3のオントロジーヘと変換し、ドメインD3へ送出する。
【0037】
A−2−2.第2のオントロジー変換方式
次に、第2のオントロジー変換方式は、常にメッセージの送信元ドメインと送信先ドメイン間での1対1の変換を行う方式である。図3において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを受信し、メッセージのコピーを、ドメインD2をトンネリングしてゲートウェイGW2に引き渡すと共に、本メッセージをドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2は、ゲートウェイGW1から受け取ったメッセージをドメインD3のオントロジーヘと変換し、ドメインD3へ送出する。
【0038】
A−2−3.第3のオントロジー変換方式
次に、第3のオントロジー変換方式は、メッセージのトンネリングを行わず常に隣接するドメインのオントロジーヘと変換する方式である。図4において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを受信し、ドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2も同様にドメインD2内で送出されたメッセージを受信し、ドメインD3のオントロジーヘと変換してドメインD3へ送出する。
【0039】
A−3.変換方式の比較
上述した第1ないし第3のオントロジー変換方式に関して、3つの項目(A〜C)から比較を行ったものを図5に示す。ここで、(A)の「オントロジー対応情報」とは、ある特定の2つのドメイン間のオントロジー変換に必要な情報(変換表)であると定義する(具体的なデータ構造に関しては後述する)。
【0040】
第1のオントロジー変換方式は、(A)、(B)、(C)のどの項目に関しても問題が無く、一番処理効率が優れている。しかし、本第1のオントロジー変換方式は、標準オントロジーを確立しなければならないという問題点を有している。複数のオントロジーを統合するような標準オントロジーを作成することは困難であり、グローバルかつドメイン数が膨大である環境においては、標準オントロジーに関する合意を得ることは現実的には厳しい。
【0041】
次に、第2のオントロジー変換方式は、(B)、(C)の項目に関しては問題ないが、(A)の項目に問題がある。すなわち、ドメインの数が増加した場合、それに伴って各ゲートウェイが保持しなければならないオントロジー対応情報の数が比例的に増加する。よって、ドメインの数が膨大である場合には、本第2のオントロジー変換方式を用いることがやはり困難である。
【0042】
次に、第3のオントロジー変換方式は、(A)、(B)の項目に関しては問題ないが、(C)の項目に問題がある。つまり、メッセージが複数のドメインを跨って転送されていく際に、通過するドメイン(ゲートウェイ)の数に比例して、本メッセージに対して行われるオントロジー変換の回数が増加する。そのため、オントロジー変換の処理効率が悪いばかりか、オントロジー変換の際に発生した誤差が蓄積されてしまうという問題点を有している。
【0043】
以上の通り、第1ないし第3のオントロジー変換方式の各々には、メリットとデメリットが存在し、適用領域に応じて方式を選択する必要がある。なお、上記第1ないし第3のオントロジー変換方式は、併用することも可能であり、例えば、局所的なドメイン群における標準オントロジーを確立して第1のオントロジー変換方式を採用すると同時に、そのようなドメイン群間では第2のオントロジー変換方式を採用する形態も可能である。
【0044】
A−4.オントロジーモデル
CBNにおいて、採用するオントロジーモデルの決定は、その全体設計に対して多大な影響を及ぼす。CBNを利用するサービスアプリケーションの立場からは、より表現力(expressiveness)が高く柔軟性のあるオントロジーモデルが望ましい。しかし、例えばルーティングは、本質的に分散アルゴリズムであり、処理効率や実装の容易性の面からは、表現力が低くともシンプルなオントロジーモデルが望ましい。一般に処理効率やスケーラビリティとオントロジーモデルの表現力は、トレードオフの関係にあると言える。
【0045】
具体的なオントロジーモデルの例として、channel,subjectといった数値や文字列を基本とした比較的表現力の低いものから、フレーム形式のような構造化されたデータモデルを有するもの、オブジェクト指向モデルのような詳細な関係定義を可能としたもの、あるいは一階述語論理式を用いることによって公理定義を可能としたもの等が挙げられる。
【0046】
CBNの基本機能は、メッセージの配送先を動的に決定するという検索機能にあり、検索という利用側面からメタ情報が構造化されているメリットは大きい。一方で、前述したように、表現力に富んだオントロジーモデルは、どちらかと言えば集中サーバ向けであり、処理効率やスケーラビリティに問題がある。よって、CBNのオントロジーモデルとしては、構造化されつつも適度にシンプルなものが適していると考える。
【0047】
以上の考察に基づき、本実施形態では、図6に示すフレーム形式を用いたオントロジーモデルを採用する。すなわち、オントロジーは、フレームの集合から構成され、フレーム間は、継承関係を有している。フレームは、フレーム名、親フレーム名、フレームの説明文(annotation)、複数のスロット(属性名と属性値タイプのペア)から構成される。そして、フレームのインスタンスがメッセージのメタ情報となる。
【0048】
なお、オントロジーモデルがこのような階層構造を有していると、例えば階層的にマルチキャストパス(spanning−tree)を張るといったルーティング方式の実現も容易となる。
【0049】
A−5.オントロジー自動変換方法
さて、上述したオントロジーモデルに限定しても、なお概念化(conceptualization)の違いに基づく構造化の仕方や語彙の選択における差異が発生する。提案するオントロジー自動変換方法は、このような差異を解消することを目的とするものである。そして、本実施形態は、基本的にはゲートウェイにおいて利用されることを前提としている。すなわち、ゲートウェイにおいてメッセージ内のメタ情報のオントロジー変換を行うことによって、ドメインを跨っても正しいメッセージ配送が実現できることを目指すものである。なお、メッセージ内のデータに関しては、サービスアプリケーションが規定するもの(CBNの上位レイヤの問題)であり、オントロジー変換を適用しない。
【0050】
本実施形態によるオントロジー自動変換方法は、「ステップS1:オントロジーの取得」、「ステップS2:オントロジー対応情報の自動生成」、「ステップS3:メタ情報のオントロジー変換」という、大きく分けて3つのステップから構成される。つまり、まず、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、オントロジー対応情報を自動生成する。ここで、オントロジー対応情報とは、具体的には、各オントロジーを構成しているフレームおよびスロットに関する対応関係を記述した「フレーム対応」および「スロット対応」の集合のことである。そして、そのオントロジー対応情報を用いてメタ情報のオントロジー変換を実現する。
【0051】
本実施形態によるオントロジー自動変換方法の特徴として、一度、上記ステップS1と上記ステップS2を経ることによって、オントロジー対応情報を生成しておけば、そのオントロジー対応情報を用いて、ステップS3のみによって複数のメタ情報のオントロジー変換が実現できることが挙げられる。すなわち、ステップS1とステップS2に関しては、最初に一度実行しておけば、あとは変換元オントロジーあるいは変換先オントロジーに変更があった場合にのみ実行すれば良い。
【0052】
なお、本実施形態によるオントロジー自動変換方法は、前述した第1ないし第3のいずれのオントロジー変換方式に対しても適用することが可能である。
【0053】
以下、各ステップの詳細を説明する。
S1:オントロジーの取得
始めに変換元(source)オントロジーと、変換先(target)オントロジーとを各ドメインから取得する。オントロジーとは、具体的にはフレームの集合である。
【0054】
S2:オントロジー対応情報の自動生成
本ステップは、大きく分けて「ステップS2−1:スロットのマッピング」と「ステップS2−2:フレームのマッピング」とから構成される。
【0055】
S2−1:スロットのマッピング
スロットのマッピングは、変換元スロットと変換先スロット(スロット対)の類似度を定義することにより、トータルとしての類似度が最も高くなる組み合わせを求めるという「組み合わせ最適化問題」に帰着できるが、ここでは、より簡明なアルゴリズムを用いる。
【0056】
S2−1−1:スロット対類似度の定義
スロット対類似度を次式によって定義する。
【0057】
[数1]
「スロット対類似度」=min(「属性名の類似度」,「属性値タイプの類似度」)。
【0058】
まず、「属性名の類似度」に関しては、既存のシソーラスを用いて算出することも可能だが、本実施形態では、国語辞書と英和辞書とから構築した概念ベースを用いて算出する。概念ベースとは、国語辞典や新聞記事などのテキストデータを情報源とし、数万語規模の単語について、単語間の意味の関連性を考慮して数百から数千次元の多次元空間に配置したデータベースである。なお、概念ベースについては、笠原要、松澤光、石川勉、「国語辞書を利用した日常語の類似性判別」、情報処理学会論文誌、Vol.38 No.7、1997年に詳しい。すわなち、各属性名の概念ベクトルをVs,Vtとすると、
【0059】
[数2]
「属性名の類似度」=(Vs・Vt)/(|Vs||Vt|)
【0060】
となる。なお、属性名が複合語である場合には、まず、最長一致法、あるいは形態素解析プログラム等によって複合語をその構成語に分割する。そして、上記Vs(あるいはVt)の代わりとして、構成語の概念ベクトルの加重平均を用いる。「属性値タイプの類似度」に関しては、図7に示すような属性値タイプ(string,integer等)の階層関係に基づいたシソーラスツリーを構築しておき、次式によって算出する。
【0061】
[数3]
「属性値タイプの類似度」=2dc/(ds+dt)
【0062】
ここで、dsとdtは、各属性値タイプのツリーにおける深さであり、dcは共通上位ノードの深さである。
【0063】
S2−1−2:スロット対応の決定
次に、以下のアルゴリズム[1]〜[2]に従ってスロット対応を決定する。
【0064】
[1]スロット対の類似度行列Sを作成する。ここで、行列要素Sijは、i番目の変換元スロットslotiとj番目の変換先スロットslotjとの類似度を、数式1を用いて算出した値をとる。
【0065】
[2]スロット対応のペアが作れなくなるまで、以下を繰り返す。
【0066】
[2.1]Sijが最大値Smaxをとるときのiとjを求める。そして、
【0067】
[2.2]上記i行とj列を削除する。
【0068】
S2−2:フレームのマッピング
フレームのマッピングに関しても、基本的にスロットのマッピングと同様の方法を用いる。
【0069】
S2−2−1:フレーム対類似度の定義
フレーム対類似度を次式によって定義する。
【0070】
[数4]
「フレーム対類似度」=min(「フレーム名の類似度」,「説明文の類似度」,「スロット対集合の類似度」)
【0071】
ここで、「フレーム名の類似度」は、「属性名の類似度」と同様に概念ベースを用いて算出する。また、「説明文の類似度」に関しても、各説明文中の自立語に対応する概念ベクトルの加重平均を計算することにより、数式2を用いて算出する。そして、「スロット対集合の類似度」は、上記ステップS2−1において決定されたスロット対集合を用いて、次式によって算出する。
【0072】
[数5]
「スロット対集合の類似度」=Σスロット対類似度/スロットの数
【0073】
上記数式5は、対応するフレームは同様のスロットを保持しているという考えに基づいている。
【0074】
S2−2−2:フレーム対応の決定
フレーム対応の決定は、ステップ(2.1.2)のスロット対応の決定と同様である。すなわち数式4を用いてフレーム対の類似度行列Fを作成し、同様のアルゴリズムによってフレーム対応を決定する。
【0075】
S3:メタ情報のオントロジー変換
メタ情報のオントロジー変換は、ステップS2において算出されたオントロジー対応情報を用いて行う(図8参照)。
【0076】
すなわち、オントロジー対応情報に含まれているフレーム対応を参照することで、変換元メタ情報のフレームに対応する変換先フレームを用意し、さらにスロット対応を参照することで、対応する変換先スロットの属性値(スロット値)を設定する。なお、属性値に関しては、属性値タイプとして列挙(enumeration)型が指定されていた場合においてのみ、その変換を行う。また、ステップS2において算出された類似度をメッセージに付与しておくことで、本類似度をオントロジー変換の精度を示す指標として、例えば検索結果の順位付け等に活用することが可能である。
【0077】
なお、オントロジー対応情報を用いることによってメタ情報だけでなく、フィルタのオントロジー変換も同様に達成することが可能である(図9参照)。フィルタのオントロジー変換によって、例えば、メタ情報とフィルタの役割を反対にし、フィルタをメッセージ内のヘッダ部分に載せ、メッセージ受信端末は、メッセージの取得条件としてメタ情報をCBNに登録する実施形態も可能となる。
【0078】
A−6.実装
本実施形態によるシステムをLinux上でJava(登録商標)を用いて実装した。メタ情報の記述言語には、XMLを用い、フレームの記述言語には、RELAX−NGを用いた(フレーム記述の一例を図10に示す)。記述言語にXML技術を採用したのは、独自仕様を採用する場合に比べてユーザの習得負担の軽減化が期待でき、各種市販ツールの活用も可能となるためである。
【0079】
なお、上述した実施形態において、ゲートウェイGW,GW1,GW2の機能は、図示しない記憶部に記憶されたプログラムを実行することで実現するようになっている。記憶部は、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性メモリやRAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。また、上記記憶部とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含む。
【0080】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワークや電話回線等の通信回線のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、上述した処理の一部を実現するためのものであってもよい。さらに、上述した処理をゲートウェイGW,GW1,GW2に既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0081】
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成は、上記実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0082】
【発明の効果】
以上説明したように、本発明によれば、オントロジー取得手段により、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、類似度算出手段により、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、対応決定手段により、類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、オントロジー変換手段により、決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するようにしたので、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことができるという利点が得られる。
【図面の簡単な説明】
【図1】本発明の実施形態による、CBNにおいてオントロジー変換を実現するためのアーキテクチャを示す概念図である。
【図2】第1のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図3】第2のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図4】第3のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図5】第1ないし第3のオントロジー変換方式に関して、3つの項目(A〜C)による比較結果を示す図である。
【図6】本実施形態で採用した、フレーム形式を用いたオントロジーモデルを示す概念図である。
【図7】属性値タイプ(string,integer等)の階層関係に基づいて構築されたシソーラスツリーを示す概念図である。
【図8】メタ情報のオントロジー変換を説明するための概念図である。
【図9】フィルタのオントロジー変換を説明するための概念図である。
【図10】本実施形態によるフレーム記述の一例を示す概念図である。
【符号の説明】
1 端末
2 端末
3 メッセージ
D1、D2、D3 ドメイン
GW、GW1、GW2 ゲートウェイ(オントロジー取得手段、類似度算出手段、対応決定手段、オントロジー変換手段、構成語取得手段、加重平均ベクトル算出手段、内積算出手段、第1の変換手段、第2の変換手段、第3の変換手段、指標手段)
【発明の属する技術分野】
本発明は、オントロジー、情報統合、Content−based network(以下、CBNと略す)、異種分散データベース、XML、分散処理、エージェントなどの技術に係り、特に、異なるオントロジーを有するエンドユーザ間でのメッセージ配送を実現するためのオントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体に関する。
【0002】
【従来の技術】
近年、Gnutella,JXTA等のP2Pネットワークが着目を浴びているが、それらの特徴の1つとして、それがアプリケーション層(overlay)のネットワークであることが挙げられる。この特徴によって、下位層であるIPの束縛から解放され、自由で柔軟な名前空間やネットワーク構成を実現可能としている。
【0003】
このようなアプリケーション層のネットワークの一形態として「Content−based network」が提案されている(例えば、非特許文献1、非特許文献2参照)。CBNとは、メッセージ内に記述されたメタ情報に基づいた内容指向の配送(routing)を行うネットワークのことである。従来型ネットワークにおいては、各ノードに対して一意にIP等のネットワークアドレスが付与され、メッセージは、そのヘッダにおいて指定されたネットワークアドレスを持つノードに対して配送される。これに対してCBNでは、各ノードは、自身が受信したいメッセージに関する条件を記述したフィルタをCBNに登録し、メッセージは、そのヘッダに記述されたメタ情報と合致するフィルタを登録しているノードに対して配送される。
【0004】
ところで、上述したCBNでは、広域(global)な環境に適用できることを主目標の1つに掲げており、その実現に際しては2つの大きな課題がある。1つ目は、ルーティングである。広域環境においてスケーラブルなメッセージ配送を実現できるルーティングアルゴリズムの考案が課題となる。そして、2つ目がオントロジーである。ここで、オントロジーとは、メタ情報とフィルタの構造(データモデル)や、用いる語彙を規定する仕様のことであり、CBNにおけるアドレス体系となる。CBNでは、まさにその内容指向な特性によって「内容の理論(Content−based AI)」であるとされるオントロジー工学の手法が活用できる(例えば、非特許文献3参照)。
【0005】
ところで、上述したCBNにおける具体的なオントロジーの課題として、特に広域環境を想定した場合、異なるオントロジーを有するエンドユーザ間でのメッセージ配送を実現するために、メッセージのオントロジー変換を実現する必要がある。なぜなら、従来型ネットワークにおいては、階層的で一意な標準アドレス体系をグローバルに規定することができたが、オントロジーに関してグローバルな標準体系を確立することは現実的でないためである。
【0006】
そこで、フレーム形式において同じ属性を表現しているスロットを自動的に対応付ける事例ベースのフレームマッピング方法として、EBFM(事例に基づくフレームマッピング)が知られている(例えば、非特許文献4参照)。
【0007】
また、文書とデータの混在を許す柔軟性に富むデータモデルであるXMLにおける、ボキャブラリ(スキーマ)変換技術も知られている(例えば、非特許文献5参照)。
【0008】
【非特許文献1】
星合隆成、小柳恵一、ビルゲスクバタール、久保田稔、柴田弘、酒井隆道、「意味情報ネットワークアーキテクチャ」、電子情報通信学会論文誌 BVol.J84−B No.3、2001年、pp.411−424
【非特許文献2】
カーザニガ・A(Carzaniga, A.)、ロセンブルム・D・S(Rosenblum, D.S.)、ウルフ・A・L(Wolf, A.L.)、「広域イベント通知サービスの設計と評価、コンピュータシステムのACMトランザクション(Design and Evaluation of a Wide−Area Event Notification Service, ACM Transactions on Computer Systems 19(3):)」、2001、332−383
【非特許文献3】
溝口理一郎、「オントロジー研究の基礎と応用」、人工知能学会誌 Vol.14 No.6、1999年
【非特許文献4】
伊藤史朗、上田隆也、池田裕治、「分散情報源に対する情報エージェントのための事例に基づくフレームマッピング」、電子情報通信学会論文誌 D−1 Vol.J81−D−I No.5、1998年、pp.433−442
【非特許文献5】
TIBCO XML Transform、インターネット<URL:http://www.tibco.com/solutions/products/extensibility/xmLtransform.jsp>
【0009】
【発明が解決しようとする課題】
【0010】
しかしながら、上述したEBFMでは、異なる情報源において共通の対象を表現した事例を同定し、スロット値の類似をもとにマッピングを行うものであり、複数のインスタンス事例および、共通の対象を表現した事例を必要とするという課題を有している。
【0011】
また、XMLのボキャブラリ(スキーマ)変換技術は、汎用的にさまざまな適用領域(例えば、商取引のトランザクション等)における変換を自動化することは容易でないため、これらの技術は人間による変換作業のサポートに主眼を置いている。ゆえに、人手を介することなくオントロジー変換を実現する問題に対しては、そのまま適用することはできないという課題を有している。
【0012】
この発明は上述した事情に鑑みてなされたもので、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことができるオントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体を提供することを目的とする。
【0013】
【課題を解決するための手段】
上述した問題点を解決するために、請求項1記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換装置において、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースと、変換元オントロジーと変換先オントロジーとを各ドメインから取得するオントロジー取得手段と、前記オントロジー取得手段により取得した、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、前記概念データベースを用いて算出する類似度算出手段と、前記類似度算出手段により算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定する対応決定手段と、前記対応決定手段により決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するオントロジー変換手段とを具備することを特徴とする。
【0014】
また、請求項2記載の発明では、請求項1記載のオントロジー変換装置において、前記類似度算出手段は、変換元オントロジーのスロットおよび変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得する構成語取得手段と、前記構成語取得手段により取得された構成語の概念ベクトルの加重平均ベクトルを算出する加重平均ベクトル算出手段と、前記加重平均ベクトル算出手段により算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とする内積算出手段とを具備することを特徴とする。
【0015】
また、請求項3記載の発明では、請求項1記載のオントロジー変換装置において、前記オントロジー変換手段は、メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換手段と、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換手段と、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換手段とを具備し、前記第1ないし第3の変換手段のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする。
【0016】
また、請求項4記載の発明では、請求項1記載のオントロジー変換装置において、前記類似度算出手段によって求められた類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いる指標手段を具備することを特徴とする。
【0017】
また、請求項5記載の発明では、請求項1記載のオントロジー変換装置において、前記オントロジー変換手段は、前記対応決定手段により決定された対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする。
【0018】
また、上述した問題点を解決するために、請求項6記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換方法において、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、該取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、該算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、該対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換することを特徴とする。
【0019】
また、請求項7記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得し、該構成語の概念ベクトルの加重平均ベクトルを算出し、該加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とすることを特徴とする。
【0020】
また、請求項8記載の発明では、請求項6記載のオントロジー変換方法において、前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする。
【0021】
また、請求項9記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いることを特徴とする。
【0022】
また、請求項10記載の発明では、請求項6記載のオントロジー変換方法において、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする。
【0023】
また、上述した問題点を解決するために、請求項11記載の発明では、複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換プログラムにおいて、前記変換元オントロジーと前記変換先オントロジーとを各ドメインから取得するステップと、前記取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出するステップと、前記算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定するステップと、前記決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するステップとをコンピュータに実行させることを特徴とする。
【0024】
また、請求項12記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得するステップと、前記取得された構成語の概念ベクトルの加重平均ベクトルを算出するステップと、前記算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とするステップとをコンピュータに実行させることを特徴とする。
【0025】
また、請求項13記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換するステップをコンピュータに実行させることを特徴とする。
【0026】
また、請求項14記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いるステップをコンピュータに実行させることを特徴とする。
【0027】
また、請求項15記載の発明では、請求項11記載のオントロジー変換プログラムにおいて、前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換するステップをコンピュータに実行させることを特徴とする。
【0028】
また、上述した問題点を解決するために、請求項16記載の発明では、請求項11〜15のいずれかに記載のオントロジー変換プログラムを記録したことを特徴とする。
【0029】
この発明では、オントロジー取得手段により、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、類似度算出手段により、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、対応決定手段により、類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、オントロジー変換手段により、決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換する。したがって、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことが可能となる。
【0030】
【発明の実施の形態】
以下、図面を用いて本発明の実施の形態を説明する。
【0031】
A.実施形態の構成
図1は、本発明の実施形態による、CBNにおいてオントロジー変換を実現するためのアーキテクチャを示す概念図である。図1において、端末1は、メッセージ送信者により用いられるものであり、データとそのメタ情報(メタデータ)とから構成されたメッセージ3をCBNに対して送信する。また、端末2は、メッセージ受信者により用いられるものであり、予め、自身が受信したいメッセージに関する条件を記述したフィルタ(filter)4をCBNに登録しておく。CBNは、メッセージ3のヘッダにおいて指定されたメタ情報と合致するフィルタを登録しているメッセージ受信者(端末2)に対して、メッセージを配送する役目を担う。
【0032】
次に、CBNは、図1に示すように、オントロジーの一意性が保証された空間として規定されたドメインD1,D2、および該ドメインD1,D2間でメッセージを転送するゲートウェイGWから構成されている。ここで、オントロジーとは、メタ情報とフィルタの構造(データモデル)や、用いる語彙を規定する仕様のことであり、CBNにおけるアドレス体系となる。すなわち、ドメインD1,D2内においては、オントロジーを共有することで、メタ情報とフィルタ間の照合の正当性を確保する。
【0033】
ゲートウェイGWは、メッセージ3を転送する際に、オントロジー変換を行うことによってドメインD1,D2間のメッセージ共有(流通)を実現する。具体的には、ゲートウェイGWは、メッセージ3内のメタ情報に関して、転送元ドメイン(例えば、ドメインD1)から転送先ドメイン(例えば、ドメインD2)ヘのオントロジー変換を行うためのオントロジー変換機能を有する。
【0034】
A−2.オントロジー変換方式
上述した構成において、複数のドメインが存在する場合、3つのオントロジー変換方式が考えられる。以下、それぞれのオントロジー変換方式について図2ないし図4を参照して説明した後に、それらのオントロジー変換方式の特性に関する比較検討を行う。
【0035】
図2ないし図4は、いずれもドメインD1、D2、D3がゲートウェイGW1、GW2を介して直列に連結された状況下で、ドメインD1において送出されたメッセージがドメインD2、そしてドメインD3に転送される様子を示す概念図である。図示するメッセージの括弧内の符号は、このメッセージがどのドメインのオントロジーに基づいて記述されたものであるのかを示している。なお、ここでは、直線のトポロジを用いて説明を行っているが、以下の説明は、他のトポロジにおいても同様に成立する。
【0036】
A−2−1.第1のオントロジー変換方式
第1のオントロジー変換方式は、メッセージを常に標準オントロジー(共有オントロジー)に変換してから転送する方式である。図2において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを標準オントロジーヘと変換し、メッセージのコピーを、ドメインD2をトンネリングしてゲートウェイGW2に引き渡すと共に、本メッセージをドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2は、ゲートウェイGW1から受け取ったメッセージをドメインD3のオントロジーヘと変換し、ドメインD3へ送出する。
【0037】
A−2−2.第2のオントロジー変換方式
次に、第2のオントロジー変換方式は、常にメッセージの送信元ドメインと送信先ドメイン間での1対1の変換を行う方式である。図3において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを受信し、メッセージのコピーを、ドメインD2をトンネリングしてゲートウェイGW2に引き渡すと共に、本メッセージをドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2は、ゲートウェイGW1から受け取ったメッセージをドメインD3のオントロジーヘと変換し、ドメインD3へ送出する。
【0038】
A−2−3.第3のオントロジー変換方式
次に、第3のオントロジー変換方式は、メッセージのトンネリングを行わず常に隣接するドメインのオントロジーヘと変換する方式である。図4において、ゲートウェイGW1は、ドメインD1内で送出されたメッセージを受信し、ドメインD2のオントロジーヘと変換してドメインD2へ送出する。ゲートウェイGW2も同様にドメインD2内で送出されたメッセージを受信し、ドメインD3のオントロジーヘと変換してドメインD3へ送出する。
【0039】
A−3.変換方式の比較
上述した第1ないし第3のオントロジー変換方式に関して、3つの項目(A〜C)から比較を行ったものを図5に示す。ここで、(A)の「オントロジー対応情報」とは、ある特定の2つのドメイン間のオントロジー変換に必要な情報(変換表)であると定義する(具体的なデータ構造に関しては後述する)。
【0040】
第1のオントロジー変換方式は、(A)、(B)、(C)のどの項目に関しても問題が無く、一番処理効率が優れている。しかし、本第1のオントロジー変換方式は、標準オントロジーを確立しなければならないという問題点を有している。複数のオントロジーを統合するような標準オントロジーを作成することは困難であり、グローバルかつドメイン数が膨大である環境においては、標準オントロジーに関する合意を得ることは現実的には厳しい。
【0041】
次に、第2のオントロジー変換方式は、(B)、(C)の項目に関しては問題ないが、(A)の項目に問題がある。すなわち、ドメインの数が増加した場合、それに伴って各ゲートウェイが保持しなければならないオントロジー対応情報の数が比例的に増加する。よって、ドメインの数が膨大である場合には、本第2のオントロジー変換方式を用いることがやはり困難である。
【0042】
次に、第3のオントロジー変換方式は、(A)、(B)の項目に関しては問題ないが、(C)の項目に問題がある。つまり、メッセージが複数のドメインを跨って転送されていく際に、通過するドメイン(ゲートウェイ)の数に比例して、本メッセージに対して行われるオントロジー変換の回数が増加する。そのため、オントロジー変換の処理効率が悪いばかりか、オントロジー変換の際に発生した誤差が蓄積されてしまうという問題点を有している。
【0043】
以上の通り、第1ないし第3のオントロジー変換方式の各々には、メリットとデメリットが存在し、適用領域に応じて方式を選択する必要がある。なお、上記第1ないし第3のオントロジー変換方式は、併用することも可能であり、例えば、局所的なドメイン群における標準オントロジーを確立して第1のオントロジー変換方式を採用すると同時に、そのようなドメイン群間では第2のオントロジー変換方式を採用する形態も可能である。
【0044】
A−4.オントロジーモデル
CBNにおいて、採用するオントロジーモデルの決定は、その全体設計に対して多大な影響を及ぼす。CBNを利用するサービスアプリケーションの立場からは、より表現力(expressiveness)が高く柔軟性のあるオントロジーモデルが望ましい。しかし、例えばルーティングは、本質的に分散アルゴリズムであり、処理効率や実装の容易性の面からは、表現力が低くともシンプルなオントロジーモデルが望ましい。一般に処理効率やスケーラビリティとオントロジーモデルの表現力は、トレードオフの関係にあると言える。
【0045】
具体的なオントロジーモデルの例として、channel,subjectといった数値や文字列を基本とした比較的表現力の低いものから、フレーム形式のような構造化されたデータモデルを有するもの、オブジェクト指向モデルのような詳細な関係定義を可能としたもの、あるいは一階述語論理式を用いることによって公理定義を可能としたもの等が挙げられる。
【0046】
CBNの基本機能は、メッセージの配送先を動的に決定するという検索機能にあり、検索という利用側面からメタ情報が構造化されているメリットは大きい。一方で、前述したように、表現力に富んだオントロジーモデルは、どちらかと言えば集中サーバ向けであり、処理効率やスケーラビリティに問題がある。よって、CBNのオントロジーモデルとしては、構造化されつつも適度にシンプルなものが適していると考える。
【0047】
以上の考察に基づき、本実施形態では、図6に示すフレーム形式を用いたオントロジーモデルを採用する。すなわち、オントロジーは、フレームの集合から構成され、フレーム間は、継承関係を有している。フレームは、フレーム名、親フレーム名、フレームの説明文(annotation)、複数のスロット(属性名と属性値タイプのペア)から構成される。そして、フレームのインスタンスがメッセージのメタ情報となる。
【0048】
なお、オントロジーモデルがこのような階層構造を有していると、例えば階層的にマルチキャストパス(spanning−tree)を張るといったルーティング方式の実現も容易となる。
【0049】
A−5.オントロジー自動変換方法
さて、上述したオントロジーモデルに限定しても、なお概念化(conceptualization)の違いに基づく構造化の仕方や語彙の選択における差異が発生する。提案するオントロジー自動変換方法は、このような差異を解消することを目的とするものである。そして、本実施形態は、基本的にはゲートウェイにおいて利用されることを前提としている。すなわち、ゲートウェイにおいてメッセージ内のメタ情報のオントロジー変換を行うことによって、ドメインを跨っても正しいメッセージ配送が実現できることを目指すものである。なお、メッセージ内のデータに関しては、サービスアプリケーションが規定するもの(CBNの上位レイヤの問題)であり、オントロジー変換を適用しない。
【0050】
本実施形態によるオントロジー自動変換方法は、「ステップS1:オントロジーの取得」、「ステップS2:オントロジー対応情報の自動生成」、「ステップS3:メタ情報のオントロジー変換」という、大きく分けて3つのステップから構成される。つまり、まず、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、オントロジー対応情報を自動生成する。ここで、オントロジー対応情報とは、具体的には、各オントロジーを構成しているフレームおよびスロットに関する対応関係を記述した「フレーム対応」および「スロット対応」の集合のことである。そして、そのオントロジー対応情報を用いてメタ情報のオントロジー変換を実現する。
【0051】
本実施形態によるオントロジー自動変換方法の特徴として、一度、上記ステップS1と上記ステップS2を経ることによって、オントロジー対応情報を生成しておけば、そのオントロジー対応情報を用いて、ステップS3のみによって複数のメタ情報のオントロジー変換が実現できることが挙げられる。すなわち、ステップS1とステップS2に関しては、最初に一度実行しておけば、あとは変換元オントロジーあるいは変換先オントロジーに変更があった場合にのみ実行すれば良い。
【0052】
なお、本実施形態によるオントロジー自動変換方法は、前述した第1ないし第3のいずれのオントロジー変換方式に対しても適用することが可能である。
【0053】
以下、各ステップの詳細を説明する。
S1:オントロジーの取得
始めに変換元(source)オントロジーと、変換先(target)オントロジーとを各ドメインから取得する。オントロジーとは、具体的にはフレームの集合である。
【0054】
S2:オントロジー対応情報の自動生成
本ステップは、大きく分けて「ステップS2−1:スロットのマッピング」と「ステップS2−2:フレームのマッピング」とから構成される。
【0055】
S2−1:スロットのマッピング
スロットのマッピングは、変換元スロットと変換先スロット(スロット対)の類似度を定義することにより、トータルとしての類似度が最も高くなる組み合わせを求めるという「組み合わせ最適化問題」に帰着できるが、ここでは、より簡明なアルゴリズムを用いる。
【0056】
S2−1−1:スロット対類似度の定義
スロット対類似度を次式によって定義する。
【0057】
[数1]
「スロット対類似度」=min(「属性名の類似度」,「属性値タイプの類似度」)。
【0058】
まず、「属性名の類似度」に関しては、既存のシソーラスを用いて算出することも可能だが、本実施形態では、国語辞書と英和辞書とから構築した概念ベースを用いて算出する。概念ベースとは、国語辞典や新聞記事などのテキストデータを情報源とし、数万語規模の単語について、単語間の意味の関連性を考慮して数百から数千次元の多次元空間に配置したデータベースである。なお、概念ベースについては、笠原要、松澤光、石川勉、「国語辞書を利用した日常語の類似性判別」、情報処理学会論文誌、Vol.38 No.7、1997年に詳しい。すわなち、各属性名の概念ベクトルをVs,Vtとすると、
【0059】
[数2]
「属性名の類似度」=(Vs・Vt)/(|Vs||Vt|)
【0060】
となる。なお、属性名が複合語である場合には、まず、最長一致法、あるいは形態素解析プログラム等によって複合語をその構成語に分割する。そして、上記Vs(あるいはVt)の代わりとして、構成語の概念ベクトルの加重平均を用いる。「属性値タイプの類似度」に関しては、図7に示すような属性値タイプ(string,integer等)の階層関係に基づいたシソーラスツリーを構築しておき、次式によって算出する。
【0061】
[数3]
「属性値タイプの類似度」=2dc/(ds+dt)
【0062】
ここで、dsとdtは、各属性値タイプのツリーにおける深さであり、dcは共通上位ノードの深さである。
【0063】
S2−1−2:スロット対応の決定
次に、以下のアルゴリズム[1]〜[2]に従ってスロット対応を決定する。
【0064】
[1]スロット対の類似度行列Sを作成する。ここで、行列要素Sijは、i番目の変換元スロットslotiとj番目の変換先スロットslotjとの類似度を、数式1を用いて算出した値をとる。
【0065】
[2]スロット対応のペアが作れなくなるまで、以下を繰り返す。
【0066】
[2.1]Sijが最大値Smaxをとるときのiとjを求める。そして、
【0067】
[2.2]上記i行とj列を削除する。
【0068】
S2−2:フレームのマッピング
フレームのマッピングに関しても、基本的にスロットのマッピングと同様の方法を用いる。
【0069】
S2−2−1:フレーム対類似度の定義
フレーム対類似度を次式によって定義する。
【0070】
[数4]
「フレーム対類似度」=min(「フレーム名の類似度」,「説明文の類似度」,「スロット対集合の類似度」)
【0071】
ここで、「フレーム名の類似度」は、「属性名の類似度」と同様に概念ベースを用いて算出する。また、「説明文の類似度」に関しても、各説明文中の自立語に対応する概念ベクトルの加重平均を計算することにより、数式2を用いて算出する。そして、「スロット対集合の類似度」は、上記ステップS2−1において決定されたスロット対集合を用いて、次式によって算出する。
【0072】
[数5]
「スロット対集合の類似度」=Σスロット対類似度/スロットの数
【0073】
上記数式5は、対応するフレームは同様のスロットを保持しているという考えに基づいている。
【0074】
S2−2−2:フレーム対応の決定
フレーム対応の決定は、ステップ(2.1.2)のスロット対応の決定と同様である。すなわち数式4を用いてフレーム対の類似度行列Fを作成し、同様のアルゴリズムによってフレーム対応を決定する。
【0075】
S3:メタ情報のオントロジー変換
メタ情報のオントロジー変換は、ステップS2において算出されたオントロジー対応情報を用いて行う(図8参照)。
【0076】
すなわち、オントロジー対応情報に含まれているフレーム対応を参照することで、変換元メタ情報のフレームに対応する変換先フレームを用意し、さらにスロット対応を参照することで、対応する変換先スロットの属性値(スロット値)を設定する。なお、属性値に関しては、属性値タイプとして列挙(enumeration)型が指定されていた場合においてのみ、その変換を行う。また、ステップS2において算出された類似度をメッセージに付与しておくことで、本類似度をオントロジー変換の精度を示す指標として、例えば検索結果の順位付け等に活用することが可能である。
【0077】
なお、オントロジー対応情報を用いることによってメタ情報だけでなく、フィルタのオントロジー変換も同様に達成することが可能である(図9参照)。フィルタのオントロジー変換によって、例えば、メタ情報とフィルタの役割を反対にし、フィルタをメッセージ内のヘッダ部分に載せ、メッセージ受信端末は、メッセージの取得条件としてメタ情報をCBNに登録する実施形態も可能となる。
【0078】
A−6.実装
本実施形態によるシステムをLinux上でJava(登録商標)を用いて実装した。メタ情報の記述言語には、XMLを用い、フレームの記述言語には、RELAX−NGを用いた(フレーム記述の一例を図10に示す)。記述言語にXML技術を採用したのは、独自仕様を採用する場合に比べてユーザの習得負担の軽減化が期待でき、各種市販ツールの活用も可能となるためである。
【0079】
なお、上述した実施形態において、ゲートウェイGW,GW1,GW2の機能は、図示しない記憶部に記憶されたプログラムを実行することで実現するようになっている。記憶部は、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性メモリやRAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。また、上記記憶部とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含む。
【0080】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワークや電話回線等の通信回線のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、上述した処理の一部を実現するためのものであってもよい。さらに、上述した処理をゲートウェイGW,GW1,GW2に既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0081】
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成は、上記実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0082】
【発明の効果】
以上説明したように、本発明によれば、オントロジー取得手段により、変換元オントロジーと変換先オントロジーとを各ドメインから取得し、類似度算出手段により、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、対応決定手段により、類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、オントロジー変換手段により、決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するようにしたので、自動的に異なるオントロジー同士の対応関係を求め、オントロジー変換を行うことができるという利点が得られる。
【図面の簡単な説明】
【図1】本発明の実施形態による、CBNにおいてオントロジー変換を実現するためのアーキテクチャを示す概念図である。
【図2】第1のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図3】第2のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図4】第3のオントロジー変換において、複数のドメインがゲートウェイを介して直列に連結された状況下で、メッセージが順次ドメインを転送される様子を示す概念図である。
【図5】第1ないし第3のオントロジー変換方式に関して、3つの項目(A〜C)による比較結果を示す図である。
【図6】本実施形態で採用した、フレーム形式を用いたオントロジーモデルを示す概念図である。
【図7】属性値タイプ(string,integer等)の階層関係に基づいて構築されたシソーラスツリーを示す概念図である。
【図8】メタ情報のオントロジー変換を説明するための概念図である。
【図9】フィルタのオントロジー変換を説明するための概念図である。
【図10】本実施形態によるフレーム記述の一例を示す概念図である。
【符号の説明】
1 端末
2 端末
3 メッセージ
D1、D2、D3 ドメイン
GW、GW1、GW2 ゲートウェイ(オントロジー取得手段、類似度算出手段、対応決定手段、オントロジー変換手段、構成語取得手段、加重平均ベクトル算出手段、内積算出手段、第1の変換手段、第2の変換手段、第3の変換手段、指標手段)
Claims (16)
- 複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換装置において、
単語間の意味の関連性を考慮して多次元空間に配置した概念データベースと、
変換元オントロジーと変換先オントロジーとを各ドメインから取得するオントロジー取得手段と、
前記オントロジー取得手段により取得した、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、前記概念データベースを用いて算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定する対応決定手段と、
前記対応決定手段により決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するオントロジー変換手段と
を具備することを特徴とするオントロジー変換装置。 - 前記類似度算出手段は、
変換元オントロジーのスロットおよび変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得する構成語取得手段と、
前記構成語取得手段により取得された構成語の概念ベクトルの加重平均ベクトルを算出する加重平均ベクトル算出手段と、
前記加重平均ベクトル算出手段により算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とする内積算出手段と
を具備することを特徴とする請求項1記載のオントロジー変換装置。 - 前記オントロジー変換手段は、
メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換手段と、
送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換手段と、
変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換手段とを具備し、
前記第1ないし第3の変換手段のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする請求項1記載のオントロジー変換装置。 - 前記類似度算出手段によって求められた類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いる指標手段を具備することを特徴とする請求項1記載のオントロジー変換装置。
- 前記オントロジー変換手段は、
前記対応決定手段により決定された対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする請求項1記載のオントロジー変換装置。 - 複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換方法において、
変換元オントロジーと変換先オントロジーとを各ドメインから取得し、該取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出し、該算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定し、該対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換することを特徴とするオントロジー変換方法。 - 前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得し、該構成語の概念ベクトルの加重平均ベクトルを算出し、該加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とすることを特徴とする請求項6記載のオントロジー変換方法。
- 前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換することを特徴とする請求項6記載のオントロジー変換方法。
- 前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いることを特徴とする請求項6記載のオントロジー変換方法。
- 前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換することを特徴とする請求項6記載のオントロジー変換方法。
- 複数のスロットを有するフレームの集合から構成された、異なるオントロジーを有するドメイン間でメッセージを転送する際に、メッセージ内のメタ情報をオントロジー変換するオントロジー変換プログラムにおいて、
前記変換元オントロジーと前記変換先オントロジーとを各ドメインから取得するステップと、
前記取得した変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの類似度を、単語間の意味の関連性を考慮して多次元空間に配置した概念データベースを用いて算出するステップと、
前記算出された類似度に基づいて、変換元オントロジーのスロットおよびフレームと変換先オントロジーのスロットおよびフレームとの対応関係を決定するステップと、
前記決定された対応関係に基づいて、前記メッセージ内のメタ情報をオントロジー変換するステップと
をコンピュータに実行させることを特徴とするオントロジー変換プログラム。 - 前記変換元オントロジーのスロットおよび前記変換先オントロジーのスロットの属性名が複合語であった場合、複合語間の類似度を算出する際に、最長一致法あるいは形態素解析法によって、複合語の構成語を取得するステップと、
前記取得された構成語の概念ベクトルの加重平均ベクトルを算出するステップと、
前記算出された加重平均ベクトル間の内積を算出することによって、前記複合語間の類似度とするステップと
をコンピュータに実行させることを特徴とする請求項11記載のオントロジー変換プログラム。 - 前記メッセージを各ドメインで共通な標準オントロジーから変換先オントロジーに変換する第1の変換方式、送信元ドメインからのメッセージを、変換先オントロジーに変換する第2の変換方式、変換元オントロジーのメッセージを、変換先オントロジーに変換する第3の変換方式のいずれか1つ、あるいは併用して前記メッセージをオントロジー変換するステップをコンピュータに実行させることを特徴とする請求項11記載のオントロジー変換プログラム。
- 前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの類似度を、オントロジー変換の精度、あるいはメタ情報と受信メッセージの条件が記述されたフィルタ情報との間の照合度合いを示す指標として用いるステップをコンピュータに実行させることを特徴とする請求項11記載のオントロジー変換プログラム。
- 前記変換元オントロジーのスロットおよびフレームと前記変換先オントロジーのスロットおよびフレームとの対応関係に基づいて、メタ情報との照合条件が記述されたフィルタ情報で指定されているフレーム名およびスロット名を置き換えることによって、前記フィルタ情報をオントロジー変換するステップをコンピュータに実行させることを特徴とする請求項11記載のオントロジー変換プログラム。
- 請求項11〜15のいずれかに記載のオントロジー変換プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002265426A JP2004102790A (ja) | 2002-09-11 | 2002-09-11 | オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002265426A JP2004102790A (ja) | 2002-09-11 | 2002-09-11 | オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004102790A true JP2004102790A (ja) | 2004-04-02 |
Family
ID=32264572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002265426A Pending JP2004102790A (ja) | 2002-09-11 | 2002-09-11 | オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004102790A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100644317B1 (ko) | 2005-08-25 | 2006-11-10 | 한국과학기술정보연구원 | 온톨로지 기반의 정보 유통 시스템 및 그 방법 |
WO2008026794A1 (en) * | 2006-08-28 | 2008-03-06 | Korea Institute Of Science & Technology Information | System for providing service of knowledge extension and inference based on dbms, and method for the same |
JP2009087339A (ja) * | 2007-09-27 | 2009-04-23 | Nec (China) Co Ltd | オントロジーデータのインポート/エクスポートのための方法および装置 |
WO2015104873A1 (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置、情報処理プログラム、記憶媒体及び情報処理方法 |
JP2017527016A (ja) * | 2014-07-18 | 2017-09-14 | コンヴィーダ ワイヤレス, エルエルシー | M2mオントロジ管理および意味論的相互運用性 |
CN112541056A (zh) * | 2020-12-18 | 2021-03-23 | 卫宁健康科技集团股份有限公司 | 医学术语标准化方法、装置、电子设备及存储介质 |
JP2021111382A (ja) * | 2019-12-30 | 2021-08-02 | エヌイーシー ラボラトリーズ ヨーロッパ ゲーエムベーハー | 弱教師に基づくオントロジーマッチング |
CN112541056B (zh) * | 2020-12-18 | 2024-05-31 | 卫宁健康科技集团股份有限公司 | 医学术语标准化方法、装置、电子设备及存储介质 |
-
2002
- 2002-09-11 JP JP2002265426A patent/JP2004102790A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100644317B1 (ko) | 2005-08-25 | 2006-11-10 | 한국과학기술정보연구원 | 온톨로지 기반의 정보 유통 시스템 및 그 방법 |
WO2008026794A1 (en) * | 2006-08-28 | 2008-03-06 | Korea Institute Of Science & Technology Information | System for providing service of knowledge extension and inference based on dbms, and method for the same |
US8037008B2 (en) | 2006-08-28 | 2011-10-11 | Korea Institute Of Science & Technology Information | DBMS-based knowledge extension and inference service method recorded on computer-readable medium |
JP2009087339A (ja) * | 2007-09-27 | 2009-04-23 | Nec (China) Co Ltd | オントロジーデータのインポート/エクスポートのための方法および装置 |
WO2015104873A1 (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置、情報処理プログラム、記憶媒体及び情報処理方法 |
JP2015130021A (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10380080B2 (en) | 2014-01-07 | 2019-08-13 | Fuji Xerox Co., Ltd. | Information processing apparatus, storage medium, and information processing method |
JP2017527016A (ja) * | 2014-07-18 | 2017-09-14 | コンヴィーダ ワイヤレス, エルエルシー | M2mオントロジ管理および意味論的相互運用性 |
JP2021111382A (ja) * | 2019-12-30 | 2021-08-02 | エヌイーシー ラボラトリーズ ヨーロッパ ゲーエムベーハー | 弱教師に基づくオントロジーマッチング |
JP7060668B2 (ja) | 2019-12-30 | 2022-04-26 | エヌイーシー ラボラトリーズ ヨーロッパ ゲーエムベーハー | 弱教師に基づくオントロジーマッチング |
CN112541056A (zh) * | 2020-12-18 | 2021-03-23 | 卫宁健康科技集团股份有限公司 | 医学术语标准化方法、装置、电子设备及存储介质 |
CN112541056B (zh) * | 2020-12-18 | 2024-05-31 | 卫宁健康科技集团股份有限公司 | 医学术语标准化方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Haase et al. | Bibster–a semantics-based bibliographic peer-to-peer system | |
Löser et al. | Semantic overlay clusters within super-peer networks | |
Nejdl et al. | Super-peer-based routing and clustering strategies for RDF-based peer-to-peer networks | |
US10452714B2 (en) | Central asset registry system and method | |
Löser et al. | Information integration in schema-based peer-to-peer networks | |
US20150039629A1 (en) | Method for storing and searching tagged content items in a distributed system | |
Ehrig et al. | The SWAP data and metadata model for semantics-based peer-to-peer systems | |
Vaculín et al. | Modeling and discovery of data providing services | |
Niinimäki et al. | An ETL process for OLAP using RDF/OWL ontologies | |
US11868445B2 (en) | Systems and methods for federated searches of assets in disparate dam repositories | |
JP2004102790A (ja) | オントロジー変換装置、オントロジー変換方法、オントロジー変換プログラムおよび記録媒体 | |
Benhssayen et al. | Semantic interoperability framework for IAAS resources in multi-cloud environment | |
Barrero et al. | Adapting searchy to extract data using evolved wrappers | |
Yu et al. | Decentralized web service organization combining semantic web and peer to peer computing | |
Al King et al. | Ontology-based data source localization in a structured peer-to-peer environment | |
Sangpachatanaruk et al. | Semantic driven hashing (sdh): an ontology-based search scheme for the semantic aware network (sa net) | |
EP3991059A1 (en) | Systems and methods for federated searches of assets in disparate dam repositories | |
Ding et al. | A vision on semantic retrieval in p2p network | |
de Brum Saccol et al. | Managing application domains in P2P systems | |
Ding | Integrating semantic metadata in P2P‐based digital libraries | |
Ren et al. | haps: Supporting effective and efficient full-text p2p search with peer dynamics | |
Kharma et al. | Data integration in a three-layer mediation framework | |
Louati et al. | SPSD: A Scalable P2P-based Service Discovery Architecture | |
Bopp et al. | MISTEL-An Approach to Access Multiple Resources. | |
Ding | A Semantic Search Framework in Peer-to-Peer Based Digital Libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040130 |