JP2001075988A - コンテンツアクセス装置および方法、記録媒体 - Google Patents
コンテンツアクセス装置および方法、記録媒体Info
- Publication number
- JP2001075988A JP2001075988A JP25120499A JP25120499A JP2001075988A JP 2001075988 A JP2001075988 A JP 2001075988A JP 25120499 A JP25120499 A JP 25120499A JP 25120499 A JP25120499 A JP 25120499A JP 2001075988 A JP2001075988 A JP 2001075988A
- Authority
- JP
- Japan
- Prior art keywords
- ontology
- content
- conversion
- application
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】コンテンツにおいて利用されているオントロジ
ーと、コンテンツを参照するアプリケーションが利用す
るオントロジーが異なっている場合に、アプリケーショ
ンのオントロジーに近い体系のオントロジーでコンテン
ツデータを参照できるようにする。 【解決手段】オントロジーを保持するオントロジーデー
タベースにアクセスする手段を持ち、コンテンツとアプ
リケーションが利用する2つのオントロジーが異なる場
合に、オントロジーデータベース中の第3のオントロジ
ーを利用して、それらの間の対応関係を調整するマッピ
ングを行う。
ーと、コンテンツを参照するアプリケーションが利用す
るオントロジーが異なっている場合に、アプリケーショ
ンのオントロジーに近い体系のオントロジーでコンテン
ツデータを参照できるようにする。 【解決手段】オントロジーを保持するオントロジーデー
タベースにアクセスする手段を持ち、コンテンツとアプ
リケーションが利用する2つのオントロジーが異なる場
合に、オントロジーデータベース中の第3のオントロジ
ーを利用して、それらの間の対応関係を調整するマッピ
ングを行う。
Description
【0001】
【発明の属する技術分野】この発明は、データ処理に関
する技術に関し、より詳細には、オントロジーを利用し
たコンテンツを処理する際に、コンテンツとその利用者
で異なるオントロジーを利用している場合のコンテンツ
アクセス方法に関する。
する技術に関し、より詳細には、オントロジーを利用し
たコンテンツを処理する際に、コンテンツとその利用者
で異なるオントロジーを利用している場合のコンテンツ
アクセス方法に関する。
【0002】
【従来の技術】現在ワードプロセッサでは、入力した文
書の中身であるテキストに加え、それぞれの文字の大き
さやフォントの種類を指定することができ、多彩な体裁
の文書を作成することができるようになっている。しか
し、それらの情報は、あくまで文書としての見た目の観
点から付与される情報であり、意味的な情報が付与され
ているわけではない。したがって、現在使われているテ
キスト検索技術では、利用者が指定した検索キーが検索
対象文書に含まれているかによって検索を行っており、
利用者の意図する意味とは異なった意味合いで使われて
いる場合でも検索されてしまうという問題がある。
書の中身であるテキストに加え、それぞれの文字の大き
さやフォントの種類を指定することができ、多彩な体裁
の文書を作成することができるようになっている。しか
し、それらの情報は、あくまで文書としての見た目の観
点から付与される情報であり、意味的な情報が付与され
ているわけではない。したがって、現在使われているテ
キスト検索技術では、利用者が指定した検索キーが検索
対象文書に含まれているかによって検索を行っており、
利用者の意図する意味とは異なった意味合いで使われて
いる場合でも検索されてしまうという問題がある。
【0003】たとえば、手先という意味で「犬」という
言葉が使われている文書を検索しようと思っても、現在
の検索技術では「犬」という語が含まれている文書はす
べて検索されるため、通常の動物の意味で犬という言葉
を使っている文書も検索され、目的とする文書を見つけ
るまでに、数多くの不要な文書に目を通す必要があり、
検索に多大な時間を要するという問題があった。
言葉が使われている文書を検索しようと思っても、現在
の検索技術では「犬」という語が含まれている文書はす
べて検索されるため、通常の動物の意味で犬という言葉
を使っている文書も検索され、目的とする文書を見つけ
るまでに、数多くの不要な文書に目を通す必要があり、
検索に多大な時間を要するという問題があった。
【0004】このような問題を解決するための1つの方
法として、テキストで使用されている個々の語に様々な
意味的な情報をタグ情報として付与しておき、検索時に
その情報を利用して検索を行うという方法が考えられ
る。意味情報を付与するのに利用される知識としては、
狭義には、概念間の上下関係を表現したシソーラスがあ
り、より詳細な知識としては、個々の概念が持つ属性
(例えば、動物であれば性別や身長、体重等)を表現で
きるオントロジーがある。したがって、シソーラスやオ
ントロジーを使えば、テキストで使われている語に関す
る様々な情報を付与することができる。情報を付与する
方式としては、SGMLやXML等のマークアップ言語
が一般的であり、広く知られた技術であるので、ここで
は詳細は省略する。
法として、テキストで使用されている個々の語に様々な
意味的な情報をタグ情報として付与しておき、検索時に
その情報を利用して検索を行うという方法が考えられ
る。意味情報を付与するのに利用される知識としては、
狭義には、概念間の上下関係を表現したシソーラスがあ
り、より詳細な知識としては、個々の概念が持つ属性
(例えば、動物であれば性別や身長、体重等)を表現で
きるオントロジーがある。したがって、シソーラスやオ
ントロジーを使えば、テキストで使われている語に関す
る様々な情報を付与することができる。情報を付与する
方式としては、SGMLやXML等のマークアップ言語
が一般的であり、広く知られた技術であるので、ここで
は詳細は省略する。
【0005】また最近では、上記のテキストデータと同
様に、ビデオなどの動画データに対し、その画像中の物
体に関する情報をメタ情報として付与しておき、動画デ
ータの検索を行う手法も提案されている。
様に、ビデオなどの動画データに対し、その画像中の物
体に関する情報をメタ情報として付与しておき、動画デ
ータの検索を行う手法も提案されている。
【0006】
【発明が解決しようとする課題】以上のように、テキス
トデータや画像データを始めとする様々なコンテンツに
オントロジーを使ってメタ情報を付与することにより、
データの検索精度を上げたり、従来できなかった意味的
な検索が可能となる。
トデータや画像データを始めとする様々なコンテンツに
オントロジーを使ってメタ情報を付与することにより、
データの検索精度を上げたり、従来できなかった意味的
な検索が可能となる。
【0007】ところで、データの作成者と利用者が同じ
場合は、データに付与されたオントロジーデータと同じ
オントロジーを利用することができるため、使用するオ
ントロジーが一致しないといった問題は生じない。しか
しながら、データの作成者と利用者が異なる場合には、
それぞれのオントロジーに差が生じうるため、その差を
解消する手段が必要となる。
場合は、データに付与されたオントロジーデータと同じ
オントロジーを利用することができるため、使用するオ
ントロジーが一致しないといった問題は生じない。しか
しながら、データの作成者と利用者が異なる場合には、
それぞれのオントロジーに差が生じうるため、その差を
解消する手段が必要となる。
【0008】たとえば、Aという名前のコンピュータが
ある場合、一般の利用者のレベルでは、Aという1つの
概念で済む場合であっても、Aを商品として取り扱って
いるメーカや販売業者の場合には、メモリやディスクの
容量などのオプションによって、いくつかのタイプに別
れており、取り引きの際には、それらの型番を指定しな
ければならないというのが普通である。
ある場合、一般の利用者のレベルでは、Aという1つの
概念で済む場合であっても、Aを商品として取り扱って
いるメーカや販売業者の場合には、メモリやディスクの
容量などのオプションによって、いくつかのタイプに別
れており、取り引きの際には、それらの型番を指定しな
ければならないというのが普通である。
【0009】したがって、あるデータやコンテンツを利
用してAというコンピュータに関する情報を処理しよう
とした場合、メーカや販売業者は、このような様々なタ
イプに対応できるように、一般利用者よりも詳細なオン
トロジーを用いることになる。しかし、一般ユーザは、
自分が日頃使用するオントロジーではそこまで詳細な情
報は不要であり、種々の細かな違いは気にせず、あくま
でAという名前で検索できればよく、それ以上の詳細な
データがあっても意味がない。
用してAというコンピュータに関する情報を処理しよう
とした場合、メーカや販売業者は、このような様々なタ
イプに対応できるように、一般利用者よりも詳細なオン
トロジーを用いることになる。しかし、一般ユーザは、
自分が日頃使用するオントロジーではそこまで詳細な情
報は不要であり、種々の細かな違いは気にせず、あくま
でAという名前で検索できればよく、それ以上の詳細な
データがあっても意味がない。
【0010】以上のような例は、コンピュータに限らず
日常全ての概念において言えることである。そのため、
コンテンツが作成された時に用いられるオントロジー
と、そのコンテンツを使用する利用者のオントロジーが
異なることが原因となって、利用者がコンテンツの内容
を適切に利用できないという問題が生じうる。このよう
な問題を解決するためには、一般には、そのコンテンツ
を利用するアプリケーションが、オントロジーの差を解
消するための変換手段を持てばよい。
日常全ての概念において言えることである。そのため、
コンテンツが作成された時に用いられるオントロジー
と、そのコンテンツを使用する利用者のオントロジーが
異なることが原因となって、利用者がコンテンツの内容
を適切に利用できないという問題が生じうる。このよう
な問題を解決するためには、一般には、そのコンテンツ
を利用するアプリケーションが、オントロジーの差を解
消するための変換手段を持てばよい。
【0011】しかしながら、全てのアプリケーション
が、このような変換手段を内蔵するような構成にするに
は、アプリケーション開発者に多大な負荷を与え、開発
が困難になるという問題が生ずる。特に、詳細なオント
ロジーをより簡略なオントロジーに変換するのであれば
変換処理自体は単純であるが、言語の違いや単位系の違
いなど、多種多様なオントロジー間の変換をすべて可能
とするような能力を持たせることは困難である。
が、このような変換手段を内蔵するような構成にするに
は、アプリケーション開発者に多大な負荷を与え、開発
が困難になるという問題が生ずる。特に、詳細なオント
ロジーをより簡略なオントロジーに変換するのであれば
変換処理自体は単純であるが、言語の違いや単位系の違
いなど、多種多様なオントロジー間の変換をすべて可能
とするような能力を持たせることは困難である。
【0012】
【課題を解決するための手段】本発明は、データに対す
るメタ情報がオントロジーを用いて表現されているコン
テンツをアクセスするコンテンツアクセス装置であっ
て、コンテンツにアクセスするアプリケーションが用い
る第1のオントロジーを記憶する第1のオントロジー記
憶手段と、この第1のオントロジー記憶手段に記憶され
た第1のオントロジーと、前記アプリケーションがアク
セスするコンテンツの有する第2のオントロジーが一致
するかを判断する判断手段と、オントロジーの変換処理
を行うための第3のオントロジーを記憶する第3のオン
トロジー記憶手段と、前記判断手段によって、第1のオ
ントロジーと第2のオントロジーが一致しないと判断さ
れた場合に、前記第3のオントロジー記憶手段から変換
処理を行うための第3のオントロジーを検索する検索手
段と、この検索手段によって検索された第3のオントロ
ジーを用いて、アプリケーションがアクセスしたコンテ
ンツの第2のオントロジーを第1のオントロジーに変換
する変換手段を有することを特徴とする。
るメタ情報がオントロジーを用いて表現されているコン
テンツをアクセスするコンテンツアクセス装置であっ
て、コンテンツにアクセスするアプリケーションが用い
る第1のオントロジーを記憶する第1のオントロジー記
憶手段と、この第1のオントロジー記憶手段に記憶され
た第1のオントロジーと、前記アプリケーションがアク
セスするコンテンツの有する第2のオントロジーが一致
するかを判断する判断手段と、オントロジーの変換処理
を行うための第3のオントロジーを記憶する第3のオン
トロジー記憶手段と、前記判断手段によって、第1のオ
ントロジーと第2のオントロジーが一致しないと判断さ
れた場合に、前記第3のオントロジー記憶手段から変換
処理を行うための第3のオントロジーを検索する検索手
段と、この検索手段によって検索された第3のオントロ
ジーを用いて、アプリケーションがアクセスしたコンテ
ンツの第2のオントロジーを第1のオントロジーに変換
する変換手段を有することを特徴とする。
【0013】つまり、コンテンツとアプリケーションが
利用する2つのオントロジーが異なる場合に、それらの
間の差を解消するため、それらの間の対応関係を調整す
る変換手段を提供するものであり、より詳しくは、複数
のオントロジーを保持するオントロジーデータベースに
アクセスする手段を持ち、オントロジーデータベース中
の第3のオントロジーを利用して、前記2つのオントロ
ジーの差を解消するための変換を行うものである。
利用する2つのオントロジーが異なる場合に、それらの
間の差を解消するため、それらの間の対応関係を調整す
る変換手段を提供するものであり、より詳しくは、複数
のオントロジーを保持するオントロジーデータベースに
アクセスする手段を持ち、オントロジーデータベース中
の第3のオントロジーを利用して、前記2つのオントロ
ジーの差を解消するための変換を行うものである。
【0014】
【発明の実施の形態】本発明の実施の形態である情報処
理装置について、図面を参照して説明する。
理装置について、図面を参照して説明する。
【0015】図1は、本処理装置であるオントロジー変
換部1と、それに関わるコンテンツ格納部2、コンテン
ツ参照部3、内部オントロジー格納部4、外部オントロ
ジーデータベース5の関連を示す図である。コンテンツ
の利用者は、コンテンツ参照部3を介して、コンテンツ
格納部2に格納されたコンテンツを利用する。以下で
は、例として、コンテンツがオントロジーを用いて意味
情報が付与されたテキストデータとし、コンテンツの参
照の目的は、テキスト検索であるとする。検索者は、検
索に際して、自分が検索したい語を表層文字列として指
定することも可能であるが、ここでは、その語の意味を
内部オントロジー格納部4に格納されたオントロジーに
含まれる概念によって指定するものとする。
換部1と、それに関わるコンテンツ格納部2、コンテン
ツ参照部3、内部オントロジー格納部4、外部オントロ
ジーデータベース5の関連を示す図である。コンテンツ
の利用者は、コンテンツ参照部3を介して、コンテンツ
格納部2に格納されたコンテンツを利用する。以下で
は、例として、コンテンツがオントロジーを用いて意味
情報が付与されたテキストデータとし、コンテンツの参
照の目的は、テキスト検索であるとする。検索者は、検
索に際して、自分が検索したい語を表層文字列として指
定することも可能であるが、ここでは、その語の意味を
内部オントロジー格納部4に格納されたオントロジーに
含まれる概念によって指定するものとする。
【0016】コンテンツ参照部3は、利用者の検索要求
を受けて、コンテンツ格納部2に格納されたコンテンツ
にアクセスするが、その際、本処理装置であるオントロ
ジー変換部1を介してコンテンツにアクセスすることに
より、コンテンツのオントロジーと、内部オントロジー
格納部4に格納された利用者のオントロジーの間の差を
意識することなく、コンテンツの参照を行うことができ
るようにする。
を受けて、コンテンツ格納部2に格納されたコンテンツ
にアクセスするが、その際、本処理装置であるオントロ
ジー変換部1を介してコンテンツにアクセスすることに
より、コンテンツのオントロジーと、内部オントロジー
格納部4に格納された利用者のオントロジーの間の差を
意識することなく、コンテンツの参照を行うことができ
るようにする。
【0017】図2は、オントロジー変換部1の構成を示
す図である。通信部11は、コンテンツ参照部3からコ
ンテンツ格納部2に対するアクセス要求の受理を始めと
し、外部のモジュールとのやり取りを行うもので、コン
テンツ解析部12は、コンテンツ格納部からコンテンツ
参照部へ転送されるデータを解析し、変換が必要な場合
には、変換部13を利用して変換処理を行う。以下で
は、コンテンツやオントロジーとして具体例を示しなが
ら、各部の機能を詳細に説明する。
す図である。通信部11は、コンテンツ参照部3からコ
ンテンツ格納部2に対するアクセス要求の受理を始めと
し、外部のモジュールとのやり取りを行うもので、コン
テンツ解析部12は、コンテンツ格納部からコンテンツ
参照部へ転送されるデータを解析し、変換が必要な場合
には、変換部13を利用して変換処理を行う。以下で
は、コンテンツやオントロジーとして具体例を示しなが
ら、各部の機能を詳細に説明する。
【0018】図3は、オントロジーを記述するための外
部表現形式と、その例である。形式そのものは、人工知
能で利用されているフレームをベースにしたものであ
り、図3(a)に示すように、大きくは、オントロジー
そのものの情報を格納する部分(図中、属性名1から属
性名nの部分)とオントロジー本体(概念に関する定義
の部分)の2つからなっている。各概念の定義において
は、属性の1つとして、概念間の上位・下位関係を示す
ための特別な属性(ここでは「is#a(=上位概念)」と
「 has#child(=下位概念)」という属性名を用いる)
を持つものとする。
部表現形式と、その例である。形式そのものは、人工知
能で利用されているフレームをベースにしたものであ
り、図3(a)に示すように、大きくは、オントロジー
そのものの情報を格納する部分(図中、属性名1から属
性名nの部分)とオントロジー本体(概念に関する定義
の部分)の2つからなっている。各概念の定義において
は、属性の1つとして、概念間の上位・下位関係を示す
ための特別な属性(ここでは「is#a(=上位概念)」と
「 has#child(=下位概念)」という属性名を用いる)
を持つものとする。
【0019】各概念の属性の定義は図3(b)のよう
に、属性値の定義は図3(c)のように表現される。
に、属性値の定義は図3(c)のように表現される。
【0020】また、知識表現量を減らすとともに、知識
の管理を容易にするため、下位の概念が上位の概念に対
する定義を継承するといった処理も、フレームに関する
処理として既に提案されているものを適宜用いればよい
ので、ここでは、詳細な説明は省略する。図3(d)で
示したオントロジーの例では、コンピュータが機械の下
位概念として、また、機械は、有形物の下位概念として
定義されている。また、オントロジーの値を表現するの
に使用している言語は日本語としている。
の管理を容易にするため、下位の概念が上位の概念に対
する定義を継承するといった処理も、フレームに関する
処理として既に提案されているものを適宜用いればよい
ので、ここでは、詳細な説明は省略する。図3(d)で
示したオントロジーの例では、コンピュータが機械の下
位概念として、また、機械は、有形物の下位概念として
定義されている。また、オントロジーの値を表現するの
に使用している言語は日本語としている。
【0021】図4は、コンテンツの一例である。これ
は、テキスト内の語の意味をオントロジーを用いてメタ
情報として付与したテキストデータであり、具体的には
タグ<WD>からタグ</WD>までが、意味付けした
語とそれに対する情報である。タグ<WD>中のONTOLO
GY= の部分が使用したオントロジーの名前であり、SEM
=がオントロジーで定義された概念の概念識別子であ
る。
は、テキスト内の語の意味をオントロジーを用いてメタ
情報として付与したテキストデータであり、具体的には
タグ<WD>からタグ</WD>までが、意味付けした
語とそれに対する情報である。タグ<WD>中のONTOLO
GY= の部分が使用したオントロジーの名前であり、SEM
=がオントロジーで定義された概念の概念識別子であ
る。
【0022】また、jNACというものは、ここではある種
のコンピュータの機種名を想定している。したがって、
この例は、jNACがコンピュータであることを知らない人
であっても、コンピュータという概念での検索が可能で
あることを示す例となっている。それに続くATTRという
名前のタグには、そのコンピュータの属性情報が付与さ
れている。具体的には、ここでは、重さ(=weight)が
1000gという情報が付加されている。なおテキスト
には、「太郎」や「秋葉原」といった語も使われてお
り、それらの語に対しても同様にタグ付けすることが可
能であるが、ここでは、以下の説明をわかりやすくする
ため、jNACという語のみがタグ付けされているものとす
る。
のコンピュータの機種名を想定している。したがって、
この例は、jNACがコンピュータであることを知らない人
であっても、コンピュータという概念での検索が可能で
あることを示す例となっている。それに続くATTRという
名前のタグには、そのコンピュータの属性情報が付与さ
れている。具体的には、ここでは、重さ(=weight)が
1000gという情報が付加されている。なおテキスト
には、「太郎」や「秋葉原」といった語も使われてお
り、それらの語に対しても同様にタグ付けすることが可
能であるが、ここでは、以下の説明をわかりやすくする
ため、jNACという語のみがタグ付けされているものとす
る。
【0023】また、タグ付けに使用したオントロジーは
図3(d)に示すオントロジーを使っているものとし、
ONTOLOGY= の値であるontology#1という値により、その
ことが示されている。このようなタグ付けをすることに
より、本来のテキスト、すなわち「太郎は昨日、秋葉原
でjNACを買った。」という文字列だけでは検索できな
い、重さ1000gのコンピュータという概念での検索
が可能となる。
図3(d)に示すオントロジーを使っているものとし、
ONTOLOGY= の値であるontology#1という値により、その
ことが示されている。このようなタグ付けをすることに
より、本来のテキスト、すなわち「太郎は昨日、秋葉原
でjNACを買った。」という文字列だけでは検索できな
い、重さ1000gのコンピュータという概念での検索
が可能となる。
【0024】ところで、図3のオントロジーは日本語に
よるオントロジーである。そのため、利用者が図5に示
すような英語によるオントロジー(内部オントロジー)
を使って検索しようと思っても、そのオントロジーでは
コンピュータはcomputerという英語で表現されているた
め、上の例のように「コンピュータ」という概念で検索
することはできない。同様に同じ数値データであって
も、単位系が異なっていれば、データ中の値をそのまま
用いることはできない。図4の例では、重さのデータ
は、グラムで表現されているが、データの利用者はポン
ドで検索したいと考えている場合には、グラムからポン
ドへの変換が必要となる。
よるオントロジーである。そのため、利用者が図5に示
すような英語によるオントロジー(内部オントロジー)
を使って検索しようと思っても、そのオントロジーでは
コンピュータはcomputerという英語で表現されているた
め、上の例のように「コンピュータ」という概念で検索
することはできない。同様に同じ数値データであって
も、単位系が異なっていれば、データ中の値をそのまま
用いることはできない。図4の例では、重さのデータ
は、グラムで表現されているが、データの利用者はポン
ドで検索したいと考えている場合には、グラムからポン
ドへの変換が必要となる。
【0025】しかし、このような変換は、コンテンツの
オントロジーと内部オントロジーだけでは行うことがで
きない。そこで、概念間の対応付けがなされているよう
な、第3のオントロジーが必要となる。図6は、そのよ
うなオントロジーとして利用できる2カ国語オントロジ
ーである。このオントロジーでは、オントロジーの属性
として、使用する言語が2つ宣言され、各概念識別子
は、例に示すように、両言語による値の対として定義さ
れている。
オントロジーと内部オントロジーだけでは行うことがで
きない。そこで、概念間の対応付けがなされているよう
な、第3のオントロジーが必要となる。図6は、そのよ
うなオントロジーとして利用できる2カ国語オントロジ
ーである。このオントロジーでは、オントロジーの属性
として、使用する言語が2つ宣言され、各概念識別子
は、例に示すように、両言語による値の対として定義さ
れている。
【0026】また、単位系を変換するための手続きも、
ある定められた書式で記述されているものとする(図6
の例では、グラムによる値をポンドに変換する式が書か
れている)。なお、図6の例は、2カ国語であるが、3
つ以上の言語であってもかまわない。
ある定められた書式で記述されているものとする(図6
の例では、グラムによる値をポンドに変換する式が書か
れている)。なお、図6の例は、2カ国語であるが、3
つ以上の言語であってもかまわない。
【0027】図7は、オントロジーの変換処理を示すフ
ローチャートである。まずステップ701で、内部オン
トロジーの情報を入手し、変換処理部内で参照できるよ
うに記憶する。例えば、図5の例では、オントロジー識
別子がpersonal#ontology,言語がEnglish,単位系がpoun
d といった情報が、後の処理で参照できるようにする。
ローチャートである。まずステップ701で、内部オン
トロジーの情報を入手し、変換処理部内で参照できるよ
うに記憶する。例えば、図5の例では、オントロジー識
別子がpersonal#ontology,言語がEnglish,単位系がpoun
d といった情報が、後の処理で参照できるようにする。
【0028】次にステップ702では、変換の際に参照
するオントロジーの名前を保持する変数omにNULLをセッ
トする。その後、ステップ703でコンテンツをアクセ
スする要求を受け付け、ステップ704で指定されたコ
ンテンツのアクセスを開始し、コンテンツをアクセスす
るポインタをデータの先頭にセットする。
するオントロジーの名前を保持する変数omにNULLをセッ
トする。その後、ステップ703でコンテンツをアクセ
スする要求を受け付け、ステップ704で指定されたコ
ンテンツのアクセスを開始し、コンテンツをアクセスす
るポインタをデータの先頭にセットする。
【0029】まずステップ705で、コンテンツ中でオ
ントロジータグがついたメタ情報があるか調べる。もし
なければ、変換するものがないので、ステップ799で
データをそのまま出力して終了する。
ントロジータグがついたメタ情報があるか調べる。もし
なければ、変換するものがないので、ステップ799で
データをそのまま出力して終了する。
【0030】メタ情報がある場合は、まずステップ70
6でタグまでのデータを出力する。コンテンツが図4の
テキストデータの場合は、「太郎は昨日、秋葉原で」ま
でを出力する。その後、ステップ708でタグ付けされ
た部分を読み込む。すなわち、図4のテキストデータの
場合は、「<WD ONTOLOGY=ontology#1 SEM=コンピュ
ータ>jNAC<ATTR NAME=weight VALUE=1000></WD
>」の部分を読み込む。ステップ709でオントロジー
識別子を比較し、同じオントロジーを使っているかをチ
ェックする。
6でタグまでのデータを出力する。コンテンツが図4の
テキストデータの場合は、「太郎は昨日、秋葉原で」ま
でを出力する。その後、ステップ708でタグ付けされ
た部分を読み込む。すなわち、図4のテキストデータの
場合は、「<WD ONTOLOGY=ontology#1 SEM=コンピュ
ータ>jNAC<ATTR NAME=weight VALUE=1000></WD
>」の部分を読み込む。ステップ709でオントロジー
識別子を比較し、同じオントロジーを使っているかをチ
ェックする。
【0031】もし、コンテンツと内部オントロジーの識
別子が一致していれば、タグ内のオントロジーデータを
変換する必要ないので、ステップ715で読み込んだデ
ータを出力しステップ705に戻る。もしオントロジー
識別子が違う場合、変数omの値と異なるならば、ステッ
プ711で変換処理に利用できる第3のオントロジーを
検索する。
別子が一致していれば、タグ内のオントロジーデータを
変換する必要ないので、ステップ715で読み込んだデ
ータを出力しステップ705に戻る。もしオントロジー
識別子が違う場合、変数omの値と異なるならば、ステッ
プ711で変換処理に利用できる第3のオントロジーを
検索する。
【0032】もし変換処理に利用できるオントロジーが
なければ、適切な変換処理ができないので、変換処理と
してはエラー状態で終了する。もし変換処理に利用でき
るオントロジーがみつかった場合には、見つかったオン
トロジーの識別子を変数omにセットするとともに、ステ
ップ714でタグ内に書かれた概念識別子や属性の値を
すべて変換し、結果を出力する。
なければ、適切な変換処理ができないので、変換処理と
してはエラー状態で終了する。もし変換処理に利用でき
るオントロジーがみつかった場合には、見つかったオン
トロジーの識別子を変数omにセットするとともに、ステ
ップ714でタグ内に書かれた概念識別子や属性の値を
すべて変換し、結果を出力する。
【0033】図8は、内部オントロジーとコンテンツオ
ントロジーが異なる場合に、変換処理を行なうのに利用
する第3のオントロジーを検索するステップ711の処
理の流れを詳細に示したものである。まずステップ80
1では、外部オントロジーデータベースへのアクセスを
開始し、続いてステップ802で、データベース中のオ
ントロジーを一つ取り出す。
ントロジーが異なる場合に、変換処理を行なうのに利用
する第3のオントロジーを検索するステップ711の処
理の流れを詳細に示したものである。まずステップ80
1では、外部オントロジーデータベースへのアクセスを
開始し、続いてステップ802で、データベース中のオ
ントロジーを一つ取り出す。
【0034】もしなければ変換処理に利用可能なオント
ロジーがなかったとしてエラー状態で終了する。もし、
利用可能なオントロジーが見つかった場合はステップ8
04で、言語が一致するか調べる。ここで「言語が一致
する」とは、内部オントロジーとコンテンツオントロジ
ーの言語が同じ場合には、それと同一である場合、異な
る場合には、それらを2つとも有することを指す。すな
わち、内部オントロジーとコンテンツオントロジーがそ
れぞれ図5と図3に示すものである場合、それぞれの言
語は英語と日本語であるが、図6に示すオントロジー
は、それら両方を含んでいる多言語オントロジーである
ため、言語が一致すると判定する。
ロジーがなかったとしてエラー状態で終了する。もし、
利用可能なオントロジーが見つかった場合はステップ8
04で、言語が一致するか調べる。ここで「言語が一致
する」とは、内部オントロジーとコンテンツオントロジ
ーの言語が同じ場合には、それと同一である場合、異な
る場合には、それらを2つとも有することを指す。すな
わち、内部オントロジーとコンテンツオントロジーがそ
れぞれ図5と図3に示すものである場合、それぞれの言
語は英語と日本語であるが、図6に示すオントロジー
は、それら両方を含んでいる多言語オントロジーである
ため、言語が一致すると判定する。
【0035】言語が一致したら、次に単位系が一致する
か調べる。図5と図3の例では、それぞれ、ポンドとグ
ラムで一致しないが、このような場合でも、図6にある
ように、値の変換に関する情報があれば、値を変換でき
るため、オントロジーとして変換可能であるとみなす。
最後にステップ807で、現在着目している概念が変換
可能であるか調べる。変換可能とは、以下の状態を指
す。
か調べる。図5と図3の例では、それぞれ、ポンドとグ
ラムで一致しないが、このような場合でも、図6にある
ように、値の変換に関する情報があれば、値を変換でき
るため、オントロジーとして変換可能であるとみなす。
最後にステップ807で、現在着目している概念が変換
可能であるか調べる。変換可能とは、以下の状態を指
す。
【0036】(1)言語が同じ場合は、現在変換しよう
としているコンテンツの概念識別子と同一名の概念が内
部オントロジーに存在するか、現在変換しようとしてい
るコンテンツの概念識別子が指す概念の上位概念に内部
オントロジーと一致するものがある場合。
としているコンテンツの概念識別子と同一名の概念が内
部オントロジーに存在するか、現在変換しようとしてい
るコンテンツの概念識別子が指す概念の上位概念に内部
オントロジーと一致するものがある場合。
【0037】(2)内部オントロジーとコンテンツのオ
ントロジーの言語が異なる場合には、現在チェックして
いる多言語オントロジーを用いて、(1)と同様に、対
応する言語で同一概念が存在するか、コンテンツの上位
概念の中に対応する概念が存在する場合。
ントロジーの言語が異なる場合には、現在チェックして
いる多言語オントロジーを用いて、(1)と同様に、対
応する言語で同一概念が存在するか、コンテンツの上位
概念の中に対応する概念が存在する場合。
【0038】なお、図7のステップ714では、変換対
象が概念である場合には、上記の手法にて対応する概念
を見つけ、コンテンツのオントロジーの概念識別子を内
部オントロジーの概念識別子に変換し、数値の場合で利
用している単位系が異なる場合には、ステップ806で
見つかっている数値変換知識を用いて変換を行なえば良
い。
象が概念である場合には、上記の手法にて対応する概念
を見つけ、コンテンツのオントロジーの概念識別子を内
部オントロジーの概念識別子に変換し、数値の場合で利
用している単位系が異なる場合には、ステップ806で
見つかっている数値変換知識を用いて変換を行なえば良
い。
【0039】なお、図7に示した手順では、第3のオン
トロジーを求める際に、オントロジー識別子が同じオン
トロジーに関しては最初に見つかったタグのデータを使
ってオントロジーデータベースを検索し、利用可能なも
のを決定したが、この方法では、それ以後のデータ処理
において変換できないタグが見つかる可能性もある。し
たがって、その時点で一旦すべてのタグデータを参照し
た上で、すべてのタグ情報が変換可能なオントロジーを
選択するようにしてもよい。また、全てのタグ情報が変
換できるオントロジーが複数個ある場合には、内部オン
トロジーもしくはコンテンツオントロジーとの類似性に
よって使用する外部オントロジーを選択するようにして
もよい。
トロジーを求める際に、オントロジー識別子が同じオン
トロジーに関しては最初に見つかったタグのデータを使
ってオントロジーデータベースを検索し、利用可能なも
のを決定したが、この方法では、それ以後のデータ処理
において変換できないタグが見つかる可能性もある。し
たがって、その時点で一旦すべてのタグデータを参照し
た上で、すべてのタグ情報が変換可能なオントロジーを
選択するようにしてもよい。また、全てのタグ情報が変
換できるオントロジーが複数個ある場合には、内部オン
トロジーもしくはコンテンツオントロジーとの類似性に
よって使用する外部オントロジーを選択するようにして
もよい。
【0040】また上記実施例においては、第3のオント
ロジーとして1個だけを用いたが、複数のオントロジー
を併用するようにしてもよい。さらに、上記実施例で
は、コンテンツとしてテキストデータを用いたが、タグ
などを用いてメタ情報が付与できるならば、静止画や動
画、音声データなどいかなる種類のデータであってもか
まわない。
ロジーとして1個だけを用いたが、複数のオントロジー
を併用するようにしてもよい。さらに、上記実施例で
は、コンテンツとしてテキストデータを用いたが、タグ
などを用いてメタ情報が付与できるならば、静止画や動
画、音声データなどいかなる種類のデータであってもか
まわない。
【0041】また、実施例では言語として、英語と日本
語といった自然言語を例に取って説明したが、このよう
な自然言語である必要は必ずしもない。概念自体は本来
言語には依存しないものであるから、化学式のように、
概念を表現するための人工的な表現言語であってもかま
わない。しかしそのような人工言語は曖昧性を排除する
ように精密に設計することができるが、利用者が人間で
ある場合は、そのような人工的な概念の概念識別子をす
べて記憶した上で利用するのは困難であり、そのような
意味からも、利用者のオントロジーは自然言語をベース
にしたもので、機械処理には、人工的に設計した精密な
ものを用い、それらの間での変換を行えるように変換用
の多言語オントロジーを用意するのがよいと言える。
語といった自然言語を例に取って説明したが、このよう
な自然言語である必要は必ずしもない。概念自体は本来
言語には依存しないものであるから、化学式のように、
概念を表現するための人工的な表現言語であってもかま
わない。しかしそのような人工言語は曖昧性を排除する
ように精密に設計することができるが、利用者が人間で
ある場合は、そのような人工的な概念の概念識別子をす
べて記憶した上で利用するのは困難であり、そのような
意味からも、利用者のオントロジーは自然言語をベース
にしたもので、機械処理には、人工的に設計した精密な
ものを用い、それらの間での変換を行えるように変換用
の多言語オントロジーを用意するのがよいと言える。
【0042】また、本願発明の実施例における処理をコ
ンピュータで実行可能なプログラムで実現し、このプロ
グラムをコンピュータで読み取り可能な記憶媒体として
実現することも可能である。
ンピュータで実行可能なプログラムで実現し、このプロ
グラムをコンピュータで読み取り可能な記憶媒体として
実現することも可能である。
【0043】なお、本願発明における記憶媒体として
は、磁気ディスク、フロッピーディスク、ハードディス
ク、光ディスク(CD−ROM,CD−R,DVD
等)、光磁気ディスク(MO等)、半導体メモリ等、プ
ログラムを記憶でき、かつコンピュータが読み取り可能
な記憶媒体であれば、その記憶形式は何れの形態であっ
てもよい。
は、磁気ディスク、フロッピーディスク、ハードディス
ク、光ディスク(CD−ROM,CD−R,DVD
等)、光磁気ディスク(MO等)、半導体メモリ等、プ
ログラムを記憶でき、かつコンピュータが読み取り可能
な記憶媒体であれば、その記憶形式は何れの形態であっ
てもよい。
【0044】また、記憶媒体からコンピュータにインス
トールされたプログラムの指示に基づきコンピュータ上
で稼動しているOS(オペレーションシステム)や、デ
ータベース管理ソフト、ネットワーク等のMW(ミドル
ウェア)等が本実施形態を実現するための各処理の一部
を実行してもよい。
トールされたプログラムの指示に基づきコンピュータ上
で稼動しているOS(オペレーションシステム)や、デ
ータベース管理ソフト、ネットワーク等のMW(ミドル
ウェア)等が本実施形態を実現するための各処理の一部
を実行してもよい。
【0045】さらに、本願発明における記憶媒体は、コ
ンピュータと独立した媒体に限らず、LANやインター
ネット等により伝送されたプログラムをダウンロードし
て記憶または一時記憶した記憶媒体も含まれる。
ンピュータと独立した媒体に限らず、LANやインター
ネット等により伝送されたプログラムをダウンロードし
て記憶または一時記憶した記憶媒体も含まれる。
【0046】また、記憶媒体は1つに限らず、複数の媒
体から本実施形態における処理が実行される場合も、本
発明における記憶媒体に含まれ、媒体の構成は何れの構
成であってもよい。
体から本実施形態における処理が実行される場合も、本
発明における記憶媒体に含まれ、媒体の構成は何れの構
成であってもよい。
【0047】なお、本願発明におけるコンピュータは、
記憶媒体に記憶されたプログラムに基づき、本実施形態
における各処理を実行するものであって、パソコン等の
1つからなる装置、複数の装置がネットワーク接続され
たシステム等の何れの構成であってもよい。
記憶媒体に記憶されたプログラムに基づき、本実施形態
における各処理を実行するものであって、パソコン等の
1つからなる装置、複数の装置がネットワーク接続され
たシステム等の何れの構成であってもよい。
【0048】また、本願発明におけるコンピュータと
は、パソコンに限らず、情報処理機器に含まれる演算処
理装置、マイコン等も含み、プログラムによって本願発
明の機能を実現することが可能な機器、装置を総称して
いる。
は、パソコンに限らず、情報処理機器に含まれる演算処
理装置、マイコン等も含み、プログラムによって本願発
明の機能を実現することが可能な機器、装置を総称して
いる。
【0049】
【発明の効果】以上説明したように、本発明によれば、
コンテンツと利用者の持つオントロジーに差がある場合
でも、両者の差を意識することなく、コンテンツ情報を
利用することができるようになる。
コンテンツと利用者の持つオントロジーに差がある場合
でも、両者の差を意識することなく、コンテンツ情報を
利用することができるようになる。
【図1】本発明の実施の形態について、全体的な構成を
示すブロック図。
示すブロック図。
【図2】本発明の実施の形態について、オントロジー変
換部の構成の概略を示す図。
換部の構成の概略を示す図。
【図3】オントロジーを記述するための形式と、その実
例を示す図。
例を示す図。
【図4】コンテンツの一例を示す図。
【図5】内部オントロジーの一例を示す図。
【図6】多言語オントロジーの一例を示す図。
【図7】オントロジーの変換処理の流れを示す図。
【図8】オントロジーの検索処理の流れを示す図。
1…オントロジー変換部 2…コンテンツ格納部 3…コンテンツ参照部 4…内部オントロジー格納部 5…外部オントロジーデータベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 平川 秀樹 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B075 ND03 NK32 NK43 PP25 PR06 UU40
Claims (5)
- 【請求項1】データに対するメタ情報がオントロジーを
用いて表現されているコンテンツをアクセスするコンテ
ンツアクセス装置であって、 コンテンツにアクセスするアプリケーションが用いる第
1のオントロジーを記憶する第1のオントロジー記憶手
段と、 この第1のオントロジー記憶手段に記憶された第1のオ
ントロジーと、前記アプリケーションがアクセスするコ
ンテンツの有する第2のオントロジーが一致するかを判
断する判断手段と、 オントロジーの変換処理を行うための第3のオントロジ
ーを記憶する第3のオントロジー記憶手段と、 前記判断手段によって、第1のオントロジーと第2のオ
ントロジーが一致しないと判断された場合に、前記第3
のオントロジー記憶手段から変換処理を行うための第3
のオントロジーを検索する検索手段と、 この検索手段によって検索された第3のオントロジーを
用いて、アプリケーションがアクセスしたコンテンツの
第2のオントロジーを第1のオントロジーに変換する変
換手段を有することを特徴とするコンテンツアクセス装
置。 - 【請求項2】前記第1のオントロジーの言語と、第2の
オントロジーの言語が異なる場合に、前記検索手段は、
複数の言語を用いてデータが表現されている多言語オン
トロジーを第3のオントロジーとして検索し、 前記変換手段は、検索された多言語オントロジーを用い
て、オントロジーの変換を行うことを特徴とする請求項
1記載のコンテンツアクセス装置。 - 【請求項3】前記第1のオントロジーの単位系と、第2
のオントロジーの単位系が異なる場合に、前記検索手段
は、それらの単位系の数値の変換方法が表現されている
第3のオントロジーを検索し、 前記変換手段は、検索された第3のオントロジーを用い
て、オントロジーの変換を行うことを特徴とする請求項
1記載のコンテンツアクセス装置。 - 【請求項4】データに対するメタ情報がオントロジーを
用いて表現されているコンテンツをアクセスするコンテ
ンツアクセス方法であって、 コンテンツにアクセスするアプリケーションが用いる第
1のオントロジーと、前記アプリケーションがアクセス
するコンテンツの有する第2のオントロジーが一致する
かを判断し、 第1のオントロジーと第2のオントロジーが一致しない
と判断された場合に、第3のオントロジー記憶手段から
変換処理を行うための第3のオントロジーを検索し、 検索された第3のオントロジーを用いて、アプリケーシ
ョンがアクセスしたコンテンツの第2のオントロジーを
第1のオントロジーに変換することを特徴とするコンテ
ンツアクセス方法。 - 【請求項5】データに対するメタ情報がオントロジーを
用いて表現されているコンテンツをアクセスするための
プログラムをコンピュータ読取り可能なように記憶した
記憶媒体であって、 コンテンツにアクセスするアプリケーションが用いる第
1のオントロジーと、前記アプリケーションがアクセス
するコンテンツの有する第2のオントロジーが一致する
かを判断させ、 第1のオントロジーと第2のオントロジーが一致しない
と判断された場合に、第3のオントロジー記憶手段から
変換処理を行うための第3のオントロジーを検索させ、 検索された第3のオントロジーを用いて、アプリケーシ
ョンがアクセスしたコンテンツの第2のオントロジーを
第1ののオントロジーに変換させるプログラムをコンピ
ュータ読取り可能なように記憶した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25120499A JP2001075988A (ja) | 1999-09-06 | 1999-09-06 | コンテンツアクセス装置および方法、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25120499A JP2001075988A (ja) | 1999-09-06 | 1999-09-06 | コンテンツアクセス装置および方法、記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001075988A true JP2001075988A (ja) | 2001-03-23 |
Family
ID=17219252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25120499A Abandoned JP2001075988A (ja) | 1999-09-06 | 1999-09-06 | コンテンツアクセス装置および方法、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001075988A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006133987A (ja) * | 2004-11-04 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報管理システム、情報管理装置、情報管理支援装置、情報管理方法および情報管理プログラム |
WO2015104873A1 (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置、情報処理プログラム、記憶媒体及び情報処理方法 |
-
1999
- 1999-09-06 JP JP25120499A patent/JP2001075988A/ja not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006133987A (ja) * | 2004-11-04 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報管理システム、情報管理装置、情報管理支援装置、情報管理方法および情報管理プログラム |
JP4567417B2 (ja) * | 2004-11-04 | 2010-10-20 | 日本電信電話株式会社 | 情報管理システム、情報管理支援装置、および情報管理プログラム |
WO2015104873A1 (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置、情報処理プログラム、記憶媒体及び情報処理方法 |
JP2015130021A (ja) * | 2014-01-07 | 2015-07-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10380080B2 (en) | 2014-01-07 | 2019-08-13 | Fuji Xerox Co., Ltd. | Information processing apparatus, storage medium, and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5592505B2 (ja) | トピックに基づいて調整可能なデーター・フィードの総計 | |
Kashyap et al. | Semantic heterogeneity in global information systems: The role of metadata, context and ontologies | |
US11573996B2 (en) | System and method for hierarchically organizing documents based on document portions | |
US20190121812A1 (en) | Semantic object tagging through name annotation | |
US9418138B2 (en) | Method and system for determining sets of variant items | |
US8326833B2 (en) | Implementing metadata extraction of artifacts from associated collaborative discussions | |
US7562009B1 (en) | Linguistic processing platform, architecture and methods | |
Shekhar et al. | WMS and GML based interoperable web mapping system | |
CN111552788B (zh) | 基于实体属性关系的数据库检索方法、系统与设备 | |
US8180799B1 (en) | Dynamically creating tables to store received data | |
Lomotey et al. | Topics and terms mining in unstructured data stores | |
Lu et al. | Emotion detection in textual information by semantic role labeling and web mining techniques | |
JP2001075988A (ja) | コンテンツアクセス装置および方法、記録媒体 | |
KR102407941B1 (ko) | Rpc에 기반하여 외부 장치의 함수 또는 프로시저를 호출하는 전자 장치가 사용자 인터페이스를 생성하는 방법, 그 컴퓨터 프로그램 및 그 전자 장치 | |
Lara | Documentary languages and knowledge organization systems in the context of the semantic web | |
Turnitsa et al. | Ontology applied–techniques employing ontological representation for M&S | |
Astudillo et al. | Contexta/SR: A multi-institutional semantic integration platform | |
Al Hamad | RXML: Path-based and XML DOM approaches for integrating between relational and XML databases | |
JP7323484B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP4242701B2 (ja) | 格納検索装置、格納検索プログラム、および格納検索プログラム記録媒体 | |
Jiang et al. | Pre-processing of Training Data | |
Gonzalez Gongora | Knowledge graph DST: a case study of rich representations for dialogue-state tracking | |
He et al. | A dynamic schema matching approach for multi-version web feature service retrieve | |
Urkude et al. | A novel semantic representation approach for web documents using deep entity linking and multidocument support | |
JP2000057169A (ja) | 製品データ管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050301 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050414 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20070625 |