JP2002334099A - 分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体 - Google Patents
分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体Info
- Publication number
- JP2002334099A JP2002334099A JP2001118956A JP2001118956A JP2002334099A JP 2002334099 A JP2002334099 A JP 2002334099A JP 2001118956 A JP2001118956 A JP 2001118956A JP 2001118956 A JP2001118956 A JP 2001118956A JP 2002334099 A JP2002334099 A JP 2002334099A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- user
- information source
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 画像・映像等の非テキスト情報をも検索キー
とするマルチメディア・データベースシステムにおい
て、検索キーと検索対象のコンテンツとが異なる形式
(たとえば、テキストと画像)である場合でも、ユーザ
が所望するコンテンツを検索することができる分散マル
チメディア情報の検索方法、検索装置、プログラムおよ
び記録媒体を提供することを目的とするものである。 【解決手段】 同一のカテゴリに属する様々なメディア
で表現されているデータを識別子によって多対多に関連
付けることによって、問い合わせに含まれる検索キーの
メディアを変換し、ネットワーク上に分散している様々
なデータベース管理システムやファイルシステムに対応
した問い合わせ文を生成して、所望のマルチメディア情
報を一括検索するものである。
とするマルチメディア・データベースシステムにおい
て、検索キーと検索対象のコンテンツとが異なる形式
(たとえば、テキストと画像)である場合でも、ユーザ
が所望するコンテンツを検索することができる分散マル
チメディア情報の検索方法、検索装置、プログラムおよ
び記録媒体を提供することを目的とするものである。 【解決手段】 同一のカテゴリに属する様々なメディア
で表現されているデータを識別子によって多対多に関連
付けることによって、問い合わせに含まれる検索キーの
メディアを変換し、ネットワーク上に分散している様々
なデータベース管理システムやファイルシステムに対応
した問い合わせ文を生成して、所望のマルチメディア情
報を一括検索するものである。
Description
【0001】
【発明の属する技術分野】本発明は、任意のメディアを
用いた問い合わせによる分散マルチメディア情報検索に
関し、詳しくは、同一のカテゴリに属する様々なメディ
アで表現されたデータを、識別子によって多対多に関連
付けることによって、問い合わせに含まれる検索キーの
メディアを変換し、ネットワーク上に分散している個々
のデータベース管理システムやファイルシステムから、
所望のマルチメディア情報を一括検索する装置、方法、
プログラム、その記録媒体に関する。
用いた問い合わせによる分散マルチメディア情報検索に
関し、詳しくは、同一のカテゴリに属する様々なメディ
アで表現されたデータを、識別子によって多対多に関連
付けることによって、問い合わせに含まれる検索キーの
メディアを変換し、ネットワーク上に分散している個々
のデータベース管理システムやファイルシステムから、
所望のマルチメディア情報を一括検索する装置、方法、
プログラム、その記録媒体に関する。
【0002】
【従来の技術】近年、図書館の書籍や美術館の絵画また
は雑誌・新聞等の文章や写真を電子化したマルチメディ
ア情報が増大している。マルチメディア情報は、一般的
に文書、音声・楽音、静止画、動画等のメディアを複合
することによって表現され、これらは、データベース管
理システム、ファイルシステム等によって、情報源とし
て格納され、ネットワーク上に分散している。
は雑誌・新聞等の文章や写真を電子化したマルチメディ
ア情報が増大している。マルチメディア情報は、一般的
に文書、音声・楽音、静止画、動画等のメディアを複合
することによって表現され、これらは、データベース管
理システム、ファイルシステム等によって、情報源とし
て格納され、ネットワーク上に分散している。
【0003】マルチメディア情報の増大に伴い、ユーザ
にとって直感的で分かりやすい検索技術の開発が期待さ
れている。現在、実用化されているマルチメディア情報
検索の多くは、書誌情報に基づく検索である。
にとって直感的で分かりやすい検索技術の開発が期待さ
れている。現在、実用化されているマルチメディア情報
検索の多くは、書誌情報に基づく検索である。
【0004】書誌情報に基づく検索とは、マルチメディ
ア情報に対して、テキストで表された書誌情報を予め付
与し、検索キーとして入力されたキーワードと書誌情報
とを照合し、マルチメディア情報を検索する方法であ
る。
ア情報に対して、テキストで表された書誌情報を予め付
与し、検索キーとして入力されたキーワードと書誌情報
とを照合し、マルチメディア情報を検索する方法であ
る。
【0005】また、静止画から静止画を検索するような
同一メディアによる類似検索も研究されている。(参考
文献[1]:串間他:“オブジェクトに基づく高速画像
検索システム:ExSight”, 情報処理学会論文誌, Vol.4
0, No.2, pp.732-741, 1999、 参考文献[2]:IBM A
lmaden Research Center.“Query by Image and Video
Content:The QBIC System”, IEEE Computer, Vol.28,
No.9,pp23-32, Sept1995) なお、類似検索とは、検索対象のマルチメディア情報か
ら、特徴量を予め抽出し、この検索対象から抽出された
特徴量と、入力された検索キーから抽出された特徴量と
の間で、類似計算し、所望のマルチメディア情報を検索
する方法である。
同一メディアによる類似検索も研究されている。(参考
文献[1]:串間他:“オブジェクトに基づく高速画像
検索システム:ExSight”, 情報処理学会論文誌, Vol.4
0, No.2, pp.732-741, 1999、 参考文献[2]:IBM A
lmaden Research Center.“Query by Image and Video
Content:The QBIC System”, IEEE Computer, Vol.28,
No.9,pp23-32, Sept1995) なお、類似検索とは、検索対象のマルチメディア情報か
ら、特徴量を予め抽出し、この検索対象から抽出された
特徴量と、入力された検索キーから抽出された特徴量と
の間で、類似計算し、所望のマルチメディア情報を検索
する方法である。
【0006】このような現状の検索技術では、情報源が
提供する検索キーのメディア種別と、ユーザが有する検
索キーのメディア種別とが一致しなければ、検索できな
いという欠点がある。
提供する検索キーのメディア種別と、ユーザが有する検
索キーのメディア種別とが一致しなければ、検索できな
いという欠点がある。
【0007】検索キーのメディア種別が不一致であれば
検索できないという上記欠点を解決するために、異メデ
ィアで表現された情報を関連付ける研究が行われてい
る。(参考文献[3]:栗田他:“印象語による絵画デ
ータベースの検索”,情報処理学会論文誌,Vol.33,No.
11, 1992、 参考文献[4]:岡他:“画像とテキスト
の自己組織化データに基づく画像理解方式の提案”,信
学技法,PRMU-98-74.) 異メディアで表現された情報を関連付けるために、上記
類似検索を利用する研究が多い。類似検索は、「特徴量
空間上で近接しているデータ同士は互いに類似してい
る」という仮定(仮定1)に基づいている。特徴量空間
における類似検索のモデルにおいて、所定の楕円内に検
索対象データが存在すれば、検索キーと近接していると
解釈される。
検索できないという上記欠点を解決するために、異メデ
ィアで表現された情報を関連付ける研究が行われてい
る。(参考文献[3]:栗田他:“印象語による絵画デ
ータベースの検索”,情報処理学会論文誌,Vol.33,No.
11, 1992、 参考文献[4]:岡他:“画像とテキスト
の自己組織化データに基づく画像理解方式の提案”,信
学技法,PRMU-98-74.) 異メディアで表現された情報を関連付けるために、上記
類似検索を利用する研究が多い。類似検索は、「特徴量
空間上で近接しているデータ同士は互いに類似してい
る」という仮定(仮定1)に基づいている。特徴量空間
における類似検索のモデルにおいて、所定の楕円内に検
索対象データが存在すれば、検索キーと近接していると
解釈される。
【0008】たとえば、上記文献[3]では、学習用の
絵画について、ユーザが印象語を付与し、その結果か
ら、印象語ベクトルと静止画特徴量ベクトルとの間で線
形関数を学習している。この線形関数が、静止画とテキ
ストとの間のメディア変換関数として機能する。
絵画について、ユーザが印象語を付与し、その結果か
ら、印象語ベクトルと静止画特徴量ベクトルとの間で線
形関数を学習している。この線形関数が、静止画とテキ
ストとの間のメディア変換関数として機能する。
【0009】また、上記文献[4]では、説明文付きの
静止画について、説明文を単語の特徴量空間でクラスタ
リングし、近接している説明文に対応する静止画は、そ
の特徴量空間上で近接するとみなし、近づけている。静
止画を検索キーとして入力し、類似画像の説明文が近接
している部分を検索結果として出力する。
静止画について、説明文を単語の特徴量空間でクラスタ
リングし、近接している説明文に対応する静止画は、そ
の特徴量空間上で近接するとみなし、近づけている。静
止画を検索キーとして入力し、類似画像の説明文が近接
している部分を検索結果として出力する。
【0010】
【発明が解決しようとする課題】しかし、上記従来例で
は、任意のメディアを用いた問い合せによって、既存情
報源からマルチメディア情報を検索する場合、次の問題
が生じる。 (1)特徴量が大きく異なるものの、関連付けが困難で
あるという問題がある。
は、任意のメディアを用いた問い合せによって、既存情
報源からマルチメディア情報を検索する場合、次の問題
が生じる。 (1)特徴量が大きく異なるものの、関連付けが困難で
あるという問題がある。
【0011】つまり、従来例では、「互いに類似してい
るデータ同士は、特徴量空間上で近接している」という
仮定(仮定1の逆)に基づいている。関連しているが近
接していないデータ(たとえばモンシロチョウについて
の文書に関連して、羽を開いたモンシロチョウの静止画
と羽を閉じたモンシロチョウの静止画)は、誤差と見な
されるか、近接化される。つまり、特徴量が大きく異な
り、近接していないものを関連付けることは難しいとい
う問題がある。 (2)ユーザの観点を反映した関連付けが困難であると
いう問題がある。
るデータ同士は、特徴量空間上で近接している」という
仮定(仮定1の逆)に基づいている。関連しているが近
接していないデータ(たとえばモンシロチョウについて
の文書に関連して、羽を開いたモンシロチョウの静止画
と羽を閉じたモンシロチョウの静止画)は、誤差と見な
されるか、近接化される。つまり、特徴量が大きく異な
り、近接していないものを関連付けることは難しいとい
う問題がある。 (2)ユーザの観点を反映した関連付けが困難であると
いう問題がある。
【0012】同じユーザでも様々な観点でマルチメディ
ア情報を扱いたい場合があり、たとえば、同じ静止画で
も、その色合いに着目するのか、形に着目するのかのよ
うに観点の違いによって、対応付けたい異メディア(た
とえば,テキストデータと静止画という異なるメディ
ア)のデータが異なる場合がある。しかし、上記従来例
では、同じデータに対して、ユーザの観点が異なるとき
に、異なるデータに関連付けることが困難であるという
問題がある。 (3)既存情報源の利用が困難であるという問題があ
る。
ア情報を扱いたい場合があり、たとえば、同じ静止画で
も、その色合いに着目するのか、形に着目するのかのよ
うに観点の違いによって、対応付けたい異メディア(た
とえば,テキストデータと静止画という異なるメディ
ア)のデータが異なる場合がある。しかし、上記従来例
では、同じデータに対して、ユーザの観点が異なるとき
に、異なるデータに関連付けることが困難であるという
問題がある。 (3)既存情報源の利用が困難であるという問題があ
る。
【0013】つまり、上記従来例では、検索対象のマル
チメディア情報から、システム独自の特徴量を抽出し、
異メディア間の関連付けや検索を行っている。一方、既
存情報源は、それぞれ特徴量の種類や問い合せの形式が
異なる。したがって、ネットワーク上に分散している様
々な既存情報源から、マルチメディア情報を検索するこ
とは難しいという問題がある。 (4)特徴量ベクトル空間上で多峰性の分布をしている
データを、高い適合率・再現率で検索するのが困難であ
るという問題がある。
チメディア情報から、システム独自の特徴量を抽出し、
異メディア間の関連付けや検索を行っている。一方、既
存情報源は、それぞれ特徴量の種類や問い合せの形式が
異なる。したがって、ネットワーク上に分散している様
々な既存情報源から、マルチメディア情報を検索するこ
とは難しいという問題がある。 (4)特徴量ベクトル空間上で多峰性の分布をしている
データを、高い適合率・再現率で検索するのが困難であ
るという問題がある。
【0014】つまり、上記従来例では、入力された検索
キーから抽出された1組の特徴量ベクトルと検索対象の
マルチメディア情報から抽出しておいた特徴量ベクトル
群との間で、1組の係数ベクトル(類似検索では重みと
呼ばれる)を用いて、予め定められた類似計算(距離計
算)を行う。したがって、ユーザが所望するデータが特
徴量ベクトル空間上で複雑な多峰性の分布をしている場
合、高い適合率・再現率で検索することが困難であると
いう問題がある。 (5)適合率と再現率のいずれを重視するのかを反映し
た関連付けが困難であるという問題がある。
キーから抽出された1組の特徴量ベクトルと検索対象の
マルチメディア情報から抽出しておいた特徴量ベクトル
群との間で、1組の係数ベクトル(類似検索では重みと
呼ばれる)を用いて、予め定められた類似計算(距離計
算)を行う。したがって、ユーザが所望するデータが特
徴量ベクトル空間上で複雑な多峰性の分布をしている場
合、高い適合率・再現率で検索することが困難であると
いう問題がある。 (5)適合率と再現率のいずれを重視するのかを反映し
た関連付けが困難であるという問題がある。
【0015】上記従来例では、関連付けられたデータを
検索キーとして検索するときに、所望のデータのみが検
索され、それ以外のデータが検索されない方が良い(適
合率を重視する)のか、所望のデータが取りこぼしなく
検索される方が良い(再現率を重視する)のかを反映し
て、どのデータとどのデータとを関連付けるべきかの指
標がない。したがって、適合率と再現率とのうちのいず
れを重視するのかを反映して、対応付けるべきデータを
選択することが困難であるという問題がある。
検索キーとして検索するときに、所望のデータのみが検
索され、それ以外のデータが検索されない方が良い(適
合率を重視する)のか、所望のデータが取りこぼしなく
検索される方が良い(再現率を重視する)のかを反映し
て、どのデータとどのデータとを関連付けるべきかの指
標がない。したがって、適合率と再現率とのうちのいず
れを重視するのかを反映して、対応付けるべきデータを
選択することが困難であるという問題がある。
【0016】本発明は、画像・映像等の非テキスト情報
をも検索キーとするマルチメディア・データベースシス
テムにおいて、検索キーと検索対象のコンテンツとが異
なる形式(たとえば、テキストと画像)である場合で
も、ユーザが所望するコンテンツを検索することができ
る分散マルチメディア情報の検索方法、検索装置、プロ
グラムおよび記録媒体を提供することを目的とするもの
である。
をも検索キーとするマルチメディア・データベースシス
テムにおいて、検索キーと検索対象のコンテンツとが異
なる形式(たとえば、テキストと画像)である場合で
も、ユーザが所望するコンテンツを検索することができ
る分散マルチメディア情報の検索方法、検索装置、プロ
グラムおよび記録媒体を提供することを目的とするもの
である。
【0017】
【課題を解決するための手段】本発明は、同一のカテゴ
リに属する様々なメディアで表現されているデータを識
別子によって多対多に関連付けることによって、問い合
わせに含まれる検索キーのメディアを変換し、ネットワ
ーク上に分散している様々なデータベース管理システム
やファイルシステムに対応した問い合せ文を生成して、
所望のマルチメディア情報を一括検索するものである。
リに属する様々なメディアで表現されているデータを識
別子によって多対多に関連付けることによって、問い合
わせに含まれる検索キーのメディアを変換し、ネットワ
ーク上に分散している様々なデータベース管理システム
やファイルシステムに対応した問い合せ文を生成して、
所望のマルチメディア情報を一括検索するものである。
【0018】
【発明の実施の形態および実施例】本発明の実施例を説
明する前に、関連する用語について説明する。
明する前に、関連する用語について説明する。
【0019】「ユーザ」は、検索を実行する利用者であ
り、実際の利用者の他に、検索時の観点等、たとえば静
止画の類似検索であれば「色重視」や「形重視」等の仮
想的な利用者も含む。
り、実際の利用者の他に、検索時の観点等、たとえば静
止画の類似検索であれば「色重視」や「形重視」等の仮
想的な利用者も含む。
【0020】「メディア」は、情報の伝達・表現手段で
あり、一般的に文書、音声・楽音、静止画、動画等の単
一メディアとその複合メディアとを含むものである。
あり、一般的に文書、音声・楽音、静止画、動画等の単
一メディアとその複合メディアとを含むものである。
【0021】「ユーザ問い合わせ」は、所望の情報を検
索するために、アプリケーションプログラムを介して、
ユーザが入力する問い合わせであり、本実施例において
は、任意のメディアによって表現されている検索キー
(キーワード、静止画キー、音声キー等)、AND/O
R条件や、返却上限数等の指定によって構成されるもの
である。
索するために、アプリケーションプログラムを介して、
ユーザが入力する問い合わせであり、本実施例において
は、任意のメディアによって表現されている検索キー
(キーワード、静止画キー、音声キー等)、AND/O
R条件や、返却上限数等の指定によって構成されるもの
である。
【0022】「検索エンジン」は、後述の情報源問い合
わせを入力すると、格納している情報の中から、検索結
果を返却するシステムであり、データベース管理システ
ムやファイルシステム等である。
わせを入力すると、格納している情報の中から、検索結
果を返却するシステムであり、データベース管理システ
ムやファイルシステム等である。
【0023】「情報源」は、検索エンジンによって検索
可能な状態で格納されている情報の集まりであり、デー
タベースやファイル等である。
可能な状態で格納されている情報の集まりであり、デー
タベースやファイル等である。
【0024】「情報源問い合わせ」は、所望の情報を検
索するために、検索エンジンを介して入力する問い合わ
せであり、特定のメディアによって表現された検索キー
(検索エンジン毎のキーワード、静止画キー、音声キー
等)、所定の特徴量を重視する度合いである重み、AN
D/ORや返却上限数等の指定によって構成され、検索
エンジンの種別によって指定される項目は異なる。
索するために、検索エンジンを介して入力する問い合わ
せであり、特定のメディアによって表現された検索キー
(検索エンジン毎のキーワード、静止画キー、音声キー
等)、所定の特徴量を重視する度合いである重み、AN
D/ORや返却上限数等の指定によって構成され、検索
エンジンの種別によって指定される項目は異なる。
【0025】「カテゴリ」は、同一性質のデータが属す
る部類である。
る部類である。
【0026】「カテゴリ識別子」は、様々なメディアで
表現されている識別子であって、同一のカテゴリに属す
るデータを関連付ける識別子である。
表現されている識別子であって、同一のカテゴリに属す
るデータを関連付ける識別子である。
【0027】図1は、本発明の一実施例である分散マル
チメディア情報の検索装置100の構成を示すブロック
図である。
チメディア情報の検索装置100の構成を示すブロック
図である。
【0028】分散マルチメディア情報検索装置100
は、ユーザインタフェース部110と、構文解析部12
0と、メディア変換部130と、一括検索処理部140
と、情報源アクセス部150と、メディア変換データ記
憶部160と、メディア変換データ管理部165と、ユ
ーザデータ記憶部170と、ユーザデータ管理部175
と、情報源メタデータ記憶部180と、情報源メタデー
タ管理部185とを有する。
は、ユーザインタフェース部110と、構文解析部12
0と、メディア変換部130と、一括検索処理部140
と、情報源アクセス部150と、メディア変換データ記
憶部160と、メディア変換データ管理部165と、ユ
ーザデータ記憶部170と、ユーザデータ管理部175
と、情報源メタデータ記憶部180と、情報源メタデー
タ管理部185とを有する。
【0029】ユーザインタフェース部110は、アプリ
ケーションプログラム200を介して入力されるユーザ
名210と、ユーザ問い合わせ220とを受け付ける。
ケーションプログラム200を介して入力されるユーザ
名210と、ユーザ問い合わせ220とを受け付ける。
【0030】構文解釈部120は、ユーザインタフェー
ス部110が受け付けたユーザ問い合わせ220の構文
を解析する。
ス部110が受け付けたユーザ問い合わせ220の構文
を解析する。
【0031】メディア変換部130は、検索キー解釈部
131と、メディア変換データ検索部132とを有し、
入力されたユーザ名210を参照し、ユーザ問い合わせ
220に含まれている検索キーのメディア種別を変換す
る。
131と、メディア変換データ検索部132とを有し、
入力されたユーザ名210を参照し、ユーザ問い合わせ
220に含まれている検索キーのメディア種別を変換す
る。
【0032】検索キー解釈部131は、ユーザ220に
含まれている検索キーが属するカテゴリのカテゴリ識別
子を特定する。メディア変換データ検索部132は、入
力されたユーザ名210を参照し、検索キー解釈部13
1で特定されたカテゴリ識別子に対応付けられている異
種メディアで表現されたデータ(検索キーグループ)を
検索する。
含まれている検索キーが属するカテゴリのカテゴリ識別
子を特定する。メディア変換データ検索部132は、入
力されたユーザ名210を参照し、検索キー解釈部13
1で特定されたカテゴリ識別子に対応付けられている異
種メディアで表現されたデータ(検索キーグループ)を
検索する。
【0033】一括検索処理部140は、各検索エンジン
によって管理されている情報源から、マルチメディア情
報を一括して検索するものであり、情報源所在探索部1
41と、利用情報検索部142と、情報源問い合わせ生
成部143と、検索結果処理部144とを有する。
によって管理されている情報源から、マルチメディア情
報を一括して検索するものであり、情報源所在探索部1
41と、利用情報検索部142と、情報源問い合わせ生
成部143と、検索結果処理部144とを有する。
【0034】情報源所在探索部141は、メディア変換
データ検索部132で検索された検索キーグループを用
いて検索可能な情報源の所在と上記情報源を管理してい
る検索エンジンとを探索する。
データ検索部132で検索された検索キーグループを用
いて検索可能な情報源の所在と上記情報源を管理してい
る検索エンジンとを探索する。
【0035】利用情報検索部142は、入力されたユー
ザ名210を参照し、上記ユーザが各情報源を検索する
ときに必要となる項目(類似検索では重み等)を検索す
る。
ザ名210を参照し、上記ユーザが各情報源を検索する
ときに必要となる項目(類似検索では重み等)を検索す
る。
【0036】情報源問い合わせ生成部143は、情報源
アクセス部150が送出する情報源問い合わせ320を
生成する。
アクセス部150が送出する情報源問い合わせ320を
生成する。
【0037】検索結果処理部144は、各情報源310
から取得し、情報源アクセス部150が受信した情報源
検索結果330に対して、ユーザ問い合わせ220に応
じた処理(返却上限数によるフィルタリング等の処理)
を行う。
から取得し、情報源アクセス部150が受信した情報源
検索結果330に対して、ユーザ問い合わせ220に応
じた処理(返却上限数によるフィルタリング等の処理)
を行う。
【0038】情報源アクセス部150は、生成された情
報源問い合わせ320を各情報源310に送信し、オー
プンなネットワーク上に分散しているマルチメディア情
報を取得する。この情報源アクセス部150には、複数
の情報源310a,310b,…,320a,320
b,…を管理する複数の検索エンジン300a,300
b,…が、通信網340を介して接続されている。
報源問い合わせ320を各情報源310に送信し、オー
プンなネットワーク上に分散しているマルチメディア情
報を取得する。この情報源アクセス部150には、複数
の情報源310a,310b,…,320a,320
b,…を管理する複数の検索エンジン300a,300
b,…が、通信網340を介して接続されている。
【0039】メディア変換データ記憶部160は、カテ
ゴリ識別子、異種メディアで表現されたデータ(検索キ
ーグループ)と、両者の対応関係等のメディア変換に関
する情報とを記憶し、管理する。
ゴリ識別子、異種メディアで表現されたデータ(検索キ
ーグループ)と、両者の対応関係等のメディア変換に関
する情報とを記憶し、管理する。
【0040】メディア変換データ管理部165は、メデ
ィア変換データ記憶部160に対する各種データの入力
/削除/変更を行う。システム管理者は、メディア変換
データ管理部165を介して、自動または手動によっ
て、メディア変換データを登録、管理する。
ィア変換データ記憶部160に対する各種データの入力
/削除/変更を行う。システム管理者は、メディア変換
データ管理部165を介して、自動または手動によっ
て、メディア変換データを登録、管理する。
【0041】ユーザデータ記憶部170は、検索を実行
するユーザに関する情報を記憶し、管理する。
するユーザに関する情報を記憶し、管理する。
【0042】ユーザデータ管理部175は、ユーザデー
タ記憶部170に対する各種データの入力/削除/変更
を行う。システム管理者は、ユーザデータ管理部175
を介して、ユーザデータを登録、管理する。
タ記憶部170に対する各種データの入力/削除/変更
を行う。システム管理者は、ユーザデータ管理部175
を介して、ユーザデータを登録、管理する。
【0043】情報源メタデータ記憶部180は、各情報
源310のアクセス情報やユーザが検索するときに必要
となる項目等の情報源310に関する情報を記憶し、管
理する。
源310のアクセス情報やユーザが検索するときに必要
となる項目等の情報源310に関する情報を記憶し、管
理する。
【0044】情報源メタデータ管理部185は、情報源
メタデータ記憶部180に対する各種データの入力/削
除/変更を行う。システム管理者は、情報源メタデータ
管理部185を介して、情報源メタデータを登録、管理
する。
メタデータ記憶部180に対する各種データの入力/削
除/変更を行う。システム管理者は、情報源メタデータ
管理部185を介して、情報源メタデータを登録、管理
する。
【0045】図2は、上記実施例において、メディア変
換データ記憶部160が保有するテーブルの詳細を示す
図である。
換データ記憶部160が保有するテーブルの詳細を示す
図である。
【0046】メディア変換データ記憶部160は、同一
のカテゴリを表すデータを関連付けるカテゴリ識別子を
管理するカテゴリテーブル161と、検索キーとして、
各情報源310に入力するために、様々なメディアで表
現されたデータを管理する検索キーテーブル162と、
カテゴリ識別子とデータとの関連付けを管理する対応関
係テーブル163と、カテゴリ識別子間の上位・下位・
同義関係を管理するシソーラステーブル164とによっ
て構成されている。
のカテゴリを表すデータを関連付けるカテゴリ識別子を
管理するカテゴリテーブル161と、検索キーとして、
各情報源310に入力するために、様々なメディアで表
現されたデータを管理する検索キーテーブル162と、
カテゴリ識別子とデータとの関連付けを管理する対応関
係テーブル163と、カテゴリ識別子間の上位・下位・
同義関係を管理するシソーラステーブル164とによっ
て構成されている。
【0047】図3は、上記実施例において、ユーザデー
タ記憶部170が保有するテーブルの詳細を示す図であ
る。
タ記憶部170が保有するテーブルの詳細を示す図であ
る。
【0048】ユーザデータは、検索を実行するユーザに
関する情報を管理するユーザデータテーブル171によ
って構成されている。
関する情報を管理するユーザデータテーブル171によ
って構成されている。
【0049】図4は、上記実施例において、情報源メタ
データ記憶部180が保有するテーブルの詳細を示す図
である。
データ記憶部180が保有するテーブルの詳細を示す図
である。
【0050】情報源メタデータは、各検索エンジン30
0にアクセスする手段に関する情報を管理する検索エン
ジンテーブル181と、各情報源310の所在情報とア
クセス情報とを管理する情報源テーブル182と、検索
エンジン300による情報源310の管理関係を管理す
る検索エンジン−情報テーブル183と、ユーザが各情
報源310を検索するときに必要となる項目(類似検索
では重み等の項目)を管理する利用情報テーブル184
とによって構成されている。
0にアクセスする手段に関する情報を管理する検索エン
ジンテーブル181と、各情報源310の所在情報とア
クセス情報とを管理する情報源テーブル182と、検索
エンジン300による情報源310の管理関係を管理す
る検索エンジン−情報テーブル183と、ユーザが各情
報源310を検索するときに必要となる項目(類似検索
では重み等の項目)を管理する利用情報テーブル184
とによって構成されている。
【0051】次に、分散マルチメディア情報検索装置1
00における処理手順の概略について説明する。
00における処理手順の概略について説明する。
【0052】図5は、上記実施例において、分散マルチ
メディア情報の検索における全体の概略動作を示すフロ
ーチャートである。
メディア情報の検索における全体の概略動作を示すフロ
ーチャートである。
【0053】分散マルチメディア情報の検索において、
ユーザデータ準備フェーズ(S10)、情報源メタデー
タ準備フェーズ(S20)、メディア変換データ準備フ
ェーズ(S30)、検索フェーズ(S40)の順で、処
理が行われる。
ユーザデータ準備フェーズ(S10)、情報源メタデー
タ準備フェーズ(S20)、メディア変換データ準備フ
ェーズ(S30)、検索フェーズ(S40)の順で、処
理が行われる。
【0054】ユーザデータ準備フェーズ(S10)で
は、検索を実行する前に、システム管理者がユーザデー
タ管理部175を介して、ユーザデータの準備を行う。
は、検索を実行する前に、システム管理者がユーザデー
タ管理部175を介して、ユーザデータの準備を行う。
【0055】情報源メタデータ準備フェーズ(S20)
では、検索を実行する前に、システム管理者が情報源メ
タデータ管理部185を介して、情報源メタデータの準
備を行う。
では、検索を実行する前に、システム管理者が情報源メ
タデータ管理部185を介して、情報源メタデータの準
備を行う。
【0056】メディア変換データ準備フェーズ(S3
0)では、検索を実行する前に、システム管理者または
自動処理によって、メディア変換データ管理部165を
介して、メディア変換データの準備を行う。
0)では、検索を実行する前に、システム管理者または
自動処理によって、メディア変換データ管理部165を
介して、メディア変換データの準備を行う。
【0057】検索フェーズ(S40)は、検索を実行す
るフェーズである。
るフェーズである。
【0058】図6は、上記実施例におけるユーザデータ
準備フェーズ(S10)を具体的に示すフローチャート
である。
準備フェーズ(S10)を具体的に示すフローチャート
である。
【0059】ユーザデータ準備フェーズ(S10)にお
いて、検索を実行するユーザに関する情報を、ユーザデ
ータテーブル171に定義する(S11)。
いて、検索を実行するユーザに関する情報を、ユーザデ
ータテーブル171に定義する(S11)。
【0060】図7は、上記実施例における情報源メタデ
ータ準備フェーズ(S20)を具体的に示すフローチャ
ートである。
ータ準備フェーズ(S20)を具体的に示すフローチャ
ートである。
【0061】情報源メタデータ準備フェーズ(S20)
において、まず、各検索エンジン300にアクセスする
手段に関する情報を、検索エンジンテーブル181に定
義し(S21)、各情報源310の所在情報とアクセス
情報とを、情報源テーブル182に定義し(S22)、
検索エンジン300による情報源310の管理関係を、
検索エンジン−情報源テーブル183に定義し(S2
3)、ユーザが各情報源310を検索するときに必要と
なる項目等を、利用情報テーブル184に定義する(S
24)。
において、まず、各検索エンジン300にアクセスする
手段に関する情報を、検索エンジンテーブル181に定
義し(S21)、各情報源310の所在情報とアクセス
情報とを、情報源テーブル182に定義し(S22)、
検索エンジン300による情報源310の管理関係を、
検索エンジン−情報源テーブル183に定義し(S2
3)、ユーザが各情報源310を検索するときに必要と
なる項目等を、利用情報テーブル184に定義する(S
24)。
【0062】図8は、上記実施例におけるメディア変換
データ準備フェーズ(S30)を具体的に示すフローチ
ャートである。
データ準備フェーズ(S30)を具体的に示すフローチ
ャートである。
【0063】メディア変換データ準備フェーズ(S3
0)において、まず、同一のカテゴリに属するデータを
関連付けるカテゴリ識別子を、カテゴリテーブル161
に定義し(S31)、検索キーとして、各情報源310
に入力するために、様々なメディアで表現されたデータ
を、検索キーテーブル162に定義し(S32)、上記
カテゴリ識別子と上記データとの関連付けを、対応関係
テーブル163に定義し(S33)、カテゴリ識別子間
の上位・下位・同義関係を、シソーラステーブル164
に定義し(S34)、様々なメディアで表現されたデー
タの中から検索キーとして用いることが適しているデー
タを選別する(S35)。
0)において、まず、同一のカテゴリに属するデータを
関連付けるカテゴリ識別子を、カテゴリテーブル161
に定義し(S31)、検索キーとして、各情報源310
に入力するために、様々なメディアで表現されたデータ
を、検索キーテーブル162に定義し(S32)、上記
カテゴリ識別子と上記データとの関連付けを、対応関係
テーブル163に定義し(S33)、カテゴリ識別子間
の上位・下位・同義関係を、シソーラステーブル164
に定義し(S34)、様々なメディアで表現されたデー
タの中から検索キーとして用いることが適しているデー
タを選別する(S35)。
【0064】なお、様々なメディアで表現されたデータ
とカテゴリとの対応関係が明確な複合メディアによって
表現されているデータを用いれば、上記各処理を自動で
行うことができる。
とカテゴリとの対応関係が明確な複合メディアによって
表現されているデータを用いれば、上記各処理を自動で
行うことができる。
【0065】図27は、上記実施例におけるデータの選
別(S35)を具体的に示すフローチャートである。
別(S35)を具体的に示すフローチャートである。
【0066】データの選別とは、あるカテゴリ識別子に
関連付けられた複数のデータの中から、検索キーとして
用いたときに、高い適合率・再現率の検索結果を返却し
得るデータを、なるべく少数選別することである。
関連付けられた複数のデータの中から、検索キーとして
用いたときに、高い適合率・再現率の検索結果を返却し
得るデータを、なるべく少数選別することである。
【0067】まず、検索キーテーブル162に定義され
ている様々なメディアで表現されたデータのうちで、特
定のメディアm(m=1,…,M)で表現されたデータ
を、メディアmが検索可能な検索エンジンによって管理
されている情報源に格納する(S142)。
ている様々なメディアで表現されたデータのうちで、特
定のメディアm(m=1,…,M)で表現されたデータ
を、メディアmが検索可能な検索エンジンによって管理
されている情報源に格納する(S142)。
【0068】次に、特定のユーザu(u=1,…,U)
にとって、特定のカテゴリ識別子c(c=1,…,C)
に関連付けられているデータ集合を、Xとし、データ集
合Xに属している各データを、xiとする(S14
5)。
にとって、特定のカテゴリ識別子c(c=1,…,C)
に関連付けられているデータ集合を、Xとし、データ集
合Xに属している各データを、xiとする(S14
5)。
【0069】各データxiのそれぞれを検索キーとし
て、上記情報源を検索したときに、上位T件の検索結果
を、それぞれY(xi)とする(S146)。
て、上記情報源を検索したときに、上位T件の検索結果
を、それぞれY(xi)とする(S146)。
【0070】データ集合Xから任意個数K個のデータx
λ(1),xλ(2),…,xλ(k)(λ(j)は1からNの
いずれかで、重複しない)を選別し、これらを検索キー
として用いたとき、検索結果の和集合
λ(1),xλ(2),…,xλ(k)(λ(j)は1からNの
いずれかで、重複しない)を選別し、これらを検索キー
として用いたとき、検索結果の和集合
【0071】
【数1】
【0072】を求め(S147)、適合した検索結果で
あるXと
あるXと
【0073】
【数2】
【0074】との共通集合Zを求める(S148)。
【0075】
【数3】
【0076】検索結果を評価する指標として、適合率P
recisionと、再現率Recallと、それらを
重み付き平均したF尺度F_measureとを次式に
よって求める(S149)。但し、α(0≦α≦1)
は、適合率Precisionと再現率Recallと
のどちらを重視するかを表すパラメータであり、システ
ム管理者が予め設定する。また|A|は、集合Aの要素
数を表す。
recisionと、再現率Recallと、それらを
重み付き平均したF尺度F_measureとを次式に
よって求める(S149)。但し、α(0≦α≦1)
は、適合率Precisionと再現率Recallと
のどちらを重視するかを表すパラメータであり、システ
ム管理者が予め設定する。また|A|は、集合Aの要素
数を表す。
【0077】
【数4】
【0078】したがって、「高い適合率・再現率を示す
検索結果を返却し得るデータを検索キーとして、なるべ
く少数選別する」ために、F尺度F_measureを
最大化し、選別個数Kを最小化するデータの組み合わせ
xλ(1),xλ(2),…,xλ (k)をN個のデータから求
める(S150)。
検索結果を返却し得るデータを検索キーとして、なるべ
く少数選別する」ために、F尺度F_measureを
最大化し、選別個数Kを最小化するデータの組み合わせ
xλ(1),xλ(2),…,xλ (k)をN個のデータから求
める(S150)。
【0079】これは、組み合わせ最適化問題に帰着し、
計算の複雑さの意味で、本質的に困難な問題に属する。
そこで、厳密な最適解ではなく、精度の高い近似解を、
短時間で求めるアルゴリズムとして、遺伝的アルゴリズ
ム、タブー探索、焼きなまし法等を適用することができ
る。F尺度F_measureを最大化し、選別個数Q
を最小化するための評価関数Fitnessとして、た
とえば、次式等が考えられる。ただし、β(0≦β≦
1)は、F尺度F_measureの最大化と選別個数
Qの最小化のどちらを重視するかを表すパラメータであ
り、システム管理者が予め設定する。Fitness
が。予め設定した値以上になったときに、得られたデー
タの組み合わせxλ(1),xλ(2),…,xλ(k)を、選
別されたデータとする。
計算の複雑さの意味で、本質的に困難な問題に属する。
そこで、厳密な最適解ではなく、精度の高い近似解を、
短時間で求めるアルゴリズムとして、遺伝的アルゴリズ
ム、タブー探索、焼きなまし法等を適用することができ
る。F尺度F_measureを最大化し、選別個数Q
を最小化するための評価関数Fitnessとして、た
とえば、次式等が考えられる。ただし、β(0≦β≦
1)は、F尺度F_measureの最大化と選別個数
Qの最小化のどちらを重視するかを表すパラメータであ
り、システム管理者が予め設定する。Fitness
が。予め設定した値以上になったときに、得られたデー
タの組み合わせxλ(1),xλ(2),…,xλ(k)を、選
別されたデータとする。
【0080】Fitness=β×F_measure
+(1−β)/K 上記処理を、カテゴリ識別子数C回だけ繰り返し(S1
51、S144)、ユーザ数U回だけ繰り返し(S15
2、S143)、そしてメディア種別数M回だけ繰り返
す(S153、S141)。
+(1−β)/K 上記処理を、カテゴリ識別子数C回だけ繰り返し(S1
51、S144)、ユーザ数U回だけ繰り返し(S15
2、S143)、そしてメディア種別数M回だけ繰り返
す(S153、S141)。
【0081】図9は、上記実施例における検索フェーズ
(S40)を具体的に示すフローチャートである。
(S40)を具体的に示すフローチャートである。
【0082】検索フェーズ(S40)では、まず、ユー
ザインタフェース部110は、アプリケーションプログ
ラム200を介して入力されたユーザ名210と、検索
キーと、検索条件とによって構成されているユーザ問い
合わせ220を受理する(S41)。構文解析部120
は、ユーザ問い合わせ220を解析し、検索キー解釈部
131は、既存の類似検索技術またはパターン認識技術
を用いて、ユーザ問い合わせ220に含まれている検索
キーが属するカテゴリのカテゴリ識別子を、カテゴリテ
ーブル161から特定する(S42)。
ザインタフェース部110は、アプリケーションプログ
ラム200を介して入力されたユーザ名210と、検索
キーと、検索条件とによって構成されているユーザ問い
合わせ220を受理する(S41)。構文解析部120
は、ユーザ問い合わせ220を解析し、検索キー解釈部
131は、既存の類似検索技術またはパターン認識技術
を用いて、ユーザ問い合わせ220に含まれている検索
キーが属するカテゴリのカテゴリ識別子を、カテゴリテ
ーブル161から特定する(S42)。
【0083】そして、メディア変換データ検索部132
は、入力されたユーザ名210を参照し、ステップS4
2で特定されたカテゴリ識別子に対応付けられている異
種メディアで表現されたデータ(検索キーグループ)
を、検索キーテーブル162と、対応関係テーブル16
3と、シソーラステーブル164とから検索する(S4
3)。
は、入力されたユーザ名210を参照し、ステップS4
2で特定されたカテゴリ識別子に対応付けられている異
種メディアで表現されたデータ(検索キーグループ)
を、検索キーテーブル162と、対応関係テーブル16
3と、シソーラステーブル164とから検索する(S4
3)。
【0084】その後、情報源所在探索部141は、メデ
ィア変換データ検索部132が検索した検索キーグルー
プを用いて、検索可能な情報源所在と接続情報とを、情
報源テーブル182から検索し(S44)、この情報源
を管理している検索エンジンを、検索エンジンテーブル
181と検索エンジン−情報源テーブル183とから検
索する(S45)。
ィア変換データ検索部132が検索した検索キーグルー
プを用いて、検索可能な情報源所在と接続情報とを、情
報源テーブル182から検索し(S44)、この情報源
を管理している検索エンジンを、検索エンジンテーブル
181と検索エンジン−情報源テーブル183とから検
索する(S45)。
【0085】利用情報検索部142は、入力されたユー
ザ名210を参照し、この参照されたユーザが各情報源
を検索するときに必要となる項目を、利用情報テーブル
184から検索する(S46)。情報源問い合わせ生成
部143は、ステップS45で検索された検索エンジン
の接続手段に対して、ステップS43で検索された様々
なメディアで表現されたデータ(検索キーグループ)
と、ステップS44で検索された情報源所在と、接続情
報と、ステップS46で検索された項目とを用いて、情
報源問い合わせ320を生成する(S47)。
ザ名210を参照し、この参照されたユーザが各情報源
を検索するときに必要となる項目を、利用情報テーブル
184から検索する(S46)。情報源問い合わせ生成
部143は、ステップS45で検索された検索エンジン
の接続手段に対して、ステップS43で検索された様々
なメディアで表現されたデータ(検索キーグループ)
と、ステップS44で検索された情報源所在と、接続情
報と、ステップS46で検索された項目とを用いて、情
報源問い合わせ320を生成する(S47)。
【0086】そして、検索結果処理部144は、情報源
アクセス部150を介して、情報源検索結果330を取
得し、構文解析部120で解析された検索条件に基づい
て、情報源検索結果330を処理し(S48)、ユーザ
インタフェース部110を介して、検索結果230を出
力する(S49)。
アクセス部150を介して、情報源検索結果330を取
得し、構文解析部120で解析された検索条件に基づい
て、情報源検索結果330を処理し(S48)、ユーザ
インタフェース部110を介して、検索結果230を出
力する(S49)。
【0087】次に、上記実施例における処理手順につい
て具体的に説明する。
て具体的に説明する。
【0088】図10は、上記実施例において、メディア
変換データ準備フェーズで用いる複合メディアで表現さ
れたデータ(HTML文書)の表示と、HTML記述と
の例を示す図である。
変換データ準備フェーズで用いる複合メディアで表現さ
れたデータ(HTML文書)の表示と、HTML記述と
の例を示す図である。
【0089】図10(1)は、メデイア変換データ準備
フェーズで用いる複合メディアで表現されたデータ(H
TML文書)を、WEBブラウザで表示した例を示す図
であり、図10(2)は、図10(1)に示す情報を表
示するHTML文書記述例を示す図である。各HTML
ページの文書構造は、同一であるとする。
フェーズで用いる複合メディアで表現されたデータ(H
TML文書)を、WEBブラウザで表示した例を示す図
であり、図10(2)は、図10(1)に示す情報を表
示するHTML文書記述例を示す図である。各HTML
ページの文書構造は、同一であるとする。
【0090】図11は、検索対象となるHTML文書
を、WEBブラウザで表示した例を示す図である。
を、WEBブラウザで表示した例を示す図である。
【0091】全文検索エンジン“TextSearc
h”によって、キーワードで検索が可能な情報源であ
る。この情報源を検索するためのURLは、“http://w
ww.hoge.net/textsearch.cgi”である。
h”によって、キーワードで検索が可能な情報源であ
る。この情報源を検索するためのURLは、“http://w
ww.hoge.net/textsearch.cgi”である。
【0092】図12は、上記実施例における静止画ファ
イル群の例を示す図である。
イル群の例を示す図である。
【0093】上記静止画ファイル群を格納しているデー
タベース名は、insect_imageであり、接続
するためのユーザ名は、adminであり、パスワード
は、gehogehoである。
タベース名は、insect_imageであり、接続
するためのユーザ名は、adminであり、パスワード
は、gehogehoである。
【0094】上記の通り、図11に示す情報源と、図1
2に示す情報源とは、ネットワーク上での位置が異な
り、検索可能な検索キーのメデイア種別が異なってい
る。
2に示す情報源とは、ネットワーク上での位置が異な
り、検索可能な検索キーのメデイア種別が異なってい
る。
【0095】次に、上記具体例について、図5に示す各
フェーズ(S10、S20、S30、S40)の動作を
説明する。
フェーズ(S10、S20、S30、S40)の動作を
説明する。
【0096】まず、ユーザデータ準備フェーズ(S1
0)について説明する。
0)について説明する。
【0097】図13は、ユーザ識別子とユーザ名との関
係を示すユーザテーブル171の内容を示す図である。
係を示すユーザテーブル171の内容を示す図である。
【0098】つまり、図13に示すように、検索を実行
する仮想的な利用者を示すものとして、ユーザ識別子と
ユーザ名とを、ユーザテーブル171に設定する(S1
1)。たとえば、ユーザ名として、検索の観点を示す
「雌雄同一視・色重視」と、「雌雄区別・形重視」とを
設定する。
する仮想的な利用者を示すものとして、ユーザ識別子と
ユーザ名とを、ユーザテーブル171に設定する(S1
1)。たとえば、ユーザ名として、検索の観点を示す
「雌雄同一視・色重視」と、「雌雄区別・形重視」とを
設定する。
【0099】次に、情報源メタデータ準備フェーズ(S
20)について説明する。
20)について説明する。
【0100】図17は、検索エンジン識別子と検索エン
ジン名とライブラリ名との関係を示す検索エンジンテー
ブル181の内容を示す図である。
ジン名とライブラリ名との関係を示す検索エンジンテー
ブル181の内容を示す図である。
【0101】各検索エンジン300にアクセスする手段
に関する情報として、図17に示すように、検索エンジ
ン識別子と検索エンジン名と接続手段のライブラリ名と
を、検索エンジンテーブル181に設定する(S2
1)。
に関する情報として、図17に示すように、検索エンジ
ン識別子と検索エンジン名と接続手段のライブラリ名と
を、検索エンジンテーブル181に設定する(S2
1)。
【0102】図18は、情報源識別子と情報源名と接続
情報との関係を示す情報源テーブル182の内容を示す
図である。
情報との関係を示す情報源テーブル182の内容を示す
図である。
【0103】各情報源310の所在情報とアクセス情報
として、図18に示すように、情報源識別子と情報源名
と接続情報とを、情報源テーブル182に設定する(S
22)。接続情報は、情報源の種別によって項目の種類
や数が異なるので、XML文書形式とする。
として、図18に示すように、情報源識別子と情報源名
と接続情報とを、情報源テーブル182に設定する(S
22)。接続情報は、情報源の種別によって項目の種類
や数が異なるので、XML文書形式とする。
【0104】図19は、検索エンジン識別子と情報源識
別子との関係を示す検索エンジン−情報テーブル183
の内容を示す図である。
別子との関係を示す検索エンジン−情報テーブル183
の内容を示す図である。
【0105】検索エンジン300による情報源310の
管理関係として、図19に示すように、検索エンジン識
別子と情報源識別子とを、検索エンジン−情報源テーブ
ル183に設定する(S23)。
管理関係として、図19に示すように、検索エンジン識
別子と情報源識別子とを、検索エンジン−情報源テーブ
ル183に設定する(S23)。
【0106】図20は、ユーザ識別子と情報源識別子と
利用情報との関係を示す利用情報テーブル184の内容
を示す図である。
利用情報との関係を示す利用情報テーブル184の内容
を示す図である。
【0107】図20に示すように、ユーザの観点を反映
して、各情報源310を検索するときに必要となる利用
情報(類似検索の場合は、重み等の情報)を、利用情報
テーブル184に設定する(S24)。利用情報は、情
報源の種別によって、項目の種類や数が異なるので、X
ML文書形式とする。
して、各情報源310を検索するときに必要となる利用
情報(類似検索の場合は、重み等の情報)を、利用情報
テーブル184に設定する(S24)。利用情報は、情
報源の種別によって、項目の種類や数が異なるので、X
ML文書形式とする。
【0108】ユーザ「雌雌同一視・色重視」と「雌雄区
別・形重視」にとっての情報源insect_imag
eの利用情報を、それぞれ図20(1)、(2)に示
す。
別・形重視」にとっての情報源insect_imag
eの利用情報を、それぞれ図20(1)、(2)に示
す。
【0109】次に、メディア変換データ準備フェーズ
(S30)を実行する。
(S30)を実行する。
【0110】図14は、カテゴリ識別子とカテゴリ識別
語との関係を示すカテゴリテーブル161の内容を示す
図である。
語との関係を示すカテゴリテーブル161の内容を示す
図である。
【0111】同一のカテゴリを表すデータを関連付ける
ための情報として、図14に示すように、カテゴリ識別
子とカテゴリ識別語とを、カテゴリテーブル161に設
定する(S31)。たとえば、図10に示すHTML文
書である場合、H1タグとH2タグとによって囲まれた
部分を、カテゴリ識別語として設定する。
ための情報として、図14に示すように、カテゴリ識別
子とカテゴリ識別語とを、カテゴリテーブル161に設
定する(S31)。たとえば、図10に示すHTML文
書である場合、H1タグとH2タグとによって囲まれた
部分を、カテゴリ識別語として設定する。
【0112】図15は、データ識別子と検索キー情報と
の関係を示す検索キーテーブル162の内容を示す図で
ある。
の関係を示す検索キーテーブル162の内容を示す図で
ある。
【0113】様々なメディアで表現されたデータとし
て、図15に示すようにデータ識別子とデータの所在
(URL)やメデイア種別を含む検索キー情報を、検索
キーテーブル162に設定する(S32)。
て、図15に示すようにデータ識別子とデータの所在
(URL)やメデイア種別を含む検索キー情報を、検索
キーテーブル162に設定する(S32)。
【0114】たとえば、図10で示したHTML文書の
場合、imgタグで囲まれた画像とPタグで囲まれた文
章の検索キー情報とを、XML文書形式によって設定す
る。なお、検索対象となる文書を管理している検索エン
ジンが、図11に示すように、キーワードを受け付け可
能な全文検索エンジンであるので、Pタグで囲まれた文
書から、形態素解析によってキーワードを抽出し、設定
している。
場合、imgタグで囲まれた画像とPタグで囲まれた文
章の検索キー情報とを、XML文書形式によって設定す
る。なお、検索対象となる文書を管理している検索エン
ジンが、図11に示すように、キーワードを受け付け可
能な全文検索エンジンであるので、Pタグで囲まれた文
書から、形態素解析によってキーワードを抽出し、設定
している。
【0115】また、ユーザ問い合わせ220で入力され
た検索キーが属するカテゴリのカテゴリ識別子を特定す
るために、既存のパターン認識技術や類似検索技術を利
用し、様々なメデイアで表現された実データが管理され
ている。
た検索キーが属するカテゴリのカテゴリ識別子を特定す
るために、既存のパターン認識技術や類似検索技術を利
用し、様々なメデイアで表現された実データが管理され
ている。
【0116】図16は、ユーザ識別子とカテゴリ識別子
とデータ識別子とメディア間類似度との関係を示す対応
関係テーブル163の内容を示す図である。
とデータ識別子とメディア間類似度との関係を示す対応
関係テーブル163の内容を示す図である。
【0117】図16に示すように、ユーザの観点を反映
したカテゴリ識別子と、データ識別子との関連付けを、
対応関係テーブル163に設定する(S33)。たとえ
ば、図10に示すHTML文書である場合、図16
(1)に示す関連付けができる。さらに、カテゴリ識別
子とデータ識別子との関連付けの強さを、メディア間類
似度という属性として[0,1]の連続値で表現するこ
とができる。
したカテゴリ識別子と、データ識別子との関連付けを、
対応関係テーブル163に設定する(S33)。たとえ
ば、図10に示すHTML文書である場合、図16
(1)に示す関連付けができる。さらに、カテゴリ識別
子とデータ識別子との関連付けの強さを、メディア間類
似度という属性として[0,1]の連続値で表現するこ
とができる。
【0118】ユーザ「雌雄同一視・色重視」と「雌雄区
別・形重視」とに対して、カテゴリ識別語と検索キー情
報との対応関係のイメージ図を、それぞれ、図16
(2)、図16(3)に示す。なお、上記実施例では、
カテゴリ識別子間の上位・下位・同義関係をシソーラス
テーブル164に設定する(S34)処理を行わない。
別・形重視」とに対して、カテゴリ識別語と検索キー情
報との対応関係のイメージ図を、それぞれ、図16
(2)、図16(3)に示す。なお、上記実施例では、
カテゴリ識別子間の上位・下位・同義関係をシソーラス
テーブル164に設定する(S34)処理を行わない。
【0119】上記のように、ユーザの観点を反映した多
対多の関連付けが可能である。また、複合メディアで表
現されたデータに関して、各データ間の対応関係が、明
確に文書構造として示されていれば、それを用いて、自
動的にメディア変換データ準備フェーズを行うことも可
能である。
対多の関連付けが可能である。また、複合メディアで表
現されたデータに関して、各データ間の対応関係が、明
確に文書構造として示されていれば、それを用いて、自
動的にメディア変換データ準備フェーズを行うことも可
能である。
【0120】図28は、上記実施例において、カテゴリ
識別語「蝶」に関連付けられているデータ集合を用い
て、データの選別(図27)を行ったときにおけるイメ
ージを示す図である。
識別語「蝶」に関連付けられているデータ集合を用い
て、データの選別(図27)を行ったときにおけるイメ
ージを示す図である。
【0121】図28(1)は、カテゴリ識別語「蝶」に
関連付けられているデータの全てを選択した場合を示す
図である。図28(2)は、データ選別を最適に行った
場合を示す図である。但し、F尺度F_measure
と評価関数Fitnessとの算出に関わるパラメータ
αとβとは、ともに0.5とした。
関連付けられているデータの全てを選択した場合を示す
図である。図28(2)は、データ選別を最適に行った
場合を示す図である。但し、F尺度F_measure
と評価関数Fitnessとの算出に関わるパラメータ
αとβとは、ともに0.5とした。
【0122】次に、検索フェーズ(S40)について説
明する。
明する。
【0123】検索フェーズの処理手順として、ユーザ
「雌雄同一視・色重視」から、以下の、検索キーと返却
上限数とによって構成される簡易な構文のユーザ問い合
わせ220が発行された場合を例に説明する。
「雌雄同一視・色重視」から、以下の、検索キーと返却
上限数とによって構成される簡易な構文のユーザ問い合
わせ220が発行された場合を例に説明する。
【0124】図21は、上記実施例の説明において使用
する検索キーを示す図である。
する検索キーを示す図である。
【0125】検索キー :図21で示される静止画 返却上限数:情報源毎に上位5件。
【0126】まず、ユーザインタフェース部110は、
アプリケーションプログラム200を介して入力される
ユーザ名「雌雄同一視・色重視」と、上記ユーザ問い合
わせ220とを受理する(S41)。
アプリケーションプログラム200を介して入力される
ユーザ名「雌雄同一視・色重視」と、上記ユーザ問い合
わせ220とを受理する(S41)。
【0127】次に、構文解析部120は、上記ユーザ問
い合わせ220を解析し、検索キー解釈部131は、既
存の類似検索技術によって図21に示す検索キーに対し
て、類似した静止面上位N件のデータ識別子(図16に
示すデータ識別子K0004,K000…)を返却す
る。上記N件のデータ識別子とユーザ名「雌雄同一視・
色重視」を示すユーザ識別子U0001とによって、図
16に示す対応関係テーブルを参照し、カテゴリ識別子
を検索する。
い合わせ220を解析し、検索キー解釈部131は、既
存の類似検索技術によって図21に示す検索キーに対し
て、類似した静止面上位N件のデータ識別子(図16に
示すデータ識別子K0004,K000…)を返却す
る。上記N件のデータ識別子とユーザ名「雌雄同一視・
色重視」を示すユーザ識別子U0001とによって、図
16に示す対応関係テーブルを参照し、カテゴリ識別子
を検索する。
【0128】このときに、メディア間類似度と上記N件
の静止画の類似度(上位ほど大きい値)とを乗じた値を
用いて、各カテゴリ識別子を降順に整列して返却する。
ここでは、検索キーが属するカテゴリとして、上記値が
最大値を示したカテゴリ識別子C0001を特定したも
のとする(S42)なお、このステップは、ユーザが候
補となるカテゴリ識別子群から選択するようにしてもよ
い。
の静止画の類似度(上位ほど大きい値)とを乗じた値を
用いて、各カテゴリ識別子を降順に整列して返却する。
ここでは、検索キーが属するカテゴリとして、上記値が
最大値を示したカテゴリ識別子C0001を特定したも
のとする(S42)なお、このステップは、ユーザが候
補となるカテゴリ識別子群から選択するようにしてもよ
い。
【0129】次に、メデイア変換データ検索部132で
は、ユーザ識別子U0001を参照し、上記カテゴリ識
別子C0001に対応付けられている異種メディアで表
現されたデータの検索キー情報を、図15に示す検索キ
ーテーブル162、図16に示す対応関係テーブル16
3から検索すると、以下の4つの検索キー情報が得られ
る(S43)。
は、ユーザ識別子U0001を参照し、上記カテゴリ識
別子C0001に対応付けられている異種メディアで表
現されたデータの検索キー情報を、図15に示す検索キ
ーテーブル162、図16に示す対応関係テーブル16
3から検索すると、以下の4つの検索キー情報が得られ
る(S43)。
【0130】・データ識別子K0001に対する検索キ
ー情報(オスのカブトムシに関する文章から抽出された
キーワード群) ・データ識別子K0002に対する検索キー情報(オス
のカブトムシの静止画像) ・データ識別子K0003に対する検索キー情報(メス
のカブトムシに関する文章から抽出されたキーワード
群) ・データ識別子K0004に対する検索キー情報(メス
のカブトムシの静止画像) なお、上記実施例では、シソーラステーブル164を用
いて、カテゴリ識別子間の上位・下位・同義関係に基づ
いて検索キー情報を検索することは行わない。
ー情報(オスのカブトムシに関する文章から抽出された
キーワード群) ・データ識別子K0002に対する検索キー情報(オス
のカブトムシの静止画像) ・データ識別子K0003に対する検索キー情報(メス
のカブトムシに関する文章から抽出されたキーワード
群) ・データ識別子K0004に対する検索キー情報(メス
のカブトムシの静止画像) なお、上記実施例では、シソーラステーブル164を用
いて、カテゴリ識別子間の上位・下位・同義関係に基づ
いて検索キー情報を検索することは行わない。
【0131】次に、情報源所在探索部141は、上記検
索キー情報を用いて検索可能な情報源と、その接続情報
とを検索する(S44)。図15に示した検索キー情報
のXML文書形式である場合、まず、Keyタグの子要
素が、KeywordタグまたはFileタグであれ
ば、さらに、その子要素のTypeタグの値を既存のX
MLパーザによって確認する。
索キー情報を用いて検索可能な情報源と、その接続情報
とを検索する(S44)。図15に示した検索キー情報
のXML文書形式である場合、まず、Keyタグの子要
素が、KeywordタグまたはFileタグであれ
ば、さらに、その子要素のTypeタグの値を既存のX
MLパーザによって確認する。
【0132】そして、図18に示す情報源テーブル18
2の接続情報のXML文書形式である場合、Accep
table_Keyタグの値と照合することによって、
検索可能な情報源を特定する。
2の接続情報のXML文書形式である場合、Accep
table_Keyタグの値と照合することによって、
検索可能な情報源を特定する。
【0133】上記4つの検索キー情報は、それぞれ、以
下の2つの情報源に対して入力可能である。
下の2つの情報源に対して入力可能である。
【0134】・情報源識別子I0001 データ識別子K0001、K0003に対する検索キー
情報(キーワード群)によって検索可能。
情報(キーワード群)によって検索可能。
【0135】・情報源識別子I0002 データ識別子K0002、K0004に対する検索キー
情報(静止画像)によって検索可能。
情報(静止画像)によって検索可能。
【0136】それぞれの情報源の情報源識別子と接続情
報とを、図18に示す情報源テーブル182から検索す
る。
報とを、図18に示す情報源テーブル182から検索す
る。
【0137】次に、上記情報源を管理している検索エン
ジン識別子とライブラリ名(接続手段)とを、図17に
示す検索エンジンテーブル181と図19に示す検索エ
ンジン−情報源テーブル183とから検索する(S4
5)。
ジン識別子とライブラリ名(接続手段)とを、図17に
示す検索エンジンテーブル181と図19に示す検索エ
ンジン−情報源テーブル183とから検索する(S4
5)。
【0138】上記検索によって、以下の2つの検索エン
ジンが得られたとする。 ・検索エンジン識別子E001、ライブラリ名Text
Search.dll情報源識別子I0001を管理。 ・検索エンジン識別子E002、ライブラリ名Imag
eSearch.dll情報源識別子I0002を管
理。
ジンが得られたとする。 ・検索エンジン識別子E001、ライブラリ名Text
Search.dll情報源識別子I0001を管理。 ・検索エンジン識別子E002、ライブラリ名Imag
eSearch.dll情報源識別子I0002を管
理。
【0139】利用情報検索部142は、ユーザ識別子U
0001を参照し、該ユーザが各情報源を検索するとき
に必要となる利用情報を、図20に示す利用情報テーブ
ル184から検索する(S46)。
0001を参照し、該ユーザが各情報源を検索するとき
に必要となる利用情報を、図20に示す利用情報テーブ
ル184から検索する(S46)。
【0140】この検索によって、以下の2つの利用情報
が得られたとする。 ・ユーザ識別子U0001、情報源I0001に対する
利用情報 ・ユーザ識別子U0001、情報源I0002に対する
利用情報。
が得られたとする。 ・ユーザ識別子U0001、情報源I0001に対する
利用情報 ・ユーザ識別子U0001、情報源I0002に対する
利用情報。
【0141】情報源問い合わせ生成部143は、上記接
続手段(ライブラリ名)に対して、上記検索キー情報と
上記接続情報と上記利用情報とを用いて、情報源問い合
わせ320を生成する(S47)。
続手段(ライブラリ名)に対して、上記検索キー情報と
上記接続情報と上記利用情報とを用いて、情報源問い合
わせ320を生成する(S47)。
【0142】この生成では、以下の2つの情報源問い合
わせ320が得られたとする。
わせ320が得られたとする。
【0143】・情報源名:昆虫百科ホームページに対す
る情報源問い合わせ ライブラリ名:TextSearch.dll 検索キー情報:データ識別子K0001,K0003に
対する検索キー情報(キーワード群) 接続情報 :情報源識別子I0001に対する接続情
報 利用情報 :ユーザ識別子U0001、情報源I00
01に対する利用情報 ・情報源名:insect_imageに対する情報源
問い合わせ ライブラリ名:ImageSearch.dll 検索キー情報:データ識別子K0002、K0004に
対する検索キー情報(静止画像) 接続情報 :情報源識別子I0002に対する接続情
報 利用情報 :ユーザ識別子U0001、情報源I00
02に対する利用情報。
る情報源問い合わせ ライブラリ名:TextSearch.dll 検索キー情報:データ識別子K0001,K0003に
対する検索キー情報(キーワード群) 接続情報 :情報源識別子I0001に対する接続情
報 利用情報 :ユーザ識別子U0001、情報源I00
01に対する利用情報 ・情報源名:insect_imageに対する情報源
問い合わせ ライブラリ名:ImageSearch.dll 検索キー情報:データ識別子K0002、K0004に
対する検索キー情報(静止画像) 接続情報 :情報源識別子I0002に対する接続情
報 利用情報 :ユーザ識別子U0001、情報源I00
02に対する利用情報。
【0144】検索結果処理部144は、情報源アクセス
部150を介して、情報源検索結果330を取得し、構
文解析部120で解析された検索条件である「各情報源
毎に上位5件」に基づいて、情報源結果330を処理す
る(S48)。
部150を介して、情報源検索結果330を取得し、構
文解析部120で解析された検索条件である「各情報源
毎に上位5件」に基づいて、情報源結果330を処理す
る(S48)。
【0145】最後に、ユーザインタフェース部110を
介して、検索結果230を出力する(S49)。
介して、検索結果230を出力する(S49)。
【0146】図22は、アプリケーションプログラム2
00による検索結果の表示例を示す図であり、プロトタ
イプシステムを用いた検索例を示す図である。
00による検索結果の表示例を示す図であり、プロトタ
イプシステムを用いた検索例を示す図である。
【0147】次に、検索フェーズの処理手順の説明とし
て、ユーザ「雌雄区別・形重視」から、以下の検索キー
と、AND/OR条件と、返却上限数とによって構成さ
れる簡易な構文のユーザ問い合わせ220が発行された
場合を例にとって説明する。
て、ユーザ「雌雄区別・形重視」から、以下の検索キー
と、AND/OR条件と、返却上限数とによって構成さ
れる簡易な構文のユーザ問い合わせ220が発行された
場合を例にとって説明する。
【0148】図23は、上記実施例における検索キーを
示す図である。
示す図である。
【0149】検索キー1 :キーワード「ツノ」 検索キー2 :図23で示される静止画 AND/OR条件:(検索キー1)AND(検索キー
2) 返却上限数 :情報源毎に上位5件。
2) 返却上限数 :情報源毎に上位5件。
【0150】まず、ユーザインタフェース部110は、
アプリケーションプログラム200を介して入力される
ユーザ名「雌雄区別・形重視」と、上記ユーザ問い合わ
せ220とを受理する(S41)。
アプリケーションプログラム200を介して入力される
ユーザ名「雌雄区別・形重視」と、上記ユーザ問い合わ
せ220とを受理する(S41)。
【0151】次に、構文解析部120は、上記ユーザ問
い合わせ220を解析し、検索キー解釈部131は、既
存の全文検索技術・類似検索技術によって、検索キー1
に対して、類似した文章上位M件のデータ識別子(K0
004,K000…)と、図23に示す検索キー2に対
して、類似した静止面上位N件のデータ識別子(K00
04,K000…)とを返却する。
い合わせ220を解析し、検索キー解釈部131は、既
存の全文検索技術・類似検索技術によって、検索キー1
に対して、類似した文章上位M件のデータ識別子(K0
004,K000…)と、図23に示す検索キー2に対
して、類似した静止面上位N件のデータ識別子(K00
04,K000…)とを返却する。
【0152】上記M件とN件とのデータ識別子のAND
をとり、ユーザ名「雌雄区別・形重視」を示すユーザ識
別子U0002によって、図16に示す対応関係テーブ
ルを参照し、カテゴリ識別子を検索する。
をとり、ユーザ名「雌雄区別・形重視」を示すユーザ識
別子U0002によって、図16に示す対応関係テーブ
ルを参照し、カテゴリ識別子を検索する。
【0153】このときに、メディア間類似度と上記M件
の文章とN件の静止画の類似度(上位ほど大きい値)と
を乗じた値を用いて、各カテゴリ識別子を降順に整列
し、返却する。
の文章とN件の静止画の類似度(上位ほど大きい値)と
を乗じた値を用いて、各カテゴリ識別子を降順に整列
し、返却する。
【0154】上記のように、異メディアに跨った複数の
検索キーをAND条件で指定できるので、候補となるカ
テゴリ識別子数の発散抑止に有効である。また、異メデ
ィアに跨った複数の検索キーをOR条件で指定できるの
で、より多くの結果を一度に得たい場合に有効である。
カテゴリ識別子特定後の処理は、上記検索フェーズの処
理手順と同じである。
検索キーをAND条件で指定できるので、候補となるカ
テゴリ識別子数の発散抑止に有効である。また、異メデ
ィアに跨った複数の検索キーをOR条件で指定できるの
で、より多くの結果を一度に得たい場合に有効である。
カテゴリ識別子特定後の処理は、上記検索フェーズの処
理手順と同じである。
【0155】上記実施例によれば、同一のカテゴリに属
する異種メデイアで表現されているデータを、同一の識
別子を介して関連付けることによって、問い合わせに含
まれている検索キーのメデイアを変換し、任意のメディ
アを用いた問い合わせによる分散マルチメディア情報を
検索することができる。
する異種メデイアで表現されているデータを、同一の識
別子を介して関連付けることによって、問い合わせに含
まれている検索キーのメデイアを変換し、任意のメディ
アを用いた問い合わせによる分散マルチメディア情報を
検索することができる。
【0156】また、同一のカテゴリを表すための識別子
と、様々なメディアで表現されたデータと、上記識別子
と上記データとの対応関係とを、個々の検索エンジンで
利用されている特徴量に依存せず、統一的な構造で記憶
管理しているので、検索キーとして用いるデータの追加
・削除が容易である。
と、様々なメディアで表現されたデータと、上記識別子
と上記データとの対応関係とを、個々の検索エンジンで
利用されている特徴量に依存せず、統一的な構造で記憶
管理しているので、検索キーとして用いるデータの追加
・削除が容易である。
【0157】さらに、同一のカテゴリに属するが、特徴
量が大きく異なり、特徴量ベクトル空間上で近接してい
ないデータであっても、上記統一的な構造で記憶管理
し、入力された間い合せに含まれる検索キーが属するカ
テゴリの識別子を特定するステップと、特定された識別
子に対応付けられている様々なメディアで表現されたデ
ータを検索するステップとを分けることによって、様々
なマルチメディア情報に対応できるメディアの変換が可
能となる。
量が大きく異なり、特徴量ベクトル空間上で近接してい
ないデータであっても、上記統一的な構造で記憶管理
し、入力された間い合せに含まれる検索キーが属するカ
テゴリの識別子を特定するステップと、特定された識別
子に対応付けられている様々なメディアで表現されたデ
ータを検索するステップとを分けることによって、様々
なマルチメディア情報に対応できるメディアの変換が可
能となる。
【0158】そして、検索を実行するユーザに関する情
報を記憶管理することによって、識別子と、様々なメデ
イアで表現されたデータとの多対多の対応関係に、ユー
ザの観点を反映したメディアの変換ができる。
報を記憶管理することによって、識別子と、様々なメデ
イアで表現されたデータとの多対多の対応関係に、ユー
ザの観点を反映したメディアの変換ができる。
【0159】また、異メディアに跨った検索キーをAN
D条件で指定した問い合わせによって、候補となる識別
子数の発散抑止を行い、適合率を重視した検索結果の絞
込みに有効である。
D条件で指定した問い合わせによって、候補となる識別
子数の発散抑止を行い、適合率を重視した検索結果の絞
込みに有効である。
【0160】さらに、異メディアに跨った検索キーをO
R条件で指定した問い合わせによって、より多くの検索
結果を一度に得ることができ、再現率を重視した検索が
可能である。
R条件で指定した問い合わせによって、より多くの検索
結果を一度に得ることができ、再現率を重視した検索が
可能である。
【0161】そして、個々の検索エンジンで利用されて
いる特徴量に依存せず、識別子を介して、メデイアの変
換を行うことによって、ネットワーク上に分散している
様々なマルチメディア情報を蓄積管理している情報源
を、一括検索することが可能となる。
いる特徴量に依存せず、識別子を介して、メデイアの変
換を行うことによって、ネットワーク上に分散している
様々なマルチメディア情報を蓄積管理している情報源
を、一括検索することが可能となる。
【0162】ところで、上記実施例を、「異メディア間
の関連付けの機能」と、「問い合せの生成機能」との2
つの機能に分割して考えることができる。
の関連付けの機能」と、「問い合せの生成機能」との2
つの機能に分割して考えることができる。
【0163】「メディア変換機能」は、任意のメディア
で表現された検索キーを、情報源毎に入力可能なメディ
アで表現された検索キーに、変換する機能である。
で表現された検索キーを、情報源毎に入力可能なメディ
アで表現された検索キーに、変換する機能である。
【0164】また、「問い合せ生成機能」は、メディア
変換された検索キーを使って、ネットワーク上に分散し
ている個々の既存情報源に対応した問い合せ文を、生成
する機能である。
変換された検索キーを使って、ネットワーク上に分散し
ている個々の既存情報源に対応した問い合せ文を、生成
する機能である。
【0165】メディア変換されて得られた辞書内のキー
は、重み管理辞書が参照され、特徴量毎の重みが付加さ
れ、個々の情報源にあった問い合せが生成される。さら
に、接続情報管理辞書を参照し、問い合せが各情報源に
送られ、検索が実行される。
は、重み管理辞書が参照され、特徴量毎の重みが付加さ
れ、個々の情報源にあった問い合せが生成される。さら
に、接続情報管理辞書を参照し、問い合せが各情報源に
送られ、検索が実行される。
【0166】まず、辞書方式によるメディア変換機能に
ついて説明する。
ついて説明する。
【0167】異メディアによって表現された関連するデ
ータ群は、仮に、それぞれの特徴量空間上で近接してい
なくてもメディア変換できる方が望ましい。また、様々
な検索エンジンヘの入力を想定し、特徴量ではなくファ
イル等データそのものにメディア変換できる方が望まし
い。
ータ群は、仮に、それぞれの特徴量空間上で近接してい
なくてもメディア変換できる方が望ましい。また、様々
な検索エンジンヘの入力を想定し、特徴量ではなくファ
イル等データそのものにメディア変換できる方が望まし
い。
【0168】図24は、辞書方式によるメディア変換を
示す図である。
示す図である。
【0169】そこで、対応する異種メディアのデータ
を、同一のカテゴリを示す識別子を媒介として、直接結
びつける辞書を利用したメディア変換方式(辞書方式)
を提案する(図24)。
を、同一のカテゴリを示す識別子を媒介として、直接結
びつける辞書を利用したメディア変換方式(辞書方式)
を提案する(図24)。
【0170】このときに、対応する異種メディアのデー
タを「辞書内のキー」と呼び、識別子を「見出し」と呼
ぶ。
タを「辞書内のキー」と呼び、識別子を「見出し」と呼
ぶ。
【0171】一般の辞書でも、見出しに対して説明があ
るように、メディア変換辞書では、複数の辞書内のキー
群によって、見出しが説明される。また、同じデータで
あっても、解釈が異なれば、複数の見出しに対応する。
したがって、見出しと辞書内のキーとは、多対多の関係
になる。
るように、メディア変換辞書では、複数の辞書内のキー
群によって、見出しが説明される。また、同じデータで
あっても、解釈が異なれば、複数の見出しに対応する。
したがって、見出しと辞書内のキーとは、多対多の関係
になる。
【0172】「メディア変換辞書」とは、見出しと辞書
内のキーとの対応関係であり、全てを人手で作成してい
ては、膨大な労力がかかり、現実的ではない。Webぺ
一ジ、電子百科辞典等の複合メディア情報を利用し、メ
ディア変換辞書を自動生成する。
内のキーとの対応関係であり、全てを人手で作成してい
ては、膨大な労力がかかり、現実的ではない。Webぺ
一ジ、電子百科辞典等の複合メディア情報を利用し、メ
ディア変換辞書を自動生成する。
【0173】新規メディアの追加に関して、従来は、新
規メディアの特徴量と、各既存メディアの特徴量との間
に、適切なモデルを新たに開発する必要があることに対
して、辞書方式では、統一的な構造で管理できるので、
新規メディアによって表現された辞書内のキーを、見出
しに追加すれば足り、したがって、追加が容易である。
規メディアの特徴量と、各既存メディアの特徴量との間
に、適切なモデルを新たに開発する必要があることに対
して、辞書方式では、統一的な構造で管理できるので、
新規メディアによって表現された辞書内のキーを、見出
しに追加すれば足り、したがって、追加が容易である。
【0174】図25は、上記実施例における検索の流れ
を示す図である。
を示す図である。
【0175】次に、メディア変換機能と、問い合せ生成
機能とを詳細に説明する。
機能とを詳細に説明する。
【0176】上記のように、メディア変換辞書は、「見
出し」に対応する辞書内のキーが、複数結びつく構造で
ある。
出し」に対応する辞書内のキーが、複数結びつく構造で
ある。
【0177】メディア変換は、 ユーザ問い合せ解釈機能 見出しを引く機能 辞書内のキーを引く機能 の3段階の機能によって構成されている。以下、これら
の機能について説明する。
の機能について説明する。
【0178】 ユーザ問い合せ解釈機能 ユーザが入力する検索キーが、辞書内のキーとして存在
していれば、そのキーから、見出しを直接引くことがで
きるが、現実には、辞書内のキーとして、全ての情報を
管理することはできない。そこで、ユーザの入力した検
索キーから、同一メディア内の類似検索技術等を用い
て、辞書内のキーを決定する。この機能を、ユーザ間い
合わせ解釈機能と呼ぶ。
していれば、そのキーから、見出しを直接引くことがで
きるが、現実には、辞書内のキーとして、全ての情報を
管理することはできない。そこで、ユーザの入力した検
索キーから、同一メディア内の類似検索技術等を用い
て、辞書内のキーを決定する。この機能を、ユーザ間い
合わせ解釈機能と呼ぶ。
【0179】 見出しを引く機能 ユーザ問い合せ解釈機能によって特定された辞書内のキ
ーから、見出しを引く機能である。ここで、検索キーが
持つ意味が見出しとして特定されたと言える。
ーから、見出しを引く機能である。ここで、検索キーが
持つ意味が見出しとして特定されたと言える。
【0180】 辞書内のキーを引く機能 特定された見出しから、その見出しに結びつく任意のメ
ディアの辞書内のキーを検索する機能である。これによ
って、検索キーが異なったメディアに変換されたと言え
る。
ディアの辞書内のキーを検索する機能である。これによ
って、検索キーが異なったメディアに変換されたと言え
る。
【0181】次に、問い合せ生成機能について説明す
る。
る。
【0182】メディア変換された検索キーを受け取り、
ネットワーク上に分散している個々の既存情報源に対応
した問い合せ文を生成する。
ネットワーク上に分散している個々の既存情報源に対応
した問い合せ文を生成する。
【0183】ただし、類似検索エンジン毎に特徴量や重
み(ある特徴量を重視する度合い)の種類、数が異なる
ことが一般的である。さらに、問い合せ形式もSQL等
を独自に拡張したもので、類似検索エンジン毎に異な
る。
み(ある特徴量を重視する度合い)の種類、数が異なる
ことが一般的である。さらに、問い合せ形式もSQL等
を独自に拡張したもので、類似検索エンジン毎に異な
る。
【0184】図26は、静止画の類似検索エンジンIm
ageCompass[1]と、QBIC[2]の問い
合せ例を示す図である。
ageCompass[1]と、QBIC[2]の問い
合せ例を示す図である。
【0185】ここで、問い合せ生成機能には、以下の機
能要件が求められる。
能要件が求められる。
【0186】 個々の情報源に対応した適切な問い合
せ生成 類似検索では、情報源毎に管理されているデータの特性
が異なるので、どういった特徴量を重視すれば、適切な
検索結果が得られるかが、異なる。したがって、情報源
毎に適切な問い合わせの生成が望まれる。
せ生成 類似検索では、情報源毎に管理されているデータの特性
が異なるので、どういった特徴量を重視すれば、適切な
検索結果が得られるかが、異なる。したがって、情報源
毎に適切な問い合わせの生成が望まれる。
【0187】 情報源追加への柔軟な対応 情報源毎に物理的・論理的所在や、接続のための情報
(ユーザ名やパスワード等)が異なる。また、類似検索
エンジン毎に、問い合せの形式も異なる。検索対象とし
て情報源が追加されると、これらの異種性を解消し、柔
軟に対応できることが望まれる。
(ユーザ名やパスワード等)が異なる。また、類似検索
エンジン毎に、問い合せの形式も異なる。検索対象とし
て情報源が追加されると、これらの異種性を解消し、柔
軟に対応できることが望まれる。
【0188】提案システムでは、上記機能要件を満た
すために、重み管理辞書で情報源・ユーザ等の単位毎
に、重みを設定・管理できる。
すために、重み管理辞書で情報源・ユーザ等の単位毎
に、重みを設定・管理できる。
【0189】また、上記機能要件を満たすために、情
報源毎の所在や、接続のための情報を、接続情報管理辞
書で管理できる。
報源毎の所在や、接続のための情報を、接続情報管理辞
書で管理できる。
【0190】メディア変換されて得られた辞書内のキー
は、重み管理辞書が参照され、特徴量毎の重みが付加さ
れ、個々の情報源にあった問い合せが生成される。さら
に、接続情報管理辞書を参照し、問い合せが各情報源に
送られ、検索が実行される。
は、重み管理辞書が参照され、特徴量毎の重みが付加さ
れ、個々の情報源にあった問い合せが生成される。さら
に、接続情報管理辞書を参照し、問い合せが各情報源に
送られ、検索が実行される。
【0191】上記実施例によるプロトタイプシステム
は、ユーザが入力する静止画またはキーワードから、辞
書に基づくメディア変換を行い、同じ意味を表す静止画
またはテキストの情報の一括検索が可能である。静止画
の情報源は、画像類似検索エンジンImageComp
ass[1]によって管理され、テキストの情報源は、
全文検索エンジンnamazuによって管理されてい
る。これらの類似検索エンジンは、ユーザ問い合せ解釈
にも用いられる(検索キーからの辞書内のキー特定)。
また、キーワードでのみ検索可能なWebぺ一ジを検索
対象の情報源として加えた。
は、ユーザが入力する静止画またはキーワードから、辞
書に基づくメディア変換を行い、同じ意味を表す静止画
またはテキストの情報の一括検索が可能である。静止画
の情報源は、画像類似検索エンジンImageComp
ass[1]によって管理され、テキストの情報源は、
全文検索エンジンnamazuによって管理されてい
る。これらの類似検索エンジンは、ユーザ問い合せ解釈
にも用いられる(検索キーからの辞書内のキー特定)。
また、キーワードでのみ検索可能なWebぺ一ジを検索
対象の情報源として加えた。
【0192】利用者が情報源の中から、ある昆虫の静止
画で検索したいとする。この場合、図22に示すよう
に、静止画を検索キーとしてアプリケーションに入力す
ると、メディア変換機能によって、辞書内のキーが引か
れる。この辞書内のキーによって、類似検索を行い、検
索結果が得られる。
画で検索したいとする。この場合、図22に示すよう
に、静止画を検索キーとしてアプリケーションに入力す
ると、メディア変換機能によって、辞書内のキーが引か
れる。この辞書内のキーによって、類似検索を行い、検
索結果が得られる。
【0193】このように、上記実施例によれば、ユーザ
が入力した画像キーから、静止画とテキスト情報との一
括検索が可能である。同様に、テキスト情報も検索キー
とすることができる。入力した検索キーは、カブトムシ
のメスの静止画である。ImageCompassの検
索結果は、メスのカブトムシと特徴が類似したゲンゴロ
ウ等が検索されたが、メディア変換辞書を介することに
よって、オスのカブトムシの静止画も検索された。
が入力した画像キーから、静止画とテキスト情報との一
括検索が可能である。同様に、テキスト情報も検索キー
とすることができる。入力した検索キーは、カブトムシ
のメスの静止画である。ImageCompassの検
索結果は、メスのカブトムシと特徴が類似したゲンゴロ
ウ等が検索されたが、メディア変換辞書を介することに
よって、オスのカブトムシの静止画も検索された。
【0194】また、従来、キーワードでのみ検索可能で
あった情報源も、メディア変換機能によって、静止画の
検索キーで一括検索できる。
あった情報源も、メディア変換機能によって、静止画の
検索キーで一括検索できる。
【0195】ところで、上記実施例をプログラムの発明
として把握することができる.つまり、上記実施例は、
任意のメディアで表現された検索キーを、情報源毎に入
力可能なメディアで表現された検索キーに変換するメデ
ィア変換手順と、上記メディア変換された検索キーを使
って、ネットワーク上に分散している個々の既存情報源
に対応した問い合せ文を生成する問い合せ生成手順とを
コンピュータに実行させるプログラムの例である。
として把握することができる.つまり、上記実施例は、
任意のメディアで表現された検索キーを、情報源毎に入
力可能なメディアで表現された検索キーに変換するメデ
ィア変換手順と、上記メディア変換された検索キーを使
って、ネットワーク上に分散している個々の既存情報源
に対応した問い合せ文を生成する問い合せ生成手順とを
コンピュータに実行させるプログラムの例である。
【0196】また、上記実施例は、入力されたユーザ名
と、検索キーと、検索条件とによって構成されているユ
ーザ問い合わせを受理し、この受理したユーザ問い合わ
せを解析し、上記ユーザ問い合わせに含まれている検索
キーが属するカテゴリのカテゴリ識別子を、カテゴリテ
ーブルから特定するカテゴリ識別子特定手順と、入力さ
れたユーザ名を参照し、上記特定されたカテゴリ識別子
に対応付けられている異種メディアで表現されたデータ
である検索キーグループを、検索キーテーブルと、対応
関係テーブルと、シソーラステーブルとから検索する検
索キーグループ検索手順と、メディア変換データ検索部
が検索した検索キーグループを用いて、検索可能な情報
源所在と接続情報とを、情報源テーブルから検索し、こ
の情報源を管理している検索エンジンを、検索エンジン
テーブルと検索エンジン−情報源テーブルとから検索す
る検索エンジン検索手順と、上記入力されたユーザ名を
参照し、この参照されたユーザが各情報源を検索すると
きに必要となる項目を、利用情報テーブルから検索し、
上記検索された検索エンジンによって、上記検索された
様々なメディアで表現されたデータである検索キーグル
ープと、上記検索された情報源所在と、接続情報と、上
記検索された項目とを用いて、情報源問い合わせを生成
する情報源問い合わせ生成手順と、情報源アクセス部を
介して、情報源検索結果を取得し、構文解析部で解析さ
れた検索条件に基づいて、情報源検索結果を処理し、ユ
ーザインタフェース部を介して、検索結果を出力する検
索結果出力手順とをコンピュータに実行させるプログラ
ムの例である。
と、検索キーと、検索条件とによって構成されているユ
ーザ問い合わせを受理し、この受理したユーザ問い合わ
せを解析し、上記ユーザ問い合わせに含まれている検索
キーが属するカテゴリのカテゴリ識別子を、カテゴリテ
ーブルから特定するカテゴリ識別子特定手順と、入力さ
れたユーザ名を参照し、上記特定されたカテゴリ識別子
に対応付けられている異種メディアで表現されたデータ
である検索キーグループを、検索キーテーブルと、対応
関係テーブルと、シソーラステーブルとから検索する検
索キーグループ検索手順と、メディア変換データ検索部
が検索した検索キーグループを用いて、検索可能な情報
源所在と接続情報とを、情報源テーブルから検索し、こ
の情報源を管理している検索エンジンを、検索エンジン
テーブルと検索エンジン−情報源テーブルとから検索す
る検索エンジン検索手順と、上記入力されたユーザ名を
参照し、この参照されたユーザが各情報源を検索すると
きに必要となる項目を、利用情報テーブルから検索し、
上記検索された検索エンジンによって、上記検索された
様々なメディアで表現されたデータである検索キーグル
ープと、上記検索された情報源所在と、接続情報と、上
記検索された項目とを用いて、情報源問い合わせを生成
する情報源問い合わせ生成手順と、情報源アクセス部を
介して、情報源検索結果を取得し、構文解析部で解析さ
れた検索条件に基づいて、情報源検索結果を処理し、ユ
ーザインタフェース部を介して、検索結果を出力する検
索結果出力手順とをコンピュータに実行させるプログラ
ムの例である。
【0197】さらに、上記実施例は、検索を実行するユ
ーザに関する情報を記憶するユーザデータ記憶手順と、
同一のカテゴリに属する様々なメディアによって表現さ
れているデータを、識別子によって対応付けられている
メディア変換に関する情報を記憶するメディア変換デー
タ記憶手順と、上記ユーザに関する情報と上記メディア
変換に関する情報とに基づいて、入力された問い合わせ
に含まれる検索キーをメディア変換するメディア変換手
順と、ネットワーク上に存在する複数の情報源を検索す
るときに必要な項目を定義するメタ情報を記憶する情報
源メタデータ記憶手順と、上記ユーザに関する情報と上
記メタ情報とに基づいて、上記メディア変換された検索
キーを用いて、上記複数の情報源を一括して検索する一
括検索手順とをコンピュータに実行させるプログラムの
例である。
ーザに関する情報を記憶するユーザデータ記憶手順と、
同一のカテゴリに属する様々なメディアによって表現さ
れているデータを、識別子によって対応付けられている
メディア変換に関する情報を記憶するメディア変換デー
タ記憶手順と、上記ユーザに関する情報と上記メディア
変換に関する情報とに基づいて、入力された問い合わせ
に含まれる検索キーをメディア変換するメディア変換手
順と、ネットワーク上に存在する複数の情報源を検索す
るときに必要な項目を定義するメタ情報を記憶する情報
源メタデータ記憶手順と、上記ユーザに関する情報と上
記メタ情報とに基づいて、上記メディア変換された検索
キーを用いて、上記複数の情報源を一括して検索する一
括検索手順とをコンピュータに実行させるプログラムの
例である。
【0198】また、上記実施例は、上記各プログラムを
記録したコンピュータ読み取り可能な記録媒体の例であ
り、この場合、上記記録媒体として、FD、CD、DV
D、HD、半導体メモリ等が考えられる。
記録したコンピュータ読み取り可能な記録媒体の例であ
り、この場合、上記記録媒体として、FD、CD、DV
D、HD、半導体メモリ等が考えられる。
【0199】
【発明の効果】本発明によれば、画像・映像等の非テキ
スト情報をも検索キーとするマルチメディア・データベ
ースシステムにおいて、検索キーと検索対象のコンテン
ツとが異なる形式(たとえば、テキストと画像)である
場合でも、ユーザが所望するコンテンツを検索すること
ができるという効果を奏する。
スト情報をも検索キーとするマルチメディア・データベ
ースシステムにおいて、検索キーと検索対象のコンテン
ツとが異なる形式(たとえば、テキストと画像)である
場合でも、ユーザが所望するコンテンツを検索すること
ができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例である分散マルチメディア情
報の検索装置100の構成を示すブロック図である。
報の検索装置100の構成を示すブロック図である。
【図2】上記実施例において、メディア変換データ記憶
部160が保有するテーブルの詳細を示す図である。
部160が保有するテーブルの詳細を示す図である。
【図3】上記実施例において、ユーザデータ記憶部17
0が保有するテーブルの詳細を示す図である。
0が保有するテーブルの詳細を示す図である。
【図4】上記実施例において、情報源メタデータ記憶部
180が保有するテーブルの詳細を示す図である。
180が保有するテーブルの詳細を示す図である。
【図5】上記実施例において、分散マルチメディア情報
の検索における全体の概略動作を示すフローチャートで
ある。
の検索における全体の概略動作を示すフローチャートで
ある。
【図6】上記実施例におけるユーザデータ準備フェーズ
(S10)を具体的に示すフローチャートである。
(S10)を具体的に示すフローチャートである。
【図7】上記実施例における情報源メタデータ準備フェ
ーズ(S20)を具体的に示すフローチャートである。
ーズ(S20)を具体的に示すフローチャートである。
【図8】上記実施例におけるメディア変換データ準備フ
ェーズ(S30)を具体的に示すフローチャートであ
る。
ェーズ(S30)を具体的に示すフローチャートであ
る。
【図9】上記実施例における検索フェーズ(S40)を
具体的に示すフローチャートである。
具体的に示すフローチャートである。
【図10】上記実施例において、メディア変換データ準
備フェーズで用いる複合メディアで表現されたデータ
(HTML文書)の表示と、HTML記述との例を示す
図である。
備フェーズで用いる複合メディアで表現されたデータ
(HTML文書)の表示と、HTML記述との例を示す
図である。
【図11】検索対象となるHTML文書を、WEBブラ
ウザで表示した例の図である。
ウザで表示した例の図である。
【図12】上記実施例における静止画ファイル群の例を
示す図である。
示す図である。
【図13】ユーザ識別子とユーザ名との関係を示すユー
ザテーブル171の内容を示す図である。
ザテーブル171の内容を示す図である。
【図14】カテゴリ識別子とカテゴリ識別語との関係を
示すカテゴリテーブル161の内容を示す図である。
示すカテゴリテーブル161の内容を示す図である。
【図15】データ識別子と検索キー情報との関係を示す
検索キーテーブル162の内容を示す図である。
検索キーテーブル162の内容を示す図である。
【図16】ユーザ識別子とカテゴリ識別子とデータ識別
子とメディア間類似度との関係を示す対応関係テーブル
163の内容を示す図である。
子とメディア間類似度との関係を示す対応関係テーブル
163の内容を示す図である。
【図17】検索エンジン識別子と検索エンジン名とライ
ブラリ名との関係を示す検索エンジンテーブル181の
内容を示す図である。
ブラリ名との関係を示す検索エンジンテーブル181の
内容を示す図である。
【図18】情報源識別子と情報源名と接続情報との関係
を示す情報源テーブル182の内容を示す図である。
を示す情報源テーブル182の内容を示す図である。
【図19】検索エンジン識別子と情報源識別子との関係
を示す検索エンジン−情報テーブル183の内容を示す
図である。
を示す検索エンジン−情報テーブル183の内容を示す
図である。
【図20】ユーザ識別子と情報源識別子と利用情報との
関係を示す利用情報テーブル184の内容を示す図であ
る。
関係を示す利用情報テーブル184の内容を示す図であ
る。
【図21】上記実施例の説明において使用する検索キー
を示す図である。
を示す図である。
【図22】アプリケーションプログラム200による検
索結果の表示例を示す図であり、プロトタイプシステム
を用いた検索例を示す図である。
索結果の表示例を示す図であり、プロトタイプシステム
を用いた検索例を示す図である。
【図23】上記実施例における検索キーを示す図であ
る。
る。
【図24】辞書方式によるメディア変換を示す図であ
る。
る。
【図25】上記実施例における検索の流れを示す図であ
る。
る。
【図26】静止画の類似検索エンジンImageCom
pass[1]と、QBIC[2]の問い合せ例を示す
図である。
pass[1]と、QBIC[2]の問い合せ例を示す
図である。
【図27】上記実施例におけるデータの選別(S35)
を具体的に示すフローチャートである。
を具体的に示すフローチャートである。
【図28】上記実施例において、カテゴリ識別語「蝶」
に関連付けられているデータ集合を用いて、データの選
別(図27)を行ったときにおけるイメージを示す図で
ある。
に関連付けられているデータ集合を用いて、データの選
別(図27)を行ったときにおけるイメージを示す図で
ある。
100…分散マルチメディア情報検索装置、 110…ユーザインタフェース部、 120…構文解析部、 130…メディア変換部、 131…検索キー解釈部、 132…メディア変換データ検索部、 140…一括検索処理部、 141…情報源所在探索部、 142…利用情報検索部、 143…情報源問い合わせ生成部、 144…検索結果処理部、 150…情報源アクセス部、 160…メディア変換データ記憶部、 161…カテゴリテーブル、 162…検索キーテーブル、 163…対応関係テーブル、 164…シソーラステーブル、 165…メディア変換データ管理部、 170…ユーザデータ記憶部、 171…ユーザデータテーブル、 175…ユーザデータ管理部、 180…情報源メタデータ記憶部、 181…検索エンジンテーブル、 182…情報源テーブル、 183…検索エンジン−情報テーブル、 184…利用情報テーブル、 185…情報源メタデータ管理部、 200…アプリケーションプログラム、 210…ユーザ名、 220…ユーザ問い合わせ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 飯塚 裕一 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 小西 一也 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 KK02 ND16 NK02 NK46 PP23 PR06 QM08
Claims (23)
- 【請求項1】 任意のメディアで表現されている検索キ
ーを、情報源毎に入力可能なメディアで表現されている
検索キーに変換するメディア変換手段と;上記メディア
変換された検索キーを使って、ネットワーク上に分散し
ている個々の既存情報源に対応した問い合せ文を生成す
る問い合せ生成手段と;を有することを特徴とする分散
マルチメディア情報の検索装置。 - 【請求項2】 請求項1において、 上記メディア変換手段は、ユーザ問い合わせ解釈手段
と、見出しを引く手段と、辞書内のキーを引く手段とに
よって構成されていることを特徴とする分散マルチメデ
ィア情報の検索装置。 - 【請求項3】 請求項2において、 上記ユーザ問い合わせ解釈手段は、ユーザの入力した検
索キーから、同一メディア内の類似検索技術等を用い
て、辞書内のキーを決定する手段であり、 上記見出しを引く手段は、上記ユーザ問い合せ解釈手段
によって特定された辞書内のキーから、見出しを引き、
上記検索キーが持つ意味を見出しとして特定する手段で
あり、 上記辞書内のキーを引く手段は、上記特定された見出し
から、その見出しに結びつく任意のメディアに設けられ
ている辞書内のキーを検索し、上記検索キーを、互いに
異なるメディアに変換する手段であることを特徴とする
分散マルチメディア情報の検索装置。 - 【請求項4】 請求項1において、 上記問い合せ生成手段は、情報源単位またはユーザ単位
毎に、重みを設定、管理する重み管理辞書を使用して問
合せを生成する手段であり、 また、情報源毎の所在または接続のための情報を管理す
る接続情報管理辞書を使用して問合せを生成する手段で
あることを特徴とする分散マルチメディア情報の検索装
置。 - 【請求項5】 入力されたユーザ名と、検索キーと、検
索条件とによって構成されているユーザ問い合わせを受
理し、この受理したユーザ問い合わせを解析し、上記ユ
ーザ問い合わせに含まれている検索キーが属するカテゴ
リのカテゴリ識別子を、カテゴリテーブルから特定する
カテゴリ識別子特定手段と;入力されたユーザ名を参照
し、上記特定されたカテゴリ識別子に対応付けられてい
る異種メディアで表現されたデータである検索キーグル
ープを、検索キーテーブルと、対応関係テーブルと、シ
ソーラステーブルとから検索する検索キーグループ検索
手段と;、メディア変換データ検索部が検索した検索キ
ーグループを用いて、検索可能な情報源所在と接続情報
とを、情報源テーブルから検索し、この情報源を管理し
ている検索エンジンを、検索エンジンテーブルと検索エ
ンジン−情報源テーブルとから検索する検索エンジン検
索手段と;上記入力されたユーザ名を参照し、この参照
されたユーザが各情報源を検索するときに必要となる項
目を、利用情報テーブルから検索し、上記検索された検
索エンジンの接続手段に対して、上記検索された様々な
メディアで表現されたデータである検索キーグループ
と、上記検索された情報源所在と、接続情報と、上記検
索された項目とを用いて、情報源問い合わせを生成する
情報源問い合わせ生成手段と;情報源アクセス部を介し
て、情報源検索結果を取得し、構文解析部で解析された
検索条件に基づいて、情報源検索結果を処理し、ユーザ
インタフェース部を介して、検索結果を出力する検索結
果出力手段と;を有することを特徴とする分散マルチメ
ディア情報の検索装置。 - 【請求項6】 請求項5において、 検索を実行するユーザに関する情報を、ユーザデータテ
ーブルに定義するユーザデータ準備手段と;同一のカテ
ゴリに属するデータを関連付けるカテゴリ識別子を、カ
テゴリテーブルに定義し、検索キーとして各情報源に入
力するために、様々なメディアで表現されたデータを、
検索キーテーブルに定義し、上記カテゴリ識別子と上記
データの関連付けとを、対応関係テーブルに定義し、カ
テゴリ識別子間の上位・下位・同義関係を、シソーラス
テーブルに定義するメディア変換データ準備手段と;各
検索エンジンにアクセスする手段に関する情報を、検索
エンジンテーブルに定義し、各情報源の所在情報とアク
セス情報とを、情報源テーブルに定義し、検索エンジン
による情報源の管理関係を、検索エンジン−情報源テー
ブルに定義し、ユーザが各情報源を検索するときに必要
となる項目を、利用情報テーブルに定義する情報源メタ
データ準備手段と;を有することを特徴とする分散マル
チメディア情報の検索装置。 - 【請求項7】 検索を実行するユーザに関する情報を記
憶するユーザデータ記憶部と;同一のカテゴリに属する
様々なメディアによって表現されているデータを、識別
子によって対応付けられているメディア変換に関する情
報を記憶するメディア変換データ記憶部と;上記ユーザ
に関する情報と上記メディア変換に関する情報とに基づ
いて、入力された問い合わせに含まれる検索キーをメデ
ィア変換するメディア変換部と;ネットワーク上に存在
する複数の情報源を検索するときに必要な項目を定義す
るメタ情報を記憶する情報源メタデータ記憶部と;上記
ユーザに関する情報と上記メタ情報とに基づいて、上記
メディア変換された検索キーを用いて、上記複数の情報
源を一括して検索する一括検索処理部と;を有すること
を特徴とする分散マルチメディア情報検索装置。 - 【請求項8】 請求項7において、 同一のカテゴリを表す識別子を管理するカテゴリ情報と
様々なメディアで表現されたデータとを検索キーとして
利用するメディアデータ管理情報と、上記識別子と上記
様々なメディアとによって表現されているデータとの多
対多の対応関係を管理する対応関係情報とを記憶するメ
ディア変換データ記憶部と;入力された問い合わせに含
まれる検索キーが属するカテゴリの識別子を、上記カテ
ゴリ情報から特定する検索キー解釈部と;上記ユーザに
関する情報と上記対応関係情報と上記メディアデータ管
理情報とに基づいて、上記得られた識別子から、対応付
けられている様々なメディアで表現されたデータを検索
するメディア変換データ検索部と;を有することを特徴
とする分散マルチメディア情報検索装置。 - 【請求項9】 請求項7において、 各検索エンジンにアクセスする手段に関する情報を管理
する検索エンジン情報と、各情報源の所在情報とアクセ
ス情報とを記憶する情報源情報と、検索エンジンによる
情報源の管理関係を記憶する管理関係情報と、ユーザが
各情報源を検索するときに、必要となる項目を管理する
利用情報とを記憶する情報源メタデータ記憶部と;上記
様々なメディアで表現されたデータから、上記情報源情
報と上記管理関係情報と上記検索エンジン情報とに基づ
いて、検索可能な情報源所在と接続情報と上記情報源と
を管理している検索エンジンを探索する情報源所在探索
部と;上記ユーザに関する情報と上記利用情報とに基づ
いて、上記ユーザが各情報源を検索するときの必要項目
を検索する利用情報検索部と;上記検索エンジンの接続
手段に対して、上記様々なメディアで表現されたデータ
と上記情報源所在および接続情報と上記必要項目を用い
て情報源問い合わせを生成する情報源問い合わせ生成部
と;を有することを特徴とする分散マルチメディア情報
検索装置。 - 【請求項10】 請求項8において、 入力された問い合わせに含まれる異種メディアに跨った
複数の検索キーが属するカテゴリのカテゴリ識別子を、
入力された問い合わせに含まれるAND/OR条件を用
いて、上記カテゴリ情報から特定する検索キー解釈部を
有することを特徴とする分散マルチメディア情報検索装
置。 - 【請求項11】 請求項8において、 上記メディアデータ管理情報に管理されている様々なメ
ディアで表現されているデータの中から、検索キーとし
て用いることが適しているデータを複数選別する手段を
有することを特徴とする分散マルチメディア情報の検索
装置。 - 【請求項12】 請求項11において、 上記検索キーとして用いることが適しているデータを複
数選別する手段は、カテゴリ対応データ記憶手段と、検
索結果記憶手段と、データ組み合わせ最適化手段とによ
って構成されていることを特徴とする分散マルチメディ
ア情報の検索装置。 - 【請求項13】 請求項12において、 上記カテゴリ対応データ記憶手段は、同一のカテゴリを
表すための識別子に対応しているデータを、上記メディ
アデータ管理情報から取得し、記憶する手段であり、 上記検索結果記憶手段は、上記同一のカテゴリを表すた
めの識別子に対応しているデータのそれぞれを、検索キ
ーとして用いた場合における検索結果を記憶する手段で
あり、 上記データ組み合わせ最適化手段は、同一のカテゴリを
表すための識別子に対応しているデータを検索キーとし
て用いたときに、所定の適合率・再現率の検索結果を返
却し得るデータの組み合わせを最適化する手段であるこ
とを特徴とする分散マルチメディア情報の検索装置。 - 【請求項14】 請求項13において、 上記データ組み合わせ最適化手段は、適合率と再現率と
のうちのいずれを重視するかを設定し、また、データ選
別個数の最小化の度合いを設定することによって選別さ
れるデータが異なる手段であることを特徴とする分散マ
ルチメディア情報の記憶装置。 - 【請求項15】 任意のメディアで表現されている検索
キーを、情報源毎に入力可能なメディアで表現されてい
る検索キーに変換するメディア変換段階と;上記メディ
ア変換された検索キーを使って、ネットワーク上に分散
している個々の既存情報源に対応した問い合せ文を生成
する問い合せ生成段階と;を有することを特徴とする分
散マルチメディア情報の検索方法。 - 【請求項16】 入力されたユーザ名と、検索キーと、
検索条件とによって構成されているユーザ問い合わせを
受理し、この受理したユーザ問い合わせを解析し、上記
ユーザ問い合わせに含まれている検索キーが属するカテ
ゴリのカテゴリ識別子を、カテゴリテーブルから特定す
るカテゴリ識別子特定段階と;入力されたユーザ名を参
照し、上記特定されたカテゴリ識別子に対応付けられて
いる異種メディアで表現されたデータである検索キーグ
ループを、検索キーテーブルと、対応関係テーブルと、
シソーラステーブルとから検索する検索キーグループ検
索段階と;メディア変換データ検索部が検索した検索キ
ーグループを用いて、検索可能な情報源所在と接続情報
とを、情報源テーブルから検索し、この情報源を管理し
ている検索エンジンを、検索エンジンテーブルと検索エ
ンジン−情報源テーブルとから検索する検索エンジン検
索段階と;上記入力されたユーザ名を参照し、この参照
されたユーザが各情報源を検索するときに必要となる項
目を、利用情報テーブルから検索し、上記検索された検
索エンジンによって、上記検索された様々なメディアで
表現されたデータである検索キーグループと、上記検索
された情報源所在と、接続情報と、上記検索された項目
とを用いて、情報源問い合わせを生成する情報源問い合
わせ生成段階と;情報源アクセス部を介して、情報源検
索結果を取得し、構文解析部で解析された検索条件に基
づいて、情報源検索結果を処理し、ユーザインタフェー
ス部を介して、検索結果を出力する検索結果出力段階
と;を有することを特徴とする分散マルチメディア情報
の検索方法。 - 【請求項17】 検索を実行するユーザに関する情報を
記憶するユーザデータ記憶段階と;同一のカテゴリに属
する様々なメディアによって表現されているデータを、
識別子によって対応付けられているメディア変換に関す
る情報を記憶するメディア変換データ記憶段階と;上記
ユーザに関する情報と上記メディア変換に関する情報と
に基づいて、入力された問い合わせに含まれる検索キー
をメディア変換するメディア変換段階と;ネットワーク
上に存在する複数の情報源を検索するときに必要な項目
を定義するメタ情報を記憶する情報源メタデータ記憶段
階と;上記ユーザに関する情報と上記メタ情報とに基づ
いて、上記メディア変換された検索キーを用いて、上記
複数の情報源を一括して検索する一括検索段階と;を有
することを特徴とする分散マルチメディア情報検索方
法。 - 【請求項18】 任意のメディアで表現されている検索
キーを、情報源毎に入力可能なメディアで表現されてい
る検索キーに変換するメディア変換手順と;上記メディ
ア変換された検索キーを使って、ネットワーク上に分散
している個々の既存情報源に対応した問い合せ文を生成
する問い合せ生成手順と;をコンピュータに実行させる
プログラム。 - 【請求項19】 入力されたユーザ名と、検索キーと、
検索条件とによって構成されているユーザ問い合わせを
受理し、この受理したユーザ問い合わせを解析し、上記
ユーザ問い合わせに含まれている検索キーが属するカテ
ゴリのカテゴリ識別子を、カテゴリテーブルから特定す
るカテゴリ識別子特定手順と;入力されたユーザ名を参
照し、上記特定されたカテゴリ識別子に対応付けられて
いる異種メディアで表現されたデータである検索キーグ
ループを、検索キーテーブルと、対応関係テーブルと、
シソーラステーブルとから検索する検索キーグループ検
索手順と;メディア変換データ検索部が検索した検索キ
ーグループを用いて、検索可能な情報源所在と接続情報
とを、情報源テーブルから検索し、この情報源を管理し
ている検索エンジンを、検索エンジンテーブルと検索エ
ンジン−情報源テーブルとから検索する検索エンジン検
索手順と;上記入力されたユーザ名を参照し、この参照
されたユーザが各情報源を検索するときに必要となる項
目を、利用情報テーブルから検索し、上記検索された検
索エンジンによって、上記検索された様々なメディアで
表現されたデータである検索キーグループと、上記検索
された情報源所在と、接続情報と、上記検索された項目
とを用いて、情報源問い合わせを生成する情報源問い合
わせ生成手順と;情報源アクセス部を介して、情報源検
索結果を取得し、構文解析部で解析された検索条件に基
づいて、情報源検索結果を処理し、ユーザインタフェー
ス部を介して、検索結果を出力する検索結果出力手順
と;をコンピュータに実行させるプログラム。 - 【請求項20】 検索を実行するユーザに関する情報を
記憶するユーザデータ記憶手順と;同一のカテゴリに属
する様々なメディアによって表現されているデータを、
識別子によって対応付けられているメディア変換に関す
る情報を記憶するメディア変換データ記憶手順と;上記
ユーザに関する情報と上記メディア変換に関する情報と
に基づいて、入力された問い合わせに含まれる検索キー
をメディア変換するメディア変換手順と;ネットワーク
上に存在する複数の情報源を検索するときに必要な項目
を定義するメタ情報を記憶する情報源メタデータ記憶手
順と;上記ユーザに関する情報と上記メタ情報とに基づ
いて、上記メディア変換された検索キーを用いて、上記
複数の情報源を一括して検索する一括検索手順と;をコ
ンピュータに実行させるプログラム。 - 【請求項21】 任意のメディアで表現されている検索
キーを、情報源毎に入力可能なメディアで表現されてい
る検索キーに変換するメディア変換手順と;上記メディ
ア変換された検索キーを使って、ネットワーク上に分散
している個々の既存情報源に対応した問い合せ文を生成
する問い合せ生成手順と;をコンピュータに実行させる
プログラムを記録したコンピュータ読み取り可能な記録
媒体。 - 【請求項22】 入力されたユーザ名と、検索キーと、
検索条件とによって構成されているユーザ問い合わせを
受理し、この受理したユーザ問い合わせを解析し、上記
ユーザ問い合わせに含まれている検索キーが属するカテ
ゴリのカテゴリ識別子を、カテゴリテーブルから特定す
るカテゴリ識別子特定手順と;入力されたユーザ名を参
照し、上記特定されたカテゴリ識別子に対応付けられて
いる異種メディアで表現されたデータである検索キーグ
ループを、検索キーテーブルと、対応関係テーブルと、
シソーラステーブルとから検索する検索キーグループ検
索手順と;メディア変換データ検索部が検索した検索キ
ーグループを用いて、検索可能な情報源所在と接続情報
とを、情報源テーブルから検索し、この情報源を管理し
ている検索エンジンを、検索エンジンテーブルと検索エ
ンジン−情報源テーブルとから検索する検索エンジン検
索手順と;上記入力されたユーザ名を参照し、この参照
されたユーザが各情報源を検索するときに必要となる項
目を、利用情報テーブルから検索し、上記検索された検
索エンジンによって、上記検索された様々なメディアで
表現されたデータである検索キーグループと、上記検索
された情報源所在と、接続情報と、上記検索された項目
とを用いて、情報源問い合わせを生成する情報源問い合
わせ生成手順と;情報源アクセス部を介して、情報源検
索結果を取得し、構文解析部で解析された検索条件に基
づいて、情報源検索結果を処理し、ユーザインタフェー
ス部を介して、検索結果を出力する検索結果出力手順
と;をコンピュータに実行させるプログラムを記録した
コンピュータ読み取り可能な記録媒体。 - 【請求項23】 検索を実行するユーザに関する情報を
記憶するユーザデータ記憶手順と;同一のカテゴリに属
する様々なメディアによって表現されているデータを、
識別子によって対応付けられているメディア変換に関す
る情報を記憶するメディア変換データ記憶手順と;上記
ユーザに関する情報と上記メディア変換に関する情報と
に基づいて、入力された問い合わせに含まれる検索キー
をメディア変換するメディア変換手順と;ネットワーク
上に存在する複数の情報源を検索するときに必要な項目
を定義するメタ情報を記憶する情報源メタデータ記憶手
順と;上記ユーザに関する情報と上記メタ情報とに基づ
いて、上記メディア変換された検索キーを用いて、上記
複数の情報源を一括して検索する一括検索手順と;をコ
ンピュータに実行させるプログラムを記録したコンピュ
ータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001118956A JP2002334099A (ja) | 2001-03-05 | 2001-04-18 | 分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001059569 | 2001-03-05 | ||
JP2001-59569 | 2001-03-05 | ||
JP2001118956A JP2002334099A (ja) | 2001-03-05 | 2001-04-18 | 分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002334099A true JP2002334099A (ja) | 2002-11-22 |
Family
ID=26610599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001118956A Pending JP2002334099A (ja) | 2001-03-05 | 2001-04-18 | 分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002334099A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011514573A (ja) * | 2008-01-15 | 2011-05-06 | アマゾン テクノロジーズ インコーポレーテッド | リコールおよび使用のためのデータのエンハンスおよび記憶 |
JP2011257891A (ja) * | 2010-06-08 | 2011-12-22 | Yahoo Japan Corp | 検索装置 |
JP2012146039A (ja) * | 2011-01-08 | 2012-08-02 | Vri Inc | 情報提供システム |
-
2001
- 2001-04-18 JP JP2001118956A patent/JP2002334099A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011514573A (ja) * | 2008-01-15 | 2011-05-06 | アマゾン テクノロジーズ インコーポレーテッド | リコールおよび使用のためのデータのエンハンスおよび記憶 |
JP2011257891A (ja) * | 2010-06-08 | 2011-12-22 | Yahoo Japan Corp | 検索装置 |
JP2012146039A (ja) * | 2011-01-08 | 2012-08-02 | Vri Inc | 情報提供システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109992645B (zh) | 一种基于文本数据的资料管理系统及方法 | |
Paliwal et al. | Semantics-based automated service discovery | |
US6598043B1 (en) | Classification of information sources using graph structures | |
EP1202187B1 (en) | Image retrieval system and methods with semantic and feature based relevance feedback | |
US8082248B2 (en) | Method and system for document classification based on document structure and written style | |
JP6014725B2 (ja) | 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム | |
US7778988B2 (en) | Information processing device, method, and program for determining relativity between contents | |
WO2007143899A1 (fr) | Système et procédé pour l'extraction intelligente et le traitement d'informations | |
JP2009534735A (ja) | 単一および複数のタクソノミーを管理する方法とシステム | |
US7024405B2 (en) | Method and apparatus for improved internet searching | |
JP2000339350A (ja) | マルチモード情報アクセス | |
CN111061828B (zh) | 一种数字图书馆知识检索方法及装置 | |
JP2011248596A (ja) | 画像入り文書の検索システム及び検索方法 | |
WO2003032199A2 (en) | Classification of information sources using graph structures | |
US20230409624A1 (en) | Multi-modal hierarchical semantic search engine | |
Song et al. | QIVISE: a quantum-inspired interactive video search engine in VBS2023 | |
JP2002334099A (ja) | 分散マルチメディア情報の検索装置、検索方法、プログラムおよび記録媒体 | |
JP2001092844A (ja) | 異種情報源問い合わせ変換方法及び装置及び異種情報源問い合わせ変換プログラムを格納した記憶媒体 | |
US20120117449A1 (en) | Creating and Modifying an Image Wiki Page | |
JP3591813B2 (ja) | データ検索方法、その装置および記録媒体 | |
Nguyen et al. | An adaptive document recognition system for lettrines | |
Ni | An Intelligent Retrieval Algorithm for Digital Literature Promotion Information Based on TRS Information Retrieval | |
JPH09231233A (ja) | ネットワーク検索装置 | |
JP2002015001A (ja) | 概念検索装置、概念検索方法、概念検索プログラムを記録した記録媒体およびコンピュータプログラム | |
Sugiyama | Studies on Improving Retrieval Accuracy in Web Information Retrieval |