JP2009048441A - 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 - Google Patents
情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 Download PDFInfo
- Publication number
- JP2009048441A JP2009048441A JP2007214405A JP2007214405A JP2009048441A JP 2009048441 A JP2009048441 A JP 2009048441A JP 2007214405 A JP2007214405 A JP 2007214405A JP 2007214405 A JP2007214405 A JP 2007214405A JP 2009048441 A JP2009048441 A JP 2009048441A
- Authority
- JP
- Japan
- Prior art keywords
- search
- ontology
- concept
- information
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 67
- 241000614201 Adenocaulon bicolor Species 0.000 claims description 38
- 238000000605 extraction Methods 0.000 claims description 29
- 238000009795 derivation Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 abstract description 5
- 235000015220 hamburgers Nutrition 0.000 description 41
- 238000012545 processing Methods 0.000 description 30
- 238000004458 analytical method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000007726 management method Methods 0.000 description 13
- 239000000463 material Substances 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 235000008429 bread Nutrition 0.000 description 7
- 235000013305 food Nutrition 0.000 description 7
- 230000008520 organization Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 235000013410 fast food Nutrition 0.000 description 6
- 230000002265 prevention Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 239000002453 shampoo Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 3
- 235000005911 diet Nutrition 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 201000000913 Duane retraction syndrome Diseases 0.000 description 2
- 102100035975 Exostosin-like 1 Human genes 0.000 description 2
- 101000875550 Homo sapiens Exostosin-like 1 Proteins 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000162 direct recoil spectroscopy Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】図書館の分類体系とWikipediaカテゴリという性質の異なるオントロジーを統合的に活用することで新たな情報検索のインフラを実現したものである。これによって、Webを手がかりとした図書館の利用によって探索を深めていくという新しい情報探索のパラダイムが世の中に広めることができ、その結果、社会全体のリテラシーの向上に寄与し、図書館の存在意義の再発見、ひいては電子図書館の実現にも資するものである。
【選択図】図6
Description
まず、本発明に至るまでの経緯、本件の発明者らの調査・研究を述べる。
従来の図書館は様々なサービスを提供しているが、その中の一つにレファレンスサービスと呼ばれるサービスがある。
・利用案内:OPACの使用方法を教えて下さい。
・文献調査:江戸時代の農民一揆に関する本を探したい。
・事項調査:大学いもの「大学」は東京大学のことですか?
レファレンスサービスは、利用者の多様な情報ニーズに応える主要な図書館サービスの一つであるが、そのサービスは図書館内でしか受けることができない。また、利用できる時間帯も限られたものである。また、社会人、高齢者、障害者、離島・山間部の住民などからは来館せずに図書館サービスを享受したいというニーズも寄せられている。
そこで、近年では、インターネットを利用して利用者からの質問を受け付けるデジタルレファレンスサービス(DRS)が注目されている。
具体的には、東京大学附属図書館の協力を得て、利用者の質問の傾向、回答者が頻繁に参照するリソース、等について調査した。
現在、東京大学附属図書館が行っているレファレンスサービスは、以下の3種に大別できる。
・文書による参考調査依頼。
・ASKサービス。
平成17年度の統計によれば東京大学附属図書館のカウンターには年間6630件の質問が寄せられた。その種別及び件数は以下の通りである。
・所蔵調査 1675件
・文献調査 718件
・事項調査 233件
・その他 20件
最も多かった利用案内の質問の大半は、既に頻繁になされている質問であり、図書館員が即答できる内容であることが判明した。また、これらの質問の回答は図書館利用ガイド等に既に記載されているものが多いことが判明した。
平成17年度、FAX、郵便、E−mailで寄せられた質問の種別及び件数は以下の通りである。
・所蔵調査 1550件
・文献調査 175件
・事項調査 170件
・その他 90件
図書館員がこれらの質問に対してどのようなリソースを利用しているのかを調べた。
(a)OPACを調べる。
東京大学附属図書館が提供しているDRSの一つに、ASKサービスがある。このASKサービスは、レファレンス質問をWebから行い、回答をメールで受け取るシステムである。
・所蔵調査 21件
・文献調査 11件
・事項調査 12件
・その他 9件
そして、上記利用案内の質問のほとんどは、電子ジャーナルのトラブルであることが判明している。そのため、このASKサービスは電子ジャーナルのトラブルシューティング窓口化しているのが現状である。
上で述べたような状況の下、本発明者らが、どのようにして統合ブラウジングツールを構築するに至ったかを技術的バックグランドを含めて順に説明する。なお、本件発明の特徴の一つは、異種オントロジーの統合ブラウジングツールの開発(図書館の分類体系とフォークソノミー型オントロジーカテゴリの対応)にある。以下、詳細に説明する。
さて、インターネットが一般に普及する以前、情報探索を行うにあたって中心的な役割を果たしていたのは図書館であった。この図書館は、膨大な資料を整理・組織化し、利用者の情報探索に役立てる様々なツールが存在していた。
インターネット普及後、「初期」には Yahoo!などのWebディレクトリが広く利用されていた。インターネットの普及期(1995年〜)より遅れた2000年頃、Googleなどの実用的なWebサーチエンジンが登場したことによって、大抵の検索質問に対して、何らかのWebページを見つけることができるという仕組みが広く利用されるようになった。これは現時点でも変わらず広く利用されている。
ここでは、情報検索ツールとしての図書館の分類体系とWikipediaとの比較を行い、それぞれの長所、短所を整理して説明する。
一般的に図書館情報学分野の専門家によって管理されているものであり、例えば、日本図書館協会では、委員会を組織して日本十進分類法(NDC)や基本件名標目表(BSH)等の改訂作業を行っている。現在は、NDC第9版(NDC9)、BSH第4版(BSH4)が最新版である。
Wikipediaは、Web上でWikiシステムによって、共同編集されているオンライン百科事典であり、誰でもどこからでも自由に編集することができるものである。
情報探索ツールとして図書館の分類体系と、Wikipediaを代表とするフォークソノミー型オントロジーとには、それぞれ異なる利点、欠点が存在する。これが図1に示されている。
このように両者には、様々な利点・欠点の相違があり、係る相違に基づいて情報探索の際に、両者を適切に使い分けることが有用である。
図2には情報探索の活用例を示す。まず、情報探索の出発点としてのWikipediaの活用について説明する。ここで、Wikipediaの記事「阪神・淡路大震災」にはカテゴリとして「日本の経済史」「地震の歴史」が付与されている。さらに、カテゴリ「日本の経済史」には、上位カテゴリとして「経済史」が付与されている。また、カテゴリ「地震の歴史」には、上位カテゴリとして「災害と防災の歴史」及び「地震」が付与されている。このように、Wikipediaの記事を一つ取り上げてみると、関連するカテゴリ群をツリー構造として取り出すことができることが理解されよう。
次に、Wikipediaカテゴリと図書館の分類体系(BSH、NDC)の対応と、図書館の分類体系の活用について説明する。
ここで述べた統合的活用のアプローチは、以下の理由によって、極めて有効であることが明らかである。
図1の下方に示すように、図書館の分類区分(BSH4)とWikipediaカテゴリの間には、カテゴリ名が一致するものが多数存在する。Wikipediaの15,532カテゴリに対して、1,363カテゴリが一致している。したがって、Wikipediaの項目から、図書館の情報資源に誘導できる可能性は大きいと考えられる。
図書館の分類体系(特にBSH)の「項目数が少なく、新しい概念を網羅できていない」という欠点を、Wikipediaカテゴリとの対応によって補うことが可能である。すなわち、Wikipediaに含まれる膨大な数の項目を情報探索の出発点にすることができるので、(潜在的には)世界中のあらゆる概念に対応可能である。
Wikipediaカテゴリはボトムアップ的に構築されているため、浅い組織化に留まっていることも多い。これをそのまま情報探索に利用すると、いわゆるWebサーフィンと同様の結果となり、探索が発散してしまう恐れが大きい。図書館の分類体系と対応して利用することによって、情報探索が収束し、深い探索につなげることが可能となる。
本願発明者らは、上述した図書館の分類体系とWikipediaの統合的利用の最初の試みとして、異種オントロジーの統合ブラウジングツール「レファレンスナビゲータ」を作成した。
現在の図書館の分類体系とWikipediaの対応は、カテゴリ名が文字列レベルで完全に一致したものに限られず、類似したものまで対応を行っている。特に、本発明では、自然言語処理を活用して類似したカテゴリ名まで精度良く対応を行っている。例えば、図2の点線部分で示した関係
「阪神・淡路大震災」 ←→ 「地震災害」、
「日本の経済史」+「平成時代」 ←→ 「NDC332.107」
を対応付けることが可能である。
上述したように、いくつかの図書館で構築されているパスファインダーは情報探索にとって有用なツールであるが、人手で構築されているため、網羅されている項目が著しく少ないという問題がある。そこで、Wikipediaの項目に対してNDC分類記号などを自動推定し、それが付与されている参考図書等を蔵書目録(OPAC)から取得することによって、あらゆる概念についてのパスファインダーを自動生成する。
京都大学付属図書館レファレンスサービスシステム(非特許文献12)や、ダイアログナビ(非特許文献6)などの方法論を発展させて、対話的に図書館利用者の情報検索を支援するシステムを構築した。具体的には、上で述べた統合オントロジーに加えて、情報検索に関する様々なメタ知識(非特許文献13)を知識ベースとして利用するシステムを構築した。
下記特許文献1には、分類番号の関連ファイルを利用した資料情報検索方式が記載されている。分類番号が階層構造を持つことに着目し、検索キーを分類番号に置き換えると共に、その上位・下位レベルも参照できると記載されている。
本実施の形態では、図書館分類とWikipediaという2種のオントロジーを統合させた新しい情報探索システム・情報探索手法を提案する。
NDC(日本十進分類法)は日本で最も普及している図書館資料の書架分類法である。一つの資料に一つのNDCコードが付与される。書架分類法としては、他にも種々知られている。例えば
DDC(デューイ十進分類法)
UDC(国際十進分類法)
NDLC(国立国会図書館分類法)
LLC(米国議会図書館分類表)
が知られている。
BSH(基本件名標目表)は、図書館資料の統制キーワードであり、一つの資料に複数の件名が付与される。また、NDCとの対応がなされている。件名標目表としては、他にも種々知られている。例えば、
LCSH(米国議会図書館件名標目表)
NDLSH(国立国会図書館件名標目票)
が知られている。
2005年頃から普及し始めたWebサービスであり、Flickr、del.icio.us、Youtubeなどが有名である。
インターネット上で共同編集されている多言語百科事典である。各記事にはカテゴリがタグとして付与されている。したがって、フォークソノミーの特徴をも包含する。また、カテゴリにもさらにカテゴリのタグを付与できる。したがって、緩やかな階層構造を取ることも可能である。また、複数の上位概念を付与することができる。したがって、多重承継が可能である。
本願発明者らは、図書館オントロジーをWikipediaで拡張することが有効であろうと考えた。
以上述べたように、図書館オントロジーとWikipediaとを統合することによってより使いやすく、且つより深い専門性の高い情報を探索可能な情報探索システムが実現できると考えられる。この考えに基づき、本願発明者らは、レファレンスナビゲータと呼ばれるシステムを開発し、一定の成果を上げることができた。以下、このレファレンスナビゲータについて説明する。
本レファレンスナビゲータは、Wikipediaと図書館オントロジーとの間で概念の対応を行っているが、その対応は、概念を表すキーワードの文字列が一致する場合だけでなく、文字列の間に一定の類似度がある場合も含めて対応を行っている。
上位概念の説明のため、記法を若干説明する。
K11「地震の歴史」
K12「日本の経済史」
K13「平成時代」
の3個である(図2参照)。
K21「地震」
K22「災害と防災の歴史」
の2個である。なお、第2レベルの上位概念は、他の(第1レベルの)概念を経由して辿る場合もあり、例えば、K23「経済史」が図2に示されている。また、図2には、3次の上位概念であるK31「災害」も記されている。
このように上位概念を辿った場合には、図2に示すように、K21「地震」と完全一致の概念「地震(453)」がNDC、BSH中に存在することが見つけられる。また、K31「災害」に完全一致する概念がNDC、BSH中に存在することが見つけられる。同様に、K23「経済史」と完全一致する概念「経済史(332)」がNDC、BSH中に存在することが見つけられる(図2参照)。
本実施の形態において特徴的なことは、各概念に対して重みによるスコアを計算し、係るスコアによって表示順を決定等していることである。
W(Kmn) = S(Kmn、C(Kmn))×W(C(Kmn))
但し、1<m<t の範囲で計算する。ここでtはしきい値である。これは計算対象となるレベルの深さを一定の値に制限したものである。なお、Kmnは、ノードとも呼ばれる。
その概念の重み = その概念の下位概念との類似度 × その下位概念の重み
という意味をなしている。
C(K)は、概念(ノード)Kの下位概念(ノード)である。
S(K1、K2)は、概念K1と概念K2との類似度である。
W(K)は、概念(ノード)Kへの重みである。
3−5 類似度
類似度S(K1、K2)は、下記の式で計算される。概念K1とK2との類似度は、
この数式中、αは伝搬パラメータであり、例えば0.8等の定数である。
TK1 = 1 「地震」の1個であるので「1」
TK2 = 4 「地震」「震の」「の歴」「歴史」の4個であるので「4」
となる。
TKC = 1 (共通する概念は「地震」の1個である)
となる。
と計算され、類似度は0.6と計算される。
αは伝搬パラメータである。
TKは、概念(ノード)Kのn−gramの総数である。
TKCは、共通するn−gramの数である。
フォークソノミー型オントロジー、すなわちWikipediaの各概念に対して以上のように重みづけをした後、それに基づいて図書館オントロジーの各概念Niに対して導出スコアI(Ni)を計算する。
ここで、Niは、図書館オントロジー中の概念(「地震」「災害」「経済史」等)である。
本実施の形態において特徴的なことは、このI(Ni)の値が大きい順に上位J個のN(図書館オントロジーのエントリ(概念))を選定し、情報探索の結果として出力することである。Jは所定の個数であり、自然数である。
エントリ パス 導出スコア
地震(453) ← 地震の歴史 :0.0906
経済(330) ← 経済史 ← 日本の経済史 :0.0607
災害(369.3) ← 災害
← 災害と防災の歴史
← 地震の歴史 :0.0362
のように表示する。
次に、本実施の形態に係る情報探索システムであるレファレンスナビゲータの構成について説明する。
図12には、ユーザ端末10の構成ブロック図が示されている。
以下、情報検索動作及びそれに伴うパスファインダーの具体的な作成動作をフローチャートに基づき説明する。
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
となる。
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
となる。なお、ここで、BTは上位語を表し、NTは下位語を表す。また、RTは関連語を表す。
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
BTI:パン(588.32)、食品(588)、飲食店(637.97)、ファーストフード、・・・
となる。なお、ここで、BTIは、拡張された上位語リストを表す。
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
BTI:パン(588.32)、食品(588)、飲食店(637.97)、ファーストフード、・・・
INFON:農林水産省(http://www.maff.go.jp )
:外食産業総合調査研究センター(http://www.gaishokusoken.jp/)
:日本フードサービス協会(http://www.jfnet.or.jp )
INFOB:外食産業統計資料集(ISBN:9784906357192 (4906357199))
:外食産業マーケティング便覧(ISBN:不明)
EXTL :東大OPAC(https://opac.dl.itc.u-tokyo.ac.jp/)
:Google(http://www.google.co.jp )
:Amazon(http://www.amazon.co.jp )
となる。
ハンバーガーについて調べるには・・・
・図書館の蔵書を探す : NDC588.32(パン) 588(食品)
・範囲を広げて調べる : パン、食品、飲食店、ファーストフード
・範囲を限定して調べる: モスバーガー、マクドナルド
・関連する項目を調べる: 佐世保バーガー、外食産業
・類似した項目を調べる: ハンバーガー司祭、ハンバーガーチェーン、
ナンバーガール
・外部リソースを検索する:OPAC、Google、Amazon
のようなデータが作成される。
上記第6では、キーボードで質問文を入力した場合の動作をフローチャートに基づき説明したが、本第7では、利用者がマウスで所定のキーワードをクリックした場合の情報検索動作及びそれに伴うパスファインダーの作成動作についてフローチャートに基づき説明する。
Q:「ハンバーガー」を選択
X:ハンバーガー
R:ハンバーガー
となる。
以上述べたように、本実施の形態によれば、Wikipediaのオントロジーと図書館オントロジーとを統合したので、双方の長所を生かした使いやすい情報検索を行うことができる。
これまでWikipediaオントロジーと図書館オントロジーの統合に関して説明してきたが、このWikipediaオントロジーは、より一般的に言えば、フォークソノミーオントロジーと言えるであろう。
(引用終わり)
このようなフォークソノミーにおけるオントロジーをフォークソノミー型オントロジーと呼ぶ。このフォークソノミー型オントロジーの一例として上述したWikipediaオントロジーを位置づけることができる。したがって、本発明は、一般的にこのフォークソノミー型のオントロジーを用いて実現することが可能である。
さて、本実施の形態では、図6〜図12を用いて、システムの構成を説明してきたが、そこに示された各種モジュールやエンジン、インデクサなどは、いずれもプログラムによって構成されている。言い換えれば、コンピュータ(サーバや、クライアントであるユーザ端末)がそれらモジュールを実行することによって、図13〜図15その他、上で述べた動作を行うのである。
(1)以上述べたように、本発明は、情報検索システムに関し、特に図書館オントロジーとフォークソノミー型オントロジーとを組み合わせた点に特徴を有する。
12 キーボード
14 マウス
16 インターネット
18 HTTPサーバ
20 Webアプリケーションエンジン
22 記憶装置
24 関数呼び出し処理エンジン
26 連想検索モジュール
28 セッション管理モジュール
30 利用者認証DB
32 ログDB
34 パスファインダー生成モジュール
36 パスファインダー生成制御ファイル
38 質問文解析モジュールA
40 解析ルール集
42 自然文解析エンジン
44 質問文解析モジュールB
46 質問文解析モジュールC
48 文字列検索モジュール
50 外部リンク生成モジュール
52 外部リンク制御ファイル
54 検索エンジン(1)
56 Aインデックス
58 Bインデックス
60 検索エンジン(1)インデクサ
62 検索エンジン(2)
64 検索エンジン(2)インデクサ
66 Aインデックス
68 Bインデックス
70 オントロジーAインデックス
72 オントロジーBインデックス
74 オントロジー処理モジュール
76 上位概念自動導出モジュール
78 キーワード比較エンジン
80 同義語辞典
90 中央制御モジュール
92 Webドキュメント
94 スクリプトコード
96 マウス選択処理モジュール
98 キー入力処理モジュール
100 履歴管理モジュール
102 履歴保存領域
104 パスファインダー描画エンジン
106 履歴描画エンジン
108 連想検索描画エンジン
Claims (17)
- 利用者からの検索要求に基づき、情報検索を行う情報検索システムにおいて、
前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手段と、
前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手段と、
前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手段と、
を含むことを特徴とする情報検索システム。 - 請求項1記載の情報検索システムにおいて、
少なくとも、前記第1の検索手段が検索した結果と前記第2の検索手段が検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成手段と、
を含むことを特徴とする情報検索システム。 - 請求項2記載の情報検索システムにおいて、
前記パスファインダー作成手段は、前記第2の検索手段が検索した結果とともに、検索要求中のキーワードから前記第2の検索手段が検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索システム。 - 請求項1又は2記載の情報検索システムにおいて、
前記抽出手段は、
フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手段と、
前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手段と、
前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手段と、
を含むことを特徴とする情報検索システム。 - 利用者からの検索要求に基づき、情報検索を行う情報検索方法において、
前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
を含むことを特徴とする情報検索方法。 - 請求項5記載の情報検索方法において、
少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップ、
を含むことを特徴とする情報検索方法。 - 請求項6記載の情報検索方法において、
前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索方法。 - 請求項5又は6記載の情報検索方法において、
前記抽出ステップは、
フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
を含むことを特徴とする情報検索方法。 - コンピュータを、利用者からの検索要求に基づき、情報検索を行う情報検索システムとして動作させるプログラムにおいて、
前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手順と、
前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手順と、
前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手順と、
を、前記コンピュータに実行させることを特徴とするプログラム。 - 請求項9記載のプログラムにおいて、
前記抽出手順は、
フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手順と、
前記各概念に対して付与された前記重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手順と、
前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手順と、
を含むことを特徴とするプログラム。 - 利用者からの検索要求に基づき、情報検索を行ってその結果を前記利用者に提供する情報検索サービス提供方法において、
前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップと、
前記作成したパスファインダーを前記利用者に提供するパスファインダー提供ステップと、
を含むことを特徴とする情報検索サービス提供方法。 - 請求項11記載の情報検索サービス提供方法において、
前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索サービス提供方法。 - 請求項11又は12記載の情報検索サービス提供方法において、
前記抽出ステップは、
フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
を含むことを特徴とする情報検索サービス提供方法。 - 請求項1〜4のいずれか1項に記載の情報検索システムにおいて、
前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索システム。 - 請求項5〜8のいずれか1項に記載の情報検索方法において、
前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索方法。 - 請求項9又は10に記載のプログラムにおいて、
前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするプログラム。 - 請求項11〜13のいずれか1項に記載のサービス提供方法において、
前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするサービス提供方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007214405A JP5283208B2 (ja) | 2007-08-21 | 2007-08-21 | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 |
PCT/JP2008/053760 WO2009025095A1 (ja) | 2007-08-21 | 2008-03-03 | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 |
US12/672,775 US8762404B2 (en) | 2007-08-21 | 2008-03-03 | Information search system, method, and program, and information search service providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007214405A JP5283208B2 (ja) | 2007-08-21 | 2007-08-21 | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009048441A true JP2009048441A (ja) | 2009-03-05 |
JP5283208B2 JP5283208B2 (ja) | 2013-09-04 |
Family
ID=40378004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007214405A Active JP5283208B2 (ja) | 2007-08-21 | 2007-08-21 | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8762404B2 (ja) |
JP (1) | JP5283208B2 (ja) |
WO (1) | WO2009025095A1 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012529717A (ja) * | 2009-06-09 | 2012-11-22 | イービーエイチ エンタープライズィーズ インコーポレイテッド | マイクロブログメッセージの内容を分析する方法 |
JP2014506357A (ja) * | 2011-01-05 | 2014-03-13 | プライマル フュージョン インコーポレイテッド | 1人以上のユーザに関心ある情報を提供する方法及び装置 |
KR101500642B1 (ko) | 2013-01-29 | 2015-03-18 | 한국과학기술원 | 고유 속성을 기반으로 한 개체 인식 방법 및 장치 |
KR101547912B1 (ko) | 2013-08-16 | 2015-08-31 | 방기수 | 진화하는 지식지도 서비스 제공 방법 및 시스템 |
KR101572911B1 (ko) | 2014-02-21 | 2015-12-02 | 한국과학기술원 | 문서 추천 방법, 문서 선택 방법 및 문서 추천 장치 |
JP2016031637A (ja) * | 2014-07-29 | 2016-03-07 | シャープ株式会社 | 表示装置、表示方法、表示プログラム、サーバ、およびネットワークシステム |
JP2016517567A (ja) * | 2013-03-13 | 2016-06-16 | クアルコム,インコーポレイテッド | 関心地点のメタデータを検索するためのデータプロバイダの階層的編成 |
US9378203B2 (en) | 2008-05-01 | 2016-06-28 | Primal Fusion Inc. | Methods and apparatus for providing information of interest to one or more users |
JP2017511922A (ja) * | 2015-01-14 | 2017-04-27 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | スマート質問回答の実現方法、システム、および記憶媒体 |
JP2018205789A (ja) * | 2017-05-30 | 2018-12-27 | 越屋メディカルケア株式会社 | 支援用品検索装置及び支援用品検索システム |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US9600468B2 (en) * | 2009-12-11 | 2017-03-21 | Nec Corporation | Dictionary creation device, word gathering method and recording medium |
US20120303359A1 (en) * | 2009-12-11 | 2012-11-29 | Nec Corporation | Dictionary creation device, word gathering method and recording medium |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
US8943047B1 (en) * | 2011-09-09 | 2015-01-27 | Intuit Inc. | Data aggregation for qualifying a partner candidate |
US8745019B2 (en) * | 2012-03-05 | 2014-06-03 | Microsoft Corporation | Robust discovery of entity synonyms using query logs |
WO2013154947A1 (en) | 2012-04-09 | 2013-10-17 | Vivek Ventures, LLC | Clustered information processing and searching with structured-unstructured database bridge |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
JP5596213B1 (ja) * | 2013-09-05 | 2014-09-24 | 株式会社Ubic | 文書分析システム及び文書分析方法並びに文書分析プログラム |
CN104298661A (zh) * | 2013-12-29 | 2015-01-21 | 新疆信息产业有限责任公司 | 应用电费自助缴费终端柯尔克孜文翻译引擎的方法 |
CN104298660A (zh) * | 2013-12-29 | 2015-01-21 | 新疆信息产业有限责任公司 | 应用电费自助缴费终端哈萨克文翻译引擎的方法 |
CN104636468A (zh) * | 2015-02-10 | 2015-05-20 | 广州供电局有限公司 | 数据查询分析方法和系统 |
CN110851459B (zh) * | 2018-07-25 | 2021-08-13 | 上海柯林布瑞信息技术有限公司 | 一种搜索方法及装置、存储介质、服务器 |
WO2021195130A1 (en) | 2020-03-23 | 2021-09-30 | Sorcero, Inc. | Cross-context natural language model generation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020059289A1 (en) * | 2000-07-07 | 2002-05-16 | Wenegrat Brant Gary | Methods and systems for generating and searching a cross-linked keyphrase ontology database |
US20050256867A1 (en) * | 2004-03-15 | 2005-11-17 | Yahoo! Inc. | Search systems and methods with integration of aggregate user annotations |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08314956A (ja) | 1995-05-16 | 1996-11-29 | Hitachi Ltd | 分類番号関連ファイルを利用した資料情報検索方式 |
JPH10273208A (ja) | 1997-03-31 | 1998-10-13 | Toppan Printing Co Ltd | 図書保管管理システム |
KR100426382B1 (ko) * | 2000-08-23 | 2004-04-08 | 학교법인 김포대학 | 엔트로피 정보와 베이지안 에스오엠을 이용한 문서군집기반의 순위조정 방법 |
US7634501B2 (en) * | 2003-02-05 | 2009-12-15 | Next Generation Software | Method and apparatus for mediated cooperation |
US7433876B2 (en) * | 2004-02-23 | 2008-10-07 | Radar Networks, Inc. | Semantic web portal and platform |
US20070106657A1 (en) * | 2005-11-10 | 2007-05-10 | Brzeski Vadim V | Word sense disambiguation |
US8335753B2 (en) * | 2004-11-03 | 2012-12-18 | Microsoft Corporation | Domain knowledge-assisted information processing |
US7349896B2 (en) * | 2004-12-29 | 2008-03-25 | Aol Llc | Query routing |
JP4787590B2 (ja) | 2005-10-04 | 2011-10-05 | 株式会社リコー | 蔵書検索方法、蔵書検索システム及び蔵書検索プログラム |
US7917519B2 (en) * | 2005-10-26 | 2011-03-29 | Sizatola, Llc | Categorized document bases |
US20070219986A1 (en) * | 2006-03-20 | 2007-09-20 | Babylon Ltd. | Method and apparatus for extracting terms based on a displayed text |
US8019754B2 (en) * | 2006-04-03 | 2011-09-13 | Needlebot Incorporated | Method of searching text to find relevant content |
US8108204B2 (en) * | 2006-06-16 | 2012-01-31 | Evgeniy Gabrilovich | Text categorization using external knowledge |
-
2007
- 2007-08-21 JP JP2007214405A patent/JP5283208B2/ja active Active
-
2008
- 2008-03-03 US US12/672,775 patent/US8762404B2/en active Active
- 2008-03-03 WO PCT/JP2008/053760 patent/WO2009025095A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020059289A1 (en) * | 2000-07-07 | 2002-05-16 | Wenegrat Brant Gary | Methods and systems for generating and searching a cross-linked keyphrase ontology database |
US20050256867A1 (en) * | 2004-03-15 | 2005-11-17 | Yahoo! Inc. | Search systems and methods with integration of aggregate user annotations |
Non-Patent Citations (2)
Title |
---|
CSNG200700482001; 岸田 和明: 'インターネット時代における統制語彙の意義と役割' 情報の科学と技術 Vol.57,No.2, 20070201, pp.62-67., 社団法人情報科学技術協会 * |
JPN6013009582; 岸田 和明: 'インターネット時代における統制語彙の意義と役割' 情報の科学と技術 Vol.57,No.2, 20070201, pp.62-67., 社団法人情報科学技術協会 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9378203B2 (en) | 2008-05-01 | 2016-06-28 | Primal Fusion Inc. | Methods and apparatus for providing information of interest to one or more users |
US9792550B2 (en) | 2008-05-01 | 2017-10-17 | Primal Fusion Inc. | Methods and apparatus for providing information of interest to one or more users |
JP2012529717A (ja) * | 2009-06-09 | 2012-11-22 | イービーエイチ エンタープライズィーズ インコーポレイテッド | マイクロブログメッセージの内容を分析する方法 |
US9323826B2 (en) | 2009-06-09 | 2016-04-26 | Ebh Enterprises Inc. | Methods, apparatus and software for analyzing the content of micro-blog messages |
JP2014506357A (ja) * | 2011-01-05 | 2014-03-13 | プライマル フュージョン インコーポレイテッド | 1人以上のユーザに関心ある情報を提供する方法及び装置 |
KR101500642B1 (ko) | 2013-01-29 | 2015-03-18 | 한국과학기술원 | 고유 속성을 기반으로 한 개체 인식 방법 및 장치 |
JP2016517567A (ja) * | 2013-03-13 | 2016-06-16 | クアルコム,インコーポレイテッド | 関心地点のメタデータを検索するためのデータプロバイダの階層的編成 |
KR101547912B1 (ko) | 2013-08-16 | 2015-08-31 | 방기수 | 진화하는 지식지도 서비스 제공 방법 및 시스템 |
KR101572911B1 (ko) | 2014-02-21 | 2015-12-02 | 한국과학기술원 | 문서 추천 방법, 문서 선택 방법 및 문서 추천 장치 |
JP2016031637A (ja) * | 2014-07-29 | 2016-03-07 | シャープ株式会社 | 表示装置、表示方法、表示プログラム、サーバ、およびネットワークシステム |
JP2017511922A (ja) * | 2015-01-14 | 2017-04-27 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | スマート質問回答の実現方法、システム、および記憶媒体 |
JP2018205789A (ja) * | 2017-05-30 | 2018-12-27 | 越屋メディカルケア株式会社 | 支援用品検索装置及び支援用品検索システム |
Also Published As
Publication number | Publication date |
---|---|
WO2009025095A1 (ja) | 2009-02-26 |
US8762404B2 (en) | 2014-06-24 |
US20110213796A1 (en) | 2011-09-01 |
JP5283208B2 (ja) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5283208B2 (ja) | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 | |
US9384245B2 (en) | Method and system for assessing relevant properties of work contexts for use by information services | |
US7895595B2 (en) | Automatic method and system for formulating and transforming representations of context used by information services | |
Poelmans et al. | Text mining scientific papers: a survey on FCA-based information retrieval research | |
JP2003330948A (ja) | ウェブページを評価する装置および方法 | |
KR101984937B1 (ko) | 전통문화 3d 디지털 연표 표출 시스템 | |
Strzelecki et al. | Direct answers in Google search results | |
TW201804345A (zh) | 基於結構化網路知識的自動中文本體庫建構方法、系統及電腦可讀媒體 | |
Rajasurya et al. | Semantic information retrieval using ontology in university domain | |
JP2024091709A (ja) | 文作成装置、文作成方法および文作成プログラム | |
Lazarinis | Exploring the effectiveness of information searching tools on Greek museum websites | |
Dattolo et al. | Visualbib: narrative views for customized bibliographies | |
Sciascio et al. | A roadmap to user-controllable social exploratory search | |
KR101007056B1 (ko) | 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법 | |
Kolli et al. | A Novel Nlp And Machine Learning Based Text Extraction Approach From Online News Feed | |
Fung et al. | Discover information and knowledge from websites using an integrated summarization and visualization framework | |
Kuroiwa et al. | Dynamic personalization for book recommendation system using web services and virtual library enhancements | |
Abuoda et al. | Automatic Tag Recommendation for the UN Humanitarian Data Exchange. | |
Mohajeri et al. | BubbleNet: An innovative exploratory search and summarization interface with applicability in health social media | |
Killmer et al. | So much information, so little time: Evaluating web resources with search engines | |
Zinvandi et al. | Persian Web Document Retrieval Corpus | |
Aguiar et al. | User Interaction Patterns for Linked Data | |
Pradhan et al. | Faceted Knowledge Organization Approach in Online Public Access Catalogue (OPAC) for Searching and Navigation: A Case Study | |
Ahmed et al. | Web Content Mining: A Solution to Consumer’s Product Hunt | |
Chen et al. | An associative text analyzer to facilitate effectiveness of exploring historical texts for digital humanities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5283208 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |