JP2009048441A - 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 - Google Patents

情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 Download PDF

Info

Publication number
JP2009048441A
JP2009048441A JP2007214405A JP2007214405A JP2009048441A JP 2009048441 A JP2009048441 A JP 2009048441A JP 2007214405 A JP2007214405 A JP 2007214405A JP 2007214405 A JP2007214405 A JP 2007214405A JP 2009048441 A JP2009048441 A JP 2009048441A
Authority
JP
Japan
Prior art keywords
search
ontology
concept
information
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007214405A
Other languages
English (en)
Other versions
JP5283208B2 (ja
Inventor
Yoji Kiyota
陽司 清田
Hiroshi Nakagawa
裕志 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Original Assignee
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC filed Critical University of Tokyo NUC
Priority to JP2007214405A priority Critical patent/JP5283208B2/ja
Priority to PCT/JP2008/053760 priority patent/WO2009025095A1/ja
Priority to US12/672,775 priority patent/US8762404B2/en
Publication of JP2009048441A publication Critical patent/JP2009048441A/ja
Application granted granted Critical
Publication of JP5283208B2 publication Critical patent/JP5283208B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】図書館の分類体系とWikipediaカテゴリという性質の異なるオントロジーを統合的に活用することによって、対話的な情報検索システムを実現することである。
【解決手段】図書館の分類体系とWikipediaカテゴリという性質の異なるオントロジーを統合的に活用することで新たな情報検索のインフラを実現したものである。これによって、Webを手がかりとした図書館の利用によって探索を深めていくという新しい情報探索のパラダイムが世の中に広めることができ、その結果、社会全体のリテラシーの向上に寄与し、図書館の存在意義の再発見、ひいては電子図書館の実現にも資するものである。
【選択図】図6

Description

本発明は、図書館のオントロジーと、Web上のオントロジーとを組み合わせてより効率的なデータを検索する方法・システムに関する。さらにそのようなシステムを形成するプログラムに関する。
A.発明に至るまでの経緯
まず、本発明に至るまでの経緯、本件の発明者らの調査・研究を述べる。
近年、大学図書館や公共図書館においてデジタルレファレンスサービス(DRS)が広く普及し始めている。このDRSとは、インターネットを活用して使用者からの多様な質問を受け付けるレファレンスサービスである。
しかし、現在、提供されているDRSの主流は、後述するようなインタビュー機能を有しておらず、調べたい対象や探索したい事実が漠然としている場合は、必ずしも有効であるとは言えなかった。
A−1. 従来のシステム図書館サービス
従来の図書館は様々なサービスを提供しているが、その中の一つにレファレンスサービスと呼ばれるサービスがある。
レファレンスサービスとは、利用者の資料・情報の検索を図書館員が援助する人的資源サービスである。「図書館のコンシェルジェサービス」とも例えられるサービスである(非特許文献1)。
一般にこのサービスには、非常に一般的で広範囲な質問が寄せられる。例えば、次のような質問がある
・利用案内:OPACの使用方法を教えて下さい。
・所蔵調査:歌舞伎登場人物辞典は東大図書館にありますか?
・文献調査:江戸時代の農民一揆に関する本を探したい。
・事項調査:大学いもの「大学」は東京大学のことですか?
レファレンスサービスは、利用者の多様な情報ニーズに応える主要な図書館サービスの一つであるが、そのサービスは図書館内でしか受けることができない。また、利用できる時間帯も限られたものである。また、社会人、高齢者、障害者、離島・山間部の住民などからは来館せずに図書館サービスを享受したいというニーズも寄せられている。
A−2. デジタルレファレンスサービス(DRS)
そこで、近年では、インターネットを利用して利用者からの質問を受け付けるデジタルレファレンスサービス(DRS)が注目されている。
このDRSは、時間的な特性から見ると、非同期型サービスと同期型サービスとに分類することができる。リアルタイムで回答を得ることができるか否かの違いがある。
主な非同期型サービスとしては電子メールを利用したものが知られている。これは、24時間どこからでも質問をすることができる有用なサービスであるが、従来のレファレンスサービスで重要な役割を果たしていた利用者へのインタビューには不向きであるという欠点がある。
一方、同期型サービスには、米国を中心とするチャットによるサービスが展開されているが、担当者が常駐する必要があるため、コストがかかってしまうという問題点がある。
レファレンスサービスに割くことができる人的資源には限界があるので、現状の図書館の態勢では全ての利用者のニーズを満たすことは困難である。
よって、現在、図書館員が行っているレファレンス応答を自動で行うことができるオンラインシステムが強く望まれている。
そこで、本件の発明者らは、自動レファレンスサービスシステム実現に向けて、必要な知見を得るために、まず、現状で提供されているレファレンスサービスの業務分析を行った。
A−3. 現状の業務分析
具体的には、東京大学附属図書館の協力を得て、利用者の質問の傾向、回答者が頻繁に参照するリソース、等について調査した。
東京大学附属図書館のレファレンスサービスの業務分析
現在、東京大学附属図書館が行っているレファレンスサービスは、以下の3種に大別できる。
・カウンターによる質問の受付。
・文書による参考調査依頼。
・ASKサービス。
A−3−1 カウンターによる質問
平成17年度の統計によれば東京大学附属図書館のカウンターには年間6630件の質問が寄せられた。その種別及び件数は以下の通りである。
・利用案内 3984件
・所蔵調査 1675件
・文献調査 718件
・事項調査 233件
・その他 20件
最も多かった利用案内の質問の大半は、既に頻繁になされている質問であり、図書館員が即答できる内容であることが判明した。また、これらの質問の回答は図書館利用ガイド等に既に記載されているものが多いことが判明した。
A−3−2 文書を介した質問応答
平成17年度、FAX、郵便、E−mailで寄せられた質問の種別及び件数は以下の通りである。
・利用案内 5件
・所蔵調査 1550件
・文献調査 175件
・事項調査 170件
・その他 90件
図書館員がこれらの質問に対してどのようなリソースを利用しているのかを調べた。
その結果
(a)OPACを調べる。
(b)(a)で見つからなければ全学総合目録カードで調べる。
(c)(b)で見つからなければ、東京大学では所蔵していないと判断し、NACSIS Webcatで他大学が所蔵しているかどうか調べる。
また、レファレンス情報源の使用も多かった。例えばJapanKnowledgeのように複数のコンテンツをオンラインで一括検索できるシステムも存在している。
現状のサービス体系では、目的に応じてどのリソースを利用すればよいかを利用者が的確に把握することは困難であると考えられる。
A−3−1−3 ASKサービス
東京大学附属図書館が提供しているDRSの一つに、ASKサービスがある。このASKサービスは、レファレンス質問をWebから行い、回答をメールで受け取るシステムである。
このASKサービスに寄せられる質問の種別及び件数は以下の通りである。
・利用案内 219件
・所蔵調査 21件
・文献調査 11件
・事項調査 12件
・その他 9件
そして、上記利用案内の質問のほとんどは、電子ジャーナルのトラブルであることが判明している。そのため、このASKサービスは電子ジャーナルのトラブルシューティング窓口化しているのが現状である。
このような現状分析の結果、以下のような問題点が把握できた。
1 図書館が提供している情報やリソースが利用者にわかりやすい形で整備されていない。すなわち、図書館が保持している知識や既存のオンラインリソースを体系的に整備する必要がある。
2.インタビュー機能を有するDRSが整備されていない。つまり、対話的に問い合わせができるDRSが有効であると考えられる。米国ではチャット中心のDRSも存在するが司書が不足している我が国では困難な面がある。
上記1からは、図書館が保持している知識や既存のオンラインリソースを体系的に整備する必要性があることがわかる。
この問題に対して、例えば、下記非特許文献4では、大学図書館が今後より積極的に取り組むべき教育支援サービスとして、ある特定のトピックに関する資料や情報を収集する手順を簡便にまとめたパスファインダーの構築と提供が挙げられている。しかし、現在のパスファインダーは、トピック毎に人手で作成しているため、コストが掛かり、網羅している範囲が狭いという問題点がある。
また、上記2からは、対話型のインターフェースを有するDRSが有効であることがわかる。例えば、京都大学附属図書館レファレンスサービスシステム(下記非特許文献5)や、ダイアログナビ(下記非特許文献6)が知られている。
以上のことから、本願発明者らは、利用者の情報探索を支援する資料や利用案内などを利用者の情報要求にしたがって自動的に整理し、対話的に示すシステムが必要であることを強く認識するに至った。言い換えれば、「パスファインダーのオンデマンド生成」が広く望まれていることが明らかになったのである。
このようなシステム実現のためには、図書館の利用方法に関する知識や、OPAC、百科事典、Webサーチエンジンなどの図書館内外の様々なオンラインリソースの統合的な利用が必要である。
特に、本願発明者らは、インターネット上の共同作業によって構築されたWikipediaを代表するフォークソノミー型オントロジーが、既存の百科事典より項目数が多く幅広い範囲の用語が収録されているため、レファレンスツールとして十分に活用可能であると考えた(非特許文献7)。
そこで、本願発明者らは、フォークソノミー型オントロジーと図書館分類とを対応づけ、且つ、対話型のインターフェースを有する情報検索ツールを開発した。
B.本特許出願の情報検索ツール
上で述べたような状況の下、本発明者らが、どのようにして統合ブラウジングツールを構築するに至ったかを技術的バックグランドを含めて順に説明する。なお、本件発明の特徴の一つは、異種オントロジーの統合ブラウジングツールの開発(図書館の分類体系とフォークソノミー型オントロジーカテゴリの対応)にある。以下、詳細に説明する。
B−1.インターネットの普及前
さて、インターネットが一般に普及する以前、情報探索を行うにあたって中心的な役割を果たしていたのは図書館であった。この図書館は、膨大な資料を整理・組織化し、利用者の情報探索に役立てる様々なツールが存在していた。
代表的なツールとしては、日本十進分類法(NDC)(非特許文献8)や、基本件名標目表(非特許文献9)などが挙げられよう。
近代にあっては、図書館に代わって、Web(インターネット)が情報探索の中心的な役割を果たしつつある。
B−2. インターネットの普及後
インターネット普及後、「初期」には Yahoo!などのWebディレクトリが広く利用されていた。インターネットの普及期(1995年〜)より遅れた2000年頃、Googleなどの実用的なWebサーチエンジンが登場したことによって、大抵の検索質問に対して、何らかのWebページを見つけることができるという仕組みが広く利用されるようになった。これは現時点でも変わらず広く利用されている。
しかし、Web上の膨大な情報は十分に組織化されているとは言い難く、情報要求に適したページを見つけることは必ずしも容易ではない。
近年、Web技術を活用することで、膨大な知識を多人数の共同作業によって、組織化しようとする取り組みが盛んに行われつつある。その代表例としては、Wikipedia(http://ja.wikipedia.org)や各種のフォークソノミーサービス(例えばFlickr(http://flickr.com)など)が知られている。
その結果、Web上に一種の情報探索用オントロジーと呼べるものが形成されてきている。これらのオントロジーには、多数の人々の多様な観点が反映されているという大きな利点があるが、限界もまたよく知られている。
これらのオントロジーの構築に関わる人々の中心的な動機は、「自分の興味を満たす情報を効率的に探せるようにしたい」というものであるので、「情報の消費者」としての観点が大きく反映される。
しかし、情報の生産者、言い換えれば「これまであまり知られていない情報を探し出し、新たな知見を生み出したい」という知的探求心を持つ人々の観点は反映されにくい。その理由は、そのような人々は彼らにとって価値の高い情報の資源の所在を秘密にしておきたいという動機が働く傾向にあるからである。
結果として、Web上に存在するオントロジーは浅い組織化に留まる傾向にあり、探索を深く掘り下げていくという用途には必ずしも適してはいなかった。
一方で、Webの世界での変革に対応して図書館の世界においても新たな潮流が見られる。例えば、図書館において情報探索の窓口の役割を果たしているレファレンスサービスでは、Wikipediaをレファレンスツールとして活用しようとする試みがなされている(非特許文献7)。しかし、現在はレファレンスサービス自体が一般的に浸透していないのが現状である(非特許文献10)。
また、特定のトピック毎に図書館が提供できる関連資料をリスト化したパスファインダーと呼ばれる情報資源をWeb上で公開する取り組みも活発に行われている(非特許文献11)。しかし、このパスファインダーは図書館が人手をかけて構築する必要があるため、Web上に存在するオントロジーに比べてごく一部のトピックをカバーしているに過ぎない。図書館はまだWebの変革スピードに追いついてはいないのが現状である。
このように、Webによる情報探索と図書館による情報検索とはそれぞれ問題点を抱えているのが実情である。
そこで、本願発明者らは、解決策として「図書館の分類体系とWeb上で構築された各種オントロジーを対応付け、情報検索の新しいインフラとして活用する」ことを考えた。
このようなことができるシステムを実現することによって、Webを出発点とした情報探索を図書館を利用した深い探索に誘導していくことが可能となる。また、図書館の存在意義の再発見にも繋がると考えられる。
本願発明者らは、具体的には、図書館の分類体系(ここでは、NDC、BSH)と、オントロジーとしてのWikipedia(特にWikipediaのカテゴリ体系)を比較し、それをふまえて、B−2節で両者の比較対応と情報探索への統合的活用法を提案し、その有用性を説明する。
また、後述する「発明を実施するための最良の形態」中の「第3 レファレンスナビゲータ」では、異種オントロジーの統合ブラウジングツールとしてのレファレンスナビゲータを説明する。
B−2 図書館の分類体系とWikipediaの比較
ここでは、情報検索ツールとしての図書館の分類体系とWikipediaとの比較を行い、それぞれの長所、短所を整理して説明する。
B−2−2 図書館の分類体系
一般的に図書館情報学分野の専門家によって管理されているものであり、例えば、日本図書館協会では、委員会を組織して日本十進分類法(NDC)や基本件名標目表(BSH)等の改訂作業を行っている。現在は、NDC第9版(NDC9)、BSH第4版(BSH4)が最新版である。
これらは、専門家による慎重な作業を介してトップダウン的に構築されているので、安定的に利用すること可能であり、また、深い組織化がなされてるという長所がある。
また、BSH、LCSH(米国議会図書館件名標目表)、NDLSH(国立国会図書館件名標目表」等の各種件名標目表が知られており、有用なツールである。
反面、改訂の周期が長く、新しい概念には対応が困難な面がある。
一般的に上位概念は一つしか持てないので、概念の多様な側面を反映することは困難な場合がある。また、件名標目表は一般的に冊子体で提供されているので、一般利用者からは利用が困難であるという問題がある。
B−2−3 Wikipedia
Wikipediaは、Web上でWikiシステムによって、共同編集されているオンライン百科事典であり、誰でもどこからでも自由に編集することができるものである。
多数の人が編集に参加していることから、世界中のほとんどの概念を網羅していると思われており、また、ハイパーリンクを容易に張ることができるという特徴を持っている。この特長を生かした項目の組織化の取り組みも行われている。
膨大な項目から効率的に一覧を生成するために「Wikipediaカテゴリ」と呼ばれるボトムアップ的な組織化の仕組みが導入されている。この仕組みによって項目を多様な観点から分類することが可能となっている。この点はフォークソノミーに類似している。よって、Wikipediaカテゴリは、フォークソノミー型オントロジーの一種としてとらえることができる。
例えば、「価格」という項目には「マーケティング」「経済学」「市場」のような複数のカテゴリを付与すうことができる。また、カテゴリ自体も上位概念の(親の)カテゴリを付与することができる。複数の親を持たせることができる点は従来の分類体系にはない大きな特徴である。
その反面、頻繁に編集が行われており、体系が安定していない、と言う問題点がある。また、信頼性に欠ける情報も少なくない等の欠点も指摘されている。そこで、信頼性を確保するために種々の取り組みが行われているが、対症療法的な取り組みに留まるとの指摘も多い。また、上述したように、浅い組織化に留まっていることも多い。
B−2−4 本発明で提案する手法・原理
報探索ツールとして図書館の分類体系と、Wikipediaを代表とするフォークソノミー型オントロジーとには、それぞれ異なる利点、欠点が存在する。これが図1に示されている。
図1に示されているように、アプローチとしては、図書館分類体系はトップダウン的であるのに対して、フォークソノミー型オントロジーは、ボトムアップ的である。また、長所としては、図書館分類体系は「安定」しており「深い組織化」が挙げられるが、フォークソノミー型オントロジーは「多様な観点の反映」「新しい概念への対応」性に富むという長所がある。また、短所としては、図書館分類側が「多様な観点の反映」が困難である点と、「新しい概念を含まない」点が挙げられよう。フォークソノミー型オントロジー側の欠点としては、「不安定」である点と、「浅い組織化」が挙げられよう。
また、親のカテゴリとしては、図書館分類側は「1」個しか持てないが、Wikipedia側は「複数」の親のカテゴリを持つことができる。
また、総カテゴリ数は、図書館分類側は11,184個であり、Wikipedia側は15,532個である。ここで、図1の数値は、それぞれの分類体系の代表例(図書館分類→BSH、フォークソノミー型オントロジー→Wikipediaカテゴリ)であることに留意されたい。また、図書館分類側とWikipedia側との間で共通するカテゴリ名は1,363個である(2006年8月の時点で)。
このように両者には、様々な利点・欠点の相違があり、係る相違に基づいて情報探索の際に、両者を適切に使い分けることが有用である。
本実施の形態では、両者の持つ共通部分を対応付けることによって、情報探索の出発点としてフォークソノミー型オントロジーを用い、そこから概念を一般化することによって図書館の分類体系に導いていくという統合的活用法を提案するものである。
B−2−5 活用の一例
図2には情報探索の活用例を示す。まず、情報探索の出発点としてのWikipediaの活用について説明する。ここで、Wikipediaの記事「阪神・淡路大震災」にはカテゴリとして「日本の経済史」「地震の歴史」が付与されている。さらに、カテゴリ「日本の経済史」には、上位カテゴリとして「経済史」が付与されている。また、カテゴリ「地震の歴史」には、上位カテゴリとして「災害と防災の歴史」及び「地震」が付与されている。このように、Wikipediaの記事を一つ取り上げてみると、関連するカテゴリ群をツリー構造として取り出すことができることが理解されよう。
このツリー構造を辿ることで、阪神・淡路大震災について調べる際の切り口が明確になっていくのである。
例えば、「日本の経済史」→「経済史」と辿っていくと「阪神・淡路大震災が日本経済に与えた影響」について調べることができることが判明する。
また一方、「地震の歴史」→「地震」と辿ることによって、「阪神・淡路大震災を引き起こした地震(すなわち1995年兵庫県南部地震)」について調べることが可能だと言うことが判明する。
結果として、「阪神・淡路大震災」という探索主題を「経済史」「災害」「地震」に一般化して調べることが可能となる。
B−2−6 対応
次に、Wikipediaカテゴリと図書館の分類体系(BSH、NDC)の対応と、図書館の分類体系の活用について説明する。
Wikipediaカテゴリと、図書館の分類体系の間には、後述するようにカテゴリ名が一致するものが存在する。上述した図2では、「経済史」「災害」「地震」が一致している。この一致を利用することによってWikipediaの活用によって一般化された探索主題を図書館の分類体系によって、より深く掘り下げることが可能である。例えば、「経済史」→「経済史−日本」→「経済史−日本−平安時代」と辿っていくと、NDC分類記号332.107によって「日本経済事典」(日本経済新聞社、1996年)等を探すことができる。また、「地震」→「耐震建築」と辿っていくと、件名「耐震建築」によって「地震とマンション」(西澤英和他、筑摩書房、2000年)などを探すことができる。
B−2−7 提案する手法・原理の優れている点
ここで述べた統合的活用のアプローチは、以下の理由によって、極めて有効であることが明らかである。
理由1 : オーバーラップが存在すること
図1の下方に示すように、図書館の分類区分(BSH4)とWikipediaカテゴリの間には、カテゴリ名が一致するものが多数存在する。Wikipediaの15,532カテゴリに対して、1,363カテゴリが一致している。したがって、Wikipediaの項目から、図書館の情報資源に誘導できる可能性は大きいと考えられる。
また、類似したカテゴリ名も対応付けることができれば、さらにその可能性は大きくなる。これは、図書館情報資源の有効活用に繋がることを意味する。
理由2 : 広範な概念を網羅できること
図書館の分類体系(特にBSH)の「項目数が少なく、新しい概念を網羅できていない」という欠点を、Wikipediaカテゴリとの対応によって補うことが可能である。すなわち、Wikipediaに含まれる膨大な数の項目を情報探索の出発点にすることができるので、(潜在的には)世界中のあらゆる概念に対応可能である。
理由3 : 情報探索を収束させること
Wikipediaカテゴリはボトムアップ的に構築されているため、浅い組織化に留まっていることも多い。これをそのまま情報探索に利用すると、いわゆるWebサーフィンと同様の結果となり、探索が発散してしまう恐れが大きい。図書館の分類体系と対応して利用することによって、情報探索が収束し、深い探索につなげることが可能となる。
B−3 レファレンスナビゲータ
本願発明者らは、上述した図書館の分類体系とWikipediaの統合的利用の最初の試みとして、異種オントロジーの統合ブラウジングツール「レファレンスナビゲータ」を作成した。
本ツールのインターフェース画面の一例を図3に示す。
本ツールは、Wikipedia、NDC9、BSH4、のオントロジー構造に加えて、Open Directory Project で構築されたWebディレクトリ構造をリレーショナルデータベースに格納しており、統合的に探索することが可能である。
上部のテキストボックスに探索主題(Wikipediaの項目名)を入力すると、その上位カテゴリ名等がハイパーリンクとして表示される。ここで、いずれかのカテゴリ名をクリックすると、さらにそのカテゴリの上位カテゴリ名、下位カテゴリ名などが表示される。同一のカテゴリ名がWikipedia以外にも含まれる場合には、それらの上位カテゴリ名、下位カテゴリ名も共に表示される。利用者がクリックを繰り返していくことによって情報探索を深めていき、図書館の情報資源を探すための手がかりを得ることができる。
このレファレンスナビゲータは、後に詳述するように、特に以下の特徴を備えている。
(1)類似したカテゴリ名の対応
現在の図書館の分類体系とWikipediaの対応は、カテゴリ名が文字列レベルで完全に一致したものに限られず、類似したものまで対応を行っている。特に、本発明では、自然言語処理を活用して類似したカテゴリ名まで精度良く対応を行っている。例えば、図2の点線部分で示した関係
「阪神・淡路大震災」 ←→ 「地震災害」、
「日本の経済史」+「平成時代」 ←→ 「NDC332.107」
を対応付けることが可能である。
(2)パスファインダーの自動生成
上述したように、いくつかの図書館で構築されているパスファインダーは情報探索にとって有用なツールであるが、人手で構築されているため、網羅されている項目が著しく少ないという問題がある。そこで、Wikipediaの項目に対してNDC分類記号などを自動推定し、それが付与されている参考図書等を蔵書目録(OPAC)から取得することによって、あらゆる概念についてのパスファインダーを自動生成する。
(3)自動レファレンスサービスシステムの実現
京都大学付属図書館レファレンスサービスシステム(非特許文献12)や、ダイアログナビ(非特許文献6)などの方法論を発展させて、対話的に図書館利用者の情報検索を支援するシステムを構築した。具体的には、上で述べた統合オントロジーに加えて、情報検索に関する様々なメタ知識(非特許文献13)を知識ベースとして利用するシステムを構築した。
C.先行特許文献・非特許文献
下記特許文献1には、分類番号の関連ファイルを利用した資料情報検索方式が記載されている。分類番号が階層構造を持つことに着目し、検索キーを分類番号に置き換えると共に、その上位・下位レベルも参照できると記載されている。
また、下記特許文献2には、RFIDを用いた図書保管管理システムが開示されている。RFIDを用いることによって複数の書籍のデータを一括して読み取ることができるとされている。
また、下記特許文献3には、蔵書検索方法・蔵書検索システム等が開示されている。ここに記載のシステムによれば、多様な条件で検索を行えるとされている。
特開平8−314956号公報 特開平10−273208号公報 特開2007−102487号公報 井上真琴:図書館に訊け!、ちくま新書(2004) 福田求:デジタルレファレンスサービスにおけるコミュニケーション技術に関する考察、情報科学研究、No.20、PP.29−40(2002) 小田充宏:デジタルレファレンスサービスの現在、情報の科学と技術、Vol.56、PP.84−89(2006) 文部科学省 科学技術・学術審議会 学術分科会 研究環境基盤部会 学術情報基盤作業部会:学術情報基盤の今後の在り方について(報告)(2006) 平田大志、日笠亘、藤井綱貴、黒橋禎夫:図書館の自動レファレンス・サービス・システムの構築、言語処理学会第6回年次大会発表論文集(2000) 清田陽司、黒橋禎夫、水戸冬子:大規模テキスト知識ベースに基づく自動質問応答−ダイアログナビ−、自然言語処理、Vol.10、No.4、PP.145−175(2003) 兼宗進:デジタル・レファレンス・ツールとしてのWikipedia、情報の化学と技術、Vol.56、PP.103−107(2006) もり・きよし、日本図書館協会分類委員会(編)、日本十進分類法 新訂9版、日本図書館協会、1995 日本図書館協会件名標目委員会(編)、基本件名標目表(BSH)第4版、日本図書館協会、1999 斉藤文男、図書館利用者にとってのレファレンス・サービス、東京都図書館協会報、No.81、2001 Laura B.Cohen and Julie M.Still. A comparison of research university and two-year college library web sites: content, functionality, and form,. College and research libraries, Vol. 60, No.3, pp.275-289, 1999. 黒橋禎夫、日笠亘、京都大学附属図書館における自動レファレンス・サービス・システム、情報管理、Vol.47、No.1、pp.184−189、2001 長澤雅男、情報と文献の探索、第3版、丸善株式会社、1994 國安結、清田陽司、綾部輝幸、東京大学附属図書館におけるレファレンスサービス業務分析−自動レファレンスサービスシステムの実現を目指して−日本図書館情報学会第54回研究大会発表要綱、pp.101−104、2006
そこで、本願発明者らは、図書館員が行っているレファレンス応答を自動で行うことができるシステムの実現に向けて鋭意研究を行い、具体的にレファレンスサービスシステムを構築するに至った。
以上述べてきたように、本発明の目的は、図書館の分類体系とWikipediaカテゴリという性質の異なるオントロジーを統合的に活用することによって、対話的な情報検索システムを実現することである。
本発明は、基本的な考え方として、図書館の分類体系とWikipediaカテゴリという性質の異なるオントロジーを統合的に活用することで新たな情報検索のインフラを実現したものである。
これによって、Webを手がかりとした図書館の利用によって探索を深めていくという新しい情報探索のパラダイムが世の中に広めることができ、その結果、社会全体のリテラシーの向上に寄与し、図書館の存在意義の再発見、ひいては電子図書館の実現にも資するものである。
本発明は、具体的には、以下の構成を採用する。
(1)本発明は、上記課題を解決するために、利用者からの検索要求に基づき、情報検索を行う情報検索システムにおいて、前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手段と、前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手段と、前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手段と、を含むことを特徴とする情報検索システムである。
(2)また、本発明は、(1)記載の情報検索システムにおいて、少なくとも、前記第1の検索手段が検索した結果と前記第2の検索手段が検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成手段と、を含むことを特徴とする情報検索システムである。
(3)また、本発明は、(2)記載の情報検索システムにおいて、前記パスファインダー作成手段は、前記第2の検索手段が検索した結果とともに、検索要求中のキーワードから前記第2の検索手段が検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索システムである。
(4)また、本発明は、(1)又は(2)記載の情報検索システムにおいて、前記抽出手段は、フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手段と、前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手段と、前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手段と、を含むことを特徴とする情報検索システムである。
(5)本発明は、上記課題を解決するために、利用者からの検索要求に基づき、情報検索を行う情報検索方法において、前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、を含むことを特徴とする情報検索方法である。
(6)また、本発明は、(5)記載の情報検索方法において、少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップ、を含むことを特徴とする情報検索方法である。
(7)また、本発明は、(6)記載の情報検索方法において、前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索方法である。
(8)また、本発明は、(5)又は(6)記載の情報検索方法において、前記抽出ステップは、フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、を含むことを特徴とする情報検索方法である。
(9)また、本発明は、上記課題を解決するために、コンピュータを、利用者からの検索要求に基づき、情報検索を行う情報検索システムとして動作させるプログラムにおいて、前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手順と、前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手順と、前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手順と、を、前記コンピュータに実行させることを特徴とするプログラムである。
(10)また、本発明は、(9)記載記載のプログラムにおいて、前記抽出手順は、フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手順と、前記各概念に対して付与された前記重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手順と、前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手順と、を含むことを特徴とするプログラムである。
(11)また、本発明は、上記課題を解決するために、利用者からの検索要求に基づき、情報検索を行ってその結果を前記利用者に提供する情報検索サービス提供方法において、前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップと、前記作成したパスファインダーを前記利用者に提供するパスファインダー提供ステップと、を含むことを特徴とする情報検索サービス提供方法である。
(12)また、本発明は、上記(11)記載の情報検索サービス提供方法において、前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索サービス提供方法である。
(13)また、本発明は、(11)又は(12)記載の情報検索サービス提供方法において、前記抽出ステップは、フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、を含むことを特徴とする情報検索サービス提供方法である。
なお、本件発明において、後述する実施の形態においてWikipediaオントロジーを主に説明しているが、これはフォークソノミー型オントロジーの好ましい一例に相当する。
(14)また、本発明は、上記(1)〜(4)のいずれか1項に記載の情報検索システムにおいて、前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索システムである。
(15)また、本発明は、上記(5)〜(8)のいずれか1項に記載の情報検索方法において、前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索方法である。
(16)また、本発明は、上記(9)又は(10)に記載のプログラムにおいて、前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするプログラムである。
(17)また、本発明は、上記(11)〜(13)のいずれか1項に記載のサービス提供方法において、前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするサービス提供方法である。
このように、本件発明においては、後述する実施の形態では図書館オントロジーを主として説明しているが、一般的なピラミッド型オントロジーでもかまわない。
以上述べたように、本発明によれば、対話的な操作によって情報検索が可能なシステムを提供することが可能である。
特に、本発明においては、2つの性質の異なるオントロジーを組み合わせることによってより精度の高い、使いやすい情報検索システムを提供することが可能である。
以下、図面を用いて、発明の実施の形態を説明する。
第1 はじめに
本実施の形態では、図書館分類とWikipediaという2種のオントロジーを統合させた新しい情報探索システム・情報探索手法を提案する。
そこで、まず、本実施の形態の背景となる図書館分類とWebオントロジー(Wikipediaを含む)とを簡単に説明する。
1−1 書架分類法(classification)
NDC(日本十進分類法)は日本で最も普及している図書館資料の書架分類法である。一つの資料に一つのNDCコードが付与される。書架分類法としては、他にも種々知られている。例えば
DDC(デューイ十進分類法)
UDC(国際十進分類法)
NDLC(国立国会図書館分類法)
LLC(米国議会図書館分類表)
が知られている。
1−2 件名標目表(Subject Headngs)
BSH(基本件名標目表)は、図書館資料の統制キーワードであり、一つの資料に複数の件名が付与される。また、NDCとの対応がなされている。件名標目表としては、他にも種々知られている。例えば、
LCSH(米国議会図書館件名標目表)
NDLSH(国立国会図書館件名標目票)
が知られている。
1−3 フォークソノミー
2005年頃から普及し始めたWebサービスであり、Flickr、del.icio.us、Youtubeなどが有名である。
フォークソノミーは、個々の利用者が自身の視点でコンテンツにタグを付与できるのが特徴である。システム全体としてみれば多様なタグが個々のコンテンツに付与されている状態となる。
1−4 Wikipedia
インターネット上で共同編集されている多言語百科事典である。各記事にはカテゴリがタグとして付与されている。したがって、フォークソノミーの特徴をも包含する。また、カテゴリにもさらにカテゴリのタグを付与できる。したがって、緩やかな階層構造を取ることも可能である。また、複数の上位概念を付与することができる。したがって、多重承継が可能である。
特に、図書館オントロジーとWikipediaとの比較を行った表が図1に示されており、既に説明した通りである。
第2 アプローチ
本願発明者らは、図書館オントロジーをWikipediaで拡張することが有効であろうと考えた。
それは、Wikipediaは、Webの汎用的な情報資源としては最も組織化されている(Wikipediaカテゴリと呼ばれるカテゴリが存在する)ので、図書館オントロジーとの親和性がある程度は高いと考えられたからである。さらに、Wikipediaは、Web上の他の情報資源との親和性を持っているからである。
また、図書館オントロジー(書架分類法、件名標目表)は、人類がこれまで長い期間営々と積み重ねてきた知識体系であり、価値判断に必要な情報資源への有力なポインタとなりうるものである。
これらの関係を表す概念図が図4に示されている。この図に示すように、情報探索のスタート地点としてはWebオントロジーは優れているが、より深い専門性、信頼性を獲得するにはWebオントロジーだけでは困難である。図書館オントロジーは、情報探索のスタート地点としての適性は低いものの、図4に示すように、より深い情報の専門性、信頼性を得ようとする場合は非常に高い適応性を有している。また、Wikipediaは、Webオントロジーではあるものの、ある程度の階層性、組織性を有しているので、図書館オントロジーとの親和性が高いと言えよう。この結果、Wikipediaにおける情報探索から図書館オントロジーへの移行を円滑に行えば、より使いやすい情報検索システムが達成できると考えられる。
このような移行は、両者に共通するカテゴリ名を用いて行うことができる。このような共通するカテゴリの例は、阪神・淡路大震災の例が図2に示されている。
この図2のように、阪神・淡路大震災から、種々の概念(カテゴリ)に到達することができる。その結果を示す図が図5に示されている。
図5に示すように、Wikipediaにおいて、「日本の経済史」に到達することによって、震災が日本経済に与えた影響を知ることができる。また、「災害と防災の歴史」から震災がその後の防災対策に与えた影響を知ることができる。さらに、「地震」から震災を起こした地震(1995年兵庫県南部地震)を知ることができる。
一方、図書館オントロジーへ移行することによって、図5に示すように、「経済史−日本−平成時代(332.107)」から「経済学事典(日本経済新聞社、1996年)の存在を知ることができる。また、「地震災害」という項目から、「地震防災の辞典(岡田恒男ほか、2000年」を知ることができる。また、「地震史(453.2)」から、「日本被害地震総覧(宇佐見龍夫、2003年)を読むことが可能である。
第3 レファレンスナビゲータ
以上述べたように、図書館オントロジーとWikipediaとを統合することによってより使いやすく、且つより深い専門性の高い情報を探索可能な情報探索システムが実現できると考えられる。この考えに基づき、本願発明者らは、レファレンスナビゲータと呼ばれるシステムを開発し、一定の成果を上げることができた。以下、このレファレンスナビゲータについて説明する。
3−1 類似について
本レファレンスナビゲータは、Wikipediaと図書館オントロジーとの間で概念の対応を行っているが、その対応は、概念を表すキーワードの文字列が一致する場合だけでなく、文字列の間に一定の類似度がある場合も含めて対応を行っている。
類似度は、いわゆる単語n−gramや、文字n−gramとよばれるモデルによって計算している。ここで、nは自然数であり、単語2−gram、単語3−gram、単語4−gram等を意味する。単語n−gramは、簡単に言えば、一定のフレーズを単語に分けて、その単語がn個連続して一致していた場合に類似と判断する手法であり、nは上述したように自然数である。
また、文字n−gramは、簡単に言えば、一定のフレーズをn文字毎に分けて、そのうちいずれかが一致するような他のフレーズがあれば、それを類似と判断する手法である。例えば、「地震の歴史」に対して文字2−gramを適用すると、「地震」「震の」「の歴」「歴史」という4個の2文字群が得られる。この文字群といずれかが一致するような他のフレーズがあれば、そのフレーズを類似と判断するのである。
さらに、本実施の形態のレファレンスナビゲータでは、いわゆるシソーラスによって類義語を探索し、その類義語も類似すると判断している。
3−2 上位概念の導出
上位概念の説明のため、記法を若干説明する。
探索対象である入力キーワードを、K0と記す。例えば、図2では、「阪神・淡路大震災」がK0である。Wikipediaでは、このK0から上位にあるカテゴリを見つけることができる。上述したように、Wikipediaでは上位概念を複数個持てるので、一般に複数個の上位概念が見つかる。これら、直接見つかったn個の上位概念を1次の上位概念と呼び、それぞれK11、・・・K1nで表す。
すなわち、本実施の形態では、概念(カテゴリ名)をKabと表し、このaは探索対象からの深さを表すレベル、次数であり、bはシリアル番号(すなわち、そのレベルに存在する概念に通し番号を付したもの)である。
さて、K0である「阪神・淡路大震災」に対して、1次の上位概念は、
K11「地震の歴史」
K12「日本の経済史」
K13「平成時代」
の3個である(図2参照)。
さらに、K11「地震の歴史」のさらに上位概念を求める(つまりK0から見れば第2レベル(2次)となる)と、
K21「地震」
K22「災害と防災の歴史」
の2個である。なお、第2レベルの上位概念は、他の(第1レベルの)概念を経由して辿る場合もあり、例えば、K23「経済史」が図2に示されている。また、図2には、3次の上位概念であるK31「災害」も記されている。
3−3 対応
このように上位概念を辿った場合には、図2に示すように、K21「地震」と完全一致の概念「地震(453)」がNDC、BSH中に存在することが見つけられる。また、K31「災害」に完全一致する概念がNDC、BSH中に存在することが見つけられる。同様に、K23「経済史」と完全一致する概念「経済史(332)」がNDC、BSH中に存在することが見つけられる(図2参照)。
一方、シソーラスを用いることによって、K0「阪神・淡路大震災」の類似概念として「地震災害」がNDC、BSH中に見つけられる。また、n−gramの手法を用いて、K12「日本の経済史」及びK13「平成時代」などと類似する概念として「経済史−日本−平成時代(332、107))が見つけられる。
3−4 重み
本実施の形態において特徴的なことは、各概念に対して重みによるスコアを計算し、係るスコアによって表示順を決定等していることである。
ある概念Kmn(mレベルのn番目の概念)の重みをW(Kmn)で表すと、W(Kmn)は、以下の式で表される。

W(Kmn) = S(Kmn、C(Kmn))×W(C(Kmn))

但し、1<m<t の範囲で計算する。ここでtはしきい値である。これは計算対象となるレベルの深さを一定の値に制限したものである。なお、Kmnは、ノードとも呼ばれる。
また、W(K0) = 1.0 である。これは、探索対象である概念K0の重みは「1」であるとしたものである。
また、上式で S()は、類似度であり、C(Kmn)は、Kmnの下位概念のうち、Kmnを導いたものを表す。例えば、K23=「経済史」に対して、C(K23)=K12=「日本の経済史」となる。
つまり、上式は、
その概念の重み = その概念の下位概念との類似度 × その下位概念の重み
という意味をなしている。
記号をまとめてみよう。
Kmnは、レベルmのn番目の概念(ノード)である。
C(K)は、概念(ノード)Kの下位概念(ノード)である。
S(K1、K2)は、概念K1と概念K2との類似度である。
W(K)は、概念(ノード)Kへの重みである。
3−5 類似度
類似度S(K1、K2)は、下記の式で計算される。概念K1とK2との類似度は、

この数式中、αは伝搬パラメータであり、例えば0.8等の定数である。
また、TK1、TK2は、概念K1とK2のn−gramの総数である。
例えば、n=2(すなわち 2−gram)、K1が「地震」、K2が「地震の歴史」の場合は、
TK1 = 1 「地震」の1個であるので「1」
TK2 = 4 「地震」「震の」「の歴」「歴史」の4個であるので「4」
となる。
また、TKCは、共通n−gram数である。例えば上で挙げた例の場合は、
TKC = 1 (共通する概念は「地震」の1個である)
となる。
したがって、K1が「地震」、K2が「地震の歴史」の場合は、

と計算され、類似度は0.6と計算される。
さて、この類似度Sは、基本的には0〜1の間の数を取る。0の場合は似てないことを意味し、1は似ていることを意味する。但し、αの値が1より小さい場合は、0〜1ではなく、例えば0.2〜1.0の範囲の数を取る(αが0.8の場合)。
記法をまとめてみよう。
αは伝搬パラメータである。
TKは、概念(ノード)Kのn−gramの総数である。
TKCは、共通するn−gramの数である。
3−6 導出スコア
フォークソノミー型オントロジー、すなわちWikipediaの各概念に対して以上のように重みづけをした後、それに基づいて図書館オントロジーの各概念Niに対して導出スコアI(Ni)を計算する。
図2で示す例によれば、Wikipediaにおいて第3レベルまで重みを計算した場合、「地震」「災害」「経済史」などが完全一致する概念として、図書館オントロジー側から見つけ出される。
したがって、これら「地震」「災害」「経済史」について導出スコアIを算出する。もちろん、導出スコアは、完全一致する概念だけでなく類似概念に関しても導出スコアIが求められる。導出スコアI(Ni)は、以下のようにして算出する。

ここで、Niは、図書館オントロジー中の概念(「地震」「災害」「経済史」等)である。
そして、X(Ni)は、その図書館オントロジー中の概念に対応付けられているWikipedia中の概念の集合である。例えば、「地震(453)」に対応付けられているWikipediaの概念は1個であるとは限らず、一般的に複数個存在する。これらを集合としたものである。
このWikipedia中の概念は、請求の範囲のフォークソノミー型オントロジー中の概念の好適な一例に相当する。
例えば、図2の例では、「経済史−日本−平成時代(332.108)」には「日本の経済史」と「平成時代」との2個の概念が対応付けられている。したがって、X(「経済史−日本−平成時代(332.108)」) = {「日本の経済史」、「平成時代」}という集合となる。
上記式により求められる導出スコアは、この集合中、最も重みの大きな概念のその重みの値である。
また、記法をまとめてみよう。
N又はNiは、図書館オントロジー中の概念(ノード)である。また、X(Ni)は、概念Niに対応付けられているWikipedia中の概念(ノード)である。
このWikipediaは、請求の範囲におけるフォークソノミー型オントロジーの好適な一例に相当する。
3−7 選定
本実施の形態において特徴的なことは、このI(Ni)の値が大きい順に上位J個のN(図書館オントロジーのエントリ(概念))を選定し、情報探索の結果として出力することである。Jは所定の個数であり、自然数である。
特に本実施の形態のレファレンスナビゲータでは、J個のエントリのそれぞれについて、K0からの導出パス、及び導出スコアを合わせて出力する。
例えば、
エントリ パス 導出スコア
地震(453) ← 地震の歴史 :0.0906
経済(330) ← 経済史 ← 日本の経済史 :0.0607
災害(369.3) ← 災害
← 災害と防災の歴史
← 地震の歴史 :0.0362
のように表示する。
このように、導出スコアだけでなく、パスも出力すれば利用者はどのようなつながりでその概念が出力されたか知ることができ、利便性に富む情報探索システムを構築することができる。
第4 レファレンスナビゲータの構成
次に、本実施の形態に係る情報探索システムであるレファレンスナビゲータの構成について説明する。
本情報検索システム(レファレンスナビゲータ)の構成図が図6〜図12に示されている。利用者は図12に示す構成の端末装置から通信回線(インターネット)を介してこのシステムを利用する。
まず、図6に示すように、ユーザ端末10上にはPCブラウザが搭載されており、このブラウザを介して、利用者は本システムにアクセスし情報探索を行う。
ユーザ端末10には、キーボード12やマウス14等が接続されており、利用者はこれらを通じてユーザ端末10を操作する。ユーザ端末10は典型的にはパーソナルコンピュータで構成することが好ましいが、PDAや携帯通信端末を用いることも好ましい。
ユーザ端末10はインターネット16を介して本システムのHTTPサーバ18と接続する。HTTPサーバ18は、Webアプリケーションエンジン20によって制御されている。
本システムの基本的な動作を記述しているのがこのWebアプリケーションエンジン20である。本願発明者らはこれを、Java(登録商標)言語によって記述したが、もちろん他の言語でも良い。このWebアプリケーションエンジン20には図6に示すように、情報探索サービスの提供に用いるWebドキュメントのデータ(インターフェース画面の定義等)や、スクリプトコード(JavaScript等)を記録した記憶装置22が備えられている。記憶装置22は、ハードディスクや半導体記憶装置、各種光ディスク等が使用可能である。
Webアプリケーションエンジン20は関数呼び出し処理エンジン24を利用して情報探索を行う。この関数呼び出し処理エンジン24はXML RPCプロトコルで実装されているが、他のプロトコルでも良い。この関数呼び出し処理エンジン24は連想検索モジュール26を用いて連想検索を行っている。連想検索モジュール26は、セッション管理モジュール28と連携し、連想検索を行う。
さて、セッション管理モジュール28はユーザ端末10とのセッションを管理しており、そのために利用者認証DB30及び検索のログを取るためのログDB32を備えている。
関数呼び出し処理エンジン24及びセッション管理モジュール28は、パスファインダー生成モジュール34がパスファインダーを生成するのに必要な情報を提供する。
パスファインダー生成モジュール34は、関数呼び出し処理エンジン24及びセッション管理モジュール28などからの指示に基づき、パスファインダーを生成する。パスファインダー生成モジュール34は、パスファインダー生成制御ファイル36を備えており、この制御ファイルの内容に基づきパスファインダーを生成する。
パスファインダー生成モジュール34には他にも種々のモジュールが接続されており、協調作業を実行している。
図7には、パスファインダー生成モジュール34に接続する他のモジュールが描かれている。
まず、質問文解析モジュールA38は、利用者からの質問を解析する。その際の解析ルールの正規表現が解析ルール集40に格納されている。また、自然文解析エンジン42が備えられており、自然文で記述された質問文の形態素解析や構文解析を行う。
このような質問文解析モジュールは複数個存在し、図7には、質問文解析モジュールA38の他に、質問文解析モジュールB44、質問文解析モジュールC46も示されている。
図8にも、パスファインダー生成モジュール34に接続する他のモジュールが描かれている。文字列検索モジュール48は、検索対象である所定の文字列を検索するモジュールである。外部リンク生成モジュール50は、所定の文字列等に対してリンクを埋め込むための外部リンクを生成するモジュールであり、後述するパスファインダーの画面上に、このリンクが設けられる。また、この外部リンクモジュール生成モジュール50には、外部をリンクする際に用いる制御ファイルの記憶手段52が設けられている。
図9には、図8の文字列検索モジュール48と共に検索動作を担う手段が種々示されている。文字列検索モジュール48には検索エンジン(1)54が設けられており、実際の検索動作を実行する。この検索エンジン(1)54は、Aインデックス56と、Bインデックス58と、を検索する。Aインデックス56は、検索エンジン(1)54用の検索エンジン(1)インデクサ60によってオントロジーAのデータベースから作成されたものである。同様に、Bインデックス58も、検索エンジン(1)54用の検索エンジン(1)インデクサ60によって、オントロジーBのデータベースから作成されたものである。
文字列検索モジュール48には、複数の検索エンジンを設けることができる。図9においては、検索エンジン(2)62が示されている。この検索エンジン(2)60にも検索エンジン(2)インデクサ64が備えられており、オントロジーAのデータベースからAインデックス66を作成し、オントロジーBのデータベースからBインデックス68を作成する。そして、検索エンジン(2)62は、Aインデックス66とBインデックス68とを検索する。
ここで、オントロジーAは、Wikipediaオントロジーを表す。また、オントロジーBは図書館オントロジーを表す。
図10には、上で述べたデータベースの詳細が記されている。検索エンジン(1)インデクサ60は、オントロジーAデータベース70と、オントロジーBデータベース72と、に基づき上述したようにAインデックス56とBインデックス58とを作成する。同様に、検索エンジン(2)インデクサ64は、オントロジーAデータベース66と、オントロジーBデータベース68と、に基づき上述したようにAインデックス66とBインデックス68とを作成する。
オントロジーAデータベース70は、Wikipediaオントロジーのデータベースであり、図10に示すように、IDとキーワードのリストであるキーワードリストを備えている。また、オントロジーAデータベース70は、各キーワードに対して上位の概念のIDと、下位の概念のIDとを備えた上位下位テーブルを備えている。この上位下位テーブルには、例えば「東京大学」の上位概念として「3」が示されている。このID3のキーワードは「国立大学」である。すなわち、「国立大学」が「東京大学」の上位概念である。
また、「国立大学」の上位概念として「4」が示されている。このID4のキーワードは「東京都」である。すなわち、「東京都」が「国立大学」の上位概念である。また、「国立大学」の下位概念として「1」が示されている。このID1のキーワードは「東京大学」である。すなわち、「東京大学」が「国立大学」の下位概念である。
さらに、オントロジーAデータベース70には、各キーワードに対して同義語の概念のIDを示した同義語テーブルを備えている。例えば、「東京大学」の同義語としてID5が示されている。ID5のキーワードは「東大」である。すなわち、「東京大学」の同義語が「東大」である。
以上のような各種テーブルからオントロジーAデータベース70が構成されている。また、オントロジーBデータベース72は、図書館オントロジーのデータベースである点がオントロジーAデータベース70と異なるが、その他の構成はほぼ同様である。
すなわち、オントロジーBデータベース72も、オントロジーAデータベース70と同様にキーワードリスト、上位下位テーブル、同義語テーブル等を備えている。
図11には、パスファインダー生成モジュール34にと、上記オントロジーAデータベース70やオントロジーBデータベース72に関連するモジュールが示されている。
まず、オントロジー処理モジュール74は、パスファインダー生成モジュール34からの指示に従ってオントロジーAデータベース70・オントロジーBデータベース72に対するオントロジー処理を実行する。その際、上位概念自動導出モジュール76はパスファインダー生成モジュールからの指示に従い上位概念を導出し、オントロジー処理モジュール74に供給する。上位概念導出モジュール76はキーワード比較エンジン78を用いて上位概念を導出する。キーワード比較エンジン78は、同義語辞書80を有しており、キーワードの比較として、既に述べたn−gramによる比較だけでなく、同義語かどうかを加味した比較も行う。
第5 ユーザ端末の構成
図12には、ユーザ端末10の構成ブロック図が示されている。
まず、中央制御モジュール90が、インターネット16を介してHTTPサーバ18との通信を行っている。中央制御モジュール90は、Webドキュメントを取得しその表示を行う。同時にスクリプトコード94の取得を行いそれを実行する。
中央制御モジュール90はマウス選択処理モジュール96をコントロールし、利用者のマウス動作(例えばキーワードの選択動作など)を監視・入力し、所定の処理を実行する。また、中央制御モジュール90はキー入力処理モジュール98をコントロールし、利用者のキー入力(キーワード「ハンバーガー」の入力など)を監視・入力し、所定の処理を実行する。
また、中央制御モジュール90は、履歴管理モジュール100を備えており、情報検索の結果の履歴を保存している。
本実施の形態において特徴的なことは、この履歴を利用者の選択に応じて適宜画面に表示できることである。これによって、利用者は過去の情報探索の結果を利用することが容易である。この履歴管理モジュール100は、履歴を保存するための履歴保存領域102を備えている。
履歴管理モジュール100は、情報探索の履歴を用いてパスファインダーを作成する。パスファインダーは種々の検索の結果として表れてくるので、その履歴を表示することによって、パスファインダーが作成される。実際のパスファインダーの画面への描画はパスファインダー描画エンジン104が実行する(図12参照)。図12には、ユーザ端末10の構成ブロック図だけでなく、端末のディスプレイに表示される画面の様子の概要が模式的に示されている。このように、パスファインダーは、画面中の一区画(ペインと呼ばれることが多い)を占める。履歴管理モジュール100は情報探索の結果の履歴をパスファインダーとは別に「履歴」として表示する。実際の履歴の画面への描画は履歴描画エンジン106が実行する(図12参照)。図12に示す例では、画面の右端部分がタブ切り換えによって種々の情報が表示可能に構成されている例を示している。図11の例では、履歴と、連想検索U.I.が示されているが、タブの切り換えによって別の情報を表示することも好ましい。
また、本実施の形態においてはユーザ端末10は、連想検索描画エンジン108を備えている。この連想検索エンジン108がHTTPサーバ18とXMLPRCによる通信を行い、連想検索の結果を得ると、これを連想検索U.I.の部分(図12の画面右下部参照)に表示する。
以上のような構成によって、利用者は、本実施の形態に係るレファレンスナビゲータを利用することができる。
第6 情報検索動作及びパスファインダーの作成動作
以下、情報検索動作及びそれに伴うパスファインダーの具体的な作成動作をフローチャートに基づき説明する。
図13、図14には、情報検索動作及びパスファインダーの作成動作を表すフローチャートが示されている。ここでは、キーボードによって質問文が入力される場合について説明する。マウスによって所定のキーワードがクリックされた場合の動作については次節で述べる。
まず、図13のステップS13−1においては、利用者が「ハンバーガーについて調べたい」という自然文をユーザ端末10において入力する。
ステップS13−2においては、中央制御モジュール90がキー入力処理モジュール98を介して上記自然文による質問文を取得し、これについて、関数呼び出しをサーバへ要求する。
ステップS13−3においては、HTTPサーバ18が受信した上記質問文をWebアプリケーションエンジン20が関数呼び出し処理エンジン24に供給する。関数呼び出し処理エンジン24はこの質問文に基づきパスファインダー生成モジュール34を呼び出す。この結果、パスファインダーのオブジェクト(以下、これをPFobjectと呼ぶ場合もある)は「Q:ハンバーガーについて調べたい」という質問文となる。
ステップS13−4においては、質問文解析モジュールA38が起動し、PFobject「Q:ハンバーガーについて調べたい」からX:ハンバーガーを取り出す。
次に、ステップS13−5において、質問文「Q:ハンバーガーについて調べたい」と、このX:ハンバーガーが文字列検索モジュール48に供給され、文字列の検索が行われる。その結果、PFobjectは、
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
となる。
次に、ステップS13−6においては、パスファインダー生成モジュール34が、オントロジー処理モジュール74を呼び出し、オントロジー処理を行わせる。その結果、PFobjectは、
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
となる。なお、ここで、BTは上位語を表し、NTは下位語を表す。また、RTは関連語を表す。
次にステップS13−7においては、パスファインダー生成モジュール34が、上位概念自動導出モジュール76を呼び出し、上位概念の導出を行わせる。その結果、PFobjectは、
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
BTI:パン(588.32)、食品(588)、飲食店(637.97)、ファーストフード、・・・
となる。なお、ここで、BTIは、拡張された上位語リストを表す。
本実施の形態において特徴的なことは、上位概念の導出において、Wikipediaのオントロジーから、図書館オントロジーの概念を取り出していることである。このような動作によってWikipediaのオントロジーと図書館オントロジーとを組み合わせることができ、より深い内容・専門性の高い内容の情報にアクセスしやすい情報探索システムが得られたものである。
この際、既に述べたように、各概念(ノード)に重みを行い、この重みに基づいて類似する概念、上位概念、を求めている。また、既に述べたように、この際、シソーラス(同義語辞典)等も加味して関連する概念の取り出し、関連付けを行っている。
このような処理によって、Wikipediaオントロジーと図書館オントロジーとの統合を図ることができ、より利便性の高い情報検索システムを提供することができる。
次に、図14に移り、ステップS14−1においては、パスファインダー生成モジュール34が、情報資源取得モジュール(不図示)を呼び出し、他の種々の情報資源の取得を行わせる。他の情報資源とは、例えば、東大OPAC、Google、Amazon、JapanKnowledge、等が挙げられる。パスファインダーにはそのような外部リンクも含めれば、より利便性の高いパスファインダーが得られる。
次に、ステップS14−2においては、上記ステップS14−1において見いだされた他の情報資源に基づき、外部リンク作成モジュール50が外部リンクを作成する。
この結果、PFobjectは、
Q:ハンバーガーについて調べたい
X:ハンバーガー
L:1:ハンバーガー 100.0% (関連性 以下同じ)
2:ハンバーガー司祭 0.4%
3:ハンバーガーチェーン 0.3%
4:ナンバーガール 0.2%
R:ハンバーガー
BT:パン、ファーストフード
NT:モスバーガー、マクドナルド、・・・
RT:佐世保バーガー、外食産業、・・・
BTI:パン(588.32)、食品(588)、飲食店(637.97)、ファーストフード、・・・
INFON:農林水産省(http://www.maff.go.jp )
:外食産業総合調査研究センター(http://www.gaishokusoken.jp/)
:日本フードサービス協会(http://www.jfnet.or.jp )
INFOB:外食産業統計資料集(ISBN:9784906357192 (4906357199))
:外食産業マーケティング便覧(ISBN:不明)
EXTL :東大OPAC(https://opac.dl.itc.u-tokyo.ac.jp/)
:Google(http://www.google.co.jp )
:Amazon(http://www.amazon.co.jp )
となる。
次に、ステップS14−3においては、パスファインダー生成モジュール34が、レスポンス生成モジュール(不図示)に、レスポンスの生成を行わせ、上記PFobjectをユーザ端末10に送信する。
ここで作成するレスポンスは、XMLオブジェクトであり、具体的には、
ハンバーガーについて調べるには・・・
・図書館の蔵書を探す : NDC588.32(パン) 588(食品)
・範囲を広げて調べる : パン、食品、飲食店、ファーストフード
・範囲を限定して調べる: モスバーガー、マクドナルド
・関連する項目を調べる: 佐世保バーガー、外食産業
・類似した項目を調べる: ハンバーガー司祭、ハンバーガーチェーン、
ナンバーガール
・外部リソースを検索する:OPAC、Google、Amazon
のようなデータが作成される。
このうち、図書館の蔵書を探す欄は、BTIの図書分類を利用して作成し、範囲を広げて調べる欄は、BTIを利用して作成する。範囲を限定して調べる欄は、NTを利用する。また、関連する項目を調べる欄はRTを利用する。また、類似した項目を調べる欄は、Lを用いる。また、外部リソースを検索する欄はEXTLを用いて、それぞれ作成する。
作成したXMLデータ(レスポンス)は、ユーザ端末10に送信される。
次に、ステップS14−4においては、ユーザ端末10の中央制御モジュール90がこのレスポンスを受信し、その内容を画面に表示する。その結果、利用者は図11で示したようなパスファインダーの画面を見ることができる。また、既に述べたように、ユーザ端末10は、履歴管理モジュール100を有しているので、過去のパスファインダーを適宜呼び出して閲覧することができ、利用者にとって使いやすい情報検索サービスが実現されている。
第7 情報検索動作及びパスファインダーの作成動作(マウスクリックによる場合)
上記第6では、キーボードで質問文を入力した場合の動作をフローチャートに基づき説明したが、本第7では、利用者がマウスで所定のキーワードをクリックした場合の情報検索動作及びそれに伴うパスファインダーの作成動作についてフローチャートに基づき説明する。
図15には、利用者がマウスで所定のキーワードをクリックした場合の情報検索動作及びパスファインダーの作成動作を表すフローチャートが示されている。ここでは、所定のキーワード「ハンバーガー」がマウスクリックされた場合について説明する。
まず、図15のステップS15−1においては、利用者が「ハンバーガー」というキーワードをユーザ端末10の画面上でクリックする。
ステップS15−2においては、中央制御モジュール90がキー入力処理モジュール98を介して上記クリックしたキーワードを取得し、これについて、関数呼び出しをサーバへ要求する。
ステップS15−3においては、HTTPサーバ18が受信した上記キーワード「ハンバーガー」をWebアプリケーションエンジン20が関数呼び出し処理エンジン24に供給する。関数呼び出し処理エンジン24はこのキーワードに基づきパスファインダー生成モジュール34を呼び出す。この結果、パスファインダーのオブジェクト(以下、これをPFobjectと呼ぶ場合もある)は
Q:「ハンバーガー」を選択
X:ハンバーガー
R:ハンバーガー
となる。
次に、ステップS15−4においては、パスファインダー生成モジュール34が、オントロジー処理モジュール74を呼び出し、オントロジー処理を行わせる。
なお、図15のフローチャートの場合は、図13で示した例(キーボードによる質問入力)と異なり、質問文処理モジュール38、文字列検索モジュール48等は使用しない。
次にステップS15−5においては、パスファインダー生成モジュール34が、上位概念自動導出モジュール76を呼び出し、上位概念の導出を行わせる。
ここでも、上記図13と同様に、上位概念の導出において、Wikipediaのオントロジーから、図書館オントロジーの概念を取り出していることである。この点が本実施の形態において特徴的な事項であり、従来の情報検索において無かった点である。
特に、このような動作によってWikipediaのオントロジーと図書館オントロジーとを組み合わせることが可能となったので、より深い内容・専門性の高い内容の情報にアクセスしやすい情報探索システムが得られたものである。
また、Wikipediaオントロジーの概念から、図書館オントロジーの概念への対応付けにおいては、既に説明したように、各概念(ノード)に重みを行い、この重みに基づいて類似する概念、上位概念、を求めることによって、図書館オントロジーへの「対応付け」を行っている。また、既に述べたように、この際、シソーラス(同義語辞典)等も加味して関連する概念の取り出し、関連付けを行っている。
このような処理によって、Wikipediaオントロジーと図書館オントロジーとの統合を図ることができ、より利便性の高い情報検索システムを提供することができる。
第8 まとめ
以上述べたように、本実施の形態によれば、Wikipediaのオントロジーと図書館オントロジーとを統合したので、双方の長所を生かした使いやすい情報検索を行うことができる。
特に、検索動作に伴って、パスファインダーが自動的に作成されるので、利便性の高い情報検索システムが構成できる。
第9 Wikipediaとフォークソノミー(folksonomy)
これまでWikipediaオントロジーと図書館オントロジーの統合に関して説明してきたが、このWikipediaオントロジーは、より一般的に言えば、フォークソノミーオントロジーと言えるであろう。
以下、「imidas」(集英社)からの引用である。
フォークソノミーとは、「利用者が、インターネットのコンテンツを自分の好みで収集・分類すること。「人々(folk)」と「分類(taxonomy)」とを組み合わせた造語。従来のインターネット上での情報分類は、ディレクトリ型検索エンジンを代表とした提供者側の、階層構造をともなう分類であるが、フォークソノミーでは、利用者が自らタグとよばれるインデックス情報を付加し、情報を分類・整理している。ネットワーク上の写真共有サービス「Flickr」や、ソーシャルブックマーク・サービスの「del.icio.us」はフォークソノミーを利用した代表的なサービス。前者は、写真登録者(アップロードした人)が自由にタグを付与してキーワードとすることにより、写真を介して利用者同士を結びつける。また、後者は、ブックマーク(お気に入り)をタグづけし、共有することにより、同じ指向のブックマークから有益な情報が見つけやすくなっている。」
(引用終わり)
このようなフォークソノミーにおけるオントロジーをフォークソノミー型オントロジーと呼ぶ。このフォークソノミー型オントロジーの一例として上述したWikipediaオントロジーを位置づけることができる。したがって、本発明は、一般的にこのフォークソノミー型のオントロジーを用いて実現することが可能である。
第10 プログラムとコンピュータ
さて、本実施の形態では、図6〜図12を用いて、システムの構成を説明してきたが、そこに示された各種モジュールやエンジン、インデクサなどは、いずれもプログラムによって構成されている。言い換えれば、コンピュータ(サーバや、クライアントであるユーザ端末)がそれらモジュールを実行することによって、図13〜図15その他、上で述べた動作を行うのである。
このように、本実施の形態で説明したシステムは、各種プログラムと、記憶装置に格納された各種データベース(オントロジーAデータベース70、オントロジーBデータベース72、利用者認証DB(データベース)、ログDB(データベース))から構成されている。また、各種の制御ファイル(パスファインダー制御ファイル36、外部リンク制御ファイル52等)、辞書データ(同義語辞書80)、等から構成されている。
ここで、各所のデータベースや辞書は所定の記憶手段に格納しておくことが好ましい。例えば、ハードディスクや、各種半導体記憶装置、各種の光ディスク、等が好ましい。これらは、コンピュータの近傍に設置しても良いが、ネットワークを介して遠隔の装置からダウンロードしてもよい。
また、各種モジュールやエンジンなどのプログラムも上記のような記憶手段に格納しておくことが好ましい。また、持ち運び可能な可搬型記憶媒体(例えばCDROM等)に格納しておくことも好ましい。また、遠隔地のサーバに格納しておき、ネットワークを介してそのサーバ中のプログラムを実行するように構成することも好ましい。
第11 応用分野
(1)以上述べたように、本発明は、情報検索システムに関し、特に図書館オントロジーとフォークソノミー型オントロジーとを組み合わせた点に特徴を有する。
したがって、本情報検索システムは、主として図書館及びその関連施設において用いることが好適である。特に、本発明によれば、概念検索によって、蔵書を効率的に検索できるので、図書館の職員、司書、各種研究者に対して「情報検索」を教育するシステムとして利用することも好適である。また、図書館の利用者に対する「情報検索」の教育に用いることも好適である。
(2)本発明は、異なるオントロジーを組み合わせることによって、概念検索を非常に効率的に行うことが可能である。したがって、本情報検索システムを用いて得られた「概念」を用いて外部の検索エンジン(インターネット上の一般的な検索エンジン)に誘導して、検索を行えば、効率的な検索を行うことができると考えられる。
そのためには、本情報検索システムの画面上に、外部の検索エンジンに対する外部リンクボタンをもうけておくことが好ましい。例えば有名な検索エンジンであるGoogleに対するこのような外部リンクボタンを、上述したユーザ端末10の画面上に設けておき、ユーザがこの外部リンクボタンをクリックした場合に、検索結果である概念をキーワードとするGoogle検索が行われるように構成しておくことが便利である。
なお、このように、キーワードを検索エンジンにfeedして検索を行わせるように外部リンクボタンを構成することは従来から行われていることであるので、当業者(その技術分野における通常の知識を持つ人をいう)であれば容易にそのようなボタンを構成することができる。
その結果、インターネット全般における検索を行うことも可能である。
(3)これまで、図書館オントロジーについて説明してきたが、これはある概念に対する上位概念がただ一つ定まるオントロジーである。換言すれば、このように上位概念がただ一つのみ定められているようなオントロジーであれば他のオントロジーを採用することも原理的に可能である。このようにある概念の上位概念が必ず一つであるようなオントロジーをピラミッド型オントロジーと呼ぶ。
そして、その採用するピラミッド型オントロジーの内容は、適用したい分野によって様々なものを採用することができるであろう。すなわち、本発明は、図書館関連の検索システムに限られず、他の種々の分野における情報検索に利用することが可能である。
要するに、概念分類を利用した語基分類辞書ツールとしての利用を図ることができるものである。
例えば、インターネット上の広告効果・影響を指標化する目的に利用することができる。世の中には種々の宣伝・広告媒体が存在するが、一般に宣伝を行うと、それを見た消費者がインターネット上でブログや記事の書き込み、掲示板への書き込みを行う。書き込まれた文書に関して、宣伝商品の言葉を語基・語幹にして概念分類を行うことによって、語基を分類することができる。その結果、概念毎に語基が並べられた辞書ツールを得ることが可能である。これを用いれば、広告主へのフィードバック材料や、広告打ち出しのためのヒントキーワード検索ツールとしての利用もできよう。
具体的な例を挙げよう。例えば、化粧品やシャンプーの広告効果を計測できる情報検索システムを構築することができる。
例えば、S社が新しいシャンプー「つばめ」を開発し、この広告をインターネット上で繰り広げた場合を想定しよう。この広告の効果を計るには、従来は、「つばめ」を取り上げている記事やブログを検索し、何回取り上げられているか? ブログで言及された回数は? それに対するコメント数は? などの数値を得て、その数値から、おおよその広告効果を推定するしかなかった。
これに本発明の情報検索システムを適用する。まず、「つばめ」に対するピラミッド型オントロジーを構築する。これはシャンプーや化粧品等を対象としたオントロジーを専門家が構築すればよい。
そして、「つばめ」に関する種々の概念を抽出した後、その概念を用いて、インターネット上の記事やブログを検索するのである。
「つばめ」について、上述したように、ピラミッド型オントロジーと、フォークソノミー型オントロジーとを組み合わせた情報検索システムを用いて関連する概念を得る。その結果、「S社」や、「シャンプー」「化粧品」、ひいては競合商品である「U社」のシャンプーである「ラック」などを得る。
これらを用いてインターネット上の記事やブログを検索することによって、より精度の高い検索をすることができる。さらに、競合他社の製品(U社の「ラック」)との比較を行うこともできるので、広告効果をより詳細に調査することができる。
情報探索ツールとして図書館の分類体系と、Wikipediaとを比較した表である。 本発明で採用する図書館オントロジーとWikipediaオントロジーを統合した場合の情報検索の活用例の概念図である。 本願発明者らが開発したレファレンスナビゲータの画面の一例である。 図書館オントロジー、Webオントロジー、Wikipediaオントロジーの関係を示す概念図である。 阪神・淡路大震災というキーワードから出発して、種々の概念(カテゴリ)に到達することができる。その様子を示す概念図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム(レファレンスナビゲータ)の構成図であり、特にユーザ端末の構成図である。 本実施の形態に係る情報検索動作及びパスファインダーの作成動作を表すフローチャートである。 本実施の形態に係る情報検索動作及びパスファインダーの作成動作を表すフローチャートである。 マウスで所定のキーワードをクリックした場合の情報検索動作及びそれに伴うパスファインダーの作成動作を表すフローチャートである。
符号の説明
10 ユーザ端末
12 キーボード
14 マウス
16 インターネット
18 HTTPサーバ
20 Webアプリケーションエンジン
22 記憶装置
24 関数呼び出し処理エンジン
26 連想検索モジュール
28 セッション管理モジュール
30 利用者認証DB
32 ログDB
34 パスファインダー生成モジュール
36 パスファインダー生成制御ファイル
38 質問文解析モジュールA
40 解析ルール集
42 自然文解析エンジン
44 質問文解析モジュールB
46 質問文解析モジュールC
48 文字列検索モジュール
50 外部リンク生成モジュール
52 外部リンク制御ファイル
54 検索エンジン(1)
56 Aインデックス
58 Bインデックス
60 検索エンジン(1)インデクサ
62 検索エンジン(2)
64 検索エンジン(2)インデクサ
66 Aインデックス
68 Bインデックス
70 オントロジーAインデックス
72 オントロジーBインデックス
74 オントロジー処理モジュール
76 上位概念自動導出モジュール
78 キーワード比較エンジン
80 同義語辞典
90 中央制御モジュール
92 Webドキュメント
94 スクリプトコード
96 マウス選択処理モジュール
98 キー入力処理モジュール
100 履歴管理モジュール
102 履歴保存領域
104 パスファインダー描画エンジン
106 履歴描画エンジン
108 連想検索描画エンジン

Claims (17)

  1. 利用者からの検索要求に基づき、情報検索を行う情報検索システムにおいて、
    前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手段と、
    前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手段と、
    前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手段と、
    を含むことを特徴とする情報検索システム。
  2. 請求項1記載の情報検索システムにおいて、
    少なくとも、前記第1の検索手段が検索した結果と前記第2の検索手段が検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成手段と、
    を含むことを特徴とする情報検索システム。
  3. 請求項2記載の情報検索システムにおいて、
    前記パスファインダー作成手段は、前記第2の検索手段が検索した結果とともに、検索要求中のキーワードから前記第2の検索手段が検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索システム。
  4. 請求項1又は2記載の情報検索システムにおいて、
    前記抽出手段は、
    フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手段と、
    前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手段と、
    前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手段と、
    を含むことを特徴とする情報検索システム。
  5. 利用者からの検索要求に基づき、情報検索を行う情報検索方法において、
    前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
    前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
    前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
    を含むことを特徴とする情報検索方法。
  6. 請求項5記載の情報検索方法において、
    少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップ、
    を含むことを特徴とする情報検索方法。
  7. 請求項6記載の情報検索方法において、
    前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索方法。
  8. 請求項5又は6記載の情報検索方法において、
    前記抽出ステップは、
    フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
    前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
    前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
    を含むことを特徴とする情報検索方法。
  9. コンピュータを、利用者からの検索要求に基づき、情報検索を行う情報検索システムとして動作させるプログラムにおいて、
    前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手順と、
    前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手順と、
    前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手順と、
    を、前記コンピュータに実行させることを特徴とするプログラム。
  10. 請求項9記載のプログラムにおいて、
    前記抽出手順は、
    フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手順と、
    前記各概念に対して付与された前記重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手順と、
    前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手順と、
    を含むことを特徴とするプログラム。
  11. 利用者からの検索要求に基づき、情報検索を行ってその結果を前記利用者に提供する情報検索サービス提供方法において、
    前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
    前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
    前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
    少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップと、
    前記作成したパスファインダーを前記利用者に提供するパスファインダー提供ステップと、
    を含むことを特徴とする情報検索サービス提供方法。
  12. 請求項11記載の情報検索サービス提供方法において、
    前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索サービス提供方法。
  13. 請求項11又は12記載の情報検索サービス提供方法において、
    前記抽出ステップは、
    フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
    前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
    前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
    を含むことを特徴とする情報検索サービス提供方法。
  14. 請求項1〜4のいずれか1項に記載の情報検索システムにおいて、
    前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索システム。
  15. 請求項5〜8のいずれか1項に記載の情報検索方法において、
    前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索方法。
  16. 請求項9又は10に記載のプログラムにおいて、
    前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするプログラム。
  17. 請求項11〜13のいずれか1項に記載のサービス提供方法において、
    前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするサービス提供方法。
JP2007214405A 2007-08-21 2007-08-21 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 Active JP5283208B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007214405A JP5283208B2 (ja) 2007-08-21 2007-08-21 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
PCT/JP2008/053760 WO2009025095A1 (ja) 2007-08-21 2008-03-03 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
US12/672,775 US8762404B2 (en) 2007-08-21 2008-03-03 Information search system, method, and program, and information search service providing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007214405A JP5283208B2 (ja) 2007-08-21 2007-08-21 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法

Publications (2)

Publication Number Publication Date
JP2009048441A true JP2009048441A (ja) 2009-03-05
JP5283208B2 JP5283208B2 (ja) 2013-09-04

Family

ID=40378004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007214405A Active JP5283208B2 (ja) 2007-08-21 2007-08-21 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法

Country Status (3)

Country Link
US (1) US8762404B2 (ja)
JP (1) JP5283208B2 (ja)
WO (1) WO2009025095A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012529717A (ja) * 2009-06-09 2012-11-22 イービーエイチ エンタープライズィーズ インコーポレイテッド マイクロブログメッセージの内容を分析する方法
JP2014506357A (ja) * 2011-01-05 2014-03-13 プライマル フュージョン インコーポレイテッド 1人以上のユーザに関心ある情報を提供する方法及び装置
KR101500642B1 (ko) 2013-01-29 2015-03-18 한국과학기술원 고유 속성을 기반으로 한 개체 인식 방법 및 장치
KR101547912B1 (ko) 2013-08-16 2015-08-31 방기수 진화하는 지식지도 서비스 제공 방법 및 시스템
KR101572911B1 (ko) 2014-02-21 2015-12-02 한국과학기술원 문서 추천 방법, 문서 선택 방법 및 문서 추천 장치
JP2016031637A (ja) * 2014-07-29 2016-03-07 シャープ株式会社 表示装置、表示方法、表示プログラム、サーバ、およびネットワークシステム
JP2016517567A (ja) * 2013-03-13 2016-06-16 クアルコム,インコーポレイテッド 関心地点のメタデータを検索するためのデータプロバイダの階層的編成
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
JP2017511922A (ja) * 2015-01-14 2017-04-27 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スマート質問回答の実現方法、システム、および記憶媒体
JP2018205789A (ja) * 2017-05-30 2018-12-27 越屋メディカルケア株式会社 支援用品検索装置及び支援用品検索システム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
US9600468B2 (en) * 2009-12-11 2017-03-21 Nec Corporation Dictionary creation device, word gathering method and recording medium
US20120303359A1 (en) * 2009-12-11 2012-11-29 Nec Corporation Dictionary creation device, word gathering method and recording medium
US9600566B2 (en) 2010-05-14 2017-03-21 Microsoft Technology Licensing, Llc Identifying entity synonyms
US8943047B1 (en) * 2011-09-09 2015-01-27 Intuit Inc. Data aggregation for qualifying a partner candidate
US8745019B2 (en) * 2012-03-05 2014-06-03 Microsoft Corporation Robust discovery of entity synonyms using query logs
WO2013154947A1 (en) 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
US10032131B2 (en) 2012-06-20 2018-07-24 Microsoft Technology Licensing, Llc Data services for enterprises leveraging search system data assets
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US9229924B2 (en) 2012-08-24 2016-01-05 Microsoft Technology Licensing, Llc Word detection and domain dictionary recommendation
JP5596213B1 (ja) * 2013-09-05 2014-09-24 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
CN104298661A (zh) * 2013-12-29 2015-01-21 新疆信息产业有限责任公司 应用电费自助缴费终端柯尔克孜文翻译引擎的方法
CN104298660A (zh) * 2013-12-29 2015-01-21 新疆信息产业有限责任公司 应用电费自助缴费终端哈萨克文翻译引擎的方法
CN104636468A (zh) * 2015-02-10 2015-05-20 广州供电局有限公司 数据查询分析方法和系统
CN110851459B (zh) * 2018-07-25 2021-08-13 上海柯林布瑞信息技术有限公司 一种搜索方法及装置、存储介质、服务器
WO2021195130A1 (en) 2020-03-23 2021-09-30 Sorcero, Inc. Cross-context natural language model generation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059289A1 (en) * 2000-07-07 2002-05-16 Wenegrat Brant Gary Methods and systems for generating and searching a cross-linked keyphrase ontology database
US20050256867A1 (en) * 2004-03-15 2005-11-17 Yahoo! Inc. Search systems and methods with integration of aggregate user annotations

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314956A (ja) 1995-05-16 1996-11-29 Hitachi Ltd 分類番号関連ファイルを利用した資料情報検索方式
JPH10273208A (ja) 1997-03-31 1998-10-13 Toppan Printing Co Ltd 図書保管管理システム
KR100426382B1 (ko) * 2000-08-23 2004-04-08 학교법인 김포대학 엔트로피 정보와 베이지안 에스오엠을 이용한 문서군집기반의 순위조정 방법
US7634501B2 (en) * 2003-02-05 2009-12-15 Next Generation Software Method and apparatus for mediated cooperation
US7433876B2 (en) * 2004-02-23 2008-10-07 Radar Networks, Inc. Semantic web portal and platform
US20070106657A1 (en) * 2005-11-10 2007-05-10 Brzeski Vadim V Word sense disambiguation
US8335753B2 (en) * 2004-11-03 2012-12-18 Microsoft Corporation Domain knowledge-assisted information processing
US7349896B2 (en) * 2004-12-29 2008-03-25 Aol Llc Query routing
JP4787590B2 (ja) 2005-10-04 2011-10-05 株式会社リコー 蔵書検索方法、蔵書検索システム及び蔵書検索プログラム
US7917519B2 (en) * 2005-10-26 2011-03-29 Sizatola, Llc Categorized document bases
US20070219986A1 (en) * 2006-03-20 2007-09-20 Babylon Ltd. Method and apparatus for extracting terms based on a displayed text
US8019754B2 (en) * 2006-04-03 2011-09-13 Needlebot Incorporated Method of searching text to find relevant content
US8108204B2 (en) * 2006-06-16 2012-01-31 Evgeniy Gabrilovich Text categorization using external knowledge

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059289A1 (en) * 2000-07-07 2002-05-16 Wenegrat Brant Gary Methods and systems for generating and searching a cross-linked keyphrase ontology database
US20050256867A1 (en) * 2004-03-15 2005-11-17 Yahoo! Inc. Search systems and methods with integration of aggregate user annotations

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200700482001; 岸田 和明: 'インターネット時代における統制語彙の意義と役割' 情報の科学と技術 Vol.57,No.2, 20070201, pp.62-67., 社団法人情報科学技術協会 *
JPN6013009582; 岸田 和明: 'インターネット時代における統制語彙の意義と役割' 情報の科学と技術 Vol.57,No.2, 20070201, pp.62-67., 社団法人情報科学技術協会 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9792550B2 (en) 2008-05-01 2017-10-17 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
JP2012529717A (ja) * 2009-06-09 2012-11-22 イービーエイチ エンタープライズィーズ インコーポレイテッド マイクロブログメッセージの内容を分析する方法
US9323826B2 (en) 2009-06-09 2016-04-26 Ebh Enterprises Inc. Methods, apparatus and software for analyzing the content of micro-blog messages
JP2014506357A (ja) * 2011-01-05 2014-03-13 プライマル フュージョン インコーポレイテッド 1人以上のユーザに関心ある情報を提供する方法及び装置
KR101500642B1 (ko) 2013-01-29 2015-03-18 한국과학기술원 고유 속성을 기반으로 한 개체 인식 방법 및 장치
JP2016517567A (ja) * 2013-03-13 2016-06-16 クアルコム,インコーポレイテッド 関心地点のメタデータを検索するためのデータプロバイダの階層的編成
KR101547912B1 (ko) 2013-08-16 2015-08-31 방기수 진화하는 지식지도 서비스 제공 방법 및 시스템
KR101572911B1 (ko) 2014-02-21 2015-12-02 한국과학기술원 문서 추천 방법, 문서 선택 방법 및 문서 추천 장치
JP2016031637A (ja) * 2014-07-29 2016-03-07 シャープ株式会社 表示装置、表示方法、表示プログラム、サーバ、およびネットワークシステム
JP2017511922A (ja) * 2015-01-14 2017-04-27 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スマート質問回答の実現方法、システム、および記憶媒体
JP2018205789A (ja) * 2017-05-30 2018-12-27 越屋メディカルケア株式会社 支援用品検索装置及び支援用品検索システム

Also Published As

Publication number Publication date
WO2009025095A1 (ja) 2009-02-26
US8762404B2 (en) 2014-06-24
US20110213796A1 (en) 2011-09-01
JP5283208B2 (ja) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5283208B2 (ja) 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US7895595B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
Poelmans et al. Text mining scientific papers: a survey on FCA-based information retrieval research
JP2003330948A (ja) ウェブページを評価する装置および方法
KR101984937B1 (ko) 전통문화 3d 디지털 연표 표출 시스템
Strzelecki et al. Direct answers in Google search results
TW201804345A (zh) 基於結構化網路知識的自動中文本體庫建構方法、系統及電腦可讀媒體
Rajasurya et al. Semantic information retrieval using ontology in university domain
JP2024091709A (ja) 文作成装置、文作成方法および文作成プログラム
Lazarinis Exploring the effectiveness of information searching tools on Greek museum websites
Dattolo et al. Visualbib: narrative views for customized bibliographies
Sciascio et al. A roadmap to user-controllable social exploratory search
KR101007056B1 (ko) 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법
Kolli et al. A Novel Nlp And Machine Learning Based Text Extraction Approach From Online News Feed
Fung et al. Discover information and knowledge from websites using an integrated summarization and visualization framework
Kuroiwa et al. Dynamic personalization for book recommendation system using web services and virtual library enhancements
Abuoda et al. Automatic Tag Recommendation for the UN Humanitarian Data Exchange.
Mohajeri et al. BubbleNet: An innovative exploratory search and summarization interface with applicability in health social media
Killmer et al. So much information, so little time: Evaluating web resources with search engines
Zinvandi et al. Persian Web Document Retrieval Corpus
Aguiar et al. User Interaction Patterns for Linked Data
Pradhan et al. Faceted Knowledge Organization Approach in Online Public Access Catalogue (OPAC) for Searching and Navigation: A Case Study
Ahmed et al. Web Content Mining: A Solution to Consumer’s Product Hunt
Chen et al. An associative text analyzer to facilitate effectiveness of exploring historical texts for digital humanities

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130524

R150 Certificate of patent or registration of utility model

Ref document number: 5283208

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250