JP2006236254A - コミュニティ依存型情報検索システム及び方法 - Google Patents

コミュニティ依存型情報検索システム及び方法 Download PDF

Info

Publication number
JP2006236254A
JP2006236254A JP2005053618A JP2005053618A JP2006236254A JP 2006236254 A JP2006236254 A JP 2006236254A JP 2005053618 A JP2005053618 A JP 2005053618A JP 2005053618 A JP2005053618 A JP 2005053618A JP 2006236254 A JP2006236254 A JP 2006236254A
Authority
JP
Japan
Prior art keywords
concept
search
community
keyword
concepts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005053618A
Other languages
English (en)
Inventor
Takuya Ogure
拓也 尾暮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP2005053618A priority Critical patent/JP2006236254A/ja
Publication of JP2006236254A publication Critical patent/JP2006236254A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】概念体系への語彙の追加を自動的に行うこと。
【解決手段】このコミュニティ依存型情報検索システムは、概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴DB4を参照して抽出し、専門分野文書DB3を分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し、専門分野文書DB3を分析して当該キーワードと関連性の高い概念体系中の概念はどれかを判断し、当該キーワードを含む検索結果から利用者が実際に閲覧した文書を分析して関連性の高い概念を判断し、これら概念と検索時に指定された概念のうち、当該キーワードに最も関連性の高い概念を判断し、上記コミュニティの概念体系DB2の概念体系に追加する機能を備えた概念体系管理用端末5を有する。
【選択図】 図1

Description

本発明は、コミュニティ依存型情報検索システム及び方法に関する。
今日、インターネット上の検索サービスは、現状では文字列検索が主流である。
一方、様々な学術分野、趣味の世界など、専門的な分野に特化した語彙とそれらに対応する概念、及び概念の関連性の理解は、その分野に関心を持つ人々で形成される閉鎖的なコミュニティの内部で共有されている。しかしながら、一般の人が一般的でない分野の専門知識を検索する場合には、適切な検索キーワードが分からないため所望とする検索結果を得ることができない。このような点に鑑みて、概念体系をユーザに提示することでユーザの検索したい概念を同定するWeb検索エンジンが実現されている。
しかしながら、上記概念体系に最新の専門的語彙を追加する労力は大きい。
本発明の目的は、それぞれのコミュニティが共有する知識に関する検索をサービスとして提供するもので、その概念体系への語彙の追加を自動的に行うことが可能なコミュニティ依存型情報検索システム及び方法を提供することにある。
上記目的を達成するために、本発明の第1の態様では、概念体系を記憶するコミュニティの概念体系データベースと、上記概念体系を構築する概念の文書データを記憶する文書データベースと、ユーザによる検索履歴を記憶する操作履歴データベースと、上記概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴データベースより抽出し、専門分野文書データベースを分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し、専門分野文書データベースを分析して当該キーワードと関連性の高い概念体系中の概念はどれかを判断し、当該キーワードを含む検索結果から利用者が実際に閲覧した文書データを分析して関連性の高い概念を判断し、これら概念と検索時に指定された概念のうち、当該キーワードに最も関連性の高い概念を特定し、上記コミュニティの概念体系データベースの概念体系に追加する機能を備えた概念体系管理用端末と、を有することを特徴とするコミュニティ依存型情報探索システムが提供される。
本発明の第2の態様では、概念体系管理用端末が、概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴データベースより抽出し、専門分野文書データベースを分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し、専門分野文書データベースを分析して当該キーワードと関連性の高い概念体系中の概念はどれかを判断し、当該キーワードを含む検索結果から利用者が実際に閲覧した文書データを分析して関連性の高い概念を判断し、これら概念と検索時に指定された概念のうち、当該キーワードに最も関連性の高い概念を特定し、上記コミュニティの概念体系データベースの概念体系に追加することを特徴とするコミュニティ依存型情報探索方法が提供される。
本発明の第3の態様では、複数の分野についての情報検索をそれぞれ実施するための複数の情報検索サーバと、類似概念を判断するための類似検索サーバと、を備え、ユーザ端末より所定分野の情報検索が要求された場合には、上記複数の情報検索サーバのうち当該所定分野についての情報探索を実施する情報検索サーバは上記類似検索サーバより上記検索を要求された概念に類似する概念の情報を要求し、上記検索を要求された概念と類似する概念の情報を併せてユーザ端末に送信する、ことを特徴とするコミュニティ依存型情報探索システムが提供される。
本発明の第4の態様では、複数の分野についての情報検索をそれぞれ実施するための複数の情報検索サーバと、類似概念を判断するための類似検索サーバとを備えたコミュニティ依存型情報探索システムによる方法であって、ユーザ端末より所定分野の情報検索が要求された場合には、上記複数の情報検索サーバのうち当該所定分野についての情報探索を実施する情報検索サーバは上記類似検索サーバより上記検索を要求された概念に類似する概念の情報を要求し、上記検索を要求された概念と類似する概念の情報を併せてユーザ端末に送信する、ことを特徴とするコミュニティ依存型情報探索方法が提供される。
本発明によれば、それぞれのコミュニティが共有する知識に関する検索をサービスとして提供するもので、その概念体系への語彙の追加を自動的に行うことが可能なコミュニティ依存型情報検索システム及び方法を提供することができる。
以下、図面を参照して、本発明の実施の形態について説明する。
(第1の実施の形態)
図1には本発明の第1の実施の形態に係るコミュニティ依存型情報検索システムの構成を示し説明する。本システムは、ユーザ端末6とインターネット等のネットワーク7を介して通信自在に接続された情報検索サーバ1と、当該情報検索サーバ1と接続されたコミュニティの概念体系データベース(以下、DBと略記)2、専門分野文書DB3、操作履歴DB4と、これらDB2乃至4と接続された概念体系管理用端末5と、を有している。
コミュニティの概念体系DB2には、例えば図2(a)に示されるような概念体系が記憶されている。この例では、「原子力発電所」の概念体系を例に挙げている。即ち、「原子力発電所」が上位概念の語彙であり、それから分岐している「発電所のシステム」、「発電所の環境」が中位概念の語彙であり、更にそれらから分岐している「物理的システム」等の語彙が下位概念の語彙であり、不図示ではあるが更に下位概念の語彙がこれらに続く。
ここで、概念体系(オントロジー)とは、専門家コミュニティで用いられる語彙に対応する概念をそのコミュニティで合意が得られる手法で整理したものである。
非専門家にとって理解しやすいように階層型を原則とし、階層を越えた関係性は別途記述する。それぞれの概念項目は説明と対応する用語が明記される。ゆえに、コミュニティに暗黙的に存在する概念体系の明示化を促すことができる。
このような概念体系を利用した検索では、網羅的かつ詳細な概念体系をユーザに提示することによってユーザが関心を持つ概念を同定できるという利点がある。ディレクトリ型検索サイトのアプローチでは、概念体系の網羅性や詳細さを高めると概念項目数が多くなってWebページを分類する人的コストが高くなってしまうが、本システムによる自動追加によればこのような負担を解消することが可能となる。
専門分野文書DB3には、例えば図2(b)に示されるような専門分野文書情報等が記憶されている。この例は、上記語彙「発電所設計法」に関するものであり、当該語彙の説明、この概念を指し示す語彙、他の概念との関係が対応付けられて記憶されている。
ここで、本システムは、概念体系を利用した「検索質問拡張機能」と「あいまい検索機能」を備えている。より詳細には、「検索質問拡張機能」とは、様々な用語の言い回しの違い、表記ゆれを統一的な記号に置き換える機能のことをいう。ここで、統一的な記号には概念体系の概念項目に一意に対応する記号を割り振ることにする。
一方、「あいまい検索機能」とは、統一的な記号の概念的な近さを考慮して検索を行う機能をいう。ここでいう「概念的な近さ」は、概念体系の中の概念の相互のつながりを利用して評価することとしている。換言すれば、検索質問に近似するドキュメントから順に提示するのが「あいまい検索」機能である。
このような構成において、ユーザ端末6がブラウザを起動して、情報検索サーバ1が提供するサイトにアクセスすると、情報検索サーバ1は、DB2,3を適宜検索して、情報を取得し、画面データを生成し、ユーザ端末6側に返信する。即ち、例えば、図3に示されるような検索用の画面データがユーザ端末6に送られる。
この画面においては、先ず上方にある「検索対象概念」に、検索を所望とする用語を入力することになる。すると、情報探索サーバ1に当該用語の情報が送信され、当該情報探索サーバ1が再びDB2,3を検索して、当該用語に該当する概念体系及び専門分野文書の情報を取得し、画面データを生成してユーザ端末6に送信する。この画面の左には概念体系が表示され、ユーザはユーザ端末6を操作することで、上位概念の語彙から中位概念の語彙、更に下位概念の語彙へと検索を所望とする用語を探すことができる。
構築された概念体系を階層関係が分かり易いように提示することで、非専門家は漠然とした疑問の概念体系の中での位置付けを認識することができるようになる。
このコミュニティ依存型情報開示システムでは、概念体系による検索のほか、フリーテキスト検索機能も有している。上記検索対象概念として入力された用語と、このフリーテキスト検索の欄に入力された用語とは、後述する概念体系への専門的語彙の追加のために情報検索サーバ1により操作履歴DB4に記憶される。
次に、実際の概念体系への専門的語彙の追加の手法を詳細に説明する。
一般に、非専門家は、専門家が使わない語彙(専門用語と対比される用語として「市民語」と一般に言われる)で検索するので、これを専門家コミュニティの専門用語と対応付ける必要がある。例えば、原子力の専門家は、原子炉のパイプのことを「配管」と呼ぶが非専門化は「パイプ」と呼ぶ。検索「美浜原発 パイプ 蒸気漏れ」が入力されたときはそれぞれの語彙を原子力分野の概念として正しく認識し、美浜原発二次系配管破断事故の検索結果を提示すべきところである。この問題を本実施の形態では解決する。
具体的には、以下の手法により概念体系に最新の専門的語彙を追加する。
即ち、専門領域に関する専門家の概念体系を全て記述し、略語などの語彙も網羅的にこれに収録するのは煩雑な作業を伴うので、コミュニティ依存型情報開示システムでは、概念体系による検索のほか、前述したようにフリーテキスト検索機能も有している。
しかるに、本システムは、概念体系に収録されていないフリーテキスト(キーワード)とその利用頻度は、概念体系の拡充のための手がかりとするものである。即ち、検索時に指定されたフリーテキストを、その頻度や同時に選択された検索対象概念と対応付けて概念体系の保守者に概念体系管理用端末5により提示する。
即ち、通常は概念体系管理用端末5には、図4に示されるような画面が表示される。ここでは、作用に概念体系(この例では、原子力システムの安全オントロジー)が階層表示され、更に選択した概念についての概念ID、タイトル、解説、コメント、言語ラベル等が右方に表示されるようになっている。この言語ラベルとは、人間がこの概念を指し示すために用いる言語表現であり、同じ概念でも正式名称、略語や日本語、英語など、様々な標記があり得る。そして、概念体系管理用端末5は、実装されているソフトウェアにより図5に示されるような処理を行い、概念体系への語彙の追加を行う。
即ち、先ず概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴DB4を参照して抽出し(ステップS1)、専門分野文書DB3を分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し(ステップS2)、専門分野文書DB3を分析して当該キーワードと関連性の高い概念体系中の「概念」はどれかを判断し(ステップS3)、当該キーワードを含む検索結果から利用者が実際に閲覧した文書を分析して関連性の高い「概念」を判断し(ステップS4)、これら「概念」と検索時に指定された「概念」のうち、当該キーワードに最も関連性の高い「概念」を判断し(ステップS5)、全ての処理を終了する。以上の処理は、本発明の第1の実施の形態に係るコミュニティ依存型情報開示方法に相当する。
以上の処理により、関連性の高い「概念」が新たな検索キーワードとして追加された場合には、図6に示されるような表示がなされる。即ち、この画面では、自動追加された旨と、その扱いを管理者に示唆する旨、更には許容応力として検索回数、そして、文書中で当該キーワードが使われる文脈例が表示される。
以上説明したように、本発明の第1の実施の形態によれば、ユーザが入力したフリーキーワードを検索用語と関連付けて記憶しておき、その頻度を履歴しとして管理しておき当該フリーキーワードを新たな検索用のキーワードとして自動的に概念体系の中の関連する用語の下位の概念として追加することが可能となる。
(第2の実施の形態)
次に本発明の第2の実施の形態について説明する。
同じ単語が複数の異なるコミュニティで独特の意味で使用されている場合、必ずしもユーザが参照しているコミュニティの知識がユーザの知識要求に答えるものとは限らない。
この第2の実施の形態は、あるコミュニティの「概念体系」の概念に関して検索が行われたとき、別のコミュニティの類似の概念の存在も提示するものである。
より詳細には、いずれかの概念体系の概念が検索サイト利用者によって指定されたときには、その概念の近傍の概念と類似の概念を他の概念体系から探索する。ここで、「近傍の概念」とは、上位概念、下位概念などの関連性によって1乃至2ステップの範囲で結ばれた概念を示す。さらに、「概念の類似」とは「概念」を指し示す語を比較し、どちらかの語が他の語に文字列として含まれるなどの関係を示す。
図7(a)は本発明の第2の実施の形態に係るコミュニティ依存型情報開示システムの構成を示す概念図である。同図に示されるように、このシステムは、各分野用の情報検索サーバ10A、10B…と、概念体系を対象にした検索サーバ11を有している。各分野用の情報探索サーバ10Aは、ユーザ端末12より検索質問を受けると、概念体系を対象にした検索サーバ11に適宜問い合わせ、検索対象である概念に類似した概念を問い合わせて併せて表示出力することになる。
その表示の一例は、図7(b)に示される通りである。即ち、この例は、分野Aに関する概念Xの探索が求められた結果であるが、分野Aにおける概念Xに関連した文書の検索結果(図中、右欄)に合わせて、他の概念体系における概念Xに関連した概念リスト(図中、左欄)が併せて表示されることになる。
以上説明したように、本発明の第2の実施の形態によれば、検索対象の語彙に類似する語彙についても併せて概念を表示することが可能となる。
以上、本発明の実施の形態について説明したが、本発明はこれに限定されることなくその趣旨を逸脱しない範囲で種々の改良・変更が可能であることは勿論である。
本発明の第1の実施の形態に係るコミュニティ依存型情報検索システムの構成を示す概念図である。 (a)は概念体系を示す図、(b)は専門分野文書の情報の例を示す図である。 ユーザ端末6にて表示される検索画面の一例を示す図である。 概念体系管理用端末にて表示される画面の一例を示す図である。 概念体系への新たな検索キーワードの追加処理の流れを示すフローチャートである。 概念体系への新たな検索キーワードの追加処理がなされた場合の表示画面を示す図である。 本発明の第2の実施の形態に係るコミュニティ依存型情報検索システムの構成を示す概念図である。
符号の説明
1…情報検索サーバ、2…コミュニティの概念体系DB、3…専門分野文書DB、4…操作履歴DB、5…概念体系管理用端末、6…ユーザ端末、7…ネットワーク。

Claims (4)

  1. 概念体系を記憶するコミュニティの概念体系データベースと、
    上記概念体系を構築する概念の文書データを記憶する文書データベースと、
    ユーザによる検索履歴を記憶する操作履歴データベースと、
    上記概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴データベースより抽出し、専門分野文書データベースを分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し、専門分野文書データベースを分析して当該キーワードと関連性の高い概念体系中の概念はどれかを判断し、当該キーワードを含む検索結果から利用者が実際に閲覧した文書データを分析して関連性の高い概念を判断し、これら概念と検索時に指定された概念のうち、当該キーワードに最も関連性の高い概念を特定し、上記コミュニティの概念体系データベースの概念体系に追加する機能を備えた概念体系管理用端末と、
    を有することを特徴とするコミュニティ依存型情報探索システム。
  2. 概念体系管理用端末が、概念体系に未登録でフリーワードとして検索されるワードのうち検索頻度が高いものを操作履歴データベースより抽出し、専門分野文書データベースを分析して当該ワードが当該専門分野のキーワードである可能性が高いか否かを判断し、専門分野文書データベースを分析して当該キーワードと関連性の高い概念体系中の概念はどれかを判断し、当該キーワードを含む検索結果から利用者が実際に閲覧した文書データを分析して関連性の高い概念を判断し、これら概念と検索時に指定された概念のうち、当該キーワードに最も関連性の高い概念を特定し、上記コミュニティの概念体系データベースの概念体系に追加することを特徴とするコミュニティ依存型情報探索方法。
  3. 複数の分野についての情報検索をそれぞれ実施するための複数の情報検索サーバと、
    類似概念を判断するための類似検索サーバと、
    を備え、ユーザ端末より所定分野の情報検索が要求された場合には、上記複数の情報検索サーバのうち当該所定分野についての情報探索を実施する情報検索サーバは上記類似検索サーバより上記検索を要求された概念に類似する概念の情報を要求し、上記検索を要求された概念と類似する概念の情報を併せてユーザ端末に送信する、
    ことを特徴とするコミュニティ依存型情報探索システム。
  4. 複数の分野についての情報検索をそれぞれ実施するための複数の情報検索サーバと、類似概念を判断するための類似検索サーバとを備えたコミュニティ依存型情報探索システムによる方法であって、ユーザ端末より所定分野の情報検索が要求された場合には、上記複数の情報検索サーバのうち当該所定分野についての情報探索を実施する情報検索サーバは上記類似検索サーバより上記検索を要求された概念に類似する概念の情報を要求し、上記検索を要求された概念と類似する概念の情報を併せてユーザ端末に送信する、ことを特徴とするコミュニティ依存型情報探索方法。
JP2005053618A 2005-02-28 2005-02-28 コミュニティ依存型情報検索システム及び方法 Pending JP2006236254A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005053618A JP2006236254A (ja) 2005-02-28 2005-02-28 コミュニティ依存型情報検索システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005053618A JP2006236254A (ja) 2005-02-28 2005-02-28 コミュニティ依存型情報検索システム及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008287664A Division JP2009043288A (ja) 2008-11-10 2008-11-10 コミュニティ依存型情報検索システム及び方法

Publications (1)

Publication Number Publication Date
JP2006236254A true JP2006236254A (ja) 2006-09-07

Family

ID=37043796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005053618A Pending JP2006236254A (ja) 2005-02-28 2005-02-28 コミュニティ依存型情報検索システム及び方法

Country Status (1)

Country Link
JP (1) JP2006236254A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020739A (ja) * 2008-06-12 2010-01-28 Yahoo Japan Corp 社会的な人気・関心を反映したディレクトリを作成、検索、及び表示する情報管理装置、方法及びプログラム
JP2014179114A (ja) * 2008-08-29 2014-09-25 Primal Fusion Inc 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020739A (ja) * 2008-06-12 2010-01-28 Yahoo Japan Corp 社会的な人気・関心を反映したディレクトリを作成、検索、及び表示する情報管理装置、方法及びプログラム
JP2014179114A (ja) * 2008-08-29 2014-09-25 Primal Fusion Inc 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法

Similar Documents

Publication Publication Date Title
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
KR101027999B1 (ko) 사용자 로그로부터의 검색 카테고리 유의어 추론
US8024345B2 (en) System and method for associating queries and documents with contextual advertisements
KR101040119B1 (ko) 콘텐츠 검색 장치 및 방법
US20090070322A1 (en) Browsing knowledge on the basis of semantic relations
Fan et al. Project-based as-needed information retrieval from unstructured AEC documents
US20110301941A1 (en) Natural language processing method and system
Vlachidis et al. A knowledge‐based approach to Information Extraction for semantic interoperability in the archaeology domain
CN103548023A (zh) 基于本体的自动自助式用户支持
WO2019116253A1 (en) Supporting evidence retrieval for complex answers
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
Nesi et al. Geographical localization of web domains and organization addresses recognition by employing natural language processing, Pattern Matching and clustering
US20140359409A1 (en) Learning Synonymous Object Names from Anchor Texts
CN102737021A (zh) 搜索引擎及其实现方法
Das et al. A novel approach for automatic Bengali question answering system using semantic similarity analysis
US20090150342A1 (en) Computer Method and Apparatus for Tag Pre-Search in Social Software
WO2012091541A1 (en) A semantic web constructor system and a method thereof
JP2008299842A (ja) 広告執行による反応情報提供方法、コンピュータ読み取り可能な記録媒体、広告執行による反応情報提供システム
JP4853915B2 (ja) 検索システム
JP2006236254A (ja) コミュニティ依存型情報検索システム及び方法
Zhuhadar A synergistic strategy for combining thesaurus-based and corpus-based approaches in building ontology for multilingual search engines
JP2009043288A (ja) コミュニティ依存型情報検索システム及び方法
WO2009035871A1 (en) Browsing knowledge on the basis of semantic relations
JP4860439B2 (ja) 質問文の自動生成システム
Bergamaschi et al. Exploiting semantics for filtering and searching knowledge in a software development context

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090324