JP2006164086A - Online knowledge search support system and online knowledge search support method - Google Patents
Online knowledge search support system and online knowledge search support method Download PDFInfo
- Publication number
- JP2006164086A JP2006164086A JP2004357483A JP2004357483A JP2006164086A JP 2006164086 A JP2006164086 A JP 2006164086A JP 2004357483 A JP2004357483 A JP 2004357483A JP 2004357483 A JP2004357483 A JP 2004357483A JP 2006164086 A JP2006164086 A JP 2006164086A
- Authority
- JP
- Japan
- Prior art keywords
- category
- knowledge
- weblog
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、知人情報とカテゴリー情報に基づいたオンライン知識検索技術に関し、詳しくはネットワーク上で特定のカテゴリーに関する知識を蓄積しているウェブログコミュニティの抽出によりオンライン知識検索を支援する技術に関する。 The present invention relates to an online knowledge search technology based on acquaintance information and category information, and more particularly to a technology that supports online knowledge search by extracting a weblog community that stores knowledge about a specific category on a network.
従来のオンライン知識検索技術においては、キーワードとページランクに基づく一般的な検索結果から更に求める知識を絞り込む方法として、
(1)自然言語処理による話題抽出に基づく検索結果の絞り込み(例えば、特許文献1参照)。
In the conventional online knowledge search technology, as a method of further narrowing down the knowledge to be searched from general search results based on keywords and page rank,
(1) Narrowing search results based on topic extraction by natural language processing (see, for example, Patent Document 1).
(2)協調フィルタリングによる検索結果の絞り込み(例えば、特許文献2参照)。
といった方法がある。
(2) Narrowing search results by collaborative filtering (see, for example, Patent Document 2).
There is a method.
上記の(1)による絞り込み方法においては、一般に形態素解析、構文解析等を含む自然言語処理により、求める知識に言及しているコンテンツを抽出する。 In the narrowing-down method according to the above (1), contents referring to the knowledge to be obtained are generally extracted by natural language processing including morphological analysis and syntax analysis.
また、(2)による絞り込み方法においては、有限数の協調フィルタリング参加ユーザーの集合において、ユーザープロファイルの一部として登録された嗜好情報やブックマーク等の解析に基づく嗜好情報抽出、及び各参加ユーザーの検索履歴に基づき、検索者と似た嗜好を持つ有限数の参加ユーザーの検索履歴を利用して検索結果を絞り込む。 Further, in the narrowing-down method according to (2), preference information extraction based on analysis of preference information, bookmarks, etc. registered as part of the user profile in a limited number of collaborative filtering participant users, and search for each participant user Based on the history, the search results are narrowed down using the search history of a finite number of participating users who have similar preferences to the searcher.
また、通例ウェブログサーバは、ウェブログ作者が日々登録するエントリー、および該エントリーに対してウェブログ読者が付加するコメント、及び異なるウェブログにおいて該エントリーに関連するエントリーが登録されたことを示すトラックバックより構成されるウェブログコンテンツを蓄積するとともに、エントリーを話題毎に分類したカテゴリー情報、及び該ウェブログ作者のインターネット上での知人に関するウェブログURL等のメタデータをFoaf(例えば、非特許文献1参照)等の形式で記述した知人情報を有する。本発明ではこれらを利用したオンライン知識検索支援をするものである。
前記従来技術においては、(1)の場合、求める知識に関する記述を含むコンテンツは抽出可能であるが、そのコンテンツにおける該知識に関する記述の信頼性は保証できない、という問題がある。 In the prior art, in the case of (1), there is a problem that the content including the description relating to the desired knowledge can be extracted but the reliability of the description relating to the knowledge in the content cannot be guaranteed.
また、(2)の場合、限られた数のエンドユーザーによる協調フィルタリングでは絞り込み精度をあげにくく、協調フィルタリングに参加するエンドユーザー数を増やすことも容易ではない、という問題がある。 Further, in the case of (2), there is a problem that it is difficult to improve the narrowing accuracy by collaborative filtering by a limited number of end users, and it is not easy to increase the number of end users participating in collaborative filtering.
本発明は、上記に問題点に鑑みてなされたもので、その目的とするところは、オンライン知識検索技術において、通例ウェブログがメタデータとして有する、エントリーを分類したカテゴリー情報、及びFoaf等の形式で記述されている知人情報を用いて、目的とする知識に関して相互に評価し合い一定の信頼をおく人脈を抽出し、この人脈に属するウェブログのコンテンツから信頼性の高い知識を取得できるよう、エンドユーザーを支援することを可能とするオンライン知識検索支援装置及び方法を提供することにある。 The present invention has been made in view of the above problems, and the purpose of the present invention is to categorize category information classified as entries, which is commonly used as metadata in a web log in online knowledge search technology, and a format such as Foaf. Using the acquaintance information described in the above, we will mutually evaluate the target knowledge and extract a human network with a certain level of trust, so that we can acquire highly reliable knowledge from the content of the weblog belonging to this human network. An object of the present invention is to provide an online knowledge search support apparatus and method that can support an end user.
上記目的を達成するため、請求項1等に記載の本発明は、以下の装置および方法を特徴とする。 In order to achieve the above object, the present invention described in claim 1 and the like is characterized by the following apparatus and method.
(1)知識リソース収集装置と知識検索支援サーバとを備えてオンライン知識検索を支援する装置であって、
前記知識リソース収集装置は、
一般的なウェブログコンテンツに含まれるエントリー、コメント、トラックバック及びエントリーの内容を分類したカテゴリー情報、及びウェブログ作者の知人のウェブログURL等を含む知人情報をインターネット上で収集するクローリング手段と、
前記クローリング手段で収集したウェブログコンテンツに含まれる知人情報から共通のカテゴリーを持つ知人関係を抽出することにより該カテゴリーに詳しい知人ネットワークをカテゴリー毎の人脈情報として抽出する人脈情報抽出手段と、
前記人脈情報に属するウェブログコンテンツをカテゴリー毎に検索可能な形でインデクシングして知識リソースとして蓄積する知識リソース抽出手段とを備え、
前記知識検索支援サーバは、一般的なエンドユーザー端末のウェブブラウザ等のブラウジングソフトから検索対象カテゴリーを指定され、該検索対象カテゴリーの同意語も含めたカテゴリーについて前記知識リソースを検索し、検索結果のウェブログコンテンツに含まれるウェブログ、ウェブログ作者、時系列及びカテゴリー情報にて分類されたエントリー、コメント、トラックバック及び各カテゴリー毎の人脈情報を、構造可視化を行った上でエンドユーザー端末上に表示可能とする知識リソース検索手段を備えたことを特徴とするオンライン知識検索支援装置。
(1) An apparatus that supports an online knowledge search including a knowledge resource collection device and a knowledge search support server,
The knowledge resource collection device includes:
Crawling means for collecting acquaintance information on the Internet, including entries, comments, trackbacks and category information included in general weblog contents, and weblog information of weblog author acquaintances;
Human network information extracting means for extracting an acquaintance network having a common category from acquaintance information included in the weblog content collected by the crawling means to extract an acquaintance network that is familiar with the category as personal network information for each category;
A knowledge resource extracting means for indexing the web log content belonging to the personal network information in a searchable form for each category and storing it as a knowledge resource;
The knowledge search support server is designated a search target category from browsing software such as a web browser of a general end user terminal, searches the knowledge resource for a category including a synonym of the search target category, Weblog entries included in weblog content, weblog authors, time series and category information, comments, trackbacks, and network information for each category are displayed on the end user terminal after visualizing the structure. An online knowledge search support apparatus characterized by comprising knowledge resource search means for enabling.
(2)知識リソース収集装置と知識検索支援サーバとを備えてオンライン知識検索を支援する方法であって、
前記知識リソース収集装置は、
一般的なウェブログコンテンツに含まれるエントリー、コメント、トラックバック及びエントリーの内容を分類したカテゴリー情報、及びウェブログ作者の知人のウェブログURL等を含む知人情報をインターネット上で収集するクローリング過程と、
前記クローリング過程で収集したウェブログコンテンツに含まれる知人情報から共通のカテゴリーを持つ知人関係を抽出することにより該カテゴリーに詳しい知人ネットワークをカテゴリー毎の人脈情報として抽出する人脈情報抽出過程と、
前記人脈情報に属するウェブログコンテンツをカテゴリー毎に検索可能な形でインデクシングして知識リソースとして蓄積する知識リソース抽出過程とを有し、
前記知識リソース検索支援サーバは、一般的なエンドユーザー端末のウェブブラウザ等のブラウジングソフトから検索対象カテゴリーを指定され、該検索対象カテゴリーの同意語も含めたカテゴリーについて前記知識リソースを検索し、検索結果のウェブログコンテンツに含まれるウェブログ、ウェブログ作者、時系列及びカテゴリー情報にて分類されたエントリー、コメント、トラックバック及び各カテゴリー毎の人脈情報を、構造可視化を行った上でエンドユーザー端末上に表示可能とする知識リソース検索過程を有することを特徴とするオンライン知識検索支援方法。
(2) A method for supporting online knowledge search comprising a knowledge resource collection device and a knowledge search support server,
The knowledge resource collection device includes:
A crawling process for collecting acquaintance information on the Internet, including entries, comments, trackbacks and category information included in general weblog contents, and web log URLs of acquaintances of weblog authors;
A network information extraction process for extracting a network of acquaintances familiar with the category as network information for each category by extracting an acquaintance relationship having a common category from acquaintance information included in the weblog content collected in the crawling process,
A knowledge resource extraction process of indexing the web log content belonging to the network information in a searchable form for each category and accumulating as a knowledge resource,
The knowledge resource search support server is designated a search target category from browsing software such as a web browser of a general end user terminal, searches the knowledge resource for a category including a synonym of the search target category, and a search result Visualization of the structure of the weblogs, weblog authors, entries categorized by time series and category information, comments, trackbacks, and network information for each category on the end user terminal An online knowledge search support method comprising a knowledge resource search process that enables display.
以上のように、本発明にあっては、知識リソース収集装置はウェブログコンテンツを収集し、知人関係にあると共に共通のカテゴリー情報を持つウェブログの集合を各カテゴリーに詳しい人脈として抽出し、知識リソース検索支援サーバは同意語を含む検索対象カテゴリーに属するウェブログコンテンツを、検索対象カテゴリーに詳しい人脈に属するウェブログコンテンツから検索し、カテゴリー毎の人脈やウェブログ毎、あるいは時系列や相互のコメント関係、相互のトラックバック関係等の分類により検索結果を可視化して表示することを可能とするため、通例ウェブログに一般的なメタデータとして付随するカテゴリー情報及び知人情報のみを用いて、目的とする知識に精通し相互に知人関係を維持するに足る信頼をおいている人脈を抽出し、この人脈に属するウェブログのコンテンツは該知識に関して信頼性が高いものとみなして、該ウェブログコンテンツから求める知識を容易に取得できるようエンドユーザーを支援することを可能とする。 As described above, in the present invention, the knowledge resource collection device collects web log contents, extracts a set of weblogs having acquaintance relationships and common category information as detailed personal connections to each category, and knowledge The resource search support server searches the web log contents belonging to the search target category including synonyms from the web log contents belonging to the personal network familiar to the search target category, and the human network for each category, each web log, or time series and mutual comments. In order to make it possible to visualize and display search results by classification of relationships, mutual trackback relationships, etc., we usually use only category information and acquaintance information attached as general metadata to weblogs. A human network that is knowledgeable and trusts enough to maintain mutual acquaintance Out, the content of the weblog belonging to the network of contacts is regarded as reliable with respect to the knowledge makes it possible to support the end-user to the knowledge obtained from the weblog content can be obtained easily.
また、現在普及しつつあるウェブログの一般的なメタデータをそのまま利用可能であるため、既存ウェブログコンテンツをそのまま知識リソースとして利用可能となる。 Further, since the general metadata of the weblog that is currently popularized can be used as it is, the existing weblog content can be used as it is as a knowledge resource.
これにより、求める知識に関する記述を含むコンテンツは抽出可能であるが、そのコンテンツにおける該知識に関する記述の信頼性は保証できない、という従来の問題を解決できる。 As a result, it is possible to solve the conventional problem that the content including the description related to the desired knowledge can be extracted, but the reliability of the description regarding the knowledge in the content cannot be guaranteed.
また、既存ウェブログコンテンツをそのまま知識リソースとして利用可能であるため、限られた数のエンドユーザーによる協調フィルタリングでは絞り込み精度をあげにくく、協調フィルタリングに参加するエンドユーザー数を増やすことも容易ではない、という問題を解決できる。 In addition, since existing weblog contents can be used as knowledge resources as they are, it is difficult to increase the accuracy of narrowing down by collaborative filtering by a limited number of end users, and it is not easy to increase the number of end users participating in collaborative filtering. Can solve the problem.
以上説明したように、本発明によれば、知識リソース収集装置はウェブログコンテンツを収集し、知人関係にあると共に共通のカテゴリー情報を持つウェブログの集合を各カテゴリーに詳しい人脈として抽出し、知識リソース検索支援サーバは同意語を含む検索対象カテゴリーに属するウェブログコンテンツを、検索対象カテゴリーに詳しい人脈に属するウェブログコンテンツから検索し、カテゴリー毎の人脈や各ウェブログ毎、あるいは時系列等の分類により検索結果を可視化してエンドユーザー端末で表示可能とするため、通例ウェブログに一般的なメタデータとして付随するカテゴリー情報及び知人情報のみを用いて、目的とする知識に精通し相互に知人関係を維持するに足る信頼をおいている人脈を抽出し、この人脈に属するウェブログのコンテンツは該知識に関して信頼性が高いものとみなして、該ウェブログコンテンツから求める知識を容易に取得できるようエンドユーザーを支援することを可能とする。 As described above, according to the present invention, the knowledge resource collection device collects web log contents, extracts a set of weblogs having acquaintance relationships and common category information as detailed personal connections to each category, and knowledge The resource search support server searches web log contents belonging to the search target category including synonyms from the web log contents belonging to the personal network familiar with the search target category, and classifies the human network by category, each web log, or time series. In order to visualize search results and display them on end-user terminals, we usually use only category information and acquaintance information attached as general metadata to weblogs. Extract the human network that has enough trust to maintain the web, and the web that belongs to this human network Content grayed is deemed reliable regarding the knowledge makes it possible to support the end-user to knowledge can easily acquire a determined from the weblog content.
これにより、求める知識に関する記述を含むコンテンツは抽出可能であるが、そのコンテンツにおける該知識に関する記述の信頼性は保証できない、という従来の問題を解決できる。 As a result, it is possible to solve the conventional problem that the content including the description related to the desired knowledge can be extracted, but the reliability of the description regarding the knowledge in the content cannot be guaranteed.
また、既存ウェブログコンテンツをそのまま知識リソースとして利用可能であるため、限られた数のエンドユーザーによる協調フィルタリングでは絞り込み精度をあげにくく、協調フィルタリングに参加するエンドユーザー数を増やすことも容易ではない、という問題を解決できる。 In addition, since existing weblog contents can be used as knowledge resources as they are, it is difficult to increase the accuracy of narrowing down by collaborative filtering by a limited number of end users, and it is not easy to increase the number of end users participating in collaborative filtering. Can solve the problem.
以下、図面を用いて本発明の実施の形態を説明する。図1は、請求項1等に記載の本発明の一実施形態に係るオンライン知識検索支援装置及び方法の構成及び処理の流れを示す図である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing the configuration and processing flow of an online knowledge search support apparatus and method according to an embodiment of the present invention as set forth in claim 1 and the like.
同図に示すオンライン知識検索支援装置及び方法は、ウェブログサーバ1を情報源として、知識リソース収集装置2、知識リソース検索支援サーバ3から構成されており、各装置間はネットワークによって接続され、更にインターネットを介して一般的なウェブログサーバ1及び一般的なエンドユーザー端末4と接続されている。
The online knowledge search support apparatus and method shown in FIG. 1 includes a knowledge
知識リソース収集装置2は、一般的なウェブログサーバ1に登録された知人情報Foaf、カテゴリー情報CAT、エントリーENT、コメントCMT及びトラックバックTRBKを含むウェブログコンテンツをキャッシュ情報として収集するクローリング手段と、前記知人情報Foaf及びカテゴリー情報CATに基づき各カテゴリー毎の人脈情報RSSを抽出する人脈情報抽出手段と、カテゴリー毎の人脈情報RSSに属する各ウェブログ作者のウェブログに含まれるエントリーENT、コメントCMT及びトラックバックTRBKを前記ウェブログコンテンツから抽出し、該エントリーENT、コメントCMT及び該トラックバックTRBKをカテゴリー毎の人脈情報と関連づけて蓄積したものを知識リソースとして生成する知識リソース抽出手段とを有する。
The knowledge
図2は一般的なウェブログコンテンツの構成例を示す図である。一般に、エントリーは時系列及びカテゴリー情報にて分類されているテキスト情報及び画像URL等であり、いわゆる日記の書き込み内容に相当する。コメントは通例、エントリーに対してウェブログ読者が書き込むテキスト情報であり、画像URL等を含むこともある。トラックバックはトラックバック先エントリーに関連するトラックバック元エントリーであり、トラックバック先ウェブログが受信したTrackbackpingに基づき参照され、トラックバック先エントリーとは異なるウェブログに存在することが多い。 FIG. 2 is a diagram showing a configuration example of general weblog content. In general, entries are text information and image URLs classified by time series and category information, and correspond to what is written in a diary. A comment is usually text information written by a weblog reader for an entry, and may include an image URL or the like. The trackback is a trackback source entry related to the trackback destination entry, is referred to based on the trackbacking received by the trackback destination web log, and often exists in a web log different from the track back destination entry.
また、一般にカテゴリー情報は、エントリーが属するカテゴリーあるいはジャンルあるいは話題を示す分類情報であり、ウェブログ作者あるいはウェブログサーバ管理者が設定することが多く、また一般的なウェブログサーバでは階層構造を持たないことが多い。 In general, category information is classification information indicating the category, genre, or topic to which the entry belongs, and is often set by the weblog author or weblog server administrator. In addition, general weblog servers have a hierarchical structure. Often not.
知人情報は、通例Foaf形式でウェブログ毎に設定されており、該ウェブログ作者の名前やニックネーム、メールアドレスあるいはメールアドレスハッシュ値、ウェブログURLや該Foaf自体のURL等を所定のXMLにて<Person>タグ配下に記述するとともに、該ウェブログ作者の知人のFoafへの参照情報を<Knows>タグ配下に記述し、更に必要に応じて例えばDublincore(例えば、後述の非特許文献2参照)等一般的なメタデータ記述を含む。
The acquaintance information is usually set for each web log in the Foaf format, and the web log author's name, nickname, mail address or mail address hash value, web log URL, URL of the Foaf itself, etc. are stored in a predetermined XML. In addition to the description under the <Person> tag, reference information to the Foaf of the acquaintance of the weblog author is described under the <Knows> tag, and further, for example, Dubincore (for example, see Non-Patent
ここで、カテゴリー毎の人脈情報RSSと呼ぶものは、各ウェブログのFoafにおいて<Knows>タグで記述される知人のウェブログへの参照を順次たどり、該ウェブログ群の中で共通のカテゴリー情報を持つウェブログ集合を抽出した結果である。カテゴリー毎の人脈情報の実装の単純な一例としては、例えばRSS1.0(例えば、後述の非特許文献3参照)の形式を用い、<Channel>タグの<description>タグに共通のカテゴリー情報を記述し、該カテゴリー情報を共通に持ち<Knows>タグで参照関係にある各Foafへの参照URLを<item>タグ配下に記述する。図3にカテゴリー毎の人脈情報の一例を示す。
Here, what is called personal network information RSS for each category sequentially refers to the acquaintance's weblog described in the <Knows> tag in the Foaf of each weblog, and common category information in the weblog group. This is a result of extracting a set of weblogs having. As a simple example of the implementation of network information for each category, for example, the format of RSS 1.0 (for example, see Non-Patent
図1に戻って、知識リソースと呼ぶものは、例えばウェブログコンテンツのキャッシュを格納したデータベースであり、ウェブログコンテンツを構成するエントリーENT、コメントCMT及びトラックバックTRBK間の相互関係、及び各エントリーENTが属するカテゴリー情報CAT、各エントリーが属するウェブログ及びウェブログ作者及びカテゴリー毎の人脈情報RSS等を含み、これらをキーとして検索が可能である。 Returning to FIG. 1, what is called a knowledge resource is a database that stores, for example, a cache of web log content. The entry ENT, the comment CMT, and the trackback TRBK constituting the web log content, and each entry ENT The category information CAT to which the entry belongs, the web log to which each entry belongs, the author of the web log, the personal network information RSS for each category, and the like, can be searched using these as keys.
知識リソース検索支援サーバ3は、エンドユーザー端末4から要求される検索対象カテゴリーを同意語辞書に基づき同意語の解決を行った上で、該カテゴリーに対応付けられてインデクシングされているエントリーENT、コメントCMT及びトラックバックTRBKの集合を前記知識リソース抽出手段にて抽出した知識リソースから検索し、人脈情報RSSと関連づけて分類されている該検索結果をエンドユーザー端末4にて表示可能な形式、例えばWWWブラウザで表示可能なhtml形式で返却する知識リソース検索手段を有する。なお、検索対象カテゴリーは、例えば複数のキーワードの組み合わせである。
The knowledge resource
次に、以上のように構成される本実施形態のオンライン知識検索支援装置及び方法の作用について、図1内に示すステップ番号S1〜S4を参照して説明する。 Next, the operation of the online knowledge search support apparatus and method of this embodiment configured as described above will be described with reference to step numbers S1 to S4 shown in FIG.
まず、知識リソース収集装置2は、インターネットに接続され公開されている一般的なウェブログサーバ1から、Foaf形式の知人情報Foaf、カテゴリー情報CAT、エントリーENT、コメントCMT及びトラックバックTRBKを含むウェブログコンテンツを収集するとともに、各Foafの<Knows>タグにて記述された各ウェブログ作者の知人が作成したウェブログについても同様にウェブログコンテンツをキャッシュ2Aとして収集する(ステップS1)。
First, the knowledge
次に、知識リソース収集装置2は、前記キャッシュ2Aにおいて、Foafの<Knows>タグにより参照関係にある複数のウェブログの中で同一カテゴリー情報を含むウェブログの集合に対して、該カテゴリーの人脈情報RSS2Bとして抽出する(ステップS2)と共に、前記キャッシュ2Aに含まれる該カテゴリーの人脈情報RSSに属するウェブログコンテンツを前記カテゴリー毎の人脈情報RSSと対応づけて蓄積し、カテゴリー毎の知識リソース2Cとする(ステップS3)。
Next, in the
次に、エンドユーザー端末4から検索対象カテゴリーとして複数のキーワードを受け取った知識リソース検索支援サーバ3は、各キーワードについて同意語辞書に基づき同意語の解決を行った上で、該キーワードに対応づけられたウェブログコンテンツを前記知識リソース抽出手段にて抽出した知識リソース2Cから検索し、検索結果のウェブログコンテンツに含まれるウェブログ、ウェブログ作者、時系列及びカテゴリー情報にて分類されたエントリーENT、コメントCMT、トラックバック、及び前記RSS形式で記述された各カテゴリー毎の人脈情報RSSをツリー構造あるいはグラフ構造としてhtml形式で可視化し、エンドユーザー端末4に返信する(ステップS4)。
Next, the knowledge resource
[非特許文献2]
“Dublin Core Metadata Element Set,Version 1.1:Reference Description" , 2003/06/02更新,[2004/10/28検索],インターネットURL<http://dublincore.org/documents/dces/>
[非特許文献3]
“RDF Site Summary(RSS)1.0" ,Gabe Beged‐Dov & Dan Brickley et.al., 2001/05/30更新,[2004/10/29検索],インターネットURL<http://web.resource.org/rss/1.0/spec>
[Non-Patent Document 2]
"Dublin Core Metadata Element Set, Version 1.1: Reference Description", updated 2003/06/02, [Search 10/28/2004], Internet URL <http://dublincore.org/documents/dces/>
[Non-Patent Document 3]
"RDF Site Summary (RSS) 1.0", Gabe Beged-Dov & Dan Brickley et.al., 2001/05/30 update, [Search 10/29/2004], Internet URL <http://web.resource.org /rss/1.0/spec>
1 ウェブログサーバ
2 知識リソース収集装置
3 知識リソース検索支援サーバ
4 エンドユーザー端末
1
Claims (2)
前記知識リソース収集装置は、
一般的なウェブログコンテンツに含まれるエントリー、コメント、トラックバック及びエントリーの内容を分類したカテゴリー情報、及びウェブログ作者の知人のウェブログURL等を含む知人情報をインターネット上で収集するクローリング手段と、
前記クローリング手段で収集したウェブログコンテンツに含まれる知人情報から共通のカテゴリーを持つ知人関係を抽出することにより該カテゴリーに詳しい知人ネットワークをカテゴリー毎の人脈情報として抽出する人脈情報抽出手段と、
前記人脈情報に属するウェブログコンテンツをカテゴリー毎に検索可能な形でインデクシングして知識リソースとして蓄積する知識リソース抽出手段とを備え、
前記知識検索支援サーバは、一般的なエンドユーザー端末のウェブブラウザ等のブラウジングソフトから検索対象カテゴリーを指定され、該検索対象カテゴリーの同意語も含めたカテゴリーについて前記知識リソースを検索し、検索結果のウェブログコンテンツに含まれるウェブログ、ウェブログ作者、時系列及びカテゴリー情報にて分類されたエントリー、コメント、トラックバック及び各カテゴリー毎の人脈情報を、構造可視化を行った上でエンドユーザー端末上に表示可能とする知識リソース検索手段を備えたことを特徴とするオンライン知識検索支援装置。 An apparatus for supporting online knowledge search comprising a knowledge resource collection device and a knowledge search support server,
The knowledge resource collection device includes:
Crawling means for collecting acquaintance information on the Internet, including entries, comments, trackbacks and category information included in general weblog contents, and weblog information of weblog author acquaintances;
Human network information extracting means for extracting an acquaintance network having a common category from acquaintance information included in the weblog content collected by the crawling means to extract an acquaintance network that is familiar with the category as personal network information for each category;
A knowledge resource extracting means for indexing the web log content belonging to the personal network information in a searchable form for each category and storing it as a knowledge resource;
The knowledge search support server is designated a search target category from browsing software such as a web browser of a general end user terminal, searches the knowledge resource for a category including a synonym of the search target category, Weblog entries included in weblog content, weblog authors, time series and category information, comments, trackbacks, and network information for each category are displayed on the end user terminal after visualizing the structure. An online knowledge search support device characterized by comprising knowledge resource search means for enabling.
前記知識リソース収集装置は、
一般的なウェブログコンテンツに含まれるエントリー、コメント、トラックバック及びエントリーの内容を分類したカテゴリー情報、及びウェブログ作者の知人のウェブログURL等を含む知人情報をインターネット上で収集するクローリング過程と、
前記クローリング過程で収集したウェブログコンテンツに含まれる知人情報から共通のカテゴリーを持つ知人関係を抽出することにより該カテゴリーに詳しい知人ネットワークをカテゴリー毎の人脈情報として抽出する人脈情報抽出過程と、
前記人脈情報に属するウェブログコンテンツをカテゴリー毎に検索可能な形でインデクシングして知識リソースとして蓄積する知識リソース抽出過程とを有し、
前記知識リソース検索支援サーバは、一般的なエンドユーザー端末のウェブブラウザ等のブラウジングソフトから検索対象カテゴリーを指定され、該検索対象カテゴリーの同意語も含めたカテゴリーについて前記知識リソースを検索し、検索結果のウェブログコンテンツに含まれるウェブログ、ウェブログ作者、時系列及びカテゴリー情報にて分類されたエントリー、コメント、トラックバック及び各カテゴリー毎の人脈情報を、構造可視化を行った上でエンドユーザー端末上に表示可能とする知識リソース検索過程を有することを特徴とするオンライン知識検索支援方法。
A method for supporting online knowledge search comprising a knowledge resource collection device and a knowledge search support server,
The knowledge resource collection device includes:
A crawling process for collecting acquaintance information on the Internet, including entries, comments, trackbacks and category information included in general weblog contents, and web log URLs of acquaintances of weblog authors;
A network information extraction process for extracting a network of acquaintances familiar with the category as network information for each category by extracting an acquaintance relationship having a common category from acquaintance information included in the weblog content collected in the crawling process,
A knowledge resource extraction process of indexing the web log content belonging to the network information in a searchable form for each category and accumulating as a knowledge resource,
The knowledge resource search support server is designated a search target category from browsing software such as a web browser of a general end user terminal, searches the knowledge resource for a category including a synonym of the search target category, and a search result Visualization of the structure of the weblogs, weblog authors, entries categorized by time series and category information, comments, trackbacks, and network information for each category on the end user terminal An online knowledge search support method comprising a knowledge resource search process that enables display.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004357483A JP2006164086A (en) | 2004-12-10 | 2004-12-10 | Online knowledge search support system and online knowledge search support method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004357483A JP2006164086A (en) | 2004-12-10 | 2004-12-10 | Online knowledge search support system and online knowledge search support method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006164086A true JP2006164086A (en) | 2006-06-22 |
Family
ID=36666015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004357483A Pending JP2006164086A (en) | 2004-12-10 | 2004-12-10 | Online knowledge search support system and online knowledge search support method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006164086A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146288A (en) * | 2006-12-08 | 2008-06-26 | Rakuten Inc | Network system, center device, information processing method, and program for center device |
JP2009211281A (en) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | Propagation structure extraction device, method and program, and computer-readable recording medium |
JP2010066814A (en) * | 2008-09-08 | 2010-03-25 | Nippon Telegr & Teleph Corp <Ntt> | Topic friend distance measuring device, method, program, and computer-readable recording medium |
WO2010114335A2 (en) * | 2009-04-02 | 2010-10-07 | Samsung Electronics Co., Ltd. | Method for providing human network management service in mobile terminal |
JP2010262638A (en) * | 2009-04-30 | 2010-11-18 | Nhn Corp | Device and method for ranking retrieval result using reliability of representative |
JP2014513826A (en) * | 2011-02-28 | 2014-06-05 | エイチエスビーシー ホールディングス ピーエルシー | Computer systems, databases and their use |
US9026643B2 (en) | 2009-10-14 | 2015-05-05 | Sony Corporation | Contents' relationship visualizing apparatus, contents' relationship visualizing method and its program |
CN105718972A (en) * | 2016-01-15 | 2016-06-29 | 卢怀农 | Intelligent acquiring method of information |
-
2004
- 2004-12-10 JP JP2004357483A patent/JP2006164086A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146288A (en) * | 2006-12-08 | 2008-06-26 | Rakuten Inc | Network system, center device, information processing method, and program for center device |
JP2009211281A (en) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | Propagation structure extraction device, method and program, and computer-readable recording medium |
JP2010066814A (en) * | 2008-09-08 | 2010-03-25 | Nippon Telegr & Teleph Corp <Ntt> | Topic friend distance measuring device, method, program, and computer-readable recording medium |
WO2010114335A2 (en) * | 2009-04-02 | 2010-10-07 | Samsung Electronics Co., Ltd. | Method for providing human network management service in mobile terminal |
WO2010114335A3 (en) * | 2009-04-02 | 2010-12-16 | Samsung Electronics Co., Ltd. | Method for providing human network management service in mobile terminal |
US10681196B2 (en) | 2009-04-02 | 2020-06-09 | Samsung Electronics Co., Ltd | Method for providing human network management service in mobile terminal |
US11405497B2 (en) | 2009-04-02 | 2022-08-02 | Samsung Electronics Co., Ltd | Method for providing human network management service in mobile terminal |
JP2010262638A (en) * | 2009-04-30 | 2010-11-18 | Nhn Corp | Device and method for ranking retrieval result using reliability of representative |
US9026643B2 (en) | 2009-10-14 | 2015-05-05 | Sony Corporation | Contents' relationship visualizing apparatus, contents' relationship visualizing method and its program |
JP2014513826A (en) * | 2011-02-28 | 2014-06-05 | エイチエスビーシー ホールディングス ピーエルシー | Computer systems, databases and their use |
CN105718972A (en) * | 2016-01-15 | 2016-06-29 | 卢怀农 | Intelligent acquiring method of information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US20150254230A1 (en) | Method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model | |
US8180751B2 (en) | Using an encyclopedia to build user profiles | |
US20090070322A1 (en) | Browsing knowledge on the basis of semantic relations | |
d'Aquin et al. | Watson: Supporting next generation semantic web applications | |
AU2019201531A1 (en) | An in-app conversational question answering assistant for product help | |
JP2009151749A (en) | Method and system for filtering subject related web page based on navigation path information | |
JP2017504105A (en) | System and method for in-memory database search | |
US20150287047A1 (en) | Extracting Information from Chain-Store Websites | |
CN109643315B (en) | Method, system, computer device and computer readable medium for automatically generating Chinese ontology based on structured network knowledge | |
JP2011192102A (en) | Device and method for creating summary, and program | |
US8108410B2 (en) | Determining veracity of data in a repository using a semantic network | |
JP2010128917A (en) | Method, device and program for extracting information propagation network | |
JP2006331292A (en) | Weblog community search support method, search support device, and recording medium recording program for search support method | |
JP2006164086A (en) | Online knowledge search support system and online knowledge search support method | |
Wang et al. | Enriching descriptions for public web services using information captured from related web pages on the internet | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
CN111105854A (en) | Search engine system for health information system knowledge base | |
US8131752B2 (en) | Breaking documents | |
JP4621680B2 (en) | Definition system and method | |
JP2004348607A (en) | Contents retrieval method, contents retrieval system, contents retrieval program, and recording medium having contents retrieval program recorded thereon | |
US11726972B2 (en) | Directed data indexing based on conceptual relevance | |
JP2010282403A (en) | Document retrieval method | |
De Virgilio et al. | A reverse engineering approach for automatic annotation of Web pages | |
Li et al. | Arnetminer: expertise oriented search using social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070216 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100309 |