JP2002092001A - 高品質情報検索システム - Google Patents

高品質情報検索システム

Info

Publication number
JP2002092001A
JP2002092001A JP2000285360A JP2000285360A JP2002092001A JP 2002092001 A JP2002092001 A JP 2002092001A JP 2000285360 A JP2000285360 A JP 2000285360A JP 2000285360 A JP2000285360 A JP 2000285360A JP 2002092001 A JP2002092001 A JP 2002092001A
Authority
JP
Japan
Prior art keywords
information source
information
database server
network
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000285360A
Other languages
English (en)
Inventor
Yutaka Konishi
豊 小西
Yasuhiro Senda
泰弘 千田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WORLD ECONOMIC INFORMATION SER
WORLD ECONOMIC INFORMATION SERVICES
Original Assignee
WORLD ECONOMIC INFORMATION SER
WORLD ECONOMIC INFORMATION SERVICES
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WORLD ECONOMIC INFORMATION SER, WORLD ECONOMIC INFORMATION SERVICES filed Critical WORLD ECONOMIC INFORMATION SER
Priority to JP2000285360A priority Critical patent/JP2002092001A/ja
Publication of JP2002092001A publication Critical patent/JP2002092001A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】各種分野において一定以上の評価を得た情報の
みを掲載するウェブサイトを遍く網羅したデータベース
を構築し、良質な最新情報をウェブサイトから容易に入
手できるようにする。 【解決手段】ネットワーク11を経由してアクセス可能
な情報源に関するデータを格納する記憶手段を備えるデ
ータベースサーバ14と、該データベースサーバ14の
記憶手段にアクセスして前記情報源に関するデータを抽
出し、前記ネットワーク11を経由して前記情報源にア
クセスして該情報源に含まれる参照情報を抽出し、前記
ネットワーク11を経由して前記参照情報を掲載する新
たな情報源にアクセスして該新たな情報源に関するデー
タを抽出し、前記データベースサーバ14の記憶手段に
格納するサイト検索ロボットサーバ16とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、高品質情報検索シ
ステムに関するものである。
【0002】
【従来の技術】従来、インターネット等のネットワーク
上には多数のホームページ、情報提供サイト等のウェブ
サイトが開設されており、多数のサイト利用者が、パソ
コン、携帯電話等のインターネットに接続された端末機
器から自由にアクセスして、各種の情報の収集等を短時
間で容易に行うことができるようになっている。特に、
最近では、端末機器の普及、通信回線の高速化、ウェブ
サイトのコンテンツや、提供する情報等の充実等に伴
い、ウェブサイトの利便性が高まるとともに、ポータル
サイトのように検索サービスを提供するウェブサイトの
数や機能が充実し、ウェブサイトにアクセスして所望の
情報を入手する利用者数、回数、時間等が大幅に増加し
ている。
【0003】
【発明が解決しようとする課題】しかしながら、前記従
来のポータルサイトのように検索サービスを提供するウ
ェブサイトにおいては、検索の対象となるデータベース
の内容の質及び量が不十分である。すなわち、前記検索
サービスを提供するウェブサイトを経由してアクセスで
きるウェブサイトの質及び数が不十分である。したがっ
て、検索に時間がかかり、しかも、満足のゆく検索結果
が得られないという事態が生じている。
【0004】例えば、科学技術、金融、文学、芸術等の
極めて限定された分野における特定の事項についての最
新情報をウェブサイトから入手しようとする場合、前記
事項についての良質な情報が掲載されているウェブサイ
トのみを漏れなく検索することは困難である。
【0005】すなわち、一般的なポータルサイトにおい
て、検索の対象となるウェブサイトは、あらかじめ前記
ポータルサイトに登録をしたもののみである。したがっ
て、登録をしていないウェブサイトは、たとえ前記事項
についての良質な情報が掲載されているウェブサイトで
あっても、検索の対象から外れてしまう。
【0006】一方、前記ポータルサイトに登録をしたウ
ェブサイトに前記事項についての情報が掲載されていて
も、掲載されている情報の質の評価がなされていないの
で、検索の結果得られた情報がノイズとなってしまう場
合がある。例えば、専門家が論文を作成する資料を収集
するために検索をした場合、一般大衆向けのウェブサイ
トにアクセスして、該当する事項についての情報をピッ
クアップしたとてしても、前記情報が論文作成の資料と
なる蓋(がい)然性は極めて低いので、前記情報は前記
専門家にとって単なるノイズとなってしまう。
【0007】また、インターネット上に開設されている
ウェブサイトに自動的に機械的にアクセスして、検索の
対象となるウェブサイトに組み入れるシステムのポータ
ルサイトも存在する。しかし、この場合も、検索の対象
となるウェブサイトの数は限定されており、また、前記
検索の対象となるウェブサイトに掲載される情報の質の
評価もなされていないので、前述した一般的なポータル
サイトの場合と同様の問題がある。
【0008】本発明は、前記従来の問題点を解決して、
各種分野において一定以上の評価を得た情報のみを掲載
するウェブサイトを遍く網羅したデータベースを構築
し、かつ、該データベースにアクセスして検索すること
によって、極めて限定された分野における事項について
の良質な最新情報をウェブサイトから容易に入手できる
高品質情報検索システムを提供することを目的とする。
【0009】
【課題を解決するための手段】そのために、本発明の高
品質情報検索システムにおいては、ネットワークに接続
され、基礎情報源又は参照情報源として設定された前記
ネットワークを経由してアクセス可能な情報源に関する
データを格納する記憶手段を備えるデータベースサーバ
と、前記ネットワーク及びデータベースサーバに接続さ
れ、前記データベースサーバの記憶手段にアクセスして
前記情報源に関するデータを抽出し、該データに基づい
て、前記ネットワークを経由して前記情報源にアクセス
して前記情報源に含まれる参照情報を抽出し、前記ネッ
トワークを経由して前記参照情報を掲載する新たな情報
源にアクセスして該新たな情報源に関するデータを抽出
し、該新たな情報源を参照情報源として設定して該新た
な情報源に関するデータを前記データベースサーバの記
憶手段に格納するサイト検索ロボットサーバとを有する
ことを特徴とする高品質情報検索システム。
【0010】本発明の他の高品質情報検索システムにお
いては、さらに、前記データベースサーバに接続され、
前記記憶手段に格納された前記情報源に関するデータに
対する利用者端末からのアクセス回数をカウントし、一
定期間内における前記アクセスが閾値に達しない情報源
に関するデータを前記データベースサーバの記憶手段か
ら削除する評価ロボットサーバを有する。
【0011】本発明の更に他の高品質情報検索システム
においては、さらに、前記ネットワーク及びデータベー
スサーバに接続され、前記データベースサーバの記憶手
段にアクセスして、前記利用者端末から入力された検索
キーに基づいて、前記情報源に関するデータを検索する
検索エンジンサーバを有する。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら詳細に説明する。
【0013】図1は本発明の実施の形態における高品質
情報検索システムの基本概念図である。
【0014】図において、11はネットワーク、12−
1〜12−n(nは自然数)は有線、無線等の公衆回線
又は専用回線を介して直接に又は他のネットワークを経
由して間接に、前記ネットワークに通信可能に接続され
た利用者(ユーザ)端末である。
【0015】ここで、前記ネットワーク11は、例え
ば、インターネットであるが、LAN(Local A
rea Network)、WAN(Wide Are
a Network)等のいかなるネットワークであっ
てもよい。なお、前記利用者端末12−1〜12−n
は、例えば、パソコン(パーソナルコンピュータ)であ
るが、電子手帳、携帯電話、携帯端末、PDA(個人用
携帯情報端末)、テレビ電話、ゲーム機等のいかなる形
態のものであってもよく、前記ネットワーク11に通信
可能に接続して双方向への情報交換が可能な機器であれ
ばよい。
【0016】また、13−1〜13−n(nは自然数)
は有線、無線等の公衆回線又は専用回線を介して直接に
又は他のネットワークを経由して間接に、前記ネットワ
ークに通信可能に接続されたウェブサイトである。
【0017】ここで、前記ウェブサイト13−1〜13
−nは、仮想店舗、電子カタログ等のEC(電子商取
引)を行うためのECサイト、娯楽情報、交通情報、科
学技術情報、会社案内、金融取引情報、学術情報等の情
報を掲示する情報提供サイト、サイト検索サービスを提
供するポータルサイト、音楽配信やソフトウェア配信の
ような各種アプリケーションサービスを提供するASP
サイト、個人、企業、団体、政府等のホームページ等で
ある。そして、前記ウェブサイト13−1〜13−n
は、一般に、演算手段、記憶手段、通信インターフェイ
ス、入出力手段等を有するパソコン、サーバー等のコン
ピュータに開設され、多数の者が前記利用者端末12−
1〜12−nから、前記ネットワークを経由してアクセ
スできるようになっている。
【0018】なお、前記ウェブサイト13−1〜13−
nは、個人、企業、団体等いかなる者によって運営され
ていてもよい。また、前記ウェブサイト13−1〜13
−nへのアクセスは、無料、有料、一部有料であっても
よく、不特定多数がアクセス可能なものであっても、登
録された者や契約を締結した者だけがアクセスできるも
のであってもよい。
【0019】さらに、前記ウェブサイト13−1〜13
−nは、前記利用者端末12−1〜12−nからの情報
も受入れることのできる双方向性(インタラクティブ)
のものであってもよく、掲示された情報の全部又は一部
を無料又は有料でダウンロードできるものであってもよ
い。
【0020】次に、14は公衆回線又は専用回線を介し
て、前記ネットワーク11、後述される検索エンジンサ
ーバ15、サイト検索ロボットサーバ16及び評価ロボ
ットサーバ17と通信可能に接続されたデータベースサ
ーバであり、演算手段、記憶手段、通信インターフェイ
ス、入出力手段等を有する。そして、前記記憶手段に
は、基礎情報源、一次〜N次参照情報源(Nは自然数)
に関する各種データが格納される。
【0021】ここで、前記基礎情報源は、例えば、各分
野の専門家等鑑識能力のある者の推奨に基づいて設定さ
れたウェブサイトやウェブページであり、当該分野にお
ける事項についての有用な質の高い情報が掲載されてい
るものである。この場合、前記分野は科学技術、金融、
文学、医学、経済学、芸術、スポーツ等いかなる範囲の
分野であってもよい。そして、分野の区分けの仕方も、
例えば、医学、薬学、電気工学等のように大きな区分け
であっても、例えば、脳腫瘍、睡眠薬、発振回路等のよ
うに小さく細分化された区分けであってもよく、また、
学校や政府機関等によって採用され、社会で広く通用し
ているような分類の観点に基づいた区分けであっても、
極めて小人数の集団の中でのみ通用している私的な観点
に基づく区分けであってもよい。
【0022】さらに、前記基礎情報源を推奨する者は、
前記専門家のように個人でなくても、選考委員会のよう
な集団であってもよい。また、前記基礎情報源は、鑑識
能力のある者の推奨によらず、各分野の多数の関係者に
よる投票、アンケート調査等に基づいて設定されてもよ
い。さらに、前記基礎情報源を推奨する者は複数のウェ
ブサイトやウェブページを前記基礎情報源として推奨す
ることもできる。
【0023】このようにして設定された前記基礎情報源
は、各分野において極めて有用で質の高い情報を掲載す
るものとして把握できる。
【0024】なお、設定された前記基礎情報源に掲載さ
れた情報については、分類及びキーワードが付与され
る。そして、前記分類は、例えば、国際特許分類、産業
分類等の分類体系に則ったものであってもよいし、いか
なる分類体系のものであってもよい。また、既存の分類
体系でなくても、新たに作成された分類体系であっても
よい。さらに、前記掲載された情報の要約が作成され、
添付されることが望ましい。なお、前記分類体系の選択
や作成、前記分類やキーワードの付与、要約の作成等
は、前記基礎情報源を推奨した者によって行われてもよ
いし、例えば、前記データベースサーバ14を運営する
者によって行われてもよい。
【0025】そして、前記分類、キーワード、要約、情
報源のタイトル等は、前記基礎情報源としてのウェブサ
イトやウェブページのURL(Uniform Res
ource Locator)とともに、前記基礎情報
源に関するデータとして、前記データベースサーバ14
の記憶手段に格納される。
【0026】なお、前記一次〜N次参照情報源に掲載さ
れた情報についても、前記分類、キーワード、要約等が
作成され、前記一次〜N次参照情報源としてのウェブサ
イトやウェブページのURLとともに、前記一次〜N次
参照情報源に関するデータとして、前記データベースサ
ーバ14の記憶手段に格納される。
【0027】ここで、前記一次参照情報源は、サイト検
索ロボットサーバ16が、前記基礎情報源に掲載されて
いる情報に基づいて、自動的に見つけ出して設定するも
のである。すなわち、一般的に、前記基礎情報源に掲載
されている情報中には、当該情報の提供者が有用と考え
る情報を掲載するウェブサイトやウェブページのUR
L、名称等が参照情報として含まれていたり、又は、前
記情報を掲載するウェブサイトやウェブページへのリン
クが設定されている。ここでは、これらウェブサイトや
ウェブページが一次参照情報源として設定される。な
お、前記リンクは、HTMLにおいてアンカータグに挟
まれた文字列をクリックすると、前記アンカータグが指
定するファイルや文字列にジャンプする仕組みである。
【0028】この場合、前記サイト検索ロボットサーバ
16は、まず、前記基礎情報源にアクセスして、前記基
礎情報源に掲載されている情報に含まれる参照情報やリ
ンクを読み取る。次に、前記参照情報やリンクを利用し
て、前記情報を掲載するウェブサイトやウェブページ、
すなわち、一次参照情報源にアクセスし、前記情報を読
み取り、読み取った内容に基づいて、分類及びキーワー
ドを付与し、さらに要約も作成する。次に、前記分類、
キーワード、要約、情報源のタイトル等は、前記一次参
照情報源としてのウェブサイトやウェブページのURL
とともに、前記一次参照情報源に関するデータとして、
前記データベースサーバ14の記憶手段に格納される。
【0029】ここで、前記一次参照情報源は、前記基礎
情報源に掲載された情報に深く関連するものであるか
ら、前記一次参照情報源に掲載された情報に付与される
分類は、前記基礎情報源に掲載された情報に付与された
分類と同一である。また、キーワードも、前記基礎情報
源に掲載された情報に付与されたものと同一であるが、
前記一次参照情報源に掲載された情報のフルテキスト検
索を実施して、新たなキーワードを機械的に抽出して、
追加的に付与することもできる。さらに、要約について
も、前記一次参照情報源に掲載された情報の、例えば、
最初の数行を機械的に抽出することにより、作成するこ
とができる。
【0030】このようにして設定された前記一次参照情
報源は、各分野において、前記基礎情報源に次いで、有
用で質の高い情報を掲載するものとして把握できる。
【0031】そして、必要であれば、前述の工程を繰り
返して、順次、高次の参照情報源を設定して、前記デー
タベースサーバ14の記憶手段に格納することができ
る。この場合、高次の参照情報源になるほど、掲載され
る情報の有用性及び質が低下していくことが考えられる
ので、次数Nを適宜設定することが望ましい。
【0032】なお、前記サイト検索ロボットサーバ16
は、公衆回線又は専用回線を介して前記ネットワーク1
1及びデータベースサーバ14と通信可能に接続されて
いる。なお、前記ネットワーク11とは、他のネットワ
ークを経由して、または、ゲートウェイ、ファイアウォ
ール等を介して、間接的に接続されていてもよい。
【0033】ここで、前記サイト検索ロボットサーバ1
6は、演算手段、記憶手段、通信インターフェイス、入
出力手段等を有する。そして、前述したように、前記デ
ータベースサーバ14の記憶手段にアクセスして、格納
されている基礎情報源、一次〜N次参照情報源に掲載さ
れた情報に含まれる引用情報や設定されているリンクを
見つけ出す。その後、前記ネットワーク11を経由し
て、前記引用情報やリンクに含まれるURLに該当する
ウェブサイトやウェブページにアクセスし、前記情報を
読み取り、読み取った内容に基づいて、分類及びキーワ
ードを付与し、要約を作成する。そして、前記分類、キ
ーワード、要約、情報源のタイトル等を、前記一次〜N
次参照情報源としてのウェブサイトのURLとともに、
前記一次〜N次参照情報源に関するデータとして、前記
データベースサーバ14の記憶手段に格納する。
【0034】また、15は検索エンジンサーバであり、
公衆回線又は専用回線を介して、前記ネットワーク11
及びデータベースサーバ14と通信可能に接続されてい
る。なお、前記ネットワーク11とは、他のネットワー
クを経由して、または、ゲートウェイ、ファイアウォー
ル等を介して、間接に接続されていてもよい。
【0035】ここで、前記検索エンジンサーバ15は演
算手段、記憶手段、通信インターフェイス、入出力手段
等を有し、前記データベースサーバ14にアクセスし
て、格納されている基礎情報源、一次〜N次参照情報源
に関する各種データを検索し、入力された分類、キーワ
ード、情報源のタイトル等の検索タームに該当する情報
を見つけ出す。
【0036】また、17は評価ロボットサーバであり、
公衆回線又は専用回線を介して、前記データベースサー
バ14と通信可能に接続されている。ここで、前記評価
ロボットサーバ17は演算手段、記憶手段、通信インタ
ーフェイス、入出力手段等を有し、前記データベースサ
ーバ14に定期的にアクセスして、格納されている基礎
情報源、一次〜N次参照情報源に関する各種データへの
アクセス回数をカウントし、一定期間における前記アク
セス回数が所定数に到達しない情報源は、質の低い情報
源であるとみなして削除する。すなわち、アクセス回数
がそれ以下であれば、情報源を削除する基準となる閾値
としてのアクセス回数を設定する。なお、前記閾値は、
適宜設定できるが、前述したように、高次の参照情報源
になるほど、掲載される情報の有用性及び質が低下して
いくと考えられるので、基礎情報源に対しては極めて低
く設定してアクセスが少なくても削除しないようにし
て、次数が多くなる参照情報源に対しては高く設定する
ことが望ましい。
【0037】ここで、前記データベースサーバ14、検
索エンジンサーバ15、サイト検索ロボットサーバ16
及び評価ロボットサーバ17は、それぞれが独立した、
いわゆる分散型のサーバであってもよいし、統合された
1つのサーバであってもよいが、負荷の分散の観点から
は、分散型サーバであることが望ましい。
【0038】次に、前記構成の高品質情報検索システム
の動作について説明する。
【0039】図2は高品質情報検索システムの動作を示
すフローチャートである。
【0040】まず、各分野における専門家等鑑識能力の
ある者が、当該分野における事項についての有用な質の
高い情報が掲載されているウェブサイトやウェブページ
を単数又は複数、基礎情報源として推奨する。なお、前
記基礎情報源を推奨する者は、前記専門家のように個人
でなくても、選考委員会のような集団であってもよい。
また、鑑識能力のある者の推奨によらず、各分野の多数
の関係者による投票、アンケート調査等に基づいて選出
してもよい。さらに、前記基礎情報源を推奨する者は複
数のウェブサイトやウェブページを前記基礎情報源とし
て推奨することもできる。
【0041】また、前述したように、前記分野は科学技
術、金融、文学、医学、経済学、芸術、スポーツ等いか
なる範囲の分野であってもよい。そして、分野の区分け
の仕方も、例えば、医学、薬学、電気工学等のように大
きな区分けであってもよく、例えば、脳腫瘍、睡眠薬、
発振回路等のように小さく細分化された区分けであって
もよい。また、学校や政府機関等によって採用され、社
会で広く通用しているような分類の観点に基づいた区分
けであってもよく、極めて小人数の集団の中でのみ通用
している私的な観点に基づく区分けであってもよい。
【0042】次に、前記推奨されたウェブサイトやウェ
ブページをそのまま、または、該ウェブサイトやウェブ
ページに掲載されている情報の内容等を審査したうえ
で、基礎情報源として設定する。そして、前述したよう
に、選択された前記基礎情報源に掲載された情報につい
て、分類及びキーワードを付与する。なお、前記分類
は、例えば、国際特許分類、産業分類等の分類体系に則
ったものであってもよいし、いかなる分類体系のもので
あってもよい。また、既存の分類体系でなくても、新た
に作成された分類体系であってもよい。さらに、前記掲
載された情報の要約を作成し、添付することが望まし
い。なお、前記分類体系の選択や作成、前記分類やキー
ワードの付与、要約の作成等は、前記基礎情報源を推奨
した者によって行われてもよいし、例えば、前記データ
ベースサーバ14を運営する者によって行われてもよ
い。
【0043】次に、前記分類、キーワード、要約、情報
源のタイトル等を、前記基礎情報源としてのウェブサイ
トやウェブページのURLとともに、前記基礎情報源に
関するデータとして、前記データベースサーバ14の記
憶手段に格納する。
【0044】すると、前記サイト検索ロボットサーバ1
6は、自動的にかつ定期的に、前記データベースサーバ
14の記憶手段にアクセスして、前記基礎情報源に関す
るデータであるURLに基づいて、前記基礎情報源とし
てのウェブサイトやウェブページにアクセスする。そし
て、前記基礎情報源に掲載されている情報中に参照情報
として含まれている他のウェブサイトやウェブページの
URL、名称等、または、他のウェブサイトやウェブペ
ージへのリンクを抽出する。
【0045】次に、前記サイト検索ロボットサーバ16
は、前記抽出したURL、名称、リンク等を利用して、
前記ネットワーク11を経由して、前記他のウェブサイ
トやウェブページにアクセスする。そして、前記他のウ
ェブサイトやウェブページに掲載されている情報を読み
取り、読み取った情報に基づいて、分類及びキーワード
を付与し、さらに要約も作成する。次いで、前記他のウ
ェブサイトやウェブページを一次参照情報源と設定し、
該一次参照情報源としてのウェブサイトやウェブページ
のURLとともに前記分類、キーワード、要約、情報源
のタイトル等を前記データベースサーバ14の記憶手段
に格納する。
【0046】ここで、前記一次参照情報源は、前記基礎
情報源に掲載された情報に深く関連するものであるか
ら、前記一次参照情報源に掲載された情報に付与される
分類は、前記基礎情報源に掲載された情報に付与された
分類と同一である。また、キーワードも、前記基礎情報
源に掲載された情報に付与されたものと同一であるが、
前記一次参照情報源に掲載された情報のフルテキスト検
索を実施して、新たなキーワードを機械的に抽出して、
追加的に付与することもできる。さらに、要約について
も、前記一次参照情報源に掲載された情報の、例えば、
最初の数行を機械的に抽出することにより、作成するこ
とができる。
【0047】なお、前記サイト検索ロボットサーバ16
が、前記ネットワーク11を経由して、前記他のウェブ
サイトやウェブページにアクセスする頻度は、例えば、
1日1回、夜中の数時間程度としてもよく、1週間に1
回、日曜日24時間程度としてもよく、適宜設定するこ
とができる。
【0048】以上のようにして、前記サイト検索ロボッ
トサーバ16は、前記基礎情報源に基づいて、前記一次
参照情報源を設定し、該一次参照情報源についての各種
データを前記データベースサーバ14の記憶手段に格納
する。
【0049】次に、前記サイト検索ロボットサーバ16
は、自動的に前記データベースサーバ14の記憶手段に
アクセスして、前記一次参照情報源に関するデータであ
るURLに基づいて、前記一次参照情報源としてのウェ
ブサイトやウェブページにアクセスする。そして、前記
一次参照情報源に掲載されている情報中に参照情報とし
て含まれている他のウェブサイトやウェブページのUR
L、名称等、または、他のウェブサイトやウェブページ
へのリンクを抽出する。
【0050】そして、前記サイト検索ロボットサーバ1
6は、前記抽出したURL、名称、リンク等を利用し
て、前記ネットワーク11を経由して、前記他のウェブ
サイトやウェブページにアクセスする。そして、前記他
のウェブサイトやウェブページに掲載されている情報を
読み取り、読み取った情報に基づいて、分類及びキーワ
ードを付与し、さらに要約も作成する。次いで、前記他
のウェブサイトやウェブページを二次参照情報源と設定
し、該二次参照情報源としてのウェブサイトやウェブペ
ージのURLとともに前記分類、キーワード、要約、情
報源のタイトル等を前記データベースサーバ14の記憶
手段に格納する。
【0051】このように、前記一次参照情報源に基づい
て、二次参照情報源を設定し、該二次参照情報源につい
ての各種データを前記データベースサーバ14の記憶手
段に格納する。
【0052】さらに、前記サイト検索ロボットサーバ1
6は、前述した工程をN回繰り返して、N+1次までの
参照情報源を設定し、該参照情報源についての各種デー
タを前記データベースサーバ14の記憶手段に格納す
る。
【0053】なお、前述したように、高次の参照情報源
になるほど、掲載される情報の有用性及び質が低下して
いくと考えられるので、次数Nを適宜設定することが望
ましい。
【0054】これにより、前記データベースサーバ14
の記憶手段には、各分野において極めて有用で質の高い
情報を掲載する基礎情報源に関する各種データ、及び、
各分野において、前記基礎情報源に次いで有用で質の高
い情報を掲載する一次〜N+1次参照情報源に関する各
種データが大量に格納されて蓄積される。したがって、
前記データベースサーバ14は、各分野において極めて
有用で質の高い情報を漏れなく蓄積した高品質のデータ
ベースとして機能することができる。
【0055】そして、前記高品質のデータベースを利用
して、各分野における情報を入手しようとする利用者
は、前記利用者端末12−1〜12−nから、前記ネッ
トワークを経由して、前記データベースサーバ14にア
クセスする。この場合、前記ネットワークから直接に前
記データベースサーバ14にアクセスしてもよいし、ま
ず前記検索エンジンサーバ15にアクセスして、前記検
索エンジンサーバ15を介して、前記データベースサー
バ14にアクセスすることもできる。
【0056】次に、前記利用者端末12−1〜12−n
から、入手しようとする情報に該当する分類、キーワー
ド、情報源のタイトル等が検索キーとして入力される
と、前記検索エンジンサーバ15は前記データベースサ
ーバ14にアクセスして、前記検索キーに基づいて、前
記データベースサーバ14の記憶手段に格納された情報
源についての各種データを検索する。
【0057】そして、前記検索キーに該当する分類、キ
ーワード、情報源のタイトル等が付与された情報を見つ
け出すと、前記検索エンジンサーバ15は、前記情報の
要約、情報源のタイトル等とともに、前記情報が掲載さ
れているウェブサイトやウェブページのURLを前記デ
ータベースサーバ14にアクセスしている前記利用者端
末12−1〜12−nに送信する。これにより、前記利
用者は、前記送信されたURLに基づいて、入手しよう
とする情報が掲載されているウェブサイトやウェブペー
ジに、前記ネットワーク11を介してアクセスし、所望
の情報を入手することができる。この場合、前記ウェブ
サイトやウェブページに利用者がアクセスしたものとし
て、アクセス回数が記録される。
【0058】なお、前記検索エンジンサーバ15が、前
記URLに基づいて、前記利用者端末12−1〜12−
nを前記URLに対応するウェブサイトやウェブページ
にジャンプさせるようにすることもできる。このように
すると、前記利用者は、前記URLを自分で入力するこ
となく、前記入手しようとする情報が掲載されているウ
ェブサイトやウェブページに容易にアクセスすることが
できる。この場合も、前記ウェブサイトやウェブページ
に利用者がアクセスしたアクセス回数が記録される。
【0059】また、複数の情報が見つけ出された場合に
は、まず、前記情報の要約、情報源のタイトル等を前記
利用者端末12−1〜12−nに送信して、利用者がア
クセスしたいウェブサイトやウェブページを選択した時
点で、前記ウェブサイトやウェブページにジャンプさせ
ることが望ましい。
【0060】これにより、前記利用者は、必要とする分
野における必要とする事項に関する有用で質の高い情報
を容易に入手することができる。しかも、検索の対象と
なる前記データベースサーバ14に蓄積された情報源の
数が極めて多いので、検索漏れの恐れがない。
【0061】そして、前記評価ロボットサーバ17は、
自動的にかつ定期的に、前記データベースサーバ14に
アクセスし、記録されている前記ウェブサイトやウェブ
ページに利用者がアクセスしたアクセス回数をカウント
し、さらに、記憶手段に格納されている基礎情報源、一
次〜N次参照情報源毎に前記アクセス回数を集計して、
それぞれの情報源に対するアクセス回数とする。そし
て、一定期間内における前記アクセス回数をあらかじめ
設定されている閾値と比較して、前記アクセス回数が閾
値に達していない情報源は、価値のない情報源、すなわ
ち、有用ではなく質の低い情報源と判断して、前記情報
源に関する各種データを前記データベースサーバ14の
記憶手段から削除する。
【0062】なお、前記評価ロボットサーバ17が、前
記データベースサーバ14にアクセスする頻度は、例え
ば、1週間に1回程度としてもよく、1月間に1回程度
としてもよく、適宜設定することができる。また、前記
一定期間も、例えば、1月でもよく、半年でもよく、適
宜設定することができる。
【0063】ここで、前述したように、基礎情報源は、
各分野の専門家等が情報の内容を吟味したうえで推奨
し、設定されたもので、掲載される情報の有用性及び質
は極めて高いと考えられるから、たとえアクセス回数が
少なくても、削除すべきでないので、前記基礎情報源に
対する閾値は低く設定されるのが望ましい。また、参照
情報は、機械的に設定されたものであり、高次になれば
なるほど、掲載される情報の有用性及び質は低下してい
くと考えられるから、アクセス回数が少ないものは削除
すべきなので、前記基礎情報源に対する閾値は高次にな
るほど高く設定されるのが望ましい。
【0064】これにより、有用性及び質の低い情報源が
前記データベースサーバ14から削除されるので、検索
の対象となる情報源は極めて質の高いものだけとなる。
したがって、ノイズの少ない高品質の情報を検索するこ
とができる。
【0065】このように、本実施の形態においては、各
分野の専門家等が情報の内容を吟味したうえで推奨して
選択された掲載される情報の有用性及び質は極めて高い
基礎情報源と、該基礎情報源に掲載された情報に基づい
て見つけ出された参照情報源とを前記データベースサー
バ14に蓄積し、しかも有用性及び質の低い情報源を前
記データベースサーバ14から削除する。したがって、
各分野において一定以上の評価を得た情報のみを掲載す
るウェブサイトやウェブページを遍く網羅したデータベ
ースを構築することができ、かつ、該データベースにア
クセスして検索することにより、限定された分野におけ
る事項についての良質なノイズの少ない情報を容易に入
手できる。
【0066】次に、フローチャートについて説明する。
ステップS1 各分野における専門家等鑑識能力のある
者が推奨した当該分野における事項についての有用な質
の高い情報が掲載されているウェブサイトやウェブペー
ジを基礎情報源として設定する。ステップS2 前記基
礎情報源に掲載される情報についての分類、キーワー
ド、要約等を作成して、前記データベースサーバ14に
格納する。ステップS3 サイト検索ロボットサーバ1
6は、前記基礎情報源(N次参照情報源)に掲載される
情報に含まれる参照情報のURLを抽出し、該URLに
基づいて、他のウェブサイトやウェブページを検索す
る。ステップS4 前記サイト検索ロボットサーバ16
は、前記他のウェブサイトやウェブページを一次参照情
報源(N+1次参照情報源)として設定する。ステップ
S5 前記サイト検索ロボットサーバ16は、該一次参
照情報源(N+1次参照情報源)に掲載される情報につ
いての分類、キーワード、要約等を作成して、前記デー
タベースサーバ14に格納する。そしてS3に戻る。た
だし、Nが所定の数に達した場合はS6に進む。ステッ
プS6 評価ロボットサーバ17は、前記基礎情報源、
一次〜N+1次参照情報源への一定期間内のアクセス回
数をカウントする.ステップS7 前記評価ロボットサ
ーバ17は、アクセス回数が閾値に達していない情報源
を前記データベースサーバ14から削除する。
【0067】なお、本発明は前記実施の形態に限定され
るものではなく、本発明の趣旨に基づいて種々変形させ
ることが可能であり、それらを本発明の範囲から排除す
るものではない。
【0068】
【発明の効果】以上詳細に説明したように、本発明によ
れば、本発明の高品質情報検索システムにおいては、ネ
ットワークに接続され、基礎情報源又は参照情報源とし
て設定された前記ネットワークを経由してアクセス可能
な情報源に関するデータを格納する記憶手段を備えるデ
ータベースサーバと、前記ネットワーク及びデータベー
スサーバに接続され、前記データベースサーバの記憶手
段にアクセスして前記情報源に関するデータを抽出し、
該データに基づいて、前記ネットワークを経由して前記
情報源にアクセスして前記情報源に含まれる参照情報を
抽出し、前記ネットワークを経由して前記参照情報を掲
載する新たな情報源にアクセスして該新たな情報源に関
するデータを抽出し、該新たな情報源を参照情報源とし
て設定して該新たな情報源に関するデータを前記データ
ベースサーバの記憶手段に格納するサイト検索ロボット
サーバとを有する。
【0069】この場合、各分野において一定以上の評価
を得た情報のみを掲載する情報源を遍く網羅したデータ
ベースを構築することができる。
【0070】本発明の他の高品質情報検索システムにお
いては、さらに、前記データベースサーバに接続され、
前記記憶手段に格納された前記情報源に関するデータに
対する利用者端末からのアクセス回数をカウントし、一
定期間内における前記アクセスが閾値に達しない情報源
に関するデータを前記データベースサーバの記憶手段か
ら削除する評価ロボットサーバを有する。
【0071】この場合、各分野における事項についての
良質なノイズの少ない情報を容易に入手できる。
【0072】本発明の更に他の高品質情報検索システム
においては、さらに、前記ネットワーク及びデータベー
スサーバに接続され、前記データベースサーバの記憶手
段にアクセスして、前記利用者端末から入力された検索
キーに基づいて、前記情報源に関するデータを検索する
検索エンジンサーバを有する。
【0073】この場合、利用者端末から必要とする分野
における必要とする事項に関する有用で質の高い情報を
容易に入手することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における高品質情報検索シ
ステムの基本概念図である。
【図2】高品質情報検索システムの動作を示すフローチ
ャートである。
【符号の説明】
11 ネットワーク 12−1、12−n 利用者端末 14 データベースサーバ 15 検索エンジンサーバ 16 サイト検索エンジンサーバ 17 評価ロボットサーバ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 (a)ネットワークに接続され、基礎情
    報源又は参照情報源として設定された前記ネットワーク
    を経由してアクセス可能な情報源に関するデータを格納
    する記憶手段を備えるデータベースサーバと、(b)前
    記ネットワーク及びデータベースサーバに接続され、前
    記データベースサーバの記憶手段にアクセスして前記情
    報源に関するデータを抽出し、該データに基づいて、前
    記ネットワークを経由して前記情報源にアクセスして前
    記情報源に含まれる参照情報を抽出し、前記ネットワー
    クを経由して前記参照情報を掲載する新たな情報源にア
    クセスして、該新たな情報源に関するデータを抽出し、
    該新たな情報源を参照情報源として設定して、該新たな
    情報源に関するデータを前記データベースサーバの記憶
    手段に格納するサイト検索ロボットサーバとを有するこ
    とを特徴とする高品質情報検索システム。
  2. 【請求項2】 前記データベースサーバに接続され、前
    記記憶手段に格納された前記情報源に関するデータに対
    する利用者端末からのアクセス回数をカウントし、一定
    期間内における前記アクセスが閾値に達しない情報源に
    関するデータを前記データベースサーバの記憶手段から
    削除する評価ロボットサーバを有する請求項1に記載の
    高品質情報検索システム。
  3. 【請求項3】 前記ネットワーク及びデータベースサー
    バに接続され、前記データベースサーバの記憶手段にア
    クセスして、前記利用者端末から入力された検索キーに
    基づいて、前記情報源に関するデータを検索する検索エ
    ンジンサーバを有する請求項1又は2項に記載の高品質
    情報検索システム。
JP2000285360A 2000-09-20 2000-09-20 高品質情報検索システム Withdrawn JP2002092001A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000285360A JP2002092001A (ja) 2000-09-20 2000-09-20 高品質情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000285360A JP2002092001A (ja) 2000-09-20 2000-09-20 高品質情報検索システム

Publications (1)

Publication Number Publication Date
JP2002092001A true JP2002092001A (ja) 2002-03-29

Family

ID=18769446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000285360A Withdrawn JP2002092001A (ja) 2000-09-20 2000-09-20 高品質情報検索システム

Country Status (1)

Country Link
JP (1) JP2002092001A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187277A (ja) * 2002-11-08 2004-07-02 Thomson Licensing Sa 放送局から送信されたオーディオビジュアルドキュメントを配信する方法、ポータブル端末、およびオーディオビジュアルドキュメントをダウンロードする固定装置
JP2007517269A (ja) * 2003-09-16 2007-06-28 グーグル・インク ニュース記事のランク付けを向上させるためのシステムおよび方法
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US8225190B1 (en) 2002-09-20 2012-07-17 Google Inc. Methods and apparatus for clustering news content
CN107730096A (zh) * 2017-09-29 2018-02-23 北京神州绿盟信息安全科技股份有限公司 一种情报数据源的质量评估方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477714B1 (en) 2002-09-20 2016-10-25 Google Inc. Methods and apparatus for ranking documents
US10496652B1 (en) 2002-09-20 2019-12-03 Google Llc Methods and apparatus for ranking documents
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US8225190B1 (en) 2002-09-20 2012-07-17 Google Inc. Methods and apparatus for clustering news content
US10095752B1 (en) 2002-09-20 2018-10-09 Google Llc Methods and apparatus for clustering news online content based on content freshness and quality of content source
US8843479B1 (en) 2002-09-20 2014-09-23 Google Inc. Methods and apparatus for ranking documents
US9361369B1 (en) 2002-09-20 2016-06-07 Google Inc. Method and apparatus for clustering news online content based on content freshness and quality of content source
JP2004187277A (ja) * 2002-11-08 2004-07-02 Thomson Licensing Sa 放送局から送信されたオーディオビジュアルドキュメントを配信する方法、ポータブル端末、およびオーディオビジュアルドキュメントをダウンロードする固定装置
US9037575B2 (en) 2003-09-16 2015-05-19 Google Inc. Systems and methods for improving the ranking of news articles
US8645368B2 (en) 2003-09-16 2014-02-04 Google Inc. Systems and methods for improving the ranking of news articles
US10459926B2 (en) 2003-09-16 2019-10-29 Google Llc Systems and methods for improving the ranking of news articles
JP2007517269A (ja) * 2003-09-16 2007-06-28 グーグル・インク ニュース記事のランク付けを向上させるためのシステムおよび方法
CN107730096A (zh) * 2017-09-29 2018-02-23 北京神州绿盟信息安全科技股份有限公司 一种情报数据源的质量评估方法及装置

Similar Documents

Publication Publication Date Title
US10366080B2 (en) Methods and systems for using community defined facets or facet values in computer networks
US8818928B2 (en) Evaluating an item based on user reputation information
US20090077065A1 (en) Method and system for information searching based on user interest awareness
US20100262597A1 (en) Method and system for searching information of collective emotion based on comments about contents on internet
JP2010506335A (ja) 場所に関するサイトの識別
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
CN106326413A (zh) 一种个性化视频推荐系统及方法
JP2007102767A (ja) 情報処理装置
CN101324948A (zh) 一种信息推荐的方法及装置
CN104217030A (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN105378730A (zh) 社交媒体分析与输出
CN101382954A (zh) 提供网址收藏名称的方法及系统
JP2003076715A (ja) ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体
Shah Supporting research data collection from YouTube with TubeKit
US20100161659A1 (en) Information supplying server
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
JP5447484B2 (ja) 情報処理装置
JP2002092001A (ja) 高品質情報検索システム
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
WO2002041182A1 (fr) Systeme et procede de distribution de nouvelles interessantes
HANDE et al. SEO tools and techniques: a comparative Study
JP3673859B2 (ja) ウェブページグループ発展過程提示システム
SENGUPTA Mapping the contributions of ETDs to SHODHGANGA by state universities in Maharashtra in lis research
JP2005174149A (ja) インターネット上の情報解析システムおよび公開サーバ
JP2003091477A (ja) アクセスログ解析システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071204