JPH1031683A - Url情報データベース構築方法及びそれを利用したインターネット検索サーバ - Google Patents

Url情報データベース構築方法及びそれを利用したインターネット検索サーバ

Info

Publication number
JPH1031683A
JPH1031683A JP9001655A JP165597A JPH1031683A JP H1031683 A JPH1031683 A JP H1031683A JP 9001655 A JP9001655 A JP 9001655A JP 165597 A JP165597 A JP 165597A JP H1031683 A JPH1031683 A JP H1031683A
Authority
JP
Japan
Prior art keywords
url
search
server
url information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9001655A
Other languages
English (en)
Inventor
Haruhiro Kurosawa
治弘 黒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9001655A priority Critical patent/JPH1031683A/ja
Publication of JPH1031683A publication Critical patent/JPH1031683A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 WWWに接続されている多数のWWWサーバ
のURL情報を効率良く検索してURL情報データベー
スを構築することができるようにする。 【解決手段】 このURL情報データベース構築方法
は、WWWに接続されている多数のWWWサーバをいく
つかの群A,B,C,…に分けて、それぞれの群内で階層構造
化し、より上位階層のWWWサーバAに自サーバに接続
されている下位階層のWWWサーバA1,A2,…;A11,A12,
…すべてのURL情報を保持させることにより、検索サ
ーバ10がURL情報データベース11を構築し、あるいは
その更新を行う場合には、いくつかの群分けされた各群
ごとの最上位階層のWWWサーバA,B,C,…にアクセスす
ることによってすべてのWWWサーバのURL情報を収
集できるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はURL情報データベ
ース構築方法及びそれを利用したインターネット検索サ
ーバに関する。
【0002】
【従来の技術】近年、インターネットの普及は急激に進
んでおり、コンピュータの一般ユーザが手軽にWWW
(World Wide Web)ブラウザを用いてア
クセスしてWWW上に開いている種々のホームページを
読み込み、必要な情報を得ることができる。
【0003】図11は従来のインターネットと社内LA
Nとの接続システムの構成を示しており、社内LAN1
には社内サーバ2とこれに接続される、WWWブラウザ
機能を有する多数のクライアント3があり、外部のイン
ターネット4にはセキュリティも兼ねたゲートウェイ5
を介して接続されている。WWWサーバ6は社内、社外
にWWWサービスを提供するものである。
【0004】
【発明が解決しようとする課題】インターネットの普及
と共に世界中で多数のWWWサーバ6が接続され、それ
ぞれのWWWサーバ6は独自のホームページを開いてい
て、それにアクセスするためにはURL(Unifor
m Resouce Lacator)を指定する必要
がある。
【0005】ところが、図12に示すようにWWW上に
開かれているホームページの数は無数に上り、あるクラ
イアント3のユーザがWWWにアクセスして自分が真に
必要としている情報を得ようとする場合には、必要とす
る情報を提供してくれるURLをWWW上で最初から特
定するのは困難であり、例えば、最初に1つのWWWサ
ーバ1のホームページH1にアクセスし、このホームペ
ージH1にハイパーリンク形式でつながっている関連す
るさらに下層のホームページH11,H12;H12
1,H122;H1221,…などにアクセスしたり、
あるいは他のWWWサーバ2,サーバ3,…のホームペ
ージに移っていく方法をとらなければならない。
【0006】そこで、このようにいわば手探り、やみく
もな方法でWWWにアクセスするのでは、本当に必要と
する情報を収集するには多くの時間がかかることになる
ため、市販されているいわゆるイェローページをあらか
じめ参考にしてURLをピックアップしておき、そのU
RLにアクセスする方法をとるか、あるいはWWW上に
提供されている検索サービスのホームページのURLに
まずアクセスして、そこで自分が必要としている情報を
提供してくれるURLを見つけ出し、その後に、見つけ
出したURLに再度アクセスするという方法をとること
がある。
【0007】しかしながら、この場合でもクライアント
は自分で必要とする情報を提供してくれそうなホームペ
ージのURLを自分で検索し、そのURLをピックアッ
プしてそれぞれにアクセスする必要があり、必要な情報
収集になお、時間と手間がかかる問題点があった。
【0008】このような問題点を解決するためにインタ
ーネット検索サーバを用意し、多数のWWWサーバのU
RL情報を収集してデータベース化して保持し、クライ
アントからの要望に応じてその検索条件を解析し、その
検索条件要素を提供していると思われるURLを自動的
に抽出し、それぞれのURLアドレスにアクセスしてホ
ームページ情報を収集し、その結果を検索要求のあった
クライアントに提供するインターネット検索サービスシ
ステムが考えられている。
【0009】ところが、このようなインターネット検索
サービスシステムでは、特に検索サーバに保持させるU
RL情報データベースのデータ内容をどのように収集す
るかが大きな課題になってくる。というのは、全世界に
は多数のWWWサーバが存在し、それらに開かれている
URLは無数に上り、インターネットロボットを利用し
てそれらすべてにアクセスしてURL情報を収集してデ
ータベース化するためには多大の時間と費用を要するこ
とになる。
【0010】本発明はこのような従来の技術的課題を解
決するためになされたもので、世界規模で存在する多数
のWWWサーバについていくつかのサーバ群に階層構造
に群分けし、それぞれのサーバ群において上位階層のサ
ーバが自サーバに接続されている下位階層のサーバそれ
ぞれのURL情報を収集して保持するようにし、検索サ
ーバからは複数の群分けされたそれぞれのサーバ群にお
ける最上位階層のWWWサーバにアクセスすることによ
って多数のURL情報を収集してURL情報データベー
スを構築することができるようにしたURL情報データ
ベース構築方法を提供することを目的とする。
【0011】本発明はまた、このようにして検索サーバ
において構築されているURL情報を利用して、クライ
アントから検索条件を入力させるための検索ホームペー
ジを発行し、そこにクライアントに検索条件を書き込ま
せ、その検索条件情報を受信した後には、検索条件から
検索条件要素を自動的に抽出し、さらにURL情報デー
タベースを活用にして該当するURLを抽出し、そのU
RLアドレスに自動的にアクセスして情報を自動収集
し、検索結果をクライアントに送信する手順を取り、ク
ライアントの要求に応じてきめ細かな検索情報サービス
ができるインターネット検索サーバを提供することを目
的とする。
【0012】
【課題を解決するための手段】請求項1の発明のURL
情報データベース構築方法は、WWWに接続されている
多数のWWWサーバを所定の規則にしたがって複数のW
WWサーバ群の階層構造に分類し、各階層におけるWW
Wサーバ各々に、自サーバに接続されている下位階層の
WWWサーバについてそれらのURL情報を収集して保
持させ、前記複数のWWWサーバ群それぞれの最上位階
層のWWWサーバに順次アクセスして、それらのWWW
サーバが保持する自群に接続されている下位階層のWW
WサーバのURL情報を収集してURL情報テーブルと
して保存するようにしたものである。
【0013】この請求項1の発明のURL情報データベ
ース構築方法では、WWWに接続されている多数のWW
Wサーバをいくつかの群に分けて、それぞれの群内で階
層構造化し、より上位階層のWWWサーバが自サーバに
接続されている下位階層の多数のWWWサーバのURL
情報を保持させることにより、検索サーバにURL情報
データベースを構築し、あるいはその更新を行う場合に
は、いくつかの群分けされた各群ごとの最上位階層のW
WWサーバにアクセスすることによって多数のWWWサ
ーバのURL情報が収集できるようになる。
【0014】したがって、WWWに接続されている多数
のWWWサーバのURL情報を少ない数のWWWサーバ
にアクセスするだけで収集することができて、URL情
報データベースの構築にかかる時間や費用を節約できる
ことになる。
【0015】請求項2の発明は、請求項1のURL情報
データベース構築方法において、前記各階層のWWWサ
ーバが自サーバのURL情報と自サーバに属する1階層
下位のサーバ群のURL情報とを記憶し、このURL情
報に基づいてURLを発行し、受信したホームページ情
報を記憶し、自サーバより1階層上位のサーバから前記
URLを受信した時に自サーバに記憶している前記ホー
ムページ情報を送信することを特徴とするものである。
【0016】この請求項2の発明のURL情報データベ
ース構築方法では、各階層に属するWWWサーバ群の各
々が自サーバに属する1階層下位のWWWサーバ群の各
々にURLを発行してホームページ情報を受信し、自サ
ーバのホームページ情報と共に記憶し、また上位階層の
WWWサーバからURLを受信した時に当該ホームペー
ジ情報を送信する。したがって、階層構造に分類された
多数WWWサーバのうち、最上位階層のサーバ群の各々
にはそれらの属するすべての下位階層のWWWサーバ群
のホームページ情報を収集して記憶していることにな
り、これらの最上位階層のサーバ群にアクセスしてそれ
らのホームページ情報を収集することによって大規模な
URL情報のデータベースを容易に構築することができ
るようになる。
【0017】請求項3の発明のインターネット検索サー
バは、クライアントに検索ホームページを発行する検索
ホームページ発行部と、前記クライアントが前記検索ホ
ームページに書き込んだ検索条件を受信する検索条件受
信部と、前記検索条件受信部で受信した前記検索条件を
解析し、検索条件要素を抽出する検索条件要素抽出部
と、請求項1又は2のURL情報データベース構築方法
を使用してURL情報を収集し、保持しているURL情
報データベースと、前記検索条件要素抽出部が抽出した
検索条件要素について、前記URL情報データベースに
アクセスして該当するURLを検索するURL検索部
と、前記URL検索部の検索結果に基づき、それぞれの
URLアドレスを順次発行して該当するURLからの情
報を収集するURL情報収集部と、前記URL情報収集
部が収集した前記URL情報を前記クライアントに送信
するURL情報送信部とを備えたものである。
【0018】この請求項3の発明のインターネット検索
サーバでは、クライアントから検索要求がインターネッ
トを通じて送られてくると、まず検索ホームページ発行
部がそのクライアントに検索ホームページを発行して、
クライアントに検索条件を書き込ませる。
【0019】そこでクライアントが検索ホームページに
書き込めば、その書き込まれた検索条件を検索条件受信
部で受信し、検索条件要素抽出部によって検索条件を解
析し、検索条件要素を抽出し、さらに検索条件要素抽出
部が抽出した検索条件要素について、URL検索部がU
RL情報データベースにアクセスして関連する情報を提
供しているURLを抽出する。そしてURL検索部が抽
出したURLについて、URL情報収集部がそれぞれの
URLアドレスを順次発行し、該当するURLからの情
報を収集し、その収集結果をURL情報送信部によって
クライアントに送信する。
【0020】こうして、クライアントから検索要求があ
れば、その検索条件を自身のホームページに書き込ま
せ、その検索条件要素を解析し、該当する情報を提供し
ているURLを抽出し、それらのURLに自動的にアク
セスして情報を収集し、その結果をクライアントに提供
することができ、クライアントのユーザとしては検索条
件の指定だけで所望の情報を入手することができるよう
になり、インターネットを利用した情報収集がきわめて
容易になる。
【0021】請求項4の発明は、請求項3のインターネ
ット検索サーバにおいて、さらに、前記URL検索部が
検索した複数のURLについて、所定の優先条件に基づ
いてそれらのアドレス発行手順を決定し、その順序で前
記URL情報収集部に渡すURL発行手順決定部を備え
たものである。
【0022】この請求項4の発明のインターネット検索
サーバでは、URL検索部が検索した複数のURLにつ
いて、発行手順決定部が所定の優先順位決定条件に則っ
てアドレス発行手順を決定し、決定されたURLアドレ
スの発行手順に従ってURL情報収集部が順次該当する
URLにアクセスして情報収集する。
【0023】したがって、検索されたすべてのURLに
ついて無秩序にアクセスするよりも効率的な情報収集が
できる。
【0024】請求項5の発明は、請求項4のインターネ
ット検索サーバにおいて、前記URL情報送信部が、前
記URL情報収集部の収集した前記URL情報を所定の
様式に編集する機能を備えたものである。
【0025】この請求項5の発明のインターネット検索
サーバでは、URL情報収集部が収集した多数のURL
情報をURL情報送信部で所定の様式に編集してクライ
アントに送信することができ、クライアントには検索条
件に合致して必要な情報だけが分かりやすい形で配信で
きることになる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態を図に
基づいて詳説する。図1は請求項1及び請求項2の発明
のURL情報データベース構築方法の1つの実施の形態
に用いるネットワークシステムを示しており、WWWに
接続されているWWWサーバをいくつかのサーバ群A,
B,C,…に群分けし、それぞれのサーバ群においてさ
らにいくつかの群A1,A2,…に分割し、分割された
群内でさらにいくつかの群A11,A12,…;A2
1,A22,…;…に分割するという方法で階層構造に
分割する。
【0027】このWWWサーバ群の分割手法は特に限定
されないが、例えば、URLの記述構造を見ると、次の
数1式のようになっている。
【0028】
【数1】 このURLは世界的に重複を避けるために各国の専任機
構が管理している。ドメイン名はサーバの分類種別を表
し、co.jpは日本の会社、govは政府機関、or
gは団体、or.jpは日本の団体というように定めら
れている。したがって、これらのドメイン名をキーにし
てサーバ群を階層構造に分類することができる。またサ
ーバ名(プロバイダ名)をキーにして階層構造に分類す
ることもできる。さらに、大分類にサーバ名を用い、そ
の下位階層としてドメイン名を用いて分類する手法なら
ば物理的なネットワーク接続に基づく分類が可能とな
り、トラフィックが余分に発生せず、レスポンス的には
優れたものとなる。
【0029】そして各WWWサーバは自サーバのURL
情報を常に収集するURL情報収集機能部IA11,I
A12,IA1,IA2,IA3,IA,IB,…を有
するものとし、さらに上位階層のWWWサーバ、例え
ば、サーバ群Aについて考えると、子階層に当たるWW
WサーバA1,A2,A3のURL情報収集機能部IA
1,IA2,IA3それぞれは、孫階層に当たるWWW
サーバA11,A12;A21,A22,…のURL情
報収集機能部IA11,IA12;IA21,IA2
2,…それぞれが保持しているURL情報を収集して保
持し、かつ自サーバのURL情報も保持している。
【0030】図2に示すように、このURL情報収集機
能部IA11,IA12,IA1,IA2,IA3,I
A,IB,…は、自己のURL情報を収集する自己情報
収集部Prog、下位階層サーバのURLが格納してあ
る付加情報部URLR、この付加情報部URLRの情報
に基づいてhttpプロトコルが下位階層のWWWサー
バにURLを発信し、収集した下位階層のURL情報と
を記憶するデータエリアDATAから構成されている。
【0031】そしてURL情報収集機能部IA11,I
A12,IA1,IA2,IA3,IA,IB,…それ
ぞれは、自身の情報収集実行部hdtpに登録されてい
る周期、頻度で自己のURL情報収集と、自サーバの下
位階層に属するWWWサーバ群のURL情報収集、更新
処理を行う。すなわち、図1に示す場合、サーバ群Aに
おいて最下位階層のWWWサーバA11,A12につい
ては、そのURL情報収集機能部IA11,IA12そ
れぞれの付加情報部URLRの付加情報11、付加情報
12は空であり、データエリアDATAには、自己情報
収集部Progにより収集した自サーバのURL情報を
data11,data12として登録している。
【0032】これらのWWWサーバA11,A12の1
階だけ上位階層のWWWサーバA1については、そのU
RL情報収集機能部IA1の付加情報部URLRの付加
情報1として、1階だけ下位階層のWWWサーバA1
1,A12のURLが登録される。そして最上位階層の
WWWサーバAのURL情報収集機能部IAの付加情報
部URLRの付加情報0として、その1階だけ下位階層
のWWWサーバA1,A2,A3のURLが登録され
る。
【0033】そして各階層のWWWサーバ各々は自己情
報収集部Progによって自サーバのURL情報を収集
し、またhttpプロトコルにより自サーバよりも1つ
の下位階層に属するWWWサーバ各々のURLを発信し
てそれらのデータエリアDATAに登録されている情報
を収集し、自サーバのデータエリアDATAに登録す
る。
【0034】例えば、WWWサーバA11は自サーバの
URL情報をデータエリアにdata11として収集、
記憶している。またWWWサーバA12は自サーバのU
RL情報をデータエリアにdata12を収集、記憶し
ている。そしてこれらのサーバA11,A12より1階
だけ上位階層のWWWサーバA1は、そのデータエリア
DATAに自サーバのURL情報data1と、1階だ
け下位階層に属するWWWサーバA11,A12それぞ
れのデータエリアDATAのデータdata11,da
ta12を収集して記憶する。さらに最上位階層のWW
WサーバAは、そのデータエリアDATAに自サーバの
URL情報data0と、1階だけ下位階層に属するW
WWサーバA1,A2,A3それぞれのデータエリアD
ATAのデータdata1,data11,data1
2;data2,data21,data22;dat
a3,data31,data32…を収集して記憶し
ているのである。
【0035】このURL情報収集は、図3のフローチャ
ートに示す手順で実行する。その起動間隔は週単位、月
単位、複数月単位、あるいは年単位と特に限定されるこ
とはないが、データ更新頻度に応じた頻度に合わせるこ
とになる。
【0036】いま中間階層のWWWサーバA1について
説明すると、このサーバA1のURL情報収集機能部I
A1において、自己情報収集部Progが自己情報をデ
ータエリアDATAにdata1として格納する(ステ
ップS1)。続いて、付加情報部URLRに下位階層の
サーバ群のURLが登録されているかどうか判断し(ス
テップS2)、登録されていればhttpプロトコルが
所定のプロトコルにしたがって登録されている1つのサ
ーバのURL、例えばサーバA11のURLを発行し
(ステップS3)、そのサーバA11からデータエリア
DATAに保存されているデータdata11を受信
し、自身のデータエリアDATAにdata11とし
て、自己データdata1と共に保存する(ステップS
4)。
【0037】この後、再び付加情報部URLRに登録さ
れているURLで未アクセスのものがあるかどうか判断
し(ステップS2)、未アクセスのURLがあれば(こ
こではサーバA12は未アクセスである)、httpプ
ロトコルがそのサーバA12のURLを発行し(ステッ
プS3)、そのサーバA12のデータエリアDATAに
保存されているデータdata12を受信し、自身のデ
ータエリアDATAにdata12として追加保存する
(ステップS4)。以上の処理は付加情報部URLRに
登録されているURLで未アクセスのものがなくなるま
で繰り返す。
【0038】こうして中間階層のWWWサーバA1につ
いては、以上のURL情報収集によってそのデータエリ
アDATAにデータdata1,data11,dat
a12を収集し、保存することになる。
【0039】さらに上位のWWWサーバAの場合には、
サーバA1,A2,A3にアクセスしてそれらのデータ
エリアDATAのデータdata1,data11,d
ata12;data2,data21,data2
2;data3,…をすべて収集して図2に示す大容量
のデータを保存することになる。
【0040】図1に示す検索サーバ10は、WWW上で
これらのWWWサーバにアクセス可能であり、かつその
URL情報データベース11に収集するURL情報を得
るために、各WWWサーバ群A,B,…,Zにおける最
上位階層のWWWサーバA,B,…,ZのURL情報収
集機能部IA,IB,…,IZそれぞれにアクセスする
ことにより、それらのWWWサーバ自身のURL情報と
共にそれらに接続されている下位階層のすべてのWWW
サーバのURL情報を収集する。
【0041】このようにしてWWWに接続されている多
数のWWWサーバのURL情報を収集してURL情報デ
ータベース11に保持している検索サーバ10を利用し
て、情報検索を行うインターネット情報検索システム
は、図4に示すネットワークを構成する。
【0042】まず社内LAN1は社内サーバ2に多数の
クライアント3を接続した形で構成されている。そして
社内LAN1とインターネット4とはセキュリティの目
的を兼ねたゲートウェイ5を介して接続されている。ま
たこの社内LAN1にはインターネット4に接続するた
めのWWWサーバ6も用意されている。また上記のUR
L情報データベース11を有する検索サーバ10も接続
されている。
【0043】請求項3〜請求項5の発明の共通する1つ
の実施の形態のインターネット検索サーバ10は、図5
に示す機能構成を有するコンピュータで構成される。検
索サーバ10は検索条件要素となる多数のキーワード
と、それらのキーワードに関連するURLとの対照テー
ブルで成るURL情報データベース11を備えている。
一例を挙げれば、図8及び図9に示す内容である。図8
はキーワードテーブル21であり、図9に示すURL情
報テーブル22において使用されているキーワードをリ
ストアップしたものである。したがって、このキーワー
ドテーブル21にリストアップされていなければ検索不
可とされることになる。図9に示すURL情報テーブル
22は、多数のURLアドレスとそれぞれに関係がある
キーワードとの対照テーブルである。例えば、 http://www.tokyo.co.jp/sibaden というURLは、東京、渋谷にある量販店で通信販売を
も行っていて、取扱品目はパソコン関連商品全般という
ことになる。また価格リストも掲載していることを示し
ている。
【0044】また、 http://www.osaka.co.jp/sakaden というURLは、大阪、中之島にあるパソコン関連商品
も取り扱っている家電製品の量販店で、通信販売も行っ
ており、価格リストも掲載していることを示している。
【0045】そして検索サーバ10はこのURL情報デ
ータベース11のURL情報テーブル22を定期的に更
新するが、そのためには上述した図1〜図3に示したU
RL情報データベース構築方法を使用し、定期的にサー
バ群A,B,…,Zの最上位階層のWWWサーバA,
B,…,ZそれぞれにアクセスしてそれらのURL情報
収集機能部IA,IB,…,IZからURL情報を収集
する。この方法を利用することによって、各地に散在し
ているWWWサーバのすべてにアクセスしてURL情報
を収集するよりも格段に早くURL情報の収集が可能と
なる。
【0046】検索サーバ10はまた、クライアント3の
ユーザに検索要求手続を説明し、また検索条件を入力さ
せるための検索ホームページを発行する検索ホームペー
ジ発行部12と、この検索ホームページ発行部12が発
行する検索ホームページを通じてクライアント3から入
力された検索条件を解析し、検索条件要素を抽出する検
索条件要素抽出部13と、この検索条件要素抽出部13
で抽出された検索条件要素に基づき、URL情報データ
ベース11のキーワードテーブル21とURL情報テー
ブル22のキーワードリストを参照して、一致するキー
ワードがリストアップされているURLをピックアップ
するURL検索部14と、このURL検索部14がピッ
クアップした複数のURLについて、あらかじめ設定さ
れている優先条件に基づき、いずれのURLから発行す
るかの順序を決定するURL発行順序整理部15を備え
ている。
【0047】検索サーバ10はさらに、URL発行順序
整理部15によって順序づけられた複数のURLについ
て、順次、URLを発行してWWWの該当するアドレス
のホームページにアクセスするURL発行部16と、U
RL発行部16によってアクセスされたホームページそ
れぞれの情報を収集するURL情報収集部17と、収集
したURL情報を編集してクライアント3に送信する検
索結果編集部18と、そしてインターネットに接続して
信号の送受信制御を行う送受信処理部19を備えてい
る。
【0048】次に、上記構成のインターネット検索サー
バの動作について説明する。図6に示すように、クライ
アント3から社内LAN1を通じて検索サーバ10のU
RLを指定してアクセスがあると、検索サーバ10の検
索ホームページ発行部12は検索ホームページ(Hom
e Page)を発行してクライアント3に送信する
(ステップS11)。
【0049】クライアント3のユーザはこの検索ホーム
ページの手続説明を読み、所定の手順に従って検索条件
を入力する。いま、クライアント3から入力された検索
条件は、図7のA1に示す内容であったとする。すなわ
ち、「A地域内でB社のパソコンを購入したいので、各
店の価格が知りたい。」 検索サーバ10の検索条件要素抽出部13では、クライ
アント3から検索条件を受信すると(ステップS1
2)、検索条件要素を抽出する(ステップS13)。こ
こでは、「A地域」、「B社パソコン」、「各店価格」
という要素を抽出する(図7におけるA2)。
【0050】続いてURL検索部14がURL情報デー
タベース11のキーワードテーブル21から検索条件要
素に含まれるキーワードを抽出し、抽出したキーワード
をリストアップしているURLをURL情報テーブル2
2からピックアップする(ステップS14)。ここで
は、最適URLとしてURL1〜URLXがピックアッ
プされている(図7におけるA3)。
【0051】続いてURL発行順序整理部15において
URL検索部14がピックアップしたいくつかのURL
1〜URLXについて、効率的な検索ができるように一
定の優先条件に基づいてURLアドレスの発行手順を決
定する(ステップS15)。この優先順序の決定には、
クライアント3の検索条件要素に最も良く一致するキー
ワード数を有するURLから優先する方法が適当であ
る。しかしながら、地域を優先する、技術分野を優先す
る、国名を優先するなど、あらかじめ優先条件を設定し
ておき、あるいはクライアント3からの検索条件入力時
に、優先条件をユーザにチェックさせ、それに基づいて
優先順位を設定する方法も採用することができる。A4
はこうして決定された発行手順を示している。
【0052】この後、URL発行部16は決定された発
行手順に従ってリストアップされているすべてのURL
について順次、URLアドレスを発行してそのホームペ
ージにアクセスし、そのホームページの情報を順次、U
RL情報収集部17に蓄積していく(ステップS16及
び図7のA5)。
【0053】こうして所定のアドレス発行手順に従い、
最後のURL3までの情報収集が完了すると、検索結果
編集部18が収集情報を所定のレポート様式に編集して
クライアント3に送信する(ステップS17,S18及
び図7のA6)。
【0054】いま、上記のインターネット検索サーバの
動作をさらに具体的に説明すると、次のようになる。ク
ライアント3が検索サーバから発行された検索ホームペ
ージに東京地域で、B社パソコンの各店の売り価格を知
りたいという検索条件を書き込んだとする。
【0055】これを受信した検索サーバでは、検索条件
要素検出部13で「東京地域」、「パソコン」、「B
社」、「価格」といった検索条件要素を抽出し、これを
URL検索部14が受け取ると、「東京地域」に含まれ
る地域として「東京」、「新宿」、「渋谷」がリストア
ップされているURLを候補とし、「B社パソコン」に
関連するキーワードとして「パソコン」あるいは「パー
ソナルコンピュータ」、「計算機」、「電子計算機」が
リストアップされているURLを候補とし、さらに「価
格」もリストアップされているURLを候補として抽出
することになる。そこで、図9のテーブル22からは、
URLa,URLbだけがピックアップされたとする。
【0056】次には、URL発行順序整理部15でこれ
らのURLa,URLbのどちらから優先させるかを決
定するのであるが、この例では一致するキーワードの数
も等しく、地域的にも近いので特に優先順位を付けず、
抽出順に情報収集することにし、まずURLaのアドレ
スを発行してそのホームページの情報を収集し、続いて
URLbのアドレスを発行して情報を収集することにな
る。
【0057】この後、検索結果収集部18は図10に示
すようなレポート形式に編集してクライアント3に送信
することになる。なお、ここで「イ店」はURLaのア
ドレスのホームページを開いている店の名前で、「ロ
店」はURLbのアドレスの店の名前である。
【0058】こうしてこの実施の形態のインターネット
検索サーバによれば、クライアントのユーザはインター
ネット検索サーバのURLにアクセスし、開かれた検索
ホームページに検索条件を入力するだけで、後はインタ
ーネット検索サーバ側で検索条件に合致するURLをピ
ックアップして情報収集し、その結果をレポートとして
得ることができるようになり、検索に要する時間、手間
を格段に倹約することができるようになる。
【0059】なお、ここでインターネット検索サーバか
らのレポートはクライアント側が回線を接続したまま待
って得る方式であっても良いが、また検索条件を送信し
た後には回線をいったん切断し、電子メールの形でクラ
イアントのメールアドレスに送信しておいてもらう方式
をとることもできる。
【0060】
【発明の効果】以上のように請求項1の発明のURL情
報データベース構築方法では、WWWに接続されている
多数のWWWサーバをいくつかの群に分けて、それぞれ
の群内で階層構造化し、より上位階層のWWWサーバが
自サーバに接続されている下位階層のWWWサーバのU
RL情報を保持させ、検索サーバにURL情報データベ
ースを構築し、あるいはその更新を行う場合に、いくつ
かの群分けされた各群ごとの最上位階層のWWWサーバ
にアクセスすることによって多数のWWWサーバのUR
L情報を収集できるようにしているので、WWWに接続
されている多数のWWWサーバのURL情報を少ない数
のWWWサーバにアクセスするだけで収集することがで
きて、URL情報データベースの構築にかかる時間や費
用を節約できることになる。
【0061】請求項2の発明のURL情報データベース
構築方法では、各階層に属するWWWサーバ群の各々が
自サーバに属する1階層下位のWWWサーバ群の各々に
URLを発行してホームページ情報を受信し、自サーバ
のホームページ情報と共に記憶し、また上位階層のWW
WサーバからURLを受信した時に当該ホームページ情
報を送信するので、階層構造に分類された多数WWWサ
ーバのうち、最上位階層のサーバ群の各々にはそれらの
属するすべての下位階層のWWWサーバ群のホームペー
ジ情報を収集して記憶させておくことができ、これらの
最上位階層のサーバ群にアクセスしてそれらのホームペ
ージ情報を収集することによって大規模なURL情報の
データベースを容易に構築することができる。
【0062】請求項3の発明のインターネット検索サー
バによれば、クライアントから検索要求があれば、その
検索条件を自身のホームページに書き込ませ、その検索
条件要素を解析し、請求項1又は2の発明のURL情報
データベース構築方法を使用して構築されたURL情報
データベースを参照して該当する情報を提供しているU
RLを抽出し、それらのURLに自動的にアクセスして
情報を収集し、その結果をクライアントに提供するよう
にしているので、クライアントのユーザとしては検索条
件の指定だけで所望の情報を入手することができ、イン
ターネットを利用した情報収集がきわめて容易になる。
【0063】請求項4の発明のインターネット検索サー
バによれば、クライアントの検索条件に基づいてURL
検索部が抽出した複数のURLについて、所定の優先順
位決定条件に則ってアドレス発行手順を決定し、決定さ
れたURLアドレスの発行手順に従って順次該当するU
RLにアクセスして情報収集するようにしているので、
クライアントの検索条件に基づいて抽出されたすべての
URLについて無秩序にアクセスするよりも効率的な情
報収集ができる。
【0064】請求項5の発明によれば、URL情報収集
部が収集した多数のURL情報をURL情報送信部で所
定の様式に編集してクライアントに送信することがで
き、クライアントには検索条件に合致して必要な情報だ
けが分かりやすい形で配信できる。
【図面の簡単な説明】
【図1】本発明のURL情報データベース構築方法の1
つの実施の形態に使用されるインターネットのネットワ
ーク構成を示す説明図。
【図2】上記の実施の形態に使用されるURL情報収集
部のデータ構造図。
【図3】上記の実施の形態におけるURL情報収集手順
のフローチャート。
【図4】本発明のインターネット検索サーバの1つの実
施の形態のシステム構成図。
【図5】上記の実施の形態におけるインターネット検索
サーバの機能ブロック図。
【図6】上記の実施の形態による検索処理のフローチャ
ート。
【図7】上記の実施の形態による検索処理のフローチャ
ート。
【図8】上記の実施の形態におけるURL情報データベ
ースのキーワードテーブルの説明図。
【図9】上記の実施の形態におけるURL情報データベ
ースのURL情報テーブルの説明図。
【図10】上記の実施の形態における検索結果のレポー
トの説明図。
【図11】従来例のシステム構成図。
【図12】一般的なインターネットの構成図。
【符号の説明】
1 社内LAN 2 社内サーバ 3 クライアント 4 インターネット 5 ゲートウェイ 6 WWWサーバ 10 検索サーバ 11 URL情報データベース 12 検索ホームページ発行部 13 検索条件要素抽出部 14 URL検索部 15 URL発行順序整理部 16 URL発行部 17 URL情報収集部 18 検索結果編集部 19 送受信処理部 21 キーワードテーブル 22 URL情報テーブル A,B,C,… WWWサーバ A1,A2,A3,… WWWサーバ A11,A12,A13,… WWWサーバ IA,IB,IC,… URL情報収集機能部 IA1,IA2,IA3,…URL情報収集機能部 IA11,IA12,… URL情報収集機能部 Prog 自己情報収集部 URLR 付加情報部 hdtp 情報収集実行部 DATA データエリア

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 WWWに接続されている多数のWWWサ
    ーバを所定の規則にしたがって複数のWWWサーバ群の
    階層構造に分類し、 各階層におけるWWWサーバ各々に、自サーバに接続さ
    れている下位階層のWWWサーバについてそれらのUR
    L情報を収集して保持させ、 前記複数のWWWサーバ群それぞれの最上位階層のWW
    Wサーバに順次アクセスして、それらのWWWサーバが
    保持する自群に接続されている下位階層のWWWサーバ
    のURL情報を収集してURL情報テーブルとして保存
    することを特徴とするURL情報データベース構築方
    法。
  2. 【請求項2】 前記各階層のWWWサーバが自サーバの
    URL情報と自サーバに属する1階層下位のサーバ群の
    URL情報とを記憶し、このURL情報に基づいてUR
    Lを発行し、受信したホームページ情報を記憶し、自サ
    ーバより1階層上位のサーバから前記URLを受信した
    時に自サーバに記憶している前記ホームページ情報を送
    信することを特徴とする請求項1に記載のURL情報デ
    ータベース構築方法。
  3. 【請求項3】 クライアントに検索ホームページを発行
    する検索ホームページ発行部と、 前記クライアントが前記検索ホームページに書き込んだ
    検索条件を受信する検索条件受信部と、 前記検索条件受信部で受信した前記検索条件を解析し、
    検索条件要素を抽出する検索条件要素抽出部と、 請求項1又は2に記載のURL情報データベース構築方
    法を使用してURL情報を収集し、保持しているURL
    情報データベースと、 前記検索条件要素抽出部が抽出した検索条件要素につい
    て、前記URL情報データベースにアクセスして該当す
    るURLを検索するURL検索部と、 前記URL検索部の検索結果に基づき、それぞれのUR
    Lアドレスを順次発行して該当するURLからの情報を
    収集するURL情報収集部と、 前記URL情報収集部が収集した前記URL情報を前記
    クライアントに送信するURL情報送信部とを備えて成
    る請求項1のURL情報データベース構築方法を利用し
    たインターネット検索サーバ。
  4. 【請求項4】 前記URL検索部が検索した複数のUR
    Lについて、所定の優先条件に基づいてそれらのアドレ
    ス発行手順を決定し、その順序で前記URL情報収集部
    に渡すURL発行手順決定部を備えて成る請求項3に記
    載のインターネット検索サーバ。
  5. 【請求項5】 前記URL情報送信部が、前記URL情
    報収集部の収集した前記URL情報を所定の様式に編集
    する機能を備えて成る請求項4に記載の検索サーバ。
JP9001655A 1996-05-14 1997-01-08 Url情報データベース構築方法及びそれを利用したインターネット検索サーバ Pending JPH1031683A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9001655A JPH1031683A (ja) 1996-05-14 1997-01-08 Url情報データベース構築方法及びそれを利用したインターネット検索サーバ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11921396 1996-05-14
JP8-119213 1996-05-14
JP9001655A JPH1031683A (ja) 1996-05-14 1997-01-08 Url情報データベース構築方法及びそれを利用したインターネット検索サーバ

Publications (1)

Publication Number Publication Date
JPH1031683A true JPH1031683A (ja) 1998-02-03

Family

ID=26334930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9001655A Pending JPH1031683A (ja) 1996-05-14 1997-01-08 Url情報データベース構築方法及びそれを利用したインターネット検索サーバ

Country Status (1)

Country Link
JP (1) JPH1031683A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000006659A (ko) * 1999-09-21 2000-02-07 심재헌 인터넷 리모콘 구동방법
JP2000293425A (ja) * 1999-04-01 2000-10-20 Nec Commun Syst Ltd インターネットWeb検索システム
KR20010057235A (ko) * 1999-12-20 2001-07-04 조영구 플로어 할당 시스템 및 그에 의한 다수의 홈페이지를제공하는 방법
KR20010102814A (ko) * 2000-05-02 2001-11-16 황용길 클라이언트 프로그램을 이용한 웹사이트 정보 제공 방법및 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체
KR20010111389A (ko) * 2000-06-08 2001-12-17 황재엽 홈페이지 검색시스템
KR20010113288A (ko) * 2000-06-19 2001-12-28 김형석 인터넷도메인 인공지능형 검색시스템 및 이를 이용한검색방법
JP2002015113A (ja) * 2000-06-30 2002-01-18 Yafoo Japan Corp インターネット上で運営されている多数の電子商店の商品情報を横断検索して検索依頼人に通知する商品検索サーバー
KR20020011200A (ko) * 2000-08-01 2002-02-08 안덕흥 사용자의 지역 위치에 기반한 인터넷 광고/홍보 시스템
KR20020015615A (ko) * 2000-08-22 2002-02-28 홍완수 낙장 도메인 등록 대행 시스템
KR100342107B1 (ko) * 1999-10-05 2002-06-26 조산구 인터넷 주소 부가정보 서비스 제공을 위한 기관 및 지역별 인터넷 주소 묶음결정 방법, 인터넷 주소 묶음별 사용지역 정보 획득 방법
KR20020069893A (ko) * 2001-02-28 2002-09-05 주식회사 인터넷과 꿈 인터넷 사이트상에서의 검색서비스 제공방법
KR100358921B1 (ko) * 1999-12-22 2002-10-31 주식회사 인티즌 인터넷 사이트에 접속하는 화면에 정보를 제공하는 방법및 그 장치
KR100361166B1 (ko) * 1999-11-13 2002-11-18 김시환 정보 검색 시스템 및 그 방법
KR20020093478A (ko) * 2001-06-09 2002-12-16 유종연 전국에 모든 홈페이지 사이트를 데이터베이스화하여검색할 수 있도록 본사의 인식센터에 저장 할 수 있도록하는 전자거래 방법.
KR20030047788A (ko) * 2001-12-06 2003-06-18 최봉준 정보검색 및 인터넷 서비스를 위한 통합 서비스홈페이지의 정보제공방법 및 그 방법을 기록한 컴퓨터로읽을 수 있는 기록매체
KR100452607B1 (ko) * 2001-03-19 2004-10-15 황정윤 인터넷 사이트 주소 검색 시스템
KR100470493B1 (ko) * 2001-06-01 2005-02-07 니트젠테크놀러지스 주식회사 특수 도메인네임 분해 서비스 방법
KR100595165B1 (ko) * 1999-03-04 2006-07-03 엘지전자 주식회사 웹 서버를 이용한 문서의 참조 문서 검색 방법
KR100617662B1 (ko) * 2000-03-14 2006-08-28 엘지전자 주식회사 멀티미디어 데이터의 사용자 히스토리 정보 구성 및 관리 방법 그리고 이를 기반으로 하는 사용자 프로파일 정보 구성 방법
KR100942902B1 (ko) * 2004-01-15 2010-02-16 엔에이치엔(주) 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100595165B1 (ko) * 1999-03-04 2006-07-03 엘지전자 주식회사 웹 서버를 이용한 문서의 참조 문서 검색 방법
JP2000293425A (ja) * 1999-04-01 2000-10-20 Nec Commun Syst Ltd インターネットWeb検索システム
KR20000006659A (ko) * 1999-09-21 2000-02-07 심재헌 인터넷 리모콘 구동방법
KR100342107B1 (ko) * 1999-10-05 2002-06-26 조산구 인터넷 주소 부가정보 서비스 제공을 위한 기관 및 지역별 인터넷 주소 묶음결정 방법, 인터넷 주소 묶음별 사용지역 정보 획득 방법
KR100361166B1 (ko) * 1999-11-13 2002-11-18 김시환 정보 검색 시스템 및 그 방법
KR20010057235A (ko) * 1999-12-20 2001-07-04 조영구 플로어 할당 시스템 및 그에 의한 다수의 홈페이지를제공하는 방법
KR100358921B1 (ko) * 1999-12-22 2002-10-31 주식회사 인티즌 인터넷 사이트에 접속하는 화면에 정보를 제공하는 방법및 그 장치
KR100617662B1 (ko) * 2000-03-14 2006-08-28 엘지전자 주식회사 멀티미디어 데이터의 사용자 히스토리 정보 구성 및 관리 방법 그리고 이를 기반으로 하는 사용자 프로파일 정보 구성 방법
KR20010102814A (ko) * 2000-05-02 2001-11-16 황용길 클라이언트 프로그램을 이용한 웹사이트 정보 제공 방법및 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체
KR20010111389A (ko) * 2000-06-08 2001-12-17 황재엽 홈페이지 검색시스템
KR20010113288A (ko) * 2000-06-19 2001-12-28 김형석 인터넷도메인 인공지능형 검색시스템 및 이를 이용한검색방법
JP2002015113A (ja) * 2000-06-30 2002-01-18 Yafoo Japan Corp インターネット上で運営されている多数の電子商店の商品情報を横断検索して検索依頼人に通知する商品検索サーバー
KR20020011200A (ko) * 2000-08-01 2002-02-08 안덕흥 사용자의 지역 위치에 기반한 인터넷 광고/홍보 시스템
KR20020015615A (ko) * 2000-08-22 2002-02-28 홍완수 낙장 도메인 등록 대행 시스템
KR20020069893A (ko) * 2001-02-28 2002-09-05 주식회사 인터넷과 꿈 인터넷 사이트상에서의 검색서비스 제공방법
KR100452607B1 (ko) * 2001-03-19 2004-10-15 황정윤 인터넷 사이트 주소 검색 시스템
KR100470493B1 (ko) * 2001-06-01 2005-02-07 니트젠테크놀러지스 주식회사 특수 도메인네임 분해 서비스 방법
KR20020093478A (ko) * 2001-06-09 2002-12-16 유종연 전국에 모든 홈페이지 사이트를 데이터베이스화하여검색할 수 있도록 본사의 인식센터에 저장 할 수 있도록하는 전자거래 방법.
KR20030047788A (ko) * 2001-12-06 2003-06-18 최봉준 정보검색 및 인터넷 서비스를 위한 통합 서비스홈페이지의 정보제공방법 및 그 방법을 기록한 컴퓨터로읽을 수 있는 기록매체
KR100942902B1 (ko) * 2004-01-15 2010-02-16 엔에이치엔(주) 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체

Similar Documents

Publication Publication Date Title
JPH1031683A (ja) Url情報データベース構築方法及びそれを利用したインターネット検索サーバ
JP4648455B2 (ja) 個人化検索方法および個人化検索システム
JP4489994B2 (ja) 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
Elgazzar et al. Clustering wsdl documents to bootstrap the discovery of web services
US8005823B1 (en) Community search optimization
JPH09311869A (ja) インターネット検索サーバ
JP5121194B2 (ja) 組織内情報検索システム及び組織内情報検索プログラム
WO2010095867A2 (ko) 이동통신 단말기와 아이피 기반 정보 단말기를 이용한 맞춤, 지능형 심볼, 아이콘 인터넷 정보 검색시스템
CN101193119A (zh) 用于自动完成框的可选择条目列表的排序方法和系统
JPH10228486A (ja) 分散ドキュメント分類システム及びプログラムを記録した機械読み取り可能な記録媒体
JP2009532766A (ja) ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬
TW200928815A (en) System and method for history clustering
CN101399716A (zh) 监控办公用计算机使用状态的分布式审计系统和方法
JP4962980B2 (ja) クリックログを用いた検索結果分類装置及び方法
CN103745006A (zh) 一种互联网信息搜索系统及方法
US7836108B1 (en) Clustering by previous representative
KR20000054312A (ko) 맞춤 웹정보 구축 제공 방법
CN102622402B (zh) 使用页面集而提供信息搜索服务的服务器、方法和系统
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
WO2001055909A1 (en) System and method for bookmark management and analysis
KR20000063422A (ko) 인터넷 정보 검색 시 개인의 북마크 파일 데이터를기반으로 필터링하여 개인 맞춤 검색 결과를 도출하는 방법
CN108280102A (zh) 上网行为记录方法、装置及用户终端
JP2008191982A (ja) 検索結果出力装置
KR100672278B1 (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
JP2002197100A (ja) 検索サービスシステムと方法及び記録媒体並びに情報仲介方法