JP2000293425A - インターネットWeb検索システム - Google Patents

インターネットWeb検索システム

Info

Publication number
JP2000293425A
JP2000293425A JP11094831A JP9483199A JP2000293425A JP 2000293425 A JP2000293425 A JP 2000293425A JP 11094831 A JP11094831 A JP 11094831A JP 9483199 A JP9483199 A JP 9483199A JP 2000293425 A JP2000293425 A JP 2000293425A
Authority
JP
Japan
Prior art keywords
information
server
search
internet web
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11094831A
Other languages
English (en)
Inventor
Kiyoaki Osawa
清昭 大澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP11094831A priority Critical patent/JP2000293425A/ja
Publication of JP2000293425A publication Critical patent/JP2000293425A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 高速にWebが検索できるインターネットW
eb検索システムを提供する。 【解決手段】 サーバーデーモン7は、定期的に自サー
バー2内の情報4,5を検索し、分類する。サーバーデ
ーモン7によって分類された検索情報は、Web検索ロ
ボット3が認識できるフォーマットで蓄積情報6に蓄積
される。Web検索ロボット3は、蓄積情報6から情報
収集を行い、検索エンジン1に利用されるデータベース
を構築する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、Web検索を最
適化、高速化するインターネットWeb検索システムに
関する。
【0002】
【従来の技術】従来のインターネットWeb検索方法
は、図2に示すように、検索エンジン8のWeb検索ロ
ボット10と呼ばれる検索用データベース構築プログラ
ムが任意のWebを巡回し、キーワードに合致する情報
を自データベース上に構築する。
【0003】すなわち、Web全体のリンク構成を把握
し、各情報よりキーワードを検索し、簡単なコメントと
所在を示すURLを自サーバーに蓄積する処理が行われ
ている。
【0004】
【発明が解決しようとする課題】上述した従来のインタ
ーネットWeb検索方法には、Web検索ロボットがU
RLを1つ1つ構文解析し、内容を検索しているため、
検索に時間がかかるという問題があった。
【0005】また、従来のWeb検索方法は、合致した
情報をすべて自データベースに保持するため、データベ
ースが膨大になるという問題があった。
【0006】この発明の目的は、高速にWebを検索す
ることができ、膨大なデータを自データベースに保持し
なくともよいインターネットWeb検索システムを提供
することにある。
【0007】
【課題を解決するための手段】この発明は、検索ロボッ
トが任意のサーバーを巡回して情報収集を行うインター
ネットWeb検索システムにおいて、前記サーバーは、
自サーバー内の情報を検索する検索手段と、検索された
情報を蓄積する蓄積手段とを備え、前記検索ロボット
は、前記蓄積手段から情報収集を行うことを特徴とす
る。
【0008】この発明は、サーバー側で情報を検索分類
する手段を備えるので、Web検索ロボットがより効率
良くデータを収集するよう動作する。
【0009】各サーバーで検索情報が情報種別毎に分類
されることによって、Web検索ロボットは自分が探し
ている情報種別のみを収集できる。
【0010】
【発明の実施の形態】次に、この発明の実施の形態につ
いて図面を参照して説明する。
【0011】図1は、この発明のインターネットWeb
検索システムの実施の形態を示す構成図である。
【0012】図1に示すインターネットWeb検索シス
テムは、情報4,5をインターネットに公開しているコ
ンピュータであるサーバー2と、サーバー2が起動する
検索プログラであり、定期的に自サーバー内の情報4,
5を検索し、分類するサーバーデーモン7と、サーバー
デーモン7によって分類された検索情報を蓄積する蓄積
情報6と、要求に応じて蓄積されたデータベース内より
目的の情報の在処を検索するプログラムである検索エン
ジン1と、検索エンジン1に利用されるデータベースを
構築するためにサーバーを巡回するプログラムであるW
eb検索ロボット3とを備えている。
【0013】各サーバー2は、サーバー毎にデーモンプ
ログラムを起動し、検索情報をWeb検索ロボット3が
認識できるフォーマットに従って独自に構築する。
【0014】各サーバー2は、定期的に検索情報の更新
を行い、検索情報をWeb検索ロボット3が見付けられ
る場所に置く。
【0015】検索情報は、情報種別毎に分類する。情報
種別には、内容による分類や、参照頻度情報等で行う。
【0016】Web検索ロボット3は、自分が探してい
る情報種別のみを見てもよい。Web検索ロボット3
は、その情報を元に、さらにWeb内の詳細な検索を行
ってもよい。
【0017】Web検索ロボット3は,サーバー2側が
設定した、/robots.txtの指示に従う。
【0018】次に、この実施の形態の全体の動作につい
て図1を参照して説明する。
【0019】情報5は、情報4からリンクを張られてい
る情報である。
【0020】サーバーデーモン7は、情報4、情報5の
情報を分類し、蓄積情報6に蓄積する。
【0021】サーバーデーモン7は、一定周期でサーバ
ー2内を検索し、Web検索ロボット3用情報をフォー
マット通りにまとめておく。
【0022】Web検索ロボット3は、検索対象のサー
バー2がこの方式を取り入れている場合、蓄積情報6内
に蓄積されている、サーバー2が収集済みの検索情報を
参照し、蓄積情報6から必要な情報のみを自データベー
スに持ち帰る。
【0023】検索者は、従来通りの方法で検索エンジン
1を使用する。
【0024】
【発明の効果】以上説明したように、この発明は、ペー
ジ単位ではなく、サーバー単位に検索できるため、高速
にWeb情報を得ることができる。
【0025】また、この発明は、サーバーの情報を自デ
ータベースに引き込まないで、リンクのみ張っておけ
ば、膨大なデータを保持しなくとも良いという効果を有
する。
【図面の簡単な説明】
【図1】この発明のインターネットWeb検索システム
の実施の形態を示す構成図である。
【図2】従来のインターネットWeb検索方法を説明す
る構成図である。
【符号の説明】
1,8 検索エンジン 2,9 サーバー 3,10 Web検索ロボット 4,5,11,12 情報 7 サーバーデーモン 6 蓄積情報

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】検索ロボットが任意のサーバーを巡回して
    情報収集を行うインターネットWeb検索システムにお
    いて、 前記サーバーは、自サーバー内の情報を検索する検索手
    段と、検索された情報を蓄積する蓄積手段とを備え、 前記検索ロボットは、前記蓄積手段から情報収集を行う
    ことを特徴とするインターネットWeb検索システム。
  2. 【請求項2】前記サーバーは、検索された情報を前記検
    索ロボットが認識できるフォーマットで前記蓄積手段に
    蓄積することを特徴とする請求項1に記載のインターネ
    ットWeb検索システム。
  3. 【請求項3】前記サーバーは、定期的に自サーバー内の
    情報を検索して前記蓄積手段に蓄積することを特徴とす
    る請求項1または2に記載のインターネットWeb検索
    システム。
  4. 【請求項4】前記サーバーは、検索された情報を情報種
    別に分類して前記蓄積手段に蓄積することを特徴とする
    請求項1〜3のいずれかに記載のインターネットWeb
    検索システム。
  5. 【請求項5】検索ロボットが任意のサーバーを巡回して
    情報収集を行うインターネットWeb検索方法におい
    て、 前記サーバーが、自サーバー内の情報を検索し、分類し
    て蓄積し、 前記検索ロボットが、前記蓄積された情報を参照して情
    報収集を行うことを特徴とするインターネットWeb検
    索方法。
  6. 【請求項6】前記サーバーは、前記検索ロボットが認識
    できるフォーマットで前記検索された情報を蓄積するこ
    とを特徴とする請求項5に記載のインターネットWeb
    検索方法。
  7. 【請求項7】前記サーバーは、定期的に自サーバー内の
    情報を検索し、分類して蓄積することを特徴とする請求
    項5または6に記載のインターネットWeb検索方法。
JP11094831A 1999-04-01 1999-04-01 インターネットWeb検索システム Pending JP2000293425A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11094831A JP2000293425A (ja) 1999-04-01 1999-04-01 インターネットWeb検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11094831A JP2000293425A (ja) 1999-04-01 1999-04-01 インターネットWeb検索システム

Publications (1)

Publication Number Publication Date
JP2000293425A true JP2000293425A (ja) 2000-10-20

Family

ID=14121002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11094831A Pending JP2000293425A (ja) 1999-04-01 1999-04-01 インターネットWeb検索システム

Country Status (1)

Country Link
JP (1) JP2000293425A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075904A (ja) * 2007-09-21 2009-04-09 Fujifilm Corp 検索可能化プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09311869A (ja) * 1996-05-24 1997-12-02 Toshiba Corp インターネット検索サーバ
JPH1031683A (ja) * 1996-05-14 1998-02-03 Toshiba Corp Url情報データベース構築方法及びそれを利用したインターネット検索サーバ
JPH10178444A (ja) * 1996-12-18 1998-06-30 Fuji Xerox Co Ltd 電子掲示システム
JPH10334026A (ja) * 1997-06-03 1998-12-18 Nec Software Ltd Web情報提供サーバおよびWeb情報提供方法
JPH1145257A (ja) * 1997-07-25 1999-02-16 Just Syst Corp Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031683A (ja) * 1996-05-14 1998-02-03 Toshiba Corp Url情報データベース構築方法及びそれを利用したインターネット検索サーバ
JPH09311869A (ja) * 1996-05-24 1997-12-02 Toshiba Corp インターネット検索サーバ
JPH10178444A (ja) * 1996-12-18 1998-06-30 Fuji Xerox Co Ltd 電子掲示システム
JPH10334026A (ja) * 1997-06-03 1998-12-18 Nec Software Ltd Web情報提供サーバおよびWeb情報提供方法
JPH1145257A (ja) * 1997-07-25 1999-02-16 Just Syst Corp Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075904A (ja) * 2007-09-21 2009-04-09 Fujifilm Corp 検索可能化プログラム

Similar Documents

Publication Publication Date Title
US11416505B2 (en) Querying an archive for a data store
US7630973B2 (en) Method for identifying related pages in a hyperlinked database
KR101120678B1 (ko) 사용자 의도 발견
US8706748B2 (en) Methods for enhancing digital search query techniques based on task-oriented user activity
JP2002132832A (ja) 画像検索方法及び画像検索エンジン装置
JP4832061B2 (ja) コンテンツ収集装置およびコンテンツ収集システム
US20060080405A1 (en) System, method, and service for interactively presenting a summary of a web site
Hatzi et al. A specialized search engine for web service discovery
US20200174820A1 (en) Presenting hypervisor data for a virtual machine with associated operating system data
Dixit et al. A novel approach to priority based focused crawler
US20190147002A1 (en) Storage Estimation in a Data Indexing and Query System
US11379670B1 (en) Automatically populating responses using artificial intelligence
US20100077300A1 (en) Computer Method and Apparatus Providing Social Preview in Tag Selection
US9971782B2 (en) Document tagging and retrieval using entity specifiers
JP3698242B2 (ja) 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体
CN110889023A (zh) 一种elasticsearch的分布式多功能搜索引擎
US20040205046A1 (en) Indexing and retrieval of textual collections on PDAS
JP2004151855A (ja) 電子文書検索システム
US7949656B2 (en) Information augmentation method
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JP2000293425A (ja) インターネットWeb検索システム
JP2940488B2 (ja) 文書グループ化装置および文書グループ化方法
KR100496384B1 (ko) 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스 작성방법 및, 기억매체
JPH11184862A (ja) グループ適応型情報検索装置
Dixit Web crawler design issues: a review