JP2000293425A - インターネットWeb検索システム - Google Patents
インターネットWeb検索システムInfo
- Publication number
- JP2000293425A JP2000293425A JP11094831A JP9483199A JP2000293425A JP 2000293425 A JP2000293425 A JP 2000293425A JP 11094831 A JP11094831 A JP 11094831A JP 9483199 A JP9483199 A JP 9483199A JP 2000293425 A JP2000293425 A JP 2000293425A
- Authority
- JP
- Japan
- Prior art keywords
- information
- server
- search
- internet web
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 高速にWebが検索できるインターネットW
eb検索システムを提供する。 【解決手段】 サーバーデーモン7は、定期的に自サー
バー2内の情報4,5を検索し、分類する。サーバーデ
ーモン7によって分類された検索情報は、Web検索ロ
ボット3が認識できるフォーマットで蓄積情報6に蓄積
される。Web検索ロボット3は、蓄積情報6から情報
収集を行い、検索エンジン1に利用されるデータベース
を構築する。
eb検索システムを提供する。 【解決手段】 サーバーデーモン7は、定期的に自サー
バー2内の情報4,5を検索し、分類する。サーバーデ
ーモン7によって分類された検索情報は、Web検索ロ
ボット3が認識できるフォーマットで蓄積情報6に蓄積
される。Web検索ロボット3は、蓄積情報6から情報
収集を行い、検索エンジン1に利用されるデータベース
を構築する。
Description
【0001】
【発明の属する技術分野】この発明は、Web検索を最
適化、高速化するインターネットWeb検索システムに
関する。
適化、高速化するインターネットWeb検索システムに
関する。
【0002】
【従来の技術】従来のインターネットWeb検索方法
は、図2に示すように、検索エンジン8のWeb検索ロ
ボット10と呼ばれる検索用データベース構築プログラ
ムが任意のWebを巡回し、キーワードに合致する情報
を自データベース上に構築する。
は、図2に示すように、検索エンジン8のWeb検索ロ
ボット10と呼ばれる検索用データベース構築プログラ
ムが任意のWebを巡回し、キーワードに合致する情報
を自データベース上に構築する。
【0003】すなわち、Web全体のリンク構成を把握
し、各情報よりキーワードを検索し、簡単なコメントと
所在を示すURLを自サーバーに蓄積する処理が行われ
ている。
し、各情報よりキーワードを検索し、簡単なコメントと
所在を示すURLを自サーバーに蓄積する処理が行われ
ている。
【0004】
【発明が解決しようとする課題】上述した従来のインタ
ーネットWeb検索方法には、Web検索ロボットがU
RLを1つ1つ構文解析し、内容を検索しているため、
検索に時間がかかるという問題があった。
ーネットWeb検索方法には、Web検索ロボットがU
RLを1つ1つ構文解析し、内容を検索しているため、
検索に時間がかかるという問題があった。
【0005】また、従来のWeb検索方法は、合致した
情報をすべて自データベースに保持するため、データベ
ースが膨大になるという問題があった。
情報をすべて自データベースに保持するため、データベ
ースが膨大になるという問題があった。
【0006】この発明の目的は、高速にWebを検索す
ることができ、膨大なデータを自データベースに保持し
なくともよいインターネットWeb検索システムを提供
することにある。
ることができ、膨大なデータを自データベースに保持し
なくともよいインターネットWeb検索システムを提供
することにある。
【0007】
【課題を解決するための手段】この発明は、検索ロボッ
トが任意のサーバーを巡回して情報収集を行うインター
ネットWeb検索システムにおいて、前記サーバーは、
自サーバー内の情報を検索する検索手段と、検索された
情報を蓄積する蓄積手段とを備え、前記検索ロボット
は、前記蓄積手段から情報収集を行うことを特徴とす
る。
トが任意のサーバーを巡回して情報収集を行うインター
ネットWeb検索システムにおいて、前記サーバーは、
自サーバー内の情報を検索する検索手段と、検索された
情報を蓄積する蓄積手段とを備え、前記検索ロボット
は、前記蓄積手段から情報収集を行うことを特徴とす
る。
【0008】この発明は、サーバー側で情報を検索分類
する手段を備えるので、Web検索ロボットがより効率
良くデータを収集するよう動作する。
する手段を備えるので、Web検索ロボットがより効率
良くデータを収集するよう動作する。
【0009】各サーバーで検索情報が情報種別毎に分類
されることによって、Web検索ロボットは自分が探し
ている情報種別のみを収集できる。
されることによって、Web検索ロボットは自分が探し
ている情報種別のみを収集できる。
【0010】
【発明の実施の形態】次に、この発明の実施の形態につ
いて図面を参照して説明する。
いて図面を参照して説明する。
【0011】図1は、この発明のインターネットWeb
検索システムの実施の形態を示す構成図である。
検索システムの実施の形態を示す構成図である。
【0012】図1に示すインターネットWeb検索シス
テムは、情報4,5をインターネットに公開しているコ
ンピュータであるサーバー2と、サーバー2が起動する
検索プログラであり、定期的に自サーバー内の情報4,
5を検索し、分類するサーバーデーモン7と、サーバー
デーモン7によって分類された検索情報を蓄積する蓄積
情報6と、要求に応じて蓄積されたデータベース内より
目的の情報の在処を検索するプログラムである検索エン
ジン1と、検索エンジン1に利用されるデータベースを
構築するためにサーバーを巡回するプログラムであるW
eb検索ロボット3とを備えている。
テムは、情報4,5をインターネットに公開しているコ
ンピュータであるサーバー2と、サーバー2が起動する
検索プログラであり、定期的に自サーバー内の情報4,
5を検索し、分類するサーバーデーモン7と、サーバー
デーモン7によって分類された検索情報を蓄積する蓄積
情報6と、要求に応じて蓄積されたデータベース内より
目的の情報の在処を検索するプログラムである検索エン
ジン1と、検索エンジン1に利用されるデータベースを
構築するためにサーバーを巡回するプログラムであるW
eb検索ロボット3とを備えている。
【0013】各サーバー2は、サーバー毎にデーモンプ
ログラムを起動し、検索情報をWeb検索ロボット3が
認識できるフォーマットに従って独自に構築する。
ログラムを起動し、検索情報をWeb検索ロボット3が
認識できるフォーマットに従って独自に構築する。
【0014】各サーバー2は、定期的に検索情報の更新
を行い、検索情報をWeb検索ロボット3が見付けられ
る場所に置く。
を行い、検索情報をWeb検索ロボット3が見付けられ
る場所に置く。
【0015】検索情報は、情報種別毎に分類する。情報
種別には、内容による分類や、参照頻度情報等で行う。
種別には、内容による分類や、参照頻度情報等で行う。
【0016】Web検索ロボット3は、自分が探してい
る情報種別のみを見てもよい。Web検索ロボット3
は、その情報を元に、さらにWeb内の詳細な検索を行
ってもよい。
る情報種別のみを見てもよい。Web検索ロボット3
は、その情報を元に、さらにWeb内の詳細な検索を行
ってもよい。
【0017】Web検索ロボット3は,サーバー2側が
設定した、/robots.txtの指示に従う。
設定した、/robots.txtの指示に従う。
【0018】次に、この実施の形態の全体の動作につい
て図1を参照して説明する。
て図1を参照して説明する。
【0019】情報5は、情報4からリンクを張られてい
る情報である。
る情報である。
【0020】サーバーデーモン7は、情報4、情報5の
情報を分類し、蓄積情報6に蓄積する。
情報を分類し、蓄積情報6に蓄積する。
【0021】サーバーデーモン7は、一定周期でサーバ
ー2内を検索し、Web検索ロボット3用情報をフォー
マット通りにまとめておく。
ー2内を検索し、Web検索ロボット3用情報をフォー
マット通りにまとめておく。
【0022】Web検索ロボット3は、検索対象のサー
バー2がこの方式を取り入れている場合、蓄積情報6内
に蓄積されている、サーバー2が収集済みの検索情報を
参照し、蓄積情報6から必要な情報のみを自データベー
スに持ち帰る。
バー2がこの方式を取り入れている場合、蓄積情報6内
に蓄積されている、サーバー2が収集済みの検索情報を
参照し、蓄積情報6から必要な情報のみを自データベー
スに持ち帰る。
【0023】検索者は、従来通りの方法で検索エンジン
1を使用する。
1を使用する。
【0024】
【発明の効果】以上説明したように、この発明は、ペー
ジ単位ではなく、サーバー単位に検索できるため、高速
にWeb情報を得ることができる。
ジ単位ではなく、サーバー単位に検索できるため、高速
にWeb情報を得ることができる。
【0025】また、この発明は、サーバーの情報を自デ
ータベースに引き込まないで、リンクのみ張っておけ
ば、膨大なデータを保持しなくとも良いという効果を有
する。
ータベースに引き込まないで、リンクのみ張っておけ
ば、膨大なデータを保持しなくとも良いという効果を有
する。
【図1】この発明のインターネットWeb検索システム
の実施の形態を示す構成図である。
の実施の形態を示す構成図である。
【図2】従来のインターネットWeb検索方法を説明す
る構成図である。
る構成図である。
1,8 検索エンジン 2,9 サーバー 3,10 Web検索ロボット 4,5,11,12 情報 7 サーバーデーモン 6 蓄積情報
Claims (7)
- 【請求項1】検索ロボットが任意のサーバーを巡回して
情報収集を行うインターネットWeb検索システムにお
いて、 前記サーバーは、自サーバー内の情報を検索する検索手
段と、検索された情報を蓄積する蓄積手段とを備え、 前記検索ロボットは、前記蓄積手段から情報収集を行う
ことを特徴とするインターネットWeb検索システム。 - 【請求項2】前記サーバーは、検索された情報を前記検
索ロボットが認識できるフォーマットで前記蓄積手段に
蓄積することを特徴とする請求項1に記載のインターネ
ットWeb検索システム。 - 【請求項3】前記サーバーは、定期的に自サーバー内の
情報を検索して前記蓄積手段に蓄積することを特徴とす
る請求項1または2に記載のインターネットWeb検索
システム。 - 【請求項4】前記サーバーは、検索された情報を情報種
別に分類して前記蓄積手段に蓄積することを特徴とする
請求項1〜3のいずれかに記載のインターネットWeb
検索システム。 - 【請求項5】検索ロボットが任意のサーバーを巡回して
情報収集を行うインターネットWeb検索方法におい
て、 前記サーバーが、自サーバー内の情報を検索し、分類し
て蓄積し、 前記検索ロボットが、前記蓄積された情報を参照して情
報収集を行うことを特徴とするインターネットWeb検
索方法。 - 【請求項6】前記サーバーは、前記検索ロボットが認識
できるフォーマットで前記検索された情報を蓄積するこ
とを特徴とする請求項5に記載のインターネットWeb
検索方法。 - 【請求項7】前記サーバーは、定期的に自サーバー内の
情報を検索し、分類して蓄積することを特徴とする請求
項5または6に記載のインターネットWeb検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11094831A JP2000293425A (ja) | 1999-04-01 | 1999-04-01 | インターネットWeb検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11094831A JP2000293425A (ja) | 1999-04-01 | 1999-04-01 | インターネットWeb検索システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000293425A true JP2000293425A (ja) | 2000-10-20 |
Family
ID=14121002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11094831A Pending JP2000293425A (ja) | 1999-04-01 | 1999-04-01 | インターネットWeb検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000293425A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075904A (ja) * | 2007-09-21 | 2009-04-09 | Fujifilm Corp | 検索可能化プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09311869A (ja) * | 1996-05-24 | 1997-12-02 | Toshiba Corp | インターネット検索サーバ |
JPH1031683A (ja) * | 1996-05-14 | 1998-02-03 | Toshiba Corp | Url情報データベース構築方法及びそれを利用したインターネット検索サーバ |
JPH10178444A (ja) * | 1996-12-18 | 1998-06-30 | Fuji Xerox Co Ltd | 電子掲示システム |
JPH10334026A (ja) * | 1997-06-03 | 1998-12-18 | Nec Software Ltd | Web情報提供サーバおよびWeb情報提供方法 |
JPH1145257A (ja) * | 1997-07-25 | 1999-02-16 | Just Syst Corp | Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
1999
- 1999-04-01 JP JP11094831A patent/JP2000293425A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1031683A (ja) * | 1996-05-14 | 1998-02-03 | Toshiba Corp | Url情報データベース構築方法及びそれを利用したインターネット検索サーバ |
JPH09311869A (ja) * | 1996-05-24 | 1997-12-02 | Toshiba Corp | インターネット検索サーバ |
JPH10178444A (ja) * | 1996-12-18 | 1998-06-30 | Fuji Xerox Co Ltd | 電子掲示システム |
JPH10334026A (ja) * | 1997-06-03 | 1998-12-18 | Nec Software Ltd | Web情報提供サーバおよびWeb情報提供方法 |
JPH1145257A (ja) * | 1997-07-25 | 1999-02-16 | Just Syst Corp | Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075904A (ja) * | 2007-09-21 | 2009-04-09 | Fujifilm Corp | 検索可能化プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11416505B2 (en) | Querying an archive for a data store | |
US7630973B2 (en) | Method for identifying related pages in a hyperlinked database | |
KR101120678B1 (ko) | 사용자 의도 발견 | |
US8706748B2 (en) | Methods for enhancing digital search query techniques based on task-oriented user activity | |
JP2002132832A (ja) | 画像検索方法及び画像検索エンジン装置 | |
JP4832061B2 (ja) | コンテンツ収集装置およびコンテンツ収集システム | |
US20060080405A1 (en) | System, method, and service for interactively presenting a summary of a web site | |
Hatzi et al. | A specialized search engine for web service discovery | |
US20200174820A1 (en) | Presenting hypervisor data for a virtual machine with associated operating system data | |
Dixit et al. | A novel approach to priority based focused crawler | |
US20190147002A1 (en) | Storage Estimation in a Data Indexing and Query System | |
US11379670B1 (en) | Automatically populating responses using artificial intelligence | |
US20100077300A1 (en) | Computer Method and Apparatus Providing Social Preview in Tag Selection | |
US9971782B2 (en) | Document tagging and retrieval using entity specifiers | |
JP3698242B2 (ja) | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 | |
CN110889023A (zh) | 一种elasticsearch的分布式多功能搜索引擎 | |
US20040205046A1 (en) | Indexing and retrieval of textual collections on PDAS | |
JP2004151855A (ja) | 電子文書検索システム | |
US7949656B2 (en) | Information augmentation method | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP2000293425A (ja) | インターネットWeb検索システム | |
JP2940488B2 (ja) | 文書グループ化装置および文書グループ化方法 | |
KR100496384B1 (ko) | 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스 작성방법 및, 기억매체 | |
JPH11184862A (ja) | グループ適応型情報検索装置 | |
Dixit | Web crawler design issues: a review |