JP2010086422A - 検索サーバ、方法及びプログラム - Google Patents
検索サーバ、方法及びプログラム Download PDFInfo
- Publication number
- JP2010086422A JP2010086422A JP2008256770A JP2008256770A JP2010086422A JP 2010086422 A JP2010086422 A JP 2010086422A JP 2008256770 A JP2008256770 A JP 2008256770A JP 2008256770 A JP2008256770 A JP 2008256770A JP 2010086422 A JP2010086422 A JP 2010086422A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- search
- feature word
- score
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 2
- 230000003252 repetitive effect Effects 0.000 claims 2
- 230000008569 process Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 16
- 230000003287 optical effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007429 general method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】端末4から受信した検索対象データに基づきWebページを検索する検索サーバ1は、検索開始時に端末4で過去に表示したWebページの閲覧履歴情報に基づきWebページを取得するWebページ取得手段13と、取得したWebページに含む特徴語であって検索対象データに類似する特徴語を類似語DB22を用いて抽出する特徴語抽出手段14と、抽出された特徴語から特徴語のスコアの偏差値を算出するスコア算出手段15と、抽出したWebページに関する検索データを端末4に送信する検索データ送信手段16と、算出された偏差値が所定の条件を満たす間リンク先のWebページを取得し該Webページに対して特徴語抽出手段14から検索データ送信手段16までを繰り返して実行する繰り返し手段17と、を備える。
【選択図】図1
Description
類似語を記憶した類似語データベースを記憶する記憶手段と、
検索開始時に、前記端末で過去に表示したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得手段と、
前記Webページ取得手段により取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出手段と、
前記特徴語抽出手段により抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出手段と、
前記特徴語抽出手段により抽出した前記Webページに関する検索データを前記端末に送信する検索データ送信手段と、
前記スコア算出手段により算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページからリンクされたリンク先のWebページを取得し、前記リンク先のWebページに対して前記特徴語抽出手段から前記検索データ送信手段までを繰り返して実行する繰り返し手段と、
を備えることを特徴とする検索サーバ。
を特徴とする(1)に記載の検索サーバ。
を特徴とする(1)又は(2)に記載の検索サーバ。
を特徴とする(1)から(3)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(4)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(5)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(6)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(7)までのいずれか1項に記載の検索サーバ。
コンピュータは、類似語を記憶した類似語データベースを記憶する記憶手段を備え、
前記コンピュータが、
検索開始時に、過去に取得したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得ステップと、
前記Webページ取得ステップにより取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出ステップと、
前記特徴語抽出ステップにより抽出した前記Webページに関する検索データを出力する検索データ出力ステップと、
前記スコア算出ステップにより算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページにリンクされたリンク先のWebページに遷移して、前記リンク先のWebページに対して前記特徴語抽出ステップから前記検索データ出力ステップまでを繰り返して実行する繰り返しステップと、
を含むことを特徴とする検索方法。
[検索システムの全体構成及び検索サーバの機能構成]
図1は、本実施形態に係る検索システム100の全体構成及び検索サーバ1の機能構成を示す図である。
図2は、本実施形態に係る検索サーバ1のハードウェア構成を示す図である。本発明が実施されるサーバは標準的なものでよく、以下に構成の一例を示す。
コンテンツサーバ2も、上述の検索サーバ1と同様な構成を持つ。なお、コンテンツサーバ2のみならず、検索サーバ1にも、コンテンツサーバ2と同様にWebページを記憶するコンテンツのDBを一部有してもよい。
端末4も、上述の検索サーバ1と同様な構成を持つ。例えば、記憶部20は、光ディスクドライブ1076に代えて外部メモリを挿入可能なドライブであってもよい。
図3は、本実施形態に係る検索サーバ1の検索処理のフローチャートである。図4は、本実施形態に係る検索サーバ1の検索データ処理のフローチャートである。
次に、Webページを検索する方法について説明する。図5は、本実施形態に係る検索サーバ1でのWebページの検索方法の例を示す図である。
次に、端末4に表示される画面例について説明する。図6は、本実施形態に係る端末4の画面例を示す図である。
本実施形態では、検索対象のWebページのスコアの偏差値が、リンク元のWebページのスコアの偏差値を下回った場合には、検索対象のWebページからリンクされたWebページのみを検索対象にしたが、これに限らない。例えば、スコアの偏差値が下回った時点で、検索対象のWebページからリンクされたWebページを検索対象にしなくてもよい。また、その探索の範囲を、スコアの偏差値が2回下回った時点等にしてもよい。
2 コンテンツサーバ
3 通信ネットワーク
4 端末
10 制御部
11 検索対象データ受信手段
12 履歴情報取得手段
13 Webページ取得手段
14 特徴語抽出手段
15 スコア算出手段
16 検索データ送信手段
17 繰り返し手段
20 記憶部
22 類似語DB
30〜36 Webページ
40〜47 リンクデータ
50 検索画面
53 検索結果表示部
100 検索システム
Claims (10)
- 端末から受信した検索対象データに基づきWebページを検索する検索サーバであって、
類似語を記憶した類似語データベースを記憶する記憶手段と、
検索開始時に、前記端末で過去に表示したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得手段と、
前記Webページ取得手段により取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出手段と、
前記特徴語抽出手段により抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出手段と、
前記特徴語抽出手段により抽出した前記Webページに関する検索データを前記端末に送信する検索データ送信手段と、
前記スコア算出手段により算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページからリンクされたリンク先のWebページを取得し、前記リンク先のWebページに対して前記特徴語抽出手段から前記検索データ送信手段までを繰り返して実行する繰り返し手段と、
を備えることを特徴とする検索サーバ。 - 前記繰り返し手段は、前記スコア算出手段により算出された前記スコアの偏差値が、リンク元の前記Webページの前記特徴語に対応する前記スコアの偏差値より高い値であることに応じて、前記リンク先のWebページに対して前記特徴語抽出手段から前記検索データ送信手段までを繰り返して実行すること、
を特徴とする請求項1に記載の検索サーバ。 - 前記繰り返し手段は、前記スコア算出手段により算出された前記スコアの偏差値が、リンク元の前記Webページの前記特徴語に対応する前記スコアの偏差値より低い値であることに応じて、前記リンク先のWebページに対してのみ前記特徴語抽出手段から前記検索データ送信手段までを実行すること、
を特徴とする請求項1又は請求項2に記載の検索サーバ。 - 前記検索データ送信手段は、前記端末に表示する前記Webページのリンクデータ及び要約文のデータを検索データとして前記端末に送信すること、
を特徴とする請求項1から請求項3までのいずれか1項に記載の検索サーバ。 - 前記検索データ送信手段は、前記特徴語抽出手段が前記特徴語を抽出したことに応じて、前記検索データを順次前記端末に送信すること、
を特徴とする請求項1から請求項4までのいずれか1項に記載の検索サーバ。 - 前記スコア算出手段は、TFIDF値を用いて前記特徴語に対応する前記スコアの偏差値を算出すること、
を特徴とする請求項1から請求項5までのいずれか1項に記載の検索サーバ。 - 前記Webページの閲覧履歴情報のうち、直近に前記端末に表示したものから順番に複数の前記閲覧履歴情報を、前記端末から取得する閲覧履歴情報取得手段を備えること、
を特徴とする請求項1から請求項6までのいずれか1項に記載の検索サーバ。 - 前記Webページ取得手段は、通信ネットワークを介して接続されたコンテンツサーバから前記Webページを取得すること、
を特徴とする請求項1から請求項7までのいずれか1項に記載の検索サーバ。 - 検索対象データに基づきWebページを検索する検索方法であって、
コンピュータは、類似語を記憶した類似語データベースを記憶する記憶手段を備え、
前記コンピュータが、
検索開始時に、過去に取得したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得ステップと、
前記Webページ取得ステップにより取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出ステップと、
前記特徴語抽出ステップにより抽出した前記Webページに関する検索データを出力する検索データ出力ステップと、
前記スコア算出ステップにより算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページにリンクされたリンク先のWebページに遷移して、前記リンク先のWebページに対して前記特徴語抽出ステップから前記検索データ出力ステップまでを繰り返して実行する繰り返しステップと、
を含むことを特徴とする検索方法。 - 請求項9に記載の方法のステップをコンピュータに実行させるための検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008256770A JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008256770A JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010086422A true JP2010086422A (ja) | 2010-04-15 |
JP4962973B2 JP4962973B2 (ja) | 2012-06-27 |
Family
ID=42250285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008256770A Expired - Fee Related JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4962973B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010119906A1 (ja) | 2009-04-14 | 2010-10-21 | 日産化学工業株式会社 | ハロアルキルスルホンアニリド誘導体 |
JP2018520429A (ja) * | 2015-06-05 | 2018-07-26 | オ−ディーディー コンセプツ インク. | 検索情報を表示する方法、装置及びコンピュータプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10260979A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
JPH10260978A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
JP2001188803A (ja) * | 1999-11-17 | 2001-07-10 | Xerox Corp | クローラ型検索及び索引型検索を実行するシステム及び方法 |
JP2001222543A (ja) * | 2000-02-08 | 2001-08-17 | Fujitsu Ltd | 情報検索装置および情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2008
- 2008-10-01 JP JP2008256770A patent/JP4962973B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10260979A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
JPH10260978A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
JP2001188803A (ja) * | 1999-11-17 | 2001-07-10 | Xerox Corp | クローラ型検索及び索引型検索を実行するシステム及び方法 |
JP2001222543A (ja) * | 2000-02-08 | 2001-08-17 | Fujitsu Ltd | 情報検索装置および情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010119906A1 (ja) | 2009-04-14 | 2010-10-21 | 日産化学工業株式会社 | ハロアルキルスルホンアニリド誘導体 |
JP2018520429A (ja) * | 2015-06-05 | 2018-07-26 | オ−ディーディー コンセプツ インク. | 検索情報を表示する方法、装置及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4962973B2 (ja) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7475074B2 (en) | Web search system and method thereof | |
JP4731479B2 (ja) | 検索システム及び検索方法 | |
US9111008B2 (en) | Document information management system | |
US8666962B2 (en) | Speculative search result on a not-yet-submitted search query | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
US20070136276A1 (en) | Method, system and software product for locating documents of interest | |
US7757158B2 (en) | Converting hypertext character strings to links by attaching anchors extracted from existing link destination | |
JP2010097461A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2011138248A (ja) | 検索支援プログラム、検索支援装置、及び検索支援方法 | |
JP4824070B2 (ja) | クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム | |
JP2009086944A (ja) | 情報処理装置および情報処理プログラム | |
JP4962973B2 (ja) | 検索サーバ、方法及びプログラム | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP4621680B2 (ja) | 定義付けシステムおよび方法 | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP2008112310A (ja) | 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体 | |
JP4860439B2 (ja) | 質問文の自動生成システム | |
JP5416023B2 (ja) | 閲覧端末及び方法 | |
JP2010079863A (ja) | 絞り込み検索サービス提供方法及びプログラム | |
JP5063568B2 (ja) | 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法 | |
JP5108707B2 (ja) | 検索サーバ装置、検索方法及びプログラム | |
JP2013109514A (ja) | 関連ワード表示制御装置、関連ワード表示方法、及びプログラム | |
JP2008262442A (ja) | 検索キーデータを表示させる方法及びサーバ | |
JP4859891B2 (ja) | コンテンツに関連する情報を提供するサーバ、システム及び方法 | |
JP4920661B2 (ja) | インデックス生成方法、プログラム及びサーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4962973 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |