JP4962973B2 - 検索サーバ、方法及びプログラム - Google Patents
検索サーバ、方法及びプログラム Download PDFInfo
- Publication number
- JP4962973B2 JP4962973B2 JP2008256770A JP2008256770A JP4962973B2 JP 4962973 B2 JP4962973 B2 JP 4962973B2 JP 2008256770 A JP2008256770 A JP 2008256770A JP 2008256770 A JP2008256770 A JP 2008256770A JP 4962973 B2 JP4962973 B2 JP 4962973B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- web page
- score
- word
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 40
- 230000008569 process Effects 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000003252 repetitive effect Effects 0.000 claims 1
- 230000003287 optical effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007429 general method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
類似語を記憶した類似語データベースを記憶する記憶手段と、
検索開始時に、前記端末で過去に表示したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得手段と、
前記Webページ取得手段により取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出手段と、
前記特徴語抽出手段により抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出手段と、
前記特徴語抽出手段により抽出した前記Webページに関する検索データを前記端末に送信する検索データ送信手段と、
前記スコア算出手段により算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページからリンクされたリンク先のWebページを取得し、前記リンク先のWebページに対して前記特徴語抽出手段から前記検索データ送信手段までを繰り返して実行する繰り返し手段と、
を備えることを特徴とする検索サーバ。
を特徴とする(1)に記載の検索サーバ。
を特徴とする(1)又は(2)に記載の検索サーバ。
を特徴とする(1)から(3)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(4)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(5)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(6)までのいずれか1項に記載の検索サーバ。
を特徴とする(1)から(7)までのいずれか1項に記載の検索サーバ。
コンピュータは、類似語を記憶した類似語データベースを記憶する記憶手段を備え、
前記コンピュータが、
検索開始時に、過去に取得したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得ステップと、
前記Webページ取得ステップにより取得した前記Webページに含む特徴語であって前記検索対象データに類似する前記特徴語を、前記類似語データベースを用いて抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出ステップと、
前記特徴語抽出ステップにより抽出した前記Webページに関する検索データを出力する検索データ出力ステップと、
前記スコア算出ステップにより算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページにリンクされたリンク先のWebページに遷移して、前記リンク先のWebページに対して前記特徴語抽出ステップから前記検索データ出力ステップまでを繰り返して実行する繰り返しステップと、
を含むことを特徴とする検索方法。
[検索システムの全体構成及び検索サーバの機能構成]
図1は、本実施形態に係る検索システム100の全体構成及び検索サーバ1の機能構成を示す図である。
図2は、本実施形態に係る検索サーバ1のハードウェア構成を示す図である。本発明が実施されるサーバは標準的なものでよく、以下に構成の一例を示す。
コンテンツサーバ2も、上述の検索サーバ1と同様な構成を持つ。なお、コンテンツサーバ2のみならず、検索サーバ1にも、コンテンツサーバ2と同様にWebページを記憶するコンテンツのDBを一部有してもよい。
端末4も、上述の検索サーバ1と同様な構成を持つ。例えば、記憶部20は、光ディスクドライブ1076に代えて外部メモリを挿入可能なドライブであってもよい。
図3は、本実施形態に係る検索サーバ1の検索処理のフローチャートである。図4は、本実施形態に係る検索サーバ1の検索データ処理のフローチャートである。
次に、Webページを検索する方法について説明する。図5は、本実施形態に係る検索サーバ1でのWebページの検索方法の例を示す図である。
次に、端末4に表示される画面例について説明する。図6は、本実施形態に係る端末4の画面例を示す図である。
本実施形態では、検索対象のWebページのスコアの偏差値が、リンク元のWebページのスコアの偏差値を下回った場合には、検索対象のWebページからリンクされたWebページのみを検索対象にしたが、これに限らない。例えば、スコアの偏差値が下回った時点で、検索対象のWebページからリンクされたWebページを検索対象にしなくてもよい。また、その探索の範囲を、スコアの偏差値が2回下回った時点等にしてもよい。
2 コンテンツサーバ
3 通信ネットワーク
4 端末
10 制御部
11 検索対象データ受信手段
12 履歴情報取得手段
13 Webページ取得手段
14 特徴語抽出手段
15 スコア算出手段
16 検索データ送信手段
17 繰り返し手段
20 記憶部
22 類似語DB
30〜36 Webページ
40〜47 リンクデータ
50 検索画面
53 検索結果表示部
100 検索システム
Claims (10)
- 端末から受信した検索キーワードを含む検索依頼の指示データである検索対象データに基づきWebページを検索する検索サーバであって、
ある単語に類似する単語を該ある単語に関連付けて記憶する類似語データベースを備える記憶手段と、
前記端末で過去に表示されたWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得手段と、
前記Webページ取得手段により取得した前記Webページに含まれる特徴語であって前記検索対象データに含まれる検索キーワードに類似する特徴語を、前記類似語データベースを用いて抽出する特徴語抽出手段と、
前記特徴語抽出手段により抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出手段と、
前記Webページに関する検索データを前記端末に送信する検索データ送信手段と、
前記スコア算出手段により算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページからリンクされたリンク先のWebページを取得し、前記リンク先のWebページに対して前記特徴語抽出手段による特徴語の抽出と、前記スコア算出手段によるスコアの偏差値の算出と、前記検索データ送信手段による検索データの送信という一連の処理を繰り返し実行させる繰り返し手段と、
を備える検索サーバ。 - 前記繰り返し手段は、前記スコア算出手段により算出された前記スコアの偏差値が、リンク元のWebページの前記特徴語に対応する前記スコアの偏差値より高い値であることに応じて、リンク先のWebページに対して前記特徴語抽出手段による特徴語の抽出と、前記スコア算出手段によるスコアの偏差値の算出と、前記検索データ送信手段による検索データの送信という一連の処理を繰り返し実行させると共に、少なくとも前記リンク先のWebページをリンク元とするWebページに対して前記特徴語抽出手段による特徴語の抽出と、前記スコア算出手段によるスコアの偏差値の算出と、前記検索データ送信手段による検索データの送信という一連の処理を繰り返し実行させる
請求項1に記載の検索サーバ。 - 前記繰り返し手段は、前記スコア算出手段により算出された前記スコアの偏差値が、リンク元のWebページの前記特徴語に対応する前記スコアの偏差値より低い値であることに応じて、リンク先のWebページに対してのみ前記特徴語抽出手段による特徴語の抽出と、前記スコア算出手段によるスコアの偏差値の算出と、前記検索データ送信手段による検索データの送信という一連の処理を実行させる
請求項1又は請求項2に記載の検索サーバ。 - 前記検索データ送信手段は、前記端末に表示する前記Webページのリンクデータ及び要約文のデータを検索データとして前記端末に送信する
請求項1から請求項3までのいずれか1項に記載の検索サーバ。 - 前記検索データ送信手段は、前記特徴語抽出手段が前記特徴語を抽出したことに応じて、前記検索データを順次前記端末に送信する
請求項1から請求項4までのいずれか1項に記載の検索サーバ。 - 前記スコア算出手段は、TFIDF値を用いて前記特徴語に対応する前記スコアの偏差値を算出する
請求項1から請求項5までのいずれか1項に記載の検索サーバ。 - 前記Webページの閲覧履歴情報のうち、直近に前記端末に表示したものから順番に複数の前記閲覧履歴情報を、前記端末から取得する閲覧履歴情報取得手段を備える
請求項1から請求項6までのいずれか1項に記載の検索サーバ。 - 前記Webページ取得手段は、通信ネットワークを介して接続されたコンテンツサーバから前記Webページを取得する
請求項1から請求項7までのいずれか1項に記載の検索サーバ。 - ある単語に類似する単語を該ある単語に関連付けて記憶する類似語データベースを備えるサーバが、端末から受信した検索キーワードを含む検索依頼の指示データである検索対象データに基づきWebページを検索する検索方法であって、
前記サーバが、過去に取得したWebページの閲覧履歴情報に基づき、前記Webページを取得するWebページ取得ステップと、
前記サーバが、前記Webページ取得ステップにより取得した前記Webページに含まれる特徴語であって前記検索対象データに含まれる検索キーワードに類似する特徴語を、前記類似語データベースを用いて抽出する特徴語抽出ステップと、
前記サーバが、前記特徴語抽出ステップにより抽出された前記特徴語から、前記特徴語のスコアの偏差値を算出するスコア算出ステップと、
前記サーバが、前記特徴語抽出ステップにより抽出した前記Webページに関する検索データを前記端末に出力する検索データ出力ステップと、
前記サーバが、前記スコア算出ステップにより算出された前記スコアの偏差値が所定の条件を満たす間、前記Webページにリンクされたリンク先のWebページに遷移して、前記リンク先のWebページに対して特徴語を抽出し、スコアの偏差値を算出し、検索データを送信するという一連の処理を繰り返す繰り返しステップと、
を含む検索方法。 - 請求項9に記載の方法のステップをコンピュータに実行させるための検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008256770A JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008256770A JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010086422A JP2010086422A (ja) | 2010-04-15 |
JP4962973B2 true JP4962973B2 (ja) | 2012-06-27 |
Family
ID=42250285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008256770A Expired - Fee Related JP4962973B2 (ja) | 2008-10-01 | 2008-10-01 | 検索サーバ、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4962973B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2420493A4 (en) | 2009-04-14 | 2012-09-05 | Nissan Chemical Ind Ltd | HALOALKYLSULFONANILIDE DERIVATIVES |
KR101690528B1 (ko) * | 2015-06-05 | 2016-12-28 | 오드컨셉 주식회사 | 검색 정보를 표시하는 방법, 장치 및 컴퓨터 프로그램 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10260979A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
JPH10260978A (ja) * | 1997-03-18 | 1998-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報収集方法及び装置 |
US6704722B2 (en) * | 1999-11-17 | 2004-03-09 | Xerox Corporation | Systems and methods for performing crawl searches and index searches |
JP4070382B2 (ja) * | 2000-02-08 | 2008-04-02 | 富士通株式会社 | 情報検索装置および情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2008
- 2008-10-01 JP JP2008256770A patent/JP4962973B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010086422A (ja) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7475074B2 (en) | Web search system and method thereof | |
JP4731479B2 (ja) | 検索システム及び検索方法 | |
US9111008B2 (en) | Document information management system | |
US9405857B2 (en) | Speculative search result on a not-yet-submitted search query | |
US7668887B2 (en) | Method, system and software product for locating documents of interest | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
JP2007517308A (ja) | 記事情報を用いて検索ランク付けを改良するための方法およびシステム | |
US7757158B2 (en) | Converting hypertext character strings to links by attaching anchors extracted from existing link destination | |
JP2010097461A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP4824070B2 (ja) | クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム | |
JP4962973B2 (ja) | 検索サーバ、方法及びプログラム | |
JP2009080806A (ja) | Webページにリンクを挿入する方法 | |
JP4621680B2 (ja) | 定義付けシステムおよび方法 | |
JP4445849B2 (ja) | ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP2008112310A (ja) | 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体 | |
JP5108707B2 (ja) | 検索サーバ装置、検索方法及びプログラム | |
JP4920661B2 (ja) | インデックス生成方法、プログラム及びサーバ | |
JP5063568B2 (ja) | 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法 | |
JP2008262442A (ja) | 検索キーデータを表示させる方法及びサーバ | |
JP4859891B2 (ja) | コンテンツに関連する情報を提供するサーバ、システム及び方法 | |
JP2011508305A (ja) | アプリケーションプログラム実行時に検索ウィンドウを提供するネットワーク検索法 | |
JP4152669B2 (ja) | 文書検索装置、文書検索方法、記録媒体及びプログラム | |
JP2010079863A (ja) | 絞り込み検索サービス提供方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4962973 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |