JP5072792B2 - 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ - Google Patents
情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ Download PDFInfo
- Publication number
- JP5072792B2 JP5072792B2 JP2008253465A JP2008253465A JP5072792B2 JP 5072792 B2 JP5072792 B2 JP 5072792B2 JP 2008253465 A JP2008253465 A JP 2008253465A JP 2008253465 A JP2008253465 A JP 2008253465A JP 5072792 B2 JP5072792 B2 JP 5072792B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- search
- weight
- word
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 24
- 238000004891 communication Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000877 morphologic effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索の対象となるWebページを解析して前記Webページ内における特徴を示す特徴語を複数抽出するWebページ解析ステップと、
抽出した前記特徴語の前記Webページ内における出現頻度を示す特徴語ウェイトを複数の前記特徴語の夫々について算出する特徴語ウェイト算出ステップと、
を含む検索方法であって、
複数の特徴語の関連性を記憶する関連語DBを備え、
前記Webページ解析ステップにより抽出した複数の前記特徴語の夫々が関連するか否かを、前記関連語DBを用いて判定する関連語判定ステップと、
関連すると判定した特徴語の特徴語ウェイトの総和を関連語ウェイトとして算出するWebページウェイト算出ステップと、
算出した前記関連語ウェイトを、当該Webページのリンクデータに対応付けてインデキシングDBに記憶するインデキシング記憶ステップと、
を含む検索方法。
検索キーワードを含む要求データを前記端末から受信する受信ステップと、
前記受信ステップにより受信した前記検索キーワードに基づき、前記検索キーワードを含むWebページを検索する検索ステップと、
前記検索ステップにより検索したWebページのうち前記検索キーワードに関連する関連語ウェイトを用いて検索結果を調整するWebページ調整ステップと、
前記Webページ調整ステップによる調整結果に基づき、検索された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信ステップと、
を含むことを特徴とする(1)に記載の検索方法。
Webページ内における全ての特徴語の特徴語ウェイトの平均値を算出する平均ウェイト算出ステップと、
前記Webページウェイト算出ステップにより算出した前記関連語ウェイトが、前記平均値から乖離する割合を算出する対比ウェイト算出ステップと、を更に含み、
前記Webページ調整ステップは、前記対比ウェイト算出ステップにより算出した割合を用いて検索結果を調整することを特徴とする(2)に記載の検索方法。
検索の対象となるWebページを解析して前記Webページ内における特徴を示す特徴語を複数抽出するWebページ解析手段と、
抽出した前記特徴語の前記Webページ内における出現頻度を示す特徴語ウェイトを複数の前記特徴語の夫々について算出する特徴語ウェイト算出手段と、
複数の特徴語の関連性を記憶する関連語DBと、
前記Webページ解析手段により抽出した複数の前記特徴語の夫々が関連するか否かを、前記関連語DBを用いて判定する関連語判定手段と、
関連すると判別した特徴語の特徴語ウェイトの総和を関連語ウェイトとして算出するWebページウェイト算出手段と、
算出した前記関連語ウェイトを、当該Webページのリンクデータに対応付けてインデキシングDBに記憶するインデキシング記憶手段と、
を備える検索サーバ。
[検索システムの全体構成及び検索サーバの機能構成]
図1は、本実施形態に係る検索システム100の全体構成及び検索サーバ1の機能構成を示す図である。
図2は、本実施形態に係る検索サーバ1のハードウェア構成を示す図である。本発明が実施されるサーバは標準的なものでよく、以下に構成の一例を示す。
コンテンツサーバ2も、上述の検索サーバ1と同様な構成を持つ。なお、コンテンツサーバ2のみならず、検索サーバ1にも、コンテンツサーバ2と同様にWebページを記憶するコンテンツのDBを有してもよい。
端末4も、上述の検索サーバ1と同様な構成を持つ。例えば、記憶部20は、光ディスクドライブ1076に代えて外部メモリを挿入可能なドライブであってもよい。また、表示装置1022が、タッチパネルとして入力装置1100の機能を備えていてもよい。更に、端末4が、加速度センサ等のセンサを備えて、そのセンサが、入力装置1100の機能を有してもよい。
図3は、本実施形態に係る検索サーバ1のインデキシング処理のフローチャートである。インデキシング処理は、例えば、検索サーバ1の管理者により決められた所定のタイミングで定期的に行う。
図4は、本実施形態に係る記憶部20に格納される関連語DB24及びインデキシングDB26を示す図である。関連語DB24は、上述の図3のS4において、制御部10がWebページ内の特徴語に関連性があるか否かを判定する際に用いられるDBである。なお、関連性が有無は検索サーバ1の管理者が予め任意に設定しておくことができる。また、インデキシングDB26は、上述の図3のS5において制御部10が関連語ウェイトを含むWebページウェイトを記憶するデータベースである。
次に、上述した関連語ウェイトを用いた検索処理について説明する。図5は、本実施形態に係る検索サーバ1での検索処理のフローチャートである。
ここで、TF・IDFを用いて算出される特徴語ウェイトは、各Webページ内における相対値となるため、Webページの対比に適しない場合がある。例えば、図7(1)のWebページ3(ID:003)は、ブログ形式のWebページであるところ、8月1日付の記事には、Webページ1と全く同じ内容である文章200が記載され、8月2日以降には更に別の文章205が記載されている。
[関連語DBの変形例]
上記実施形態では、関連すると判定された特徴語を単に加算することとしているが、図8に示すように関連する度合いに応じて加算する割合を異ならせることとしてもよい。例えば、「関連語ID010」の「オリンピック」に関連するものとして「北京」と「東京」とが考えられるところ、開催された年月が近い「北京」を開催された年月が遠い「東京」よりも関連性が高いとすることとしてもよい。なお、これらの関連する度合いは、検索サーバ1の管理者が任意に設定可能であり、また適宜変更可能である。
また、上記実施形態では、関連語ウェイトを所定のタイミングで定期的に行われるインデキシング処理において算出する(S5)こととしているが、これに限られるものではない。例えば、検索処理においてユーザが入力した検索キーワードを受信後に、関連語ウェイトを算出することとしてもよい。このような構成にすることにより、当該検索キーワードに対応する関連語IDについてのみ関連語ウェイトを算出すれば足りることになる。
2 コンテンツサーバ
4 端末
10 制御部
11 Webページ取得手段
12 Webページ解析手段
13 特徴語ウェイト算出手段
14 関連語判定手段
15 Webページウェイト算出手段
16 受信手段
17 検索手段
18 Webページ調整手段
19 コンテンツ送信手段
20 記憶部
22 回収WebページDB
24 関連語DB
26 インデキシングDB
100 検索システム
Claims (4)
- 端末に対して通信ネットワークを介して接続されたコンピュータが、
検索の対象となるWebページを解析して前記Webページ内における特徴を示す特徴語を複数抽出するWebページ解析ステップと、
抽出した前記特徴語の前記Webページ内における出現頻度を示す特徴語ウェイトを複数の前記特徴語の夫々について算出する特徴語ウェイト算出ステップと、
を含む検索方法であって、
複数の特徴語の関連性を記憶する関連語DBを備え、
前記Webページ解析ステップにより抽出した複数の前記特徴語の夫々が関連するか否かを、前記関連語DBを用いて判定する関連語判定ステップと、
関連すると判定した特徴語の特徴語ウェイトの総和を関連語ウェイトとして算出するWebページウェイト算出ステップと、
算出した前記関連語ウェイトを、当該Webページのリンクデータに対応付けてインデキシングDBに記憶するインデキシング記憶ステップと、
検索キーワードを含む要求データを前記端末から受信する受信ステップと、
前記受信ステップにより受信した前記検索キーワードに基づき、前記検索キーワードを含むWebページを検索する検索ステップと、
前記検索ステップにより検索したWebページのうち前記検索キーワードに関連する関連語ウェイトを用いて検索結果を調整するWebページ調整ステップと、
前記Webページ調整ステップによる調整結果に基づき、検索された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信ステップと、
Webページ内における全ての特徴語の特徴語ウェイトの平均値を算出する平均ウェイト算出ステップと、
前記Webページウェイト算出ステップにより算出した前記関連語ウェイトが、前記平均値から乖離する割合を算出する対比ウェイト算出ステップと、
を含み、
前記Webページ調整ステップは、前記対比ウェイト算出ステップにより算出した割合を用いて検索結果を調整することを特徴とする検索方法。 - 前記コンピュータが、通信ネットワークを介して接続されたWebサーバを定期的に巡回して、検索の対象になる前記Webページを取得する取得ステップを含むこと、
を特徴とする請求項1に記載の検索方法。 - 請求項1又は請求項2のいずれか1項に記載の方法のステップをコンピュータに実行させるための検索プログラム。
- 端末に対して通信ネットワークを介して接続された検索サーバであって、
検索の対象となるWebページを解析して前記Webページ内における特徴を示す特徴語を複数抽出するWebページ解析手段と、
抽出した前記特徴語の前記Webページ内における出現頻度を示す特徴語ウェイトを複数の前記特徴語の夫々について算出する特徴語ウェイト算出手段と、
複数の特徴語の関連性を記憶する関連語DBと、
前記Webページ解析手段により抽出した複数の前記特徴語の夫々が関連するか否かを、前記関連語DBを用いて判定する関連語判定手段と、
関連すると判別した特徴語の特徴語ウェイトの総和を関連語ウェイトとして算出するWebページウェイト算出手段と、
算出した前記関連語ウェイトを、当該Webページのリンクデータに対応付けてインデキシングDBに記憶するインデキシング記憶手段と、
検索キーワードを含む要求データを前記端末から受信する受信手段と、
前記受信手段により受信した前記検索キーワードに基づき、前記検索キーワードを含むWebページを検索する検索手段と、
前記検索手段により検索したWebページのうち前記検索キーワードに関連する関連語ウェイトを用いて検索結果を調整するWebページ調整手段と、
前記Webページ調整手段による調整結果に基づき、検索された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信手段と、
Webページ内における全ての特徴語の特徴語ウェイトの平均値を算出する平均ウェイト算出手段と、
前記Webページウェイト算出手段により算出した前記関連語ウェイトが、前記平均値から乖離する割合を算出する対比ウェイト算出手段と、
を備え、
前記Webページ調整手段は、前記対比ウェイト算出手段により算出した割合を用いて検索結果を調整することを特徴とする検索サーバ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008253465A JP5072792B2 (ja) | 2008-09-30 | 2008-09-30 | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008253465A JP5072792B2 (ja) | 2008-09-30 | 2008-09-30 | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010086210A JP2010086210A (ja) | 2010-04-15 |
JP5072792B2 true JP5072792B2 (ja) | 2012-11-14 |
Family
ID=42250123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008253465A Active JP5072792B2 (ja) | 2008-09-30 | 2008-09-30 | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5072792B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8704905B2 (en) | 2007-08-29 | 2014-04-22 | Panasonic Corporation | Camera body and camera system |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103377185B (zh) * | 2012-04-24 | 2017-09-22 | 深圳市世纪光速信息技术有限公司 | 一种为短文本自动添加标签的方法及装置 |
JP6072449B2 (ja) | 2012-07-09 | 2017-02-01 | ルネサスエレクトロニクス株式会社 | 半導体記憶回路及びその動作方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090111A (ja) * | 1998-09-14 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 情報検索エージェント装置及び情報検索エージェント装置の機能を発揮するプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2001134588A (ja) * | 1999-11-04 | 2001-05-18 | Ricoh Co Ltd | 文書検索装置 |
JP2004287696A (ja) * | 2003-03-20 | 2004-10-14 | Seiko Epson Corp | 検索システム及び検索プログラム |
JP4510483B2 (ja) * | 2004-02-23 | 2010-07-21 | 株式会社エヌ・ティ・ティ・データ | 情報検索装置 |
JP2006343925A (ja) * | 2005-06-08 | 2006-12-21 | Fuji Xerox Co Ltd | 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム |
-
2008
- 2008-09-30 JP JP2008253465A patent/JP5072792B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8704905B2 (en) | 2007-08-29 | 2014-04-22 | Panasonic Corporation | Camera body and camera system |
Also Published As
Publication number | Publication date |
---|---|
JP2010086210A (ja) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5174931B2 (ja) | ドキュメント利用統計を用いたランキング関数 | |
CN107092615B (zh) | 来自文档的查询建议 | |
JP4638439B2 (ja) | ウェブ検索の個人化 | |
KR101171405B1 (ko) | 검색 결과에서 배치 내용 정렬의 맞춤화 | |
US20040002945A1 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
US20090299978A1 (en) | Systems and methods for keyword and dynamic url search engine optimization | |
JP2006092557A (ja) | 検索エンジンから返されるページのランキングを制御するシステムおよび方法 | |
US10282358B2 (en) | Methods of furnishing search results to a plurality of client devices via a search engine system | |
JP2007188352A (ja) | ページリランキング装置、ページリランキングプログラム | |
JP2010055159A (ja) | 情報検索装置、情報検索方法、およびプログラム | |
JP2007140973A (ja) | ページリランキング装置、ページリランキングプログラム | |
EP2050020A1 (en) | A method for personalized search indexing | |
US20150169576A1 (en) | Dynamic Search Results | |
JP6506489B1 (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
US20150339387A1 (en) | Method of and system for furnishing a user of a client device with a network resource | |
US20150169643A1 (en) | Providing supplemental search results in repsonse to user interest signal | |
JP2003091552A (ja) | 検索要求情報抽出方法及びその実施システム並びにその処理プログラム | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP5296745B2 (ja) | クエリサジェスチョン提供装置及び方法 | |
JP5220659B2 (ja) | 検索装置及び方法 | |
JP2010055155A (ja) | サーバ装置、情報処理方法およびプログラム | |
JP2009145953A (ja) | データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 | |
JP5014252B2 (ja) | コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム | |
JP5777663B2 (ja) | 検索支援装置及び検索支援プログラム | |
JP2012168844A (ja) | 検索サジェスト装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120312 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120724 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5072792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |