JP4920661B2 - インデックス生成方法、プログラム及びサーバ - Google Patents
インデックス生成方法、プログラム及びサーバ Download PDFInfo
- Publication number
- JP4920661B2 JP4920661B2 JP2008282328A JP2008282328A JP4920661B2 JP 4920661 B2 JP4920661 B2 JP 4920661B2 JP 2008282328 A JP2008282328 A JP 2008282328A JP 2008282328 A JP2008282328 A JP 2008282328A JP 4920661 B2 JP4920661 B2 JP 4920661B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- symbol
- index
- anchor text
- index generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000004891 communication Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索対象になるWebページを記憶するWebページデータベースから前記Webページを読み込んで、前記Webページに配置されたアンカーテキストと、表示された前記アンカーテキストの行に隣接して配置されたシンボルとを取得するデータ取得ステップと、
前記データ取得ステップにおいて取得した前記アンカーテキストと前記シンボルとの間の関係を判定する関係判定ステップと、
前記関係判定ステップにより前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記シンボルを前記アンカーテキストが示すリンクデータのインデックスとして対応付けて、インデックスデータベースを生成するインデックス生成ステップと、
を含むインデックス生成方法。
前記シンボルと、前記シンボルに対応する条件データとを記憶する関係条件データベースを備え、
前記関係判定ステップにおいて、前記アンカーテキストと共に取得した前記シンボルに基づいて前記関係条件データベースの前記条件データを抽出し、前記アンカーテキストの前記リンクデータが示すリンク先のWebページが、前記条件データの条件を満たすか否かにより前記関係を判定すること、
を特徴とする(1)に記載のインデックス生成方法。
を特徴とする(1)又は(2)に記載のインデックス生成方法。
前記関係判定ステップにより前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記リンクデータと前記シンボルとのウェイトを算出するウェイト算出ステップを含み、
前記インデックス生成ステップにおいて、前記ウェイト算出ステップで算出された前記ウェイトを前記リンクデータ及び前記シンボルに対応付けて記憶すること、
を特徴とする(1)から(3)までのいずれか1項に記載のインデックス生成方法。
を特徴とする(4)に記載のインデックス生成方法。
互いに関連する種類の異なる複数の前記シンボルを、各々対応付けて記憶するシンボルデータベースを備え、
前記インデックス生成ステップにおいて、前記シンボルデータベースに基づき互いに関連する前記シンボルを集約してインデックスデータベースを生成すること、
を特徴とする(1)から(5)までのいずれか1項に記載のインデックス生成方法。
を特徴とする(1)から(6)までのいずれか1項に記載のインデックス生成方法。
を特徴とする(7)に記載のインデックス生成方法。
前記データ取得手段において取得した前記アンカーテキストと前記シンボルとの間の関係を判定する関係判定手段と、
前記関係判定手段により前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記シンボルを前記アンカーテキストが示すリンクデータのインデックスとして対応付けて、インデックスデータベースを生成するインデックス生成手段と、
を備えるインデックス生成サーバ。
[インデックスサーバの機能構成]
図1は、本実施形態に係るインデックス生成サーバ1の機能構成を示す図である。
図2は、本実施形態に係るインデックス生成サーバ1のハードウェア構成を示す図である。本発明が実施されるサーバは、標準的なものでよく、以下に構成の一例を示す。
コンテンツサーバ2も、上述のインデックス生成サーバ1と同様な構成を持つ。なお、コンテンツサーバ2のみならず、インデックス生成サーバ1にも、コンテンツサーバ2と同様にWebページを記憶するコンテンツのDBを一部有してもよい。
端末4も、上述のインデックス生成サーバ1と同様な構成を持つ。例えば、記憶部20は、光ディスクドライブ1076に代えて外部メモリを挿入可能なドライブであってもよい。
図3は、本実施形態に係るインデックス生成処理のフローチャートである。
次に、WebページからインデックスDB24を生成するにあたって、リンクデータ及び絵文字を取得する方法について、具体例を用いて説明する。図4は、本実施形態に係るWebページの具体例を示す図である。
次に、インデックスDB24を用いた検索について説明する。図8は、本実施形態に係る検索システム100の全体構成を示す図である。
本実施形態では、ウェイトについて、リンクデータに対応する絵文字の出現度合いに基づいて決定していたが、相対的な数で表されるものであれば、例えば、リンクデータの参照度合い等、リンクデータ及び絵文字のうち少なくともいずれかを用いたものを用いることができる。
2 コンテンツサーバ
3 通信ネットワーク
4 端末
5 検索サーバ
10 制御部
11 Webページ取得手段
12 データ取得手段
13 関係判定手段
14 ウェイト算出手段
15 インデックス生成手段
20 記憶部
21 WebページDB
22 関係条件DB
23 シンボルDB
24 インデックスDB
30,40,43,46,50 Webページ
31,33,35,51 アンカーテキスト
32,34,52 絵文字
100 検索システム
Claims (10)
- コンピュータが、
検索対象になるWebページを記憶するWebページデータベースから前記Webページを読み込んで、前記Webページに配置されたアンカーテキストと、表示された前記アンカーテキストの行に隣接して配置されたシンボルとを取得するデータ取得ステップと、
前記データ取得ステップにおいて取得した前記アンカーテキストと前記シンボルとの間の関係を判定する関係判定ステップと、
前記関係判定ステップにより前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記シンボルを前記アンカーテキストが示すリンクデータのインデックスとして対応付けて、インデックスデータベースを生成するインデックス生成ステップと、
を含むインデックス生成方法。 - 前記コンピュータが、
前記シンボルと、前記シンボルに対応する条件データとを記憶する関係条件データベースを備え、
前記関係判定ステップにおいて、前記アンカーテキストと共に取得した前記シンボルに基づいて前記関係条件データベースの前記条件データを抽出し、前記アンカーテキストの前記リンクデータが示すリンク先のWebページが、前記条件データの条件を満たすか否かにより前記関係を判定すること、
を特徴とする請求項1に記載のインデックス生成方法。 - 前記シンボルは、表示された前記アンカーテキストの文字の大きさに類似する大きさで表示される画像データであること、
を特徴とする請求項1又は請求項2に記載のインデックス生成方法。 - 前記コンピュータが、
前記関係判定ステップにより前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記リンクデータと前記シンボルとのウェイトを算出するウェイト算出ステップを含み、
前記インデックス生成ステップにおいて、前記ウェイト算出ステップで算出された前記ウェイトを前記リンクデータ及び前記シンボルに対応付けて記憶すること、
を特徴とする請求項1から請求項3までのいずれか1項に記載のインデックス生成方法。 - 前記ウェイト算出ステップにおいて、前記ウェイトとして、前記リンクデータに対応する前記シンボルの出現度合い又は前記リンクデータの参照度合いを算出すること、
を特徴とする請求項4に記載のインデックス生成方法。 - 前記コンピュータが、
互いに関連する種類の異なる複数の前記シンボルを、各々対応付けて記憶するシンボルデータベースを備え、
前記インデックス生成ステップにおいて、前記シンボルデータベースに基づき互いに関連する前記シンボルを集約してインデックスデータベースを生成すること、
を特徴とする請求項1から請求項5までのいずれか1項に記載のインデックス生成方法。 - 前記コンピュータが、通信ネットワークを介して接続されたWebサーバを定期的に巡回して、前記Webページデータベースに記憶する前記Webページを取得するWebページ取得ステップを含むこと、
を特徴とする請求項1から請求項6までのいずれか1項に記載のインデックス生成方法。 - 前記Webページデータベースは、前記Webページ取得ステップにより取得した前記Webページを、取得タイミングに対応付けて記憶すること、
を特徴とする請求項7に記載のインデックス生成方法。 - 請求項1から請求項8までのいずれか1項に記載の方法のステップをコンピュータに実行させるためのインデックス生成プログラム。
- 検索対象になるWebページを記憶するWebページデータベースから前記Webページを読み込んで、前記Webページに配置されたアンカーテキストと、表示された前記アンカーテキストの行に隣接して配置されたシンボルとを取得するデータ取得手段と、
前記データ取得手段において取得した前記アンカーテキストと前記シンボルとの間の関係を判定する関係判定手段と、
前記関係判定手段により前記アンカーテキストと前記シンボルとに関係があると判定されたことに応じて、前記シンボルを前記アンカーテキストが示すリンクデータのインデックスとして対応付けて、インデックスデータベースを生成するインデックス生成手段と、
を備えるインデックス生成サーバ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008282328A JP4920661B2 (ja) | 2008-10-31 | 2008-10-31 | インデックス生成方法、プログラム及びサーバ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008282328A JP4920661B2 (ja) | 2008-10-31 | 2008-10-31 | インデックス生成方法、プログラム及びサーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010108416A JP2010108416A (ja) | 2010-05-13 |
JP4920661B2 true JP4920661B2 (ja) | 2012-04-18 |
Family
ID=42297769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008282328A Expired - Fee Related JP4920661B2 (ja) | 2008-10-31 | 2008-10-31 | インデックス生成方法、プログラム及びサーバ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4920661B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013108746A1 (ja) * | 2012-01-16 | 2013-07-25 | 日本電気株式会社 | 検索システム、その制御方法、及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11224256A (ja) * | 1998-02-05 | 1999-08-17 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法および情報検索プログラムを記録した記録媒体 |
DE60044220D1 (de) * | 1999-01-26 | 2010-06-02 | Xerox Corp | Multimodaler Informationzugriff |
JP2003271630A (ja) * | 2002-03-15 | 2003-09-26 | Yamaha Corp | 情報検索方法、プログラム及び装置 |
-
2008
- 2008-10-31 JP JP2008282328A patent/JP4920661B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010108416A (ja) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8458207B2 (en) | Using anchor text to provide context | |
US9589071B2 (en) | Query suggestions from documents | |
US8868539B2 (en) | Search equalizer | |
US9355185B2 (en) | Infinite browse | |
US7516124B2 (en) | Interactive search engine | |
US9396214B2 (en) | User interface for viewing clusters of images | |
US8146010B2 (en) | Combinable tabs for a tabbed document interface | |
CA2788651C (en) | Information search system with real-time feedback | |
US20100228738A1 (en) | Adaptive document sampling for information extraction | |
US20100082610A1 (en) | Query refinement based on user selections | |
JP2007272872A (ja) | 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム | |
JP4796538B2 (ja) | コメントデータを関連付ける方法 | |
JP2012212191A (ja) | 情報処理装置及び情報処理方法 | |
JP4920661B2 (ja) | インデックス生成方法、プログラム及びサーバ | |
JP2008112310A (ja) | 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体 | |
JP5049207B2 (ja) | 地名表示態様調整方法、地名表示態様調整装置及び地名表示態様調整システム | |
JP4962973B2 (ja) | 検索サーバ、方法及びプログラム | |
JP2010086210A (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP2013012242A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008262442A (ja) | 検索キーデータを表示させる方法及びサーバ | |
JP2018136786A (ja) | ウェブページ制作支援システム | |
JP2010086180A (ja) | デバイスを調整した検索方法、プログラム及びサーバ | |
JP4995238B2 (ja) | 広告誘導サーバ、広告誘導方法及びサーバプログラム | |
JP2013015920A (ja) | 情報処理装置、情報処理方法、および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4920661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |