JP5450135B2 - 関連度辞書を用いた検索モデリングシステムおよび方法 - Google Patents
関連度辞書を用いた検索モデリングシステムおよび方法 Download PDFInfo
- Publication number
- JP5450135B2 JP5450135B2 JP2010021533A JP2010021533A JP5450135B2 JP 5450135 B2 JP5450135 B2 JP 5450135B2 JP 2010021533 A JP2010021533 A JP 2010021533A JP 2010021533 A JP2010021533 A JP 2010021533A JP 5450135 B2 JP5450135 B2 JP 5450135B2
- Authority
- JP
- Japan
- Prior art keywords
- site
- query
- keyword
- search
- relevance dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 239000000463 material Substances 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 11
- 238000013480 data collection Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 239000000470 constituent Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- SGPGESCZOCHFCL-UHFFFAOYSA-N Tilisolol hydrochloride Chemical compound [Cl-].C1=CC=C2C(=O)N(C)C=C(OCC(O)C[NH2+]C(C)(C)C)C2=C1 SGPGESCZOCHFCL-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
Description
102:検索モデリングシステム
103−1〜103−3:サイト
Claims (15)
- サイトに対するサイト資料を分析して、前記サイトの特性を反映するキーワードを決定し、決定された前記キーワードを含むリストを前記サイトに対する関連度辞書として生成する関連度辞書生成部と、
サイトに対してクエリとクリック頻度のペアを含むサイトコレクションを収集するデータ収集部と、
前記サイトコレクションに関連度辞書を適用して、前記サイトに対するクエリ及び前記サイトのタイトルを構成するキーワードが前記サイトに対する関連度辞書に存在するか否かを判断して、前記サイトに対するクエリ及び前記サイトのタイトルを構成するキーワードが前記サイトに対する関連度辞書に存在する場合、第1のクエリのグループに分類し、存在しない場合、第2のクエリのグループに分類する構成要素判断部と、
前記第1のクエリのグループに分類されたキーワードにはより高い索引語加重値を適用し、前記第2のクエリのグループに分類されたキーワードにはより低い索引語加重値を適用して、前記索引語加重値が適用されたキーワードを前記サイトに索引するサイト索引部と、を含み、
ユーザが前記第1のクエリのグループのクエリを入力した場合、前記サイトを検索結果の上位に表示して、前記ユーザが前記第2のクエリのグループのクエリを入力した場合、前記サイトを検索結果の上位に表示しないことを特徴とする検索モデリングシステム。 - 前記関連度辞書は、
前記サイトのディレクトリ構造およびアンカーテキスト構造に基づいて抽出されたキーワードであり、前記サイトとの関連度が高いことを特徴とする請求項1に記載の検索モデリングシステム。 - 前記サイトのディレクトリ構造、サイトキーワード、またはアンカーテキスト構造を用いて前記サイトに対する関連度辞書を生成する関連度辞書生成部、
をさらに含む請求項1に記載の検索モデリングシステム。 - 前記関連度辞書生成部は、
前記サイトに対するディレクトリ構造、サイトキーワード、またはアンカーテキストを含むサイト資料を抽出するサイト資料抽出部と、
前記抽出されたサイト資料を分析してキーワードを決定するキーワード決定部と、
前記決定したキーワードを用いてリストを生成するリスト生成部と、
を含む請求項3に記載の検索モデリングシステム。 - 前記構成要素判断部は、
前記少なくとも1つのクエリに対するクリック閾値を定義し、前記クリック閾値よりも大きいクリック頻度を示すクエリに対して関連度辞書に存在するか否かを判断することを特徴とする請求項1に記載の検索モデリングシステム。 - 前記サイト索引部は、
前記クエリまたは前記タイトルが関連度辞書に存在する場合、索引語加重値を増加させて前記クエリまたは前記タイトルに適用することを特徴とする請求項1に記載の検索モデリングシステム。 - 前記サイトに対するページランク、クリック頻度、ツールバー訪問頻度、またはサイト滞留時間のうちの少なくとも1つの人気度要素を用いて前記クエリに索引された1つ以上のサイトの人気度を判断する人気度判断部、
をさらに含む請求項1に記載の検索モデリングシステム。 - 検索モデリングシステムが実行する検索モデリング方法であって、
関連度辞書生成部がサイトに対するサイト資料を分析して、前記サイトの特性を反映するキーワードを決定し、決定された前記キーワードを含むリストを前記サイトに対する関連度辞書として生成し、
データ収集部がサイトに対してクエリとクリック頻度のペアを含むサイトコレクションを収集し、
構成要素判断部が前記サイトコレクションに関連度辞書を適用して、前記サイトに対するクエリ及び前記サイトのタイトルを構成するキーワードが前記サイトに対する関連度辞書に存在するか否かを判断して、前記サイトに対するクエリ及び前記サイトのタイトルを構成するキーワードが前記サイトに対する関連度辞書に存在する場合、第1のクエリのグループに分類し、存在しない場合、第2のクエリのグループに分類し、
サイト索引部が前記第1のクエリのグループに分類されたキーワードにはより高い索引語加重値を適用し、前記第2のクエリのグループに分類されたキーワードにはより低い索引語加重値を適用して、前記索引語加重値が適用されたキーワードを前記サイトに索引すること、を含み、
ユーザが前記第1のクエリのグループのクエリを入力した場合、前記サイトを検索結果の上位に表示して、前記ユーザが前記第2のクエリのグループのクエリを入力した場合、前記サイトを検索結果の上位に表示しないことを特徴とする検索モデリング方法。 - 前記関連度辞書は、
前記サイトのディレクトリ構造およびアンカーテキスト構造に基づいて抽出されたキーワードであり、前記サイトとの関連度が高いことを特徴とする請求項8に記載の検索モデリング方法。 - 関連度辞書生成部が前記サイトのディレクトリ構造、サイトキーワード、またはアンカーテキスト構造を用いて前記サイトに対する関連度辞書を生成すること、
をさらに含む請求項8に記載の検索モデリング方法。 - 前記関連度辞書を生成すること、
前記サイトに対するディレクトリ構造、サイトキーワード、またはアンカーテキストを含むサイト資料を抽出し、
前記抽出されたサイト資料を分析してキーワードを決定し、
前記決定したキーワードを用いてリストを生成すること、
を含む請求項10に記載の検索モデリング方法。 - 前記クエリまたは前記タイトルが前記関連度辞書に存在するか否かを判断することは、
前記構成要素判断部が前記少なくとも1つのクエリに対するクリック閾値を定義し、前記クリック閾値よりも大きいクリック頻度を示すクエリに対して関連度辞書に存在するか否かを判断することを特徴とする請求項8に記載の検索モデリング方法。 - 前記サイトを索引することは、
前記サイト索引部が前記クエリまたは前記タイトルが関連度辞書に存在する場合、索引語加重値を増加させて前記クエリまたは前記タイトルに適用することを特徴とする請求項8に記載の検索モデリング方法。 - 人気度判断部が前記サイトに対するページランク、クリック頻度、ツールバー訪問頻度、またはサイト滞留時間のうちの少なくとも1つの人気度要素を用いて前記クエリに索引された1つ以上のサイトの人気度を判断すること、
をさらに含む請求項8に記載の検索モデリング方法。 - 請求項8乃至14の何れか一に記載の方法を実行させるためのプログラムを記録したことを特徴とするコンピュータで読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20090011371A KR100994349B1 (ko) | 2009-02-12 | 2009-02-12 | 연관도 사전을 이용한 검색 모델링 시스템 및 방법 |
KR10-2009-0011371 | 2009-02-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010186474A JP2010186474A (ja) | 2010-08-26 |
JP5450135B2 true JP5450135B2 (ja) | 2014-03-26 |
Family
ID=42757087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010021533A Active JP5450135B2 (ja) | 2009-02-12 | 2010-02-02 | 関連度辞書を用いた検索モデリングシステムおよび方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5450135B2 (ja) |
KR (1) | KR100994349B1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484698A (zh) * | 2015-08-25 | 2017-03-08 | 北京奇虎科技有限公司 | 一种搜索关键词的推送方法和装置 |
CN112835923A (zh) * | 2021-02-02 | 2021-05-25 | 中国工商银行股份有限公司 | 一种相关检索方法、装置和设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090111A (ja) * | 1998-09-14 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 情報検索エージェント装置及び情報検索エージェント装置の機能を発揮するプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002236699A (ja) * | 2001-02-09 | 2002-08-23 | Asahi Kasei Corp | 情報検索システム及び管理用サーバ並びに制御用プログラム |
JP4423841B2 (ja) * | 2002-08-14 | 2010-03-03 | 日本電気株式会社 | キーワード決定装置、決定方法、文書検索装置、検索方法、文書分類装置及び分類方法並びにプログラム |
JP4909748B2 (ja) * | 2007-01-22 | 2012-04-04 | ヤフー株式会社 | ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ |
JP2008181186A (ja) * | 2007-01-23 | 2008-08-07 | Yahoo Japan Corp | クエリーログを利用したキーワードとサイトの関連度を求める方法 |
KR100896614B1 (ko) * | 2007-01-29 | 2009-05-08 | 엔에이치엔(주) | 검색 시스템 및 방법 |
-
2009
- 2009-02-12 KR KR20090011371A patent/KR100994349B1/ko active IP Right Grant
-
2010
- 2010-02-02 JP JP2010021533A patent/JP5450135B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
KR20100092145A (ko) | 2010-08-20 |
JP2010186474A (ja) | 2010-08-26 |
KR100994349B1 (ko) | 2010-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4936401B2 (ja) | ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム | |
Chirita et al. | P-tag: large scale automatic generation of personalized annotation tags for the web | |
US8745039B2 (en) | Method and system for user guided search navigation | |
Osiński | An algorithm for clustering of web search results | |
CN100568232C (zh) | 通用搜索引擎接口 | |
US8346792B1 (en) | Query generation using structural similarity between documents | |
KR100505848B1 (ko) | 검색 시스템 | |
US20090144240A1 (en) | Method and systems for using community bookmark data to supplement internet search results | |
JP2009525520A (ja) | 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン | |
US7024405B2 (en) | Method and apparatus for improved internet searching | |
WO2010098178A1 (ja) | 情報推薦装置、情報推薦方法および情報推薦プログラム | |
Ru et al. | Indexing the invisible web: a survey | |
JP2002245061A (ja) | キーワード抽出 | |
JP2009122807A (ja) | 連想検索システム | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5450135B2 (ja) | 関連度辞書を用いた検索モデリングシステムおよび方法 | |
Koolen et al. | Wikipedia pages as entry points for book search | |
Laclavík et al. | Search query categorization at scale | |
JP5191204B2 (ja) | 連想検索システム | |
US20080033953A1 (en) | Method to search transactional web pages | |
Wu et al. | A quality analysis of keyword searching in different search engines projects | |
Bhatia et al. | A scalable approach for performing proximal search for verbose patent search queries | |
TWI423053B (zh) | Domain Interpretation Data Retrieval Method and Its System | |
Navaneethakrishnan et al. | An approach to page ranking based on discourse structures | |
JP2013101415A (ja) | 商品ウェブページ分析装置、商品ウェブページ分析方法、および、商品ウェブページ分析装置用のプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5450135 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |