JP2010262638A - 代表者の信頼度を用いた検索結果順位化装置および方法 - Google Patents
代表者の信頼度を用いた検索結果順位化装置および方法 Download PDFInfo
- Publication number
- JP2010262638A JP2010262638A JP2010093975A JP2010093975A JP2010262638A JP 2010262638 A JP2010262638 A JP 2010262638A JP 2010093975 A JP2010093975 A JP 2010093975A JP 2010093975 A JP2010093975 A JP 2010093975A JP 2010262638 A JP2010262638 A JP 2010262638A
- Authority
- JP
- Japan
- Prior art keywords
- search result
- representative
- document
- reliability
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000000284 extract Substances 0.000 claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000008520 organization Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】代表者の信頼度を用いた検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。
【選択図】図1
Description
110:検索部
120:代表者抽出部
130:信頼度算出部
140:順位化部
Claims (21)
- 検索クエリに対する検索結果文書を抽出する検索部と、
前記検索結果文書に対する代表者を抽出する代表者抽出部と、
前記代表者に対する信頼度を算出する信頼度算出部と、
前記信頼度を用いて前記検索結果文書を順位化する順位化部と、
を含む、ことを特徴とする検索結果順位化装置。 - 前記代表者抽出部は、
前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記代表者抽出部は、
前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記代表者抽出部は、
前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記信頼度算出部は、
予め選定された代表者プールに含まれる代表者に対して信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記信頼度算出部は、
前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記信頼度算出部は、
それぞれの検索クエリに対応して前記代表者の信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記順位化部は、
前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記検索クエリは、代表者名を含み、
前記順位化部は、
前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項1に記載の検索結果順位化装置。 - 前記代表者名は、
前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項9に記載の検索結果順位化装置。 - 検索クエリに対する検索結果文書を抽出し、
前記検索結果文書に対する代表者を抽出し、
前記代表者に対する信頼度を算出し、
前記信頼度を用いて前記検索結果文書を順位化する、
ことを含むことを特徴とする検索結果順位化方法。 - 前記代表者を抽出することは、
前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記代表者を抽出することは、
前記検索結果文書のURLパターンを分析して前記代表者を抽出するための最小URLを決定し、
前記検索結果文書中前記最小URLを含む文書を分類し、
前記分類された文書に対する代表者を抽出する、
ことを含むことを特徴とする請求項11に記載の検索結果順位化方法。 - 前記代表者を抽出することは、
前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記信頼度を算出することは、
予め選定された代表者プールに含まれる代表者に対して信頼度を抽出することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記信頼度を算出することは、
前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記信頼度を算出することは、
前記検索クエリに対応する前記代表者の信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記順位化することは、
前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記検索結果文書を抽出することは、
代表者名を含む前記検索クエリに対する検索結果文書を抽出し、
前記順位化することは、
前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項11に記載の検索結果順位化方法。 - 前記代表者名は、
前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項19に記載の検索結果順位化方法。 - 請求項11乃至請求項20のうちいずれか一項の方法を実行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090038119A KR101050013B1 (ko) | 2009-04-30 | 2009-04-30 | 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법 |
KR10-2009-0038119 | 2009-04-30 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014042802A Division JP5724009B2 (ja) | 2009-04-30 | 2014-03-05 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010262638A true JP2010262638A (ja) | 2010-11-18 |
JP5497523B2 JP5497523B2 (ja) | 2014-05-21 |
Family
ID=43360614
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010093975A Active JP5497523B2 (ja) | 2009-04-30 | 2010-04-15 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
JP2014042802A Active JP5724009B2 (ja) | 2009-04-30 | 2014-03-05 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
JP2015068780A Active JP5989170B2 (ja) | 2009-04-30 | 2015-03-30 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014042802A Active JP5724009B2 (ja) | 2009-04-30 | 2014-03-05 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
JP2015068780A Active JP5989170B2 (ja) | 2009-04-30 | 2015-03-30 | 代表者の信頼度を用いた検索結果順位化装置および方法 |
Country Status (2)
Country | Link |
---|---|
JP (3) | JP5497523B2 (ja) |
KR (1) | KR101050013B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015049892A (ja) * | 2013-08-29 | 2015-03-16 | 富士通株式会社 | キュレーションをランク付けする方法及びシステム |
WO2016178337A1 (ja) * | 2015-05-01 | 2016-11-10 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013162263A1 (ko) * | 2012-04-23 | 2013-10-31 | 줌인터넷 주식회사 | 패킷미러링을 이용한 검색대상 랭크 결정 방법 및 시스템 |
WO2013162265A1 (ko) * | 2012-04-23 | 2013-10-31 | 줌인터넷 주식회사 | 패킷미러링을 이용한 순위 정보 제공 방법 및 시스템 |
CN105488151A (zh) * | 2015-11-27 | 2016-04-13 | 小米科技有限责任公司 | 参考文档的推荐方法及装置 |
JP6577925B2 (ja) * | 2016-09-20 | 2019-09-18 | 株式会社トヨタマップマスター | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 |
KR101972660B1 (ko) * | 2017-08-18 | 2019-04-25 | 주식회사 포스코아이씨티 | 팩트체크 시스템 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171819A (ja) * | 1996-12-06 | 1998-06-26 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2006164086A (ja) * | 2004-12-10 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | オンライン知識検索支援装置、およびオンライン知識検索支援方法 |
JP2008165599A (ja) * | 2006-12-28 | 2008-07-17 | National Institute Of Information & Communication Technology | 風評情報抽出装置及び風評情報抽出方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7523051B2 (en) * | 2001-05-31 | 2009-04-21 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP2004192542A (ja) * | 2002-12-13 | 2004-07-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦装置、情報推薦方法、プログラムおよび記録媒体 |
US7577655B2 (en) * | 2003-09-16 | 2009-08-18 | Google Inc. | Systems and methods for improving the ranking of news articles |
JP2005327028A (ja) * | 2004-05-13 | 2005-11-24 | Ricoh Co Ltd | 人材検索システム、プログラムおよび記録媒体 |
KR100462542B1 (ko) * | 2004-05-27 | 2004-12-17 | 엔에이치엔(주) | 신뢰성 있는 컨텐츠를 제공하는 컨텐츠 검색 시스템 및 그방법 |
KR100941140B1 (ko) * | 2007-01-16 | 2010-02-09 | 넷다이버(주) | 블로그의 가치 평가 방법 및 장치 |
KR100928794B1 (ko) * | 2007-05-17 | 2009-11-25 | 엔에이치엔비즈니스플랫폼 주식회사 | 블로그의 영향력에 기반한 ppp 방법 및 시스템 |
KR100892263B1 (ko) * | 2007-08-01 | 2009-04-09 | 주식회사 다음커뮤니케이션 | 카테고리별 키워드 추천 시스템 및 방법 |
-
2009
- 2009-04-30 KR KR1020090038119A patent/KR101050013B1/ko active IP Right Grant
-
2010
- 2010-04-15 JP JP2010093975A patent/JP5497523B2/ja active Active
-
2014
- 2014-03-05 JP JP2014042802A patent/JP5724009B2/ja active Active
-
2015
- 2015-03-30 JP JP2015068780A patent/JP5989170B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171819A (ja) * | 1996-12-06 | 1998-06-26 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2006164086A (ja) * | 2004-12-10 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | オンライン知識検索支援装置、およびオンライン知識検索支援方法 |
JP2008165599A (ja) * | 2006-12-28 | 2008-07-17 | National Institute Of Information & Communication Technology | 風評情報抽出装置及び風評情報抽出方法 |
Non-Patent Citations (4)
Title |
---|
中島伸介 他: "ブロガーの熟知度に基づいたブログランキング方式の提案", 電子情報通信学会 第19回データ工学ワークショップ論文集[ONLINE]DEWS2008 DATA ENGINEERING WORKSHOP MIYA, JPN6013027810, 7 April 2008 (2008-04-07), JP, ISSN: 0002551034 * |
中島伸介 他: "信用度に基づくblog情報フィルタリング", 日本データベース学会LETTERS, vol. 第3巻,第2号, JPN6013027812, 21 September 2004 (2004-09-21), JP, pages 105 - 108, ISSN: 0002551035 * |
中窪仁 他: "Web検索におけるリンク構造解析", 第15回データ工学ワークショップ(DEWS2004)論文集 [ONLINE], JPN6013027814, 18 June 2004 (2004-06-18), JP, ISSN: 0002551036 * |
戸田浩之 他: "目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価", 情報処理学会論文誌, vol. Vol.48,No.SIG14(TOD35), JPN6013027809, 25 September 2007 (2007-09-25), JP, pages 132 - 151, ISSN: 0002551033 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015049892A (ja) * | 2013-08-29 | 2015-03-16 | 富士通株式会社 | キュレーションをランク付けする方法及びシステム |
WO2016178337A1 (ja) * | 2015-05-01 | 2016-11-10 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
US10380125B2 (en) | 2015-05-01 | 2019-08-13 | Sony Corporation | Information processing apparatus and information processing method |
Also Published As
Publication number | Publication date |
---|---|
JP2015144011A (ja) | 2015-08-06 |
JP5724009B2 (ja) | 2015-05-27 |
KR20100119157A (ko) | 2010-11-09 |
JP5497523B2 (ja) | 2014-05-21 |
JP5989170B2 (ja) | 2016-09-07 |
JP2014112433A (ja) | 2014-06-19 |
KR101050013B1 (ko) | 2011-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5989170B2 (ja) | 代表者の信頼度を用いた検索結果順位化装置および方法 | |
US10764353B2 (en) | Automatic genre classification determination of web content to which the web content belongs together with a corresponding genre probability | |
JP4437500B2 (ja) | データをタグ情報に対応付けて管理する技術 | |
JP4936401B2 (ja) | ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム | |
US7937338B2 (en) | System and method for identifying document structure and associated metainformation | |
JP5329540B2 (ja) | ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム | |
JP2007528520A (ja) | 検索エンジンに登録されたウェブサイトを管理するための方法およびシステム | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
KR101011726B1 (ko) | 스니펫 제공 장치 및 방법 | |
US20150081477A1 (en) | Search query analysis device, search query analysis method, and computer-readable recording medium | |
KR101103671B1 (ko) | 사용자의 요청에 대응하여 동적으로 가장 적합한 이미지를 추출하고 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2006309509A (ja) | 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体 | |
JP2007241568A (ja) | 話題画像抽出方法及び装置及びプログラム | |
JP7081155B2 (ja) | 選択プログラム、選択方法、及び選択装置 | |
KR20110112116A (ko) | 화제도 기반의 검색 제공 방법 및 시스템 | |
JP6749865B2 (ja) | 情報収集装置、および、情報収集方法 | |
JP5225331B2 (ja) | データ抽出装置及び方法 | |
JP2007011892A (ja) | 語彙獲得方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP2011086278A (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム | |
JP6303742B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
US9311392B2 (en) | Document analysis apparatus, document analysis method, and computer-readable recording medium | |
CN107784056B (zh) | 页面数据查找方法及装置 | |
JP2008165785A (ja) | 検索システムおよびその方法 | |
Patel et al. | A Survey on Web Content Extraction and Noise Reduction from Webpage | |
JP5289498B2 (ja) | カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5497523 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |