JP2012074034A - 文書ランキングスコアの動的更新のための方法および装置 - Google Patents
文書ランキングスコアの動的更新のための方法および装置 Download PDFInfo
- Publication number
- JP2012074034A JP2012074034A JP2011208611A JP2011208611A JP2012074034A JP 2012074034 A JP2012074034 A JP 2012074034A JP 2011208611 A JP2011208611 A JP 2011208611A JP 2011208611 A JP2011208611 A JP 2011208611A JP 2012074034 A JP2012074034 A JP 2012074034A
- Authority
- JP
- Japan
- Prior art keywords
- document
- score
- word relevance
- relevance score
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Abstract
【解決手段】第1文書と第2文書との間の共通キーワードに対する前記第1文書の第1単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを算出するステップと、前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップと、前記第2単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを更新するステップと、を含み、前記第1文書は前記第2文書へのリンクを含むことを特徴とする文書ランキング決定方法。
【選択図】図7
Description
文書が生成される場合、ユーザに提供しようとする主要情報で本文を構成してもよい。また、文書の本文に対する詳細説明や本文に関連する追加情報は他の文書をリンクに接続する方式により提供されてもよい。ここで、リンクに接続された文書(例えば、文書<Y1>110および文書<Y2>130)とはリンクを含む文書(例えば、文書<X>100)のような主要情報について説明している文書であってもよく、または他の文書における主要情報に関する細部事項を補完説明する文書であってもよく、または単語(例えば、単語A150および単語B160)の詳細説明の文書であってもよい。または場合に応じて、リンクに接続された文書はリンクを含む文書と全く関係のない文書(例えば、文書の内容と関係のない広告)であってもよい。
リンクに接続された文書(例えば、文書<Y1>110、文書<Y2>130)がリンクを含む文書(例えば、文書<X>100)に対する寄与スコアは与えられたクエリに対する2つの文書の単語関連度スコアに基づいて決定されてもよい。
検索結果においては、文書の相対的なランキングが重要であり、ユーザは自身が所望する情報が検索結果を表示するページの1ページ目に表示されることを所望する。例えば、文書ランキング決定システムが上位10位までに該当する文書を1ページ目に表示する場合、ユーザはそれら表示される文書に対して敏感であるが、ランキングが200位から300位までの間に位置する文書については、それらの文書をいずれも重要ではないものとして、その間のランキングの差に関心を示さないことが考えられる。
(2)各リンクの寄与係数を更新する。
(3)各文書は数6によって算出された追加寄与スコアを伝達する。
(4)スコア伝達反復作業を再開する。
810 寄与係数算出部
820 単語関連度スコア算出部
830 寄与スコア算出部
840 単語関連度スコア変更部
850 文書ランキングスコア算出部
Claims (25)
- 第1文書と第2文書との間の共通キーワードに対する前記第1文書の第1単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを算出するステップと、
前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップと、
前記第2単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを更新するステップと、
を含み、
前記第1文書は前記第2文書へのリンクを含むことを特徴とする文書ランキング決定方法。 - 第1文書と第2文書との共通キーワードに対する第1単語関連度スコアに基づいて第2文書の文書ランキングスコアを算出するステップは、
前記共通キーワードに対する第1寄与係数および前記第1単語関連度スコアに基づいて第1寄与スコアを算出するステップと、
前記第1寄与スコアを第2文書の前記共通キーワードに対する文書ランキングスコアに反映するステップと、
を含み、
前記第2単語関連度スコアに基づいて第2文書の文書ランキングスコアを更新するステップは、
前記共通キーワードに対する第2寄与係数を算出するステップと、
前記第1寄与係数、前記第1単語関連度スコア、前記第2寄与係数、および前記第2単語関連度スコアに基づいて第2寄与スコアを算出するステップと、
前記第2寄与スコアを前記第2文書の前記文書ランキングスコアに反映するステップと、
を含むことを特徴とする請求項1に記載の文書ランキング決定方法。 - 前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップは、前記第1文書の内容が変更されるステップを含み、
前記第1単語関連度スコアは、前記第1文書の内容が変更される前の前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであり、前記第2単語関連度スコアは前記第1文書の内容が変更された後の前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項1または2に記載の文書ランキング決定方法。 - 前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップは、前記第1文書の内容が生成されるステップを含み、
前記第2単語関連度スコアは、前記生成された内容における前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項1から3のいずれかに記載の文書ランキング決定方法。 - 前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップは、前記第1文書の内容が削除されるステップを含み、
前記第1単語関連度スコアは、前記第1文書の内容が削除された後の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項1から4のいずれかに記載の文書ランキング決定方法。 - 前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップは、前記リンクが生成されるステップを含み、
前記第2単語関連度スコアは、前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであり、前記第1単語関連度スコアが前記第2単語関連度スコアに変更されるとみなすことによって前記リンクの生成を反映することを特徴とする請求項1から5のいずれかに記載の文書ランキング決定方法。 - 前記第1単語関連度スコアを第2単語関連度スコアに動的に変更するステップは、前記リンクが削除されるステップを含み、
前記第1単語関連度スコアは、前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであり、前記第1単語関連度スコアが前記第2単語関連度スコアに変更されるとみなすことによって前記リンクの削除を反映することを特徴とする請求項1から6のいずれかに記載の文書ランキング決定方法。 - 前記第1単語関連度スコアおよび前記第2単語関連度スコアは、前記第1文書の内容と前記共通キーワードとの間の関連性に基づいて算出されることを特徴とする請求項1から7のいずれかに記載の文書ランキング決定方法。
- 前記第1寄与係数および前記第2寄与係数は、前記共通キーワードにおいて前記第2文書が前記第1文書の内容に寄与する係数であることを特徴とする請求項2から8のいずれかに記載の文書ランキング決定方法。
- 前記第1文書が含む各単語について、前記第1文書の前記単語に対する単語関連度スコアを算出するステップと、
前記第1文書のキーワードおよび前記第2文書のキーワードを抽出するステップと、
前記第1文書と前記第2文書との間の前記共通キーワードを抽出するステップと
をさらに含むことを特徴とする請求項1から9のいずれかに記載の文書ランキング決定方法。 - 前記第1文書への経路の開始文書である第3文書に対する、前記経路を通じた前記第1文書の寄与スコアおよび前記第1寄与係数に基づいて第3寄与スコアを算出するステップをさらに含むことを特徴とする請求項2から10のいずれかに記載の文書ランキング決定方法。
- 前記第2文書の文書ランキングスコアは、前記共通キーワードに対する前記第2文書の単語関連度スコア、前記第1寄与スコア、前記第2寄与スコア、および前記第3寄与スコアに基づいて決定されることを特徴とする請求項11に記載の文書ランキング決定方法。
- 前記文書ランキングスコアに基づいて前記第2文書の文書ランキングを決定するステップをさらに含むことを特徴とする請求項1から12のいずれかに記載の文書ランキング決定方法。
- 請求項1から13のいずれかに記載の方法を実行するためのプログラムが記録されたコンピュータで読み出し可能な記録媒体。
- 第1文書と第2文書との間の共通キーワードに対する前記第1文書の第1単語関連度スコアおよび前記共通キーワードに対する前記第1文書の第2単語関連度スコアを算出する単語関連度スコア算出部と、
前記第1単語関連度スコアを前記第2単語関連度スコアに変更する単語関連度スコア変更部と、
第1単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを算出し、前記第2単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを更新する文書ランキングスコア算出部と
を備え、
前記第1文書は前記第2文書へのリンクを含むことを特徴とする文書ランキング決定装置。 - 前記共通キーワードに対する第1寄与係数および第2寄与係数を算出する寄与係数算出部と、
前記第1寄与係数および前記第1単語関連度スコアに基づいて第1寄与スコアを算出し、前記第1寄与係数、前記第1単語関連度スコア、第2寄与係数、および前記第2単語関連度スコアに基づいて第2寄与スコアを算出する寄与スコア算出部と
をさらに備え、
前記文書ランキングスコア算出部は、前記第1寄与スコアを前記第2文書の前記共通キーワードに対する文書ランキングスコアに反映することによって前記第1単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを算出し、前記第2寄与スコアを前記第2文書の前記文書ランキングスコアに反映することによって前記第2単語関連度スコアに基づいて前記第2文書の文書ランキングスコアを更新することを特徴とする請求項15に記載の文書ランキング決定装置。 - 前記単語関連度スコア変更部は、前記第1文書の内容が変更される場合に前記第1単語関連度スコアを前記第2単語関連度スコアに変更し、
前記第1単語関連度スコアは、前記第1文書の内容が変更される前の前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであり、前記第2単語関連度スコアは、前記第1文書の内容が変更された後の前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項15または16に記載の文書ランキング決定装置。 - 前記単語関連度スコア変更部は、前記第1文書の内容が生成される場合に前記第1単語関連度スコアを前記第2単語関連度スコアに変更し、
前記第2単語関連度スコアは、前記生成された第1文書の内容の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項15から17のいずれかに記載の文書ランキング決定装置。 - 前記単語関連度スコア変更部は、前記第1文書の内容が削除される場合に前記第1単語関連度スコアを前記第2単語関連度スコアに変更し、
前記第1単語関連度スコアは、前記第1文書の内容が削除された後の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項15から18のいずれかに記載の文書ランキング決定装置。 - 前記単語関連度スコア変更部は、前記リンクが生成される場合に前記第1単語関連度スコアが前記第2単語関連度スコアに変更されたものとみなすことによって前記リンクの生成を反映し、
前記第2単語関連度スコアは、前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項15から19のいずれかに記載の文書ランキング決定装置。 - 前記単語関連度スコア変更部は、前記リンクが削除される場合に前記第1単語関連度スコアが前記第2単語関連度スコアに変更されたものとみなすことによって前記リンクの削除を反映し、
前記第1単語関連度スコアは、前記第1文書の内容の前記共通キーワードに対する単語関連度スコアであることを特徴とする請求項15から20のいずれかに記載の文書ランキング決定装置。 - 前記第1文書のキーワードおよび前記第2文書のキーワードを抽出し、前記第1文書と前記第2文書との間の前記共通キーワードを抽出する共通キーワード抽出部をさらに備え、
前記単語関連度スコア算出部は、前記第1文書が含む各単語に対して前記第1文書の前記単語に対する単語関連度スコアを算出することを特徴とする請求項15から21のいずれかに記載の文書ランキング決定装置。 - 前記寄与スコア算出部は、前記第1文書への経路の開始文書である第3文書に対する、前記経路を通じた前記第1文書の寄与スコアおよび前記第1寄与係数に基づいて第3寄与スコアを算出し、
前記文書ランキングスコア算出部は、前記第3寄与スコアを前記第2文書の前記文書ランキングスコアに反映することを特徴とする請求項16から22のいずれかに記載の文書ランキング決定装置。 - 前記文書ランキングスコア算出部は、前記共通キーワードに対する前記第2文書の単語関連度スコア、前記第1寄与スコア、前記第2寄与スコア、および前記第3寄与スコアに基づいて前記第2文書の文書ランキングスコアを決定することを特徴とする請求項23に記載の文書ランキング決定装置。
- 前記文書ランキングスコアに基づいて前記第2文書の文書ランキングを決定する文書ランキング決定部をさらに備えることを特徴とする請求項15から24のいずれかに記載の文書ランキング決定装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20100093311A KR101086566B1 (ko) | 2010-09-27 | 2010-09-27 | 문서 순위 점수의 동적 갱신을 위한 방법 및 장치 |
KR10-2010-0093311 | 2010-09-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012074034A true JP2012074034A (ja) | 2012-04-12 |
JP5764448B2 JP5764448B2 (ja) | 2015-08-19 |
Family
ID=45398152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011208611A Expired - Fee Related JP5764448B2 (ja) | 2010-09-27 | 2011-09-26 | 文書ランキングスコアの動的更新のための方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9098567B2 (ja) |
JP (1) | JP5764448B2 (ja) |
KR (1) | KR101086566B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9251146B2 (en) * | 2013-05-10 | 2016-02-02 | International Business Machines Corporation | Altering relevancy of a document and/or a search query |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030050909A1 (en) * | 2001-08-27 | 2003-03-13 | Mihai Preda | Ranking nodes in a graph |
KR20100093804A (ko) * | 2009-02-17 | 2010-08-26 | 엔에이치엔(주) | 기여 점수에 기초한 문서 순위 결정 시스템 및 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3607462B2 (ja) | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
US7505964B2 (en) * | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7958136B1 (en) * | 2008-03-18 | 2011-06-07 | Google Inc. | Systems and methods for identifying similar documents |
-
2010
- 2010-09-27 KR KR20100093311A patent/KR101086566B1/ko active IP Right Grant
-
2011
- 2011-09-23 US US13/243,711 patent/US9098567B2/en active Active
- 2011-09-26 JP JP2011208611A patent/JP5764448B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030050909A1 (en) * | 2001-08-27 | 2003-03-13 | Mihai Preda | Ranking nodes in a graph |
KR20100093804A (ko) * | 2009-02-17 | 2010-08-26 | 엔에이치엔(주) | 기여 점수에 기초한 문서 순위 결정 시스템 및 방법 |
Non-Patent Citations (2)
Title |
---|
CSNB201000256001; 渡辺 隆広: 検索にガンガンヒットさせるSEOの教科書 初版, 20080616, p.56-61,107-109,114-117, 株式会社翔泳社 * |
JPN6013029853; 渡辺 隆広: 検索にガンガンヒットさせるSEOの教科書 初版, 20080616, p.56-61,107-109,114-117, 株式会社翔泳社 * |
Also Published As
Publication number | Publication date |
---|---|
KR101086566B1 (ko) | 2011-11-23 |
US9098567B2 (en) | 2015-08-04 |
JP5764448B2 (ja) | 2015-08-19 |
US20120078920A1 (en) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8417692B2 (en) | Generalized edit distance for queries | |
US20160042298A1 (en) | Content discovery and ingestion | |
JP2009282957A (ja) | 文書処理装置および文書処理方法 | |
KR20080066496A (ko) | 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템 | |
JP5460426B2 (ja) | 生産性評価装置、生産性評価方法およびプログラム | |
JP5968744B2 (ja) | コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体 | |
AU2018250372B2 (en) | Method to construct content based on a content repository | |
JP2014089606A (ja) | 情報処理装置及びその制御方法、プログラム | |
KR20080078930A (ko) | 관심사를 반영하여 추출한 정보 제공 방법 및 시스템 | |
JP4750628B2 (ja) | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR102368043B1 (ko) | 사용자 정의 토픽 모델링을 활용한 사용자 관심 뉴스 추천 장치 및 그 방법 | |
US10146876B2 (en) | Predicting real-time change in organic search ranking of a website | |
US9378248B2 (en) | Retrieval apparatus, retrieval method, and computer-readable recording medium | |
JP5764448B2 (ja) | 文書ランキングスコアの動的更新のための方法および装置 | |
JP6540286B2 (ja) | 業務分析プログラム、装置および方法 | |
JP3967230B2 (ja) | 画像情報表示システム | |
JP5695586B2 (ja) | Xml文書検索装置及びプログラム | |
JP5389683B2 (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
JP2013156876A (ja) | 推薦クエリ抽出装置及び方法及びプログラム | |
JP5410359B2 (ja) | クエリ選択装置及びプログラム | |
JP5147651B2 (ja) | 文書データ内を検索するシステム、方法、およびプログラム | |
US11681870B2 (en) | Reducing latency and improving accuracy of work estimates utilizing natural language processing | |
JP6488399B2 (ja) | 情報提示システム、及び情報提示方法 | |
JP6100863B2 (ja) | 広告特定装置、広告情報のデータ構造、広告特定方法、及びプログラム | |
JP5832495B2 (ja) | 広告特定装置、広告情報のデータ構造、広告特定方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150615 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5764448 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |