JP2012518221A - 寄与スコアに基づいた文書順位決定システムおよび方法 - Google Patents
寄与スコアに基づいた文書順位決定システムおよび方法 Download PDFInfo
- Publication number
- JP2012518221A JP2012518221A JP2011550048A JP2011550048A JP2012518221A JP 2012518221 A JP2012518221 A JP 2012518221A JP 2011550048 A JP2011550048 A JP 2011550048A JP 2011550048 A JP2011550048 A JP 2011550048A JP 2012518221 A JP2012518221 A JP 2012518221A
- Authority
- JP
- Japan
- Prior art keywords
- document
- contribution
- score
- coefficient
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000009825 accumulation Methods 0.000 claims description 50
- 230000007423 decrease Effects 0.000 description 13
- 238000007781 pre-processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
しかし、文書重要度は単語と常に関連性があるものと見ることができず、検索の正確度が高められた最適化した方法が当然のこととされる。また、ユーザが入力した主題と異なる分野で重要なサイトが最終ランキングの上位に位置する主題移動(Topic Drift)の現象が発生して検索の正確度が低下する恐れがある。
図1に示すように、文書<X>100とリンクされた文書<Y1>101、文書<Z1>102、文書<Y2>103、および文書<Z2>104が図示されている。ここで、文書<X>100、文書<Y1>101、文書<Z1>102は単語A105を含み、文書<X>100、文書<Y2>103、文書<Z2>104は単語B106を含む。
1)ウェブ開発者は、情報が足りない文書を補うため、リンクされた他の文書の情報に基づいて、その文書をリンクに接続してもよい。2)文書がリンクされても、その情報を有する文書からの距離が遠いほど情報の活用度は、減少しても良い。3)接続された2つの文書が含んでいる共通単語の数は2つの文書の関連程度に関連があり、関連のない文書であるほど共通単語の数は少ない。4)検索エンジンユーザは検索結果の1位に敏感であり、ランキングが下降するほどランキングに対する敏感度は落ちる。
一例として、文書順位を決定する時、次のような基本概念を予め定義してもよい。
文書が生成される時、ユーザに提供しようとする主要情報が本文に構成され、本文に対する詳細説明または関連する追加情報は他の文書をリンクを通じた接続により提供されてもよい。ここで、リンクによって接続された文書(図1における文書<Y1>101、文書<Y2>103)はリンクを含む文書(図1における文書<X>100)と同じ主題において記述している文書であるか、細部事項に対して補完説明をする文書、または、単語(図1における単語A105および単語B106)に対する詳細説明文書であってもよい。あるいは、場合に応じて、リンクによって接続された文書は広告のようにリンクを含む文書とは全く関係のない文書であってもよい。
リンクされた文書(図1における文書<Y1>101、文書<Y2>103)がリンクを含んでいる文書(図1における文書<X>100)に対する寄与スコアは、与えられた検索クエリに対する文書<Y1>101及び文書<Y2>103の内容スコアに基づいて決定されてもよい。
2つの文書が与えられた検索クエリに対する関連度が高いほど、リンクされた文書はリンクを含む文書の品質に大きく寄与する。ただし、リンクを含んでいる文書が検索クエリに対して関連度は高いものの、リンクされた文書が検索クエリに対して関連度が低ければ、リンクされた文書はリンクを含む文書の品質に寄与できないことがある。
検索結果において検索された文書の相対的なランキングが重要であり、ユーザは自身の希望する情報が検索結果の初ページに露出されることを所望する。もし、文書順位決定システムが上位1〜10位に該当する文書を出力する場合、ランキングの高い文書になるほど、例えば、ユーザはランキング1位に位置する文書に敏感であるが、ランキング200〜300の間に位置する文書はいずれの位置にあるかを重要と考えない。
図2に示すように、文書順位決定システム200は、内容スコア算出部201、寄与スコア算出部202、蓄積係数算出部203、および順位決定部204を備えてもよく、寄与スコア算出部202は寄与係数決定部205を備えてもよい。
そして、寄与係数決定部205は、第1文書および第2文書が単一のリンクを通じて接続される場合、第1文書の内容スコア、第2文書の内容スコア、および第2文書のアウトリンクに対応する第3文書の内容スコアを用いて第1文書の第2文書に対する寄与係数を決定してもよい。
ここで、寄与係数決定部205は第1文書の内容スコアに比例し、第2文書の内容スコアおよび第3文書の内容スコアに反比例する第1文書の第2文書に対する寄与係数を決定してもよい。
一例として、蓄積係数算出部203は、第1文書の内容スコアと第1文書のアウトリンクに対応する文書の第4文書の内容スコアとを用いて第1文書の蓄積係数を算出してもよい。ここで、第1文書の蓄積係数と第4文書の寄与係数を適用した総和は予め設定された値と同一であってもよい。一例として、予め設定された値は1であってもよい。蓄積係数を算出する具体的な内容は図4に基づいて後述する。
寄与係数決定部205は、共通単語に対して第1文書の第2文書に対する寄与係数を決定してもよい。ここで、寄与係数は第1文書が第2文書の価値に寄与する係数を意味する。
図3には、文書<q>301に複数のd段階のリンク経路を経て文書<p>304に達する文書の集合が図示されている。このようなリンク経路に対応する文書の集合をD(p、d)と仮定する。ここで、文書<p>304が第1文書に対応し、文書<p>304に達する文書の集合が第2文書に対応してもよい。
は単語t305に対して第1文書<p>304の文書順位を算出するための文書順位スコア(C−Rank)を意味する。
は文書<p>304の内容を考慮した単語t305に対して文書<p>304の内容スコアを意味し、
は単語t305に対して第1文書<p>304の第2文書<q>301に対する寄与スコアを意味する。
ここで、
は、文書<p>304がリンク経路をd段階だけ逆にしたときに接する文書<q>301に寄与する寄与係数であり、第1文書<p>304の第2文書<q>301に対する寄与係数を意味する。
はリンク経路に対応する文書<r1>302〜文書<rd−1>303の寄与係数によって決定されてもよい。ここで、リンク経路に対応する文書の寄与係数は、リンクの経路上に隣接する文書間の寄与係数(例えば、<r1>→<r2>のリンクから<r2>の<r1>に対する寄与係数)を用いて決定してもよい。
を決定してもよい。ここで、第2文書<q>301のアウトリンクに対応する第3文書が多いほど、第1文書の第2文書に対する寄与係数は減少してもよい。
が
よりも大きいほど)、第1文書の第2文書に対する寄与係数
は増加してもよい。そして、第2文書<q>301が第1文書<p>301よりも単語t305との関連度が高いほど(すなわち、
が
よりも大きいほど)、第1文書の第2文書に対する寄与係数
は減少してもよい。
において、文書<r>の数が増加するほど)、第1文書の第2文書に対する寄与係数
は減少してもよい。ここで、第3文書は、図3に示す文書<r1>302〜文書<rd−1>303とは別に、第2文書に単語を補完するためにリンクを通じて接続された文書全体を意味する。
である。そして、数1および数2に示すように、文書<p>の文書<q>および文書<r>に対する寄与スコアは、それぞれ
と
である。数3に示すように、文書<p>の文書<r>に対する寄与スコア
は
である。
である。したがって、文書<q>の上位文書(文書<r>)に対する寄与係数
と文書<q>の内容スコア
が分かれば、文書<p>の文書<q>と文書<q>の上位文書(文書<r>)に対する寄与スコア
を把握することができる。
一例として、順位決定部204は、内容スコアおよび寄与スコアに蓄積係数を適用したり(総和不変モデル)、または寄与スコアに蓄積係数を適用して(ハイブリッドモデル)文書順位を決定してもよい。
ここで、
は単語tに対する第1文書<p>の蓄積係数を意味する。蓄積係数算出部203は、第1文書の内容スコア
と第1文書のアウトリンクに対応する文書の第4文書(文書<r>)の内容スコア
を用いて第1文書の蓄積係数を算出してもよい。蓄積係数は、第1文書の第2文書に対する寄与スコアのうち第1文書が直接寄与したスコアの比率を意味する。
ここで、総和不変モデルによると、第1文書<p>402の蓄積係数と第4文書<r1>403〜文書<r4>406の寄与係数を適用した総和が予め設定された値(数6によると1である)と同一であってもよい。ここで、数6によると、文書<p>の蓄積係数および文書<p>のアウトリンクに対応する文書<r>の寄与係数の総和は1である。
したがって、数7によると、文書<p>402にアウトリンクが追加されるほど文書<p>402の文書順位スコアが減少するため、アウトリンクの乱用を防止することができる。
すなわち、数8によると、単語tに対する文書<p>の文書順位スコア
は文書<p>の蓄積係数
の適用された内容スコア
と、文書<p>の蓄積係数
の適用された文書<p>の文書<q>に対する寄与スコア
の和に決定されてもよい。
すなわち、数9によると、単語tに対する文書<p>の文書順位スコア
は、文書<p>の内容スコア
と文書<p>の蓄積係数
の適用された文書<p>の文書<q>に対する寄与スコア
の和に決定されてもよい。
ここで、Tt はハイブリッドモデルで文書順位スコアの総和を意味する。数10によると、ハイブリッドモデルにおいて、全ての文書順位スコアの総和は全ての文書の内容スコアの総和の2倍よりも小さいか同一であることが分かる。
,
,
.
数11において、
は単語tに対する文書<p>の文書順位スコアを意味する。
は単語tに対する文書<p>の内容スコアを意味し、
は単語tに対する文書<p>の蓄積係数、
は単語tに対して段階dを通じて文書<q>にリンクされた文書<p>の文書<q>に対する寄与価値(寄与係数と内容スコアとの積)を意味する。
S1.
算出
S2.
および
算出
S3.
そして
S4.
S5.
S6.
である
に対してS4、S5を繰り返す。全てのpとtに対して
であれば終了。
ここで、S1、S2は前処理過程であり、S3、S4、S5およびS6は反復算出過程を意味する。前処理ステップのS1によると、文書順位決定システムは全ての文書<p>に対して含んでいる単語tに対する内容スコアを算出する。前処理ステップのS2によると、文書順位決定システムは共通単語に対して寄与係数を算出し、共通単語に対して蓄積係数を算出する。
前述したように、基本モデルはインリンク数が増加するほど文書順位は増加するが、アウトリンク数の増減には影響されないモデルを意味する。
ステップS501において、内容スコア算出部201は、文書に含まれた少なくとも1つの単語それぞれに対する文書の内容スコアを算出してもよい。一例として、内容スコア算出部201は、文書の内容と少なくとも1つの単語それぞれの関連性を考慮しての内容スコアを算出してもよい。他の一例として、内容スコア算出部201は、単語に対する文書の類似度、文字の大きさ、文書の長さ、イメージ存在の有無などのような文書の内容から文書の品質を評価した内容スコアを算出してもよい。
このような共通単語に対する寄与係数は、共通単語を含む全ての文書に対して決定されてもよい。
基本モデル使用システムで発生する不正行為として、不正文書によってアウトリンクを追加することで文書の文書順位を増加させる行為を防止するために、総和不変モデルは他の文書に対する寄与スコアのうち自身が直接寄与したスコア(蓄積係数)を内容スコアおよび寄与スコアに反映してもよい。
ステップS606において、順位決定部204は、与えられた単語において文書の寄与スコアに文書の蓄積係数を適用してもよい。ステップS608において、順位決定部204は、蓄積係数が適用された文書の寄与スコアと文書の内容スコアとを合算して文書順位スコアを決定してもよい。これによって、順位決定部204は文書順位スコアを用いて文書順位を決定してもよい。
また、本発明の一実施形態に係る文書順位決定方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータ読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうちの1つまたはその組み合わせを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するよう特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例としては、コンパイラによって生成されるような機械語コード(machine code)だけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コード(higher level code)を含む。上述したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアのレイヤで動作するように構成されてもよい。
したがって、本発明の範囲は、開示された実施形態に限定されて定められるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
201 内容スコア算出部
202 寄与スコア算出部
203 蓄積係数算出部
204 順位決定部
205 寄与係数決定部
ステップS501において、内容スコア算出部201は、文書に含まれた少なくとも1つの単語それぞれに対する文書の内容スコアを算出してもよい。一例として、内容スコア算出部201は、文書の内容と少なくとも1つの単語それぞれの関連性を考慮しての内容スコアを算出してもよい。他の一例として、内容スコア算出部201は、単語に対する文書の類似度、文字の大きさ、文書の長さ、イメージ存在の有無などのような文書の内容から文書の品質を評価した内容スコアを算出してもよい。
ステップS606において、順位決定部204は、与えられた単語において文書の寄与スコアに文書の蓄積係数を適用してもよい。ステップS607において、順位決定部204は、蓄積係数が適用された文書の寄与スコアと文書の内容スコアとを合算して文書順位スコアを決定してもよい。これによって、順位決定部204は文書順位スコアを用いて文書順位を決定してもよい。
Claims (23)
- 文書に含まれた少なくとも1つの単語それぞれに対して前記文書の内容スコアを算出する内容スコア算出部と、
共通単語に対して前記文書の寄与スコアを算出する寄与スコア算出部と、
前記の内容スコアおよび前記寄与スコアを用いて前記少なくとも1つの単語それぞれに対して前記文書順位を決定する順位決定部と、
を備えることを特徴とする文書順位決定システム。 - 前記の内容スコア算出部は、前記文書の内容および前記少なくとも1つの単語それぞれの関連性を考慮して前記の内容スコアを算出することを特徴とする請求項1に記載の文書順位決定システム。
- 前記寄与スコア算出部は、前記共通単語に対して第1文書の第2文書に対する寄与係数を決定する寄与係数決定部を備え、
前記寄与係数は、前記第1文書および第2文書に共通して含まれた前記共通単語に対して、前記第1文書が前記第2文書の価値に寄与する係数であることを特徴とする請求項1に記載の文書順位決定システム。 - 前記寄与スコア算出部は、前記第1文書の前記第2文書に対する寄与係数に前記第2文書の内容スコアを適用して前記第1文書の寄与スコアを算出することを特徴とする請求項3に記載の文書順位決定システム。
- 前記寄与係数決定部は、前記第2文書から前記第1文書に達する複数の段階のリンクを含むリンク経路が存在する場合、前記リンク経路に対応する文書の寄与係数を用いて前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項3に記載の文書順位決定システム。
- 前記寄与係数決定部は、前記第1文書および前記第2文書が1つのリンクに接続される場合、前記第1文書の内容スコア、前記第2文書の内容スコア、および前記第2文書のアウトリンクに対応する第3文書の内容スコアを用いて前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項5に記載の文書順位決定システム。
- 前記寄与係数決定部は、前記第1文書の内容スコアに比例し、前記第2文書の内容スコアおよび前記第3文書の内容スコアに反比例する前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項6に記載の文書順位決定システム。
- 前記共通単語に対して前記第1文書の寄与スコアのうち前記第1文書が直接寄与したスコアの比率である前記第1文書の蓄積係数を算出する蓄積係数算出部をさらに備えることを特徴とする請求項3に記載の文書順位決定システム。
- 前記順位決定部は、前記の内容スコアおよび前記寄与スコアに前記蓄積係数を適用するか、または前記寄与スコアに前記蓄積係数を適用することを特徴とする請求項8に記載の文書順位決定システム。
- 前記蓄積係数算出部は、前記第1文書の内容スコアおよび前記第1文書のアウトリンクに対応する文書の第4文書の内容スコアを用いて前記第1文書の蓄積係数を算出することを特徴とする請求項8に記載の文書順位決定システム。
- 前記第1文書の蓄積係数および前記第4文書の寄与係数を適用した総和が予め設定された値と同一であることを特徴とする請求項10に記載の文書順位決定システム。
- 内容スコア算出部が文書に含まれた少なくとも1つの単語それぞれに対して前記文書の内容スコアを算出することと、
寄与スコア算出部が共通単語に対して前記文書の寄与スコアを算出することと、
順位決定部が前記の内容スコアおよび前記寄与スコアを用いて前記少なくとも1つの単語それぞれに対して前記文書順位を決定することと、
を含むことを特徴とする文書順位決定方法。 - 前記の内容スコア算出部が少なくとも1つの単語それぞれに対して文書の内容スコアを算出することは、前記の内容スコア算出部が前記文書の内容と前記少なくとも1つの単語それぞれの関連性を考慮して前記の内容スコアを算出することを特徴とする請求項12に記載の文書順位決定方法。
- 前記寄与スコア算出部が前記共通単語に対して文書の寄与スコアを算出することは、寄与係数決定部が前記共通単語に対して第1文書の第2文書に対する寄与係数を決定することを含み、
前記寄与係数は、前記第1文書および第2文書に共通して含まれた前記共通単語に対して前記第1文書が前記第2文書の価値に寄与する係数であることを特徴とする請求項12に記載の文書順位決定方法。 - 前記寄与スコア算出部が前記共通単語に対して文書の寄与スコアを算出することは、前記第1文書の前記第2文書に対する寄与係数に前記第2文書の内容スコアを適用して前記第1文書の寄与スコアを算出することを特徴とする請求項14に記載の文書順位決定方法。
- 前記寄与係数決定部が前記共通単語に対して第1文書の第2文書に対する寄与係数を決定することは、前記第2文書から前記第1文書に達する複数の段階のリンクを含むリンク経路が存在する場合、前記リンク経路に対応する文書の寄与係数を用いて前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項14に記載の文書順位決定方法。
- 前記寄与係数決定部が前記共通単語に対して第1文書の第2文書に対する寄与係数を決定することは、前記第1文書および前記第2文書が1つのリンクに接続される場合、前記第1文書の内容スコア、前記第2文書の内容スコア、および前記第2文書のアウトリンクに対応する第3文書の内容スコアを用いて前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項16に記載の文書順位決定方法。
- 前記寄与係数決定部が前記共通単語に対して第1文書の第2文書に対する寄与係数を決定することは、前記第1文書の内容スコアに比例し、前記第2文書の内容スコアおよび前記第3文書の内容スコアに反比例する前記第1文書の第2文書に対する寄与係数を決定することを特徴とする請求項17に記載の文書順位決定方法。
- 蓄積係数算出部が前記共通単語に対して前記第1文書の寄与スコアのうち前記第1文書が直接寄与したスコアの比率である前記第1文書の蓄積係数を算出することをさらに含むことを特徴とする請求項14に記載の文書順位決定方法。
- 前記順位決定部が前記少なくとも1つの単語それぞれに対して前記文書順位を決定することは、前記の内容スコアおよび前記寄与スコアに前記蓄積係数を適用するか、または前記寄与スコアに前記蓄積係数を適用することを特徴とする請求項19に記載の文書順位決定方法。
- 前記蓄積係数算出部が前記第1文書の蓄積係数を算出することは、前記第1文書の内容スコアと前記第1文書のアウトリンクに対応する文書の第4文書の内容スコアを用いて前記第1文書の蓄積係数を算出することを特徴とする請求項19に記載の文書順位決定方法。
- 前記第1文書の蓄積係数および前記第4文書の寄与係数を適用した総和が予め設定された値と同一であることを特徴とする請求項21に記載の文書順位決定方法。
- 請求項12乃至請求項22のいずれか1項の方法を実行するためのプログラムが記録されたコンピュータで読み出し可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2009-0012898 | 2009-02-17 | ||
KR1020090012898A KR101065091B1 (ko) | 2009-02-17 | 2009-02-17 | 기여 점수에 기초한 문서 순위 결정 시스템 및 방법 |
PCT/KR2009/007481 WO2010095807A2 (ko) | 2009-02-17 | 2009-12-15 | 기여 점수에 기초한 문서 순위 결정 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012518221A true JP2012518221A (ja) | 2012-08-09 |
JP5406313B2 JP5406313B2 (ja) | 2014-02-05 |
Family
ID=42634287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011550048A Active JP5406313B2 (ja) | 2009-02-17 | 2009-12-15 | 寄与スコアに基づいた文書順位決定システムおよび方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8838611B2 (ja) |
JP (1) | JP5406313B2 (ja) |
KR (1) | KR101065091B1 (ja) |
WO (1) | WO2010095807A2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101659064B1 (ko) * | 2009-09-03 | 2016-09-22 | 김서준 | 사용자 피드백을 이용하여 컨텐츠에 대한 평가 점수를 산출하기 위한 방법 및 장치 |
KR101086566B1 (ko) * | 2010-09-27 | 2011-11-23 | 엔에이치엔(주) | 문서 순위 점수의 동적 갱신을 위한 방법 및 장치 |
KR101122436B1 (ko) * | 2010-09-30 | 2012-03-09 | 엔에이치엔(주) | 단어의 문서 관련도 점수 및 그래프 구조에 기반한 문서의 키워드 추출 방법 및 장치 |
JP5526209B2 (ja) * | 2012-10-09 | 2014-06-18 | 株式会社Ubic | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム |
US9946800B2 (en) | 2015-07-06 | 2018-04-17 | International Business Machines Corporation | Ranking related objects using blink model based relation strength determinations |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004164290A (ja) * | 2002-11-13 | 2004-06-10 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
JP2007094552A (ja) * | 2005-09-27 | 2007-04-12 | Nippon Telegr & Teleph Corp <Ntt> | コミュニティ抽出装置、コミュニティ抽出方法、プログラム、及び記録媒体 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3607462B2 (ja) | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
KR100378240B1 (ko) * | 2000-08-23 | 2003-03-29 | 학교법인 통진학원 | 엔트로피와 사용자 프로파일을 적용한 문서순위 조정방법 |
US7024408B2 (en) * | 2002-07-03 | 2006-04-04 | Word Data Corp. | Text-classification code, system and method |
US7499919B2 (en) | 2005-09-21 | 2009-03-03 | Microsoft Corporation | Ranking functions using document usage statistics |
KR100898462B1 (ko) | 2007-05-16 | 2009-05-21 | 엔에이치엔(주) | 문서 순위 결정 방법 및 이를 이용한 문서 순위 결정시스템 |
-
2009
- 2009-02-17 KR KR1020090012898A patent/KR101065091B1/ko active IP Right Grant
- 2009-12-15 WO PCT/KR2009/007481 patent/WO2010095807A2/ko active Application Filing
- 2009-12-15 US US13/202,009 patent/US8838611B2/en active Active
- 2009-12-15 JP JP2011550048A patent/JP5406313B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004164290A (ja) * | 2002-11-13 | 2004-06-10 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
JP2007094552A (ja) * | 2005-09-27 | 2007-04-12 | Nippon Telegr & Teleph Corp <Ntt> | コミュニティ抽出装置、コミュニティ抽出方法、プログラム、及び記録媒体 |
Non-Patent Citations (4)
Title |
---|
CSNB201000256001; 渡辺 隆広: 検索にガンガンヒットさせるSEOの教科書 初版, 20080616, p.56-61,107-109,114-117, 株式会社翔泳社 * |
CSNG200701345004; 大塚 浩司: 'HITSアルゴリズムに基づく階層性を考慮したウェブコミュニティの抽出' 電子情報通信学会論文誌 第J90-D巻 第12号, 20071201, p.3161-3169, 社団法人電子情報通信学会 * |
JPN6013029853; 渡辺 隆広: 検索にガンガンヒットさせるSEOの教科書 初版, 20080616, p.56-61,107-109,114-117, 株式会社翔泳社 * |
JPN6013029855; 大塚 浩司: 'HITSアルゴリズムに基づく階層性を考慮したウェブコミュニティの抽出' 電子情報通信学会論文誌 第J90-D巻 第12号, 20071201, p.3161-3169, 社団法人電子情報通信学会 * |
Also Published As
Publication number | Publication date |
---|---|
JP5406313B2 (ja) | 2014-02-05 |
US20110302176A1 (en) | 2011-12-08 |
WO2010095807A2 (ko) | 2010-08-26 |
US8838611B2 (en) | 2014-09-16 |
WO2010095807A3 (ko) | 2010-10-14 |
KR20100093804A (ko) | 2010-08-26 |
KR101065091B1 (ko) | 2011-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6448606B2 (ja) | 検索エンジンの結果ページ内に目的別アプリケーションを提供する装置、方法、プログラム、及びシステム | |
US10289735B2 (en) | Establishing search results and deeplinks using trails | |
US8326842B2 (en) | Semantic table of contents for search results | |
KR101078864B1 (ko) | 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법 | |
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
JP4708436B2 (ja) | 信頼性のある文書の識別 | |
US7698294B2 (en) | Content object indexing using domain knowledge | |
US20090276414A1 (en) | Ranking model adaptation for searching | |
US10108699B2 (en) | Adaptive query suggestion | |
KR20160144384A (ko) | 딥 러닝 모델을 이용한 상황 의존 검색 기법 | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
JP5989170B2 (ja) | 代表者の信頼度を用いた検索結果順位化装置および方法 | |
US10242033B2 (en) | Extrapolative search techniques | |
JP5406313B2 (ja) | 寄与スコアに基づいた文書順位決定システムおよび方法 | |
US8204872B2 (en) | Method and system for instantly expanding a keyterm and computer readable and writable recording medium for storing program for instantly expanding keyterm | |
US9720914B2 (en) | Navigational aid for electronic books and documents | |
JP5133294B2 (ja) | 時空間検索装置及び方法及びプログラム | |
KR100867081B1 (ko) | 도서 검색에 이용되는 문서 스코어를 생성하는 방법 및상기 방법을 수행하는 시스템 | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
KR101371318B1 (ko) | 문서 순위 결정 시스템 및 방법 | |
JP5832869B2 (ja) | カテゴリーマッチングを用いたキーワード抽出システムおよびキーワード抽出方法 | |
US8577899B2 (en) | Detecting duplicates in a shared knowledge base | |
US9864767B1 (en) | Storing term substitution information in an index | |
CN112214511A (zh) | 一种基于wtp-wcd算法的api推荐方法 | |
Ali et al. | Extended structural relevance framework: a framework for evaluating structured document retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5406313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |