JP2010262638A - 代表者の信頼度を用いた検索結果順位化装置および方法 - Google Patents

代表者の信頼度を用いた検索結果順位化装置および方法 Download PDF

Info

Publication number
JP2010262638A
JP2010262638A JP2010093975A JP2010093975A JP2010262638A JP 2010262638 A JP2010262638 A JP 2010262638A JP 2010093975 A JP2010093975 A JP 2010093975A JP 2010093975 A JP2010093975 A JP 2010093975A JP 2010262638 A JP2010262638 A JP 2010262638A
Authority
JP
Japan
Prior art keywords
search result
representative
document
reliability
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010093975A
Other languages
English (en)
Other versions
JP5497523B2 (ja
Inventor
Hae-Jin Lee
ヘジン リー
Joon-Ho Lee
ジュンホ リー
Chang Ho Shin
チャンホ シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2010262638A publication Critical patent/JP2010262638A/ja
Application granted granted Critical
Publication of JP5497523B2 publication Critical patent/JP5497523B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】代表者の信頼度を用いた検索結果順位化装置および方法を提供する。
【解決手段】代表者の信頼度を用いた検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。
【選択図】図1

Description

本発明は、検索クエリに対応した検索結果文書の代表者を抽出して代表者の信頼度を考慮して検索結果文書を順位化する装置および方法に関する。
検索キーワードに対応して検索結果として示されるページには、検索キーワードを主題とするサイト、検索キーワードを内容に含むブログ、カフェ、掲示板、ニュース、ウェブ文書などが掲載される。
このような検索結果を順位化する過程において、該当文書のキーワードとの類似度または該当文書のページランクなどだけを考慮して見たところ、信頼性が不足する文書が検索結果の上段に表示される場合が発生する。これによって、検索キーワードを含んでいたとしても検索意図に適合しない文書が検索結果として表示されるようになり、検索結果の信頼度が保障されない場合が発生する。
これは、検索キーワードを含むそれぞれの文書自体の関連度または人気度だけを考慮して順位化を行うためである。
したがって、ユーザの検索意図により適合し、検索の信頼性を向上させることができる検索結果順位化装置および方法が求められる。
本発明は、検索結果文書に対する代表者を抽出し、前記代表者の信頼度を考慮して前記検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書を優先順位で提供できる検索結果順位化装置および方法を提供する。
本発明は、検索結果文書の代表者に対する信頼度を抽出するために前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法を提供する。
本発明は、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法を提供する。
本発明の一実施形態に係る検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。
また、本発明の一実施形態に係る検索結果順位化装置は、前記代表者抽出部は、前記検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、前記検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出してもよい。
また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。
また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、それぞれの検索クエリに対応して前記代表者の信頼度を算出してもよい。
また、本発明の一実施形態に係る検索結果順位化装置は、前記順位化部は、前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化してもよい。
また、本発明の一実施形態に係る検索結果順位化装置は、前記検索クエリは代表者名を含み、前記順位化部は、前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化してもよい。
本発明の一実施形態に係る検索結果順位化方法は、検索クエリに対する検索結果文書を抽出し、前記検索結果文書に対する代表者を抽出し、前記代表者に対する信頼度を算出し、前記信頼度を考慮して前記検索結果文書を順位化する、ことを含んでもよい。
また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出してもよい。
また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、予め選定された代表者プール(pool)から前記検索結果文書に対応する代表者を抽出してもよい。
本発明の一実施形態によれば、検索結果文書に対する代表者を抽出して、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。
本発明の一実施形態によれば、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法が提供される。
本発明の一実施形態によれば、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。
本発明の一実施形態において、検索結果順位化装置を示すブロック図である。 本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。 本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。 本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。 本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。 本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。 本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。
以下、添付する図面に記載された内容を参照しながら本発明の実施形態を詳細に説明する。ただし、本発明が実施形態によって制限され、限定されることはない。各図面に提示する同一の参照符号は、同一の部材を示す。検索結果順位化方法は、検索結果順位化装置を構成する構成要素によってなされる。
図1は、本発明の一実施形態において、検索結果順位化装置を示すブロック図である。
図1を参照すれば、検索結果順位化装置100は、検索部110と、代表者抽出部120と、信頼度算出部130と、順位化部140と、を含んでもよい。
検索部110は、検索クエリに対する検索結果文書を抽出してもよい。すなわち、検索部110は、ユーザから入力された検索クエリに対応して1つ以上の検索結果文書を抽出してもよい。ここで、検索クエリは、代表者名を含んでもよい。
代表者抽出部120は、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は、検索結果文書の代表サイトと、検索結果文書の情報の出所のうち少なくとも1つであってもよい。一方、代表者抽出は、予め選定された計算方式によって、自動的に抽出されるようにしてもよい。この時、すべての検索結果文書に対して代表者を選定せずに、一定の条件を満足する検索結果文書に対してのみ代表者を抽出するようにしてもよい。例えば、サイトのページランク、ブログランク、訪問者数、下位文書の品質値などを考慮して代表者を抽出する基準を設定し、検索結果文書が含まれるサイトが代表者を抽出する基準以上の値を有する場合にだけ検索結果文書に対する代表者を抽出するようにしてもよい。一例として、ブログランキング300位内のブログに対してのみ代表者を抽出しようとする時、検索結果文書が掲載されたブログが500位のブログランキングを有するのであれば、検索結果文書に対しては代表者を抽出しないようにしてもよい。
代表者抽出の一実施形態について図2を参考にしながら、以下に詳しく説明する。
図2は、本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。
図2を参照すれば、検索結果文書210の種類によって代表者がさまざまに選択される。例えば、検索結果文書210がブログポストである場合、ブログ所有者211を代表者として抽出し、検索結果文書210がカフェの投稿メッセージである場合、カフェ212を代表者として抽出し、検索結果文書210がウェブページの場合、ウェブサイト213を代表者として抽出し、検索結果文書210がニュースである場合、ニュースを提供する報道機関214を代表者として抽出してもよい。すなわち、代表者は、検索結果文書の出所と認識される代表サイト、人、会社などを意味してもよい。
再び図1を参照すれば、代表者は、検索結果文書のURLパターンを分析し、分析したURLパターンを用いて抽出してもよい。例えば、「スポーツ朝鮮」の下位文書は「http://sports.chosun.com」を含むため、「http://sports.chosun.com」を代表者抽出のためのURLとして決定してもよい。したがって、URLの前部が「http://sports.chosun.com」で始まる文書に対しては、すべて「スポーツ朝鮮」を代表者として抽出することができる。すなわち、URL「http://sports.chosun.com」で始まる文書に対しては「スポーツ朝鮮」に対する信頼度に基づいて順位化することができる。
信頼度算出部130は、代表者に対する信頼度を算出してもよい。すなわち、抽出された代表者に対する信頼度を予め選定された方法によって算出して検索結果文書に対する信頼度を推定してもよい。信頼度算出の一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高くなり得る。
また、信頼度算出部130は、予め選定された代表者プール(pool)に含まれた代表者に対してのみ信頼度を算出してもよい。例えば、すべての検索結果文書の代表者に対して信頼度を算出するのではなく、代表者プールに含まれる代表者に対してのみ信頼度を算出してもよい。すなわち、代表者プールに含まれる代表者に対してのみ信頼度を算出することによって、信頼度算出に過度な負荷がかからないようにできる。
順位化部140は、信頼度を考慮して検索結果文書を順位化してもよい。例えば、検索結果文書の代表者に対する信頼度が高いほど、高い順位の検索結果から出力される。この時、信頼度だけでなく、検索結果文書の検索クエリとの類似度、検索結果文書のページランクなどを共に考慮して検索結果文書を順位化してもよい。
一方、検索クエリが代表者名を含む場合、代表者名に対応する代表者を抽出して、代表者と関連する検索結果文書には重みを付与して順位化してもよい。
例えば、ユーザが「KTX釜山」を検索語で入力する場合にKTXが代表者名に分類されて代表者名と関連するサイトである「http://www.korail.com」(以下「コレイル」という)を代表者としてもよい。したがって、代表者名と関連するサイトの下位ページの中に「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書には、重みが付与されて検索結果の上段に位置するようにしてもよい。
上記のように、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供することができる。
図3は、本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。
図3を参照すれば、ユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ310を介してユーザに提供することができる。この時、各検索結果文書は、検索結果文書に対する信頼度は考慮せずに、検索クエリとの類似度、検索結果文書のページランクのうち少なくとも1つを用いて順位化して提供するものであってもよい。図3の場合、ユーザの検索クエリ「旅行情報」に対応する検索結果文書として「韓国観光公社」311、「Tour123」312、「ジオトラベル」313、「ネイバー旅行」314などを順に提供してもよい。この場合、検索クエリと関連する内容が含まれているが、ユーザの所望する情報とは関係が少ない検索結果文書が上位順位に表示されてユーザに提供されることもある。
図4は、本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。
図4を参照すれば、図3のようにユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ410を介してユーザに提供することができる。ここで、複数の検索結果文書は、各検索結果文書の代表者に対する信頼度を考慮して順位化して提供してもよい。図4の場合、検索結果文書として「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などを抽出してもよい。
この時、「韓国観光公社」411に対する代表者は、韓国観光公社自体または韓国観光公社の代表サイトとしてもよい。したがって、韓国観光公社自体または韓国観光公社の代表サイトの信頼度を抽出することができる。ここで、信頼度は数値化して格納してもよく、韓国観光公社411の場合、一例として信頼度「90」を有することもある。
また、「Tour123」412の場合、「Tour123」412の代表サイトまたはサイト運営者を代表者として抽出してもよく、「Tour123」412の代表サイトまたはサイト運営者に対する信頼度を抽出してもよい。この時、「Tour123」412の場合、一例として、信頼度「30」を有することもある。
また、「ジオトラベル」413の場合、「ジオトラベル」413の代表サイトまたはサイト運営者を代表者として抽出してもよく、「ジオトラベル」413の代表サイトまたはサイト運営者に対する信頼度が抽出されてもよい。この時、「ジオトラベル」413の場合、一例として、信頼度「50」を有することもある。
また、「ネイバー旅行」414の場合、ネイバーの代表サイトなどが代表者として抽出されてもよく、ネイバーの代表サイトに対する信頼度が抽出されてもよい。この時、「ネイバー」414の場合、一例として、信頼度「80」を有することもある。
したがって、各検索結果文書の信頼度を考慮して検索結果文書を順位化する場合、図4に示すように、「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などの順序で検索結果を提供してもよい。すなわち、図3の場合のように、信頼度が低い「Tour123」312などが上位ランクに提供されず、「ネイバー旅行」412のような信頼度の高い代表者の下位文書を高い順位で提供してもよい。
図5は、本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。
図5を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ510を介してユーザに提供することができる。この時、複数の検索結果文書は、「KTX」と「釜山」をすべて含む検索結果文書を抽出してユーザに提供してもよい。この場合、代表者名に重みを付与せずにユーザに検索結果文書を提供する場合、地球ツアーの第1下位文書511、地球ツアーの第2下位文書512、oktourの下位文書513、およびユーアンドアイ(UNI)旅行社514の下位文書などを順次提供してもよい。
図6は、本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。
図6を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ610を介してユーザに提供することができる。この時、検索クエリ中「KTX」を代表者名に分類し、代表者名に重みを付与して検索結果文書を順位化してもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むものであってもよい。ここで、代表者名「KTX」に対応する代表者を検出すれば、代表者名「KTX」と関連するサイトのうち代表サイトの「コレイル」を代表者として検出してもよい。したがって、「コレイル」の下位ページのうち「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書に重みを付与して検索結果の上段に表示してもよい。図6の場合、代表者「コレイル」の下位ページのうち「釜山」というキーワードを有する「コレイル」の第1下位文書611および「コレイル」の第2下位文書612が第1順位および第2順位として表示され、代表者が「コレイル」でない地球ツアーの第1下位文書613および地球ツアーの第2下位文書613は、第3順位および第4順位として表示してもよい。
上記のように、検索クエリに代表者名が含まれる場合、代表者名に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供してもよい。
図7は、本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。
図7を参照すれば、ステップ710では検索クエリに対する検索結果文書を抽出してもよい。ここで、検索クエリには代表者名を含んでもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含んでもよい。この場合、代表者名と関連する代表者を抽出して代表者の下位文書が検索結果文書に含まれる場合には、代表者の下位文書は検索結果の上位ランクに表示してユーザに提供してもよい。
ステップ720では、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は予め選定された代表者プール(pool)から抽出してもよい。代表者抽出の一例として、検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、検索結果文書がカフェの投稿メッセージである場合、カフェを代表者として抽出し、検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、検索結果文書がニュースである場合、ニュースを提供する報道機関を代表者として抽出してもよい。また、ステップ720は、検索結果文書のURLパターンを分析して代表者を抽出するための最小URLを決定するステップと、検索結果文書中最小URLを含む文書を分類するステップと、分類された文書に対する代表者を抽出するステップと、を含んでもよい。例えば、検索結果文書のURLパターンを分析して、「http://blog.naver.com/idxxxx」を代表者分類のための最小URLとして決定してもよい。以降、検索結果文書中URLの前部に「http://blog.naver.com/idxxxx」を含む文書を分類して、分類された文書に対してはURLをアドレスとして用いるブログの所有者を代表者として抽出してもよい。以降、「http://blog.naver.com/idxxxx」を含む文書は、ブログ所有者に対する信頼度を考慮して順位化してもよい。
ステップ730では、代表者に対する信頼度を算出してもよい。ここで、信頼度は、一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高まり、代表者の下位文書には検索結果出力時に高い順位を付けて提供してもよい。
ステップ740では、信頼度を考慮して検索結果文書を順位化してもよい。すなわち、信頼度の高い代表者を有する検索結果文書は、高い順位に表示してもよい。また、信頼度を考慮して検索結果文書を順位化する場合、信頼度だけでなく検索クエリとの類似度、検索結果文書のページランクなどを共に考慮してもよい。
一方、図7で説明していない部分は、図1〜図6の説明を参考にすることができる。
上記のように、検索結果文書を順位化して提供するために、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる装置および方法を提供することができる。この時、信頼度だけでなく検索クエリとの類似度、ページランクなどを総合的に考慮することによって、ユーザの検索意図により適合する文書を上位ランクに表示することができる。
また、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出することができる。
なお、本発明の実施形態は、コンピュータにより実現されるさまざまな動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むものであってもよく、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明をさまざまに修正および変更することができることを理解することができる。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
100:検索結果順位化装置
110:検索部
120:代表者抽出部
130:信頼度算出部
140:順位化部

Claims (21)

  1. 検索クエリに対する検索結果文書を抽出する検索部と、
    前記検索結果文書に対する代表者を抽出する代表者抽出部と、
    前記代表者に対する信頼度を算出する信頼度算出部と、
    前記信頼度を用いて前記検索結果文書を順位化する順位化部と、
    を含む、ことを特徴とする検索結果順位化装置。
  2. 前記代表者抽出部は、
    前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
    前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
    前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
    前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項1に記載の検索結果順位化装置。
  3. 前記代表者抽出部は、
    前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。
  4. 前記代表者抽出部は、
    前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。
  5. 前記信頼度算出部は、
    予め選定された代表者プールに含まれる代表者に対して信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
  6. 前記信頼度算出部は、
    前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
  7. 前記信頼度算出部は、
    それぞれの検索クエリに対応して前記代表者の信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
  8. 前記順位化部は、
    前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項1に記載の検索結果順位化装置。
  9. 前記検索クエリは、代表者名を含み、
    前記順位化部は、
    前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項1に記載の検索結果順位化装置。
  10. 前記代表者名は、
    前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項9に記載の検索結果順位化装置。
  11. 検索クエリに対する検索結果文書を抽出し、
    前記検索結果文書に対する代表者を抽出し、
    前記代表者に対する信頼度を算出し、
    前記信頼度を用いて前記検索結果文書を順位化する、
    ことを含むことを特徴とする検索結果順位化方法。
  12. 前記代表者を抽出することは、
    前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
    前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
    前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
    前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項11に記載の検索結果順位化方法。
  13. 前記代表者を抽出することは、
    前記検索結果文書のURLパターンを分析して前記代表者を抽出するための最小URLを決定し、
    前記検索結果文書中前記最小URLを含む文書を分類し、
    前記分類された文書に対する代表者を抽出する、
    ことを含むことを特徴とする請求項11に記載の検索結果順位化方法。
  14. 前記代表者を抽出することは、
    前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項11に記載の検索結果順位化方法。
  15. 前記信頼度を算出することは、
    予め選定された代表者プールに含まれる代表者に対して信頼度を抽出することを特徴とする請求項11に記載の検索結果順位化方法。
  16. 前記信頼度を算出することは、
    前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。
  17. 前記信頼度を算出することは、
    前記検索クエリに対応する前記代表者の信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。
  18. 前記順位化することは、
    前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項11に記載の検索結果順位化方法。
  19. 前記検索結果文書を抽出することは、
    代表者名を含む前記検索クエリに対する検索結果文書を抽出し、
    前記順位化することは、
    前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項11に記載の検索結果順位化方法。
  20. 前記代表者名は、
    前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項19に記載の検索結果順位化方法。
  21. 請求項11乃至請求項20のうちいずれか一項の方法を実行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。

JP2010093975A 2009-04-30 2010-04-15 代表者の信頼度を用いた検索結果順位化装置および方法 Active JP5497523B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090038119A KR101050013B1 (ko) 2009-04-30 2009-04-30 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법
KR10-2009-0038119 2009-04-30

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014042802A Division JP5724009B2 (ja) 2009-04-30 2014-03-05 代表者の信頼度を用いた検索結果順位化装置および方法

Publications (2)

Publication Number Publication Date
JP2010262638A true JP2010262638A (ja) 2010-11-18
JP5497523B2 JP5497523B2 (ja) 2014-05-21

Family

ID=43360614

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010093975A Active JP5497523B2 (ja) 2009-04-30 2010-04-15 代表者の信頼度を用いた検索結果順位化装置および方法
JP2014042802A Active JP5724009B2 (ja) 2009-04-30 2014-03-05 代表者の信頼度を用いた検索結果順位化装置および方法
JP2015068780A Active JP5989170B2 (ja) 2009-04-30 2015-03-30 代表者の信頼度を用いた検索結果順位化装置および方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2014042802A Active JP5724009B2 (ja) 2009-04-30 2014-03-05 代表者の信頼度を用いた検索結果順位化装置および方法
JP2015068780A Active JP5989170B2 (ja) 2009-04-30 2015-03-30 代表者の信頼度を用いた検索結果順位化装置および方法

Country Status (2)

Country Link
JP (3) JP5497523B2 (ja)
KR (1) KR101050013B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049892A (ja) * 2013-08-29 2015-03-16 富士通株式会社 キュレーションをランク付けする方法及びシステム
WO2016178337A1 (ja) * 2015-05-01 2016-11-10 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013162263A1 (ko) * 2012-04-23 2013-10-31 줌인터넷 주식회사 패킷미러링을 이용한 검색대상 랭크 결정 방법 및 시스템
WO2013162265A1 (ko) * 2012-04-23 2013-10-31 줌인터넷 주식회사 패킷미러링을 이용한 순위 정보 제공 방법 및 시스템
CN105488151A (zh) * 2015-11-27 2016-04-13 小米科技有限责任公司 参考文档的推荐方法及装置
JP6577925B2 (ja) * 2016-09-20 2019-09-18 株式会社トヨタマップマスター 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
KR101972660B1 (ko) * 2017-08-18 2019-04-25 주식회사 포스코아이씨티 팩트체크 시스템 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171819A (ja) * 1996-12-06 1998-06-26 Fuji Xerox Co Ltd 情報検索装置
JP2006164086A (ja) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> オンライン知識検索支援装置、およびオンライン知識検索支援方法
JP2008165599A (ja) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology 風評情報抽出装置及び風評情報抽出方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7523051B2 (en) * 2001-05-31 2009-04-21 Sony Corporation Information processing apparatus, information processing method, and program
JP2004192542A (ja) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> 情報推薦装置、情報推薦方法、プログラムおよび記録媒体
US7577655B2 (en) * 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
JP2005327028A (ja) * 2004-05-13 2005-11-24 Ricoh Co Ltd 人材検索システム、プログラムおよび記録媒体
KR100462542B1 (ko) * 2004-05-27 2004-12-17 엔에이치엔(주) 신뢰성 있는 컨텐츠를 제공하는 컨텐츠 검색 시스템 및 그방법
KR100941140B1 (ko) * 2007-01-16 2010-02-09 넷다이버(주) 블로그의 가치 평가 방법 및 장치
KR100928794B1 (ko) * 2007-05-17 2009-11-25 엔에이치엔비즈니스플랫폼 주식회사 블로그의 영향력에 기반한 ppp 방법 및 시스템
KR100892263B1 (ko) * 2007-08-01 2009-04-09 주식회사 다음커뮤니케이션 카테고리별 키워드 추천 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171819A (ja) * 1996-12-06 1998-06-26 Fuji Xerox Co Ltd 情報検索装置
JP2006164086A (ja) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> オンライン知識検索支援装置、およびオンライン知識検索支援方法
JP2008165599A (ja) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology 風評情報抽出装置及び風評情報抽出方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
中島伸介 他: "ブロガーの熟知度に基づいたブログランキング方式の提案", 電子情報通信学会 第19回データ工学ワークショップ論文集[ONLINE]DEWS2008 DATA ENGINEERING WORKSHOP MIYA, JPN6013027810, 7 April 2008 (2008-04-07), JP, ISSN: 0002551034 *
中島伸介 他: "信用度に基づくblog情報フィルタリング", 日本データベース学会LETTERS, vol. 第3巻,第2号, JPN6013027812, 21 September 2004 (2004-09-21), JP, pages 105 - 108, ISSN: 0002551035 *
中窪仁 他: "Web検索におけるリンク構造解析", 第15回データ工学ワークショップ(DEWS2004)論文集 [ONLINE], JPN6013027814, 18 June 2004 (2004-06-18), JP, ISSN: 0002551036 *
戸田浩之 他: "目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価", 情報処理学会論文誌, vol. Vol.48,No.SIG14(TOD35), JPN6013027809, 25 September 2007 (2007-09-25), JP, pages 132 - 151, ISSN: 0002551033 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049892A (ja) * 2013-08-29 2015-03-16 富士通株式会社 キュレーションをランク付けする方法及びシステム
WO2016178337A1 (ja) * 2015-05-01 2016-11-10 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
US10380125B2 (en) 2015-05-01 2019-08-13 Sony Corporation Information processing apparatus and information processing method

Also Published As

Publication number Publication date
JP2015144011A (ja) 2015-08-06
JP5724009B2 (ja) 2015-05-27
KR20100119157A (ko) 2010-11-09
JP5497523B2 (ja) 2014-05-21
JP5989170B2 (ja) 2016-09-07
JP2014112433A (ja) 2014-06-19
KR101050013B1 (ko) 2011-07-19

Similar Documents

Publication Publication Date Title
JP5989170B2 (ja) 代表者の信頼度を用いた検索結果順位化装置および方法
US10764353B2 (en) Automatic genre classification determination of web content to which the web content belongs together with a corresponding genre probability
JP4437500B2 (ja) データをタグ情報に対応付けて管理する技術
JP4936401B2 (ja) ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム
US7937338B2 (en) System and method for identifying document structure and associated metainformation
JP5329540B2 (ja) ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム
JP2007528520A (ja) 検索エンジンに登録されたウェブサイトを管理するための方法およびシステム
US20110208715A1 (en) Automatically mining intents of a group of queries
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
US20150081477A1 (en) Search query analysis device, search query analysis method, and computer-readable recording medium
KR101103671B1 (ko) 사용자의 요청에 대응하여 동적으로 가장 적합한 이미지를 추출하고 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2006309509A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JP2007241568A (ja) 話題画像抽出方法及び装置及びプログラム
JP7081155B2 (ja) 選択プログラム、選択方法、及び選択装置
KR20110112116A (ko) 화제도 기반의 검색 제공 방법 및 시스템
JP6749865B2 (ja) 情報収集装置、および、情報収集方法
JP5225331B2 (ja) データ抽出装置及び方法
JP2007011892A (ja) 語彙獲得方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2011086278A (ja) 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US9311392B2 (en) Document analysis apparatus, document analysis method, and computer-readable recording medium
CN107784056B (zh) 页面数据查找方法及装置
JP2008165785A (ja) 検索システムおよびその方法
Patel et al. A Survey on Web Content Extraction and Noise Reduction from Webpage
JP5289498B2 (ja) カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140306

R150 Certificate of patent or registration of utility model

Ref document number: 5497523

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250