JP2011238276A - ブログ文書のランク付け - Google Patents
ブログ文書のランク付け Download PDFInfo
- Publication number
- JP2011238276A JP2011238276A JP2011159731A JP2011159731A JP2011238276A JP 2011238276 A JP2011238276 A JP 2011238276A JP 2011159731 A JP2011159731 A JP 2011159731A JP 2011159731 A JP2011159731 A JP 2011159731A JP 2011238276 A JP2011238276 A JP 2011238276A
- Authority
- JP
- Japan
- Prior art keywords
- blog
- document
- score
- blog document
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】サーチクエリに応答して、ブログ文書のランク付けされた組を提供する。
【解決手段】サーチクエリに対するブログ文書の関連性に基づく関連性得点を生成するステップと、サーチクエリとは無関係のブログ文書の品質に基づき品質得点を生成するステップと、品質得点に基く量だけ関連性得点を調節することによって順位得点を生成するステップを含む。
【選択図】図1
【解決手段】サーチクエリに対するブログ文書の関連性に基づく関連性得点を生成するステップと、サーチクエリとは無関係のブログ文書の品質に基づき品質得点を生成するステップと、品質得点に基く量だけ関連性得点を調節することによって順位得点を生成するステップを含む。
【選択図】図1
Description
発明の分野
この発明の原理と整合する実現例は一般に、情報検索に関し、より具体的には、サーチクエリに応答して、ブログ文書のランク付けされた組を提供することに関する。
この発明の原理と整合する実現例は一般に、情報検索に関し、より具体的には、サーチクエリに応答して、ブログ文書のランク付けされた組を提供することに関する。
発明の背景
ワールドワイドウェブ(World Wide Web)(「ウェブ」)は、大量の情報を含んでいるが、この情報のうちの所望の部分を捜し出すことが難しい場合がある。ウェブ上の情報量と、ウェブのサーチに慣れていない新規のユーザの数とが急速に増えているため、この問題は一層悪化する。
ワールドワイドウェブ(World Wide Web)(「ウェブ」)は、大量の情報を含んでいるが、この情報のうちの所望の部分を捜し出すことが難しい場合がある。ウェブ上の情報量と、ウェブのサーチに慣れていない新規のユーザの数とが急速に増えているため、この問題は一層悪化する。
サーチエンジンは、ユーザが興味を抱くウェブページへのハイパーリンクを返そうとする。一般に、サーチエンジンは、ユーザが入力したサーチ語(サーチクエリと称する)に基づいてユーザの興味を判定する。サーチエンジンの目的は、このサーチクエリに基づき、高品質であって関連性を有する結果(ウェブページ等)へのリンクをユーザに提供することである。一般に、サーチエンジンは、予め格納されたウェブページのコーパスに対し、サーチクエリ内の語を突合せることにより、このことを行なう。ユーザのサーチ語を含むウェブページは、サーチ結果として識別され、リンクとしてユーザに返される。
この数年に、ブログと称される新規の媒体がウェブ上に登場した。ブログ(ウェブログの略)は、投稿(post)と称される新規のジャーナル項目で頻繁に更新されることが一般的な、個人的見解の公表物である。ブログおよびそれらの投稿の内容および品質は、ブログの作者の意図に依存して大きく異なり得る。ブログ作成が普及するにつれ、高品質のブログのサーチ結果を提供する機能が一段と重要になっている。
発明の概要
この発明の原理と整合する一実現例によると、方法は、ブログサーチエンジンにおいてサーチクエリを受取るステップと、サーチクエリに応答してブログ文書を検索するステップと、サーチクエリに対するブログ文書の関連性に基づき、ブログ文書についての第1の得点を求めるステップと、ブログ文書の品質に基づき、第1の得点を変更するステップと、変更された第1の得点に基づき、ブログ文書に関する情報を提供するステップとを含み得る。
この発明の原理と整合する一実現例によると、方法は、ブログサーチエンジンにおいてサーチクエリを受取るステップと、サーチクエリに応答してブログ文書を検索するステップと、サーチクエリに対するブログ文書の関連性に基づき、ブログ文書についての第1の得点を求めるステップと、ブログ文書の品質に基づき、第1の得点を変更するステップと、変更された第1の得点に基づき、ブログ文書に関する情報を提供するステップとを含み得る。
この発明の原理と整合する別の実現例において、コンピュータにより実行される方法は、ブログ文書を獲得するステップと、ブログ文書の品質の肯定的標識またはブログ文書の品質の否定的標識の少なくとも1つを識別するステップと、識別された肯定的標識または否定的標識の少なくとも1つに基づき、ブログ文書についての品質得点を求めるステップとを含む。
この発明の原理と整合するさらに別の実現例において、方法は、ブログサーチエンジンにおいてサーチクエリを受取るステップと、サーチクエリに応答してブログ文書のグループについての得点を求めるステップとを含み、当該得点は、サーチクエリに対するブログ文書のグループの関連性と、ブログ文書のグループの品質とに基づき、当該方法はさらに、求められた得点に基づき、ブログ文書のグループに関する情報を提供するステップを含み得る。
この発明の原理と整合するさらに別の実現例において、方法は、ブログ文書の品質の肯定的標識またはブログ文書の品質の否定的標識の少なくとも1つを識別するステップを含み得、当該識別された肯定的標識または否定的標識の少なくとも1つは、ブログ文書に固有の標識を含み、当該方法はさらに、識別された肯定的標識または否定的標識の少なくとも1つに基づき、ブログ文書についての品質得点を求めるステップと、サーチクエリを受取るステップと、サーチクエリに対するブログ文書の関連性に基づき、ブログ文書についての得点を求めるステップと、品質得点に基づき、ブログ文書の得点を調節するステップと、調節された得点に基づき、ブログ文書に関連する情報を提供するステップとを含み得る。
本明細書に組込まれて本明細書の一部をなす添付の図面は、この発明の実現例を示し、説明と共にこの発明を説明する。
詳細な説明
この発明の原理と整合する実現例についての以下の詳細な説明は、添付の図面を参照する。異なる図面における同じ参照番号は、同じ要素または類似の要素を識別し得る。また、以下の詳細な説明は、この発明を限定しない。
この発明の原理と整合する実現例についての以下の詳細な説明は、添付の図面を参照する。異なる図面における同じ参照番号は、同じ要素または類似の要素を識別し得る。また、以下の詳細な説明は、この発明を限定しない。
概観
この発明の原理と整合するシステムおよび方法は、サーチクエリに応答して提供されるブログの結果の品質を高める。ブログの結果の品質を高めるために、多数の品質係数を用いて、ブログの結果の得点を(肯定的または否定的に)変更することができる。
この発明の原理と整合するシステムおよび方法は、サーチクエリに応答して提供されるブログの結果の品質を高める。ブログの結果の品質を高めるために、多数の品質係数を用いて、ブログの結果の得点を(肯定的または否定的に)変更することができる。
図1は、この発明の原理と整合する概念を示す例示的な図である。図1に示すように、サーチクエリに応答してブログ(またはブログ投稿)の得点を求めるために、2つの別個のデータの組、すなわち、サーチクエリ内の語に対する、ブログ(またはブログ投稿)のトピック上の関連性と、ブログ(またはブログ投稿)の品質とが使用される。この品質は、クエリの語とは無関係である。ブログ(またはブログ投稿)の品質は、当該ブログ(またはブログ投稿)の得点に、肯定的または否定的な影響を及ぼし得る。
以下に使用する「ブログ文書」という句は、ブログ、ブログ投稿、またはブログおよびブログ投稿の両方を含むように広く解釈され得る。本明細書に記載する技術がブログおよびブログ投稿に同等に適用可能であることが認識されるであろう。本明細書で使用される語である「文書」は、機械可読および機械格納可能なあらゆる作業生成物を含むように広く解釈され得る。文書は、たとえば、電子メール、ウェブサイト、ファイル、ファイルの組合せ、他のファイルへの埋込まれたリンクを有する1つ以上のファイル、ニュースグループへの書込、ブログ文書、ウェブ広告等を含み得る。インターネット(Internet)という状況において、共通の文書はウェブページである。ウェブページは、テキスト情報を含むことが多く、埋込まれた情報(たとえばメタ情報、画像、ハイパーリンク等)、および/または、埋込まれた命令(たとえばJava(登録商標)script等)を含み得る。本明細書で使用する語である「リンク」は、或る文書から別の文書または同一文書の別の部分へのあらゆる参照/別の文書または同一文書の別の部分から或る文書へのあらゆる参照を含むように広く解釈され得る。
例示的なネットワーク構成
図2は、この発明の原理と整合するシステムおよび方法が実現され得るネットワーク200の例示的な図である。ネットワーク200は、ネットワーク250を介して多数のサーバ220−240に接続された多数のクライアント210を含み得る。簡略化のために、2つのクライアント210および3つのサーバ220−240がネットワーク250に接続されていることが示される。実際には、より多くの、または、より少ないクライアントおよびサーバが存在してよい。また、場合によっては、クライアントがサーバの機能を果たし、サーバがクライアントの機能を果たすことが考えられる。
図2は、この発明の原理と整合するシステムおよび方法が実現され得るネットワーク200の例示的な図である。ネットワーク200は、ネットワーク250を介して多数のサーバ220−240に接続された多数のクライアント210を含み得る。簡略化のために、2つのクライアント210および3つのサーバ220−240がネットワーク250に接続されていることが示される。実際には、より多くの、または、より少ないクライアントおよびサーバが存在してよい。また、場合によっては、クライアントがサーバの機能を果たし、サーバがクライアントの機能を果たすことが考えられる。
クライアント210は、クライアントエンティティを含み得る。エンティティは、パーソナルコンピュータ、無線式電話、携帯情報端末(PDA)、ラップトップ、もしくは別の種類の計算あるいは通信装置等の装置、これらの装置の1つの上で遂行されるスレッドもしくはプロセス、および/または、これらの装置の1つにより実行可能なオブジェクトとして規定され得る。サーバ220−240は、この発明の原理と整合する態様で文書の収集、処理、サーチ、および/または、維持を行なうサーバエンティティを含み得る。
この発明の原理と整合する実現例において、サーバ220は、クライアント210によって使用可能なサーチエンジン225を含み得る。一実現例において、サーチエンジン225は、ブログ文書のみをサーチするブログサーチエンジンを含み得る。サーバ220は、文書のコーパスを巡回し、文書に索引付けし、文書に関連付けられた情報を文書のリポジトリに格納することができる。サーバ230および240は、サーバ220による巡回または解析が行なわれ得る文書を格納または維持することができる。
サーバ220−240は別のエンティティとして示されているが、1つ以上のサーバ220−240が、別の1つ以上のサーバ220−240の1つ以上の機能を果たすことが可能であり得る。たとえば、2つ以上のサーバ220−240が1つのサーバとして実現されることが可能であり得る。また、サーバ220−240のうちのわずか1つが2つ以上の別の(可能性として分散された)装置として実現されることも可能であり得る。
ネットワーク250は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、公衆交換電話網(Public Switched Telephone Network)(PSTN)等の電話網、イントラネット、インターネット、またはネットワークの組合せを含み得る。クライアント210およびサーバ220−240は、有線、無線、および/または、光学式接続を介してネットワーク250に接続し得る。
例示的なクライアント/サーバのアーキテクチャ
図3は、1つ以上のクライアント210および/またはサーバ220−240に対応し得るクライアントまたはサーバエンティティ(以降、「クライエント/サーバエンティティ」と称する)の例示的な図である。クライアント/サーバエンティティは、バス310、プロセッサ320、メインメモリ330、読出専用メモリ(ROM)340、記憶装置350、入力装置360、出力装置370、および通信インターフェイス380を含み得る。バス310は、クライアント/サーバエンティティの要素間の通信を可能にする経路を含み得る。
図3は、1つ以上のクライアント210および/またはサーバ220−240に対応し得るクライアントまたはサーバエンティティ(以降、「クライエント/サーバエンティティ」と称する)の例示的な図である。クライアント/サーバエンティティは、バス310、プロセッサ320、メインメモリ330、読出専用メモリ(ROM)340、記憶装置350、入力装置360、出力装置370、および通信インターフェイス380を含み得る。バス310は、クライアント/サーバエンティティの要素間の通信を可能にする経路を含み得る。
プロセッサ320は、プロセッサ、マイクロプロセッサ、または、命令の解釈および実行が可能な処理論理を含み得る。メインメモリ330は、ランダムアクセスメモリ(RAM)か、または、プロセッサ320による実行のための情報および命令を格納し得る別の種類の動的記憶装置を含み得る。ROM340は、ROM装置か、または、プロセッサ320による使用のための静的情報および命令を格納し得る別の種類の静的記憶装置を含み得る。記憶装置350は、磁気および/または光学記録媒体と、その対応装置とを含み得る。
入力装置360は、オペレータによる、クライアント/サーバエンティティへの情報の入力を可能にする機構、たとえば、キーボード、マウス、ペン、音声認識および/またはバイオメトリック機構等を含み得る。出力装置370は、ディスプレイ、プリンタ、スピーカ等を含む、オペレータに情報を出力する機構を含み得る。通信インターフェイス380は、クライアント/サーバエンティティによる、他の装置および/またはシステムとの通信を可能にする、送受信機様のあらゆる機構を含み得る。たとえば、通信インターフェイス380は、ネットワーク250等のネットワークを介して別の装置またはシステムと通信するための機構を含み得る。
以下により詳細に説明するように、この発明の原理と整合するクライアント/サーバエンティティは、或る文書の処理に関する動作を実行することができる。クライアント/サーバエンティティは、メモリ330等のコンピュータ可読媒体に含まれるソフトウェア命令をプロセッサ320が実行することに応答して、これらの動作を実行することができる。コンピュータ可読媒体は、物理的または論理的なメモリ装置および/または搬送波として規定され得る。
ソフトウェア命令は、データ記憶装置350等の別のコンピュータ可読媒体から、または、別の装置から、通信インターフェイス380を介してメモリ330内に読出され得る。メモリ330に含まれるソフトウェア命令は、プロセッサ320に対し、以下に説明するプロセスを実施させることができる。代替的に、ソフトウェア命令の代わりに、またはソフトウェア命令と組合せて、ハードワイヤード回路素子を用いて、この発明の原理と整合するプロセスを実現することができる。したがって、この発明の原理と整合する実現例は、ハードウェア回路素子およびソフトウェアのいずれの特定の組合せにも限定されない。
例示的なコンピュータ可読媒体
図4は、サーバ220によって使用され得る例示的なコンピュータ可読媒体400の一部の図である。一実現例において、コンピュータ可読媒体400は、サーバ220のメモリ330に対応し得る。図4に示すコンピュータ可読媒体400の一部は、オペレーティングシステム410とブログ品質ソフトウェア420とを含み得る。
図4は、サーバ220によって使用され得る例示的なコンピュータ可読媒体400の一部の図である。一実現例において、コンピュータ可読媒体400は、サーバ220のメモリ330に対応し得る。図4に示すコンピュータ可読媒体400の一部は、オペレーティングシステム410とブログ品質ソフトウェア420とを含み得る。
オペレーティングシステム410は、Windows(登録商標)、Unix(登録商標)、またはLinux(登録商標)オペレーティングシステム等のオペレーティングシステムソフトウェアを含み得る。ブログ品質ソフトウェア420は、ブログ文書に関するデータを受取り、かつ、このデータに基づいて当該ブログ文書についての品質得点を求めるソフトウェアを含み得る。以下にさらに詳細に説明するように、データは、ブログ文書の内容が低品質である可能性を測定する信号を含み得、このことは、候補結果としてのブログ文書の降格または排除を生じる。データはまた、ブログ文書の内容が高品質/人気を有する可能性を測定する信号も含み得、このことは、候補結果としてのブログ文書の昇格を生じる。
図5は、この発明の原理と整合する実現例においてサーバ220に関連付けられ得る例示的なデータベース500である。データベース500は、サーバ220においてローカルに、たとえば、メインメモリ330もしくは記憶装置350に格納され得、または、サーバ220の外部に、たとえば、考え得る遠隔地に格納され得る。例示するように、データベース500は、以下の例示的なフィールド、すなわち、文書識別(ID)フィールド510と品質得点フィールド520とを含み得る。データベース500が、図5に示すもの以外のフィールドを含み得ることが認識されるであろう。
文書IDフィールド510は、ブログ文書を識別する情報を格納することができ、このブログ文書は、上記のとおり、ブログまたはブログ投稿であり得る。この情報は、一意の識別子を含み得る。品質得点フィールド520は、フィールド510で識別された各ブログ文書についての品質得点を格納し得る。データベース500は、サーバ220により受取られたサーチクエリに応答してアクセスされ得る。サーバ220は、フィールド520からの品質得点に基づき、サーチ結果の組から、ブログ文書(すなわちブログおよび/または投稿)の昇格、降格、または排除すら行なうことができる。
ブログ文書についての品質得点の決定
図6は、この発明の原理と整合する実現例において、ブログ文書についての品質得点を求めるための例示的なプロセスのフローチャートである。処理は、得点化されるべきブログ文書についての情報を獲得すること(活動610)により開始し得る。情報は、ブログ自体、投稿、ブログからのメタデータ、および/または、ブログ文書に関連付けられた1つ以上のフィード(feed)を含み得る。
図6は、この発明の原理と整合する実現例において、ブログ文書についての品質得点を求めるための例示的なプロセスのフローチャートである。処理は、得点化されるべきブログ文書についての情報を獲得すること(活動610)により開始し得る。情報は、ブログ自体、投稿、ブログからのメタデータ、および/または、ブログ文書に関連付けられた1つ以上のフィード(feed)を含み得る。
ブログ文書の品質についての肯定的標識が識別され得る(活動620)。このような標識は、ブログ文書の人気、ブログ文書の暗示された人気、ブログロールにおけるブログ文書の存在、高品質のブログロールにおけるブログ文書の存在、ブログ文書のタグ付け、他のソースによるブログ文書への言及、および、ブログ文書のページランク(登録商標)を含み得る。他の標識が使用されても良いことが認識されるであろう。
ブログ文書の人気は、そのブログ文書の品質の肯定的表示であり得る。多数のニュースアグリゲータサイト(一般には「ニュースリーダ」または「フィードリーダ」と称する)が存在し、ここでは、個人がブログ文書に(そのフィードを介して)申込みを行ない得る。このようなアグリゲータは、所定のブログ文書に申込みを行なった個人の数を記述する情報を格納する。極めて多くの数の申込契約を有するブログ文書は、そのブログ文書についてのより高い品質を暗示する。また、申込契約は、申込みを行なった一意のユーザを検証するか、または、申込者の一意のインターネットプロトコル(Internet Protocol)(IP)アドレスをフィルタ処理することにより、「申込契約スパム」(スパム発信者が、自身のブログ文書を「より人気のある」ものにしようと自身のブログ文書に申込みを行なう)に備えて検証され得る。
ブログ文書に対し、暗示された人気が識別され得る。この暗示された人気は、たとえば、サーチ結果のクリックストリームを調査することにより識別され得る。たとえば、或るブログ文書が、結果の組の中に出現したときに他のブログ文書よりも多くクリックされた場合、このことは、当該ブログ文書に人気があることの表示となり得、すなわち、ブログ文書の品質の肯定的標識となり得る。
ブログロール内のブログ文書の存在は、当該ブログ文書の品質の肯定的表示となり得る。ブログ文書がしばしば、最新のエントリ(すなわち投稿)だけでなく、「ブログロール」も含むことが認識されるであろう。これらのブログロールは、作者/ブロガーが興味を抱く外部サイト(通常他のブログ)へのリンクが高密度に集まったものである。ブログ文書へのブログロールのリンクは、そのブログ文書の人気の表示であり、したがって、ブログ文書への集約されたブログロールのリンクの数を数えて使用し、当該ブログ文書に対する人気の大きさを推論することができる。
高品質のブログロールにおけるブログ文書の存在は、そのブログ文書の品質の肯定的表示となり得る。高品質のブログロールは、周知のブロガーまたは信頼できるブロガーにリンクするブログロールである。したがって、当該ブログ文書にもリンクする高品質のブログロールは、当該ブログ文書の品質の肯定的標識である。
同様に、周知のブロガーまたは信頼できるブロガーのブログロール内にブログ文書が存在することもまた、当該ブログ文書の品質の肯定的表示となり得る。この状況において、周知のブロガーまたは信頼できるブロガーは、スパム発信を行なうブロガーにリンクしないものと仮定される。
ブログ文書のタグ付けは、当該ブログ文書の品質の肯定的表示となり得る。いくつかの既存のサイトは、ユーザがブログ文書に「タグ」を付けること(すなわち、「類別すること」)を許可する。このような特化された類別は、個人が当該ブログ文書の内容を評価し、1つ以上のカテゴリがその内容を適切に記載していると判断したことの標識であり、したがって、当該ブログ文書の品質の肯定的標識である。
他のソースによるブログ文書への言及は、当該ブログ文書の品質の肯定的表示となり得る。たとえば、電子メールまたはチャットの翻音の内容は、ブログ文書のURLを含み得る。当該ブログ文書への言及を含む電子メールまたはチャット議論は、当該ブログ文書の品質の肯定的標識である。
ブログ文書のページランク(登録商標)は、当該ブログ文書の品質の肯定的標識となり得る。高いページランク(登録商標)(正規のウェブページに関して通常計算される信号)は、高品質の標識であり、したがって、ブログ文書の品質の肯定的表示としてブログ文書に適用され得る。実現例によっては、ブログ文書(たとえば投稿)がページランク(登録商標)に関連付けられ得ない場合がある(たとえば、その投稿が新規であるとき)。このような情況において、新規の投稿は、この新規の投稿に対する独自のページランク(登録商標)が決定される時まで、関連付けられているブログのページランク(登録商標)を継承することができる。この継承されたページランク(登録商標)は、新規の投稿の品質の肯定的表示として働き得る。
ブログ文書の品質についての否定的標識が識別され得る(活動630)。このような標識は、ブログ文書に対する新規の投稿の頻度、ブログ文書内の投稿の内容、ブログ文書内の投稿のサイズ、ブログ文書のリンクの分布、および、ブログ文書内の広告の存在を含み得る。他の標識を使用してもよいことが認識されるであろう。
ブログ文書に新規の投稿が追加される頻度は、そのブログ文書の品質の否定的表示となり得る。フィードは一般に、ブログ文書からの最新の投稿のみを含む。スパム発信者はしばしば、新規の投稿を猛烈に生成する(すなわち、多くの新規の投稿が短時間に出現する)か、または、予測可能な間隔(10分ごとに1つの投稿、もしくは、3時間ごとの32分において1つの投稿)で新規の投稿を生成する。これらの挙動はいずれも、悪意に相関し、考え得るスパム発信者を識別するために使用され得る。したがって、ブログ文書に新規の投稿が追加される頻度が予測可能なパターンに一致すると、これは、当該ブログ文書の品質の否定的表示となり得る。
ブログ文書内の投稿の内容は、そのブログ文書の品質の否定的表示となり得る。フィードは一般に、所定のブログ文書からのいくつかの投稿の内容の一部またはすべてを含む。ブログ文書自体もまた、投稿の内容を含む。スパム発信者は、サーチ結果におけるランクを上げるために、内容の或るバージョンをフィード内に挿入することが考えられ、その一方で、それらのブログ文書には異なるバージョンを挿入する(たとえば、関係のない広告へのリンク)。したがって、このような(フィードとブログ文書との)不一致は、当該ブログ文書の品質の否定的表示となり得る。
また場合によっては、特定の内容がブログ文書内の多数の投稿において複製され得、同一の内容を含む多数のフィードが生じる場合がある。このような複製は、そのフィードが低品質/スパムであることを示し、したがって、当該ブログ文書の品質の否定的表示となり得る。
ブログ文書の投稿において使用される単語/句もまた、そのブログ文書の品質の否定的表示となり得る。たとえば、評価者がスパムとみなすブログ文書およびフィードの集合から、スパムにおいて頻繁に出現する単語および句(バイグラム、トリグラム等)のリストを抽出することができる。ブログ文書が、このリストから高い割合の単語または句を含む場合、これは、当該ブログ文書の品質の否定的表示となり得る。
ブログ文書内の投稿のサイズは、当該ブログ文書の品質の否定的表示となり得る。多くの自動化された投稿生成器は、同一の長さまたは極めてよく似た長さの多数の投稿を作成する。その結果、投稿のサイズの分布を、スパム度数(spamminess)についての信頼できる測度として使用することができる。ブログ文書が同一の長さまたは極めてよく似た長さの多数の投稿を含む場合、これは、当該ブログ文書の品質の否定的表示となり得る。
ブログ文書のリンクの分布は、ブログ文書の品質の否定的表示となり得る。上で開示したように、投稿によっては、特定のブログ文書のページランク(登録商標)を上げるために作成されるものもある。場合によっては、投稿またはブログ文書からのすべてのリンクのうちの高い割合のリンクが、すべて、1つのウェブページまたは1つの外部サイトのいずれかを指すことがある。いずれかの1つの外部サイトへの多数のリンクがしきい値を超えた場合、これは、そのブログ文書の品質の否定的表示となり得る。
ブログ文書内の広告の存在は、当該ブログ文書の品質の否定的表示となり得る。ブログ文書が多数の広告を含む場合、これは、当該ブログ文書の品質の否定的表示となり得る。
さらに、ブログ文書は一般に、3種類の内容、すなわち、最新の投稿の内容、ブログロール、および、ブログメタデータ(たとえば、作者プロファイル情報および/または当該ブログ文書もしくはその作者に関する他の情報)を含む。広告が存在する場合、その広告は一般に、ブログメタデータのセクション内またはブログロール付近に出現する。ブログ文書の最新の投稿部分に広告が存在することは、当該ブログ文書の品質の否定的表示となり得る。
ブログ文書についての品質得点が、これらの標識に基づいて求められ得る(活動640)。たとえば、一実現例において、ブログ文書についての品質得点は、異なる標識に重みを割当て、それらの重みを組合せて品質得点を獲得することにより、求められ得る。標識は、あらゆる態様で組合せられ得、および/または、重み付けされ得る。たとえば、この発明の原理と整合する一実現例において、各標識には、正の値または負の値が与えられ得る。これらの値を共に加算して、そのブログ文書についての品質得点を求めることができる。代替的に、各標識値は、対応する係数(または重み)で乗算され得、結果的に得られた値を合計して、当該ブログ文書についての品質得点を求めることができる。品質得点を求めるための他の技術を代替的に使用することができる。
ブログ文書についての品質得点が一旦求められると、この品質得点は、当該ブログ文書に関連付けられ得る。たとえば、品質得点は、データベース500等のデータベースにおいて、得点が求められたブログ文書を識別する情報に関連付けられ得る。この態様で、データベース500には、ブログ文書についての品質得点が読込まれ得る。品質得点は、定期的に更新され得る。
サーチ結果の提示
図7は、サーチ結果を提示するための例示的なプロセスのフローチャートである。一実現例において、図7の処理は、サーバ220内の1つ以上のソフトウェアおよび/またはハードウェア構成要素により実施され得る。別の実現例において、この処理は、別の装置内か、または、サーバ220とは別の装置のグループ内もしくはサーバ220を含む装置のグループ内の1つ以上のソフトウェアおよび/またはハードウェア構成要素により実施され得る。
図7は、サーチ結果を提示するための例示的なプロセスのフローチャートである。一実現例において、図7の処理は、サーバ220内の1つ以上のソフトウェアおよび/またはハードウェア構成要素により実施され得る。別の実現例において、この処理は、別の装置内か、または、サーバ220とは別の装置のグループ内もしくはサーバ220を含む装置のグループ内の1つ以上のソフトウェアおよび/またはハードウェア構成要素により実施され得る。
処理は、サーチクエリが受取られること(活動710)により開始し得る。たとえば、ユーザは、サーチエンジンに関連付けられたサーチボックス内にサーチクエリを提供する(たとえば、サーチエンジンインターフェイス内またはアドオンツールバーのサーチボックス内にサーチ語を入力する)ことができる。ウェブブラウザ(またはアドオンツールバー)は、サーバ220に関連付けられたサーチエンジン225等のサーチエンジンに対し、サーチクエリを送ることができる。
1組の文書についての関連性の得点が、サーチクエリに基づき求められ得る(活動720)。たとえば、サーバ220は、文書についての情報検索(IR)得点を求めることができる。文書についてのIR得点は、文書の内容に対するサーチクエリのサーチ語の突合せに基づいて求められ得る。文書についてのIR得点を求めるために使用され得る多数の公知の技術が存在する。たとえば、IR得点は、文書内におけるサーチ語の出現の数に基づいて求められ得る。代替的に、または加えて、IR得点は、サーチ語が文書内で出現する場所(たとえばタイトル、内容等)、または、サーチ語の特性(たとえばフォント、サイズ、色等)に基づき求められ得る。代替的に、または加えて、サーチ語は、多数のサーチ語が存在する場合、別のサーチ語とは異なる態様で重み付けされ得る。代替的に、または加えて、多数のサーチ語が存在する場合のサーチ語の近似性は、IR得点に影響を及ぼし得る。文書についてのIR得点を求めるためのさらに別の技術が、当業者には公知である。
文書についての総合得点が、文書の品質に基づいて求められ得る(活動730)。たとえば、各文書についてのIR得点を、その文書の品質得点と組合せて、総合得点を求めることができる。得点を組合せることにより、文書についてのIR得点が、品質得点に基づいて調節され得、それにより、得点を上昇もしくは下降させ、または、場合によっては得点がそのまま維持されて、総合得点が得られる。代替的に、文書は、IR得点を生成することなく、品質得点にのみ基づいて得点化され得る。いずれの場合も、総合得点は、品質得点を用いることにより、文書に対して求められ得る。
文書のランク付けされた組が、文書についての総合得点に基づき、ユーザに提供され得る(活動740)。このようにして、文書の品質を用いて、ユーザに提供されるサーチ結果を改良することができる。
例
以下の例は、上記の処理を示す。ユーザがファンタジーフットボール(fantasy football)に関するブログに興味を抱いているものと仮定されたい。ユーザは、サーチエンジン225等のサーチエンジンに対し、サーチクエリ「ファンタジーフットボール」を提出し得る。それに応答して、サーチエンジン225が、(たとえばIR技術を用いて)そのサーチクエリに対する関連性に基づき、ブログ文書のグループを検索するものと仮定されたい。
以下の例は、上記の処理を示す。ユーザがファンタジーフットボール(fantasy football)に関するブログに興味を抱いているものと仮定されたい。ユーザは、サーチエンジン225等のサーチエンジンに対し、サーチクエリ「ファンタジーフットボール」を提出し得る。それに応答して、サーチエンジン225が、(たとえばIR技術を用いて)そのサーチクエリに対する関連性に基づき、ブログ文書のグループを検索するものと仮定されたい。
図8は、サーチクエリに応答して受取られたブログ文書の例示的な組の図である。示すように、サーチエンジン225は、以下の関連性(またはIR)の得点を有する5個のブログ文書(ブログ文書1−5)を検索した。すなわち、ブログ文書1は、1.0のIR得点を有し、ブログ文書2は、0.9のIR得点を有し、ブログ文書3は、0.8のIR得点を有し、ブログ文書4は、0.7のIR得点を有し、ブログ文書5は、0.6のIR得点を有する。例示の目的のため、これらの5個のブログ文書が以下の品質得点を有するものと仮定されたい。すなわち、ブログ文書1は、0.4の正の品質得点を有し、ブログ文書2は、−0.4の負の品質得点を有し、ブログ文書3は、0.8の正の品質得点を有し、ブログ文書4は、0.3の正の品質得点を有し、ブログ文書5は、0.3の正の品質得点を有する。
サーチエンジン225は、品質得点に関連性の得点を加算することにより、ブログ文書についての総合得点を求めることができる。この場合、ブログ文書1は、1.4の総合得点を有し、ブログ文書2は、0.5の総合得点を有し、ブログ文書3は、1.6の総合得点を有し、ブログ文書4は、1.0の総合得点を有し、ブログ文書5は、0.9の総合得点を有する。したがって、サーチエンジン225は、以下の順序で、すなわち、ブログ文書3、ブログ文書1、ブログ文書4、ブログ文書5、およびブログ文書2の順序で、ユーザにブログ文書1−5を提供することができる。
図8の例から明らかなように、ブログ文書の品質は、それらの文書のランクを上昇または下降させ得る。このようにして、より高品質の結果がユーザに提供される。
結論
この発明の原理と整合する実現例は、ブログの品質を考慮することにより、ブログのサーチを改良する。
この発明の原理と整合する実現例は、ブログの品質を考慮することにより、ブログのサーチを改良する。
この発明の例示的な実施例の上記の記載は、例示および説明を提供したが、網羅的であることを意図しておらず、または、この発明を開示された形態そのものに限定することを意図しない。上記の教示に照らして変更および変形が可能であり、または、この発明の実施から、変更および変形を行なうことができる。
たとえば、図6および図7に関して一連の活動を記載してきたが、これらの活動の順序は、この発明の原理と整合する他の実現例において変更されてよい。さらに、従属性を有さない活動を並行して実施することができる。
上記の記載はユーザについて言及している。「ユーザ」は、クライアント210(図2)等のクライアントか、または、クライアントのオペレータを指すことを意図する。
上記のとおり、この発明の局面が、図面に例示された実現例においてソフトウェア、ファームウェア、およびハードウェアの多くの異なる形態で実現され得ることが当業者には明らかである。この発明の原理と整合する局面を実現するために使用される実際のソフトウェアコードまたは専用の制御ハードウェアは、この発明を限定しない。したがって、当該局面の動作および挙動を、特定のソフトウェアコードに言及せずに説明してきた。当業者が、本明細書の記載に基づき、ソフトウェアおよび制御ハードウェアを設計してこれらの局面を実現し得ることが理解される。
本願で使用される要素、活動、または命令はいずれも、明記されない限り、この発明にとって重要であるか、または必須であるものと解釈されるべきではない。また、本明細書で使用する冠詞の「a」は、1つ以上の項目を含むことを意図する。1つの項目のみを意図する場合、「1つの」という用語または類似の言語を使用する。さらに、「に基づき」という句は、明記されない限り、「に少なくとも部分的に基づき」を意味することを意図する。
Claims (24)
- 1つ以上のサーバ装置によって実行される方法であって、
前記1つ以上のサーバ装置のブログサーチエンジンによりサーチクエリを受取るステップと、
前記サーチクエリに応答して、前記1つ以上のサーバ装置の前記ブログサーチエンジンにより、ブログ文書を検索するステップと、
前記サーチクエリに対する前記ブログ文書の関連性に基づく関連性得点を、前記ブログ文書について、前記1つ以上のサーバ装置の前記ブログサーチエンジンにより生成するステップと、
前記サーチクエリとは無関係の、前記ブログ文書の品質に基づき、前記1つ以上のサーバ装置の前記ブログサーチエンジンにより、品質得点を生成するステップと、
前記品質得点に基く量だけ前記関連性得点を調節することによって、前記1つ以上のサーバ装置の前記ブログサーチエンジンにより、順位得点を生成するステップと、
前記順位得点に基づく順序で、前記1つ以上のサーバ装置の前記ブログサーチエンジンにより、前記ブログ文書に関する情報および1つ以上の別のブログ文書に関する情報を提供するステップとを含む、方法。 - 前記ブログ文書は、ブログまたはブログ投稿を含む、請求項1に記載の方法。
- 複数の標識に基づき、前記ブログ文書の前記品質を求めるステップをさらに含む、請求項1に記載の方法。
- 前記複数の標識は、1つ以上の肯定的標識または1つ以上の否定的標識の少なくとも1つを含む、請求項3に記載の方法。
- 前記複数の標識は、前記ブログ文書の人気、他のブログ文書に関連付けられた1つ以上のブログロールにおける前記ブログ文書へのリンクの存在、前記ブログ文書のタグ付け、他の文書における前記ブログ文書への言及、前記ブログ文書のページランク(登録商標)、前記ブログ文書に投稿が追加される頻度、前記ブログ文書の内容、前記ブログ文書内の投稿のサイズ、前記ブログ文書に関連付けられたリンクの分布、前記ブログ文書内の広告の量、または、前記ブログ文書内の広告の位置の1つ以上を含む、請求項3に記載の方法。
- 前記ブログ文書の前記品質得点を生成する前記ステップは、
前記1つ以上の肯定的標識と前記1つ以上の否定的標識とを組合せるステップを含む、請求項4に記載の方法。 - 前記順位得点を生成する前記ステップは、
前記品質得点に基づき、前記関連性得点を上昇または下降させるステップを含む、請求項1に記載の方法。 - ブログサーチエンジンによりサーチクエリを受取るための手段と、
前記サーチクエリに応答してブログ文書を獲得するための手段と、
前記サーチクエリに対する前記ブログ文書の関連性に基づき、前記ブログ文書についての第1の得点を生成するための手段と、
前記サーチクエリとは無関係の、前記ブログ文書の品質に基づき、前記ブログ文書についの第2の得点を生成するための手段と、
前記第2の得点に基いた量だけ前記第1の得点を調節することにより第3の得点を生成するための手段と、
前記第3の得点に基づいた順序で、前記ブログ文書に関連する情報および少なくとも別のブログ文書に関連する情報を提供するための手段とを備える、システム。 - ブログサーチエンジンを備える装置であって、前記ブログサーチエンジンは、
サーチクエリを受取り、
前記サーチクエリに応答して複数のブログ文書を検索し、
前記複数のブログ文書内の各ブログ文書について、前記サーチクエリに対する前記各ブログ文書の関連性に基づき、関連性得点を生成し、
前記サーチクエリとは無関係の、前記各ブログ文書の品質に基づく品質得点を、各ブログ文書について生成し、
前記各ブログ文書について、前記品質得点に基く量だけ前記関連性得点を調節することにより、前記各ブログ文書について、前記各ブログ文書についての順位得点を生成し、
前記ブログ文書の前記順位得点に基く順序で前記ブログ文書を順位付けし、
順位付けされた順序で、前記順位付けされたブログ文書を提供する、装置。 - 方法を実行するプロセッサを制御するための命令を含むコンピュータ可読媒体であって、前記方法は、
サーチクエリを受取るステップと、
前記サーチクエリに応答して文書を検索するステップとを含み、前記文書はブログ文書を含み、前記方法はさらに、
前記サーチクエリに対する前記文書の各々の関連性に基づき、前記文書の各々についての関連性得点を生成するステップと、
前記サーチクエリとは無関係の、前記ブログ文書の各々の品質に基づき、前記ブログ文書の各々について品質得点を生成するステップと、
前記文書の各々についての順位得点を生成するステップとを含み、前記文書の中の特定の1つについての前記順位得点を生成するステップは、前記品質得点に基く量だけ前記得点の文書についての前記得点を調整するステップを含み、前記方法はさらに、
前記文書の順位得点に基く順序で、前記文書に関する情報を提供するステップを含む、コンピュータ可読媒体。 - コンピュータにより実行される方法であって、
ブログ文書を獲得するステップと、
前記ブログ文書の品質の肯定的標識または前記ブログ文書の前記品質の否定的標識の少なくとも1つを識別するステップと、
前記識別された肯定的標識または否定的標識の少なくとも1つに基づき、前記ブログ文書についての品質得点を生成するステップと、
前記サーチクエリに対する前記ブログ文書の関連性を求めるステップと、
別のブログ文書に対する前記ブログ文書のランクを求めるステップとを含み、前記ブログ文書の前記ランクを求めるステップは、
前記ブログ文書についての生成された前記品質得点を用いて、前記ブログ文書の前記求められた関連性を変更するステップを含む、コンピュータにより実行される方法。 - 前記ブログ文書は、ブログまたはブログ投稿を含む、請求項11に記載のコンピュータにより実行される方法。
- 前記肯定的標識は、前記ブログ文書の人気、他のブログ文書に関連付けられた1つ以上のブログロールにおける前記ブログ文書へのリンクの存在、前記ブログ文書のタグ付け、他の文書における前記ブログ文書への言及、または、前記ブログ文書のページランク(登録商標)の1つ以上を含む、請求項11に記載のコンピュータにより実行される方法。
- 前記否定的標識は、前記ブログ文書に投稿が追加される頻度、前記ブログ文書内の投稿のサイズ、前記ブログ文書に関連付けられたリンクの分布、前記ブログ文書内の広告の量、または、前記ブログ文書内の広告の位置の1つ以上を含む、請求項11に記載のコンピュータにより実行される方法。
- 前記否定的標識は、前記ブログ文書の内容と、前記ブログ文書に関連付けられたフィードの内容との不一致の表示を含む、請求項11に記載のコンピュータにより実行される方法。
- 前記否定的標識は、前記ブログ文書が、高い割合の予め定められた単語または句を含むことの表示を含む、請求項11に記載のコンピュータにより実行される方法。
- 前記否定的標識は、前記ブログ文書が重複する内容を含むことの表示を含む、請求項11に記載のコンピュータにより実行される方法。
- 機械実行可能な命令を記憶するメモリと、
ブログ文書を受取り、
前記ブログ文書の品質の肯定的標識または前記ブログ文書の前記品質の否定的標識の少なくとも1つを識別し、
前記識別された肯定的標識または否定的標識の少なくとも1つに基づき、前記ブログ文書についての品質得点を生成し、
サーチクエリに対する前記ブログ文書の関連性を求め、
別のブログ文書に対する前記ブログ文書のランクを求めるように、前記命令を実行するための1つ以上のプロセッサとを備え、前記1つ以上のプロセッサは、
前記ブログ文書についての生成された前記品質得点を用いて、前記ブログ文書の前記求められた関連性を変更する、装置。 - 1つ以上のサーバ装置により実行される方法であって、
前記1つ以上のサーバ装置のブログサーチエンジンによって、サーチクエリを受取るステップと、
前記サーチクエリに応答して複数のブログ文書についての得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって求めるステップとを含み、前記得点は、前記サーチクエリに対する前記複数のブログ文書の関連性と、前記複数のブログ文書の品質とに基づき、前記求めるステップは、
前記複数のブログ文書についての関連性の得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって求めるステップと、
前記複数のブログ文書の前記品質に基づいて、前記関連性の得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって調節するステップとを含み、さらに、
前記求められた得点に基づいた順序で、前記複数のブログ文書に関する情報を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって提供するステップを含む、方法。 - 複数の標識に基づき、前記複数のブログ文書における各ブログ文書の品質を求めるステップをさらに含む、請求項19に記載の方法。
- 前記複数の標識は、1つ以上の肯定的標識および1つ以上の否定的標識を含む、請求項20に記載の方法。
- 前記1つ以上の肯定的標識は、前記ブログ文書の人気、他のブログ文書に関連付けられた1つ以上のブログロールにおける前記ブログ文書へのリンクの存在、前記ブログ文書のタグ付け、他の文書における前記ブログ文書への言及、または、前記ブログ文書のページランク(登録商標)の1つ以上を含み、
前記1つ以上の否定的標識は、前記ブログ文書に投稿が追加される頻度、前記ブログ文書の内容、前記ブログ文書内の投稿のサイズ、前記ブログ文書に関連付けられたリンクの分布、前記ブログ文書内の広告の量、または、前記ブログ文書内の広告の位置の1つ以上を含む、請求項21に記載の方法。 - 各ブログ文書の前記品質を求める前記ステップは、
前記1つ以上の肯定的標識と前記1つ以上の否定的標識とを組合せて前記各ブログ文書についての品質得点を求めるステップを含む、請求項21に記載の方法。 - 1つ以上のサーバ装置によって実行される方法であって、
ブログ文書の品質の肯定的標識または前記ブログ文書の前記品質の否定的標識の少なくとも1つを、前記1つ以上のサーバ装置のブログサーチエンジンによって識別するステップを含み、前記識別された肯定的標識または否定的標識の少なくとも1つは、ブログ文書に固有の標識を含み、さらに、
前記識別された肯定的標識または否定的標識の少なくとも1つに基づき、前記ブログ文書についての品質得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって求めるステップと、
サーチクエリを、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって受取るステップと、
前記サーチクエリに対する前記ブログ文書の関連性に基づき、前記ブログ文書についての得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって求めるステップと、
前記品質得点に基づき、前記ブログ文書の前記得点を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって調節するステップと、
前記調節された得点に基づいた順序で、前記ブログ文書に関連する情報を、前記1つ以上のサーバ装置の前記ブログサーチエンジンによって提供するステップとを含む、方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/224,321 US8244720B2 (en) | 2005-09-13 | 2005-09-13 | Ranking blog documents |
US11/224,321 | 2005-09-13 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008531257A Division JP4837040B2 (ja) | 2005-09-13 | 2006-09-13 | ブログ文書のランク付け |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011238276A true JP2011238276A (ja) | 2011-11-24 |
Family
ID=37432282
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008531257A Active JP4837040B2 (ja) | 2005-09-13 | 2006-09-13 | ブログ文書のランク付け |
JP2011159731A Pending JP2011238276A (ja) | 2005-09-13 | 2011-07-21 | ブログ文書のランク付け |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008531257A Active JP4837040B2 (ja) | 2005-09-13 | 2006-09-13 | ブログ文書のランク付け |
Country Status (9)
Country | Link |
---|---|
US (2) | US8244720B2 (ja) |
EP (1) | EP1934830A1 (ja) |
JP (2) | JP4837040B2 (ja) |
KR (1) | KR101005510B1 (ja) |
CN (1) | CN101305371A (ja) |
AU (1) | AU2006290977B2 (ja) |
BR (1) | BRPI0615915B1 (ja) |
CA (1) | CA2622784A1 (ja) |
WO (1) | WO2007033202A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013246682A (ja) * | 2012-05-28 | 2013-12-09 | Sony Corp | 情報処理装置、情報処理方法、および、プログラム |
JP2018504727A (ja) * | 2015-11-27 | 2018-02-15 | 小米科技有限責任公司Xiaomi Inc. | 参考文書の推薦方法及び装置 |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7421429B2 (en) * | 2005-08-04 | 2008-09-02 | Microsoft Corporation | Generate blog context ranking using track-back weight, context weight and, cumulative comment weight |
US8244720B2 (en) | 2005-09-13 | 2012-08-14 | Google Inc. | Ranking blog documents |
US7856445B2 (en) * | 2005-11-30 | 2010-12-21 | John Nicholas and Kristin Gross | System and method of delivering RSS content based advertising |
US9202241B2 (en) * | 2005-11-30 | 2015-12-01 | John Nicholas and Kristin Gross | System and method of delivering content based advertising |
US8924558B2 (en) | 2005-11-30 | 2014-12-30 | John Nicholas and Kristin Gross | System and method of delivering content based advertising |
US8417569B2 (en) * | 2005-11-30 | 2013-04-09 | John Nicholas and Kristin Gross Trust | System and method of evaluating content based advertising |
US8117195B1 (en) | 2006-03-22 | 2012-02-14 | Google Inc. | Providing blog posts relevant to search results |
US20070239674A1 (en) * | 2006-04-11 | 2007-10-11 | Richard Gorzela | Method and System for Providing Weblog Author-Defined, Weblog-Specific Search Scopes in Weblogs |
US20070255701A1 (en) * | 2006-04-28 | 2007-11-01 | Halla Jason M | System and method for analyzing internet content and correlating to events |
US20090070683A1 (en) * | 2006-05-05 | 2009-03-12 | Miles Ward | Consumer-generated media influence and sentiment determination |
US20070271259A1 (en) * | 2006-05-17 | 2007-11-22 | It Interactive Services Inc. | System and method for geographically focused crawling |
US8452777B2 (en) | 2007-02-01 | 2013-05-28 | Linkedin Corporation | Dynamic submission and preference indicator |
US8527594B2 (en) * | 2007-02-16 | 2013-09-03 | Ecairn, Inc. | Blog advertising |
US8346763B2 (en) * | 2007-03-30 | 2013-01-01 | Microsoft Corporation | Ranking method using hyperlinks in blogs |
US20090006341A1 (en) * | 2007-06-28 | 2009-01-01 | Bruce Chapman | Method of website ranking promotion using creation of mass blog posting links |
WO2009023984A1 (en) | 2007-08-17 | 2009-02-26 | Google Inc. | Ranking social network objects |
CN100545847C (zh) * | 2007-09-25 | 2009-09-30 | 腾讯科技(深圳)有限公司 | 一种对博客文章进行排序的方法及系统 |
KR100932841B1 (ko) * | 2007-11-09 | 2009-12-21 | 엔에이치엔(주) | 검색 문서 품질 측정 방법 및 그 시스템 |
KR100932842B1 (ko) * | 2007-12-06 | 2009-12-21 | 엔에이치엔(주) | 검색랭킹의 품질 평가 방법 및 시스템 |
KR100975502B1 (ko) * | 2008-01-30 | 2010-08-11 | 엔에이치엔(주) | 블로그 포스트의 랭킹 판단 방법 및 시스템 |
US8078197B2 (en) * | 2008-02-20 | 2011-12-13 | Agere Systems Inc. | Location-based search-result ranking for blog documents and the like |
KR101004999B1 (ko) * | 2008-08-27 | 2011-01-04 | 서강대학교산학협력단 | 콘텐츠와 콘텐츠 제공 사이트의 파급력 측정 방법 및 장치 |
US8073947B1 (en) * | 2008-10-17 | 2011-12-06 | GO Interactive, Inc. | Method and apparatus for determining notable content on web sites |
KR101013761B1 (ko) * | 2008-10-27 | 2011-02-14 | 한국과학기술원 | 블로그 권위값 추정 기법을 사용한 블로그 검색 장치 및 방법 |
US20100114910A1 (en) * | 2008-10-27 | 2010-05-06 | Korea Advanced Institute Of Science And Technology | Blog search apparatus and method using blog authority estimation |
KR101049648B1 (ko) | 2009-02-23 | 2011-07-14 | 성균관대학교산학협력단 | 블로그 랭크 알고리즘을 이용해서 효율적으로 블로그를 검색하기 위한 블로그 랭크 방법 |
JP5216654B2 (ja) * | 2009-03-27 | 2013-06-19 | Kddi株式会社 | 重要度判定装置、重要度判定方法、およびプログラム |
US8577910B1 (en) | 2009-05-15 | 2013-11-05 | Google Inc. | Selecting relevant languages for query translation |
US8577909B1 (en) | 2009-05-15 | 2013-11-05 | Google Inc. | Query translation using bilingual search refinements |
US8572109B1 (en) | 2009-05-15 | 2013-10-29 | Google Inc. | Query translation quality confidence |
US8538957B1 (en) * | 2009-06-03 | 2013-09-17 | Google Inc. | Validating translations using visual similarity between visual media search results |
US8745067B2 (en) * | 2009-08-12 | 2014-06-03 | Google Inc. | Presenting comments from various sources |
KR101284788B1 (ko) * | 2009-10-13 | 2013-07-10 | 한국전자통신연구원 | 신뢰도에 기반한 질의응답 장치 및 그 방법 |
US8606792B1 (en) | 2010-02-08 | 2013-12-10 | Google Inc. | Scoring authors of posts |
US20110258560A1 (en) * | 2010-04-14 | 2011-10-20 | Microsoft Corporation | Automatic gathering and distribution of testimonial content |
US20110276554A1 (en) * | 2010-05-10 | 2011-11-10 | Chen-Yu Sheu | Query and note based search system |
US8560530B2 (en) | 2010-05-17 | 2013-10-15 | Buzzmetrics, Ltd. | Methods, apparatus, and articles of manufacture to rank web site influence |
AU2013203650B2 (en) * | 2010-05-17 | 2014-08-14 | Buzzmetrics Ltd. | Methods, apparatus and articles of manufacture to rank web site influence |
CA2836700C (en) | 2010-05-25 | 2017-05-30 | Mark F. Mclellan | Active search results page ranking technology |
CN102385576A (zh) * | 2010-08-27 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 博主影响力计算方法及系统 |
US9009065B2 (en) | 2010-12-17 | 2015-04-14 | Google Inc. | Promoting content from an activity stream |
JP2012141837A (ja) * | 2011-01-04 | 2012-07-26 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
US20120210240A1 (en) * | 2011-02-10 | 2012-08-16 | Microsoft Corporation | User interfaces for personalized recommendations |
US9251269B2 (en) * | 2011-10-27 | 2016-02-02 | International Business Machines Corporation | Accounting for authorship in a web log search engine |
US9135291B2 (en) * | 2011-12-14 | 2015-09-15 | Megathread, Ltd. | System and method for determining similarities between online entities |
US9589303B2 (en) | 2012-01-09 | 2017-03-07 | Google Inc. | Selective presentation of content types and sources in search |
CN103246670B (zh) * | 2012-02-09 | 2016-02-17 | 深圳市腾讯计算机系统有限公司 | 微博排序、搜索、展示方法和系统 |
WO2014007826A1 (en) * | 2012-07-06 | 2014-01-09 | Empire Technology Development Llc | Organization of inputs for online service |
US9553783B2 (en) * | 2012-09-14 | 2017-01-24 | Salesforce.Com, Inc. | Spam flood detection methodologies |
CN103914491B (zh) | 2013-01-09 | 2017-11-17 | 腾讯科技(北京)有限公司 | 对优质用户生成内容的数据挖掘方法和系统 |
JP6130270B2 (ja) * | 2013-08-21 | 2017-05-17 | Kddi株式会社 | メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法 |
US10303684B1 (en) * | 2013-08-27 | 2019-05-28 | Google Llc | Resource scoring adjustment based on entity selections |
US9589024B2 (en) * | 2013-09-27 | 2017-03-07 | Intel Corporation | Mechanism for facilitating dynamic and proactive data management for computing devices |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005033978A1 (en) * | 2003-09-30 | 2005-04-14 | Google Inc. | Information retrieval based on historical data |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421675B1 (en) | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
US6598046B1 (en) * | 1998-09-29 | 2003-07-22 | Qwest Communications International Inc. | System and method for retrieving documents responsive to a given user's role and scenario |
US6510406B1 (en) | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US7743045B2 (en) * | 2005-08-10 | 2010-06-22 | Google Inc. | Detecting spam related and biased contexts for programmable search engines |
US7716199B2 (en) * | 2005-08-10 | 2010-05-11 | Google Inc. | Aggregating context data for programmable search engines |
US7693830B2 (en) * | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US6946715B2 (en) * | 2003-02-19 | 2005-09-20 | Micron Technology, Inc. | CMOS image sensor and method of fabrication |
US7016889B2 (en) * | 2003-01-30 | 2006-03-21 | Hewlett-Packard Development Company, Lp. | System and method for identifying useful content in a knowledge repository |
US7739281B2 (en) * | 2003-09-16 | 2010-06-15 | Microsoft Corporation | Systems and methods for ranking documents based upon structurally interrelated information |
KR20050077242A (ko) | 2004-02-10 | 2005-08-01 | 엔에이치엔(주) | 검색 작업 요청에 응답하여 출력되는 검색 결과에 광고를제공하는 방법 및 시스템 |
US8930239B2 (en) * | 2005-03-23 | 2015-01-06 | Douglas Ashbaugh | Distributed content exchange and presentation system |
US7761447B2 (en) * | 2004-04-08 | 2010-07-20 | Microsoft Corporation | Systems and methods that rank search results |
US20070067297A1 (en) * | 2004-04-30 | 2007-03-22 | Kublickis Peter J | System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users |
US7596571B2 (en) * | 2004-06-30 | 2009-09-29 | Technorati, Inc. | Ecosystem method of aggregation and search and related techniques |
US7890871B2 (en) * | 2004-08-26 | 2011-02-15 | Redlands Technology, Llc | System and method for dynamically generating, maintaining, and growing an online social network |
US8335785B2 (en) * | 2004-09-28 | 2012-12-18 | Hewlett-Packard Development Company, L.P. | Ranking results for network search query |
US8060463B1 (en) * | 2005-03-30 | 2011-11-15 | Amazon Technologies, Inc. | Mining of user event data to identify users with common interests |
US20060284744A1 (en) * | 2005-05-25 | 2006-12-21 | Andrew Shotland | Structured blogging with reciprocal links |
US9158855B2 (en) * | 2005-06-16 | 2015-10-13 | Buzzmetrics, Ltd | Extracting structured data from weblogs |
US7421429B2 (en) * | 2005-08-04 | 2008-09-02 | Microsoft Corporation | Generate blog context ranking using track-back weight, context weight and, cumulative comment weight |
US20070050389A1 (en) * | 2005-09-01 | 2007-03-01 | Opinmind, Inc. | Advertisement placement based on expressions about topics |
US7765209B1 (en) * | 2005-09-13 | 2010-07-27 | Google Inc. | Indexing and retrieval of blogs |
US8244720B2 (en) | 2005-09-13 | 2012-08-14 | Google Inc. | Ranking blog documents |
US8688673B2 (en) * | 2005-09-27 | 2014-04-01 | Sarkar Pte Ltd | System for communication and collaboration |
US7716226B2 (en) * | 2005-09-27 | 2010-05-11 | Patentratings, Llc | Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects |
US7657585B2 (en) * | 2005-10-25 | 2010-02-02 | Innternational Business Machines Corporation | Automated process for identifying and delivering domain specific unstructured content for advanced business analysis |
US7917519B2 (en) * | 2005-10-26 | 2011-03-29 | Sizatola, Llc | Categorized document bases |
US20070255702A1 (en) * | 2005-11-29 | 2007-11-01 | Orme Gregory M | Search Engine |
US7734610B2 (en) * | 2005-12-12 | 2010-06-08 | Google Inc. | Decentralised web annotation |
US7685144B1 (en) * | 2005-12-29 | 2010-03-23 | Google Inc. | Dynamically autocompleting a data entry |
US7634463B1 (en) * | 2005-12-29 | 2009-12-15 | Google Inc. | Automatically generating and maintaining an address book |
US20070203891A1 (en) * | 2006-02-28 | 2007-08-30 | Microsoft Corporation | Providing and using search index enabling searching based on a targeted content of documents |
US8117195B1 (en) * | 2006-03-22 | 2012-02-14 | Google Inc. | Providing blog posts relevant to search results |
US20090171866A1 (en) * | 2006-07-31 | 2009-07-02 | Toufique Harun | System and method for learning associations between logical objects and determining relevance based upon user activity |
US8200648B2 (en) * | 2006-08-07 | 2012-06-12 | Yeda Research & Development Co. Ltd. At The Weizmann Institute Of Science | Data similarity and importance using local and global evidence scores |
US20080104128A1 (en) * | 2006-10-24 | 2008-05-01 | Drayer Jay A | system and method for secure, anonymous, and pertinent reposting of private blog posting, etc. |
US20080154887A1 (en) * | 2006-12-01 | 2008-06-26 | S.L.I. Systems, Inc. | Method and system for displaying information |
US8180717B2 (en) * | 2007-03-20 | 2012-05-15 | President And Fellows Of Harvard College | System for estimating a distribution of message content categories in source data |
US7873635B2 (en) * | 2007-05-31 | 2011-01-18 | Microsoft Corporation | Search ranger system and double-funnel model for search spam analyses and browser protection |
US7664726B2 (en) * | 2007-06-25 | 2010-02-16 | Microsoft Corporation | Influence based rewards for word-of-mouth advertising ecosystems |
US8010527B2 (en) * | 2007-06-29 | 2011-08-30 | Fuji Xerox Co., Ltd. | System and method for recommending information resources to user based on history of user's online activity |
US9283476B2 (en) * | 2007-08-22 | 2016-03-15 | Microsoft Technology Licensing, Llc | Information collection during game play |
US7716228B2 (en) * | 2007-09-25 | 2010-05-11 | Firstrain, Inc. | Content quality apparatus, systems, and methods |
US20090157491A1 (en) * | 2007-12-12 | 2009-06-18 | Brougher William C | Monetization of Online Content |
WO2009105277A1 (en) * | 2008-02-22 | 2009-08-27 | Socialrep, Llc | System and method for measuring and managing distributed online conversations |
US8069179B2 (en) * | 2008-04-24 | 2011-11-29 | Microsoft Corporation | Preference judgements for relevance |
US20100131455A1 (en) * | 2008-11-19 | 2010-05-27 | Logan James D | Cross-website management information system |
US8694496B2 (en) * | 2008-11-26 | 2014-04-08 | At&T Intellectual Property I, L.P. | Harvesting application metadata |
US8886636B2 (en) * | 2008-12-23 | 2014-11-11 | Yahoo! Inc. | Context transfer in search advertising |
US8745067B2 (en) * | 2009-08-12 | 2014-06-03 | Google Inc. | Presenting comments from various sources |
EP2465051A1 (en) * | 2009-08-12 | 2012-06-20 | Google, Inc. | Objective and subjective ranking of comments |
US10019518B2 (en) * | 2009-10-09 | 2018-07-10 | Excalibur Ip, Llc | Methods and systems relating to ranking functions for multiple domains |
-
2005
- 2005-09-13 US US11/224,321 patent/US8244720B2/en active Active
-
2006
- 2006-09-13 BR BRPI0615915A patent/BRPI0615915B1/pt active IP Right Grant
- 2006-09-13 KR KR1020087008671A patent/KR101005510B1/ko active IP Right Grant
- 2006-09-13 AU AU2006290977A patent/AU2006290977B2/en not_active Ceased
- 2006-09-13 WO PCT/US2006/035539 patent/WO2007033202A1/en active Application Filing
- 2006-09-13 JP JP2008531257A patent/JP4837040B2/ja active Active
- 2006-09-13 CN CNA2006800422026A patent/CN101305371A/zh active Pending
- 2006-09-13 EP EP06803458A patent/EP1934830A1/en not_active Ceased
- 2006-09-13 CA CA002622784A patent/CA2622784A1/en not_active Abandoned
-
2011
- 2011-07-21 JP JP2011159731A patent/JP2011238276A/ja active Pending
-
2012
- 2012-06-26 US US13/533,619 patent/US20120265757A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005033978A1 (en) * | 2003-09-30 | 2005-04-14 | Google Inc. | Information retrieval based on historical data |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013246682A (ja) * | 2012-05-28 | 2013-12-09 | Sony Corp | 情報処理装置、情報処理方法、および、プログラム |
JP2018504727A (ja) * | 2015-11-27 | 2018-02-15 | 小米科技有限責任公司Xiaomi Inc. | 参考文書の推薦方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
AU2006290977B2 (en) | 2011-04-21 |
AU2006290977A1 (en) | 2007-03-22 |
KR101005510B1 (ko) | 2011-01-04 |
EP1934830A1 (en) | 2008-06-25 |
JP4837040B2 (ja) | 2011-12-14 |
CA2622784A1 (en) | 2007-03-22 |
BRPI0615915B1 (pt) | 2019-09-10 |
US20070061297A1 (en) | 2007-03-15 |
KR20080044915A (ko) | 2008-05-21 |
US20120265757A1 (en) | 2012-10-18 |
WO2007033202A1 (en) | 2007-03-22 |
US8244720B2 (en) | 2012-08-14 |
CN101305371A (zh) | 2008-11-12 |
BRPI0615915A2 (pt) | 2012-04-10 |
JP2009508267A (ja) | 2009-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4837040B2 (ja) | ブログ文書のランク付け | |
US8276060B2 (en) | System and method for annotating documents using a viewer | |
US7716225B1 (en) | Ranking documents based on user behavior and/or feature data | |
US8762326B1 (en) | Personalized hot topics | |
US8782037B1 (en) | System and method for mark-up language document rank analysis | |
US9092488B2 (en) | Determination of a desired repository for retrieving search results | |
US8631001B2 (en) | Systems and methods for weighting a search query result | |
JP4714156B2 (ja) | 記事情報を用いて検索ランク付けを改良するための方法およびシステム | |
US7765209B1 (en) | Indexing and retrieval of blogs | |
US8166056B2 (en) | System and method for searching annotated document collections | |
US8332426B2 (en) | Indentifying referring expressions for concepts | |
US20060224615A1 (en) | Systems and methods for providing subscription-based personalization | |
US8538970B1 (en) | Personalizing search results | |
Hsu et al. | Efficient and effective prediction of social tags to enhance web search | |
CN107423298B (zh) | 一种搜索方法和装置 | |
US8595225B1 (en) | Systems and methods for correlating document topicality and popularity | |
AU2011204929B2 (en) | Ranking blog documents | |
CN111460307B (zh) | 一种移动终端精确搜索方法和装置 | |
Hendriksen | Extending WASP: providing context to a personal web archive | |
EP1962201A2 (en) | System and method for annotating documents using a viewer | |
Saravanan | MONITORING ROUTINE IN WEB EXPLORATION ENVIRONMENTS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131203 |