JP2007517269A - ニュース記事のランク付けを向上させるためのシステムおよび方法 - Google Patents

ニュース記事のランク付けを向上させるためのシステムおよび方法 Download PDF

Info

Publication number
JP2007517269A
JP2007517269A JP2006526402A JP2006526402A JP2007517269A JP 2007517269 A JP2007517269 A JP 2007517269A JP 2006526402 A JP2006526402 A JP 2006526402A JP 2006526402 A JP2006526402 A JP 2006526402A JP 2007517269 A JP2007517269 A JP 2007517269A
Authority
JP
Japan
Prior art keywords
source
information source
information
value
news
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006526402A
Other languages
English (en)
Other versions
JP5632574B2 (ja
Inventor
カーティス・ミッシェル
バーラット・クリッシュナ
シュミット・ミッシェル
Original Assignee
グーグル・インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インク filed Critical グーグル・インク
Publication of JP2007517269A publication Critical patent/JP2007517269A/ja
Application granted granted Critical
Publication of JP5632574B2 publication Critical patent/JP5632574B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 記事に関連付けられた情報源の品質に基づくニュース記事のランク付けを向上させる。
【解決手段】 本発明においては、リンクのリストを受け取り(505)、各リンクについて、そのリンクが関連づけられた情報源を特定し(515)、少なくとも特定された情報源の品質の一部に基づいて、リンクのリストをランク付けする(520)ことを特徴とする結果のランク付け方法が提供される。
【選択図】 図5

Description

本発明は、一般的には、コミュニケーションシステム、より詳細には、コミュニケーションシステムにおけるニュース記事のランク付けを向上させるための、システムおよび方法に関する。
例えばインターネットといったネットワークは、我々の日常生活で次第に重要になってきている。何百万人もの人々が今日、モノやサービスを求めて買い物をしたり、関心事についての情報(例えば、映画リスト、ニュース等)を得たり、友人や家族や同僚と(例えば、電子メールまたはインスタント・メッセージ)コミュニケーションをとったりするために、インターネットにアクセスする。
これまで、ある者が商品を購入するもしくは単にインターネットで情報を検索したい場合、この者は、特定のウェブサイトにアクセスするために、関心事についてウェブサイトに関連するURL(Uniform Resource Locator)を、ウェブブラウザへと入力する。次にその者は、関心事についての情報が、特定のウェブサイトで入手できるかどうかを判断する。
例えば、ある者が、インターネットを通して特定のトピックに関する最新ニュースを得たいと仮定する。その者は、従来の検索エンジンを含むウェブサイトにアクセスする。その者は、本トピックに関係する記事を発表した情報源を見つけようと、例えば”Iraq”といった、関心事についてのトピックに関係する1つ以上の用語を、検索エンジンへと入力する。求めるトピックに関係するニュース記事を提供する個々のウェブサイトを見つけるのに、このような方法での検索エンジンの使用は、何百もしくは何千もの「ヒット記事」でランク付けされたリストという結果を出力する。各ヒット記事は、検索用語に関係するウェブページに対応している。
ランク付けされたリスト中の各ヒット記事は、希望のトピックと関係するかもしれないが、これらのヒット記事に関連する情報源は、品質を一律にしない可能性もある。例えば、CNNやBBCが、報道の正確さ、文章の専門性などについて、品質の高い情報源であると広くみなされているが、その一方で、例えば郷土の情報源といった地方の情報源は、品質がより低いであろう。
したがって、記事に関連付けられた情報源の品質に基づくニュース記事のランク付けを向上させるためのシステムおよび方法が必要である。
本発明の原理にかかる実施態様は、記事が関連付けられた情報源の品質のうち少なくとも一部に基づき、検索結果におけるニュース記事のランク付けを調整する。
本発明の原理にかかる1つの実施態様においては、検索結果をランク付けするための方法が提供される。この方法は、リンクのリストを受信し、各リンクについてリンクが関連付けられた情報源を特定し、特定された情報源の品質の少なくとも一部に基づきリンクのリストのランク付けをすることを含む。
本発明の原理にかかる他の実施態様においては、サーバには一群の情報源のための品質指標を格納するために設定されたプロセッサおよびメモリが含まれる。プロセッサは、オブジェクトのリストを受信し、各オブジェクトが関連付けられた情報源を特定し、1つのオブジェクトが関連付けられた情報源に関連付けられた品質指標の少なくとも一部に基づくオブジェクトのリスト中にあるオブジェクトをランク付けする。
本発明の原理にかかるさらなる実施態様では、ニュースソースの品質を決定するための方法を提供する。この方法は、第1の期間中にニュースソースによって産出された記事の数、ニュースソースによって産出される記事の平均長、ニュースソースが第2の期間に産出する重要な報道の数、ニュース速報のスコア、ニュースソースに対するネットワーク・トラフィックの量、ニュースソースについての人の意見、ニュースソースの貸出統計、ニュースソースに関連する人員のサイズ、ニュースソースに関連する局の数、ニュースソースに関連する一群の記事に最初に登録された事業体の数、ニュースソースによる報道の幅広さ、ニュースソースへのトラフィックの発信元となる諸国の数、およびニュースソースに使用する文体、のうち少なくとも1つの少なくとも一部に基づくニュースソースに対する1つ以上のメトリック値、の決定を含むことができる。この方法はさらに、決定された1つ以上のメトリック値の少なくとも一部に基づくニュースソースについての品質価値の算出を含むことができる。
本発明の原理にかかるさらに別の実施態様では、検索結果を提供するための方法を提供する。この方法は、オブジェクトのリストを受信し、一群のオブジェクトにおける各オブジェクトに関連付けられた情報源を特定し、特定された情報源の各々の品質を決定し、オブジェクトに関連付けられた情報源の決定された品質の少なくとも一部に基づき一群のオブジェクト中における各オブジェクトのランク付けを行うこと含むことができる。
記事に関連付けられた情報源の品質に基づくニュース記事のランク付けを向上させる。
本発明の原理にかかる実施態様についての詳細な記述については、添付の図面を参照して述べる。異なる図面中の同じ参照番号は、同様または類似の要素とみなす。また、以下の詳細な記述は、本発明を限定するものではない。
本発明の原理にかかる実施態様は、ニュース記事に関連付けられる情報源の品質の少なくとも一部に基づく検索結果における、ニュース記事のランク付けを向上させる。前述の記述は、ニュースソースからのニュース記事のランク付けに焦点を当てているが、さらに、ここに記述される技法は、ニュース記事以外の項目のランク付けの向上にも応用できる点は、留意すべきである。
(システムの一例)
図1は、本発明の原理にかかるシステムおよび方法を実装した、システム100の一例である。システム100は、ネットワーク140を経由しサーバ120およびサーバ130へと接続したマルチクライアント110を含むことができる。ネットワーク140には、ローカルエリア・ネットワーク(Local Area Network:LAN)、広域ネットワーク(Wide Area Network:WAN)、公衆交換回線電話網(Public Switched Telephone Network:PSTN)といった電話網、イントラネット、インターネット、類似するまたは異なるネットワーク、もしくはネットワークの連携が含まれてもよい。簡易にするため、図1では、2つのクライアント110および3つのサーバ120/130が、ネットワーク140へと接続するように示す。実際には、クライアント110、および/または、サーバ120/130は、これより少ない場合もあれば、多い場合もある。また、場合によっては、クライアント110は、サーバ120/130の関数を実行し、サーバ120/130は、クライアント110の関数を実行することもある。
クライアント110は、例えば、無線電話、パーソナル・コンピュータ、携帯情報端末(PDA)、ノート型パソコン等といった、デバイスを含むことができる。サーバ120/130は、サーバ・デバイス、スレッド、および/または、スレッドで作動するオブジェクト、検索を含み、本発明の原理にかかる方法で、ドキュメントを保存する。クライアント110およびサーバ120/130は、有線、無線または光接続を経由してネットワーク140へと接続することもある。
本発明の原理にかかる実施態様において、サーバ120は、クライアント110で使用可能な検索エンジン125を含むこともある。サーバ130は、クライアント110によってアクセス可能なオブジェクト(またはウェブドキュメント)を格納する。
(サーバの一例)
図2は、本発明の原理にかかる実施態様における、サーバ120の一例である。クライアント110およびサーバ130が、同様に設定されてもよい。サーバ120は、BUS(バス)210、メインメモリ230、リードオンリーメモリ(Read Only Memory:ROM)240、記憶装置250、1つ以上の入力装置260、1つ以上の出力装置270、通信インタフェース280を含むことができる。バス210は、サーバ120のコンポーネント間の通信を許可する1つ以上の配線を含むことができる。
プロセッサ220は、命令を解釈し実行する、あらゆる従来型のプロセッサおよびマイクロプロセッサを含んでよい。メインメモリ230は、プロセッサ220によって実行するための情報および命令を格納する、ランダムアクセスメモリ(Ramdom Access Memory:RAM)または別型のダイナミック・記憶装置を含むことができる。ROM240は、プロセッサ220に使用するための情報および命令を格納する、従来型のROMまたは別型のスタティック・記憶装置を含むことができる。記憶装置250は、磁気記録装置、および/または、光学記録装置、並びにこれらに対応するドライブが含まれる場合がある。
入力装置260は、例えば、キーボード、マウス、ペン、(例えば音声認証デバイスといった)1つ以上の生体認証機構等といった、ユーザが情報をサーバ120へ入力することを許可する1つ以上の従来型の機構を含むことができる。出力装置270は、ユーザへの出力情報がディスプレイ、プリンタ、スピーカ等を含む、1つ以上の従来型の機構を含むことができる。通信インタフェース280は、サーバ120がその他の装置および/またはシステムとの通信を可能にする、あらゆるトランシーバ用の機構を含む。例えば、通信インタフェース280は、例えばネットワーク140といったネットワークを経由し、別の装置またはシステムとの通信を行うための機構を含むことができる。
以下に詳細に記述するように、本発明の原理にかかるサーバ120は、クライアント110からのクエリに対する応答の検索結果を提供することができる。1つの実施態様において、サーバ120はニュース記事が提供する情報源の品質に基づくニュース記事検索結果を修正する。サーバ120は、例えばメモリ230といったコンピュータへ読み込み可能な媒体中に含有される、ソフトウェア命令を実行するプロセッサ220に対応してこれらの操作を実行する。コンピュータへ読み込み可能な媒体は、1つ以上のメモリ装置、および/または、搬送波として決定される。ソフトウェア命令は、例えばデータ・記憶装置250といった別のコンピュータへ読み込み可能な媒体、あるいは、通信インタフェース280を経由する別のデバイスから、メモリ230へと読み込むことができる。このメモリ230に含有されるソフトウェア命令は、プロセッサ220が、後述プロセスを実行する原因となる可能性もある。もう1つの方法として、組み込み回路が、本発明の原理にかかるプロセスを実施態様するため、ソフトウェア命令の代わりにあるいはソフトウェア命令と組み合わせて使用することができる。それ故に、本発明は、組み込み回路およびソフトウェアのうち、いかなる特定の組み合わせにも限定されない。
本発明の原理にかかるサーバ120は、1つ以上の関連付けられたデータベースからの情報に基づく検索結果のランク付けを並べたり変更したりすることができる。このデータベースは、(例えば、メモリ230中の)サーバ120またはサーバ120の外部に格納することができる。
図3は、本発明の原理にかかる実施態様におけるサーバ120に関連付けることができるデータベース300の模範図である。ただ1つのデータベースのみが以下に記述されているとはいえ、サーバ120は、ローカルではサーバ120に格納されるかあるいはネットワーク140を通して分散する1つ以上の追加データベース(例示せず)に関連付けられる点は、留意すべきである。
図に示すように、データベース300は、情報源フィールド310、および、情報源ランクフィールド320を含む。データベース300は、データベース300および/またはネットワーク140から読み出された情報における情報の検索および分類に役立つ、追加フィールドを含むことができる。
情報源フィールド310は、システム100におけるニュースソースを特定することができる。1〜N(Nは1以上である)と表示されるニュースソースは、例えば地方のオンライン新聞または地方のテレビ局のウェブサイトといった地域のニュースソース、国内のニュースソース、海外のニュースソース、専門ニュースソース(例えば、技術・スポーツ・または娯楽に関する雑誌、もしくはこれらの新聞)、および/または、インターネットといったネットワーク由来のあらゆるタイプのニュースソースを含むことができる。例えば、ニュースソースには、Washington Post、CNN、MSNBC、BCC、New York Post、USA Today、Pittsburgh Post−Gazette、ESPN、Sports Illustrated等のオンライン版を含むことができる。
情報源ランクフィールド320は、情報源フィールド310で特定された情報源から読み出された記事(またはドキュメント)のランク付けを調整するために使用できる値を格納することができる。このようにして、より品質の高いニュースソースからの記事のランク付けは、より品質の低いニュースソースからの同トピックに関する記事よりも高いランクへと調整することができる。以下に詳細に記述されるように、既定のニュースソースの値は、少なくとも、そのニュースソースの信頼性、レポートの精度、文体にみるプロ意識、等を基準にすることができる。
(プロセシングの一例)
図4は、本発明の原理にかかる実施態様におけるニュースソースのための情報源ランクを決定するためのプロセスの一例のフローチャートである。以下に記述するプロセスは、例えば、サーバ120によって自動的に、あるいは、人による手動操作によって、実行することができる。別の実施態様においては、以下に記述する一部のプロセスが自動的に実行され、一方で、他の部分は手動によって実行することができる。
各ニュースソースについての一群のメトリックを考慮することによって、処理が開始される(動作405)。各メトリックは、ニュースソースの品質の部分指標としての役目を果たす、ニュースソースの特定の属性を測定することができる。本発明の原理にかかる一実施態様において、各メトリックは、数値として算出される。ここで例えば、より高く算出された値は、より高品質のニュースソースを表すことができる。
以下にさらに詳細に記述されるように、一群のメトリックは、既定の期間中にニュースソースによって産出された記事の数、ニュースソース由来の記事の平均長、ニュースソース由来の報道の重要性、ニュース速報スコア、使用パターン、人の意見、貸出統計、ニュースソースに関連する人員のサイズ、ニュースソースに関連する局の数、ニュースソースが一群の記事内で産出する最初に登録された事業体の数、報道の幅広さ、国際的多様性、文体等を含むことができる。ニュースソースの品質の決定における第1のメトリックは、既定の期間にニュースソースによって産出された記事の数を含むことができる。この期間は、1週間、2週間、あるいは1ヶ月等であってもよい。本発明の原理にかかる1つの実施態様において、第1のメトリックは、この期間中にニュースソースによって産出された重複しない記事の数を数えることによって決定することができる。もう1つの実施態様においては、第1のメトリックは、ニュースソースによって産出されたオリジナル文の数を数えることによって決定することができる。
第2のメトリックは、ニュースソース由来の記事の平均長を含むことができる。平均長が、例えば、単語や文で測定することができる。本発明の原理にかかる1つの実施態様において、第2のメトリックは、ニュースソースによって産出された重複しない記事の平均長を定めることによって決定することができる。例えば、CNNの1つの記事の平均長は300語である一方で、Amateur News Networkについては150語であると、決定することができる。したがって、CNNに対する第2のメトリックの値は300、Amateur News Networkについては150とすることができる。
第3のメトリックは、ニュースソースによる報道範囲の重要性を含む。このメトリックは、少なくとも、既定の記事に対する潜在的なニュースストーリーの「サイズ」(これより「ストーリーサイズ」と称する)が決定される可能性があるという仮定に基づかせることができる。このメトリックは、固定された期間中に検討したニュースソースによって産出された全ての重複しない記事についてのストーリーサイズ・スコアに相当する総価値である。この期間は、1週間、2週間、あるいは1ヶ月等であってもよい。一例として、Dが1つの記事である場合、Dのストーリーサイズは、(例えば、サーバ120といった)同じ題材で存在するシステムに周知の相異なる他の記事の数として測定されるだろう。例えば、Dがスペースシャトル「コロンビア号」の衝突に関する記事であって、さらに、500もの他の相異なる記事が同じ題材で存在する場合、ストーリーサイズは500である。特定の題材に関するその他の記事を検出する技法は、多く存在する。例えば、同時係属中で同一出願人の、2003年6月30日付出願の特許文献1(発明の名称「文書のランキングを行う方法及び装置」)、および、2003年6月30日付出願の特許文献2(発明の名称「ニュースコンテンツのクラスター化された体系化の方法及び装置」)において、2つのそのような技法が記述されている。両者のいずれもが、全体を参照することによって本明細書に明示的に援用されている。一群の関連記事は、以下「クラスタ」と称する。本発明の原理にかかる1つの実施態様において、メトリック値は、最も大きいNのストーリーサイズに限定することができる。ここでNは、1以上の正の整数であって、既定された期間に既知の情報源によって報道される(例えば、サーバ120が、1週間のうちにCNNによって報道される最大100のストーリー)。
第4のメトリックは、ニュース速報スコアの代表値を含むことができる。このメトリックは、重要な出来事が起こった直後にストーリーを公開するために、ニュースソースの能力を測定する。このメトリックは、ニュースソースに由来する重複しない記事の各々のうち「最新スコア」を平均化できる。ここで例えば、最新スコアとは、そのニュースイベントが起こって直後に記事が公開された場合、高い値となる数であり、ニュースストーリーが起こってから多くの時間が経過した後に記事が公開された場合は低い値となる。
本発明の原理にかかる実施態様において、クラスタ内の全ての記事が、公開時間によって増加方向で格納され、さらに、第1の記事時間が、その出来事の起こった時であるとみなされる。例えば、Tは、現在の記事と最初の記事との時間よる差異と仮定しよう。閾値N1は、ストーリーが、もはや最新ではないとみなされた後の間隔を示すために使用することができる。したがって、ニュース速報スコア・メトリックは、
If T>N1, then breaking_score=0
If 0<T<N1, then breaking_score=log(N1/T)
並びに、
If T=0, then breaking_score=log(N1)
と定義できる。N1は、例えば3時間といったように、時間で表示される。
本発明の原理にかかる別の実施態様では、クラスタ内の全ての記事は、増加方向で時間によって格納され、さらに、各記事のランクは上記記載の値Tとみなされる。同様に、閾値N2を使用することができる。したがって、ニュース速報スコアのメトリックは、
If T>N2, then breaking_score=0
ならびに、
If 1<T<N2, then breaking_score=log(N2/T)
ある実施態様例において、N2は10であってもよい。
本発明の原理にかかるさらに別の実施態様において、上記で定義されたニュース速報スコアは、既定の記事が属する関連記事のクラスタのサイズに比例する数量を乗算することができる。例えば、ニュース速報スコアは、係数=(1+log(クラスタサイズ))を乗算することができる。このことは、ストーリーが重要で、且つ、大きなクラスタを形成すると見られる場合に、ニュース速報の値を重要視する。
さらにまた別の実施態様では、最新スコアの平均化の代わりに、クラスタサイズが所定の値(例えば、30)を超える場合、その値は、合計される。したがって、この場合においては、ニュース速報スコアは、以下のように定義することができる。
各記事Aについて:
If((Size(Cluster(A))>30:
breaking_news[Source(A)]+=30−rank_within_cluster(A)
第5のメトリックは、使用パターンを表示する値を含むことができる。ニュース検索エンジンのウェブページから個々の記事へ通るリンクは、使用(例えば、クリック)に際し監視される。しばしば選定されるニュースソースが検出され、使用の監視に比例する値が割り当てられる。CNNといった、周知のサイトは、無名のタウンニュースといった人気の少ないサイトよりも好まれる傾向にあり、人気の少ないサイトを避ける可能性がある。測定されたトラフィックは、ニュース検索エンジンの嗜好によるランク付けに起因する測定のバイアスを避けるために、読者がリンクのアクセスで得た機会の数によって正規化することができる。
第6のメトリックは、ニュースソースについて人の意見を表示する値を含むことができる。本発明の原理にかかる1つの実施態様では、ユーザは一般的に、楽しんで読む(またはアクセスした)新聞(または雑誌)を特定するために投票することができる。別の方法またはこれに加えて、このニュース検索エンジンのユーザは、ユーザが楽しんでアクセスするウェブサイトに決定するよう投票することができる。その他の機関によるニュースサイトの評価もまた、利用することができる(例えば、新聞は、少なくともその新聞が受賞したピューリッツァー賞の数の一部に基づいて比較される可能性がある)。さらに、ニュースソースの寿命は、公的な信用の尺度と捉えられメトリックとして使用することができる。別の実施態様において、評価する者が、個々のニュースソースからの記事の選択を示し、各情報源にスコアを与えるように依頼することもできる。これにより与えられたスコアは、メトリックとみることができる。
第7のメトリックは、ニュースソースの貸出統計を表示する値を含むことができる。例えば、Media Matrix and Nielsen Netratingsといった機関は、(例えば、ニュースサイトといった)オンラインサイトの利用統計を公開する。これらの公開されたトラフィック数は、ニュースソースの品質の尺度として使用することができる。本発明の原理にかかる1つの実施態様では、このニュースサイトに関連する印刷された新聞の貸出統計は、メトリックとみなすことができる。
第8のメトリックは、ニュースソースに関連付けられた人員のサイズを表示する値を含むことができる。本発明の原理にかかる1つの実施態様において、その人員のサイズは、そのニュースソースに由来する記事に挙げられた特異的なジャーナリスト名の数のうち少なくとも一部に基づいて決定することができる。
第9のメトリックは、ニュースソースに関連付けられる報道局の数を表示する値を含むことができる。
第10のメトリックは、ニュースソースが関連記事のクラスタ内で産出する最初に登録された事業体の数を表示する値を含むことができ、例えば、少なくともN個の関連記事(例えば、N=3)を有する全ての記事を平均化する。登録された事業体は、人・場所・または機関に相当する。ニュースソースが、同クラスタ内(故に、同トピック)の他の記事を含有しない登録された事業体を含有する、ニュースストーリーを生成する場合、このニュースソースは、最初に報道する能力があることの暗示である可能性がある。この解析において、閾値サイズNのクラスタにおける既知のニュースソースによって加算された平均値が、評価される。本発明の原理にかかる1つの実施態様においては、登録された事業体が、クラスタ中でより以前に公開された記事が同じ登録事業体を有していないかどうか検討される。登録された事業体は、スペリングおよび略語中のばらつきを相殺するために、近似の文字列照合を使用して比較することができる。他の記事に記載のどの事業体とも明らかに異なる登録事業体は、オリジナルとみなすことができる。
第11のメトリックは、ニュースソースの幅広さ(例えば、情報源がコンテンツを産出するトピックの数)を表示する値を含むことができる。本発明の原理にかかる1つの実施態様において、ニュースソース由来の記事は、一連のトピック(例えば、芸術、音楽、スポーツ、ビジネス等)へと類別することができ、さらに、トピックの範囲は、幅広さの尺度として使用することができる。あらゆる従来型の分類技術が、記事をトピックへと類別するために使用される可能性がある。例えば、機械学習文献に由来する分類システムは、ニュース記事を選択された一連のトピックへと類別するために使用することが可能である。別の実施態様においては、ニュースソースによって公開されたセクションの数は、幅広さの尺度とみなすことができる。
第12のメトリックは、ニュースソースの国際的多様性を表示する値を含むことができる。このメトリックは、ニュースサイトがネットワーク・トラフィックを受信する国の数を測定することができる。本発明の原理にかかる1つの実施態様において、このメトリックは、既知のユーザがニュース・ウェブサイトへアクセスしてくる(たとえば、検索サイトから測定されたニュースソースによる記事へのリンクをクリックするユーザのインターネット・プロトコル(IP)アドレス上の少なくとも一部に基づく)国を考慮することによって、測定することができる。対応するIPアドレスは、国マッピングに対する既知のIPブロックについてのテーブルに基づいて、アクセス元の国へとマッピングできる。別の実施態様においては、既知のニュース・ウェブサイトへリンクするウェブサイトのIPアドレスが監視され、ニュースサイトがリンクされた異なる国々の数は、メトリックとして使用することができる。
第13のメトリックは、ニュースソースに使用される文体を表示する値を含むことができる。スペリングの正確さ・文法・および知識レベルを測定するための自動化されたテストは、文体を反映するメトリック値を生成するために使用することが可能である。文体について測定された品質に比例するスコアが、その次に割り当てられる。
その他のメトリックは、前述した一群のメトリックへ追加されたものあるいはもう別のものとみなされる点は、留意すべきである。例えば、別のメトリックは、ニュース・ウェブサイトへとハイパーリンクの数を表示する値を含むことができる。
一群のメトリックが考慮されると、各ニュースソースについての情報源ランクは、一群のメトリックの少なくとも一部に基づいて決定することができる(動作410)。ニュースソースに対する情報源ランクを決定するために、上述した一群のメトリックの一部または全部は、ニュースソースに対する最終スコア(例えば、情報源ランク)を産出するように結合させることが可能である。多くの技法が、ニュースソースの情報源ランクを決定するために使用できる。例えば、本発明の原理にかかる1つの実施態様において、各メトリックは、対応する係数を乗算することができ、さらにその結果算出された値は、ニュースソースについての情報源ランクを与えるよう合計することができる。もう1つの方法として、各メトリックは、0〜1の範囲になるように正規化することができ、さらにその結果算出された値は、最終メトリック値(すなわち、情報源ランク)を合計することにより得られる。例えば、この正規化は、このメトリックに割り当てられた最大限可能な値で各メトリックを除算することによって達成できる。
別の実施態様においては、様々なメトリックにおけるニュースソースの平均ランクが、計算される。例えば、CNNが、貸出統計で1のランク、国際的人気度で2のランク、国際的な局数では9のランクを有する場合、(これらのメトリックだけを考慮すると)CNNは、
(1+2+9)/3=4
の平均ランクを有する。
各ニュースソースについて、さらなる実施態様においては、このメトリックに対する最高ニュースソースに関連する各メトリックの百分率スコアは、ニュースソースについての情報源ランクを決定するために使用することできる。例えば、CNNが国際的人気度で2のランクで、BCCが同メトリックで最高ランクの10を有する場合、このメトリックに対するCNNの百分率スコアは0.2であるとすることができる。
上述した技術に関するもう1つの実施態様として、上述した技法のうちの1つは、考慮されている既知のニュースソースについての最高値Nのみを使用することができる。Nは、1以上の正の整数であることができる。1つの実施態様においては、Nは5であってもよい。既知のニュースソースについての最高Nのメトリックのみを考慮することにより、このことは、いくつかのメトリックがまだ計算し終えていないニュースソースの組み込みを可能にする。
ニュースソースについて情報源ランクが決定されると、この情報源ランクは、サーバ120によって格納される(動作415)。
図5は、本発明の原理にかかる実施態様における、オブジェクト(例えば、ニュース記事)のランク付けを調整するためのプロセスの一例に関するフローチャートである。以下の記述が検索クエリ結果として読み出されたオブジェクトのランク付けに焦点を当てると同時に、本発明の原理にかかる実施態様は、それほど限定されるものではない。実際には、本発明の原理にかかる実施態様は、スコア付け基準に従ってニュース記事をランク付けする、あらゆるシステムまたは方法に、等しく応用が可能である。その基準は、例えば、クエリ(例えば、以下のシナリオ例に記述された検索エンジン)、トピック(例えば、スポーツ)、キーワードのリスト(例えば、最初の検索結果ドキュメント由来のキーワード)、地理的領域(例えば、ニューヨーク)、一群の記事における記事のリスト、あるいは、一連のドキュメント例を含めることが可能である。
プロセシングは、例えば、クライアント110といったような、クライアント上のウェブ・ブラウザ・ソフトウェアを使用するサーバ120にアクセスするユーザから開始する(図1)。ユーザは、サーバ120によって保守されている1つ以上の検索語から検索エンジン125までを含むクエリを提供する(動作505)。1つの実施態様において、この検索クエリは、新トピックに関係する1つ以上の用語を含む。例えば、ユーザがGeorge Bushについてのニュース記事を見たいと望む場合、このユーザは、クライアント110に、検索語「George Bush」を指定する検索クエリを、サーバ120へと送信させる。
検索クエリの受信に応答して、サーバ120は、従来型の方法でランク付けされた結果のリストを生成することができる(動作510)。この結果は、ニュース記事への参照(例えば、リンク)および場合によってはリンクのテキスト解説を含むことができる。サーバ120は、ランク付けされたリスト中の各リンクについて、そのリンクは情報源ランクが決定されたニュースソースに対応するかどうかを決定することができる。情報源ランクがリンクに存在するかどうかを決定するために、サーバ120は、リンクが対応するニュースソースを特定することができる(動作515)。1つの実施態様において、サーバ120は、リンクに関連付けられたURL(Uniform Resource Locator)の少なくとも一部に基づくニュースソースを特定することができる。例えば、サーバ120は、リンク「www.cnn.com/2003/abc/index.html」はニュースソース「CNN」に対応すると決定することができる。あるリンクが対応するニュースソースを特定するためのその他の技法が、代わりに使用されてもよい。
ニュースソースが識別されると、サーバ120は、例えばデータベース300にアクセスすることもしくはリンクに対応するニュースソースが情報源フィールド310に格納されているかどうかを決定することによって、情報源ランクがリンクに存在するかどうかを決定することができる(動作520)。ニュースソースが、情報源フィールド310に存在しない場合、サーバ120は、リンクのランク付けを調整することはできない。その一方で、ニュースソースが情報源フィールド310に存在する場合、サーバ120は、情報源ランクフィールド320からニュースソースの情報源ランクを読み出すことができる。サーバ120は、結果、読み出された情報源ランクの少なくとも一部に基づくニュースソースに対応するリンクのランク付けを調整することができる(動作520)。
リンクの初期ランク付けR1を仮定すると、サーバ120は、各リンクについて向上したスコアを計算することによって調整されたランク付けR2を生産することができる。サーバ120は、R1でのランク付けに対応するスコアおよびリンクに関連付けられたニュースソースについての情報源ランクを組み合わせることによって、新しいスコアを決定することができる。本発明の原理にかかる実施態様においては、サーバ120は、加重和として新しいスコアを決定することができる。例えば、サーバ120は、以下のように、リンクに対する新しいスコアを決定することができる。
NEWSCORE(D)=alpha*OLDSCORE+beta*SOURCERANK(SOURCE(D))
ここでSOURCE(D)とはリンクDのニュースソースであり、alphaおよびbetaは、相応する定数である。例えば、本発明の原理にかかる1つの実施態様において、alphaは0.8に、betaは0.2に設定することができる。alphaおよびbetaに対するその他の値が、代わりの方法として使用できる点は、留意すべきである。例えばR1スコアおよび情報源ランクの平均をとるといったような、リンクのランク付けを調整するための他の技法が、代わりの方法として使用できる。このようにして、向上したニュースリンクのランキングが生産できる。
ランク付けされたリストが調整されると、サーバ120は、リンクの調整・ランク付けされたリストをクライアント110に提供する(動作525)。サーバ120は、ネットワーク140を経由して、調整されたリンクのリストをクライアント110に伝送することができる。
本発明の原理にかかるその他の実施態様において、サーバ120は、動作510において、検索クエリの受信に応答してランク付けされていない検索結果のリストを読み出すことができる。この例で、サーバ120は、検索結果リストに関連付けられているニュースソースに関連付けられた情報源ランクに基づく検索結果のリストをランク付けすることができる。
(結論)
本発明の原理にかかる実施態様は、ニュース記事に関連付けられたニュースソースの品質の少なくとも一部に基づくニュース記事のランク付けを向上させることができる。
前述の本発明についての実施例の記述は、例証および記述を提供するが、網羅的であることや開示された正確な形式へと本発明を限定することなどを目的としない。修正および偏光は、上述の教示に照らして起こりうるし、さらに本発明の実践から獲得することもできるだろう。例えば、上述した関数は、サーバ120で実行される必要はない。その他の実施態様においては、図5に記述した1つ以上の動作は、クライアント110で実行することができる。例えば、ブラウザアシスタント(すなわち、従来型のウェブブラウザと連動して作動するソフトウェア)は、図5のプロセスに関して記述した1つ以上の動作を実行することができる。
さらに、上述したように、本発明の原理にかかる実施態様は、ニュース記事のランク付けに限定されない。例えば、本発明の原理にかかる実施態様は、ネットワークから読み出しができるしあるいは1つ以上のデータベースを形成することも可能な、その他の種類の項目をランク付けするために使用することができる。
図4および図5に関して一連の動作が記述されているとはいえ、動作の順序は、本発明の原理にかかる別の実施態様においては変化することができる。さらに、従属しない動作が、平行して実行されてもよい。
本出願の記述で使用される要素、動作、または命令は、そのようなものとして明示的に記述されない限り、本発明にとって重要かつ必要なものとして解釈されるべきではない。
本発明の原理にかかるシステムおよび方法が実施態様されたシステムの一例である。 本発明の原理にかかる実施態様における図1のサーバの一例である。 本発明の原理にかかる実施態様における図2のサーバと関連付けることも可能なデータベースの一例である。 本発明の原理にかかる実施態様におけるニュースソースについて情報源ランクを決定するためのプロセスの一例のフローチャートである。 本発明の原理にかかる実施態様におけるオブジェクトのランク付けを調整するためのプロセスの一例のフローチャートである。
符号の説明
100 システム
110 クライアント
120 サーバ
125 検索エンジン
130 サーバ
140 ネットワーク

Claims (31)

  1. リンクのリストの受信と、
    各リンクに対して、前記リンクに関連付けられた情報源の特定と、
    前記特定された情報源の品質の少なくとも一部に基づく前記リンクのリストのランク付けと
    を備えることを特徴とする、結果をランク付けするための方法。
  2. 前記情報源の特定が、
    前記リンクに関連付けられたURL(Uniform Resource Locator)の少なくとも一部に基づく前記情報源の特定を含むことを特徴とする請求項1記載の方法。
  3. 前記特定された情報源の少なくとも幾つかがニュースソースであることを特徴とする請求項1記載の方法。
  4. 前記ランク付けが、特定された各情報源に対する情報源ランク値の読み出しを含むことを特徴とする請求項1の方法であって、第1の期間中に前記特定された情報源によって産出された多数の記事のうち1つ以上の記事、前記特定された情報源によって産出される記事の平均長、前記特定情報源が第2の期間に産出する重要な報道の量、ニュース速報情報源、前記特定された情報源へのネットワーク・トラフィック、前記情報源についての人の意見、前記特定された情報源の貸出統計、前記特定された情報源に関連する人員のサイズ、前記特定された情報源に関連する多数の局、前記特定された情報源に関連する一群の記事に最初に登録された多数の事業体、前記特定された情報源による報道の範囲、前記特定された情報源へのトラフィックの発信元となる多数の国、および、前記特定された情報源に使用する文体の少なくとも一部に基づく前記情報源ランク値の読み出しを含むことを特徴とする方法。
  5. 前記リンクのリストはリンクがランク付けされたリストであって、
    さらに、前記ランク付けが前記特定された情報源の品質の少なくとも一部に基づく、前記リンクのランク付けリストの調整を含むことを特徴とする請求項1記載の方法。
  6. 前記リンクがオンライン・ニュース記事へのリンクを含むことを特徴とする請求項1記載の方法。
  7. 1つ以上の検索クエリ、トピック、1つ以上のキーワード、地理的領域、および一連のドキュメントの少なくとも一部に基づく前記リンクのリストの決定をさらに含むことを特徴とする請求項1記載の方法。
  8. オブジェクトのリストを受信するための手段と、
    前記リスト中の各オブジェクトに対して、前記オブジェクトに関連付けられた情報源を特定するための手段と、
    前記オブジェクトが関連付けられた前記情報源の少なくとも一部に基づく前記オブジェクトのリストをランク付けするための手段と
    を備えることを特徴とする、検索結果のランク付けを調整するためのシステム。
  9. 複数の情報源に対する品質指標を格納するために設定されたメモリと、
    オブジェクトのリストを受信し、
    前記オブジェクトがそれぞれ関連付けられた情報源を特定し、
    前記1つのオブジェクトが関連付けられた情報源に関連付けられた品質指標の少なくとも一部に基づく前記オブジェクトのリスト中の少なくとも1つのオブジェクトをランク付けするように設定されたプロセッサと
    を備えることを特徴とするサーバ。
  10. 検索クエリに応答して読み出されたオブジェクトのリストをランク付けするための方法を実行するために少なくとも1つのプロセッサを制御するための命令を含有する、コンピュータへ読み込み可能な媒体であって、前記方法が、
    前記オブジェクトのリスト中において前記読み出された各オブジェクトに関連付けられた情報源の特定と、
    1つのオブジェクトが関連付けられた情報源と関連付けられた品質指標の少なくとも一部に基づく、前記オブジェクトのリスト中の少なくとも1つのオブジェクトのランク付けと、
    を備えることを特徴とする、前記コンピュータへ読み込み可能な媒体。
  11. 情報源の品質を決定するための方法であって、
    第1の期間中に前記情報源によって産出された多数の記事のうち少なくとも1つの記事、前記情報源によって産出される記事の平均長、前記情報源が第2の期間に産出される重要な報道の量、ニュース速報スコア、前記情報源へのネットワーク・トラフィックの量、
    前記情報源についての人の意見、前記情報源の貸出統計、前記情報源に関連する人員のサイズ、前記情報源に関連する多数の局、前記情報源に関連する一群の記事に最初に登録された多数の事業体、前記情報源による報道の幅広さ、前記情報源へのトラフィックの発信元となる多数の国、および、前記情報源に使用する文体の少なくとも一部に基づく前記情報源についての1つ以上のメトリック値の決定と、
    前記決定された1つ以上のメトリック値の少なくとも一部に基づく情報源についての品質値の生成と
    を備えることを特徴とする方法。
  12. 前記決定が、前記情報源についての複数のメトリック値の決定を含むことを特徴とする請求項11記載の方法。
  13. 前記生成が、
    複数の調整されたメトリック値を算出するための、前記複数のメトリック値中の各メトリック値の係数による乗算と、
    前記品質値を獲得するための前記複数の調整されたメトリック値の加算と、
    を含むことを特徴とする請求項12記載の方法。
  14. 前記複数のメトリック値が前記情報源に対する最も高いメトリック値の設定回数を含むことを特徴とする請求項13記載の方法。
  15. 前記生成が、
    前記複数のメトリック値における各メトリック値の正規化と、
    前記品質値を獲得する前記複数の標準化されたメトリック値の加算と
    を含むことを特徴とする請求項12記載の方法。
  16. 前記複数のメトリック値が、前記情報源に対する最も高いメトリック値の設定回数を含むことを特徴とする請求項15の方法。
  17. 前記生成が、
    全体値を産出する前記複数の情報源に対するメトリック値の加算と、
    前記複数のメトリック値における若干のメトリック値による全体値の分割による品質値の獲得と
    を含むことを特徴とする請求項12記載の方法。
  18. 前記複数のメトリック値が、前記情報源に対する最も高いメトリック値の設定回数を含むことを特徴とする請求項17記載の方法。
  19. 前記生成が、
    前記複数のメトリック値における各メトリック値に対する、前記メトリックの最高値に対する百分率スコアの決定と、
    前記品質値を獲得するための前記百分率スコアの加算と
    を含むことを特徴とする請求項12記載の方法。
  20. 前記複数のメトリック値が、前記情報源に対する最も高いメトリック値の設定回数を含むことを特徴とする請求項19記載の方法。
  21. 複数の他の情報源について,異なるニュースソースを含む前記複数の他の情報源のうちの少なくとも1つに対する決定および生成の反復と、
    前記情報源についての品質値および前記複数の他の情報源の格納と、
    を備えることを特徴とする請求項11記載の方法。
  22. 前記ニュースソースに関連付けられたオブジェクトをランク付けするために品質値の使用をすることを含むことを特徴とする請求項11の方法。
  23. 請求項11の方法であって、
    前記決定は、前記情報源が第2の期間に産出する重要な報道の量を表示する重要メトリック値の決定を含むことを特徴とし、さらに、
    前記重要メトリックの決定が、
    前記第2の期間中の情報源によって産出された各記事に対し、前記記事についての重要値を産出するため他の情報源によって産出された同じ題材についての複数の重複しない記事の決定と、
    前記重要メトリック値を獲得するための前記メトリック値の加算と
    を含むことを特徴とする方法。
  24. 請求項11の方法であって、
    前記決定は、前記ニュース速報スコアを表示するニュース速報メトリック値の決定を含み、さらに、
    前記ニュース速報メトリック値が、
    少なくとも前記情報源によって産出された1つの記事に対し、前記少なくとも1つの記事が前記情報源によって公開された第1の値の決定と、
    最初の記事が前記少なくとも1つの記事として同じ題材で公開された、第2の時間値の決定と、
    相違時間値を決定する前記第1の時間値から前記第2の時間値の減算と、
    相違時間値と閾値との比較と、
    前記比較の少なくとも一部に基づくニュース速報メトリック値の割当てと
    を含むことを特徴とする方法。
  25. 前記ニュース速報メトリック値の決定が、
    前記少なくとも1つの記事として同じ題材である他の情報源からの一群の記事の特定と、
    前記値をニュース速報メトリック値に割り当てる前の、前記値および、前記他の情報源からの一群の記事のサイズに比例する数量の乗算と
    をさらに含むことを特徴とする請求項24記載の方法。
  26. 1つ以上のメトリック値の決定において、重複しない記事を重複する記事よりも重要性が高いことを特徴とする請求項11の方法。
  27. メモリと、
    第1の期間中に前記情報源によって産出された多数の記事のうち少なくとも1つの記事、前記情報源によって産出される記事の平均長、前記情報源が第2の期間に産出される重要な報道の量、ニュース速報スコア、前記情報源へのネットワーク・トラフィックの量、前記情報源についての人の意見、前記情報源の貸出統計、前記情報源に関連する人員のサイズ、前記情報源に関連する多数の局、前記情報源に関連する一群の記事に最初に登録された多数の事業体、前記情報源による報道の幅広さ、前記情報源へのトラフィックの発信元となる多数の国、前記情報源に使用する文体の少なくとも一部に基づく情報源についての1つ以上のメトリック値を決定し、
    前記決定された1つ以上のメトリック値の少なくとも一部に基づく前記情報源についての品質値を決定し、
    前記メモリに前記品質値を格納するように設定されたプロセッサと、
    を備えることを特徴とするサーバ。
  28. 情報源の品質を決定するための方法を実行するために少なくとも1つのプロセッサ制御用の命令を含有するコンピュータへの読み込み可能な媒体であって、前記方法が、
    複数の情報源の各情報源について、第1の期間中に前記情報源によって産出された多数の記事のうち少なくとも1つの記事、前記情報源によって産出される記事の平均長、前記情報源が第2の期間に産出される重要な報道の量、ニュース速報スコア、前記情報源へのネットワーク・トラフィックの量、前記情報源についての人の意見、前記情報源の貸出統計、前記情報源に関連する人員のサイズ、前記情報源に関連する多数の局、前記情報源に関連する一群の記事に最初に登録された多数の事業体、前記情報源による報道の幅広さ、前記情報源へのトラフィックの発信元となる多数の国、および、前記情報源に使用する文体の少なくとも一部に基づく1つ以上のメトリック値の決定と、
    前記情報源に対する前記決定された1つ以上のメトリック値の少なくとも一部に基づく前記複数の情報源の各々についての品質値の決定と、
    を備えることを特徴とする、前記コンピュータへの読み込み可能な媒体。
  29. 検索結果を提供するための方法であって、
    オブジェクトのリストの受信と、
    前記複数のオブジェクトの前記各オブジェクトに関連付けられた情報源の特定と、
    前記情報源の各々の品質の決定と、
    前記オブジェクトに関連付けられた前記情報源の前記決定された品質の少なくとも一部に基づく前記複数のオブジェクトの各オブジェクトのランク付けと、
    を備えることを特徴とする方法。
  30. 前記特定された情報源の各々の品質の決定が、
    特定された各情報源について、第1の期間中に前記情報源によって産出された多数の記事のうち少なくとも1つの記事、前記情報源によって産出される記事の平均長、前記情報源が第2の期間に産出される重要な報道の量、ニュース速報スコア、前記情報源へのネットワーク・トラフィックの量と、前記情報源についての人の意見、前記情報源の貸出統計、前記情報源に関連する人員のサイズ、前記情報源に関連する多数の局、前記情報源に関連する一群の記事に最初に登録された多数の事業体、前記情報源による報道の幅広さ、前記情報源へのトラフィックの発信元となる多数の国、前記情報源に使用する文体の少なくとも一部に基づく1つ以上のメトリック値の決定と、
    前記情報源に対する前記決定された1つ以上のメトリック値の少なくとも一部に基づく前記特定された情報源の各々の品質の生成と
    を含むことを特徴とする請求項29記載の方法。
  31. 前記複数のオブジェクトがオンライン・ニュース記事を含むことを特徴とする請求項29記載の方法。
JP2006526402A 2003-09-16 2004-09-14 ニュース記事のランク付けを向上させるためのシステムおよび方法 Active JP5632574B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/662,931 US7577655B2 (en) 2003-09-16 2003-09-16 Systems and methods for improving the ranking of news articles
US10/662,931 2003-09-16
PCT/US2004/030028 WO2005029368A1 (en) 2003-09-16 2004-09-14 Systems and methods for improving the ranking of news articles

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014091127A Division JP5797806B2 (ja) 2003-09-16 2014-04-25 ニュース記事のランク付けを向上させるためのシステムおよび方法

Publications (2)

Publication Number Publication Date
JP2007517269A true JP2007517269A (ja) 2007-06-28
JP5632574B2 JP5632574B2 (ja) 2014-11-26

Family

ID=34274249

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006526402A Active JP5632574B2 (ja) 2003-09-16 2004-09-14 ニュース記事のランク付けを向上させるためのシステムおよび方法
JP2014091127A Expired - Fee Related JP5797806B2 (ja) 2003-09-16 2014-04-25 ニュース記事のランク付けを向上させるためのシステムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014091127A Expired - Fee Related JP5797806B2 (ja) 2003-09-16 2014-04-25 ニュース記事のランク付けを向上させるためのシステムおよび方法

Country Status (6)

Country Link
US (6) US7577655B2 (ja)
EP (1) EP1665100A1 (ja)
JP (2) JP5632574B2 (ja)
CN (2) CN1853183A (ja)
CA (1) CA2536449A1 (ja)
WO (1) WO2005029368A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200267A (ja) * 2006-01-29 2007-08-09 Hiroyasu Yamamoto 新聞と購読者間における購読後反響情報の双方向交流を可能にする新聞のシステム
JP2010176666A (ja) * 2009-01-27 2010-08-12 Palo Alto Research Center Inc ソーシャルインデックスにおける熱いトピック及び冷めたトピックを検出することによりユーザの関心を管理するためのシステム及び方法
JP2010176136A (ja) * 2009-01-30 2010-08-12 Navteq North America Llc 位置コンテンツの品質を評価するための方法及びシステム
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置
JP2019164591A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Families Citing this family (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US7568148B1 (en) 2002-09-20 2009-07-28 Google Inc. Methods and apparatus for clustering news content
US7577655B2 (en) 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
CA2442190A1 (en) * 2003-09-24 2005-03-24 Enquiro Search Solutions Inc. Dynamic web page referrer tracking and ranking
US8700610B1 (en) 2003-09-29 2014-04-15 Google Inc. Systems and methods for providing news alerts
US7836083B2 (en) * 2004-02-20 2010-11-16 Factiva, Inc. Intelligent search and retrieval system and method
US7698333B2 (en) * 2004-07-22 2010-04-13 Factiva, Inc. Intelligent query system and method using phrase-code frequency-inverse phrase-code document frequency module
US9760629B1 (en) 2004-12-29 2017-09-12 Google Inc. Systems and methods for implementing a news round table
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
GB0506618D0 (en) * 2005-04-01 2005-05-11 Wine Science Ltd A method of supplying information articles at a website and system for supplying such articles
US7962462B1 (en) 2005-05-31 2011-06-14 Google Inc. Deriving and using document and site quality signals from search query streams
WO2006130985A1 (en) 2005-06-08 2006-12-14 Ian Tzeung Huang Internet search engine results ranking based on critic and user ratings
US7565358B2 (en) * 2005-08-08 2009-07-21 Google Inc. Agent rank
US7580930B2 (en) * 2005-12-27 2009-08-25 Baynote, Inc. Method and apparatus for predicting destinations in a navigation context based upon observed usage patterns
US8880499B1 (en) 2005-12-28 2014-11-04 Google Inc. Personalizing aggregated news content
US20070185789A1 (en) * 2006-02-09 2007-08-09 Zorthian Gregory J Magazine circulation scoring model
US7451120B1 (en) * 2006-03-20 2008-11-11 Google Inc. Detecting novel document content
US7797313B1 (en) * 2006-03-28 2010-09-14 Symantec Operating Corporation Relevance ranking in a computer system
US7603350B1 (en) 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
US7831928B1 (en) 2006-06-22 2010-11-09 Digg, Inc. Content visualization
US7970938B1 (en) * 2006-08-16 2011-06-28 Vmware, Inc. IP subnet discovery with ranked results
US9514436B2 (en) 2006-09-05 2016-12-06 The Nielsen Company (Us), Llc Method and system for predicting audience viewing behavior
AU2007293092A1 (en) * 2006-09-05 2008-03-13 Innerscope Research, Inc. Method and system for determining audience response to a sensory stimulus
US8086600B2 (en) * 2006-12-07 2011-12-27 Google Inc. Interleaving search results
US20090030717A1 (en) 2007-03-29 2009-01-29 Neurofocus, Inc. Intra-modality synthesis of central nervous system, autonomic nervous system, and effector data
US7668823B2 (en) * 2007-04-03 2010-02-23 Google Inc. Identifying inadequate search content
US8392253B2 (en) 2007-05-16 2013-03-05 The Nielsen Company (Us), Llc Neuro-physiology and neuro-behavioral based stimulus targeting system
US20090013068A1 (en) * 2007-07-02 2009-01-08 Eaglestone Robert J Systems and processes for evaluating webpages
US7831596B2 (en) * 2007-07-02 2010-11-09 Hewlett-Packard Development Company, L.P. Systems and processes for evaluating webpages
CN101815467B (zh) 2007-07-30 2013-07-17 神经焦点公司 神经反应刺激和刺激属性谐振估计器
JP2010536102A (ja) * 2007-08-08 2010-11-25 ベイノート,インク. コンテキストに基づくコンテンツレコメンデーションの方法及び装置
US9244968B2 (en) * 2007-08-14 2016-01-26 John Nicholas and Kristin Gross Trust Temporal document verifier and method
US8386313B2 (en) 2007-08-28 2013-02-26 The Nielsen Company (Us), Llc Stimulus placement system using subject neuro-response measurements
US8392255B2 (en) 2007-08-29 2013-03-05 The Nielsen Company (Us), Llc Content based selection and meta tagging of advertisement breaks
US20090083129A1 (en) 2007-09-20 2009-03-26 Neurofocus, Inc. Personalized content delivery using neuro-response priming data
US8151292B2 (en) 2007-10-02 2012-04-03 Emsense Corporation System for remote access to media, and reaction and survey data from viewers of the media
CN101917898A (zh) 2007-10-31 2010-12-15 埃姆申塞公司 对来自观众的生理响应提供分散式收集和集中式处理的系统和方法
US9171454B2 (en) * 2007-11-14 2015-10-27 Microsoft Technology Licensing, Llc Magic wand
WO2009089116A2 (en) * 2008-01-02 2009-07-16 Three Purple Dots, Inc. Systems and methods for determining the relative bias and accuracy of a piece of news
WO2009094633A1 (en) * 2008-01-25 2009-07-30 Chacha Search, Inc. Method and system for access to restricted resource(s)
US20090265328A1 (en) * 2008-04-16 2009-10-22 Yahool Inc. Predicting newsworthy queries using combined online and offline models
US8952894B2 (en) * 2008-05-12 2015-02-10 Microsoft Technology Licensing, Llc Computer vision-based multi-touch sensing using infrared lasers
JP5500070B2 (ja) 2008-07-30 2014-05-21 日本電気株式会社 データ分類システム、データ分類方法、及びデータ分類プログラム
JP5423676B2 (ja) * 2008-07-30 2014-02-19 日本電気株式会社 データ分類システム、データ分類方法、及びデータ分類プログラム
US8847739B2 (en) 2008-08-04 2014-09-30 Microsoft Corporation Fusing RFID and vision for surface object tracking
US20100031202A1 (en) * 2008-08-04 2010-02-04 Microsoft Corporation User-defined gesture set for surface computing
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
US8095545B2 (en) * 2008-10-14 2012-01-10 Yahoo! Inc. System and methodology for a multi-site search engine
TWI390177B (zh) * 2008-11-24 2013-03-21 Inst Information Industry 景點推薦裝置和方法以及儲存媒體
US8768759B2 (en) * 2008-12-01 2014-07-01 Topsy Labs, Inc. Advertising based on influence
WO2010065111A1 (en) 2008-12-01 2010-06-10 Topsy Labs, Inc. Ranking and selecting enitities based on calculated reputation or influence scores
US20100153372A1 (en) * 2008-12-17 2010-06-17 Sea Woo Kim 3d visualization system for web survey
US8468153B2 (en) * 2009-01-21 2013-06-18 Recorded Future, Inc. Information service for facts extracted from differing sources on a wide area network
US8458171B2 (en) * 2009-01-30 2013-06-04 Google Inc. Identifying query aspects
US8775074B2 (en) * 2009-01-30 2014-07-08 Navteq B.V. Method and system for refreshing location code data
US8554871B2 (en) * 2009-01-30 2013-10-08 Navteq B.V. Method and system for exchanging location content data in different data formats
US8271195B2 (en) 2009-01-30 2012-09-18 Navteq B.V. Method for representing linear features in a location content management system
US20100250325A1 (en) 2009-03-24 2010-09-30 Neurofocus, Inc. Neurological profiles for market matching and stimulus presentation
KR101050013B1 (ko) * 2009-04-30 2011-07-19 엔에이치엔(주) 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법
US20100293179A1 (en) * 2009-05-14 2010-11-18 Microsoft Corporation Identifying synonyms of entities using web search
US8533203B2 (en) * 2009-06-04 2013-09-10 Microsoft Corporation Identifying synonyms of entities using a document collection
US10987015B2 (en) 2009-08-24 2021-04-27 Nielsen Consumer Llc Dry electrodes for electroencephalography
US9560984B2 (en) 2009-10-29 2017-02-07 The Nielsen Company (Us), Llc Analysis of controlled and automatic attention for introduction of stimulus material
US20110106750A1 (en) 2009-10-29 2011-05-05 Neurofocus, Inc. Generating ratings predictions using neuro-response data
US9454586B2 (en) 2009-12-01 2016-09-27 Apple Inc. System and method for customizing analytics based on users media affiliation status
US9129017B2 (en) 2009-12-01 2015-09-08 Apple Inc. System and method for metadata transfer among search entities
US11122009B2 (en) 2009-12-01 2021-09-14 Apple Inc. Systems and methods for identifying geographic locations of social media content collected over social networks
US20120290551A9 (en) * 2009-12-01 2012-11-15 Rishab Aiyer Ghosh System And Method For Identifying Trending Targets Based On Citations
US11036810B2 (en) 2009-12-01 2021-06-15 Apple Inc. System and method for determining quality of cited objects in search results based on the influence of citing subjects
US9280597B2 (en) 2009-12-01 2016-03-08 Apple Inc. System and method for customizing search results from user's perspective
US8892541B2 (en) 2009-12-01 2014-11-18 Topsy Labs, Inc. System and method for query temporality analysis
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
US9110979B2 (en) 2009-12-01 2015-08-18 Apple Inc. Search of sources and targets based on relative expertise of the sources
US9043319B1 (en) * 2009-12-07 2015-05-26 Google Inc. Generating real-time search results
US8606792B1 (en) 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US9953083B2 (en) * 2010-02-16 2018-04-24 Excalibur Ip, Llc System and method for determining an authority rank for real time searching
US8918399B2 (en) * 2010-03-03 2014-12-23 Ca, Inc. Emerging topic discovery
US8732590B2 (en) 2010-04-14 2014-05-20 Linkedin Corporation Techniques for presenting content items to members of a group
WO2011128945A1 (en) * 2010-04-16 2011-10-20 Hitachi, Ltd. Integrated search server and integrated search method
US8684742B2 (en) 2010-04-19 2014-04-01 Innerscope Research, Inc. Short imagery task (SIT) research method
US9600566B2 (en) 2010-05-14 2017-03-21 Microsoft Technology Licensing, Llc Identifying entity synonyms
US8874566B2 (en) * 2010-09-09 2014-10-28 Disney Enterprises, Inc. Online content ranking system based on authenticity metric values for web elements
CN102033914A (zh) * 2010-11-29 2011-04-27 百度在线网络技术(北京)有限公司 基于权威度确定链接资源的可靠描述信息的方法与设备
EP2678822A4 (en) 2011-02-23 2014-09-10 Bottlenose Inc System and method for message analysis in a network or between networks
US8768782B1 (en) 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
US9015037B2 (en) 2011-06-10 2015-04-21 Linkedin Corporation Interactive fact checking system
US8185448B1 (en) 2011-06-10 2012-05-22 Myslinski Lucas J Fact checking method and system
US9087048B2 (en) 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US9176957B2 (en) 2011-06-10 2015-11-03 Linkedin Corporation Selective fact checking method and system
EP2724250A4 (en) * 2011-06-22 2015-05-20 Rogers Communications Inc SYSTEMS AND METHOD FOR ORIENTING DOCUMENT CLUSTERS
US8788502B1 (en) 2011-07-26 2014-07-22 Google Inc. Annotating articles
US9189797B2 (en) 2011-10-26 2015-11-17 Apple Inc. Systems and methods for sentiment detection, measurement, and normalization over social networks
US8843477B1 (en) 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US8832092B2 (en) 2012-02-17 2014-09-09 Bottlenose, Inc. Natural language processing optimized for micro content
US9292858B2 (en) 2012-02-27 2016-03-22 The Nielsen Company (Us), Llc Data collection system for aggregating biologically based measures in asynchronous geographically distributed public environments
US9569986B2 (en) 2012-02-27 2017-02-14 The Nielsen Company (Us), Llc System and method for gathering and analyzing biometric user feedback for use in social media and advertising applications
US9451303B2 (en) 2012-02-27 2016-09-20 The Nielsen Company (Us), Llc Method and system for gathering and computing an audience's neurologically-based reactions in a distributed framework involving remote storage and computing
US8745019B2 (en) 2012-03-05 2014-06-03 Microsoft Corporation Robust discovery of entity synonyms using query logs
US8745081B2 (en) * 2012-03-13 2014-06-03 Yahoo! Inc. Personalization of news articles based on news sources
US10908792B2 (en) * 2012-04-04 2021-02-02 Recorded Future, Inc. Interactive event-based information system
WO2013173802A1 (en) * 2012-05-17 2013-11-21 Google Inc. Systems and methods for crawling and indexing content
US20150169584A1 (en) * 2012-05-17 2015-06-18 Google Inc. Systems and methods for re-ranking ranked search results
US8977613B1 (en) * 2012-06-12 2015-03-10 Firstrain, Inc. Generation of recurring searches
US10032131B2 (en) 2012-06-20 2018-07-24 Microsoft Technology Licensing, Llc Data services for enterprises leveraging search system data assets
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US20140006406A1 (en) * 2012-06-28 2014-01-02 Aol Inc. Systems and methods for analyzing and managing electronic content
US9009126B2 (en) 2012-07-31 2015-04-14 Bottlenose, Inc. Discovering and ranking trending links about topics
US10560057B1 (en) 2012-08-06 2020-02-11 Google Llc Measuring media attention over time based on long term heterogeneous archive data
US9229924B2 (en) 2012-08-24 2016-01-05 Microsoft Technology Licensing, Llc Word detection and domain dictionary recommendation
US9558273B2 (en) * 2012-09-21 2017-01-31 Appinions Inc. System and method for generating influencer scores
US9152714B1 (en) 2012-10-01 2015-10-06 Google Inc. Selecting score improvements
US9043317B2 (en) 2012-12-06 2015-05-26 Ca, Inc. System and method for event-driven prioritization
US10037538B2 (en) * 2012-12-11 2018-07-31 Facebook, Inc. Selection and presentation of news stories identifying external content to social networking system users
US9483159B2 (en) 2012-12-12 2016-11-01 Linkedin Corporation Fact checking graphical user interface including fact checking icons
US10235423B2 (en) * 2012-12-12 2019-03-19 Google Llc Ranking search results based on entity metrics
US8762302B1 (en) 2013-02-22 2014-06-24 Bottlenose, Inc. System and method for revealing correlations between data streams
JP5966974B2 (ja) * 2013-03-05 2016-08-10 富士ゼロックス株式会社 中継装置、クライアント装置、システム及びプログラム
US10747837B2 (en) 2013-03-11 2020-08-18 Creopoint, Inc. Containing disinformation spread using customizable intelligence channels
US9807181B2 (en) * 2013-07-17 2017-10-31 Yahoo Holdings, Inc. Determination of general and topical news and geographical scope of news content
US10169424B2 (en) 2013-09-27 2019-01-01 Lucas J. Myslinski Apparatus, systems and methods for scoring and distributing the reliability of online information
US20150095320A1 (en) 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
US10275531B2 (en) * 2013-10-22 2019-04-30 Steven Michael VITTORIO Medical content search and results
US20220050882A1 (en) * 2013-10-22 2022-02-17 Steven Michael VITTORIO Content search and results
US11222084B2 (en) * 2013-10-22 2022-01-11 Steven Michael VITTORIO Content search and results
CN104699725B (zh) * 2013-12-10 2018-10-09 阿里巴巴集团控股有限公司 数据搜索处理方法及系统
US8990234B1 (en) 2014-02-28 2015-03-24 Lucas J. Myslinski Efficient fact checking method and system
US9972055B2 (en) 2014-02-28 2018-05-15 Lucas J. Myslinski Fact checking method and system utilizing social networking information
US9643722B1 (en) 2014-02-28 2017-05-09 Lucas J. Myslinski Drone device security system
US20150271096A1 (en) * 2014-03-24 2015-09-24 Google Technology Holdings LLC Allocation of Client Device Memory for Content from Content Sources
US9836765B2 (en) 2014-05-19 2017-12-05 Kibo Software, Inc. System and method for context-aware recommendation through user activity change detection
US9886479B2 (en) 2014-07-29 2018-02-06 International Business Machines Corporation Managing credibility for a question answering system
CN104182482B (zh) * 2014-08-06 2018-05-22 中国科学院计算技术研究所 一种新闻列表页判断方法及筛选新闻列表页的方法
US9189514B1 (en) 2014-09-04 2015-11-17 Lucas J. Myslinski Optimized fact checking method and system
WO2016058521A1 (zh) * 2014-10-13 2016-04-21 北京奇虎科技有限公司 判断新闻发布位置和新闻的重要性的方法和装置
WO2016168811A1 (en) 2015-04-17 2016-10-20 Vittorio Steven Michael Content search and results
US9936250B2 (en) 2015-05-19 2018-04-03 The Nielsen Company (Us), Llc Methods and apparatus to adjust content presented to an individual
US10866994B2 (en) * 2015-06-23 2020-12-15 Splunk Inc. Systems and methods for instant crawling, curation of data sources, and enabling ad-hoc search
US11042591B2 (en) 2015-06-23 2021-06-22 Splunk Inc. Analytical search engine
WO2017112808A1 (en) * 2015-12-21 2017-06-29 The Knife Llc Rating a level of journalistic distortion in news media content
US10242096B2 (en) 2016-03-15 2019-03-26 Google Llc Automated news digest
RU2660593C2 (ru) 2016-04-07 2018-07-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения исходной ссылки на исходный объект
WO2018106261A1 (en) * 2016-12-09 2018-06-14 Google Llc Preventing the distribution of forbidden network content using automatic variant detection
JP6453367B2 (ja) * 2017-01-16 2019-01-16 Necパーソナルコンピュータ株式会社 広告サーバおよび広告配信システム
EP3586251A4 (en) * 2017-02-21 2020-09-09 Sony Interactive Entertainment LLC PROCEDURE FOR DETERMINING THE TRUTH OF MESSAGES
CN110020194B (zh) * 2018-08-09 2021-10-08 南京尚网网络科技有限公司 资源推荐方法、装置及介质
RU2731654C1 (ru) 2018-09-17 2020-09-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания пуш-уведомлений, связанных с цифровыми новостями
RU2698916C1 (ru) * 2019-03-14 2019-09-02 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система поиска релевантных новостей
RU2757174C2 (ru) 2019-09-05 2021-10-11 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для ранжирования цифровых объектов на основе связанной с ними целевой характеристики
CN110825958A (zh) * 2019-09-24 2020-02-21 广州数知科技有限公司 一种基于网络热度的热点事件智能排序算法
US11341203B2 (en) * 2019-10-02 2022-05-24 Snapwise Inc. Methods and systems to generate information about news source items describing news events or topics of interest
US11334949B2 (en) * 2019-10-11 2022-05-17 S&P Global Inc. Automated news ranking and recommendation system
US11494416B2 (en) 2020-07-27 2022-11-08 S&P Global Inc. Automated event processing system
US11853697B2 (en) 2021-04-23 2023-12-26 International Business Machines Corporation Dynamically inheriting accumulated attribution

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08335265A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置および方法
JP2002092001A (ja) * 2000-09-20 2002-03-29 World Economic Information Services 高品質情報検索システム
JP2003248691A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69231113T2 (de) 1991-04-08 2001-03-01 Koninkl Philips Electronics Nv Speicherverfahren für bibliographische Information über Daten aus einer endlichen Textquelle, und insbesondere Dokumentverbuchungen zur Verwendung in einem Suchsystem für Ganztextdokumente
US5724567A (en) 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
US5907836A (en) 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US6026388A (en) 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5787420A (en) 1995-12-14 1998-07-28 Xerox Corporation Method of ordering document clusters without requiring knowledge of user interests
US6311197B2 (en) 1996-06-03 2001-10-30 Webtv Networks, Inc. Method for downloading a web page to a client for efficient display on a television screen
US5930798A (en) * 1996-08-15 1999-07-27 Predicate Logic, Inc. Universal data measurement, analysis and control system
JPH10171819A (ja) 1996-12-06 1998-06-26 Fuji Xerox Co Ltd 情報検索装置
US6399337B1 (en) * 1997-06-06 2002-06-04 The Governors Of The University Of Alberta α1,3-fucosyltransferase
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6119124A (en) 1998-03-26 2000-09-12 Digital Equipment Corporation Method for clustering closely resembling data objects
US6275820B1 (en) 1998-07-16 2001-08-14 Perot Systems Corporation System and method for integrating search results from heterogeneous information resources
US6558431B1 (en) * 1998-09-11 2003-05-06 Macromedia, Inc. Storing valid and invalid markup language in strict and relaxed tables respectively
EP1006458A1 (en) * 1998-12-01 2000-06-07 BRITISH TELECOMMUNICATIONS public limited company Methods and apparatus for information retrieval
JP3347088B2 (ja) 1999-02-12 2002-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連情報検索方法およびシステム
US7702537B2 (en) * 1999-05-28 2010-04-20 Yahoo! Inc System and method for enabling multi-element bidding for influencing a position on a search result list generated by a computer network search engine
US7072888B1 (en) 1999-06-16 2006-07-04 Triogo, Inc. Process for improving search engine efficiency using feedback
US6453315B1 (en) 1999-09-22 2002-09-17 Applied Semantics, Inc. Meaning-based information organization and retrieval
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
AU4712601A (en) * 1999-12-08 2001-07-03 Amazon.Com, Inc. System and method for locating and displaying web-based product offerings
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6952806B1 (en) * 2000-01-21 2005-10-04 Xerox Corporation Medium containing information gathered from material including a source and interface for graphically displaying the information
US7137065B1 (en) 2000-02-24 2006-11-14 International Business Machines Corporation System and method for classifying electronically posted documents
US6594654B1 (en) 2000-03-03 2003-07-15 Aly A. Salam Systems and methods for continuously accumulating research information via a computer network
US6859800B1 (en) * 2000-04-26 2005-02-22 Global Information Research And Technologies Llc System for fulfilling an information need
JP3562572B2 (ja) 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
US6772160B2 (en) 2000-06-08 2004-08-03 Ingenuity Systems, Inc. Techniques for facilitating information acquisition and storage
CA2443036A1 (en) 2003-09-14 2005-03-14 Yaron Mayer System and method for improved searching on the internet or similar networks and especially improved metanews and/or improved automatically generated newspapers.
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US6601075B1 (en) 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US7080073B1 (en) * 2000-08-18 2006-07-18 Firstrain, Inc. Method and apparatus for focused crawling
US6628994B1 (en) * 2000-08-31 2003-09-30 Hewlett-Packard Development Company, L.P. Method to obtain improved performance by automatic adjustment of computer system parameters
US6647383B1 (en) 2000-09-01 2003-11-11 Lucent Technologies Inc. System and method for providing interactive dialogue and iterative search functions to find information
US20020038430A1 (en) 2000-09-13 2002-03-28 Charles Edwards System and method of data collection, processing, analysis, and annotation for monitoring cyber-threats and the notification thereof to subscribers
US7200606B2 (en) 2000-11-07 2007-04-03 The Regents Of The University Of California Method and system for selecting documents by measuring document quality
US6978419B1 (en) 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US7080079B2 (en) 2000-11-28 2006-07-18 Yu Philip K Method of using the internet to retrieve and handle articles in electronic form from printed publication which have been printed in paper form for circulation by the publisher
US20020073188A1 (en) 2000-12-07 2002-06-13 Rawson Freeman Leigh Method and apparatus for partitioning system management information for a server farm among a plurality of leaseholds
JP4476476B2 (ja) 2000-12-13 2010-06-09 コニカミノルタホールディングス株式会社 ワークフローシステム及びワークフローシステムにおけるクライアント
US6892189B2 (en) 2001-01-26 2005-05-10 Inxight Software, Inc. Method for learning and combining global and local regularities for information extraction and classification
US6850934B2 (en) 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
JPWO2002099695A1 (ja) * 2001-05-31 2004-09-16 ソニー株式会社 情報処理装置、および情報処理方法、並びにプログラム
US6463265B1 (en) * 2001-06-05 2002-10-08 International Business Machines Corp. Data source hand-off in a broadcast-based data dissemination environment
US20030009496A1 (en) 2001-07-05 2003-01-09 International Business Machines Corporation Bookmarks for world wide web documents with indicators of the hit rates for the web documents from the web sites sending the documents
JP3870043B2 (ja) 2001-07-05 2007-01-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のためのシステム、コンピュータ・プログラム、およびサーバ
US7010527B2 (en) 2001-08-13 2006-03-07 Oracle International Corp. Linguistically aware link analysis method and system
US6978274B1 (en) 2001-08-31 2005-12-20 Attenex Corporation System and method for dynamically evaluating latent concepts in unstructured documents
EP1485825A4 (en) * 2002-02-04 2008-03-19 Cataphora Inc DETAILED EXPLORATION TECHNIQUE OF SOCIOLOGICAL DATA AND CORRESPONDING APPARATUS
US7567953B2 (en) 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US7117201B2 (en) * 2002-03-20 2006-10-03 Hewlett-Packard Development Company, L.P. Resource searching
US20030220913A1 (en) * 2002-05-24 2003-11-27 International Business Machines Corporation Techniques for personalized and adaptive search services
US6892198B2 (en) * 2002-06-14 2005-05-10 Entopia, Inc. System and method for personalized information retrieval based on user expertise
US7171620B2 (en) * 2002-07-24 2007-01-30 Xerox Corporation System and method for managing document retention of shared documents
WO2004025490A1 (en) 2002-09-16 2004-03-25 The Trustees Of Columbia University In The City Of New York System and method for document collection, grouping and summarization
US7568148B1 (en) 2002-09-20 2009-07-28 Google Inc. Methods and apparatus for clustering news content
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US7209875B2 (en) * 2002-12-04 2007-04-24 Microsoft Corporation System and method for machine learning a confidence metric for machine translation
US7577654B2 (en) * 2003-07-25 2009-08-18 Palo Alto Research Center Incorporated Systems and methods for new event detection
US7617203B2 (en) * 2003-08-01 2009-11-10 Yahoo! Inc Listings optimization using a plurality of data sources
US7577655B2 (en) 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
EP1682179A4 (en) * 2003-11-05 2008-09-03 Palingen Inc INCREASED CYTOTOXICITY OF CDIM BINDING ANTIBODY AGAINST B LYMPHOCYTES
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US20070260586A1 (en) * 2006-05-03 2007-11-08 Antonio Savona Systems and methods for selecting and organizing information using temporal clustering
US20090164408A1 (en) * 2007-12-21 2009-06-25 Ilya Grigorik Method, System and Computer Program for Managing Delivery of Online Content
US8818992B2 (en) * 2008-09-12 2014-08-26 Nokia Corporation Method, system, and apparatus for arranging content search results
WO2010065111A1 (en) * 2008-12-01 2010-06-10 Topsy Labs, Inc. Ranking and selecting enitities based on calculated reputation or influence scores
US9338215B2 (en) * 2011-03-14 2016-05-10 Slangwho, Inc. Search engine
US9262773B2 (en) * 2012-05-17 2016-02-16 Trophy Stack, Inc. Method of ranking and displaying certified content
US9712578B2 (en) * 2014-06-17 2017-07-18 Facebook, Inc. Determining stories of interest based on quality of unconnected content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08335265A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置および方法
JP2002092001A (ja) * 2000-09-20 2002-03-29 World Economic Information Services 高品質情報検索システム
JP2003248691A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
CSND200100712007; 坂野 幸臣: '「Googleはヒットする」の秘密も解明 検索エンジン解体新書' INTERNET magazine No.79 , 20010801, P.222-P.235, 株式会社インプレス impress corporation *
CSND200201158002; 原田 昌紀 MASANORI HARADA: 'サーチエンジンにおける検索結果のランキング' bit Vol.32 No.8 , 20000801, P.8-P.14, 共立出版株式会社 *
CSND200301279011; 鈴木 純一 Junichi SUZUKI: 'Web検索エンジン最新事情' WEB+DB PRESS Vol.5 初版 , 20011115, P.108-P.114, (株)技術評論社 *
CSNG200301442015; 佐藤進也,外: '文字列出現頻度比較による情報源間の類似性判定' 情報処理学会研究報告 第2002巻,第28号, 20020315, pp.119-126, 社団法人情報処理学会 *
CSNG200301533007; 武田 浩一 Koichi TAKEDA: 'サイト・アウトライニング-インターネットからの情報収集と可視化技術- Site Outlining-Internet Inform' 情報処理 第42巻 第8号 IPSJ MAGAZINE , 20010815, P.781-P.786, 社団法人情報処理学会 Information Processing Socie *
JPN6010010449; 坂野 幸臣: '「Googleはヒットする」の秘密も解明 検索エンジン解体新書' INTERNET magazine No.79 , 20010801, P.222-P.235, 株式会社インプレス impress corporation *
JPN6010010453; 原田 昌紀 MASANORI HARADA: 'サーチエンジンにおける検索結果のランキング' bit Vol.32 No.8 , 20000801, P.8-P.14, 共立出版株式会社 *
JPN6010010458; 鈴木 純一 Junichi SUZUKI: 'Web検索エンジン最新事情' WEB+DB PRESS Vol.5 初版 , 20011115, P.108-P.114, (株)技術評論社 *
JPN6010010460; 武田 浩一 Koichi TAKEDA: 'サイト・アウトライニング-インターネットからの情報収集と可視化技術- Site Outlining-Internet Inform' 情報処理 第42巻 第8号 IPSJ MAGAZINE , 20010815, P.781-P.786, 社団法人情報処理学会 Information Processing Socie *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200267A (ja) * 2006-01-29 2007-08-09 Hiroyasu Yamamoto 新聞と購読者間における購読後反響情報の双方向交流を可能にする新聞のシステム
JP2010176666A (ja) * 2009-01-27 2010-08-12 Palo Alto Research Center Inc ソーシャルインデックスにおける熱いトピック及び冷めたトピックを検出することによりユーザの関心を管理するためのシステム及び方法
JP2010176136A (ja) * 2009-01-30 2010-08-12 Navteq North America Llc 位置コンテンツの品質を評価するための方法及びシステム
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置
JP2019164591A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Also Published As

Publication number Publication date
CN101826115A (zh) 2010-09-08
US8332382B2 (en) 2012-12-11
CA2536449A1 (en) 2005-03-31
US20130159294A1 (en) 2013-06-20
US7577655B2 (en) 2009-08-18
JP5632574B2 (ja) 2014-11-26
US9037575B2 (en) 2015-05-19
EP1665100A1 (en) 2006-06-07
JP2014157623A (ja) 2014-08-28
US8126876B2 (en) 2012-02-28
US20090276429A1 (en) 2009-11-05
JP5797806B2 (ja) 2015-10-21
US8645368B2 (en) 2014-02-04
US10459926B2 (en) 2019-10-29
US20120158711A1 (en) 2012-06-21
US20140188859A1 (en) 2014-07-03
CN101826115B (zh) 2016-08-17
WO2005029368A1 (en) 2005-03-31
US20160019216A1 (en) 2016-01-21
CN1853183A (zh) 2006-10-25
US20050060312A1 (en) 2005-03-17

Similar Documents

Publication Publication Date Title
JP5797806B2 (ja) ニュース記事のランク付けを向上させるためのシステムおよび方法
US7454417B2 (en) Methods and systems for improving a search ranking using population information
US9177063B2 (en) Endorsing search results
CA2702439C (en) Method and apparatus for scoring electronic documents
US8468143B1 (en) System and method for directing questions to consultants through profile matching
US8843479B1 (en) Methods and apparatus for ranking documents
US20120042020A1 (en) Micro-blog message filtering
JP2011222004A (ja) 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法
US20100325129A1 (en) Determining the geographic scope of web resources using user click data
US10380121B2 (en) System and method for query temporality analysis
US20130066800A1 (en) Method of aggregating consumer reviews
JP2009098964A (ja) ネットワークサービスシステム、サーバ、方法及びプログラム
JP2005174149A (ja) インターネット上の情報解析システムおよび公開サーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100528

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100604

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100629

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100706

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100728

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110614

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110621

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110712

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110720

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110812

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110915

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120706

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120828

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20121214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130612

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130617

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130711

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130809

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130814

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140303

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140306

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140403

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141010

R150 Certificate of patent or registration of utility model

Ref document number: 5632574

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250