CN101826115A - 用于改进对新闻文章分级的系统和方法 - Google Patents

用于改进对新闻文章分级的系统和方法 Download PDF

Info

Publication number
CN101826115A
CN101826115A CN201010198508A CN201010198508A CN101826115A CN 101826115 A CN101826115 A CN 101826115A CN 201010198508 A CN201010198508 A CN 201010198508A CN 201010198508 A CN201010198508 A CN 201010198508A CN 101826115 A CN101826115 A CN 101826115A
Authority
CN
China
Prior art keywords
news sources
news
quote
grade
quoting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010198508A
Other languages
English (en)
Other versions
CN101826115B (zh
Inventor
迈克尔·科蒂斯
科里什纳·伯哈雷特
迈克尔·施米特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101826115A publication Critical patent/CN101826115A/zh
Application granted granted Critical
Publication of CN101826115B publication Critical patent/CN101826115B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种用于分级结果的系统。该系统可以接收链接的列表。该系统可以识别出与每个链接相关联的源,并且至少部分基于所识别出的源的质量对该链接的列表分级。

Description

用于改进对新闻文章分级的系统和方法
本申请是申请号为200480026722.9,申请日期为2006年3月16日,发明名称为“用于改进对新闻文章分级的系统和方法”的申请的分案申请。
技术领域
本发明一般地涉及通信系统,更具体地说,涉及用于改进通信系统中的对新闻文章分级的系统和方法。
背景技术
诸如因特网之类的网络已成为日常生活的日益重要的部分。现在,数以百万的人天天访问因特网购买商品和服务,获得感兴趣的信息(例如,电影列表、新闻等),与朋友、家人和同事通信(例如,经由电子邮件和即时消息)。
现在,当希望在因特网上购买产品或仅仅寻找信息时,会在他/她的web浏览器输入关于感兴趣的web站点的统一资源定位符,以便访问特定的web站点。然后确定在该特定站点感兴趣的信息是否可用。
例如,假设有人希望经由因特网获得关于特定主题的最新新闻。它就访问包括传统的搜索引擎的web站点。将一个或多个与感兴趣的主题相关的项(例如“Iraq”)输入到搜索引擎中,试图定位已发布了关于该主题的文章的新闻源。这样,使用搜索引擎定位提供了与期望主题相关的新闻文章的各个网站,从而产生数百甚至数千个“点击”的经分级列表,其中每个点击可能与涉及这(一个或多个)搜索项的web页面相对应。
尽管该经分级列表中的每个点击可能涉及期望主题,但是与这些点击相关联的新闻源可能具有不同的质量。例如,大多认为CNN和BBC是报道准确、撰写专业等等的高质量源,而本地新闻源(例如,家乡的新闻源)可能是低质量的。
因此,需要系统和方法来基于与新闻文章相关联的的新闻源的质量来改进对新闻文章的分级。
发明内容
符合本发明原理的实现方式至少部分基于与新闻文章相关联的多个新闻源的质量来调整文章的分级。
根据符合本发明原理的一种实现方式,提供了一种用于分级结果的方法,该方法包括:接收链接的列表;针对每个链接识别出与该链接相关联的源;至少部分基于所识别出的源的质量对链接的列表分级。
在符合本发明原理的另一种实现方式中,一种服务器包括处理器和配置为存储一组源的质量指示符的存储器。处理器可以接收对象的列表,识别出与这些对象中的每个对象相关联的源,并且至少部分基于与对象的列表中的至少一个对象被关联到的源相关联的质量指示符来对所述对象分级。
在符合本发明原理的另一种实现方式中,提供了一种用于确定新闻源的质量的方法。该方法可以包括:至少部分基于下述中的至少一个来确定该新闻源的一个或多种度量值:在第一时间段中新闻源产生的文章数目;新闻源产生的文章的平均长度;在第二时间段中新闻源产生的重要报道的量;爆炸性新闻分数;到新闻源的网络流量;人们对新闻源的评价;新闻源的发行统计;与新闻源相关联的职员多少;与新闻源相关联的办事处的数目;在与新闻源相关联的一组文章中原始指名实体的数目;新闻源的覆盖幅度;到新闻源的流量源自的不同国家的数目;以及新闻源使用的写作风格。该方法还包括至少部分基于所确定的一个或多种度量值来计算新闻源的质量值。
在符合本发明原理的另一种实施方式中,提供了一种用于提供搜索结果的方法。该方法可以包括接收对象的列表;识别出与该组对象中的每个对象相关联的源;确定所识别出的源中的每个源的质量;以及至少部分基于所确定的与该组对象中的每个对象相关联到的源的质量来对该对象分级。
附图说明
结合于此并组成本说明书一部分的附图图示了本发明的实施例,并且与详细描述一起解释本发明。在附图中,
图1是符合本发明原理的系统和方法可以在其中实现的系统的示例图;
图2是在符合本发明原理的实现方式中的图1的服务器的示例图;
图3是在符合本发明原理的实现方式中可以与图2的服务器相关联的数据库的示意图;
图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图;
图5是在符合本发明原理的实现方式中用于调节对象分级的示例过程的流程图;
具体实施方式
下面符合本发明原理的实现方式的详细描述参考附图。在不同的图示中相同的标号可以识别相同的或相似的元素。另外,下面的详细描述不限制本发明。
符合本发明原理的实现方式至少部分基于与新闻文章相关联的源的质量来改进对搜索结果中的新闻文章的分级。尽管前述描述集中于对来自新闻源的新闻文章分级,但是应当理解,这里所述的技术同样适用于改进对除了新闻文章之外的其他项目分级。
示例性系统
图1是系统100的示例图,在系统100中,可以实现符合本发明原理的系统和方法。系统100可以包括多个客户机110,客户机110经由网络140连接到服务器120和130。网络140可以包括局域网(LAN)、广域网(WAN)、电话网(例如,公共交换电话网,PSTN)、内联网、因特网、相似的或不同的网络、或者这些网络的组合。出于简化,在图1中两个客户机110和三个服务器120/130被示作连接到网络140。实际上,可以有更多或更少的客户机110和/或服务器120/130。另外,在某些实例中,客户机110可以执行服务器120/130的功能,并且服务器120/130可以执行客户机110的功能。
客户机110可以包括设备,例如,无线电话、个人计算机、个人数字助理(PDA)、膝上型电脑等,以及在这些设备上运行的线程或进程,以及/或者可由这些设备执行的对象。服务器120/130可以包括服务器设备,线程,以及/或者以符合本发明的原理的方式操作、搜索或者维护文档的对象。客户机110和服务器120/130可以经由有线、无线或光连接而连接到网络140。
在符合本发明原理的实现方式中,服务器120可以包括由客户机110使用的搜索引擎125。服务器130可以存储可由客户机110访问的对象(或者web文档)。
示例性服务器配置
图2是符合本发明原理的实现方式中的服务器120的示例图。客户机110和服务器130可以类似地配置。服务器120可以包括总线210、处理器220、主存230、只读存储器(ROM)240、存储设备250、一个或多个输入设备260、一个或多个输出设备270、以及通信接口280。总线210可以包括允许在服务器120的组件之间通信的一个或多个导线。
处理器220可以包括可以解释并执行指令的任意类型的传统处理器或微处理器。主存230可以包括随机访问存储器(RAM)或其他类型的动态存储器件,存储用于处理器220执行的信息和指令。ROM 240可以包括传统的ROM器件或其他类型的静态存储器件,存储用于由处理器220使用的静态信息和指令。存储设备250可以包括磁和/或光记录介质及其相应的驱动器。
输入设备260可以包括允许用户将信息输入到服务器120的一种或多种传统机制,例如,键盘、鼠标、笔、一种或多种生物测定学(biometric)机制(例如语音识别设备),等等。输出设备270可以笔将信息输出到用户的一种或多种传统机制,包括显示器、打印机、扬声器等。通信接口280可以包括任何类似收发器的机制,其使服务器120能够与其他设备和/或系统通信。例如,通信接口280可以包括用于经由网络(例如,网络140)与另一个设备或系统通信的机制。
如下面将详细描述的,符合本发明原理的服务器120可以响应于来自客户机110的查询改进搜索结果。在一种实现方式中,服务器120基于提供新闻文章的源的质量对新闻文章搜索结果进行修改。服务器120可以响应于处理器220执行计算机可读介质(例如,存储器230)中包含的软件指令来执行这些操作。计算机可读介质可以被限定为一种或多种存储器器件和/或载波。软件指令可以从另一种计算机可读介质(例如,存储设备250)被读入到存储器230中,或者经由通信接口280从另一个设备读入到存储器230中。存储器230中包含的软件指令可以致使处理器220执行稍后将描述的过程。或者,硬连线的电路可以用来替换软件指令或者与软件指令组合使用来实现符合本发明原理的过程。因此,本发明不受限于硬件电路和软件的任意特定组合。
符合本发明原理的服务器120可以基于来自一个或多个关联数据库的信息来对搜索结果的分级进行分级或修改。这些数据库可以被存储在服务器120处(例如,在存储器230中)或者存储在服务器120外。
图3是数据库300的示例图,在符合本发明原理的实现方式中,数据库300可以与服务器120相关联。经管下面只描述一个数据库,但是应当意识到服务器120可以与一个或多个额外的数据库(未示出)相关联,这些额外的数据库本地地存储在服务器120处,或者分布在网络140上。
如上所述,数据库300可以包括源字段310和源等级字段320。数据库300可以包括额外的字段(未示出),这些额外的字段帮助搜索和分类数据库300中的信息和/或自网络140接收到的信息。
在系统100中,源字段310可以识别新闻源。标记为1到N(其中N是大于等于1的数字)的新闻源可以包括本地新闻源(例如,本地在线报纸或本地电视台网站),全国新闻源、国际新闻源、专业新闻源(例如,技术、体育或娱乐杂志或报纸)和/或来自网络(例如,因特网)的任何其他类型的新闻源。例如,新闻源可以包括WashingtonPost、CNN、MSNBC、BCC、the New York Post、USA Today、the Pittsburgh Post-Gazette、ESPN、Sports Illustrated等的在线版。
源等级字段320可以存储这样的值,该值可用于对从在源字段310中识别出的源提取的文章(或者文档)的等级进行调整。这样,可以将来自较高质量新闻源的文章的等级调整为比来自较低质量的新闻源的同样主题的文章的高。下面将详细描述,给定新闻源的值可以至少部分基于该新闻源的可信性、报告准确度、写作专业性等。
示例性处理
图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图。下面所述的过程可以由例如服务器120自动执行,或者由人员操作员手动执行。在替换实现方式中,下面所述过程的多个部分可以被自动执行,而其他部分可以被手动执行。
处理可以开始于考虑每个新闻源的一组度量(动作405)。每种度量可以测量新闻源的特定属性,该特定属性可以充当新闻源的质量的部分指示符。在符合本发明原理的一种实现方式中,每种度量可以作为数值计算,其中例如计算出的较高的值可能指示较高质量的新闻源。
在下面将详细解释,该组度量可以包括在给定时间段中由新闻源产生的文章的数目、来自该新闻源的文章的平均长度、来自该新闻源的报道的重要性、爆炸性新闻分数、使用模式、人群评价、发行统计、与该新闻源相关联的职员多少、与该新闻源相关的新闻办事处数目、在文章簇(cluster)中该新闻源产生指名实体的数目、覆盖幅度、国际多样性、写作风格等。确定新闻源的质量的第一度量可以包括在给定时间段中由该新闻源产生的文章的数目。该时间段可以是一周、双周、月等。在符合本发明原理的一种实现方式中,第一度量可以通过对在一时间段上该新闻源产生的非重复文章的数据进行计数来确定。在替换实现方式中,第一度量可以通过对由该新闻源产生的原始句子的数目进行计数来确定。
第二度量可以包括来自该新闻源的文章的平均长度。该平均产度可以例如按词或句子测量。在符合本发明原理的一种实现方式中,第二度量可以通过确定由该新闻源产生的非重复文章的平均长度来确定。例如,可以确定来自CNN的文章的平均长度为300个词,而来自Amateur News Network的文章的平均长度为150个词。因此,CNN的第二度量的值可以为300,而Amateur News Network的可以为150。
第三度量可以包括该新闻源的报道的重要性。该度量可以至少部分基于可以确定给定文章的背后新闻记事的“大小”(下文中称作“记事大小”)这样的假设。该度量可以为代表在固定时间段内所考虑的新闻源产生的所有非重复文章的记事大小分数的总值。该时间段可以是一周、双周、月等。作为示例,如果D为文章,则D的记事大小可以作为该系统(例如,服务器120)已知的关于相同主题的不同的其他文章的数目而被测量出。例如,如果D是关于哥伦比亚航天飞机坠毁的文章,并且存在500篇关于该主题的不同文章,则该记事大小应为500。存在许多用于检测关于该记事的其他文章的技术。例如,在下述共同未决、共同转让的专利申请中描述了两类这种技术,所述专利申请是:2003年6月30日提交的题为“Methods and Apparatus for RankingDocuments”的美国专利申请No.10/611,267,以及2003年6月30日提交的题为“Methods and Apparatus for Clustered Aggregation ofNews Content,”的美国专利申请No.10/611,269,这二者都通过引用明确整体结合于此。一组相关的文章在下文中称作“簇”。在符合本发明原理的一种实现方式中,度量值可以被限制为在规定的时间段上由给定的源覆盖的最大的N个记事的记事大小,其中N是大于等于1的正整数(例如,在1周中服务器120测量的由CNN覆盖的最大100个记事)。
第四度量可以包括代表爆炸性新闻分数的值。该度量可以测量新闻源在重要事件发生后立即发表记事的能力。该度量可以对来自新闻源的每篇非重复文章的“爆炸性分数”进行平均,其中爆炸性分数例如是这样的数字,如果在新闻事件发生后立即发表文章则该数字为较高的值,如果在从新闻记事发生起已经过很多时间后才发表文章则该数字为较低的值。
在符合本发明原理的一种实现方式中,以递增顺序按照发表时间对簇中的所有文章进行分类,并且第一篇文章的时间作为事件的时间。例如,假设T是当前文章和第一篇文章之间的时间差。阈值N1可用于标注这样的间隔,在该间隔之后不再考虑记事的爆炸性。因此,爆炸新闻分数度量可以如下确定(breaking_source:爆炸性分数):
如果T>N1,则breaking_score=0;
如果0<T≤N1,则breaking_score=log(Nl/T);并且
如果T=0,则breaking_score=log(Nl)。
N1可以以小时表示,例如3小时。
在符合本发明原理的另一种实现方式中,以递增顺序按照时间对簇中的所有文章进行分类,并且每篇文章的等级作为上述值T。相应地,可以使用阈值N2。因此,爆炸新闻分数度量可以如下确定:
如果T>N2,则breaking_score=0;并且
如果1<T≤N2,则breaking_score=log(N2/T)。
在一种示例性实现方式中,N2可以为10。
在又一种符合本发明原理的实现方式中,如上确定的爆炸性新闻分数可以被乘以这样的量,该量与给定文章所属的相关文章簇的大小成正比。例如,爆炸性新闻分数可以被乘以因子=(1+log(簇大小))。这在记事重要并且看来要形成大簇时突出爆炸性新闻的值。
在又一种实现方式中,不是对爆炸性分数值求平均,而是如果簇大小大于遇到值(例如,30),则对这些值求和。因此,在这种情形中,爆炸性新闻分数可以如下确定:
对于每篇文章A(size:大小;Breaking_new:爆炸性新闻;cluster:簇;Score:分数;rank_within_cluster:簇内等级):
如果(Size(cluster(A)))>30):
Breaking_news[score(A)]+=30-rank_within_Cluster(A)。
第五度量可以包括代表使用模式的值。可以针对使用(例如,点击)来监控从新闻搜索引擎的网页到各个文章的链接。常常被选择的新闻源被检测出,并且被分配与所观察到的使用成正比的值。公知的站点例如CNN倾向于优于不流行的站点,例如不知名的小镇新闻,用户可能避开这种新闻。所测量出的流量可以用读者可能访问该链接的机会的数目归一化,以避免由于新闻搜索引擎的分级偏好导致的测量偏离。
第六度量包括代表人群对新闻源的评价的值。在符合本发明原理的一种实现方式中,一般可以对用户进行民意测验来识别用户喜欢阅读(或者已访问过)的报纸(或者杂志)。作为替换或者附加地,可以对新闻搜索引擎的用户进行民意测验来确定用户喜欢访问的新闻网站。也可以使用其他机构对新闻站点的评估(例如,可以至少部分基于报纸已获得的Pulitzer奖的次数等对报纸进行比较)。此外,新闻源的年龄也可以作为公众信任的测量,并且可用作一种度量。在另一种实现方式中,可以向评估者出示来自各个新闻源选出的文章,并且要求给每个源分配一个分数。该分配的分数可以作为一种度量。
第七度量可以包括代表新闻源的发行统计的值。诸如MediaMetrix和Nielsen Netratings等机构发布在线站点(例如,新闻站点)的使用统计。这些发布的流量数字可以用作对新闻源的质量的测量。在符合本发明原理的一种实现方式中,与新闻站点相关联的印刷报纸的发现统计可作为一种度量。
第八度量可以包括代表与新闻源关联的职员数目的值。在符合本发明原理的一种实现方式中,可以至少部分基于在来自新闻源的文章中提到的不同记者的数目确定。
第九度量可以包括代表与新闻源关联的新闻办事处的数目的值。
第十度量可以包括代表下述原始指名实体的数目的值,所述原始指名实体的数目是在例如具有至少N篇相关文章(例如,N=3)的所有文章上平均的、新闻源在相关文章的簇内产生的原始指名实体的数目。指名实体可以对应于个人、位置或组织。如果新闻源生成包含同一簇内的其他文章(从而关于同一话题)不包含的指名实体的新闻记事,则这可能指示出该新闻源能够发出原始报道。在这种分析中,由在阈值大小为N的簇中给定的新闻源添加的平均值被评估。在符合本发明实施例的一种实现方式中,如果簇中没有较早的文章具有相同的指名实体,则可以考虑该指名实体。可以使用近似字符串匹配来对指名实体进行比较,以补偿拼写和缩写的变体。与其他文章中的指名实体显著不同的指名实体可以认为是原始的。
第十一度量可以包括代表新闻源的幅度的值(例如,新闻源产生的内容涉及的话题的数目)。在符合本发明原理的一种实现方式中,来自新闻源的文章可以分类到一组话题(例如,艺术、音乐、体育、商业等)中,并且话题的范围可以用作幅度的测量。可以使用任何传统分类技术来奖文章分类到多种话题中。例如,根据机器学习文献的分类系统可以用来将新闻文章分类到选出的一组话题中。在另一种实现方式中,由新闻源发表的章节数可以作为幅度的测量。
第十二度量可以包括代表新闻源的国际多样性的值。该度量可以测量新闻站点从其接收网络流量的国家的数目。在符合本发明原理的一种实现方式中,通过考虑到新闻站点的已知访问者所来自的国家,可以测量出该度量(例如,至少部分基于点击从搜索站点到正被测量的新闻源的文章的链接的那些用户的因特网协议(IP)地址)。基于已知IP块到国家的映射的表,可以将相应IP地址映射到起源国家。在另一种实现方式中,可以监控链接到给定新闻web站点的那些web站点的IP地址,该新闻站点从其被链接的不同国家的数目可以作为该度量。
第十三度量可以包括代表新闻源使用的写作风格的值。可以使用用于测量拼写正确性、语法和阅读水平的自动测试来生成反应写作风格的度量值。然后可以分配与测量出的写作风格成正比的分数。
应当意识到,除了上述度量组或者作为对上述度量组的替换,可以考虑其他度量。例如,另一种度量可以包括代表到新闻web站点的超链接的数目的值。
一旦已考虑了一组度量,就可以至少部分基于该组度量来确定每个新闻源的源等级(动作410)。为了确定每个新闻源的源等级,上述该组度量的一些或全部可以被组合来产生新闻源的最终分数(即,源等级)。可以使用许多技术来确定新闻源的源等级。例如,在符合本发明原理的一种实现方式中,每种度量可以被乘以相应的因子,并且所产生的值可以被总计,以给出新闻源的源等级。或者,每种度量可以被归一化到0到1的范围内,并且所产生的值可以被总计来给出最终度量值(即,源等级)。例如,可以通过将每种度量值除以该度量分配的最大可能值,从而实现归一化。
在另一种实现方式中,可以计算出新闻源的各种度量的平均等级。例如,如果CNN具有发行统计等级1,国际流行度等级2,以及国际办事处数目等级9,则仅考虑这些度量CNN具有平均分级(1+2+9)/3=4。
在又一种实现方式中,对于每个新闻源,相对于每种度量的最佳新闻源的该种度量的百分比分数可以用于确定该新闻源的分数分级。例如,如果CNN具有国际流行度等级2,并且BBC具有该度量的最高等级10,则CNN的该度量的百分比分数可以为0.2。
作为对上述的替换,上述技术之一可以仅与正被考虑的给定新闻源的最好的N种度量一起使用。N可以是大于等于一的正整数。在一种实现方式中,N可以为5。通过对给定新闻源仅考虑最好的N种度量,这允许结合某些度量还未被计算出的新闻源。
一旦已确定出新闻源的源等级,则服务器120可以存储该源等级(动作415)。在一种实现方式中,服务器120可以将新闻源的识别与相应的源等级值存储到数据库中,例如数据库300。
图5是在符合本发明原理的实现方式中用于调节对象(例如,新闻文章)的等级的示例过程的流程图。尽管下面的描述集中于作为搜索查询结果提取出的分级对象,但是符合本发明原理的实现方式不受限于此。实际上,符合本发明原理的实现方式同样适用于根据打分标准对新闻文章分级的系统和方法。该标准例如可以包括查询(例如,将在下面的示例性场景中描述的搜索引擎查询)、话题(例如,体育)、关键字列表(例如,来自搜索结果文档的初始集合的关键字)、地理区域(例如,纽约)、文章簇中的文章列表、或者示例性文档集合。
处理可以开始于用户使用例如客户机(例如,客户机110)上的web浏览器软件访问服务器120(图1)。然后用户可以项由服务器120维护的搜索引擎125提供包括一个或多个搜索项的查询(动作505)。在一种实现方式中,搜索查询包括与新闻话题有关的一个或多个项。例如,如果用户想阅览关于George Bush的新闻文章,则用户可以使客户机110向服务器120发送具有搜索项“George Bush”的搜索查询。
响应于接收到搜索项,服务器120可以以传统方式生成分级后的结果列表(动作510)。这些结果可以包括对新闻文章的引用(例如,链接),并且可能包括对链接的文本描述。服务器120可以针对分级的列表中的每个链接确定链接是否与已针对其确定了源等级的新闻源相对应。为了确定对于链接是否存在源等级,服务器120可以首先识别出链接对应的新闻源(动作515)。在一种实现方式中,服务器120可以至少部分基于与链接相关联的统一资源定位符(URL)识别新闻源。例如,服务器120可以确定出链接“www.cnn.com/2003/abc/index.html”对应于新闻源“CNN”。可以替换地使用用于识别链接的对应的新闻源的其它技术。
一旦已识别出新闻源,服务器120就可以通过例如访问数据库300并且确定与链接相对应的新闻源是否被存储在源字段310中,从而确定对于该链接是否存在源等级(动作520)。如果新闻源在源字段310中不存在,则服务器120不能调整该链接的分级。另一方面,如果该新闻源在源字段310中存在,则服务器120可以从源等级字段320提取出该新闻源的源等级。然后服务器120可以至少部分基于提取出的源等级来调整与该新闻源相对应的链接的分级(动作520)。
给定链接的初始分级R1,服务器120可以通过针对每个链接计算改进后的分数,从而产生调整后的分级R2。服务器120可以通过将与R1中的分级相对应的分数和与链接相关联的新闻源的源等级组合,从而确定出新分数。在符合本发明原理的一种实现方式中,服务器120可以将新分数确定为加权的和。例如,服务器120可以如下确定链接的新分数(NEWSCORE:新分数;OLDSCORE:旧分数;SOURCERANK:源等级):
NEWSCORE(D)=α*OLDSCORE(D)+β*SOURCERANK(SOURCE(D))
其中SOURCE(D)是链接D的新闻源,并且α和β是适当的常数。例如,在符合本发明原理的一种实现方式中,α可以被设置为0.8,β可以被设置为0.2。应当意识到,可以替换使用其他α和β值。也可以替换使用用于调整链接的分级的其他技术,例如,对R1分数和源等级求平均。这样,可以产生新链接的改进的分级。
一旦已调整了分级后列表,服务器120就可以向客户机110提供调整后的链接分级列表(动作525)。服务器120可以经由网络140将调整后的链接列表发送到客户机110。
在符合本发明原理的其他实现方式中,在动作510中,服务器120可以响应于接收到搜索查询,提取出未分级的结果列表。在这种情形中,服务器120可以基于与结果列表所关联到的新闻源相关联的源等级来对结果列表分级。
结论
符合本发明原理的实现方式可以至少部分基于与新闻文章相关联的新闻源的质量来改进对新闻文章的分级。
前面对本发明的示例性实施例的描述提供了说明和描述,但是不是要穷尽本发明或者将本发明限制于所公开的精确形式。根据上述教导,可以做出修改和改变,并且实施本发明可能要求修改和改变。例如,不需要由服务器120执行上述功能。在其他实现方式中,可以由客户机110执行图5中描述的一个或多个动作。例如,浏览器助手(即,与传统web浏览器一起工作的软件)可以执行参考图5的过程描述的一个或多个动作。
此外,如上所述,符合本发明原理的实现方式不受限于分级新闻文章。例如,符合本发明原理的实现方式可以用于对可以通过网络提取出或从一个或多个数据库提取出的其他类型的项目进行分级。
尽管已参考图4和图5描述了动作序列,但是在符合本发明的其他实现方式中这些动作的顺序可以改变。此外,可以并行实现无依赖关系的动作。
在本申请的描述中使用的元素、动作或指令不应当被解释为对本发明关键或必须的,除非明确描述我如此。另外,这里所使用的名词是要包括一个或多个项目。在仅要一个项目的地方,明确使用“一个”或类似的语言。

Claims (20)

1.一种由一个或多个服务器设备执行的用于对引用进行分级的方法,所述方法包括:
在一个或多个服务器设备的一个或多个处理器处接收来自客户机设备的搜索查询;
由一个或多个服务器设备的一个或多个处理器响应于接收搜索查询生成对新闻文章的引用列表;
由一个或多个服务器设备的一个或多个处理器对于在引用列表中的每个引用识别与每个引用相关联的新闻源;
由一个或多个服务器设备的一个或多个处理器对于每个识别出的新闻源确定是否存在新闻源等级;以及
由一个或多个服务器设备的一个或多个处理器至少部分地基于存在的新闻源等级对引用列表中的引用进行分级。
2.如权利要求1所述的方法,其中确定每个新闻源等级是否存在包括访问数据库以定位新闻源等级。
3.如权利要求1所述的方法,还包括:
向客户机设备提供分级后的引用列表。
4.如权利要求1所述的方法,其中对引用进行分级包括:
对于存在有对应的新闻源等级的每个引用,通过组合新闻源等级和与之前的引用分级相对应的分数来确定新分数;以及
基于新分数对引用进行分级。
5.如权利要求4所述的方法,其中确定新分数包括:
对于存在有对应的新闻源等级的每个引用,确定新闻源等级和与之前的引用分级相对应的分数的加权和。
6.如权利要求1所述的方法,其中识别新闻源包括基于与引用相关联的统一资源定位符(URL)识别新闻源。
7.如权利要求1所述的方法,其中对于对新闻文章的引用列表不进行分级。
8.一种系统,包括:
数据库,用于将质量值与识别新闻源的信息相关联;和
处理器,用于:
响应于接收查询生成对新闻文章的引用列表,
对于引用列表中的第一引用,识别与第一引用相关联的新闻源,
访问数据库,以提取与新闻源相对应的质量值,以及
基于提取的质量值,相对于引用列表中的其它引用对第一引用进行分级,以产生有序的引用列表。
9.如权利要求8所述的系统,其中处理器还被用于:
对于引用列表中的第二引用,识别与第二引用相关联的新闻源;
访问数据库,以提取与和第二引用相关联的新闻源相对应的第二质量值;以及
基于第二质量值,关于引用列表中的其它引用对第二引用进行分级。
10.如权利要求8所述的系统,其中处理器还用于:
向客户机设备提供有序的引用列表。
11.如权利要求8所述的系统,其中当对第一引用进行分级时,处理器还用于:
对于第一引用,通过组合质量值和与之前的引用分级相对应的之前的分数确定分数;以及
基于所述分数对引用进行分级。
12.如权利要求11所述的系统,其中当确定分数时,处理器还用于:
确定质量值和之前的分数的加权和。
13.如权利要求8所述的系统,其中当识别新闻源时,处理器还用于:
基于与引用相关联的统一资源定位符(URL)识别新闻源。
14.如权利要求8所述的系统,其中对引用列表不进行排序。
15.一种用于对引用进行分级的系统,所述系统包括:
用于接收来自客户机设备的搜索查询的装置;
用于响应于接收搜索查询生成对新闻文章的引用列表的装置;
用于对于在引用列表中的每个引用识别与每个引用相关联的新闻源的装置;
用于对于每个识别出的新闻源确定是否存在新闻源等级的装置;以及
用于至少部分地基于存在的新闻源等级对引用列表中的引用进行分级的装置。
16.如权利要求15所述的系统,其中引用包括到在线新闻文章的链接。
17.如权利要求16所述的系统,其中用于识别新闻源的装置包括用于基于与链接相关联的统一资源定位符(URL)识别新闻源的装置。
18.如权利要求15所述的系统,其中用于确定每个新闻源等级是否存在的装置包括用于访问数据库以定位新闻源等级的装置。
19.如权利要求15所述的系统,其中用于对引用进行分级的装置包括:
用于对于存在有对应的新闻源等级的每个引用,通过组合新闻源等级和与之前的引用分级相对应的分数来确定新分数的装置;以及
用于基于新分数对引用进行分级的装置。
20.如权利要求19所述的系统,用于确定新分数的装置包括:
用于对于存在有对应的新闻源等级的每个引用,确定新闻源等级和与之前的引用分级相对应的分数的加权和的装置。
CN201010198508.9A 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法 Expired - Fee Related CN101826115B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/662,931 US7577655B2 (en) 2003-09-16 2003-09-16 Systems and methods for improving the ranking of news articles
US10/662,931 2003-09-16
CNA2004800267229A CN1853183A (zh) 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800267229A Division CN1853183A (zh) 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法

Publications (2)

Publication Number Publication Date
CN101826115A true CN101826115A (zh) 2010-09-08
CN101826115B CN101826115B (zh) 2016-08-17

Family

ID=34274249

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2004800267229A Pending CN1853183A (zh) 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法
CN201010198508.9A Expired - Fee Related CN101826115B (zh) 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2004800267229A Pending CN1853183A (zh) 2003-09-16 2004-09-14 用于改进对新闻文章分级的系统和方法

Country Status (6)

Country Link
US (6) US7577655B2 (zh)
EP (1) EP1665100A1 (zh)
JP (2) JP5632574B2 (zh)
CN (2) CN1853183A (zh)
CA (1) CA2536449A1 (zh)
WO (1) WO2005029368A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038654A (zh) * 2013-03-05 2014-09-10 富士施乐株式会社 中继装置、客户端装置及方法

Families Citing this family (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US7568148B1 (en) 2002-09-20 2009-07-28 Google Inc. Methods and apparatus for clustering news content
US7577655B2 (en) 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
US20050076097A1 (en) * 2003-09-24 2005-04-07 Sullivan Robert John Dynamic web page referrer tracking and ranking
US8700610B1 (en) 2003-09-29 2014-04-15 Google Inc. Systems and methods for providing news alerts
EP1716511A1 (en) * 2004-02-20 2006-11-02 Dow Jones Reuters Business Interactive, LLC Intelligent search and retrieval system and method
US7698333B2 (en) * 2004-07-22 2010-04-13 Factiva, Inc. Intelligent query system and method using phrase-code frequency-inverse phrase-code document frequency module
US9760629B1 (en) 2004-12-29 2017-09-12 Google Inc. Systems and methods for implementing a news round table
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
GB0506618D0 (en) * 2005-04-01 2005-05-11 Wine Science Ltd A method of supplying information articles at a website and system for supplying such articles
US7962462B1 (en) 2005-05-31 2011-06-14 Google Inc. Deriving and using document and site quality signals from search query streams
WO2006130985A1 (en) 2005-06-08 2006-12-14 Ian Tzeung Huang Internet search engine results ranking based on critic and user ratings
US7565358B2 (en) * 2005-08-08 2009-07-21 Google Inc. Agent rank
US7856446B2 (en) * 2005-12-27 2010-12-21 Baynote, Inc. Method and apparatus for determining usefulness of a digital asset
US8880499B1 (en) 2005-12-28 2014-11-04 Google Inc. Personalizing aggregated news content
JP2007200267A (ja) * 2006-01-29 2007-08-09 Hiroyasu Yamamoto 新聞と購読者間における購読後反響情報の双方向交流を可能にする新聞のシステム
US20070185789A1 (en) * 2006-02-09 2007-08-09 Zorthian Gregory J Magazine circulation scoring model
US7451120B1 (en) * 2006-03-20 2008-11-11 Google Inc. Detecting novel document content
US7797313B1 (en) * 2006-03-28 2010-09-14 Symantec Operating Corporation Relevance ranking in a computer system
US7603350B1 (en) 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
US7831928B1 (en) * 2006-06-22 2010-11-09 Digg, Inc. Content visualization
US7970938B1 (en) * 2006-08-16 2011-06-28 Vmware, Inc. IP subnet discovery with ranked results
US9514436B2 (en) 2006-09-05 2016-12-06 The Nielsen Company (Us), Llc Method and system for predicting audience viewing behavior
AU2007293092A1 (en) * 2006-09-05 2008-03-13 Innerscope Research, Inc. Method and system for determining audience response to a sensory stimulus
US8086600B2 (en) * 2006-12-07 2011-12-27 Google Inc. Interleaving search results
US20090024049A1 (en) 2007-03-29 2009-01-22 Neurofocus, Inc. Cross-modality synthesis of central nervous system, autonomic nervous system, and effector data
US7668823B2 (en) * 2007-04-03 2010-02-23 Google Inc. Identifying inadequate search content
US8392253B2 (en) 2007-05-16 2013-03-05 The Nielsen Company (Us), Llc Neuro-physiology and neuro-behavioral based stimulus targeting system
US7831596B2 (en) * 2007-07-02 2010-11-09 Hewlett-Packard Development Company, L.P. Systems and processes for evaluating webpages
US20090013068A1 (en) * 2007-07-02 2009-01-08 Eaglestone Robert J Systems and processes for evaluating webpages
EP2170161B1 (en) 2007-07-30 2018-12-05 The Nielsen Company (US), LLC. Neuro-response stimulus and stimulus attribute resonance estimator
JP2010536102A (ja) * 2007-08-08 2010-11-25 ベイノート,インク. コンテキストに基づくコンテンツレコメンデーションの方法及び装置
US10698886B2 (en) * 2007-08-14 2020-06-30 John Nicholas And Kristin Gross Trust U/A/D Temporal based online search and advertising
US8386313B2 (en) 2007-08-28 2013-02-26 The Nielsen Company (Us), Llc Stimulus placement system using subject neuro-response measurements
US8392255B2 (en) 2007-08-29 2013-03-05 The Nielsen Company (Us), Llc Content based selection and meta tagging of advertisement breaks
US20090083129A1 (en) 2007-09-20 2009-03-26 Neurofocus, Inc. Personalized content delivery using neuro-response priming data
US8327395B2 (en) 2007-10-02 2012-12-04 The Nielsen Company (Us), Llc System providing actionable insights based on physiological responses from viewers of media
US20090133047A1 (en) 2007-10-31 2009-05-21 Lee Hans C Systems and Methods Providing Distributed Collection and Centralized Processing of Physiological Responses from Viewers
US9171454B2 (en) * 2007-11-14 2015-10-27 Microsoft Technology Licensing, Llc Magic wand
WO2009089116A2 (en) * 2008-01-02 2009-07-16 Three Purple Dots, Inc. Systems and methods for determining the relative bias and accuracy of a piece of news
WO2009094633A1 (en) * 2008-01-25 2009-07-30 Chacha Search, Inc. Method and system for access to restricted resource(s)
US20090265328A1 (en) * 2008-04-16 2009-10-22 Yahool Inc. Predicting newsworthy queries using combined online and offline models
US8952894B2 (en) * 2008-05-12 2015-02-10 Microsoft Technology Licensing, Llc Computer vision-based multi-touch sensing using infrared lasers
US9342589B2 (en) 2008-07-30 2016-05-17 Nec Corporation Data classifier system, data classifier method and data classifier program stored on storage medium
WO2010013473A1 (ja) * 2008-07-30 2010-02-04 日本電気株式会社 データ分類システム、データ分類方法、及びデータ分類プログラム
US20100031202A1 (en) * 2008-08-04 2010-02-04 Microsoft Corporation User-defined gesture set for surface computing
US8847739B2 (en) 2008-08-04 2014-09-30 Microsoft Corporation Fusing RFID and vision for surface object tracking
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
US8095545B2 (en) * 2008-10-14 2012-01-10 Yahoo! Inc. System and methodology for a multi-site search engine
TWI390177B (zh) * 2008-11-24 2013-03-21 Inst Information Industry 景點推薦裝置和方法以及儲存媒體
WO2010065111A1 (en) 2008-12-01 2010-06-10 Topsy Labs, Inc. Ranking and selecting enitities based on calculated reputation or influence scores
US8768759B2 (en) * 2008-12-01 2014-07-01 Topsy Labs, Inc. Advertising based on influence
US20100153372A1 (en) * 2008-12-17 2010-06-17 Sea Woo Kim 3d visualization system for web survey
US8468153B2 (en) * 2009-01-21 2013-06-18 Recorded Future, Inc. Information service for facts extracted from differing sources on a wide area network
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US8554871B2 (en) 2009-01-30 2013-10-08 Navteq B.V. Method and system for exchanging location content data in different data formats
US8775074B2 (en) * 2009-01-30 2014-07-08 Navteq B.V. Method and system for refreshing location code data
US8458171B2 (en) * 2009-01-30 2013-06-04 Google Inc. Identifying query aspects
US20100198503A1 (en) * 2009-01-30 2010-08-05 Navteq North America, Llc Method and System for Assessing Quality of Location Content
US8271195B2 (en) 2009-01-30 2012-09-18 Navteq B.V. Method for representing linear features in a location content management system
US20100250325A1 (en) 2009-03-24 2010-09-30 Neurofocus, Inc. Neurological profiles for market matching and stimulus presentation
KR101050013B1 (ko) * 2009-04-30 2011-07-19 엔에이치엔(주) 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법
US20100293179A1 (en) * 2009-05-14 2010-11-18 Microsoft Corporation Identifying synonyms of entities using web search
US8533203B2 (en) * 2009-06-04 2013-09-10 Microsoft Corporation Identifying synonyms of entities using a document collection
US10987015B2 (en) 2009-08-24 2021-04-27 Nielsen Consumer Llc Dry electrodes for electroencephalography
US9560984B2 (en) 2009-10-29 2017-02-07 The Nielsen Company (Us), Llc Analysis of controlled and automatic attention for introduction of stimulus material
US20110106750A1 (en) 2009-10-29 2011-05-05 Neurofocus, Inc. Generating ratings predictions using neuro-response data
US9280597B2 (en) 2009-12-01 2016-03-08 Apple Inc. System and method for customizing search results from user's perspective
US9454586B2 (en) 2009-12-01 2016-09-27 Apple Inc. System and method for customizing analytics based on users media affiliation status
US11122009B2 (en) 2009-12-01 2021-09-14 Apple Inc. Systems and methods for identifying geographic locations of social media content collected over social networks
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
US9129017B2 (en) 2009-12-01 2015-09-08 Apple Inc. System and method for metadata transfer among search entities
US11036810B2 (en) 2009-12-01 2021-06-15 Apple Inc. System and method for determining quality of cited objects in search results based on the influence of citing subjects
US9110979B2 (en) 2009-12-01 2015-08-18 Apple Inc. Search of sources and targets based on relative expertise of the sources
US8892541B2 (en) 2009-12-01 2014-11-18 Topsy Labs, Inc. System and method for query temporality analysis
US20120290551A9 (en) * 2009-12-01 2012-11-15 Rishab Aiyer Ghosh System And Method For Identifying Trending Targets Based On Citations
US9043319B1 (en) * 2009-12-07 2015-05-26 Google Inc. Generating real-time search results
US8606792B1 (en) 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US9953083B2 (en) * 2010-02-16 2018-04-24 Excalibur Ip, Llc System and method for determining an authority rank for real time searching
US8918399B2 (en) * 2010-03-03 2014-12-23 Ca, Inc. Emerging topic discovery
US8732590B2 (en) * 2010-04-14 2014-05-20 Linkedin Corporation Techniques for presenting content items to members of a group
US8346780B2 (en) * 2010-04-16 2013-01-01 Hitachi, Ltd. Integrated search server and integrated search method
US8684742B2 (en) 2010-04-19 2014-04-01 Innerscope Research, Inc. Short imagery task (SIT) research method
US9600566B2 (en) 2010-05-14 2017-03-21 Microsoft Technology Licensing, Llc Identifying entity synonyms
US8874566B2 (en) * 2010-09-09 2014-10-28 Disney Enterprises, Inc. Online content ranking system based on authenticity metric values for web elements
JP5032645B2 (ja) * 2010-11-04 2012-09-26 株式会社東芝 ニュース情報分析装置
CN102033914A (zh) * 2010-11-29 2011-04-27 百度在线网络技术(北京)有限公司 基于权威度确定链接资源的可靠描述信息的方法与设备
WO2012116236A2 (en) 2011-02-23 2012-08-30 Nova Spivack System and method for analyzing messages in a network or across networks
US9176957B2 (en) 2011-06-10 2015-11-03 Linkedin Corporation Selective fact checking method and system
US9015037B2 (en) 2011-06-10 2015-04-21 Linkedin Corporation Interactive fact checking system
US9087048B2 (en) 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US8768782B1 (en) 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
US8185448B1 (en) 2011-06-10 2012-05-22 Myslinski Lucas J Fact checking method and system
US8612447B2 (en) 2011-06-22 2013-12-17 Rogers Communications Inc. Systems and methods for ranking document clusters
US8788502B1 (en) 2011-07-26 2014-07-22 Google Inc. Annotating articles
US9189797B2 (en) 2011-10-26 2015-11-17 Apple Inc. Systems and methods for sentiment detection, measurement, and normalization over social networks
US8843477B1 (en) * 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US8832092B2 (en) 2012-02-17 2014-09-09 Bottlenose, Inc. Natural language processing optimized for micro content
US9451303B2 (en) 2012-02-27 2016-09-20 The Nielsen Company (Us), Llc Method and system for gathering and computing an audience's neurologically-based reactions in a distributed framework involving remote storage and computing
US9292858B2 (en) 2012-02-27 2016-03-22 The Nielsen Company (Us), Llc Data collection system for aggregating biologically based measures in asynchronous geographically distributed public environments
US9569986B2 (en) 2012-02-27 2017-02-14 The Nielsen Company (Us), Llc System and method for gathering and analyzing biometric user feedback for use in social media and advertising applications
US8745019B2 (en) 2012-03-05 2014-06-03 Microsoft Corporation Robust discovery of entity synonyms using query logs
US8745081B2 (en) * 2012-03-13 2014-06-03 Yahoo! Inc. Personalization of news articles based on news sources
US10908792B2 (en) * 2012-04-04 2021-02-02 Recorded Future, Inc. Interactive event-based information system
WO2013173802A1 (en) * 2012-05-17 2013-11-21 Google Inc. Systems and methods for crawling and indexing content
US20150169584A1 (en) 2012-05-17 2015-06-18 Google Inc. Systems and methods for re-ranking ranked search results
US8977613B1 (en) * 2012-06-12 2015-03-10 Firstrain, Inc. Generation of recurring searches
US10032131B2 (en) 2012-06-20 2018-07-24 Microsoft Technology Licensing, Llc Data services for enterprises leveraging search system data assets
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US20140006406A1 (en) * 2012-06-28 2014-01-02 Aol Inc. Systems and methods for analyzing and managing electronic content
US9009126B2 (en) 2012-07-31 2015-04-14 Bottlenose, Inc. Discovering and ranking trending links about topics
US10560057B1 (en) 2012-08-06 2020-02-11 Google Llc Measuring media attention over time based on long term heterogeneous archive data
US9229924B2 (en) 2012-08-24 2016-01-05 Microsoft Technology Licensing, Llc Word detection and domain dictionary recommendation
US9558273B2 (en) * 2012-09-21 2017-01-31 Appinions Inc. System and method for generating influencer scores
US9152714B1 (en) 2012-10-01 2015-10-06 Google Inc. Selecting score improvements
US9043317B2 (en) 2012-12-06 2015-05-26 Ca, Inc. System and method for event-driven prioritization
US10037538B2 (en) * 2012-12-11 2018-07-31 Facebook, Inc. Selection and presentation of news stories identifying external content to social networking system users
US9483159B2 (en) 2012-12-12 2016-11-01 Linkedin Corporation Fact checking graphical user interface including fact checking icons
WO2014089776A1 (en) * 2012-12-12 2014-06-19 Google Inc. Ranking search results based on entity metrics
US8762302B1 (en) 2013-02-22 2014-06-24 Bottlenose, Inc. System and method for revealing correlations between data streams
US10747837B2 (en) 2013-03-11 2020-08-18 Creopoint, Inc. Containing disinformation spread using customizable intelligence channels
US9807181B2 (en) * 2013-07-17 2017-10-31 Yahoo Holdings, Inc. Determination of general and topical news and geographical scope of news content
US20150095320A1 (en) 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
US10169424B2 (en) 2013-09-27 2019-01-01 Lucas J. Myslinski Apparatus, systems and methods for scoring and distributing the reliability of online information
US11222084B2 (en) * 2013-10-22 2022-01-11 Steven Michael VITTORIO Content search and results
WO2015061479A1 (en) * 2013-10-22 2015-04-30 Vittorio Steven Michael Content and search results
US20220050882A1 (en) * 2013-10-22 2022-02-17 Steven Michael VITTORIO Content search and results
CN104699725B (zh) * 2013-12-10 2018-10-09 阿里巴巴集团控股有限公司 数据搜索处理方法及系统
US8990234B1 (en) 2014-02-28 2015-03-24 Lucas J. Myslinski Efficient fact checking method and system
US9643722B1 (en) 2014-02-28 2017-05-09 Lucas J. Myslinski Drone device security system
US9972055B2 (en) 2014-02-28 2018-05-15 Lucas J. Myslinski Fact checking method and system utilizing social networking information
US20150271096A1 (en) * 2014-03-24 2015-09-24 Google Technology Holdings LLC Allocation of Client Device Memory for Content from Content Sources
US9836765B2 (en) 2014-05-19 2017-12-05 Kibo Software, Inc. System and method for context-aware recommendation through user activity change detection
US9886479B2 (en) 2014-07-29 2018-02-06 International Business Machines Corporation Managing credibility for a question answering system
CN104182482B (zh) * 2014-08-06 2018-05-22 中国科学院计算技术研究所 一种新闻列表页判断方法及筛选新闻列表页的方法
US9189514B1 (en) 2014-09-04 2015-11-17 Lucas J. Myslinski Optimized fact checking method and system
WO2016058521A1 (zh) * 2014-10-13 2016-04-21 北京奇虎科技有限公司 判断新闻发布位置和新闻的重要性的方法和装置
US11250008B2 (en) 2015-04-17 2022-02-15 Steven Michael VITTORIO Content search and results
US9936250B2 (en) 2015-05-19 2018-04-03 The Nielsen Company (Us), Llc Methods and apparatus to adjust content presented to an individual
US11042591B2 (en) 2015-06-23 2021-06-22 Splunk Inc. Analytical search engine
US10866994B2 (en) 2015-06-23 2020-12-15 Splunk Inc. Systems and methods for instant crawling, curation of data sources, and enabling ad-hoc search
US20170177717A1 (en) * 2015-12-21 2017-06-22 The Knife, LLC Rating a level of journalistic distortion in news media content
US10242096B2 (en) 2016-03-15 2019-03-26 Google Llc Automated news digest
RU2660593C2 (ru) 2016-04-07 2018-07-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения исходной ссылки на исходный объект
EP3350726B1 (en) * 2016-12-09 2019-02-20 Google LLC Preventing the distribution of forbidden network content using automatic variant detection
JP6453367B2 (ja) * 2017-01-16 2019-01-16 Necパーソナルコンピュータ株式会社 広告サーバおよび広告配信システム
WO2018156641A1 (en) * 2017-02-21 2018-08-30 Sony Interactive Entertainment LLC Method for determining news veracity
JP6664585B2 (ja) * 2018-03-20 2020-03-13 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN110020194B (zh) * 2018-08-09 2021-10-08 南京尚网网络科技有限公司 资源推荐方法、装置及介质
RU2731654C1 (ru) 2018-09-17 2020-09-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания пуш-уведомлений, связанных с цифровыми новостями
RU2698916C1 (ru) * 2019-03-14 2019-09-02 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система поиска релевантных новостей
RU2757174C2 (ru) 2019-09-05 2021-10-11 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для ранжирования цифровых объектов на основе связанной с ними целевой характеристики
CN110825958A (zh) * 2019-09-24 2020-02-21 广州数知科技有限公司 一种基于网络热度的热点事件智能排序算法
US11341203B2 (en) * 2019-10-02 2022-05-24 Snapwise Inc. Methods and systems to generate information about news source items describing news events or topics of interest
US11393036B2 (en) 2019-10-11 2022-07-19 S&P Global Inc. Deep learning-based two-phase clustering algorithm
US11494416B2 (en) 2020-07-27 2022-11-08 S&P Global Inc. Automated event processing system
US11853697B2 (en) 2021-04-23 2023-12-26 International Business Machines Corporation Dynamically inheriting accumulated attribution
US12001529B1 (en) * 2021-11-05 2024-06-04 Validate Me LLC Counting machine for manufacturing and validating event-relevant identities via an ensemble network

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5293552A (en) * 1991-04-08 1994-03-08 U.S. Philips Corporation Method for storing bibliometric information on items from a finite source of text, and in particular document postings for use in a full-text document retrieval system
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
JPH08335265A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置および方法
US5907836A (en) * 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5787420A (en) * 1995-12-14 1998-07-28 Xerox Corporation Method of ordering document clusters without requiring knowledge of user interests
US6311197B2 (en) * 1996-06-03 2001-10-30 Webtv Networks, Inc. Method for downloading a web page to a client for efficient display on a television screen
US5930798A (en) * 1996-08-15 1999-07-27 Predicate Logic, Inc. Universal data measurement, analysis and control system
JPH10171819A (ja) 1996-12-06 1998-06-26 Fuji Xerox Co Ltd 情報検索装置
WO1998055630A2 (en) * 1997-06-06 1998-12-10 The Governors Of The University Of Alberta Alpha-1,3-fucosyltransferase of helicobacter pylori
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6119124A (en) * 1998-03-26 2000-09-12 Digital Equipment Corporation Method for clustering closely resembling data objects
US6275820B1 (en) * 1998-07-16 2001-08-14 Perot Systems Corporation System and method for integrating search results from heterogeneous information resources
US6558431B1 (en) * 1998-09-11 2003-05-06 Macromedia, Inc. Storing valid and invalid markup language in strict and relaxed tables respectively
EP1006458A1 (en) * 1998-12-01 2000-06-07 BRITISH TELECOMMUNICATIONS public limited company Methods and apparatus for information retrieval
JP3347088B2 (ja) * 1999-02-12 2002-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連情報検索方法およびシステム
US7702537B2 (en) * 1999-05-28 2010-04-20 Yahoo! Inc System and method for enabling multi-element bidding for influencing a position on a search result list generated by a computer network search engine
US7072888B1 (en) 1999-06-16 2006-07-04 Triogo, Inc. Process for improving search engine efficiency using feedback
US6453315B1 (en) * 1999-09-22 2002-09-17 Applied Semantics, Inc. Meaning-based information organization and retrieval
AU4712601A (en) * 1999-12-08 2001-07-03 Amazon.Com, Inc. System and method for locating and displaying web-based product offerings
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6952806B1 (en) * 2000-01-21 2005-10-04 Xerox Corporation Medium containing information gathered from material including a source and interface for graphically displaying the information
US7137065B1 (en) * 2000-02-24 2006-11-14 International Business Machines Corporation System and method for classifying electronically posted documents
US6594654B1 (en) * 2000-03-03 2003-07-15 Aly A. Salam Systems and methods for continuously accumulating research information via a computer network
US6859800B1 (en) * 2000-04-26 2005-02-22 Global Information Research And Technologies Llc System for fulfilling an information need
JP3562572B2 (ja) * 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
US6772160B2 (en) * 2000-06-08 2004-08-03 Ingenuity Systems, Inc. Techniques for facilitating information acquisition and storage
CA2443036A1 (en) 2003-09-14 2005-03-14 Yaron Mayer System and method for improved searching on the internet or similar networks and especially improved metanews and/or improved automatically generated newspapers.
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US7080073B1 (en) * 2000-08-18 2006-07-18 Firstrain, Inc. Method and apparatus for focused crawling
US6628994B1 (en) * 2000-08-31 2003-09-30 Hewlett-Packard Development Company, L.P. Method to obtain improved performance by automatic adjustment of computer system parameters
US6647383B1 (en) * 2000-09-01 2003-11-11 Lucent Technologies Inc. System and method for providing interactive dialogue and iterative search functions to find information
US20020038430A1 (en) * 2000-09-13 2002-03-28 Charles Edwards System and method of data collection, processing, analysis, and annotation for monitoring cyber-threats and the notification thereof to subscribers
JP2002092001A (ja) * 2000-09-20 2002-03-29 World Economic Information Services 高品質情報検索システム
US7200606B2 (en) * 2000-11-07 2007-04-03 The Regents Of The University Of California Method and system for selecting documents by measuring document quality
US6978419B1 (en) * 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US7080079B2 (en) * 2000-11-28 2006-07-18 Yu Philip K Method of using the internet to retrieve and handle articles in electronic form from printed publication which have been printed in paper form for circulation by the publisher
US20020073188A1 (en) 2000-12-07 2002-06-13 Rawson Freeman Leigh Method and apparatus for partitioning system management information for a server farm among a plurality of leaseholds
JP4476476B2 (ja) * 2000-12-13 2010-06-09 コニカミノルタホールディングス株式会社 ワークフローシステム及びワークフローシステムにおけるクライアント
US6892189B2 (en) * 2001-01-26 2005-05-10 Inxight Software, Inc. Method for learning and combining global and local regularities for information extraction and classification
US6850934B2 (en) 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
JPWO2002099695A1 (ja) 2001-05-31 2004-09-16 ソニー株式会社 情報処理装置、および情報処理方法、並びにプログラム
US6463265B1 (en) * 2001-06-05 2002-10-08 International Business Machines Corp. Data source hand-off in a broadcast-based data dissemination environment
JP3870043B2 (ja) 2001-07-05 2007-01-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のためのシステム、コンピュータ・プログラム、およびサーバ
US20030009496A1 (en) * 2001-07-05 2003-01-09 International Business Machines Corporation Bookmarks for world wide web documents with indicators of the hit rates for the web documents from the web sites sending the documents
US7010527B2 (en) 2001-08-13 2006-03-07 Oracle International Corp. Linguistically aware link analysis method and system
US6978274B1 (en) * 2001-08-31 2005-12-20 Attenex Corporation System and method for dynamically evaluating latent concepts in unstructured documents
CA2475319A1 (en) * 2002-02-04 2003-08-14 Cataphora, Inc. A method and apparatus to visually present discussions for data mining purposes
JP2003248691A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US7117201B2 (en) * 2002-03-20 2006-10-03 Hewlett-Packard Development Company, L.P. Resource searching
US20030220913A1 (en) * 2002-05-24 2003-11-27 International Business Machines Corporation Techniques for personalized and adaptive search services
US6892198B2 (en) * 2002-06-14 2005-05-10 Entopia, Inc. System and method for personalized information retrieval based on user expertise
US7171620B2 (en) * 2002-07-24 2007-01-30 Xerox Corporation System and method for managing document retention of shared documents
CA2496567A1 (en) * 2002-09-16 2004-03-25 The Trustees Of Columbia University In The City Of New York System and method for document collection, grouping and summarization
US8090717B1 (en) 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US7568148B1 (en) * 2002-09-20 2009-07-28 Google Inc. Methods and apparatus for clustering news content
US7209875B2 (en) * 2002-12-04 2007-04-24 Microsoft Corporation System and method for machine learning a confidence metric for machine translation
US7577654B2 (en) * 2003-07-25 2009-08-18 Palo Alto Research Center Incorporated Systems and methods for new event detection
US7617203B2 (en) * 2003-08-01 2009-11-10 Yahoo! Inc Listings optimization using a plurality of data sources
US7577655B2 (en) 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
AU2004288231A1 (en) * 2003-11-05 2005-05-19 Palingen, Inc. Enhanced B cell cytotoxicity of CDIM binding antibody
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US20070260586A1 (en) * 2006-05-03 2007-11-08 Antonio Savona Systems and methods for selecting and organizing information using temporal clustering
US20090164408A1 (en) * 2007-12-21 2009-06-25 Ilya Grigorik Method, System and Computer Program for Managing Delivery of Online Content
US8818992B2 (en) * 2008-09-12 2014-08-26 Nokia Corporation Method, system, and apparatus for arranging content search results
WO2010065111A1 (en) * 2008-12-01 2010-06-10 Topsy Labs, Inc. Ranking and selecting enitities based on calculated reputation or influence scores
US9058391B2 (en) * 2011-03-14 2015-06-16 Slangwho, Inc. System and method for transmitting a feed related to a first user to a second user
US9262773B2 (en) * 2012-05-17 2016-02-16 Trophy Stack, Inc. Method of ranking and displaying certified content
US9712578B2 (en) * 2014-06-17 2017-07-18 Facebook, Inc. Determining stories of interest based on quality of unconnected content

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038654A (zh) * 2013-03-05 2014-09-10 富士施乐株式会社 中继装置、客户端装置及方法
CN104038654B (zh) * 2013-03-05 2018-12-14 富士施乐株式会社 中继装置、客户端装置及方法

Also Published As

Publication number Publication date
US8126876B2 (en) 2012-02-28
US20130159294A1 (en) 2013-06-20
CN101826115B (zh) 2016-08-17
US8645368B2 (en) 2014-02-04
US20160019216A1 (en) 2016-01-21
CA2536449A1 (en) 2005-03-31
US7577655B2 (en) 2009-08-18
US20050060312A1 (en) 2005-03-17
US20120158711A1 (en) 2012-06-21
US8332382B2 (en) 2012-12-11
US10459926B2 (en) 2019-10-29
JP2014157623A (ja) 2014-08-28
JP5797806B2 (ja) 2015-10-21
US9037575B2 (en) 2015-05-19
JP2007517269A (ja) 2007-06-28
CN1853183A (zh) 2006-10-25
JP5632574B2 (ja) 2014-11-26
US20140188859A1 (en) 2014-07-03
US20090276429A1 (en) 2009-11-05
EP1665100A1 (en) 2006-06-07
WO2005029368A1 (en) 2005-03-31

Similar Documents

Publication Publication Date Title
CN101826115A (zh) 用于改进对新闻文章分级的系统和方法
US10496652B1 (en) Methods and apparatus for ranking documents
CN100568232C (zh) 通用搜索引擎接口
CN101416186B (zh) 增强的搜索结果
US7146416B1 (en) Web site activity monitoring system with tracking by categories and terms
Royal et al. What's on Wikipedia, and what's not...? Assessing completeness of information
US20070239701A1 (en) System and method for prioritizing websites during a webcrawling process
US20070174255A1 (en) Analyzing content to determine context and serving relevant content based on the context
CN101111837A (zh) 查询自动分类的搜索处理
WO2007064874A2 (en) Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy
KR20030091751A (ko) 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치
CN101305371A (zh) 对博客文档进行排名
WO2011031973A1 (en) Determining client system attributes
WO2012080707A1 (en) Method and apparatus for structuring a network
US20110184815A1 (en) System and method for sharing profits with one or more content providers
US20100161590A1 (en) Query processing in a dynamic cache
Chen et al. The best answers? think twice: online detection of commercial campaigns in the CQA forums
JP2015194955A (ja) 入札情報検索システム
Pallas et al. Evaluating the accuracy of cloud NLP services using ground-truth experiments
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
Li et al. Online commercial intention detection framework based on web pages
KAYALVIZHI et al. A Learning Approach for Noise Reduction in Web Data Based on Dynamic User Interests
CN114861046A (zh) 一种应用推荐方法及装置
Forman et al. A novel traffic analysis for identifying search fields in the long tail of web sites
Kumar et al. Noise Reduction in Web Data: a Learning Approach based on Dynamic User Interests

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google Inc.

Address before: American California

Patentee before: GOOGLE Inc.

CP01 Change in the name or title of a patent holder
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

CF01 Termination of patent right due to non-payment of annual fee