CN101826115A - 用于改进对新闻文章分级的系统和方法 - Google Patents
用于改进对新闻文章分级的系统和方法 Download PDFInfo
- Publication number
- CN101826115A CN101826115A CN201010198508A CN201010198508A CN101826115A CN 101826115 A CN101826115 A CN 101826115A CN 201010198508 A CN201010198508 A CN 201010198508A CN 201010198508 A CN201010198508 A CN 201010198508A CN 101826115 A CN101826115 A CN 101826115A
- Authority
- CN
- China
- Prior art keywords
- news sources
- news
- quote
- grade
- quoting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 40
- 239000000284 extract Substances 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 2
- 230000009471 action Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 4
- 239000002360 explosive Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99937—Sorting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种用于分级结果的系统。该系统可以接收链接的列表。该系统可以识别出与每个链接相关联的源,并且至少部分基于所识别出的源的质量对该链接的列表分级。
Description
本申请是申请号为200480026722.9,申请日期为2006年3月16日,发明名称为“用于改进对新闻文章分级的系统和方法”的申请的分案申请。
技术领域
本发明一般地涉及通信系统,更具体地说,涉及用于改进通信系统中的对新闻文章分级的系统和方法。
背景技术
诸如因特网之类的网络已成为日常生活的日益重要的部分。现在,数以百万的人天天访问因特网购买商品和服务,获得感兴趣的信息(例如,电影列表、新闻等),与朋友、家人和同事通信(例如,经由电子邮件和即时消息)。
现在,当希望在因特网上购买产品或仅仅寻找信息时,会在他/她的web浏览器输入关于感兴趣的web站点的统一资源定位符,以便访问特定的web站点。然后确定在该特定站点感兴趣的信息是否可用。
例如,假设有人希望经由因特网获得关于特定主题的最新新闻。它就访问包括传统的搜索引擎的web站点。将一个或多个与感兴趣的主题相关的项(例如“Iraq”)输入到搜索引擎中,试图定位已发布了关于该主题的文章的新闻源。这样,使用搜索引擎定位提供了与期望主题相关的新闻文章的各个网站,从而产生数百甚至数千个“点击”的经分级列表,其中每个点击可能与涉及这(一个或多个)搜索项的web页面相对应。
尽管该经分级列表中的每个点击可能涉及期望主题,但是与这些点击相关联的新闻源可能具有不同的质量。例如,大多认为CNN和BBC是报道准确、撰写专业等等的高质量源,而本地新闻源(例如,家乡的新闻源)可能是低质量的。
因此,需要系统和方法来基于与新闻文章相关联的的新闻源的质量来改进对新闻文章的分级。
发明内容
符合本发明原理的实现方式至少部分基于与新闻文章相关联的多个新闻源的质量来调整文章的分级。
根据符合本发明原理的一种实现方式,提供了一种用于分级结果的方法,该方法包括:接收链接的列表;针对每个链接识别出与该链接相关联的源;至少部分基于所识别出的源的质量对链接的列表分级。
在符合本发明原理的另一种实现方式中,一种服务器包括处理器和配置为存储一组源的质量指示符的存储器。处理器可以接收对象的列表,识别出与这些对象中的每个对象相关联的源,并且至少部分基于与对象的列表中的至少一个对象被关联到的源相关联的质量指示符来对所述对象分级。
在符合本发明原理的另一种实现方式中,提供了一种用于确定新闻源的质量的方法。该方法可以包括:至少部分基于下述中的至少一个来确定该新闻源的一个或多种度量值:在第一时间段中新闻源产生的文章数目;新闻源产生的文章的平均长度;在第二时间段中新闻源产生的重要报道的量;爆炸性新闻分数;到新闻源的网络流量;人们对新闻源的评价;新闻源的发行统计;与新闻源相关联的职员多少;与新闻源相关联的办事处的数目;在与新闻源相关联的一组文章中原始指名实体的数目;新闻源的覆盖幅度;到新闻源的流量源自的不同国家的数目;以及新闻源使用的写作风格。该方法还包括至少部分基于所确定的一个或多种度量值来计算新闻源的质量值。
在符合本发明原理的另一种实施方式中,提供了一种用于提供搜索结果的方法。该方法可以包括接收对象的列表;识别出与该组对象中的每个对象相关联的源;确定所识别出的源中的每个源的质量;以及至少部分基于所确定的与该组对象中的每个对象相关联到的源的质量来对该对象分级。
附图说明
结合于此并组成本说明书一部分的附图图示了本发明的实施例,并且与详细描述一起解释本发明。在附图中,
图1是符合本发明原理的系统和方法可以在其中实现的系统的示例图;
图2是在符合本发明原理的实现方式中的图1的服务器的示例图;
图3是在符合本发明原理的实现方式中可以与图2的服务器相关联的数据库的示意图;
图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图;
图5是在符合本发明原理的实现方式中用于调节对象分级的示例过程的流程图;
具体实施方式
下面符合本发明原理的实现方式的详细描述参考附图。在不同的图示中相同的标号可以识别相同的或相似的元素。另外,下面的详细描述不限制本发明。
符合本发明原理的实现方式至少部分基于与新闻文章相关联的源的质量来改进对搜索结果中的新闻文章的分级。尽管前述描述集中于对来自新闻源的新闻文章分级,但是应当理解,这里所述的技术同样适用于改进对除了新闻文章之外的其他项目分级。
示例性系统
图1是系统100的示例图,在系统100中,可以实现符合本发明原理的系统和方法。系统100可以包括多个客户机110,客户机110经由网络140连接到服务器120和130。网络140可以包括局域网(LAN)、广域网(WAN)、电话网(例如,公共交换电话网,PSTN)、内联网、因特网、相似的或不同的网络、或者这些网络的组合。出于简化,在图1中两个客户机110和三个服务器120/130被示作连接到网络140。实际上,可以有更多或更少的客户机110和/或服务器120/130。另外,在某些实例中,客户机110可以执行服务器120/130的功能,并且服务器120/130可以执行客户机110的功能。
客户机110可以包括设备,例如,无线电话、个人计算机、个人数字助理(PDA)、膝上型电脑等,以及在这些设备上运行的线程或进程,以及/或者可由这些设备执行的对象。服务器120/130可以包括服务器设备,线程,以及/或者以符合本发明的原理的方式操作、搜索或者维护文档的对象。客户机110和服务器120/130可以经由有线、无线或光连接而连接到网络140。
在符合本发明原理的实现方式中,服务器120可以包括由客户机110使用的搜索引擎125。服务器130可以存储可由客户机110访问的对象(或者web文档)。
示例性服务器配置
图2是符合本发明原理的实现方式中的服务器120的示例图。客户机110和服务器130可以类似地配置。服务器120可以包括总线210、处理器220、主存230、只读存储器(ROM)240、存储设备250、一个或多个输入设备260、一个或多个输出设备270、以及通信接口280。总线210可以包括允许在服务器120的组件之间通信的一个或多个导线。
处理器220可以包括可以解释并执行指令的任意类型的传统处理器或微处理器。主存230可以包括随机访问存储器(RAM)或其他类型的动态存储器件,存储用于处理器220执行的信息和指令。ROM 240可以包括传统的ROM器件或其他类型的静态存储器件,存储用于由处理器220使用的静态信息和指令。存储设备250可以包括磁和/或光记录介质及其相应的驱动器。
输入设备260可以包括允许用户将信息输入到服务器120的一种或多种传统机制,例如,键盘、鼠标、笔、一种或多种生物测定学(biometric)机制(例如语音识别设备),等等。输出设备270可以笔将信息输出到用户的一种或多种传统机制,包括显示器、打印机、扬声器等。通信接口280可以包括任何类似收发器的机制,其使服务器120能够与其他设备和/或系统通信。例如,通信接口280可以包括用于经由网络(例如,网络140)与另一个设备或系统通信的机制。
如下面将详细描述的,符合本发明原理的服务器120可以响应于来自客户机110的查询改进搜索结果。在一种实现方式中,服务器120基于提供新闻文章的源的质量对新闻文章搜索结果进行修改。服务器120可以响应于处理器220执行计算机可读介质(例如,存储器230)中包含的软件指令来执行这些操作。计算机可读介质可以被限定为一种或多种存储器器件和/或载波。软件指令可以从另一种计算机可读介质(例如,存储设备250)被读入到存储器230中,或者经由通信接口280从另一个设备读入到存储器230中。存储器230中包含的软件指令可以致使处理器220执行稍后将描述的过程。或者,硬连线的电路可以用来替换软件指令或者与软件指令组合使用来实现符合本发明原理的过程。因此,本发明不受限于硬件电路和软件的任意特定组合。
符合本发明原理的服务器120可以基于来自一个或多个关联数据库的信息来对搜索结果的分级进行分级或修改。这些数据库可以被存储在服务器120处(例如,在存储器230中)或者存储在服务器120外。
图3是数据库300的示例图,在符合本发明原理的实现方式中,数据库300可以与服务器120相关联。经管下面只描述一个数据库,但是应当意识到服务器120可以与一个或多个额外的数据库(未示出)相关联,这些额外的数据库本地地存储在服务器120处,或者分布在网络140上。
如上所述,数据库300可以包括源字段310和源等级字段320。数据库300可以包括额外的字段(未示出),这些额外的字段帮助搜索和分类数据库300中的信息和/或自网络140接收到的信息。
在系统100中,源字段310可以识别新闻源。标记为1到N(其中N是大于等于1的数字)的新闻源可以包括本地新闻源(例如,本地在线报纸或本地电视台网站),全国新闻源、国际新闻源、专业新闻源(例如,技术、体育或娱乐杂志或报纸)和/或来自网络(例如,因特网)的任何其他类型的新闻源。例如,新闻源可以包括WashingtonPost、CNN、MSNBC、BCC、the New York Post、USA Today、the Pittsburgh Post-Gazette、ESPN、Sports Illustrated等的在线版。
源等级字段320可以存储这样的值,该值可用于对从在源字段310中识别出的源提取的文章(或者文档)的等级进行调整。这样,可以将来自较高质量新闻源的文章的等级调整为比来自较低质量的新闻源的同样主题的文章的高。下面将详细描述,给定新闻源的值可以至少部分基于该新闻源的可信性、报告准确度、写作专业性等。
示例性处理
图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图。下面所述的过程可以由例如服务器120自动执行,或者由人员操作员手动执行。在替换实现方式中,下面所述过程的多个部分可以被自动执行,而其他部分可以被手动执行。
处理可以开始于考虑每个新闻源的一组度量(动作405)。每种度量可以测量新闻源的特定属性,该特定属性可以充当新闻源的质量的部分指示符。在符合本发明原理的一种实现方式中,每种度量可以作为数值计算,其中例如计算出的较高的值可能指示较高质量的新闻源。
在下面将详细解释,该组度量可以包括在给定时间段中由新闻源产生的文章的数目、来自该新闻源的文章的平均长度、来自该新闻源的报道的重要性、爆炸性新闻分数、使用模式、人群评价、发行统计、与该新闻源相关联的职员多少、与该新闻源相关的新闻办事处数目、在文章簇(cluster)中该新闻源产生指名实体的数目、覆盖幅度、国际多样性、写作风格等。确定新闻源的质量的第一度量可以包括在给定时间段中由该新闻源产生的文章的数目。该时间段可以是一周、双周、月等。在符合本发明原理的一种实现方式中,第一度量可以通过对在一时间段上该新闻源产生的非重复文章的数据进行计数来确定。在替换实现方式中,第一度量可以通过对由该新闻源产生的原始句子的数目进行计数来确定。
第二度量可以包括来自该新闻源的文章的平均长度。该平均产度可以例如按词或句子测量。在符合本发明原理的一种实现方式中,第二度量可以通过确定由该新闻源产生的非重复文章的平均长度来确定。例如,可以确定来自CNN的文章的平均长度为300个词,而来自Amateur News Network的文章的平均长度为150个词。因此,CNN的第二度量的值可以为300,而Amateur News Network的可以为150。
第三度量可以包括该新闻源的报道的重要性。该度量可以至少部分基于可以确定给定文章的背后新闻记事的“大小”(下文中称作“记事大小”)这样的假设。该度量可以为代表在固定时间段内所考虑的新闻源产生的所有非重复文章的记事大小分数的总值。该时间段可以是一周、双周、月等。作为示例,如果D为文章,则D的记事大小可以作为该系统(例如,服务器120)已知的关于相同主题的不同的其他文章的数目而被测量出。例如,如果D是关于哥伦比亚航天飞机坠毁的文章,并且存在500篇关于该主题的不同文章,则该记事大小应为500。存在许多用于检测关于该记事的其他文章的技术。例如,在下述共同未决、共同转让的专利申请中描述了两类这种技术,所述专利申请是:2003年6月30日提交的题为“Methods and Apparatus for RankingDocuments”的美国专利申请No.10/611,267,以及2003年6月30日提交的题为“Methods and Apparatus for Clustered Aggregation ofNews Content,”的美国专利申请No.10/611,269,这二者都通过引用明确整体结合于此。一组相关的文章在下文中称作“簇”。在符合本发明原理的一种实现方式中,度量值可以被限制为在规定的时间段上由给定的源覆盖的最大的N个记事的记事大小,其中N是大于等于1的正整数(例如,在1周中服务器120测量的由CNN覆盖的最大100个记事)。
第四度量可以包括代表爆炸性新闻分数的值。该度量可以测量新闻源在重要事件发生后立即发表记事的能力。该度量可以对来自新闻源的每篇非重复文章的“爆炸性分数”进行平均,其中爆炸性分数例如是这样的数字,如果在新闻事件发生后立即发表文章则该数字为较高的值,如果在从新闻记事发生起已经过很多时间后才发表文章则该数字为较低的值。
在符合本发明原理的一种实现方式中,以递增顺序按照发表时间对簇中的所有文章进行分类,并且第一篇文章的时间作为事件的时间。例如,假设T是当前文章和第一篇文章之间的时间差。阈值N1可用于标注这样的间隔,在该间隔之后不再考虑记事的爆炸性。因此,爆炸新闻分数度量可以如下确定(breaking_source:爆炸性分数):
如果T>N1,则breaking_score=0;
如果0<T≤N1,则breaking_score=log(Nl/T);并且
如果T=0,则breaking_score=log(Nl)。
N1可以以小时表示,例如3小时。
在符合本发明原理的另一种实现方式中,以递增顺序按照时间对簇中的所有文章进行分类,并且每篇文章的等级作为上述值T。相应地,可以使用阈值N2。因此,爆炸新闻分数度量可以如下确定:
如果T>N2,则breaking_score=0;并且
如果1<T≤N2,则breaking_score=log(N2/T)。
在一种示例性实现方式中,N2可以为10。
在又一种符合本发明原理的实现方式中,如上确定的爆炸性新闻分数可以被乘以这样的量,该量与给定文章所属的相关文章簇的大小成正比。例如,爆炸性新闻分数可以被乘以因子=(1+log(簇大小))。这在记事重要并且看来要形成大簇时突出爆炸性新闻的值。
在又一种实现方式中,不是对爆炸性分数值求平均,而是如果簇大小大于遇到值(例如,30),则对这些值求和。因此,在这种情形中,爆炸性新闻分数可以如下确定:
对于每篇文章A(size:大小;Breaking_new:爆炸性新闻;cluster:簇;Score:分数;rank_within_cluster:簇内等级):
如果(Size(cluster(A)))>30):
Breaking_news[score(A)]+=30-rank_within_Cluster(A)。
第五度量可以包括代表使用模式的值。可以针对使用(例如,点击)来监控从新闻搜索引擎的网页到各个文章的链接。常常被选择的新闻源被检测出,并且被分配与所观察到的使用成正比的值。公知的站点例如CNN倾向于优于不流行的站点,例如不知名的小镇新闻,用户可能避开这种新闻。所测量出的流量可以用读者可能访问该链接的机会的数目归一化,以避免由于新闻搜索引擎的分级偏好导致的测量偏离。
第六度量包括代表人群对新闻源的评价的值。在符合本发明原理的一种实现方式中,一般可以对用户进行民意测验来识别用户喜欢阅读(或者已访问过)的报纸(或者杂志)。作为替换或者附加地,可以对新闻搜索引擎的用户进行民意测验来确定用户喜欢访问的新闻网站。也可以使用其他机构对新闻站点的评估(例如,可以至少部分基于报纸已获得的Pulitzer奖的次数等对报纸进行比较)。此外,新闻源的年龄也可以作为公众信任的测量,并且可用作一种度量。在另一种实现方式中,可以向评估者出示来自各个新闻源选出的文章,并且要求给每个源分配一个分数。该分配的分数可以作为一种度量。
第七度量可以包括代表新闻源的发行统计的值。诸如MediaMetrix和Nielsen Netratings等机构发布在线站点(例如,新闻站点)的使用统计。这些发布的流量数字可以用作对新闻源的质量的测量。在符合本发明原理的一种实现方式中,与新闻站点相关联的印刷报纸的发现统计可作为一种度量。
第八度量可以包括代表与新闻源关联的职员数目的值。在符合本发明原理的一种实现方式中,可以至少部分基于在来自新闻源的文章中提到的不同记者的数目确定。
第九度量可以包括代表与新闻源关联的新闻办事处的数目的值。
第十度量可以包括代表下述原始指名实体的数目的值,所述原始指名实体的数目是在例如具有至少N篇相关文章(例如,N=3)的所有文章上平均的、新闻源在相关文章的簇内产生的原始指名实体的数目。指名实体可以对应于个人、位置或组织。如果新闻源生成包含同一簇内的其他文章(从而关于同一话题)不包含的指名实体的新闻记事,则这可能指示出该新闻源能够发出原始报道。在这种分析中,由在阈值大小为N的簇中给定的新闻源添加的平均值被评估。在符合本发明实施例的一种实现方式中,如果簇中没有较早的文章具有相同的指名实体,则可以考虑该指名实体。可以使用近似字符串匹配来对指名实体进行比较,以补偿拼写和缩写的变体。与其他文章中的指名实体显著不同的指名实体可以认为是原始的。
第十一度量可以包括代表新闻源的幅度的值(例如,新闻源产生的内容涉及的话题的数目)。在符合本发明原理的一种实现方式中,来自新闻源的文章可以分类到一组话题(例如,艺术、音乐、体育、商业等)中,并且话题的范围可以用作幅度的测量。可以使用任何传统分类技术来奖文章分类到多种话题中。例如,根据机器学习文献的分类系统可以用来将新闻文章分类到选出的一组话题中。在另一种实现方式中,由新闻源发表的章节数可以作为幅度的测量。
第十二度量可以包括代表新闻源的国际多样性的值。该度量可以测量新闻站点从其接收网络流量的国家的数目。在符合本发明原理的一种实现方式中,通过考虑到新闻站点的已知访问者所来自的国家,可以测量出该度量(例如,至少部分基于点击从搜索站点到正被测量的新闻源的文章的链接的那些用户的因特网协议(IP)地址)。基于已知IP块到国家的映射的表,可以将相应IP地址映射到起源国家。在另一种实现方式中,可以监控链接到给定新闻web站点的那些web站点的IP地址,该新闻站点从其被链接的不同国家的数目可以作为该度量。
第十三度量可以包括代表新闻源使用的写作风格的值。可以使用用于测量拼写正确性、语法和阅读水平的自动测试来生成反应写作风格的度量值。然后可以分配与测量出的写作风格成正比的分数。
应当意识到,除了上述度量组或者作为对上述度量组的替换,可以考虑其他度量。例如,另一种度量可以包括代表到新闻web站点的超链接的数目的值。
一旦已考虑了一组度量,就可以至少部分基于该组度量来确定每个新闻源的源等级(动作410)。为了确定每个新闻源的源等级,上述该组度量的一些或全部可以被组合来产生新闻源的最终分数(即,源等级)。可以使用许多技术来确定新闻源的源等级。例如,在符合本发明原理的一种实现方式中,每种度量可以被乘以相应的因子,并且所产生的值可以被总计,以给出新闻源的源等级。或者,每种度量可以被归一化到0到1的范围内,并且所产生的值可以被总计来给出最终度量值(即,源等级)。例如,可以通过将每种度量值除以该度量分配的最大可能值,从而实现归一化。
在另一种实现方式中,可以计算出新闻源的各种度量的平均等级。例如,如果CNN具有发行统计等级1,国际流行度等级2,以及国际办事处数目等级9,则仅考虑这些度量CNN具有平均分级(1+2+9)/3=4。
在又一种实现方式中,对于每个新闻源,相对于每种度量的最佳新闻源的该种度量的百分比分数可以用于确定该新闻源的分数分级。例如,如果CNN具有国际流行度等级2,并且BBC具有该度量的最高等级10,则CNN的该度量的百分比分数可以为0.2。
作为对上述的替换,上述技术之一可以仅与正被考虑的给定新闻源的最好的N种度量一起使用。N可以是大于等于一的正整数。在一种实现方式中,N可以为5。通过对给定新闻源仅考虑最好的N种度量,这允许结合某些度量还未被计算出的新闻源。
一旦已确定出新闻源的源等级,则服务器120可以存储该源等级(动作415)。在一种实现方式中,服务器120可以将新闻源的识别与相应的源等级值存储到数据库中,例如数据库300。
图5是在符合本发明原理的实现方式中用于调节对象(例如,新闻文章)的等级的示例过程的流程图。尽管下面的描述集中于作为搜索查询结果提取出的分级对象,但是符合本发明原理的实现方式不受限于此。实际上,符合本发明原理的实现方式同样适用于根据打分标准对新闻文章分级的系统和方法。该标准例如可以包括查询(例如,将在下面的示例性场景中描述的搜索引擎查询)、话题(例如,体育)、关键字列表(例如,来自搜索结果文档的初始集合的关键字)、地理区域(例如,纽约)、文章簇中的文章列表、或者示例性文档集合。
处理可以开始于用户使用例如客户机(例如,客户机110)上的web浏览器软件访问服务器120(图1)。然后用户可以项由服务器120维护的搜索引擎125提供包括一个或多个搜索项的查询(动作505)。在一种实现方式中,搜索查询包括与新闻话题有关的一个或多个项。例如,如果用户想阅览关于George Bush的新闻文章,则用户可以使客户机110向服务器120发送具有搜索项“George Bush”的搜索查询。
响应于接收到搜索项,服务器120可以以传统方式生成分级后的结果列表(动作510)。这些结果可以包括对新闻文章的引用(例如,链接),并且可能包括对链接的文本描述。服务器120可以针对分级的列表中的每个链接确定链接是否与已针对其确定了源等级的新闻源相对应。为了确定对于链接是否存在源等级,服务器120可以首先识别出链接对应的新闻源(动作515)。在一种实现方式中,服务器120可以至少部分基于与链接相关联的统一资源定位符(URL)识别新闻源。例如,服务器120可以确定出链接“www.cnn.com/2003/abc/index.html”对应于新闻源“CNN”。可以替换地使用用于识别链接的对应的新闻源的其它技术。
一旦已识别出新闻源,服务器120就可以通过例如访问数据库300并且确定与链接相对应的新闻源是否被存储在源字段310中,从而确定对于该链接是否存在源等级(动作520)。如果新闻源在源字段310中不存在,则服务器120不能调整该链接的分级。另一方面,如果该新闻源在源字段310中存在,则服务器120可以从源等级字段320提取出该新闻源的源等级。然后服务器120可以至少部分基于提取出的源等级来调整与该新闻源相对应的链接的分级(动作520)。
给定链接的初始分级R1,服务器120可以通过针对每个链接计算改进后的分数,从而产生调整后的分级R2。服务器120可以通过将与R1中的分级相对应的分数和与链接相关联的新闻源的源等级组合,从而确定出新分数。在符合本发明原理的一种实现方式中,服务器120可以将新分数确定为加权的和。例如,服务器120可以如下确定链接的新分数(NEWSCORE:新分数;OLDSCORE:旧分数;SOURCERANK:源等级):
NEWSCORE(D)=α*OLDSCORE(D)+β*SOURCERANK(SOURCE(D))
其中SOURCE(D)是链接D的新闻源,并且α和β是适当的常数。例如,在符合本发明原理的一种实现方式中,α可以被设置为0.8,β可以被设置为0.2。应当意识到,可以替换使用其他α和β值。也可以替换使用用于调整链接的分级的其他技术,例如,对R1分数和源等级求平均。这样,可以产生新链接的改进的分级。
一旦已调整了分级后列表,服务器120就可以向客户机110提供调整后的链接分级列表(动作525)。服务器120可以经由网络140将调整后的链接列表发送到客户机110。
在符合本发明原理的其他实现方式中,在动作510中,服务器120可以响应于接收到搜索查询,提取出未分级的结果列表。在这种情形中,服务器120可以基于与结果列表所关联到的新闻源相关联的源等级来对结果列表分级。
结论
符合本发明原理的实现方式可以至少部分基于与新闻文章相关联的新闻源的质量来改进对新闻文章的分级。
前面对本发明的示例性实施例的描述提供了说明和描述,但是不是要穷尽本发明或者将本发明限制于所公开的精确形式。根据上述教导,可以做出修改和改变,并且实施本发明可能要求修改和改变。例如,不需要由服务器120执行上述功能。在其他实现方式中,可以由客户机110执行图5中描述的一个或多个动作。例如,浏览器助手(即,与传统web浏览器一起工作的软件)可以执行参考图5的过程描述的一个或多个动作。
此外,如上所述,符合本发明原理的实现方式不受限于分级新闻文章。例如,符合本发明原理的实现方式可以用于对可以通过网络提取出或从一个或多个数据库提取出的其他类型的项目进行分级。
尽管已参考图4和图5描述了动作序列,但是在符合本发明的其他实现方式中这些动作的顺序可以改变。此外,可以并行实现无依赖关系的动作。
在本申请的描述中使用的元素、动作或指令不应当被解释为对本发明关键或必须的,除非明确描述我如此。另外,这里所使用的名词是要包括一个或多个项目。在仅要一个项目的地方,明确使用“一个”或类似的语言。
Claims (20)
1.一种由一个或多个服务器设备执行的用于对引用进行分级的方法,所述方法包括:
在一个或多个服务器设备的一个或多个处理器处接收来自客户机设备的搜索查询;
由一个或多个服务器设备的一个或多个处理器响应于接收搜索查询生成对新闻文章的引用列表;
由一个或多个服务器设备的一个或多个处理器对于在引用列表中的每个引用识别与每个引用相关联的新闻源;
由一个或多个服务器设备的一个或多个处理器对于每个识别出的新闻源确定是否存在新闻源等级;以及
由一个或多个服务器设备的一个或多个处理器至少部分地基于存在的新闻源等级对引用列表中的引用进行分级。
2.如权利要求1所述的方法,其中确定每个新闻源等级是否存在包括访问数据库以定位新闻源等级。
3.如权利要求1所述的方法,还包括:
向客户机设备提供分级后的引用列表。
4.如权利要求1所述的方法,其中对引用进行分级包括:
对于存在有对应的新闻源等级的每个引用,通过组合新闻源等级和与之前的引用分级相对应的分数来确定新分数;以及
基于新分数对引用进行分级。
5.如权利要求4所述的方法,其中确定新分数包括:
对于存在有对应的新闻源等级的每个引用,确定新闻源等级和与之前的引用分级相对应的分数的加权和。
6.如权利要求1所述的方法,其中识别新闻源包括基于与引用相关联的统一资源定位符(URL)识别新闻源。
7.如权利要求1所述的方法,其中对于对新闻文章的引用列表不进行分级。
8.一种系统,包括:
数据库,用于将质量值与识别新闻源的信息相关联;和
处理器,用于:
响应于接收查询生成对新闻文章的引用列表,
对于引用列表中的第一引用,识别与第一引用相关联的新闻源,
访问数据库,以提取与新闻源相对应的质量值,以及
基于提取的质量值,相对于引用列表中的其它引用对第一引用进行分级,以产生有序的引用列表。
9.如权利要求8所述的系统,其中处理器还被用于:
对于引用列表中的第二引用,识别与第二引用相关联的新闻源;
访问数据库,以提取与和第二引用相关联的新闻源相对应的第二质量值;以及
基于第二质量值,关于引用列表中的其它引用对第二引用进行分级。
10.如权利要求8所述的系统,其中处理器还用于:
向客户机设备提供有序的引用列表。
11.如权利要求8所述的系统,其中当对第一引用进行分级时,处理器还用于:
对于第一引用,通过组合质量值和与之前的引用分级相对应的之前的分数确定分数;以及
基于所述分数对引用进行分级。
12.如权利要求11所述的系统,其中当确定分数时,处理器还用于:
确定质量值和之前的分数的加权和。
13.如权利要求8所述的系统,其中当识别新闻源时,处理器还用于:
基于与引用相关联的统一资源定位符(URL)识别新闻源。
14.如权利要求8所述的系统,其中对引用列表不进行排序。
15.一种用于对引用进行分级的系统,所述系统包括:
用于接收来自客户机设备的搜索查询的装置;
用于响应于接收搜索查询生成对新闻文章的引用列表的装置;
用于对于在引用列表中的每个引用识别与每个引用相关联的新闻源的装置;
用于对于每个识别出的新闻源确定是否存在新闻源等级的装置;以及
用于至少部分地基于存在的新闻源等级对引用列表中的引用进行分级的装置。
16.如权利要求15所述的系统,其中引用包括到在线新闻文章的链接。
17.如权利要求16所述的系统,其中用于识别新闻源的装置包括用于基于与链接相关联的统一资源定位符(URL)识别新闻源的装置。
18.如权利要求15所述的系统,其中用于确定每个新闻源等级是否存在的装置包括用于访问数据库以定位新闻源等级的装置。
19.如权利要求15所述的系统,其中用于对引用进行分级的装置包括:
用于对于存在有对应的新闻源等级的每个引用,通过组合新闻源等级和与之前的引用分级相对应的分数来确定新分数的装置;以及
用于基于新分数对引用进行分级的装置。
20.如权利要求19所述的系统,用于确定新分数的装置包括:
用于对于存在有对应的新闻源等级的每个引用,确定新闻源等级和与之前的引用分级相对应的分数的加权和的装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/662,931 US7577655B2 (en) | 2003-09-16 | 2003-09-16 | Systems and methods for improving the ranking of news articles |
US10/662,931 | 2003-09-16 | ||
CNA2004800267229A CN1853183A (zh) | 2003-09-16 | 2004-09-14 | 用于改进对新闻文章分级的系统和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800267229A Division CN1853183A (zh) | 2003-09-16 | 2004-09-14 | 用于改进对新闻文章分级的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101826115A true CN101826115A (zh) | 2010-09-08 |
CN101826115B CN101826115B (zh) | 2016-08-17 |
Family
ID=34274249
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800267229A Pending CN1853183A (zh) | 2003-09-16 | 2004-09-14 | 用于改进对新闻文章分级的系统和方法 |
CN201010198508.9A Expired - Fee Related CN101826115B (zh) | 2003-09-16 | 2004-09-14 | 用于改进对新闻文章分级的系统和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800267229A Pending CN1853183A (zh) | 2003-09-16 | 2004-09-14 | 用于改进对新闻文章分级的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (6) | US7577655B2 (zh) |
EP (1) | EP1665100A1 (zh) |
JP (2) | JP5632574B2 (zh) |
CN (2) | CN1853183A (zh) |
CA (1) | CA2536449A1 (zh) |
WO (1) | WO2005029368A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104038654A (zh) * | 2013-03-05 | 2014-09-10 | 富士施乐株式会社 | 中继装置、客户端装置及方法 |
Families Citing this family (158)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8090717B1 (en) | 2002-09-20 | 2012-01-03 | Google Inc. | Methods and apparatus for ranking documents |
US7568148B1 (en) | 2002-09-20 | 2009-07-28 | Google Inc. | Methods and apparatus for clustering news content |
US7577655B2 (en) | 2003-09-16 | 2009-08-18 | Google Inc. | Systems and methods for improving the ranking of news articles |
US20050076097A1 (en) * | 2003-09-24 | 2005-04-07 | Sullivan Robert John | Dynamic web page referrer tracking and ranking |
US8700610B1 (en) | 2003-09-29 | 2014-04-15 | Google Inc. | Systems and methods for providing news alerts |
EP1716511A1 (en) * | 2004-02-20 | 2006-11-02 | Dow Jones Reuters Business Interactive, LLC | Intelligent search and retrieval system and method |
US7698333B2 (en) * | 2004-07-22 | 2010-04-13 | Factiva, Inc. | Intelligent query system and method using phrase-code frequency-inverse phrase-code document frequency module |
US9760629B1 (en) | 2004-12-29 | 2017-09-12 | Google Inc. | Systems and methods for implementing a news round table |
US7698270B2 (en) * | 2004-12-29 | 2010-04-13 | Baynote, Inc. | Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge |
GB0506618D0 (en) * | 2005-04-01 | 2005-05-11 | Wine Science Ltd | A method of supplying information articles at a website and system for supplying such articles |
US7962462B1 (en) | 2005-05-31 | 2011-06-14 | Google Inc. | Deriving and using document and site quality signals from search query streams |
WO2006130985A1 (en) | 2005-06-08 | 2006-12-14 | Ian Tzeung Huang | Internet search engine results ranking based on critic and user ratings |
US7565358B2 (en) * | 2005-08-08 | 2009-07-21 | Google Inc. | Agent rank |
US7856446B2 (en) * | 2005-12-27 | 2010-12-21 | Baynote, Inc. | Method and apparatus for determining usefulness of a digital asset |
US8880499B1 (en) | 2005-12-28 | 2014-11-04 | Google Inc. | Personalizing aggregated news content |
JP2007200267A (ja) * | 2006-01-29 | 2007-08-09 | Hiroyasu Yamamoto | 新聞と購読者間における購読後反響情報の双方向交流を可能にする新聞のシステム |
US20070185789A1 (en) * | 2006-02-09 | 2007-08-09 | Zorthian Gregory J | Magazine circulation scoring model |
US7451120B1 (en) * | 2006-03-20 | 2008-11-11 | Google Inc. | Detecting novel document content |
US7797313B1 (en) * | 2006-03-28 | 2010-09-14 | Symantec Operating Corporation | Relevance ranking in a computer system |
US7603350B1 (en) | 2006-05-09 | 2009-10-13 | Google Inc. | Search result ranking based on trust |
US7831928B1 (en) * | 2006-06-22 | 2010-11-09 | Digg, Inc. | Content visualization |
US7970938B1 (en) * | 2006-08-16 | 2011-06-28 | Vmware, Inc. | IP subnet discovery with ranked results |
US9514436B2 (en) | 2006-09-05 | 2016-12-06 | The Nielsen Company (Us), Llc | Method and system for predicting audience viewing behavior |
AU2007293092A1 (en) * | 2006-09-05 | 2008-03-13 | Innerscope Research, Inc. | Method and system for determining audience response to a sensory stimulus |
US8086600B2 (en) * | 2006-12-07 | 2011-12-27 | Google Inc. | Interleaving search results |
US20090024049A1 (en) | 2007-03-29 | 2009-01-22 | Neurofocus, Inc. | Cross-modality synthesis of central nervous system, autonomic nervous system, and effector data |
US7668823B2 (en) * | 2007-04-03 | 2010-02-23 | Google Inc. | Identifying inadequate search content |
US8392253B2 (en) | 2007-05-16 | 2013-03-05 | The Nielsen Company (Us), Llc | Neuro-physiology and neuro-behavioral based stimulus targeting system |
US7831596B2 (en) * | 2007-07-02 | 2010-11-09 | Hewlett-Packard Development Company, L.P. | Systems and processes for evaluating webpages |
US20090013068A1 (en) * | 2007-07-02 | 2009-01-08 | Eaglestone Robert J | Systems and processes for evaluating webpages |
EP2170161B1 (en) | 2007-07-30 | 2018-12-05 | The Nielsen Company (US), LLC. | Neuro-response stimulus and stimulus attribute resonance estimator |
JP2010536102A (ja) * | 2007-08-08 | 2010-11-25 | ベイノート,インク. | コンテキストに基づくコンテンツレコメンデーションの方法及び装置 |
US10698886B2 (en) * | 2007-08-14 | 2020-06-30 | John Nicholas And Kristin Gross Trust U/A/D | Temporal based online search and advertising |
US8386313B2 (en) | 2007-08-28 | 2013-02-26 | The Nielsen Company (Us), Llc | Stimulus placement system using subject neuro-response measurements |
US8392255B2 (en) | 2007-08-29 | 2013-03-05 | The Nielsen Company (Us), Llc | Content based selection and meta tagging of advertisement breaks |
US20090083129A1 (en) | 2007-09-20 | 2009-03-26 | Neurofocus, Inc. | Personalized content delivery using neuro-response priming data |
US8327395B2 (en) | 2007-10-02 | 2012-12-04 | The Nielsen Company (Us), Llc | System providing actionable insights based on physiological responses from viewers of media |
US20090133047A1 (en) | 2007-10-31 | 2009-05-21 | Lee Hans C | Systems and Methods Providing Distributed Collection and Centralized Processing of Physiological Responses from Viewers |
US9171454B2 (en) * | 2007-11-14 | 2015-10-27 | Microsoft Technology Licensing, Llc | Magic wand |
WO2009089116A2 (en) * | 2008-01-02 | 2009-07-16 | Three Purple Dots, Inc. | Systems and methods for determining the relative bias and accuracy of a piece of news |
WO2009094633A1 (en) * | 2008-01-25 | 2009-07-30 | Chacha Search, Inc. | Method and system for access to restricted resource(s) |
US20090265328A1 (en) * | 2008-04-16 | 2009-10-22 | Yahool Inc. | Predicting newsworthy queries using combined online and offline models |
US8952894B2 (en) * | 2008-05-12 | 2015-02-10 | Microsoft Technology Licensing, Llc | Computer vision-based multi-touch sensing using infrared lasers |
US9342589B2 (en) | 2008-07-30 | 2016-05-17 | Nec Corporation | Data classifier system, data classifier method and data classifier program stored on storage medium |
WO2010013473A1 (ja) * | 2008-07-30 | 2010-02-04 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
US20100031202A1 (en) * | 2008-08-04 | 2010-02-04 | Microsoft Corporation | User-defined gesture set for surface computing |
US8847739B2 (en) | 2008-08-04 | 2014-09-30 | Microsoft Corporation | Fusing RFID and vision for surface object tracking |
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US8095545B2 (en) * | 2008-10-14 | 2012-01-10 | Yahoo! Inc. | System and methodology for a multi-site search engine |
TWI390177B (zh) * | 2008-11-24 | 2013-03-21 | Inst Information Industry | 景點推薦裝置和方法以及儲存媒體 |
WO2010065111A1 (en) | 2008-12-01 | 2010-06-10 | Topsy Labs, Inc. | Ranking and selecting enitities based on calculated reputation or influence scores |
US8768759B2 (en) * | 2008-12-01 | 2014-07-01 | Topsy Labs, Inc. | Advertising based on influence |
US20100153372A1 (en) * | 2008-12-17 | 2010-06-17 | Sea Woo Kim | 3d visualization system for web survey |
US8468153B2 (en) * | 2009-01-21 | 2013-06-18 | Recorded Future, Inc. | Information service for facts extracted from differing sources on a wide area network |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US8554871B2 (en) | 2009-01-30 | 2013-10-08 | Navteq B.V. | Method and system for exchanging location content data in different data formats |
US8775074B2 (en) * | 2009-01-30 | 2014-07-08 | Navteq B.V. | Method and system for refreshing location code data |
US8458171B2 (en) * | 2009-01-30 | 2013-06-04 | Google Inc. | Identifying query aspects |
US20100198503A1 (en) * | 2009-01-30 | 2010-08-05 | Navteq North America, Llc | Method and System for Assessing Quality of Location Content |
US8271195B2 (en) | 2009-01-30 | 2012-09-18 | Navteq B.V. | Method for representing linear features in a location content management system |
US20100250325A1 (en) | 2009-03-24 | 2010-09-30 | Neurofocus, Inc. | Neurological profiles for market matching and stimulus presentation |
KR101050013B1 (ko) * | 2009-04-30 | 2011-07-19 | 엔에이치엔(주) | 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법 |
US20100293179A1 (en) * | 2009-05-14 | 2010-11-18 | Microsoft Corporation | Identifying synonyms of entities using web search |
US8533203B2 (en) * | 2009-06-04 | 2013-09-10 | Microsoft Corporation | Identifying synonyms of entities using a document collection |
US10987015B2 (en) | 2009-08-24 | 2021-04-27 | Nielsen Consumer Llc | Dry electrodes for electroencephalography |
US9560984B2 (en) | 2009-10-29 | 2017-02-07 | The Nielsen Company (Us), Llc | Analysis of controlled and automatic attention for introduction of stimulus material |
US20110106750A1 (en) | 2009-10-29 | 2011-05-05 | Neurofocus, Inc. | Generating ratings predictions using neuro-response data |
US9280597B2 (en) | 2009-12-01 | 2016-03-08 | Apple Inc. | System and method for customizing search results from user's perspective |
US9454586B2 (en) | 2009-12-01 | 2016-09-27 | Apple Inc. | System and method for customizing analytics based on users media affiliation status |
US11122009B2 (en) | 2009-12-01 | 2021-09-14 | Apple Inc. | Systems and methods for identifying geographic locations of social media content collected over social networks |
US11113299B2 (en) | 2009-12-01 | 2021-09-07 | Apple Inc. | System and method for metadata transfer among search entities |
US9129017B2 (en) | 2009-12-01 | 2015-09-08 | Apple Inc. | System and method for metadata transfer among search entities |
US11036810B2 (en) | 2009-12-01 | 2021-06-15 | Apple Inc. | System and method for determining quality of cited objects in search results based on the influence of citing subjects |
US9110979B2 (en) | 2009-12-01 | 2015-08-18 | Apple Inc. | Search of sources and targets based on relative expertise of the sources |
US8892541B2 (en) | 2009-12-01 | 2014-11-18 | Topsy Labs, Inc. | System and method for query temporality analysis |
US20120290551A9 (en) * | 2009-12-01 | 2012-11-15 | Rishab Aiyer Ghosh | System And Method For Identifying Trending Targets Based On Citations |
US9043319B1 (en) * | 2009-12-07 | 2015-05-26 | Google Inc. | Generating real-time search results |
US8606792B1 (en) | 2010-02-08 | 2013-12-10 | Google Inc. | Scoring authors of posts |
US9953083B2 (en) * | 2010-02-16 | 2018-04-24 | Excalibur Ip, Llc | System and method for determining an authority rank for real time searching |
US8918399B2 (en) * | 2010-03-03 | 2014-12-23 | Ca, Inc. | Emerging topic discovery |
US8732590B2 (en) * | 2010-04-14 | 2014-05-20 | Linkedin Corporation | Techniques for presenting content items to members of a group |
US8346780B2 (en) * | 2010-04-16 | 2013-01-01 | Hitachi, Ltd. | Integrated search server and integrated search method |
US8684742B2 (en) | 2010-04-19 | 2014-04-01 | Innerscope Research, Inc. | Short imagery task (SIT) research method |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
US8874566B2 (en) * | 2010-09-09 | 2014-10-28 | Disney Enterprises, Inc. | Online content ranking system based on authenticity metric values for web elements |
JP5032645B2 (ja) * | 2010-11-04 | 2012-09-26 | 株式会社東芝 | ニュース情報分析装置 |
CN102033914A (zh) * | 2010-11-29 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 基于权威度确定链接资源的可靠描述信息的方法与设备 |
WO2012116236A2 (en) | 2011-02-23 | 2012-08-30 | Nova Spivack | System and method for analyzing messages in a network or across networks |
US9176957B2 (en) | 2011-06-10 | 2015-11-03 | Linkedin Corporation | Selective fact checking method and system |
US9015037B2 (en) | 2011-06-10 | 2015-04-21 | Linkedin Corporation | Interactive fact checking system |
US9087048B2 (en) | 2011-06-10 | 2015-07-21 | Linkedin Corporation | Method of and system for validating a fact checking system |
US8768782B1 (en) | 2011-06-10 | 2014-07-01 | Linkedin Corporation | Optimized cloud computing fact checking |
US8185448B1 (en) | 2011-06-10 | 2012-05-22 | Myslinski Lucas J | Fact checking method and system |
US8612447B2 (en) | 2011-06-22 | 2013-12-17 | Rogers Communications Inc. | Systems and methods for ranking document clusters |
US8788502B1 (en) | 2011-07-26 | 2014-07-22 | Google Inc. | Annotating articles |
US9189797B2 (en) | 2011-10-26 | 2015-11-17 | Apple Inc. | Systems and methods for sentiment detection, measurement, and normalization over social networks |
US8843477B1 (en) * | 2011-10-31 | 2014-09-23 | Google Inc. | Onsite and offsite search ranking results |
US8832092B2 (en) | 2012-02-17 | 2014-09-09 | Bottlenose, Inc. | Natural language processing optimized for micro content |
US9451303B2 (en) | 2012-02-27 | 2016-09-20 | The Nielsen Company (Us), Llc | Method and system for gathering and computing an audience's neurologically-based reactions in a distributed framework involving remote storage and computing |
US9292858B2 (en) | 2012-02-27 | 2016-03-22 | The Nielsen Company (Us), Llc | Data collection system for aggregating biologically based measures in asynchronous geographically distributed public environments |
US9569986B2 (en) | 2012-02-27 | 2017-02-14 | The Nielsen Company (Us), Llc | System and method for gathering and analyzing biometric user feedback for use in social media and advertising applications |
US8745019B2 (en) | 2012-03-05 | 2014-06-03 | Microsoft Corporation | Robust discovery of entity synonyms using query logs |
US8745081B2 (en) * | 2012-03-13 | 2014-06-03 | Yahoo! Inc. | Personalization of news articles based on news sources |
US10908792B2 (en) * | 2012-04-04 | 2021-02-02 | Recorded Future, Inc. | Interactive event-based information system |
WO2013173802A1 (en) * | 2012-05-17 | 2013-11-21 | Google Inc. | Systems and methods for crawling and indexing content |
US20150169584A1 (en) | 2012-05-17 | 2015-06-18 | Google Inc. | Systems and methods for re-ranking ranked search results |
US8977613B1 (en) * | 2012-06-12 | 2015-03-10 | Firstrain, Inc. | Generation of recurring searches |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US20140006406A1 (en) * | 2012-06-28 | 2014-01-02 | Aol Inc. | Systems and methods for analyzing and managing electronic content |
US9009126B2 (en) | 2012-07-31 | 2015-04-14 | Bottlenose, Inc. | Discovering and ranking trending links about topics |
US10560057B1 (en) | 2012-08-06 | 2020-02-11 | Google Llc | Measuring media attention over time based on long term heterogeneous archive data |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
US9558273B2 (en) * | 2012-09-21 | 2017-01-31 | Appinions Inc. | System and method for generating influencer scores |
US9152714B1 (en) | 2012-10-01 | 2015-10-06 | Google Inc. | Selecting score improvements |
US9043317B2 (en) | 2012-12-06 | 2015-05-26 | Ca, Inc. | System and method for event-driven prioritization |
US10037538B2 (en) * | 2012-12-11 | 2018-07-31 | Facebook, Inc. | Selection and presentation of news stories identifying external content to social networking system users |
US9483159B2 (en) | 2012-12-12 | 2016-11-01 | Linkedin Corporation | Fact checking graphical user interface including fact checking icons |
WO2014089776A1 (en) * | 2012-12-12 | 2014-06-19 | Google Inc. | Ranking search results based on entity metrics |
US8762302B1 (en) | 2013-02-22 | 2014-06-24 | Bottlenose, Inc. | System and method for revealing correlations between data streams |
US10747837B2 (en) | 2013-03-11 | 2020-08-18 | Creopoint, Inc. | Containing disinformation spread using customizable intelligence channels |
US9807181B2 (en) * | 2013-07-17 | 2017-10-31 | Yahoo Holdings, Inc. | Determination of general and topical news and geographical scope of news content |
US20150095320A1 (en) | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
US10169424B2 (en) | 2013-09-27 | 2019-01-01 | Lucas J. Myslinski | Apparatus, systems and methods for scoring and distributing the reliability of online information |
US11222084B2 (en) * | 2013-10-22 | 2022-01-11 | Steven Michael VITTORIO | Content search and results |
WO2015061479A1 (en) * | 2013-10-22 | 2015-04-30 | Vittorio Steven Michael | Content and search results |
US20220050882A1 (en) * | 2013-10-22 | 2022-02-17 | Steven Michael VITTORIO | Content search and results |
CN104699725B (zh) * | 2013-12-10 | 2018-10-09 | 阿里巴巴集团控股有限公司 | 数据搜索处理方法及系统 |
US8990234B1 (en) | 2014-02-28 | 2015-03-24 | Lucas J. Myslinski | Efficient fact checking method and system |
US9643722B1 (en) | 2014-02-28 | 2017-05-09 | Lucas J. Myslinski | Drone device security system |
US9972055B2 (en) | 2014-02-28 | 2018-05-15 | Lucas J. Myslinski | Fact checking method and system utilizing social networking information |
US20150271096A1 (en) * | 2014-03-24 | 2015-09-24 | Google Technology Holdings LLC | Allocation of Client Device Memory for Content from Content Sources |
US9836765B2 (en) | 2014-05-19 | 2017-12-05 | Kibo Software, Inc. | System and method for context-aware recommendation through user activity change detection |
US9886479B2 (en) | 2014-07-29 | 2018-02-06 | International Business Machines Corporation | Managing credibility for a question answering system |
CN104182482B (zh) * | 2014-08-06 | 2018-05-22 | 中国科学院计算技术研究所 | 一种新闻列表页判断方法及筛选新闻列表页的方法 |
US9189514B1 (en) | 2014-09-04 | 2015-11-17 | Lucas J. Myslinski | Optimized fact checking method and system |
WO2016058521A1 (zh) * | 2014-10-13 | 2016-04-21 | 北京奇虎科技有限公司 | 判断新闻发布位置和新闻的重要性的方法和装置 |
US11250008B2 (en) | 2015-04-17 | 2022-02-15 | Steven Michael VITTORIO | Content search and results |
US9936250B2 (en) | 2015-05-19 | 2018-04-03 | The Nielsen Company (Us), Llc | Methods and apparatus to adjust content presented to an individual |
US11042591B2 (en) | 2015-06-23 | 2021-06-22 | Splunk Inc. | Analytical search engine |
US10866994B2 (en) | 2015-06-23 | 2020-12-15 | Splunk Inc. | Systems and methods for instant crawling, curation of data sources, and enabling ad-hoc search |
US20170177717A1 (en) * | 2015-12-21 | 2017-06-22 | The Knife, LLC | Rating a level of journalistic distortion in news media content |
US10242096B2 (en) | 2016-03-15 | 2019-03-26 | Google Llc | Automated news digest |
RU2660593C2 (ru) | 2016-04-07 | 2018-07-06 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер определения исходной ссылки на исходный объект |
EP3350726B1 (en) * | 2016-12-09 | 2019-02-20 | Google LLC | Preventing the distribution of forbidden network content using automatic variant detection |
JP6453367B2 (ja) * | 2017-01-16 | 2019-01-16 | Necパーソナルコンピュータ株式会社 | 広告サーバおよび広告配信システム |
WO2018156641A1 (en) * | 2017-02-21 | 2018-08-30 | Sony Interactive Entertainment LLC | Method for determining news veracity |
JP6664585B2 (ja) * | 2018-03-20 | 2020-03-13 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN110020194B (zh) * | 2018-08-09 | 2021-10-08 | 南京尚网网络科技有限公司 | 资源推荐方法、装置及介质 |
RU2731654C1 (ru) | 2018-09-17 | 2020-09-07 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания пуш-уведомлений, связанных с цифровыми новостями |
RU2698916C1 (ru) * | 2019-03-14 | 2019-09-02 | Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) | Способ и система поиска релевантных новостей |
RU2757174C2 (ru) | 2019-09-05 | 2021-10-11 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для ранжирования цифровых объектов на основе связанной с ними целевой характеристики |
CN110825958A (zh) * | 2019-09-24 | 2020-02-21 | 广州数知科技有限公司 | 一种基于网络热度的热点事件智能排序算法 |
US11341203B2 (en) * | 2019-10-02 | 2022-05-24 | Snapwise Inc. | Methods and systems to generate information about news source items describing news events or topics of interest |
US11393036B2 (en) | 2019-10-11 | 2022-07-19 | S&P Global Inc. | Deep learning-based two-phase clustering algorithm |
US11494416B2 (en) | 2020-07-27 | 2022-11-08 | S&P Global Inc. | Automated event processing system |
US11853697B2 (en) | 2021-04-23 | 2023-12-26 | International Business Machines Corporation | Dynamically inheriting accumulated attribution |
US12001529B1 (en) * | 2021-11-05 | 2024-06-04 | Validate Me LLC | Counting machine for manufacturing and validating event-relevant identities via an ensemble network |
Family Cites Families (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5293552A (en) * | 1991-04-08 | 1994-03-08 | U.S. Philips Corporation | Method for storing bibliometric information on items from a finite source of text, and in particular document postings for use in a full-text document retrieval system |
US5724567A (en) * | 1994-04-25 | 1998-03-03 | Apple Computer, Inc. | System for directing relevance-ranked data objects to computer users |
JPH08335265A (ja) * | 1995-06-07 | 1996-12-17 | Canon Inc | 文書処理装置および方法 |
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US6026388A (en) * | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5787420A (en) * | 1995-12-14 | 1998-07-28 | Xerox Corporation | Method of ordering document clusters without requiring knowledge of user interests |
US6311197B2 (en) * | 1996-06-03 | 2001-10-30 | Webtv Networks, Inc. | Method for downloading a web page to a client for efficient display on a television screen |
US5930798A (en) * | 1996-08-15 | 1999-07-27 | Predicate Logic, Inc. | Universal data measurement, analysis and control system |
JPH10171819A (ja) | 1996-12-06 | 1998-06-26 | Fuji Xerox Co Ltd | 情報検索装置 |
WO1998055630A2 (en) * | 1997-06-06 | 1998-12-10 | The Governors Of The University Of Alberta | Alpha-1,3-fucosyltransferase of helicobacter pylori |
US6421675B1 (en) | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
US6119124A (en) * | 1998-03-26 | 2000-09-12 | Digital Equipment Corporation | Method for clustering closely resembling data objects |
US6275820B1 (en) * | 1998-07-16 | 2001-08-14 | Perot Systems Corporation | System and method for integrating search results from heterogeneous information resources |
US6558431B1 (en) * | 1998-09-11 | 2003-05-06 | Macromedia, Inc. | Storing valid and invalid markup language in strict and relaxed tables respectively |
EP1006458A1 (en) * | 1998-12-01 | 2000-06-07 | BRITISH TELECOMMUNICATIONS public limited company | Methods and apparatus for information retrieval |
JP3347088B2 (ja) * | 1999-02-12 | 2002-11-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 関連情報検索方法およびシステム |
US7702537B2 (en) * | 1999-05-28 | 2010-04-20 | Yahoo! Inc | System and method for enabling multi-element bidding for influencing a position on a search result list generated by a computer network search engine |
US7072888B1 (en) | 1999-06-16 | 2006-07-04 | Triogo, Inc. | Process for improving search engine efficiency using feedback |
US6453315B1 (en) * | 1999-09-22 | 2002-09-17 | Applied Semantics, Inc. | Meaning-based information organization and retrieval |
AU4712601A (en) * | 1999-12-08 | 2001-07-03 | Amazon.Com, Inc. | System and method for locating and displaying web-based product offerings |
US6963867B2 (en) * | 1999-12-08 | 2005-11-08 | A9.Com, Inc. | Search query processing to provide category-ranked presentation of search results |
US6785671B1 (en) * | 1999-12-08 | 2004-08-31 | Amazon.Com, Inc. | System and method for locating web-based product offerings |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6952806B1 (en) * | 2000-01-21 | 2005-10-04 | Xerox Corporation | Medium containing information gathered from material including a source and interface for graphically displaying the information |
US7137065B1 (en) * | 2000-02-24 | 2006-11-14 | International Business Machines Corporation | System and method for classifying electronically posted documents |
US6594654B1 (en) * | 2000-03-03 | 2003-07-15 | Aly A. Salam | Systems and methods for continuously accumulating research information via a computer network |
US6859800B1 (en) * | 2000-04-26 | 2005-02-22 | Global Information Research And Technologies Llc | System for fulfilling an information need |
JP3562572B2 (ja) * | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US6772160B2 (en) * | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
CA2443036A1 (en) | 2003-09-14 | 2005-03-14 | Yaron Mayer | System and method for improved searching on the internet or similar networks and especially improved metanews and/or improved automatically generated newspapers. |
US7490092B2 (en) * | 2000-07-06 | 2009-02-10 | Streamsage, Inc. | Method and system for indexing and searching timed media information based upon relevance intervals |
US6601075B1 (en) * | 2000-07-27 | 2003-07-29 | International Business Machines Corporation | System and method of ranking and retrieving documents based on authority scores of schemas and documents |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US6628994B1 (en) * | 2000-08-31 | 2003-09-30 | Hewlett-Packard Development Company, L.P. | Method to obtain improved performance by automatic adjustment of computer system parameters |
US6647383B1 (en) * | 2000-09-01 | 2003-11-11 | Lucent Technologies Inc. | System and method for providing interactive dialogue and iterative search functions to find information |
US20020038430A1 (en) * | 2000-09-13 | 2002-03-28 | Charles Edwards | System and method of data collection, processing, analysis, and annotation for monitoring cyber-threats and the notification thereof to subscribers |
JP2002092001A (ja) * | 2000-09-20 | 2002-03-29 | World Economic Information Services | 高品質情報検索システム |
US7200606B2 (en) * | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6978419B1 (en) * | 2000-11-15 | 2005-12-20 | Justsystem Corporation | Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments |
US7080079B2 (en) * | 2000-11-28 | 2006-07-18 | Yu Philip K | Method of using the internet to retrieve and handle articles in electronic form from printed publication which have been printed in paper form for circulation by the publisher |
US20020073188A1 (en) | 2000-12-07 | 2002-06-13 | Rawson Freeman Leigh | Method and apparatus for partitioning system management information for a server farm among a plurality of leaseholds |
JP4476476B2 (ja) * | 2000-12-13 | 2010-06-09 | コニカミノルタホールディングス株式会社 | ワークフローシステム及びワークフローシステムにおけるクライアント |
US6892189B2 (en) * | 2001-01-26 | 2005-05-10 | Inxight Software, Inc. | Method for learning and combining global and local regularities for information extraction and classification |
US6850934B2 (en) | 2001-03-26 | 2005-02-01 | International Business Machines Corporation | Adaptive search engine query |
JPWO2002099695A1 (ja) | 2001-05-31 | 2004-09-16 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
US6463265B1 (en) * | 2001-06-05 | 2002-10-08 | International Business Machines Corp. | Data source hand-off in a broadcast-based data dissemination environment |
JP3870043B2 (ja) | 2001-07-05 | 2007-01-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のためのシステム、コンピュータ・プログラム、およびサーバ |
US20030009496A1 (en) * | 2001-07-05 | 2003-01-09 | International Business Machines Corporation | Bookmarks for world wide web documents with indicators of the hit rates for the web documents from the web sites sending the documents |
US7010527B2 (en) | 2001-08-13 | 2006-03-07 | Oracle International Corp. | Linguistically aware link analysis method and system |
US6978274B1 (en) * | 2001-08-31 | 2005-12-20 | Attenex Corporation | System and method for dynamically evaluating latent concepts in unstructured documents |
CA2475319A1 (en) * | 2002-02-04 | 2003-08-14 | Cataphora, Inc. | A method and apparatus to visually present discussions for data mining purposes |
JP2003248691A (ja) * | 2002-02-25 | 2003-09-05 | Nippon Telegr & Teleph Corp <Ntt> | 分散型検索方法、及び、分散型検索装置、及び、分散型検索プログラム、及び、分散型検索プログラムを格納した記憶媒体 |
US7567953B2 (en) * | 2002-03-01 | 2009-07-28 | Business Objects Americas | System and method for retrieving and organizing information from disparate computer network information sources |
US7117201B2 (en) * | 2002-03-20 | 2006-10-03 | Hewlett-Packard Development Company, L.P. | Resource searching |
US20030220913A1 (en) * | 2002-05-24 | 2003-11-27 | International Business Machines Corporation | Techniques for personalized and adaptive search services |
US6892198B2 (en) * | 2002-06-14 | 2005-05-10 | Entopia, Inc. | System and method for personalized information retrieval based on user expertise |
US7171620B2 (en) * | 2002-07-24 | 2007-01-30 | Xerox Corporation | System and method for managing document retention of shared documents |
CA2496567A1 (en) * | 2002-09-16 | 2004-03-25 | The Trustees Of Columbia University In The City Of New York | System and method for document collection, grouping and summarization |
US8090717B1 (en) | 2002-09-20 | 2012-01-03 | Google Inc. | Methods and apparatus for ranking documents |
US7568148B1 (en) * | 2002-09-20 | 2009-07-28 | Google Inc. | Methods and apparatus for clustering news content |
US7209875B2 (en) * | 2002-12-04 | 2007-04-24 | Microsoft Corporation | System and method for machine learning a confidence metric for machine translation |
US7577654B2 (en) * | 2003-07-25 | 2009-08-18 | Palo Alto Research Center Incorporated | Systems and methods for new event detection |
US7617203B2 (en) * | 2003-08-01 | 2009-11-10 | Yahoo! Inc | Listings optimization using a plurality of data sources |
US7577655B2 (en) | 2003-09-16 | 2009-08-18 | Google Inc. | Systems and methods for improving the ranking of news articles |
AU2004288231A1 (en) * | 2003-11-05 | 2005-05-19 | Palingen, Inc. | Enhanced B cell cytotoxicity of CDIM binding antibody |
US20080077570A1 (en) * | 2004-10-25 | 2008-03-27 | Infovell, Inc. | Full Text Query and Search Systems and Method of Use |
US20070260586A1 (en) * | 2006-05-03 | 2007-11-08 | Antonio Savona | Systems and methods for selecting and organizing information using temporal clustering |
US20090164408A1 (en) * | 2007-12-21 | 2009-06-25 | Ilya Grigorik | Method, System and Computer Program for Managing Delivery of Online Content |
US8818992B2 (en) * | 2008-09-12 | 2014-08-26 | Nokia Corporation | Method, system, and apparatus for arranging content search results |
WO2010065111A1 (en) * | 2008-12-01 | 2010-06-10 | Topsy Labs, Inc. | Ranking and selecting enitities based on calculated reputation or influence scores |
US9058391B2 (en) * | 2011-03-14 | 2015-06-16 | Slangwho, Inc. | System and method for transmitting a feed related to a first user to a second user |
US9262773B2 (en) * | 2012-05-17 | 2016-02-16 | Trophy Stack, Inc. | Method of ranking and displaying certified content |
US9712578B2 (en) * | 2014-06-17 | 2017-07-18 | Facebook, Inc. | Determining stories of interest based on quality of unconnected content |
-
2003
- 2003-09-16 US US10/662,931 patent/US7577655B2/en not_active Expired - Fee Related
-
2004
- 2004-09-14 CN CNA2004800267229A patent/CN1853183A/zh active Pending
- 2004-09-14 EP EP04784026A patent/EP1665100A1/en not_active Ceased
- 2004-09-14 CN CN201010198508.9A patent/CN101826115B/zh not_active Expired - Fee Related
- 2004-09-14 CA CA002536449A patent/CA2536449A1/en not_active Withdrawn
- 2004-09-14 WO PCT/US2004/030028 patent/WO2005029368A1/en active Application Filing
- 2004-09-14 JP JP2006526402A patent/JP5632574B2/ja not_active Expired - Fee Related
-
2009
- 2009-07-10 US US12/501,256 patent/US8126876B2/en not_active Expired - Fee Related
-
2012
- 2012-02-24 US US13/404,827 patent/US8332382B2/en not_active Expired - Lifetime
- 2012-09-14 US US13/616,659 patent/US8645368B2/en not_active Expired - Fee Related
-
2013
- 2013-12-24 US US14/140,108 patent/US9037575B2/en not_active Expired - Lifetime
-
2014
- 2014-04-25 JP JP2014091127A patent/JP5797806B2/ja not_active Expired - Fee Related
-
2015
- 2015-04-27 US US14/696,931 patent/US10459926B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104038654A (zh) * | 2013-03-05 | 2014-09-10 | 富士施乐株式会社 | 中继装置、客户端装置及方法 |
CN104038654B (zh) * | 2013-03-05 | 2018-12-14 | 富士施乐株式会社 | 中继装置、客户端装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
US8126876B2 (en) | 2012-02-28 |
US20130159294A1 (en) | 2013-06-20 |
CN101826115B (zh) | 2016-08-17 |
US8645368B2 (en) | 2014-02-04 |
US20160019216A1 (en) | 2016-01-21 |
CA2536449A1 (en) | 2005-03-31 |
US7577655B2 (en) | 2009-08-18 |
US20050060312A1 (en) | 2005-03-17 |
US20120158711A1 (en) | 2012-06-21 |
US8332382B2 (en) | 2012-12-11 |
US10459926B2 (en) | 2019-10-29 |
JP2014157623A (ja) | 2014-08-28 |
JP5797806B2 (ja) | 2015-10-21 |
US9037575B2 (en) | 2015-05-19 |
JP2007517269A (ja) | 2007-06-28 |
CN1853183A (zh) | 2006-10-25 |
JP5632574B2 (ja) | 2014-11-26 |
US20140188859A1 (en) | 2014-07-03 |
US20090276429A1 (en) | 2009-11-05 |
EP1665100A1 (en) | 2006-06-07 |
WO2005029368A1 (en) | 2005-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101826115A (zh) | 用于改进对新闻文章分级的系统和方法 | |
US10496652B1 (en) | Methods and apparatus for ranking documents | |
CN100568232C (zh) | 通用搜索引擎接口 | |
CN101416186B (zh) | 增强的搜索结果 | |
US7146416B1 (en) | Web site activity monitoring system with tracking by categories and terms | |
Royal et al. | What's on Wikipedia, and what's not...? Assessing completeness of information | |
US20070239701A1 (en) | System and method for prioritizing websites during a webcrawling process | |
US20070174255A1 (en) | Analyzing content to determine context and serving relevant content based on the context | |
CN101111837A (zh) | 查询自动分类的搜索处理 | |
WO2007064874A2 (en) | Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy | |
KR20030091751A (ko) | 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치 | |
CN101305371A (zh) | 对博客文档进行排名 | |
WO2011031973A1 (en) | Determining client system attributes | |
WO2012080707A1 (en) | Method and apparatus for structuring a network | |
US20110184815A1 (en) | System and method for sharing profits with one or more content providers | |
US20100161590A1 (en) | Query processing in a dynamic cache | |
Chen et al. | The best answers? think twice: online detection of commercial campaigns in the CQA forums | |
JP2015194955A (ja) | 入札情報検索システム | |
Pallas et al. | Evaluating the accuracy of cloud NLP services using ground-truth experiments | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
Li et al. | Online commercial intention detection framework based on web pages | |
KAYALVIZHI et al. | A Learning Approach for Noise Reduction in Web Data Based on Dynamic User Interests | |
CN114861046A (zh) | 一种应用推荐方法及装置 | |
Forman et al. | A novel traffic analysis for identifying search fields in the long tail of web sites | |
Kumar et al. | Noise Reduction in Web Data: a Learning Approach based on Dynamic User Interests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: American California Patentee after: Google Inc. Address before: American California Patentee before: GOOGLE Inc. |
|
CP01 | Change in the name or title of a patent holder | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160817 |
|
CF01 | Termination of patent right due to non-payment of annual fee |