CN102057375A - 在线参引的收集和记分 - Google Patents

在线参引的收集和记分 Download PDF

Info

Publication number
CN102057375A
CN102057375A CN2009801216104A CN200980121610A CN102057375A CN 102057375 A CN102057375 A CN 102057375A CN 2009801216104 A CN2009801216104 A CN 2009801216104A CN 200980121610 A CN200980121610 A CN 200980121610A CN 102057375 A CN102057375 A CN 102057375A
Authority
CN
China
Prior art keywords
webpage
internet
search
advertisement
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801216104A
Other languages
English (en)
Inventor
莱缪尔·S·帕克
吉米·于
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aptar France SAS
Original Assignee
Valois SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Valois SAS filed Critical Valois SAS
Publication of CN102057375A publication Critical patent/CN102057375A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/541Interprogram communication via adapters, e.g. between incompatible applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一个示例实施例包括用于对实体的在线参引建立索引的方法。所述方法包括确定要被搜索以获得对实体的参引的、互联网的一个或多个通道,并且在所述一个或多个通道的每一个内确定要评估的一个或多个信号。所述方法也包括爬取互联网以获得对实体的在线参引,其中爬取互联网包括搜索所述互联网的一个或多个通道以获得对所述实体的参引,并且评估所述一个或多个信号。所述方法进一步包括构建所述参引的反向索引,其中所述反向索引基于在其中找到参引的每一个通道以及被评估用于所述参引的所述一个或多个信号。

Description

在线参引的收集和记分
背景技术
通常,搜索引擎优化是网络管理员应用来提高给定网页或者其他互联网站点的业务量和业务质量的过程。典型技术包括标题标签中的关键字、元标签(meta tag)中的关键字、正文文本中的关键字、向内链接中的锚文本、站点年龄、站点结构、站点内部链接结构中的链接广泛度、可索引文本/网页内容量、站点链接数量、站点链接的广泛度/相关度和向内链接标签的主题相关度。基于网络管理员试图优化的搜索引擎,有时候采用另外的技术。由于搜索引擎算法和度量是专用的(proprietary),搜索引擎优化技术广泛用于提高搜索引擎结果页面上的网页或者其他互联网站点的可视性。
搜索引擎营销是互联网营销的一种形式,所述互联网营销包括搜索引擎优化(SEO)、付费收录和付费链接。付费收录和付费链接是付费互联网广告的形式,付费互联网广告将广告置于特定关键字搜索的结果页面上。付费收录和付费链接根据诸如关键字或者搜索项的因素而在价格上发生变化。
在线广告是广告的一种形式,其影响互联网或者环球网传送消息。在线广告包括文本广告、横幅式广告、网页直立式广告、浮动广告、扩展式广告、礼貌广告、墙纸式广告、恶作剧式广告、弹出式广告、隐藏式弹出广告、视频广告、地图广告、移动广告和许多其他的在线广告形式。
在此要求保护的主题不限于克服了任何缺点或者只在如上述的环境下工作的实施例。上述背景技术只是用于说明本文介绍的一些实施例可能应用的一个示例技术领域。
发明内容
此发明内容用于以简单形式介绍下面在具体实施方式中进一步描述的各种方案的选择。此发明内容并非旨在确定所要保护的主题的关键特征或者必要特征,也不是旨在帮助确定要求保护的主题的范围。
总的来说,本发明的示例实施例涉及实体的在线参引(online reference)的收集和记分。一个示例实施例包括用于对实体的在线参引建立索引的方法。该方法包括确定要被搜索以得到实体的参引的、互联网的一个或多个通道,并且确定在所述一个或多个通道的每一个中要评估的一个或多个信号。该方法也包括爬取(crawling)互联网以得到实体的在线参引,其中爬取互联网包括搜索互联网的一个或多个通道以获得实体的参引,并且评估所述一个或多个信号。该方法进一步包括构建所述参引的反向索引,其中所述反向索引基于在其中找到参引的每一个通道和被评估用于参引的一个或多个信号。
另一个实施例包括用于对实体的在线参引建立索引的系统。该系统包括深度索引引擎(deep index engine),其中深度索引引擎被配置用于装配参数以爬取互联网并且将要执行的爬取插入到工作队列中。该系统也包括一个或多个工作节点(worker node),其中所述工作节点被配置用于执行由深度索引引擎装配的互联网爬取。该系统进一步包括一个或多个协调器,其中所述协调器被配置用于针对所述一个或多个工作节点从工作队列中发起工作。
本发明的示例实施例的这些和其他方面根据下面的描述和所附权利要求将变得非常清楚。
附图说明
为了进一步澄清本发明的一些实施例的各个方面,将参考在附图中示出的特定实施例对发明做更加具体描述。应当理解,这些附图仅图示本发明的典型实施例,因此不应视为限制它的范围。本发明将被通过利用附图进行具体详细地描述和说明,其中:
图1示出用于对实体的在线参引建立索引的示例系统的实施例;
图2A-2C示出可以用于图1的系统中的工作节点的各种配置;
图3示出使用页面搜索来找到要被搜索以得到在线参引的合适网页的方法的各个方面;
图4示出解析搜索引擎结果页面的方法的各个方面;
图5示出用于提供在反向索引内的结果的方法的实例;
图6A-6C示出提供结果给用户的各个实例;和
图7示出用于对实体的在线参引建立索引的示例方法的流程图。
具体实施方式
下面将参考附图,其中相同的结构使用相同附图标记。应当理解,附图是对本发明的一些实施例的图示以及原理说明,而不是限制本发明,也不必按比例绘制。
首先参见图1,其示出了用于对实体的在线参引建立索引的系统105的实施例。其在线参引被建立索引的实体可以包括个人、公司、商标、产品、型号或者互联网上任何地方引用的任何其他实体。参引可以包括有机参引(organicreference)、在线广告、新闻条目或者实体的任何其他参引。具体地,系统105可以用于识别实体的在线参引,其中基于客户的请求确定在线参引的类型和实体。例如,响应于接收来自客户的要对竞争对手的在线广告建立索引的请求,系统105可以用于执行索引。
系统105包括深度索引引擎110。深度索引引擎110被配置用于将爬取网络112的参数装配为搜索工作。网络112示例地包括互联网,该互联网包括在多个广域网和/或局域网之间的逻辑和物理连接形成的全球互联网并且可选地包括环球网(“Web”),该环球网包括经互联网访问的互联超文本文件的系统。作为替换或附加地,网络112包括一个或多个蜂窝RF网络和/或一个或多个有线和/或无线网络,诸如但不限于802.xx网络、蓝牙接入点、无线接入点、IP网络等。网络112也包括使一种类型的网络与另一种类型的网络接口的服务器。
深度索引引擎110装配的参数可以包括一个或多个通道(channel)。这些通道是在要搜索的互联网/网络112内的特定媒体。在一些实施例中,通道可以包括有机搜索、页面搜索、链接广告网络、横幅式广告、上下文广告、电子邮件、博客、社交网络、社会新闻(social news)、联盟网络营销、移动广告、媒体广告、视频广告、论坛、新闻站点、富媒体、社会书签、付费搜索和网游植入广告。然而,所述通道不限于上述内容,而是可以包括要搜索的互联网的任何相关领域,不论是现在已经存在的还是将来创造出来的。
有机搜索指的是搜索引擎结果页面中的那些按照它们与搜索项的相关度而不是它们的广告来呈现的列表。页面搜索指的是搜索引擎结果页面中的与呈现原因无关的列表。链接广告网络指的是自动插入网页的广告——如果其包含相关主题。横幅式广告指的是放在特定网页上、特定位置中的广告。上下文广告指的是当出现某些关键字或者其他标识而放置的广告,例如关键字广告。E-mail(电子邮件或者email)指的是利用数字通信系统生成、发送或者存储主要基于文本的人际间通信的方法。博客指的是一种网页类型,通常由个人利用定期输入评论、事件描述或者诸如图形或视频的其他素材来维护。社交网络指的是由节点(其通常为个人或机构)组成的社会结构,所述节点由一个或多个特定类型的相关性连系,所述相关性是诸如价值、愿景、想法、金融交易、友谊、亲属关系、厌恶、冲突或者贸易。社会新闻指的是如下网页:其中用户对新闻报道或者其他链接进行提交和投票、从而确定提供哪些链接。联盟网络营销包括使用网页来将业务推送到由第一个网页所有者的联营机构维护的不同网页。移动广告包括在无线设备上提供的个性化广告。媒体广告包括在以一种类型的媒体或者通信装置中以在线、出版、视频或者任何其他格式放置的广告。视频广告是以视频格式提供的广告。论坛或者留言版是以用户生成内容为特征的在线讨论站点。新闻站点是以报告包括一般新闻和专题新闻的新闻为主要目的的网页。富媒体或者交互媒体是允许接收者主动参与的媒体。社会书签涉及网络用户存储、组织、搜索和管理网络上的网页的书签并且私下地保存书签、将书签与公众共享、将书签与指定的人或者群组共享、将书签在某些网络内共享或者将网络与专用和公共访问的任何其他组合共享的方法。付费搜索是一种类型的上下文广告,其中网站所有者通常基于点击率或者广告浏览支付广告费用,使他们的网站搜索结果显示在搜索引擎结果页面上的顶部位置。网游植入广告是放置于视频游戏内的在线广告或者游戏控制台上的广告。
返回图1,深度索引引擎110装配的参数也可以包括要评估的一个或多个信号。所述信号包括关于实体的参引的信息。例如,置于网页顶部的广告更容易看到,因此通常比放置在网页底部的广告更贵并且被认为更加有效。因此,如果要索引的参引包括在线广告,广告位置是可以被识别以进行索引的信号。可替换地或附加地,要评估的信号可以包括以下中的一个或多个:给定网页上的参引的频率,网页上的参引的位置,爬取的日历日期,网页发布的日历日期,爬取的时间,网页发布的时间,上下文驱动的网页索引,下载网页的时间,与网页的网页浏览器兼容性,网页的网页插件(Web插件)兼容性等。附加地或者可替换地,要评估的电子邮件消息内的信号可以包括接收的电子邮件消息的频率、电子邮件消息的向外链接、接收的电子邮件消息的日历日期、接收的电子邮件消息的日历日期、接收的电子邮件消息的时间等。上下文驱动的网页索引信号可以进一步包括网页内的链接和/或围绕网页的发布和主题的当前事件。然而,要评估的信号不限于上述内容,而是可以包括关于不论是现在已经存在的或者将来创造的、对实体的参引的任何相关信息。也应当注意,除非有特殊规定,在此使用的“网页”指的是任何在线发布,包括域、子域、网上发布、统一资源标识符(URI)、统一资源定位符(URL)和非永久发布诸如电子邮件和聊天。
继续参见图1,深度索引引擎110创建、定义和/或确定工作,并且将工作(对于搜索工作,包括每一个搜索工作的装配参数)插入到工作队列115中。向工作队列115的插入可以通过直接插入或者通过经协调器120发送工作或者通过用于从深度索引引擎110将工作发送到工作队列115的任何其他方法进行。在一些实施例中,工作队列115维护要执行的工作并且将工作提供给工作节点125以执行。
工作队列115中的工作包括但不限于搜索工作,例如爬取互联网。在一些实施例中,一旦互联网已经被爬取就获得数据。通常,数据指的是深度索引引擎已经规定为相关的任何信息。在一些实施例中,数据可以包括关于被搜索的通道的信息和被评估的信号。在其他实施例中,数据可以包括下载网页以进一步处理,如下面讨论的那样。在进一步的实施例中,数据可以包括要解析的搜索结果,如下面讨论的那样。
在一些实施例中,一旦获得数据,必须对数据进行处理。深度索引引擎110可以将此类处理工作插入到工作队列115中。在一些实施例中,数据处理可以包括评估信号。在其他实施例中,数据处理可以包括解析搜索结果,如下面讨论的那样。在进一步的实施例中,处理可以包括评估参引以得到正面或负面含义。例如,可以处理关于产品的博客条目以确定该条目对于产品通常是正面的或者负面的。
在其他实施例中,一旦获得数据,可能需要压缩数据,这是可以由深度索引引擎110插入到工作队列115中的另一工作。在一些实施例中,数据压缩可以包括保存数据以在之后处理。在其他实施例中,数据压缩可以包括解析网页以得到相关信号并且仅保存涉及到相关信号的网页部分。应当理解,利用本公开内容的优点,深度索引引擎110可以将需要执行的任何工作(包括收集和/或处理数据)插入到工作队列115中。
在一些实施例中,系统105包括工作节点125。工作节点125包括执行已经由深度索引引擎110插入到工作队列115中的工作的节点。在一些实施例中,工作节点125执行的工作包括:爬取Web并且执行相关搜索、压缩数据、处理数据、构建反向索引、计算搜索引擎优化分数或者已经被插入到工作队列115中的任何其他工作。在一些实施例中,每一个工作节点125可以是配置用于执行插入到工作队列115中的任何工作的一般工作节点。在其他实施例中,工作节点125可以是专用工作节点,每一个专用工作节点执行单一工作。在进一步的实施例中,工作节点125可以是一般工作节点和专用工作节点的任何组合。
在一些实施例中,工作节点125被进一步配置用于仿真互联网的人类用户的活动。在一些实施例中,仿真互联网的人类用户的活动包括模仿和/或提供与人类用户典型相关的一个或多个属性,包括下面中的一个或多个:地理位置、浏览的特定时间、年龄、收入水平、电子邮件地址或者人类用户的其他人口特征。例如,工作节点125可以被配置用于通过多个互联网服务提供商连接到互联网以仿真不同地理位置的互联网人类用户。可替换地或者附加地,工作节点125可以被配置用于在特定时间连接到互联网。可替换地或者附加地,工作节点125可以配置用于在某些网站输入对应于人类用户的特定人口特征的年龄、收入水平等。可替换或者附加地,工作节点125可以被配置用于在某些网站输入电子邮件地址。在本发明的一些实施例中,仿真互联网的人类用户的活动考虑到更为相关的搜索结果,因为搜索参引关心如何将这种参引提供给互联网用户。
图2A示出了工作节点205的配置的一个实例,其中工作节点205例如在搜索工作的执行中爬取互联网。工作节点205直接连接到网页210。然后通过观察合适的通道,工作节点205可搜索对在网页210内和/或在附加网页内的实体的在线参引。在一些实施例中,工作节点205也可定位和/或评估合适信号来获得信号信息以供之后评估,如在上面概述的、在搜索工作内由图1的深度索引引擎110所指示的那样。在这个和其他实施例中,工作节点205可以在连接到网页210时评估合适的信号。
图2B示出了工作节点205的配置的一个实例,其中工作节点220在搜索工作的执行中爬取互联网。在这个实例中,工作节点220使用代理225连接到网页230。在计算机网络中,代理是服务器(例如,计算机系统或者应用程序),该服务器作为来自于客户的、从其他服务器寻求资源的请求的介质。客户连接到代理,请求可从不同服务器得到的一些服务诸如文件、连接、网页或者其他资源。在一些实施例中,通过代理225连接到网页230的工作节点220可允许工作节点220表现为来自与实际不同的地理起点。
图2C示出了工作节点240的另一个实例,其中工作节点240在搜索工作的执行中爬取互联网。在这个实例中,工作节点240通过代理245连接到互联网,并且通过反向链接(backlink)255定位网页250。反向链接255是对网站或者网页250的导入链接。网页250的反向链接255可具有显著的个人、文化或者语义方面的重要性,因为它们可以指示谁在关注网页250。反向链接255可以包括从另一个网页到网页250的任何链接。反向链接255也称为导入链接、入站链接、入内链接和向里链接。反向链接255有时用作网页250的广泛度的度量,并且几个搜索引擎提供网页250的反向链接255的信息。在一些实施例中,反向链接255用来帮助找到实体的在线参引或者用来评估参引。
返回图1,在一些实施例中,系统105也包括一个或多个协调器120。协调器120可以从深度索引引擎110接收工作并且将它们插入到工作队列115中,如上所述的那样。协调器120也可以按照完成工作的需要,将工作从工作队列115中移除并且将它们提供给工作节点125。协调器120也可以跟踪正在由哪些工作节点125执行哪些工作以优化工作节点125的性能(例如,确保专用节点在完成它们的当前任务之后具有可用工作)。
系统105的模块或者单独部件包括深度索引引擎110、工作队列115、工作节点125和协调器120可以用硬件、软件或它们的任意组合来实现。如果以软件实现,系统105的模块存储在计算机可读介质中,所述介质根据需要被访问以执行它们的功能。此外,如果以软件实现,可以由处理器、现场可编程门阵列(FPGA)或者能够执行软件指令或其他逻辑功能的任何其他逻辑器件来执行分配给各模块的任务。
图3示出使用页面搜索来找到要被搜索以得到在线参引的合适网页的方法的各个方面。图3的方法可以由工作节点305结合关键字数据库310来执行。关键字数据库310包括要在页面搜索中使用的一个或多个关键字。在一些实施例中,图1的深度索引引擎110可以编译关键字数据库310。在其他实施例中,图1中的工作节点125可以在页面搜索之前编译关键字数据库310
返回图3,工作节点305从关键字数据库310获得关键字(315)。然后,工作节点305查询搜索引擎以进行页面搜索(320)。搜索引擎可以是用来执行搜索的、不论是现在已经存在的或者将来创造的、任何公共或者专用搜索引擎。可以对每一个关键字使用多个搜索引擎来编译结果,或者可以如针对各实体所优选的那样使用单个搜索引擎。
一旦进行了搜索,工作节点305收集搜索引擎结果页面(325)。结果页面可以被收集(325)作为要由工作节点305处理或者要被插入到工作队列中以由其他工作节点处理的文本。搜索引擎结果页面也能够以原始格式来收集或者只是链接本身被收集(325),所述链接本身被保留有插入到工作队列中以由工作节点进行附加网页爬取的链接。然而,不论是现在已经有的还是将来创造的收集搜索引擎结果页面的任何方法都是专注于收集搜索引擎结果页面325。
在收集搜索引擎结果页面之后,搜索引擎结果页面被解析(330)以得到相关信息。结果页面可以由工作节点305解析(330)或者可以被插入到工作队列中以由其他工作节点解析。被认为是相关的信息可以由图1的深度索引引擎110之前装配的参数确定。例如,如果希望的话,可以仅考虑有机搜索结果。可替换地,如果在线参引限于搜索引擎内的付费广告的话,可以仅考虑付费结果。在一些实施例中,搜索结果的排名可与索引相关,而在其他实施例中,排名可能与索引相关很小或者不相关。
图4示出解析搜索引擎结果页面以获得实体的参引的方法的各个方面,搜索引擎结果页面如从图3示出的关键字搜索获得的搜索引擎结果页面。在一些实施例中,图4的方法由一个或多个工作节点执行。
图4的方法以将搜索引擎结果页面解析为一个或多个与通道相关的组、诸如有机结果和付费广告而开始。为了该实例的目的,不同地处理有机结果和付费广告,尽管在其他实施例中它们可以被相同或不同地处理。工作节点解析(410)有机结果,以确定(415)参引实体的搜索引擎结果页面的有机结果中的一个或多个信号,所述一个或多个信号包括例如参引实体的相应搜索引擎结果的描述、标题、URL和/或排名。这些信号可以帮助确定搜索引擎结果的相关度,也帮助确定将来要搜索的一个或多个网页420。网页420然后可以被解析以得到实体的参引。
工作节点也可以解析(425)付费广告结果以确定(430)搜索引擎结果页面的付费广告结果中的、参引实体的一个或多个信号,所述一个或多个信号包括例如参引实体的、搜索引擎结果页面中的相应付费广告的位置和/URL。通常突出位置被认为是更加有效,因而通常比付费广告的非突出位置更贵。因此,在搜索引擎结果页面和/或其他网页中付费广告的位置给出了为广告支付多少费用以及在搜索的关键字和营销者放置广告之间的关联的相关度的指示。借助有机搜索结果,由付费广告指向的网页435可以被确定并且其本身被解析以得到对实体的附加参引。
同时参考图3和图4,应当注意,在这个实例中,执行搜索的相同节点不需要访问最终被搜索以得到在线参引的网页。例如,一个工作节点可以从关键字数据库310获得(315)关键字,查询(320)搜索引擎并且收集(325)结果。第二工作节点可以解析(330,405)结果网页,确定(410,425)哪些结果是有机的,哪些结果是付费的。第三工作节点可以确定(415)有机结果的合适信号,而第四工作节点可以确定(430)付费结果的合适信号。然后网页420,435可以插入到工作队列中以由附加工作节点爬取。在其他实施例中,可以采用比四个工作节点更少或更多的节点来执行图3和图4的步骤。
返回图1,一旦系统105完成在线参引的搜索,系统可以将结果提供给用户。在一些实施例中,可以生成反向索引130,其列出实体的在线参引,并且根据一组准则诸如成本-效果、可视性或其他准则对它们进行排名。当搜索引擎把包含给定字的所有文件列成表时,其称为反向索引。这与常规索引相反,常规索引包含文件内的所有字的位置。
在其他实施例中,结果可以作为原始数据来提供。例如,结果可以被作为特定网页的点击量、即网页的业务历史记录来提供,或者作为特定关键字或者关键字组的有机搜索结果排名来提供。在另外的实施例中,结果可以被作为特定媒体中的评述(mention)来提供。例如,结果可以作为博客内的评述量来提供。可替换地或者附加地,结果可以进一步被细分。例如,博客评述可以被细分为正面评述和负面评述。
图5示出用于提供在反向索引内的结果的方法的一个实例。在这个实例中,结果具有为已经被爬取的网页生成(505)的搜索引擎优化(SEO)分数。换言之,基于一些预定准则(如在搜索引擎结果内的位置)来提供结果。搜索引擎结果可以包括有机搜索、付费搜索或这二者。此外,SEO分数可以考虑对来自特定搜索引擎的搜索结果赋予更大的权重。例如,更加流行的搜索引擎的结果中的高位置可以比不太流行的搜索引擎的结果更多地影响SEO分数。
可替换地或附加地,根据图5的方法生成的反向索引可以包括广告分数。在一些实施例中,广告分数可以用来指出广告的成本-效果。例如,如果第一广告产生第二广告的业务的50%,但是第一广告的成本仅是第二广告的10%,则可以给予第一广告更高的广告分数以指出它在产生业务中具有更好的成本-效果。
图5的方法进一步包括确定(510)其中网页进行排名的关键字,即当被搜索时返回网页的关键字。在一些实施例中,确定(510)其中网页进行排名的关键字可以通过从关键字数据库515获得可能的关键字并且执行关键字搜索来进行。在其他实施例中,关键字可以是关心的关键字并且关键字搜索的结果可以具有生成的SEO分数。在另外的实施例中,可以用所希望的任何其他方式来编译关键字数据库以优化索引。
一旦搜索了关键字,则确定(520)了网页的有机排名。然后,将加权乘法器应用(525)于有机排名,其中加权乘法器可以基于有机排名。即,加权乘法器对于每一个排名是不同的(即,不是恒定的)。在一些实施例中,加权乘法器考虑(530)有机排名的点击分析的分布。即,乘法器考虑跟随链接到URL的用户数量。例如,由于某种原因,搜索会出现对于大多数用户而言无关的结果。即使结果的排名很高,也可以调整乘法器来反映跟随链接的用户数量少。根据加权乘法器和有机排名,可以产生(535)SEO分数。SEO分数允许基于预定准则来分析参引的相关度。
图6A示出将结果提供给用户的实例。在这个实例中,以图表615的形式提供结果。例如,可以根据客户的请求来产生图表615,其中该客户希望看到他自己的网页和他的竞争对手的网页的有机排名如何随着时间而变化。图表615具有代表不同网页的有机排名的多条线。第一条线610代表客户的网页的有机排名和有机排名在一周时间间隔上的变化。第二条线615代表第一竞争对手的网页的有机排名和有机排名在一周时间间隔上的变化。第三条线620代表第二竞争对手的网页的有机排名和有机排名在一周时间间隔上的变化。
在一些实施例中,图表615可以限于客户的有机排名历史记录。在其他实施例中,图表615可以限于竞争对手的有机排名历史记录,并且可以不包括客户的有机排名历史记录。根据客户的规定,图表615可以包括多于或少于两个竞争对手的有机排名历史记录。此外,竞争对手能够以任何方式被确定。例如,只示出最大竞争对手或者确定特别关心的某些竞争对手。
图6B示出将结果提供给用户的附加实例。图6B的图表640提供社会媒体通道中的对网页的评述。所述评述可以包括对网页、产品或者其他实体的各种参引。图表640的x轴645包括搜索的通道。图表640的y轴650表示系统发现的评述数量。在一些实施例中,评述数量可以包括评述的绝对数目。在其他实施例中,评述数量可以是评述的相对数量。例如,网页的评述数量可以与竞争对手的网页评述数量比较。
图6C示出将结果提供给用户的另一个实例。图6C的图表670是将至用户的网页的反向链接质量提供给用户的饼形图。在一些实施例中,可以使用网页级别值(0到10)确定质量。网页级别(Pagerank)是一种链接分析算法,该链接分析算法将数字权重分配给超链接的一组文件的每一个元素(诸如Web),目的是测量该组内每一个元素的相对重要性。在一些实施例中,与具有带有较低网页级别值0和1的来自多个域的数百个反向链接相比,更有利的是具有带有高网页级别值6或者更高网页级别值的、来自单个(或者几个)域的向内链接(反向链接)。
图表670的第一区域675指示具有网页级别值7到10的来自网页的反向链接,或优质的反向链接。图表670的第二区域680指示具有网页级别值3到6的来自网页的反向链接,或合格反向链接。图表670的第三区域685指示具有网页级别值0到2的来自网页的反向链接,或一般反向链接。反向链接质量可以利用其他方法来评估并且不限于网页级别。
应当理解,图6A-6C的图表仅仅是根据本发明的一些实施例能够被生成以将结果提供给用户的示例图表。实际上,可以通过产生其他类型图表或者根本不产生任何图表来将结果提供给用户。
再参见图7,公开了用于对实体的在线参引建立索引的示例方法700。其在线参引被建立索引的实体可以包括个人、公司、商标、产品、型号或互联网上在任何地方参引的任何其他实体。参引可以包括有机参引、在线广告、新闻条目或实体的任何其他参引。特别地,方法700可以用来确定实体的在线参引,其中基于客户的请求确定在线参引类型和实体。例如,客户可以要求对竞争对手的在线广告建立索引,并且方法700可以用来执行索引。可替换或者附加地,方法700可以用来确定实体的在线参引,其中在线参引类型或实体中的之一或二者不是由于客户要求而被确定。
方法700包括确定(705)要搜索的通道。如上所述,通道是要搜索的互联网内的特定媒体。在一些实施例中,通道可以包括有机搜索、页面搜索、链接广告网络、横幅式广告、上下文广告、电子邮件、博客、社交网络、社会新闻、联盟网络营销、移动广告、媒体广告、视频广告、论坛、新闻站点、富媒体、社会书签、付费搜索和网游植入广告。然而,通道不限于上述内容,而是可以包括不论是现在已经有的或者将来创造的、要搜索的互联网的任何相关领域。
方法700进一步包括确定(710)要评估的信号。所述信号包括关于对实体的参引的相关信息。例如,放置在网页顶部的广告是更加可视的,因此通常更加贵并且被认为更加有效。因此,如果要索引的参引包括在线广告,广告位置是可以被确定用于索引的信号。可替换地或附加地,要评估的信号可以包括给定网页上的参引的频率、网页上的参引的位置、爬取的日历日期、网页发布的日历日期、爬取的时间、网页发布的时间、上下文驱动的网页索引、下载网页的时间、网页的网络浏览器兼容性、网页的网页插件兼容性等。可替换地或附加地,要评估的电子邮件消息内的信号可以包括接收的电子邮件消息的频率、电子邮件消息上的向外链接、接收的电子邮件消息的日历日期、接收的电子邮件消息的时间等。上下文驱动的网络索引可以进一步包括网页内的链接、围绕网页的发布和主题的当前事件。然而,要评估的信号不限于上述内容,而是可以包括不论是现在已经存在的还是将来创造的、关于对实体的参引的任何相关信息。
方法700也包括爬取(715)网络、互联网或其他网络(如图1的网络112),以获得对实体的在线参引。爬取(715)环球网/互联网/网络112可以通过到网页的直接连接,可包括使用代理服务器,可使用反向链接来确定合适网页或者可以包括定位和评估网页的任何其他方法。爬取(715)环球网/互联网/网络112也可包括仿真互联网的人类用户的活动。例如,爬取(715)环球网可以通过多个互联网服务提供商进行,以仿真不同地理位置的互联网人类用户。仿真互联网的人类用户的活动可给出更加相关的搜索结果,因为它们考虑到如何将这些参引提供给互联网用户。
方法700进一步包括构建(720)结果的反向索引。例如,可以构建(720)的反向索引引用实体的在线参引,并且根据一组预定的准则对它们排名。构建(720)反向索引可以可选地包括执行趋势分析。趋势分析示出在线参引如何随时间变化。例如,图6A的图表605示出客户网页、第一竞争对手的网页和第二竞争对手的网页的有机排名如何随时间变化。这样,包括在图6A的图表605中的数据可以代表趋势分析的特定类型。
可替换地或附加地,构建(720)反向索引可以包括生成SEO分数。SEO分数允许用户(如请求索引的客户)基于一个或多个预定准则(如成本-效果)来查看参引的相关度。
在一些实施例中,可以使用系统、如图1描述的系统来执行方法700。用来执行所述方法的系统的模块或单个部件可以用硬件、软件或它们的任意组合来实现。如果以软件来实现,则系统的模块存储在计算机可读介质中,计算机可读介质根据需要而被访问以执行它们的功能。此外,如果以软件实现,分配给每一个模块的任务可以由处理器、现场可编程门阵列(FPGA)或者能够执行软件指令或其他逻辑功能的任何其他逻辑器件执行。
在此描述的实施例可包括使用包含各种计算机硬件和/或软件模块的专用计算机或通用计算机,如下文将详细介绍的那样。
本发明范围内的实施例也可包括用于执行或者具有计算机可执行指令或存储在其上的数据结构的物理计算机可读介质和/或无形计算机可读介质。这样的物理计算机可读介质和/或无形计算机可读介质可以是可由通用或专用计算机访问的任何可用介质。例如(不是用于限制),这样的物理计算机可读介质可以包括RAM、ROM、EFPROM、CD-ROM或者其他光盘存储、磁盘存储或其他磁性存储器件、或任何其他如下物理介质:所述物理介质可以用来承载或存储形式为计算机可执行指令或数据结构的期望程序代码装置,并且可以由通用或专用计算机访问。在通用或专用计算机内,无形计算机可读介质可以包括电磁装置,用于例如通过计算机内的电路从计算机的一个部分向另一个部分传送数据信号。
当通过网络或另一个到计算机的通信连接(硬连线、无线或硬连线和无线的组合)传送或提供信息时,用于发送和接收计算机可执行指令、数据结构和/或数据信号的硬连线器件(例如导线、电缆、光纤、电子电路、化学物品等)应当恰当地视为物理计算机可读介质,而用于发送和/或接收计算机可执行指令、数据结构和/或数据信号的无线载体或无线介质(例如无线电通信、卫星通信、红外通信等)应当恰当地视为无形计算机可读介质。上述的组合也应当包括在计算机可读介质的范围之内。
计算机可执行指令例如包括导致通用计算机、专用计算机或专用处理装置执行某些功能或功能组的指令、数据和/或数据信号。虽然没有要求,在此,已经在计算机可执行指令的一般上下文中(如程序模块、由计算机执行、在网络环境和/或非网络环境中)描述了本发明的各方面。通常,程序模块包括执行特定任务或实施特定抽象内容类型的内容结构、例程、程序、对象和部件。计算机可执行指令、关联的内容结构和程序模块代表执行在此公开的方法的各个方面的程序代码的实例。
实施例也可包括用于使用在本发明的系统中的计算机程序产品,所述计算机程序产品具有存储有计算机可读程序代码的物理计算机可读介质,所述计算机可读程序代码包括计算机可执行指令,当该计算机可执行指令被处理器执行时导致系统执行本发明的方法。
在不背离本发明基本特征的精神的情况下,本发明可以其他特定形式来实施。所描述的实施例在各方面被认为仅仅是说明性的而不是限制性的。因此,本发明的范围由所附权利要求限定而不是由前面的描述限定。落在权利要求的等价意思和范围内的所有变化被包含在本发明的范围内。

Claims (22)

1.一种用于对实体的在线参引建立索引的方法,所述方法包括:
确定要被搜索以获得实体的参引的、互联网的一个或多个通道;
在所述一个或多个通道的每一个内确定要评估的一个或多个信号,被评估的所述信号包括关于实体的参引的信息;
爬取互联网以获得实体的在线参引,其中爬取互联网包括搜索互联网的所述一个或多个通道以获得实体的参引并且评估所述一个或多个信号;和
构建所述参引的反向索引,其中所述反向索引基于在其中找到参引的每一个通道以及针对所述参引而被评估的所述一个或多个信号。
2.如权利要求1所述的方法,其中实体的参引包括以下中的一个或多个:与所述实体关联的有机参引,在线广告或新闻条目。
3.如权利要求1所述的方法,所述方法进一步包括编译搜索引擎优化分数。
4.如权利要求1所述的方法,所述方法进一步包括编译广告分数。
5.如权利要求1所述的方法,其中基于客户请求确定被索引的所述实体。
6.如权利要求1所述的方法,其中搜索以下通道中的一个或多个:有机搜索,页面搜索,链接广告网络,横幅式广告,上下文广告,电子邮件,博客,社交网络,社会新闻,联盟网络营销,移动广告,媒体广告,视频广告,论坛,新闻站点,富媒体,社会书签,付费搜索和网游植入广告。
7.如权利要求1所述的方法,其中爬取互联网进一步包括爬取网页,并且其中为爬取的网页评估以下信号中的一个或多个:给定网页上的参引的频率,网页上的参引的位置,爬取的日历日期,网页发布的日历日期,爬取的时间,网页发布的时间,上下文驱动的网页索引,下载网页的时间,网页的网络浏览器兼容性或网页的网页插件兼容性。
8.如权利要求7所述的方法,其中上下文驱动的网页索引包括基于链接、当前事件和主题中的一个或多个的上下文驱动的网页索引。
9.如权利要求1所述的方法,其中爬取互联网进一步包括预订的或者未经请求的爬取电子邮件消息,并且其中为爬取的电子邮件消息评估以下信号中的一个或多个:接收的电子邮件消息的频率,电子邮件消息上的向外链接,接收的电子邮件消息的日历日期或接收的电子邮件消息的时间。
10.如权利要求1所述的方法,其中爬取互联网进一步包括仿真互联网的人类用户的活动。
11.如权利要求10所述的方法,其中仿真互联网的人类用户的活动包括模仿或者提供与互联网的人类用户相关联的至少一个属性作为输入,所述至少一个属性包括以下中的一个或多个:地理位置,浏览时间,年龄,收入水平或电子邮件地址。
12.如权利要求1所述的方法,其中构建反向索引进一步包括执行所述在线参引的趋势分析。
13.一种用于对实体的在线参引建立索引的系统,该系统包括:
深度索引引擎,其中所述深度索引引擎被配置用于装配参数以爬取互联网并且将要执行的爬取插入工作队列;
一个或多个工作节点,其中所述工作节点被配置用于执行由所述深度索引引擎装配的互联网爬取;和
一个或多个协调器,其中所述协调器被配置用于从所述工作队列中发起所述一个或多个工作节点的工作。
14.如权利要求13所述的系统,其中所述深度索引引擎被进一步配置用于装配用于反向索引的参数,并且将关于创建所述反向索引的工作插入到所述工作队列中。
15.如权利要求13所述的系统,其中所述深度索引引擎、所述工作队列、所述工作节点和所述协调器中的一个或多个被以硬件实施。
16.如权利要求13所述的系统,其中所述深度索引引擎、所述工作队列、所述工作节点和所述协调器中的一个或多个被以存储在物理计算机可读介质中的软件实施。
17.如权利要求13所述的系统,其中所述装配的参数确定要搜索的一个或多个通道。
18.如权利要求17所述的系统,其中所确定的一个或多个通道包括以下中的一个或多个:有机搜索,页面搜索,链接广告网络,横幅式广告,上下文广告,电子邮件,博客,社交网络,社会新闻,联盟网络营销,移动广告,媒体广告,视频广告,论坛,新闻站点,富媒体,社会书签,付费搜索和网游植入广告。
19.如权利要求13所述的系统,其中所述装配的参数确定要评估的一个或多个信号。
20.如权利要求19所述的方法,其中确定的一个或多个信号包括以下中的一个或多个:给定网页上的参引的频率,网页上的参引的位置,爬取的日历日期,网页发布的日历日期,爬取的时间,网页发布的时间,上下文驱动的网页索引,下载网页的时间,网页的网络浏览器兼容性或网页的网页插件兼容性。
21.如权利要求13所述的系统,其中所述一个或多个工作节点进一步配置用于仿真互联网的人类用户的活动,其中仿真互联网的人类用户的活动包括模仿或者提供与所述互联网的人类用户相关联的至少一个属性作为输入,所述至少一个属性包括以下中的一个或多个:地理位置,浏览时间,年龄,收入水平或电子邮件地址。
22.如权利要求13所述的系统,其中所述一个或多个工作节点被进一步配置为通过多个互联网服务提供商连接到所述互联网,以仿真从不同地理位置访问互联网的人类用户。
CN2009801216104A 2008-06-09 2009-06-03 在线参引的收集和记分 Pending CN102057375A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US6003308P 2008-06-09 2008-06-09
US61/060,033 2008-06-09
US12/436,704 US8190594B2 (en) 2008-06-09 2009-05-06 Collecting and scoring online references
US12/436,704 2009-05-06
PCT/US2009/046100 WO2009152007A2 (en) 2008-06-09 2009-06-03 Collecting and scoring online references

Publications (1)

Publication Number Publication Date
CN102057375A true CN102057375A (zh) 2011-05-11

Family

ID=41401137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801216104A Pending CN102057375A (zh) 2008-06-09 2009-06-03 在线参引的收集和记分

Country Status (6)

Country Link
US (4) US8190594B2 (zh)
EP (1) EP2307987A4 (zh)
JP (1) JP5238074B2 (zh)
CN (1) CN102057375A (zh)
CA (1) CA2727407C (zh)
WO (1) WO2009152007A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105793878A (zh) * 2013-09-17 2016-07-20 南穆迪·南·默克温耶 交易社交媒体平台系统和方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8190594B2 (en) * 2008-06-09 2012-05-29 Brightedge Technologies, Inc. Collecting and scoring online references
US8671089B2 (en) 2009-10-06 2014-03-11 Brightedge Technologies, Inc. Correlating web page visits and conversions with external references
US9058242B2 (en) * 2010-03-04 2015-06-16 Gshift Labs Inc. Method and system of optimizing a web page for search engines
US8577973B2 (en) 2010-06-30 2013-11-05 International Business Machines Corporation Accelerated micro blogging using correlated history and targeted item actions
KR101431114B1 (ko) * 2010-07-01 2014-08-18 에스케이플래닛 주식회사 컨텐츠 검색 서비스 시스템 및 컨텐츠 검색 서비스 방법
WO2012118997A2 (en) 2011-03-03 2012-09-07 Brightedge Technologies, Inc. Optimization of social media engagement
US8972275B2 (en) 2011-03-03 2015-03-03 Brightedge Technologies, Inc. Optimization of social media engagement
US9235570B2 (en) 2011-03-03 2016-01-12 Brightedge Technologies, Inc. Optimizing internet campaigns
WO2012129102A2 (en) * 2011-03-22 2012-09-27 Brightedge Technologies, Inc. Detection and analysis of backlink activity
US9026530B2 (en) * 2011-08-15 2015-05-05 Brightedge Technologies, Inc. Synthesizing search engine optimization data for directories, domains, and subdomains
US20130046584A1 (en) * 2011-08-16 2013-02-21 Brightedge Technologies, Inc. Page reporting
US9665643B2 (en) * 2011-12-30 2017-05-30 Microsoft Technology Licensing, Llc Knowledge-based entity detection and disambiguation
US9367634B2 (en) 2012-01-19 2016-06-14 Brightedge Technologies, Inc. Optimizing location and mobile search
US9146993B1 (en) * 2012-03-16 2015-09-29 Google, Inc. Content keyword identification
US10659422B2 (en) 2012-04-30 2020-05-19 Brightedge Technologies, Inc. Content management systems
US20160055490A1 (en) * 2013-04-11 2016-02-25 Brandshield Ltd. Device, system, and method of protecting brand names and domain names
US8732015B1 (en) * 2013-05-30 2014-05-20 Unified Social, Inc. Social media pricing engine
US11132717B2 (en) 2016-02-22 2021-09-28 Ad Lightning Inc. Synthetic user profiles and monitoring online advertisements
CN105956085B (zh) * 2016-04-29 2019-08-27 优酷网络技术(北京)有限公司 一种倒排索引的构建方法和装置、检索方法和装置
US10826936B2 (en) 2017-05-10 2020-11-03 Ad Lightning, Inc. Detecting and attributing undesirable automatic redirects
US10778702B1 (en) * 2017-05-12 2020-09-15 Anomali, Inc. Predictive modeling of domain names using web-linking characteristics
US20210312474A1 (en) * 2019-09-17 2021-10-07 Brightedge Technologies, Inc. Dynamic General Configurability of Web Pages To Optimize Content for Search Performance and User Experiences
US20220414164A1 (en) * 2021-06-28 2022-12-29 metacluster lt, UAB E-commerce toolkit infrastructure

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6112238A (en) 1997-02-14 2000-08-29 Webtrends Corporation System and method for analyzing remote traffic data in a distributed computing environment
US6466970B1 (en) 1999-01-27 2002-10-15 International Business Machines Corporation System and method for collecting and analyzing information about content requested in a network (World Wide Web) environment
US6925442B1 (en) 1999-01-29 2005-08-02 Elijahu Shapira Method and apparatus for evaluating vistors to a web server
US8554775B2 (en) 1999-04-13 2013-10-08 Semmx, Inc. Orthogonal corpus index for ad buying and search engine optimization
US7343412B1 (en) 1999-06-24 2008-03-11 International Business Machines Corporation Method for maintaining and managing dynamic web pages stored in a system cache and referenced objects cached in other data stores
WO2001008382A1 (en) * 1999-07-22 2001-02-01 Emarkmonitor Inc. Process for searching and monitoring for internet trademark usage
US6401075B1 (en) 2000-02-14 2002-06-04 Global Network, Inc. Methods of placing, purchasing and monitoring internet advertising
US8352331B2 (en) 2000-05-03 2013-01-08 Yahoo! Inc. Relationship discovery engine
US7028083B2 (en) 2000-05-26 2006-04-11 Akomai Technologies, Inc. Method for extending a network map
CA2924940A1 (en) 2000-07-05 2002-01-10 Paid Search Engine Tools, L.L.C. Paid search engine bid management
US6618717B1 (en) 2000-07-31 2003-09-09 Eliyon Technologies Corporation Computer method and apparatus for determining content owner of a website
EP1182581B1 (en) 2000-08-18 2005-01-26 Exalead Searching tool and process for unified search using categories and keywords
US7225246B2 (en) 2000-08-21 2007-05-29 Webtrends, Inc. Data tracking using IP address filtering over a wide area network
US20020083188A1 (en) 2000-11-02 2002-06-27 Webtrends Corporation Method for determining web page loading and viewing times
US20020112048A1 (en) 2000-12-11 2002-08-15 Francois Gruyer System and method for providing behavioral information of a user accessing on-line resources
US7356530B2 (en) 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US20020154163A1 (en) 2001-04-18 2002-10-24 Oak Interactive Ltd. Advertising system for interactive multi-stages advertisements that use the non-used areas of the browser interface
US7266839B2 (en) 2001-07-12 2007-09-04 J P Morgan Chase Bank System and method for providing discriminated content to network users
US20030046389A1 (en) 2001-09-04 2003-03-06 Thieme Laura M. Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility
US20030078838A1 (en) 2001-10-18 2003-04-24 Szmanda Jeffrey P. Method of retrieving advertising information and use of the method
US7185085B2 (en) 2002-02-27 2007-02-27 Webtrends, Inc. On-line web traffic sampling
AU2003248767C1 (en) 2002-06-28 2009-01-29 Omniture, Inc. Capturing and presenting site visitation path data
JP2004070405A (ja) * 2002-08-01 2004-03-04 Mitsubishi Electric Corp Webページの風評情報抽出装置
US6810356B1 (en) 2002-08-30 2004-10-26 Advertising.Com Traffic estimation
US20040059625A1 (en) 2002-09-20 2004-03-25 Ncr Corporation Method for providing feedback to advertising on interactive channels
EP1604349A4 (en) 2003-03-04 2006-12-06 Omniture Inc CONNECTING WEBSITE CLICKS WITH LINKS ON ONE WEBSITE
US7603373B2 (en) 2003-03-04 2009-10-13 Omniture, Inc. Assigning value to elements contributing to business success
US8275839B2 (en) * 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US7437364B1 (en) * 2004-06-30 2008-10-14 Google Inc. System and method of accessing a document efficiently through multi-tier web caching
CN1993298A (zh) 2004-08-27 2007-07-04 昭和电工株式会社 制造用于磁记录介质的玻璃基底的方法及通过该方法制得的用于磁记录介质的玻璃基底
US20080040342A1 (en) 2004-09-07 2008-02-14 Hust Robert M Data processing apparatus and methods
US7584194B2 (en) * 2004-11-22 2009-09-01 Truveo, Inc. Method and apparatus for an application crawler
US7962461B2 (en) * 2004-12-14 2011-06-14 Google Inc. Method and system for finding and aggregating reviews for a product
US8001005B2 (en) 2005-01-25 2011-08-16 Moreover Acquisition Corporation Systems and methods for providing advertising in a feed of content
US20060173822A1 (en) 2005-02-03 2006-08-03 Microsoft Corporation System and method for optimization of results based on monetization intent
US7617193B2 (en) 2005-03-28 2009-11-10 Elan Bitan Interactive user-controlled relevance ranking retrieved information in an information search system
CA2543694A1 (en) 2005-04-14 2006-10-14 Yosi Heber System and method for analyzing, generating suggestions for, and improving websites
US7801881B1 (en) * 2005-05-31 2010-09-21 Google Inc. Sitemap generating client for web crawler
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
WO2007002820A2 (en) * 2005-06-28 2007-01-04 Yahoo! Inc. Search engine with augmented relevance ranking by community participation
US9558498B2 (en) 2005-07-29 2017-01-31 Excalibur Ip, Llc System and method for advertisement management
US20070038608A1 (en) 2005-08-10 2007-02-15 Anjun Chen Computer search system for improved web page ranking and presentation
US8768772B2 (en) 2005-09-20 2014-07-01 Yahoo! Inc. System and method for selecting advertising in a social bookmarking system
US20070067217A1 (en) 2005-09-20 2007-03-22 Joshua Schachter System and method for selecting advertising
US7912755B2 (en) * 2005-09-23 2011-03-22 Pronto, Inc. Method and system for identifying product-related information on a web page
US20070073592A1 (en) * 2005-09-28 2007-03-29 Redcarpet, Inc. Method and system for network-based comparision shopping
US8417569B2 (en) 2005-11-30 2013-04-09 John Nicholas and Kristin Gross Trust System and method of evaluating content based advertising
US7788131B2 (en) 2005-12-15 2010-08-31 Microsoft Corporation Advertising keyword cross-selling
US7827060B2 (en) 2005-12-30 2010-11-02 Google Inc. Using estimated ad qualities for ad filtering, ranking and promotion
US7685091B2 (en) * 2006-02-14 2010-03-23 Accenture Global Services Gmbh System and method for online information analysis
US20070203789A1 (en) 2006-02-27 2007-08-30 Microsoft Corporation Designing hyperlink structures
JP2009528639A (ja) * 2006-02-28 2009-08-06 バズロジック, インコーポレイテッド ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法
US20070203891A1 (en) 2006-02-28 2007-08-30 Microsoft Corporation Providing and using search index enabling searching based on a targeted content of documents
US20070233566A1 (en) 2006-03-01 2007-10-04 Dema Zlotin System and method for managing network-based advertising conducted by channel partners of an enterprise
WO2007103646A2 (en) 2006-03-01 2007-09-13 Covario, Inc. System and method for managing network-based advertising conducted by channel partners of an enterprise
US7877392B2 (en) 2006-03-01 2011-01-25 Covario, Inc. Centralized web-based software solutions for search engine optimization
US7444343B2 (en) 2006-03-31 2008-10-28 Microsoft Corporation Hybrid location and keyword index
US20070255754A1 (en) 2006-04-28 2007-11-01 James Gheel Recording, generation, storage and visual presentation of user activity metadata for web page documents
US8209320B2 (en) 2006-06-09 2012-06-26 Ebay Inc. System and method for keyword extraction
US8001105B2 (en) 2006-06-09 2011-08-16 Ebay Inc. System and method for keyword extraction and contextual advertisement generation
US20080010142A1 (en) 2006-06-27 2008-01-10 Internet Real Estate Holdings Llc On-line marketing optimization and design method and system
CN100456298C (zh) * 2006-07-12 2009-01-28 百度在线网络技术(北京)有限公司 广告信息检索系统及广告信息检索方法
US8838560B2 (en) 2006-08-25 2014-09-16 Covario, Inc. System and method for measuring the effectiveness of an on-line advertisement campaign
US8972379B1 (en) * 2006-08-25 2015-03-03 Riosoft Holdings, Inc. Centralized web-based software solution for search engine optimization
US20080052278A1 (en) 2006-08-25 2008-02-28 Semdirector, Inc. System and method for modeling value of an on-line advertisement campaign
CA2600910A1 (en) 2006-09-08 2008-03-08 Eldis Inc. Methods for estimating search engine market share for websites
US8041596B2 (en) 2006-09-08 2011-10-18 Eldis Inc. Methods for estimating search engine market share for websites
US20090319365A1 (en) 2006-09-13 2009-12-24 James Hallowell Waggoner System and method for assessing marketing data
US7672943B2 (en) 2006-10-26 2010-03-02 Microsoft Corporation Calculating a downloading priority for the uniform resource locator in response to the domain density score, the anchor text score, the URL string score, the category need score, and the link proximity score for targeted web crawling
US20080270158A1 (en) * 2007-04-30 2008-10-30 Fatdoor, Inc. Method and apparatus for geo-spatial and social relationship analysis
US20080133500A1 (en) 2006-11-30 2008-06-05 Caterpillar Inc. Website evaluation and recommendation tool
US20080189274A1 (en) * 2007-02-05 2008-08-07 8Lives Technology Systems and methods for connecting relevant web-based product information with relevant network conversations
JP5194856B2 (ja) 2007-02-07 2013-05-08 富士通株式会社 コンパクトな決定図を用いた効率的インデックス付け
US7974989B2 (en) * 2007-02-20 2011-07-05 Kenshoo Ltd. Computer implemented system and method for enhancing keyword expansion
US8307392B2 (en) 2007-06-11 2012-11-06 Yahoo! Inc. Systems and methods for inserting ads during playback of video media
US8271473B2 (en) 2007-06-25 2012-09-18 Jobs2Web, Inc. System and method for career website optimization
WO2009065149A2 (en) 2007-11-18 2009-05-22 Seoeng Llc Navigable website analysis engine
US8862622B2 (en) * 2007-12-10 2014-10-14 Sprylogics International Corp. Analysis, inference, and visualization of social networks
US7933916B2 (en) * 2008-02-28 2011-04-26 Microsoft Corporation Querying nonSQL data stores with a SQL-style language
US8312022B2 (en) 2008-03-21 2012-11-13 Ramp Holdings, Inc. Search engine optimization
US8700618B2 (en) 2008-05-12 2014-04-15 Covario, Inc. Tracking implicit trajectory of content sharing
US20090287684A1 (en) * 2008-05-14 2009-11-19 Bennett James D Historical internet
US8190594B2 (en) * 2008-06-09 2012-05-29 Brightedge Technologies, Inc. Collecting and scoring online references
US8494897B1 (en) 2008-06-30 2013-07-23 Alexa Internet Inferring profiles of network users and the resources they access
US8341047B1 (en) 2008-07-25 2012-12-25 Metrix4Media, LLC Systems and methods for optimizing an electronic advertising campaign based on organic content
US8364529B1 (en) 2008-09-05 2013-01-29 Gere Dev. Applications, LLC Search engine optimization performance valuation
US7974983B2 (en) * 2008-11-13 2011-07-05 Buzzient, Inc. Website network and advertisement analysis using analytic measurement of online social media content
US8396742B1 (en) 2008-12-05 2013-03-12 Covario, Inc. System and method for optimizing paid search advertising campaigns based on natural search traffic
EP2199969A1 (en) 2008-12-18 2010-06-23 Adtraction Marketing AB Method to track number of visitors or clicks
US20100217647A1 (en) 2009-02-20 2010-08-26 Philip Clifford Jacobs Determining share of voice
US8019746B2 (en) 2009-03-02 2011-09-13 Yahoo! Inc. Optimized search result columns on search results pages
EP2409251A4 (en) 2009-03-20 2015-03-18 Ad Vantage Networks Llc METHOD AND SYSTEMS FOR SCANNING, SELECTION AND DISPLAY OF CONTENT
US8676798B1 (en) 2009-09-30 2014-03-18 BloomReach Inc. Query generation for searchable content
US9058242B2 (en) 2010-03-04 2015-06-16 Gshift Labs Inc. Method and system of optimizing a web page for search engines
US20120089429A1 (en) 2010-05-13 2012-04-12 Accenture Global Services Limited. Systems and methods for gathering and analyzing social media data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105793878A (zh) * 2013-09-17 2016-07-20 南穆迪·南·默克温耶 交易社交媒体平台系统和方法

Also Published As

Publication number Publication date
CA2727407C (en) 2016-08-02
JP2011524054A (ja) 2011-08-25
US8620892B2 (en) 2013-12-31
USRE48437E1 (en) 2021-02-16
USRE49927E1 (en) 2024-04-16
WO2009152007A3 (en) 2010-03-18
JP5238074B2 (ja) 2013-07-17
US20120215760A1 (en) 2012-08-23
US8190594B2 (en) 2012-05-29
US20090307056A1 (en) 2009-12-10
EP2307987A4 (en) 2011-09-28
WO2009152007A2 (en) 2009-12-17
EP2307987A2 (en) 2011-04-13
CA2727407A1 (en) 2009-12-17

Similar Documents

Publication Publication Date Title
CN102057375A (zh) 在线参引的收集和记分
US10740723B2 (en) Computer method and system for searching and navigating published content on a global computer network
US10269024B2 (en) Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
TWI451275B (zh) 促進內容與網路中廣告資訊匹配之系統及方法
US20140297614A1 (en) Location-based serach and map display
US20140297403A1 (en) Social Analytics System and Method for Analyzing Conversations in Social Media
US20080160490A1 (en) Seeking Answers to Questions
US20110238608A1 (en) Method and apparatus for providing personalized information resource recommendation based on group behaviors
WO2004044705A2 (en) Method and system of searching by correlating the query structure and the data structure
JP2008507027A (ja) 1次インターネット検索キーワードと係わる2次キーワードによるターゲティング広告方法とその広告システム、及び2次キーワードリスト提供方法及び装置
US20120041936A1 (en) Search engine optimization at scale
US20030041143A1 (en) Internet tool
Gregurec et al. Search Engine Optimization (SEO): Website analysis of selected faculties in Croatia
US11275773B2 (en) User interface for search method and system
Lai et al. A system architecture of intelligent-guided browsing on the Web
Wen Development of personalized online systems for web search, recommendations, and e-commerce
CN100545839C (zh) 用于瞄准用户行为的内容管理系统
Kakulapati et al. Survey on web search results personalization techniques
Sion et al. Blogs-an instrument of the social media and its Google indexation in view of improving the quality of Romanian tourism services
Robertson The web, the home and the search engine
JP2003076714A (ja) 情報価値を用いたデータ処理システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110511