CN109074365B - 使网络通信路径参数化 - Google Patents
使网络通信路径参数化 Download PDFInfo
- Publication number
- CN109074365B CN109074365B CN201780000967.1A CN201780000967A CN109074365B CN 109074365 B CN109074365 B CN 109074365B CN 201780000967 A CN201780000967 A CN 201780000967A CN 109074365 B CN109074365 B CN 109074365B
- Authority
- CN
- China
- Prior art keywords
- web page
- keywords
- data processing
- processing system
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/134—Hyperlinking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Abstract
提供了使网络通信路径参数化的系统和方法。所述系统可识别由多个客户端计算装置经由网络协议遍历的网络通信路径。所述系统可基于所述网络通信路径的参数以及多个关键词中的每一个关键词对于在所述第一web页面上经由所述网络协议将所述多个客户端计算装置导向所述第二web页面的所述超链接的属性来生成具有所述多个关键词中的每一个关键词的标量值的权重数据结构。所述系统可基于对所述多个关键词中的每一个关键词的所述标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择所述内容项。
Description
相关申请的交叉引用
本申请要求于2017年1月18日提交的标题为“Parameterizing NetworkCommunication Paths”的美国专利申请No.15/408,861的优先权,其内容全部通过引用并入在本文中。
背景技术
可通过计算装置在图形环境、web页面或其它界面中显示信息。图形环境或web页面可包括由实体经由应用服务器或web页面服务器提供以供显示的文本、图像、视频或音频信息。附加内容项对象也可由第三方提供以用于与由实体提供的信息一起显示在web页面上。因此,查看图形环境的人可访问作为web页面的主体的信息以及可以或者可以不与web页面的主题有关的所选择的第三方内容项对象。由于大数目的可用内容项对象和电子图形环境的资源密集性质,高效地选择并提供内容项对象以供显示在图形环境中可以面临挑战。
发明内容
计算装置(诸如服务器)可消耗大量的计算资源对于将不由该服务器或由接收到所选择的内容项对象的最终用户选择的数字内容项对象执行实时内容选择过程。当内容提供者对于相关关键词执行搜索或者从所述服务器请求针对相关关键词的推荐时服务器可消耗大量的计算资源。当内容提供者向下滚动关键词结果的列表时可利用附加计算资源,因为每个新页面视图使所述服务器执行另一搜索过程或远程过程调用(“RPC”)。使用web爬取器(crawler)来识别锚(例如,传入链接)并且然后使用仅用锚的技术来回溯到链接站点可易受虚伪或恶意行为的攻击。例如,恶意代码或自动化程序或服务可用于生成欺诈或虚伪超链接以形成具有一组web站点的链接场(link farm),所述web站点超链接到该组中的每个其它站点。这可让关键词生成易受来自像链接场一样的搜索引擎优化时的尝试的污染和提供许多欺诈传入链接的类似恶意技术的攻击。所述数据处理系统可以在检测链接场时花费相当大量的资源。另外,由于失效或陈旧链接仅使用锚可能是有问题的。所述数据处理系统可花费计算资源来识别并确定这些旧链接是否是陈旧的。
本解决方案的系统和方法提供可通过识别由计算装置遍历的网络通信路径来识别触发或者发起了该网络通信路径的遍历的参数来减少处理器利用、存储器利用、远程过程调用和带宽使用的数据处理系统。所述数据处理系统可基于网络通信路径数据(诸如页面推荐数据)来对针对内容提供者的关键词推荐进行加权和评分。所述数据处理系统可确定来自每个锚页面的总推荐率并且将此表示为可用于对从该锚页面得到的关键词进行加权的标量值。
本公开的至少一个方面指向用于使网络通信路径参数化的系统。所述系统可包括包含由至少一个处理器执行的网络路径检测组件、参数化组件和内容选择器组件的数据处理系统。所述数据处理系统可识别由多个客户端计算装置经由网络协议遍历的网络通信路径。所述网络通信路径可包括第一web页面和第二web页面。所述第一web页面可包括具有将所述多个客户端计算装置导向所述第二web页面的超链接的内容项。所述数据处理系统可基于所述网络通信路径的参数以及多个关键词中的每一个关键词对于在所述第一web页面上经由所述网络协议将所述多个客户端计算装置导向所述第二web页面的所述超链接的属性来生成具有所述多个关键词中的每一个关键词的标量值的权重数据结构。所述数据处理系统可基于对所述多个关键词中的每一个关键词的所述标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择所述内容项。
至少一个方面指向使网络通信路径参数化的方法。所述方法可包括数据处理系统识别由多个客户端计算装置经由网络协议遍历的网络通信路径。所述网络通信路径可包括第一web页面和第二web页面。所述第一web页面可包括具有将所述多个客户端计算装置导向所述第二web页面的超链接的内容项。所述方法可包括所述数据处理系统基于所述网络通信路径的参数以及多个关键词中的每一个关键词对于在所述第一web页面上经由所述网络协议将所述多个客户端计算装置导向所述第二web页面的所述超链接的属性来生成具有所述多个关键词中的每一个关键词的标量值的权重数据结构。所述方法可包括所述数据处理系统基于对所述多个关键词中的每一个关键词的所述标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择所述内容项。
在下面详细地讨论这些及其它方面和实施方式。以上信息和以下具体实施方式包括各个方面和实施方式的说明性示例,并且提供用于理解所要求保护的方面和实施方式的性质和特征的概要或框架。附图提供图示和对各个方面和实施方式的进一步理解,并且被并入本说明书并构成本说明书的一部分。
附图说明
在附图和以下描述中阐述本说明书中所描述的主题的一个或多个实施方式的细节。主题的其它特征、方面和优点将从本说明书、附图和权利要求书变得显而易见。
图1是用于使网络通信路径参数化的系统的图示。
图2是用于使网络通信路径参数化的操作系统流程的图示。
图3是使网络通信路径参数化的方法的图示。
图4是图示可以被采用来实现图1和图2中所示的系统的各种元件以及图3中所示的方法的计算机系统的架构的框图。
在各个附图中相同的附图标记和名称指示相同的元件。
具体实施方式
下文是与使网络通信路径参数化的方法、设备和系统有关的各种概念以及使网络通信路径参数化的方法、设备和系统的实施方式的更详细描述。可以按照许多方式中的任意方式实现上面介绍且在下面更详细地讨论的各种概念。
包括用于对内容项安插(placement)活动进行处理的一个或多个服务器或计算装置的数据处理系统可消耗大量的计算资源来对于将不由该数据处理系统或者由接收到所选择的广告的用户来选择的内容项执行实时内容选择过程(例如,广告拍卖)。当内容提供者对于相关关键词执行搜索或者从所述数据处理系统请求针对相关关键词的推荐时数据处理系统可消耗大量的计算资源。当内容提供者向下滚动关键词结果的列表时可利用附加计算资源,因为每个新页面视图使所述数据处理系统执行另一搜索过程或远程过程调用(“RPC”)。使用web爬取器来识别锚(例如,传入链接)并且然后使用仅用锚的技术来回溯到链接站点可易受虚伪或恶意行为的攻击。例如,恶意代码或自动化程序或服务可用于生成欺诈或虚伪超链接以形成具有一组web站点的链接场,该组web站点超链接到该组中的每个其它站点。这可让关键词生成易受来自在像链接场一样的搜索引擎优化期间的尝试的污染或者提供许多欺诈传入链接的类似恶意技术的攻击。所述数据处理系统可以在检测链接场时花费相当大量的资源。另外,由于失效或陈旧链接,仅使用锚可能是有问题的。所述数据处理系统可以花费大量的资源来识别并确定这些旧链接是否是陈旧的。
本解决方案的系统和方法提供可通过识别由计算装置遍历的网络通信路径以识别触发或者发起了该网络通信路径的遍历的参数来减少处理器利用、存储器利用、远程过程调用和带宽使用的数据处理系统。该数据处理系统可基于网络通信路径数据(诸如页面推荐数据)来对针对内容提供者的关键词推荐进行加权和评分。该数据处理系统可确定来自每个锚页面的总推荐率并且将此表示为可用于对从该锚页面得到的关键词进行加权的标量值。
该数据处理系统可使用关于与从锚页面推荐来的客户端装置相关联的属性的集合的聚类数据来基于类似的属性针对那种客户端装置显式地对关键词进行加权。例如,与和属性的第二集合相关联的客户端装置(例如,位于纽约州纽约市并且链接到指示对浪漫喜剧感兴趣的最终用户简档)相比与属性的第一集合相关联的客户端装置(例如,位于加利福尼亚州圣何塞并且链接到指示对科幻小说电影感兴趣的最终用户简档)可以更倾向于遵循特定关键词集合到电子商务站点。该数据处理系统可通过将所推荐的客户端装置的属性和从进行推荐的锚页面学习到的关键词相组合来学习此模式。
为了确定表示来自每个锚页面的总推荐率的标量值,并且使用该标量值来对从该锚页面得到的关键词进行加权,该数据处理系统可刮取(scrape)web锚页面以产生与该页面相关联的相关关键词的列表。可以基于与关键词相关联的属性和到目标页面的一个或多个超链接来对这些关键词进行加权。例如,属性可包括接近度、字体、大小、文本颜色、特性、题目、概念、媒体类型(例如,图像、视频、文本或音频)或层。例如,这些关键词可以通过它们对于到目标页面的一个或多个超链接的接近度进行加权处理。该数据处理系统可使用基于浏览器cookie的机制来跟踪访问多个站点的客户端计算装置以为该客户端计算装置生成简档。浏览器cookie可包括例如像素,包括被配置成为第三方站点聚合客户端计算装置会话数据的JavaScript库集合的分析应用编程接口。浏览器cookie模块可包括认证机制和安全组件。
该数据处理系统可将推荐者(referrer)用于登录web页面以及类似或相关的web页面。例如,如果web页面被重新构建并且变得可被客户端计算装置访问,则该web页面可以没有业务流量。通过识别类似的web页面并且使用来自那些web站点的推荐关键词数据,该数据处理系统可针对重新构建的web页面使用此技术来生成关键词建议。
该数据处理系统可基于推荐来自于的源对与客户端计算装置相关联的网络活动进行分类。例如,该数据处理系统可针对到该web页面的每个不同的推荐者来监测特定web页面的属性,因为推荐者可提供关于访问了该推荐者web页面的客户端计算装置的属性的数据。利用这个,该数据处理系统可选择与客户端计算装置相关联的网络活动的属性或类型,并且依据来自该站点的客户端计算装置将执行动作或网络活动的可能性对来自推荐者的关键词进行加权。例如,该数据处理系统可依据客户端计算装置有多么可能进行与选择web页面上的内容项相关联的网络活动从而与电子调查交互或者进行电子交易来对推荐者进行加权。
该数据处理系统可把加权因数建立在客户端计算装置选择简档的基础上,使得关键词推荐源基于所推荐的客户端计算装置和内容提供者的选择准则相匹配的百分比而被加权。在这些示例中内容提供者可针对属性选择关键词。
该数据处理系统可通过例如将权重相乘、将权重相加、计算权重的平均数或者以其它方式组合权重来组合各种加权实施方式中的每一个。该数据处理系统可通过对与条件(例如,网络活动或匹配的简档)匹配或对应的客户端计算装置的数目进行计数并且将它除以客户端计算装置的总数目来确定权重。
在一些情况下,该数据处理系统可从具有推荐者的锚页面中并且从链接到那些锚页面的页面中提取关键词。以此菊花链方式,该数据处理系统可基于由一个或多个计算装置遍历的扩展网络通信来生成权重。
图1图示用于使网络路径通信参数化的示例系统100。系统100可包括内容选择基础设施。系统100可包括经由网络105与内容提供者计算装置125、内容发布者计算装置115或客户端计算装置110中的一个或多个进行通信的数据处理系统120。网络105可包括计算机网络,诸如互联网、局域网、广域网、城域网或其它区域网、内部网、卫星网络以及其它通信网络,诸如语音或数据移动电话网。网络105可用于访问信息资源,诸如可被显示在至少一个计算装置110(诸如膝上型计算机、台式计算机、平板计算机、个人数字助理、智能电话或便携式计算机)上的web页面、web站点、域名或统一资源定位符。例如,经由网络105计算装置110的用户可访问由至少一个web站点运营商或内容发布者115提供的web页面。计算装置110的web浏览器(例如,资源111、应用111或代理111)可访问web站点运营商或内容发布者115的web服务器以检索web页面用于在计算装置110的监视器上显示。内容发布者115可向在计算装置110上执行以渲染内容的资源111提供指令。web站点运营商或内容发布者115一般地包括操作web页面的实体。web站点运营商或内容发布者115包括与网络105进行通信以使得web页面对计算装置110可用的至少一个web页面服务器。数据处理系统120可向在计算装置110上执行以渲染内容的资源111提供指令。
网络105可以是任何类型或形式的网络并且可以包括以下各项中的任一个:点到点网络、广播网络、广域网、局域网、电信网络、数据通信网、计算机网络、ATM(异步传输模式)网络、SONET(同步光网络)网络、SDH(同步数字层级)网络、无线网络和有线网络。网络105可以包括无线链路,诸如红外信道或卫星频带。网络105的拓扑可以包括总线、星型或环型网络拓扑。网络可以包括使用用于在移动装置之间通信的任一个或多个协议的移动电话网,所述协议包括高级移动电话协议(“AMPS”)、时分多址(“TDMA”)、码分多址(“CDMA”)、全球移动通信系统(“GSM”)、通用分组无线服务(“GPRS”)或通用移动电信系统(“UMTS”)。可以经由不同的协议来发送不同类型的数据,或者可以经由不同的协议来发送相同类型的数据。
系统100可包括至少一个数据处理系统120。数据处理系统120可包括至少一个逻辑装置,诸如具有处理器以经由网络105例如与计算装置110、web站点运营商或内容发布者计算装置115(或内容发布者115)以及至少一个内容提供者计算装置125(或提供者装置125或内容提供者125)进行通信的计算装置。数据处理系统120可包括至少一个计算资源、服务器、处理器或存储器。例如,数据处理系统120可包括位于至少一个数据中心中的多个计算资源或服务器。数据处理系统120可包括多个逻辑上分组的服务器并且方便分布式计算技术。服务器的逻辑组可以被称为数据中心、服务器场或机器场。服务器也可是在地理上离散的。数据中心或机器场可以作为单个实体被管理,或者机器场可包括多个机器场。每个机器场内的服务器可以是异构的—服务器或机器中的一个或多个可根据一个或多个类型的操作系统平台来操作。
机器场中的服务器可连同相关存储系统一起被存储在高密度机架系统中,并且位于企业数据中心中。例如,以这种方式合并服务器可以通过将服务器和高性能存储系统定位在集中式高性能网络上来改进系统可管理性、数据安全性、系统的物理安全性和系统性能。使服务器和存储系统集中并且将它们与高级系统管理工具耦合允许实现对服务器资源的更高效使用。
数据处理系统120可包括具有至少一个计算资源或服务器的内容安插系统。数据处理系统120可包括至少一个网络路径检测组件130、至少一个参数化组件135、至少一个聚合器组件140、至少一个内容选择器组件145和至少一个数据储存库150。至少一个数据储存库150可将内容数据151、权重152、web页面数据153或性能数据154包括或者存储在一个或多个数据结构或数据库中。内容数据151可包括例如内容活动信息、内容组、内容选择准则、内容项对象或由内容提供者125提供的或者由数据处理系统获得或者确定以方便内容选择的其它信息。网络路径检测组件120、参数化组件135、聚合器组件140和内容选择器组件145可每个包括至少一个处理单元或其它逻辑器件,诸如可编程的逻辑阵列引擎,或被配置成与数据库储存库或数据库150进行通信的模块。网络路径检测组件120、参数化组件135、聚合器组件140、内容选择器组件145和数据储存库150可以是单独的组件、单个组件或数据处理系统120的一部分。系统100及其组件(诸如数据处理系统120)可以包括硬件元件,诸如一个或多个处理器、逻辑器件或电路。
数据处理系统120可获得与多个计算装置110相关联的匿名计算机网络活动信息。计算装置110的用户可肯定地授权数据处理系统120获得与用户的计算装置110相对应的网络活动信息。例如,数据处理系统120可提示计算装置110的用户以便同意获得一个或多个类型的网络活动信息。计算装置110的用户的身份可保持匿名并且计算装置110可以与唯一标识符(例如,用户或者由数据处理系统提供的计算装置或者计算装置的用户的唯一标识符)相关联。数据处理系统可使每个观察结果与对应的唯一标识符相关联。
内容提供者125可以建立电子内容活动。电子内容活动可指代对应于公共主题的一个或多个内容组。内容活动可包括层次数据结构,所述层次数据结构包括内容组、内容项数据对象、和内容选择准则。为了创建内容活动,内容提供者125可指定内容活动的活动等级参数的值。活动等级参数可包括例如活动名称、用于安插内容项对象的优选内容网络、内容活动的预算、内容活动的开始和结束日期、内容活动的持续时间、内容项对象安插的排程、语言、地理位置、在上面提供内容项对象的计算装置的类型。其它活动等级参数可包括例如支付技术,诸如每点击成本(CPC)、每千闪现成本(CPM)、每动作成本(CPA)、每转化成本或每千转化成本。在一些情况下,闪现可指代内容项对象被从其源(例如,数据处理系统120或内容提供者125)取得(fetch)的时刻,并且是可计数的。在一些情况下,由于点击欺诈的可能性,可过滤并排除如闪现的机器人活动。因此,在一些情况下,闪现可指代来自Web服务器的对来自浏览器111的页面请求的响应的测量,所述页面请求被从机器活动和错误代码中过滤,并且在尽可能接近于渲染内容项对象以便显示在计算装置110上的机会点处被记录。在一些情况下,闪现可指代可查看的闪现;例如,内容项对象在客户端计算装置110的显示装置上至少部分地(例如,20%、30%、30%、40%、50%、60%、70%或更多)可查看。点击或选择可指代用户与内容项对象的交互,诸如鼠标点击、触摸交互、手势、摇动、音频交互或键盘点击。转化可指代用户相对于内容项对象采取期望的动作;例如,购买产品或服务、完成调查、访问与内容项相对应的物理店或者完成电子交易。
内容提供者125可为内容活动进一步建立一个或多个内容组。内容组包括一个或多个内容项对象和对应的内容选择准则,诸如关键词、单词、术语、短语、地理位置、计算装置的类型、日时间、兴趣、题目或垂线。在相同内容活动下的内容组可共享相同的活动等级参数,但是可能已经为特定内容组等级参数定制规格,诸如关键词、否定关键词(例如,其阻止在主要内容中存在否定关键词时安插内容项)、针对关键词的出价或预算。
为了创建新内容组,内容提供者可为该内容组的内容组等级参数提供值。内容组等级参数包括例如内容组名称或内容组主题,以及针对不同的内容安插机会(例如,自动安插或受管理安插)或结果(例如,点击、闪现或转化)的出价。内容组名称或内容组主题可以是内容提供者125可使用来捕获内容组的内容项对象将被选择以供显示的题目或主题的一个或多个术语。例如,汽车经销商可为它运营的每个品牌的车辆创建不同的内容组,并且可以为它运营的每个型号的车辆进一步创建不同的内容组。汽车经销商可使用的内容组主题的示例包括例如“制造A跑车”、“制造B跑车”、“制造C轿车”、“制造C卡车”、“制造C混合动力车”或“制造D混合动力车”。例如,示例内容活动主题可以是“混合动力车”并且包括针对“制造C混合动力车”和“制造D混合动力车”两者的内容组。
内容提供者125可向每个内容组提供一个或多个关键词和内容项对象。关键词可包括与和内容项对象相关联或者通过内容项对象识别的产品或服务相关的词项。关键词可包括一个或多个词项或短语。例如,汽车经销商可以包括“跑车”、“V-6发动机”、“四轮驱动”、“燃料效率”作为内容组或内容活动的关键词。在一些情况下,否定关键词可由内容提供者来指定以避免、防止、阻止或者禁用和那些否定关键词匹配的某些搜索结果web页面或内容web页面上的内容安插。内容提供者可指定用于选择内容项对象的匹配的类型,诸如确切匹配、短语匹配或广泛匹配。
内容提供者125可提供一个或多个内容项对象以供由数据处理系统120选择。数据处理系统120可在和预算、内容排程、最大出价、关键词以及为内容组所指定的其它选择准则匹配的内容安插机会变得可用时选择内容项对象。不同类型的内容项对象可被包括在内容组中,所述不同类型的内容项对象诸如文本内容项、图像内容项、视频内容项、音频内容项、多媒体内容项、呼叫内容项或内容项链接。
数据处理系统120可包括、执行或者与网络路径检测组件130进行通信以识别由多个客户端计算装置110使用网络协议(例如,HTTP)经由网络105遍历的一个或多个网络通信路径。网络通信路径可指代由包括超链接的第一web页面形成的路径,所述超链接在选择时,将客户端计算装置110导向或者路由到第二web页面。可将超链接嵌入在电子内容项(诸如补充内容项或广告)中。可和文章、图像、视频或其它多媒体内容一起嵌入或者提供超链接。
网络路径检测组件130可识别、检测或者以其它方式确定第一web页面是锚web页面或web锚。web锚可指代链接到诸如第二web页面的目标web页面的web页面。锚可指代与将被加权的关键词相关联的传入链接。链接可指代从一个web资源(例如,第一web页面)到另一web资源(例如,第二web页面)的连接。链接可包括两端(诸如锚)和方向。链接可在源或锚处开始并且指向目的地锚,所述目的地锚可包括诸如图像、视频剪辑、声音片断、节目、HTML文档或HTML文档内的元素的另一web资源。可响应于网络活动而激活链接,所述网络活动诸如选择、点击、鼠标掠过、手指手势、运动、接近手势,或者由计算装置110的用户接口(例如,键盘输入、鼠标输入或语音命令)所支持的其它输入活动。激活链接可引导计算装置110访问第二web页面、检索第二web页面的内容、经由计算装置110渲染第二web页面或者以其它方式提供或者呈现第二web页面的内容。术语推荐者可包括最终用户借此从web锚中选择链接并且对目标web页面或第二web页面采取的动作。
在一些情况下,第一页面或web锚可将锚web页面的统一资源定位符(“URL”)或统一资源识别符(“URI”)传递给第二web页面或登录web页面。例如,第一web页面可使用推荐者参数来将指示第一web页面的web地址或其它识别符的URI或URL传递给第二web页面。第一web页面可将URI或URL作为文本、字符串、超文本或其它格式来传递。在一些情况下,第一web页面可在传递URL之前对URL进行加密。在一些情况下,第一web页面可在传递URL之前对URL进行封装。在一些情况下,可以传递整个URL,然而在其它情况下第一web页面可以仅传递域名。例如,数据处理系统120可接收如下整个URL:www_example1_com/page1.html。在一些情况下,数据处理系统120可以仅接收如下域名:www_example1_com。
在一些情况下,第一web页面上的内容项可包括跟踪URL。跟踪URL可包括具有将客户端计算装置110导向第二web页面的URL的第一部分,以及包括指示关于第一web页面或锚web页面的信息的令牌的第二部分。例如,第一web页面可以是www_example1_com并且第二web页面可以是www_example2_com。在此示例中,跟踪URL可以是www_example2_com/?token=www_example1_com,其中跟踪URL的第一部分包括用于将客户端计算装置110导向第二web页面的www_example2_com,并且第二部分包括用于指示关于第一web页面的信息的www_example1_com。
因为数据处理系统120可以仅在一些情况下接收第一web页面的域名,所以数据处理系统120可使用其它技术来接收整个URI或URL。例如,客户端计算装置110可包括在计算装置110上执行以识别、存储并提供与网络路径通信有关的信息的资源111。例如,资源111可包括被设计和构建来识别、检测或者以其它方式获得第一web页面的统一资源定位符并且将URL记录和存储在存储器中的数据文件中的cookie代理。资源111可将所记录的信息(例如,URL或URI)提供给与URL相对应的数据处理系统120或内容发布者115。
第一和第二web页面可指代web站点、web页面、资源、应用、多媒体内容、视频游戏、移动应用、桌面应用、微件(widget)或其它数字或电子内容。
网络路径检测组件130可在访问登录web页面之前识别由客户端计算装置110遍历的多个web页面或web站点。在一些情况下,网络路径检测组件130可识别web页面的菊花链,其中每个web页面包括指向后续web页面的链接。菊花链可指代网络跳到跳到跳(hop-to-hop-to-hop)。网络路径检测组件130可根据javascript标签确定第一跳。该javascript标签可在菊花链中的每个web页面上执行。该javascript标签可在每个web页面上执行以确定相同客户端计算装置110正在访问每个web页面(或与多个客户端计算装置110相关联的相同账户识别符)。在一些情况下,客户端计算装置110上的资源111可将多个web页面跳链接在一起以创建菊花链,并且将菊花链序列发送到数据处理系统120。
在一些情况下,网络路径检测组件130可从每个web页面获得跳信息,并且组合所接收到的信息以生成由计算装置110遍历的web页面的菊花链或地图。例如,客户端计算装置110可访问第一web页面;第一web页面可包括具有将客户端计算装置110导向第二web页面的第一跟踪URL的第一内容项;第二web页面可包括具有将客户端计算装置110导向第三web页面的第二跟踪URL的第二内容项;第三web页面可包括具有将客户端计算装置110导向第四web页面的第三跟踪URL的第三内容项。网络路径检测组件130可从第二web页面、第三web页面和第四web页面中的每一个接收信息。该信息可包括例如客户端计算装置110的识别符、锚web页面的指示和已链接的web页面的指示。例如,数据处理系统120可从第二web页面接收关于将装置110导向第二web页面的第一web页面的信息;数据处理系统120可从第三web页面接收关于将装置110导向第三web页面的第二web页面的信息;并且数据处理系统可从第四web页面接收关于将装置110导向第四web页面的第三web页面的信息。网络路径检测组件130可编译此信息以确定由装置110遍历的网络通信路径。
在一些情况下,后续web页面可提供关于多个先前的web页面的信息。例如,第三web页面的跟踪URL可提供识别将装置110导向第三web页面的第二web页面的信息以及识别将装置110导向第二web页面的第一web页面的信息。例如,可通过可附加一个或多个URL识别符以生成令牌的脚本(诸如javascript或其它技术)来生成跟踪URL。因此,第二web页面可生成识别第一web页面的令牌,并且将第一web页面信息传递给第三web页面。第三web页面可生成具有包括关于第二web页面和第一web页面的信息的令牌的跟踪URL。
数据处理系统120可包括、执行或者与参数化组件135进行通信以生成具有多个关键词中的每一个的标量值的权重数据结构。参数化组件135可基于网络通信路径的参数以及所述多个关键词中的每一个关键词对于在第一web页面上经由网络协议将所述多个客户端计算装置导向第二web页面的超链接的接近度(或其它属性)来生成标量值。
数据处理系统120或参数化组件135可包括web爬取器组件,所述web爬取器组件被配置成刮取web页面以识别关键词,并且将所述关键词存储在数据储存库中。web爬取器(或web爬虫或web机器人)可包括以有系统的自动化方式浏览万维网的程序或自动化脚本。此过程可被称为Web爬取或爬行。
数据处理系统120可刮取web页面或者执行数据刮取以从该web页面中提取数据。数据处理系统120可直接使用超文本传输协议或者通过web浏览器来访问万维网。数据处理系统120可从web页面收集或者获得数据并且将所获得的数据(例如,关键词)存储在数据储存库150中以供以后检索或处理。
数据处理系统120可通过取得web页面并且从web页面中提取数据来刮取web页面。取得可指代web页面的下载。因此,web爬取可以是web刮取的组件,诸如以取得页面以供以后处理。一旦被取得,然后提取就可发生。数据处理系统可对web页面的内容进行解析、搜索、重新格式化。数据处理系统120(例如,web刮取器)可包括用于从web页面中提取数据的API。
数据处理系统120可刮取web页面以识别web页面(例如,锚web页面)的关键词。数据处理系统120可对链接到登录web页面的锚web页面上的关键词进行加权。数据处理系统120可使用一个或多个技术来对关键词进行加权或者评分,并且对关键词进行排名以向内容提供者装置125提供关键词建议。例如,数据处理系统120可确定来自每个锚页面的总推荐率以生成可用于对从该锚页面得到的关键词进行加权的标量值。数据处理系统120还可使用关于从锚页面推荐的客户端装置120的集合的聚类数据来基于客户端计算装置120的类型(或与客户端计算装置110相关联的属性)对关键词进行加权。
数据处理系统120可基于包括到登录web页面(例如,第二web页面)的链接的内容项的一个或多个关键词的属性来对锚web页面(例如,第一web页面)上的关键词进行加权。属性可包括例如接近度、字体、大小、文本颜色、特性、题目、概念、媒体类型(例如,图像、视频、文本或音频)或层。数据处理系统120可基于与登录web页面相关联的网络活动(例如,客户端计算装置是否在被从第一web页面推荐到登录web页面之后在登录web页面上执行了电子交易)对关键词进行加权。数据处理系统120可基于锚web页面推荐到登录web页面的计算装置110的数目对关键词进行加权。数据处理系统120可基于接近度、推荐的数目以及登录web页面上的网络活动中的两个或更多个的组合来对关键词进行加权。数据处理系统120可基于接近度、推荐的数目以及登录web页面上的网络活动中的一个或多个的组合来对关键词进行加权。例如,数据处理系统120可基于接近度和登录web页面上的网络活动的组合来对关键词进行加权。
数据处理系统120可基于关键词与内容项的接近度(或属性)来对关键词进行加权。数据处理系统120可确定关键词与内容项之间的距离。例如,数据处理系统可渲染第一web页面的代码以确定第一web页面的布局和关键词相对于内容项对象的位置。在一些情况下,与渲染在物理显示器上显示的代码相反数据处理系统120可在虚拟环境中渲染代码。例如,数据处理系统120可建立在上面渲染web页面的代码以执行进一步处理的虚拟存储器或虚拟图形显示。在一些情况下,数据处理系统120可模拟经渲染的web页面的显示。数据处理系统120可基于计算装置110或通信地耦合到计算装置110的显示装置的特性来模拟web页面的显示。特性可包括例如屏幕大小、像素的数目、或可用内容类型(例如,仅文本、图像、视频或多媒体)。在一些情况下,数据处理系统120可使用标准特性集合,使得针对所有内容项所确定的距离相对于彼此是标准的。数据处理系统120可确定第一web页面的所述多个关键词中的每一个关键词与包括指向第二web页面的链接的内容项对象之间的距离。数据处理系统120可使距离值归一化。例如,数据处理系统120可基于最小距离和最大距离来使距离归一化(例如,normalized_distance_value=(determined_distance_value–minimum_distance_value)/(maximum_distance_value–minimum_distance_value))。可针对特定锚web页面或者跨多个锚web页面使距离值归一化。
数据处理系统120可基于关键词与内容项之间的字符的数目来确定关键词与内容项之间的距离。例如,关键词可与内容项分开10个字符、20个字符、30个字符、50个字符或更多字符的距离。字符可包括字母数字字符或符号。在一些情况下,字符可以不包括空格。例如,空格可以不用于确定距离,因为它可能不影响关键词的权重。在一些情况下,数据处理系统120可在确定距离时将空格作为字符进行计数。在一些情况下,数据处理系统120可以或者可以不包括多媒体内容作为字符。
数据处理系统120可基于关键词与内容项之间的像素的数目来确定关键词与内容项之间的距离。数据处理系统120可渲染或者模拟web页面并且计算使关键词(或关键词的一部分)与具有链接的内容项(或内容项的一部分)分开的像素的数目。数据处理系统120可使用默认显示大小或显示分辨率来基于像素数目确定距离。数据处理系统120可从数据储存库150中检索默认像素大小。针对移动装置的默认像素大小可包括例如1080x 1920;750x1334;640x 1136;1536x 2048;1440x 2560;或1440x 2560。针对台式或膝上型计算装置的默认像素大小可包括例如1366x 768或1920x 1080。
数据处理系统可将距离确定为分桶距离。该分桶距离可指代关键词与内容项之间的距离的分类或距离的指示。数据处理系统120可使用如下一个或多个桶来形成或者确定分桶距离:1)关键词和内容项在阈值数目的单词内;2)关键词和内容项不在阈值数目的单词内但是在相同句子内;3)关键词和内容项不在阈值数目的单词或相同句子内,但是在相同段落内;4)关键词和内容项不在阈值数目的单词内,不在相同句子内,不在相同段落内,但是在web页面的相同折叠内。web页面的折叠可指代在折叠之上(above-the-fold)或在折叠之下(below-the-fold)。在折叠之上是指当web页面被最初渲染以供显示时在显示屏幕上的显示器上的web页面的区域。在折叠之下是指当web页面被最初渲染以供显示时不在显示器上但是当web页面被向下滚动以展现web页面在折叠下面的区域时被显示的web页面的区域。
数据处理系统120可基于关键词与内容项有多近来确定关键词的标量值。与更远离内容项的关键词相比,更靠近内容项的关键词可被更重地加权或者具有更高的标量值。例如,如果第一web页面上的第一关键词与内容项之间的距离是D1,并且web页面上的第二关键词与内容项之间的距离是D2,并且D2大于D1,则数据处理系统120可对第一关键词的加权比第二关键词高。数据处理系统120可将标量值确定为包括在0至1、0至10、0至100、0至1000的范围或某个其它范围内的值。
当客户端计算装置110被第一web页面推荐时数据处理系统120可基于登录页面上的网络活动来对关键词进行加权。例如,与将客户端计算装置110导向客户端计算装置110参与电子交易(例如,转化)的第二web页面的第一web页面相关联的关键词可被加权比与将客户端计算装置110导向第二web页面而不产生转化的第三web页面相关联的关键词高。
数据处理系统120可基于诸如由存在有关键词的web页面作出的推荐的数目的参数来对关键词进行加权。例如,参数可包括在一定时间间隔(例如,1小时、2小时、3小时、4小时、6小时、12小时、24小时、48小时、72小时、1星期、30天或60天)期间将所述多个客户端计算装置导向第二web页面的第一web页面的实例的总数目。数据处理系统120可基于包括由第一web页面对登录页面作出的推荐和由多个锚web页面对登录页面的推荐的总数目之间的比率的参数来对关键词进行加权。参数可包括在所述时间间隔期间将所述多个客户端计算装置导向第二web页面的第一web页面的实例的总数目除以将第二多个客户端计算装置导向第二web页面的多个web页面的实例的总数目。
例如,如果第一web页面将N个客户端计算装置110推荐到登录页面,并且第二web页面将N+20个客户端计算装置110推荐到登录web页面,则第二web页面上的关键词与第一web页面上的关键词相比可被更重地加权。如果N=100,则在此示例中,针对第一页面的参数可以是100并且针对第二web页面的参数可以是120。可基于范围(诸如0至1或0至100)使参数归一化。例如,可使针对第一web页面的参数归一化为0并且可使针对第二web页面的参数归一化为1。类似地,基于推荐者的比率的参数可用于确定权重如下:第一web页面推荐100个客户端计算装置并且第二web页面推荐120个客户端计算装置,然后应用于第一web页面的关键词的权重可以是100/(100+120)=0.45并且应用于第二web页面的关键词的权重可以是120/(100+120)=0.54。
数据处理系统120可组合一个或多个因数以为权重生成标量值。例如,数据处理系统120可添加与各种加权技术相关联的值如下:first_keyword_weight=proximity_weight+network_activity_weight+number_of_referrals_weight。在另一示例中,数据处理系统120可对这些因数中的一个或多个应用更大的权重如下:first_keyword_weight=0.5*proximity_weight+3*network_activity_weight+2*number_of_referrals_weight。数据处理系统120可使用求和、乘法、点积或其它技术来组合权重以确定作为关键词的权重的标量值。因此,数据处理系统120可基于用于对关键词进行加权的诸如距离、推荐的数目以及登录页面上的网络活动的一个或多个因数来确定锚web页面上的每个关键词的标量值。
数据处理系统120然后可基于关键词的权重对关键词进行排名以选择或者建议要添加到内容提供者的内容项活动的一个或多个关键词。内容选择器组件145然后可响应于对内容的请求而使用所添加的关键词来选择在最终用户计算装置110上显示的内容项。数据处理系统可基于对所述多个关键词中的每一个的标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程(例如,由内容选择器组件145执行),用于响应于从客户端计算装置110接收到的对内容的请求而选择内容项。
在一些情况下,数据处理系统120可基于与访问锚web页面和登录web页面的计算装置110相关联的属性来选择关键词或关键词的权重。属性可包括例如计算装置的类型(例如,移动装置、智能电话、台式机、笔记本、可穿戴装置或智能手表)、地理位置或其它简档信息。当为计算装置110选择响应于请求的内容时,数据处理系统120可选择具有如使用具有相同或类似属性的其它计算装置110的历史网络路径通信信息所确定的最高权重的关键词。例如,数据处理系统120可针对位于圣何塞的计算装置110将第一关键词的权重确定为10并且将第二关键词的权重确定为20。然而,数据处理系统120可针对位于波士顿的计算装置110将第一关键词的权重确定为20并且将第二关键词的权重确定为10。因此,如果数据处理系统120从位于波士顿的计算装置110接收到对内容的请求,则数据处理系统120可使用如输入到实时内容选择过程中的具有权重为20的第一关键词来选择要提供用于经由计算装置110显示的内容项对象。
数据处理系统102可包括、执行或者以其它方式与内容选择器组件118进行通信以基于关键词经由实时内容选择过程来接收和选择内容项。内容选择过程可指或者包括选择由第三方内容提供者125提供的赞助内容项对象。实时内容选择过程可包括由多个内容提供者提供的内容项被解析、处理、加权或者匹配以便选择要提供给计算装置110的一个或多个内容项的服务。内容选择器组件145可实时地执行内容选择过程。实时地执行内容选择过程可指响应于经由客户端计算装置110接收到的对内容的请求而执行内容选择过程。可在接收请求的时间间隔(例如,5秒钟、10秒钟、20秒钟、30秒钟、1分钟、2分钟、3分钟、5分钟、10分钟或20分钟)内执行(例如,发起或者完成)实时内容选择过程。可在与客户端计算装置110的通信会话期间或者在通信会话被终止之后的一定时间间隔内执行实时内容选择过程。
例如,数据处理系统120可包括被设计、构建、配置或者可操作来选择内容项对象的内容选择器组件145。为了选择用于显示的内容项,数据处理系统120可使用关键词来基于广泛匹配、确切匹配或短语匹配来选择匹配内容项。例如,内容选择器组件145可对候选内容项的主题进行分析、解析或者以其它方式处理以确定候选内容项的主题是否对应于与来自计算装置110的对内容的请求相关联的关键词或短语(例如,与web页面的主要内容或输入到搜索引擎中的搜索查询相关联的关键词)的主题。内容选择器组件145可使用图像处理技术、字符识别技术或数据库查找来对候选内容项的词项、字符、文本、符号或图像进行识别、分析或者识别。候选内容项可以包括指示候选内容项的主题的元数据,在此情况下内容选择器组件145可以对该元数据进行处理以确定候选内容项的主题是否对应于所输入的关键词。
数据处理系统120可包括、执行或者以其它方式访问聚合器组件140以聚合锚web页面。例如,网络通信路径可包括由将多个客户端计算装置110导向相同登录web页面的多个不同的锚web页面形成的多个网络通信路径。聚合器可组合所述多个锚web页面和客户端装置当中的数据以阻止系统100的内容提供者或其它管理员或用户识别锚web页面或客户端计算装置。
在一些情况下,聚合器组件140可确定与由所述多个客户端计算装置中的至少两个形成的集群相关联的属性(例如,第二属性)。例如,聚合器组件140可识别诸如计算装置的类型或位置的属性,并且形成共享相同或类似属性的计算装置的集群。数据处理系统120然后可选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从和与集群相关联的属性匹配的客户端计算装置接收到的对内容的请求而选择内容项。
在一些情况下,数据处理系统120可为数据处理系统120可能不能够访问历史执行信息的登录web页面生成关键词建议。例如,数据处理系统120可确定数据处理系统120具有网络通信路径信息的第一登录页面与第二新登录web页面类似,并且基于第一登录web页面的网络通信路径信息来选择第二登录web页面的关键词。数据处理系统120可基于提供两个登录页面的相同内容提供者、基于与两个登录页面相关联的元数据的相似性、基于对两个登录页面的语义分析或从两个登录页面的内容提供者125接收到的有关相似性的指令来确定第一和第二登录web页面是类似的。因此,数据处理系统120可相对于为第二新登录web页面生成关键词建议将第一登录web页面用作第二新登录web页面的代理。
因此,数据处理系统120可通过识别由计算装置遍历的网络通信路径以识别触发或者发起了该网络通信路径的遍历的参数来减少处理器利用、存储器利用、远程过程调用和带宽使用。该数据处理系统可基于网络通信路径数据(诸如页面推荐数据)来对针对内容提供者的关键词推荐进行加权和评分。该数据处理系统可确定来自每个锚页面的总推荐率并且将此表示为可用于对从该锚页面得到的关键词进行加权的标量值。通过使用此技术来选择关键词,该数据处理系统可方便内容项安插活动的建立和处理,从而减少附加的远程过程调用或搜索查询。
图2是用于使网络通信路径参数化的操作系统流程的图示。系统200可包括系统100、系统400或其一个或多个组件或者由系统100、系统400或其一个或多个组件来执行。该系统可包括如下三组客户端计算装置110:第一组客户端计算装置(225)、第二组客户端计算装置(226)和第三组客户端计算装置(227)。第一、第二和第三组客户端计算装置225-227可访问web页面。例如,第一组客户端计算装置225可访问第一web页面205;第二组客户端计算装置226可访问第三web页面215;并且第三组客户端计算装置227可访问第四web页面220。第一web页面205、第二web页面215和第三web页面220中的每一个可包括相应的主要内容240、241和242以及相应的补充内容250、251和252。补充内容可包括在实时内容选择处理期间由内容提供者125提供并且由内容选择器组件145选择的内容项对象。
第一web页面205可包括主要内容240,所述主要内容240包括第一关键词230、第二关键词231和第三关键词232。第一web页面205可包括链接到第二web页面210的补充内容项250。第一web页面205可被称为锚web页面并且第二web页面210可被称为登录web页面。网络通信路径260可由链接到第二web页面210的第一web页面205形成。
第三web页面215可包括主要内容241,所述主要内容241包括第四关键词233、第五关键词234和第六关键词235。第三web页面215可包括链接到第四web页面220的补充内容项251。第三web页面215可被称为第一锚web页面并且第四web页面220可被称为第二锚web页面。第四web页面220可包括主要内容242,所述主要内容242包括第7关键词236、第8关键词237和第9关键词238。第四web页面220可包括链接到第二web页面210的补充内容项252。第四web页面220可被称为锚web页面并且第二web页面210可被称为登录web页面。在一些情况下,第三web页面215和第四web页面220可菊花链在一起以形成具有两个部分261和262的网络通信路径。网络通信路径261的第一部分可包括从第三web页面261到第四web页面220的链接;并且网络通信路径262的第二部分可包括从第四web页面220到第二web页面210的链接。在一些情况下,第二组计算装置226可至少部分地与第三组计算装置227重叠,因为相同计算装置可访问第三web页面215;与补充内容项251交互;响应于与补充内容项251的交互而被导向第四web页面220;与补充内容项252交互;并且响应于与补充内容项252的交互而被导向登录web页面210。
数据处理系统120可基于关键词对于补充内容项250的接近度、从包括关键词的锚web页面(例如,205、215或220)到登录web页面210的推荐的数目以及在登录web页面210上发生的网络活动中的一个或多个来对关键词(例如,230-238)进行加权或者评分。例如,在24小时时间间隔期间对第二web页面210的总推荐者访问可以是30。30次访问中的20次可来自第一web页面205;并且30次访问中的10次可经由第四web页面220来自第三web页面215。在来自第一web页面205的20次访问之中,50%可产生转化网络活动;而在来自第三web页面215的10次访问之中,20%可产生转化网络活动。数据处理系统120可与相应的web页面上的关键词与内容项之间的距离相结合地使用此信息来确定关键词的权重、分数或其它值,并且选择所述关键词中的要输入到内容项选择过程中的一个或多个。
例如,数据处理系统120针对第一web页面205可确定第三关键词232与补充内容项250之间的距离大于第一关键词230与补充内容项250之间的距离,第一关键词230与补充内容项250之间的距离大于第二关键词231与补充内容项250之间的距离。因此,因为第二关键词231具有到补充内容项250的最短距离,所以对第一web页面205来说第二关键词231可接收基于距离的最高权重。
数据处理系统120可为第三web页面215和第四web页面220的关键词确定基于距离的权重。例如,数据处理系统120针对第三web页面215可确定第六关键词235与补充内容项251之间的距离大于第四关键词233与补充内容项251之间的距离,第四关键词233与补充内容项251之间的距离大于第五关键词234与补充内容项251之间的距离。因此,因为第五关键词234具有到补充内容项251的最短距离,所以对第三web页面215来说第五关键词234可接收基于距离的最高权重。
数据处理系统120针对第四web页面220可确定第九关键词238与补充内容项252之间的距离大于第七关键词236与补充内容项252之间的距离,第七关键词236与补充内容项252之间的距离大于第八关键词237与补充内容项252之间的距离。因此,因为第八关键词237具有到补充内容252的最短距离,所以对第四web页面220来说第八关键词237可接收基于距离的最高权重。
此外,数据处理系统120可跨越多个web页面对关键词的基于距离的权重进行比较。例如,数据处理系统120可为可跨越多个web页面比较的关键词确定归一化距离。在此示例中,数据处理系统120可确定第二关键词231与补充内容项250之间的距离(例如,归一化距离)大于第八关键词237与补充内容项252之间的距离(例如,归一化距离),第八关键词237与补充内容项252之间的距离大于第五关键词234与补充内容项251之间的距离(例如,归一化距离)。因此,因为第五关键词231与第二关键词231和第八关键词237相比具有到补充内容251的最短距离,所以数据处理系统120可相对于第一web页面205、第三web页面215和第四web页面220的关键词给第五关键词234指派基于距离的最高权重。
数据处理系统120可将基于距离的权重与基于来自web页面的推荐的数目或登录页面上的对应网络活动而生成的权重组合。数据处理系统120可基于登录web页面210上的结果得到的网络活动来对菊花链中的一个或多个web页面(例如,第三web页面215)进行加权。数据处理系统120可对第三web页面215的关键词应用权重,该权重是基于产生了从web页面220到登录页面210的推荐的来自web页面215的推荐的数目而确定的。应用于第三web页面215的关键词的权重可基于在所述时间间隔期间产生了到登录页面的推荐的推荐的总数目或比率。该比率可以是在所述时间间隔期间产生了到登录web页面210的推荐的来自第三web页面215的推荐除以从第四web页面220到第二web页面210的推荐的总数目的比率。该比率可以是在所述时间间隔期间产生了到登录web页面210的推荐的来自第三web页面215的推荐除以从第一web页面205和第四web页面220到第二web页面210的推荐的总数目的比率。该比率可以是在所述时间间隔期间产生了到登录web页面210的推荐的来自第三web页面215的推荐除以对第二web页面210的访问的总数目的比率。
图3是使网络通信路径参数化的方法的图示。该方法可包括使包括与至少一个存储器通信的至少一个处理器的网络通信路径参数化的计算机实现的方法(或数据处理系统)。方法300可经由图1、图2或图4中所图示的一个或多个系统或组件(包括例如数据处理系统、网络路径检测组件、参数化组件、内容选择器组件、数据储存库、内容提供者、内容发布者、网络、计算装置或代理)来执行。
在行为305处,数据处理系统可识别网络通信路径。数据处理系统可识别由一个或多个客户端计算装置经由网络协议遍历的一个或多个网络通信路径。网络通信路径可包括第一web页面和第二web页面。第一web页面可包括具有将一个或多个客户端计算装置导向第二web页面的超链接的内容项。在一些情况下,第一web页面可包括锚web页面,并且第二web页面可包括由内容提供者装置提供的登录web页面。
在行为310处,数据处理系统可生成权重数据结构。生成权重数据结构可包括或者指更新、操纵、修改或者以其它方式访问先前生成的权重数据结构。权重数据结构可包括存在于web页面上的关键词的标量值。数据处理系统可通过刮取web页面以识别关键词来获得关键词。数据处理系统可将所识别的关键词存储在数据储存库中。
数据处理系统可基于网络通信路径的参数以及多个关键词中的每一个对于在第一web页面上经由网络协议将所述多个客户端计算装置导向第二web页面的超链接的接近度来生成权重。参数可包括例如经由网络通信路径到登录页面的推荐的数目;或者基于经由网络通信路径到登录页面的推荐的数目和经由包括锚web页面的所有网络通信路径到登录页面的推荐的总数目的比率;或者基于经由网络通信路径到登录页面的推荐的数目和在一定时间间隔期间对登录页面的访问的总数目的比率。
权重数据结构可包括多个关键词中的每一个的值。权重可特定于关键词和登录web页面。权重可特定于关键词和内容项。例如,关键词可出现在显示导向相同登录web页面的相同内容项的多个锚web页面上。在此示例中,可针对锚web页面中的每一个来确定关键词的权重并组合以当用于选择导向相同登录web页面的任何内容项时为关键词生成总权重。在一些情况下,可针对锚web页面中的每一个来确定关键词的权重并组合以当用于选择导向相同登录web页面的相同内容项时为关键词生成总权重。
在行为315处,数据处理系统可选择内容项。数据处理系统可基于关键词选择内容项。关键词可由数据处理系统基于对所述多个关键词中的每一个的标量值的比较来选择。可向内容提供者建议在权重数据结构中具有最高标量值的关键词以用于包括在内容活动中;或者数据处理系统可将关键词自动地添加到内容活动。数据处理系统可将所选择的关键词输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择内容项。
图4是示例计算机系统400的框图。计算机系统或计算装置400可包括或者用于实现系统100或其组件,诸如数据处理系统120。计算系统400包括用于通信信息的总线405或其它通信组件以及耦合到总线405以用于对信息进行处理的处理器410或处理电路。计算系统400也可包括耦合到总线以用于对信息进行处理的一个或多个处理器410或处理电路。计算系统400也包括耦合到总线405以用于存储信息以及待由处理器410执行的指令的主存储器415,诸如随机存取存储器(RAM)或其它动态存储装置。主存储器415可以是或者包括数据储存库145。主存储器415也可被用于存储位置信息、临时变量或在由处理器410执行指令期间的其它中间信息。计算系统400还可以包括耦合到总线405以用于为处理器410存储静态信息和指令的只读存储器(ROM)420或其它静态存储装置。存储装置425(诸如固态装置、磁盘或光盘)可耦合到总线405以永久地存储信息和指令。存储装置425可包括或者为数据储存库145的一部分。
计算系统400可以经由总线405耦合到显示器435,诸如液晶显示器或有源矩阵显示器,以用于向用户显示信息。输入装置430(诸如包括字母数字键和其它键的键盘)可以耦合到总线405以便向处理器410通信信息和命令选择。输入装置430可包括触摸屏显示器435。输入装置430也可包括光标控件,诸如鼠标、轨迹球或光标方向键,以用于向处理器410通信方向信息和命令选择并且以用于控制光标在显示器435上的移动。例如,显示器435可以是图1的数据处理系统120、客户端计算装置150或其它组件的一部分。
本文中所描述的过程、系统和方法可由计算系统400响应于处理器410执行包含在主存储器415中的指令的布置来实现。可将这些指令从另一计算机可读介质(诸如存储装置425)读取到主存储器415中。包含在主存储器415中的指令的布置的执行使计算系统400执行本文中所描述的说明性过程。也可以采用多处理布置中的一个或多个处理器来执行包含在主存储器415中的指令。硬连线电路可连同本文中所描述的系统和方法一起使用代替软件指令或者与软件指令相结合地使用。本文中所描述的系统和方法不限于硬件电路和软件的任何特定组合。
尽管已经在图4中描述了示例计算系统,然而可在其它类型的数字电子电路中或者在计算机软件、固件或硬件(包括本说明书中所公开的结构及其结构等同物)中或者在它们中的一个或多个的组合中实现包括本说明书中所描述的操作的主题。
针对本文中所讨论的系统收集关于用户的个人信息或者可以利用个人信息的情形,可以给用户提供控制程序或特征是否可以收集个人信息(例如,关于用户的社交网络、社交动作或活动、用户的偏好或用户的位置的信息)或者控制是否和/或如何从内容服务器或其它数据处理系统接收可能与用户更相关的内容的机会。此外,某些数据可以在它被存储或者使用之前被以一个或多个方式匿名,使得当生成参数时个人可识别信息被移除。例如,可以使用户的身份匿名,使得对该用户来说不可确定个人可识别信息,或者可以在获得了位置信息的情况下一般化用户的地理位置(诸如到城市、邮政编码或州级别),使得不可确定用户的特定位置。因此,用户可以控制关于他自己或她自己的信息如何被收集并且由内容服务器使用。
本说明书中所描述的主题和操作可用数字电子电路或者用计算机软件、固件或硬件(包括本说明书中所公开的结构及其结构等同物)或者用它们中的一个或多个的组合加以实现。本说明书中所描述的主题可作为具体实现在一个或多个计算机存储介质上以供由数据处理设备执行或者以控制数据处理设备的操作的一个或多个计算机程序(例如,计算机程序指令的一个或多个电路)来实现。可替选地或此外,可将程序指令编码在人工生成的传播信号(例如,被生成来对信息进行编码以便发送到适合的接收器设备以供由数据处理设备执行的机器生成的电、光学或电磁信号)上。计算机存储介质可以是或者被包括在计算机可读存储装置、计算机可读存储基板、随机或串行存取存储器阵列或装置或者它们中的一个或多个的组合中。虽然计算机存储介质不是传播信号,然而计算机存储介质可以是被编码在人工生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质也可以是或者被包括在一个或多个单独的组件或介质(例如,多个CD、磁盘或其它存储装置)中。本说明书中所描述的操作可作为由数据处理设备对存储在一个或多个计算机可读存储装置上或者从其它源接收的数据执行的操作被实现。
术语“数据处理系统”、“计算装置”、“组件”或“数据处理设备”包含用于对数据进行处理的各种设备、装置和机器,作为示例包括可编程处理器、计算机、片上系统或多个可编程处理器、多个计算机、多个片上系统,或上述的组合。设备可包括专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除硬件之外,设备还可包括为所述计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或者它们中的一个或多个的组合的代码。设备和执行环境可实现各种不同的计算模型基础设施,诸如web服务、分布式计算和网格计算基础设施。网络路径检测组件120、参数化组件135、聚合器组件140、内容选择器组件145和其它数据处理系统120组件可包括或者共享一个或多个数据处理设备、系统、计算装置或处理器。
计算机程序(也被称为程序、软件、软件应用、app、脚本或代码)可用任何形式的编程语言(包括编译或解释语言)、描述性或过程语言编写,并且可按照任何形式(包括作为独立程序或者作为适合于在计算环境中使用的模块、组件、子例行程序、对象或其它单元)被部署。计算机程序可对应于文件系统中的文件。可在保持其它程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的一部分中、在专用于所述程序的单个文件中或者在多个协调文件(例如,存储一个或多个模块、子程序或代码的部分的文件)中存储计算机程序。可将计算机程序部署成在一个计算机上或在位于一个站点处或者跨越多个站点分布并且通过通信网络互连的多个计算机上执行。
本说明书中所描述的过程和逻辑流程可由执行一个或多个计算机程序的一个或多个可编程处理器(例如,数据处理系统120的组件)来执行以通过对输入数据进行操作并且生成输出来执行动作。过程和逻辑流程也可由专用逻辑电路来执行,并且设备也可作为专用逻辑电路被实现,所述专用逻辑电路例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。适合于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器装置,作为示例包括半导体存储器装置,例如,EPROM、EEPROM和闪速存储器装置;磁盘,例如,内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路来补充,或者并入专用逻辑电路。
本文中所描述的主题可被实现在计算系统中,所述计算系统包括后端组件(例如,作为数据服务器),或者包括中间件组件(例如,应用服务器),或者包括前端组件(例如,具有用户可用来与本说明书中所描述的主题交互的图形用户界面或web浏览器的客户端计算机),或者一个或多个这样的后端、中间件或前端组件的组合。本系统的组件可通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互联的网络(例如,互联网)和对等网络(例如,自组织对等网络)。
诸如系统100或系统400的计算系统可包括客户端和服务器。客户端和服务器一般地远离彼此并且通常通过通信网络(例如,网络105)交互。客户端和服务器的关系借助于在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生。服务器可向客户端装置发送数据(例如,表示内容项的数据分组)(例如,用于向与客户端装置交互的用户显示数据并且从与客户端装置交互的用户接收用户输入的目的)。在客户端装置处生成的数据(例如,用户交互的结果)可在服务器处从客户端装置接收(例如,由数据处理系统120从计算装置110或内容提供者计算装置125或内容发布者装置115接收)。
虽然按照特定次序在附图中描绘了操作,但是不要求按照所示的特定次序或按照顺序次序执行这些操作,并且不要求执行所有图示的操作。可按照不同的次序执行本文中所描述的动作。
各种系统组件的分离不要求在所有实施方式中都分离,并且可将所描述的程序组件包括在单个硬件或软件产品中。例如,网络路径检测组件130或内容选择器组件145可以是单个组件、app或程序,或者具有一个或多个处理电路的逻辑装置,或者数据处理系统120的一个或多个服务器的一部分。
在现在描述了一些说明性实施方式后,显而易见的是,已经通过示例呈现的前文是说明性的,而不是限制性的。特别地,尽管本文中所呈现的许多示例牵涉方法行为或系统元件的特定组合,然而可以以其它方式组合那些行为和那些元件以实现相同的目标。连相同个实施方式一起讨论的行为、元件和特征在其它一个或多个其它实施方式中不旨在被从类似角色排除。
本文中所使用的短语和术语用于描述的目的而不应该被认为是限制性的。“包括有”、“包括”、“具有”、“包含”、“牵涉”、“特征是”、“特征在于”及其变化在本文中的使用意在包含此后列举的项、其等同物和附加项以及由此后排他地列举的项构成的替选实施方式。在一个实施方式中,本文中所描述的系统和方法由所描述的元件、行为或组件中的一个、超过一个的每个组合或全部构成。
按照单数引用的对本文系统和方法的实施方式或元件或行为的任何引用也可以包含包括有多个这些元件的实施方式,并且在本文中对任何实施方式或元件或行为的任何复数引用也可以包含仅包括有单个元件的实施方式。单数或复数形式的引用不旨在将目前公开的系统或方法、其组件、行为或元件限于单个或多个配置。对任何行为或元件的引用基于任何信息、行为或元件可以包括该行为或元件至少部分地基于任何信息、行为或元件的实施方式。
本文中所公开的任何实施方式可以与任何其它实施方式或实施例组合,并且对“实施方式”、“一些实施方式”、“一个实施方式”等的引用不一定是相互排斥的并且旨在指示可以在至少一个实施方式或实施例中包括连同该实施方式一起描述的特定特征、结构或特性。如本文中所使用的这些术语不一定全部引用相同实施方式。任何实施方式可以包含地或排他地按照与本文中所公开的方面和实施方式一致的任何方式与任何其它实施方式组合。
对“或”的引用可以被解释为包括的,使得使用“或”所描述的任何术语可以指示所描述的术语中的单个、超过一个和全部中的任一个。例如,对“‘A’和‘B’中的至少一个”的引用可包括仅‘A’、仅‘B’以及‘A’和‘B’两者。与“包括”或其它开放术语相结合地使用的这些引用可包括附加项。
在附图、具体实施方式或任何权利要求中的技术特征后面有附图标记的情况下,附图标记已经被包括来提高附图、具体实施方式和权利要求的可理解性。因此,附图标记及其不存在均不对任何权利要求要素的范围具有任何限制性影响。
本文中所描述的系统和方法可以在不脱离其特性的情况下以其它特定形式加以具体实现。上述实施方式说明而不限制所描述的系统和方法。本文中所描述的系统和方法的范围因此由所附权利要求而不是上述描述来指示,并且落入权利要求的等价意义和范围内的改变被包含在其中。
Claims (17)
1.一种用于使网络通信路径参数化的系统,包括:
数据处理系统,所述数据处理系统包括由至少一个处理器执行的网络路径检测组件、参数化组件和内容选择器组件,所述数据处理系统用于:
识别由多个客户端计算装置经由网络协议遍历的网络通信路径,所述网络通信路径包括第一web页面和第二web页面,所述第一web页面具有带有超链接的内容项,所述超链接将所述多个客户端计算装置导向所述第二web页面;
基于所述网络通信路径的参数以及多个关键词中的每一个关键词对于在所述第一web页面上的所述超链接的接近度,来生成权重数据结构,所述权重数据结构具有所述多个关键词中每一个关键词的标量值,所述超链接经由所述网络协议将所述多个客户端计算装置导向所述第二web页面,其中所述参数包括:在一定时间间隔期间将所述多个客户端计算装置导向所述第二web页面的所述第一web页面的实例的总数目以及在一定时间间隔期间将所述多个客户端计算装置导向所述第二web页面的所述第一web页面的实例的总数目除以将多个第二客户端装置导向所述第二web页面的多个web页面的实例的总数目;以及
基于对所述多个关键词中的每一个关键词的所述标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择所述内容项。
2.根据权利要求1所述的系统,其中所述第一web页面包括锚web页面,并且所述第二web页面包括由内容提供者装置提供的登录web页面。
3.根据权利要求1所述的系统,其中所述数据处理系统进一步被配置来刮取所述第一web页面以识别所述多个关键词,并且将所述多个关键词存储在数据储存库中。
4.根据权利要求1所述的系统,其中所述数据处理系统进一步被配置来:
渲染所述第一web页面的代码;
确定所述第一web页面的所述多个关键词中的每一个关键词与包括所述超链接的所述内容项之间的距离;以及
基于所述第一web页面的所述多个关键词中的每一个关键词与所述内容项之间的所述距离来确定所述多个关键词中的每一个关键词的所述标量值。
5.根据权利要求4所述的系统,其中所述数据处理系统进一步被配置来:
基于所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的字符的数目来确定所述第一关键词与所述内容项之间的距离;以及
基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
6.根据权利要求4所述的系统,其中所述数据处理系统进一步被配置来:
基于所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的像素的数目来确定所述第一关键词与所述内容项之间的距离;以及
基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
7.根据权利要求4所述的系统,其中所述数据处理系统进一步被配置来:
确定所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的分桶距离,所述分桶距离对应于以下中的至少一个:
在阈值数目的单词内;
在相同句子内;
在相同段落内;以及
在所述第一web页面的相同折叠内;以及
基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
8.根据权利要求1所述的系统,其中所述数据处理系统进一步被配置来:
识别由第二多个客户端计算装置经由所述网络协议遍历的第二网络通信路径,所述第二网络通信路径包括第三web页面和所述第二web页面,所述第三web页面具有带有所述超链接的所述内容项,所述超链接将所述第二多个客户端计算装置导向所述第二web页面;
基于所述第二网络通信路径的第二参数以及第二多个关键词中的每一个对于在所述第三web页面上的所述超链接的接近度来生成所述权重数据结构,所述权重数据结构具有所述第二多个关键词中每一个的所述标量值,所述超链接经由所述网络协议将所述第二多个客户端计算装置导向所述第二web页面。
9.根据权利要求8所述的系统,包括所述数据处理系统以用于:
确定所述第二网络通信路径的所述第二参数大于所述网络通信路径的所述参数;以及
基于所述第二参数大于所述参数,将更大的权重指派给所述第二多个关键词。
10.根据权利要求1所述的系统,其中所述数据处理系统进一步被配置来:
确定与由所述多个客户端计算装置中的至少两个客户端计算装置形成的集群相关联的属性;以及
选择所述多个关键词中的关键词以输入到所述在线内容选择过程,用于响应于从和与所述集群相关联的所述属性匹配的所述客户端计算装置接收到的所述对内容的请求而选择所述内容项。
11.一种使网络通信路径参数化的方法,包括:
通过由包括至少一个处理器的数据处理系统所执行的网络路径检测组件来识别由多个客户端计算装置经由网络协议遍历的网络通信路径,所述网络通信路径包括第一web页面和第二web页面,所述第一web页面具有带有超链接的内容项,所述超链接将所述多个客户端计算装置导向所述第二web页面;
通过由所述数据处理系统所执行的参数化组件来基于所述网络通信路径的参数以及多个关键词中的每一个关键词对于在所述第一web页面上的所述超链接的接近度,来生成权重数据结构,所述权重数据结构具有所述多个关键词中每一个关键词的标量值,所述超链接经由所述网络协议将所述多个客户端计算装置导向所述第二web页面,其中所述参数包括:在一定时间间隔期间将所述多个客户端计算装置导向所述第二web页面的所述第一web页面的实例的总数目以及在一定时间间隔期间将所述多个客户端计算装置导向所述第二web页面的所述第一web页面的实例的总数目除以将多个第二客户端装置导向所述第二web页面的多个web页面的实例的总数目;以及
通过由所述数据处理系统所执行的内容选择器组件基于对所述多个关键词中的每一个关键词的所述标量值的比较来选择所述多个关键词中的关键词以输入到在线内容选择过程,用于响应于从客户端计算装置接收到的对内容的请求而选择所述内容项。
12.根据权利要求11所述的方法,其中所述第一web页面包括锚web页面,并且所述第二web页面包括由内容提供者装置提供的登录web页面。
13.根据权利要求11所述的方法,包括:
由所述数据处理系统刮取所述第一web页面以识别所述多个关键词,并且将所述多个关键词存储在数据储存库中。
14.根据权利要求11所述的方法,所述方法包括:
由所述数据处理系统渲染所述第一web页面的代码;
由所述数据处理系统确定所述第一web页面的所述多个关键词中的每一个关键词与包括所述超链接的所述内容项之间的距离;以及
由所述数据处理系统基于所述第一web页面的所述多个关键词中的每一个关键词与所述内容项之间的所述距离来确定所述多个关键词中的每一个关键词的所述标量值。
15.根据权利要求14所述的方法,进一步包括:
由所述数据处理系统基于所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的字符的数目来确定所述第一关键词与所述内容项之间的距离;以及
由所述数据处理系统基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
16.根据权利要求14所述的方法,新一步包括:
由所述数据处理系统基于所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的像素的数目来确定所述第一关键词与所述内容项之间的距离;以及
由所述数据处理系统基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
17.根据权利要求14所述的方法,进一步包括:
由所述数据处理系统确定所述第一web页面的所述多个关键词中的第一关键词与所述内容项之间的分桶距离,所述分桶距离对应于以下中的至少一个:
在阈值数目的单词内,
在相同句子内,
在相同段落内,以及
在所述第一web页面的相同折叠内;以及
由所述数据处理系统基于所述第一关键词与所述内容项之间的所述距离来确定每一个所述第一关键词的所述标量值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/408,861 | 2017-01-18 | ||
US15/408,861 US20180203573A1 (en) | 2017-01-18 | 2017-01-18 | Parameterizing network communication paths |
PCT/US2017/034267 WO2018136108A1 (en) | 2017-01-18 | 2017-05-24 | Parameterizing network communication paths |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109074365A CN109074365A (zh) | 2018-12-21 |
CN109074365B true CN109074365B (zh) | 2023-05-16 |
Family
ID=59014791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780000967.1A Active CN109074365B (zh) | 2017-01-18 | 2017-05-24 | 使网络通信路径参数化 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20180203573A1 (zh) |
CN (1) | CN109074365B (zh) |
WO (1) | WO2018136108A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633431B (zh) * | 2019-08-08 | 2022-05-03 | 北京大学 | 一种Web请求关联的分析方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101986297A (zh) * | 2010-10-28 | 2011-03-16 | 浙江大学 | 基于链接聚类的无障碍网页浏览方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050137939A1 (en) | 2003-12-19 | 2005-06-23 | Palo Alto Research Center Incorporated | Server-based keyword advertisement management |
US7774335B1 (en) | 2005-08-23 | 2010-08-10 | Amazon Technologies, Inc. | Method and system for determining interest levels of online content navigation paths |
US10042927B2 (en) * | 2006-04-24 | 2018-08-07 | Yeildbot Inc. | Interest keyword identification |
US7809801B1 (en) * | 2006-06-30 | 2010-10-05 | Amazon Technologies, Inc. | Method and system for keyword selection based on proximity in network trails |
US7779147B1 (en) * | 2006-06-30 | 2010-08-17 | Amazon Technologies, Inc. | Method and system for advertisement placement based on network trail proximity |
US8386509B1 (en) | 2006-06-30 | 2013-02-26 | Amazon Technologies, Inc. | Method and system for associating search keywords with interest spaces |
US7660815B1 (en) | 2006-06-30 | 2010-02-09 | Amazon Technologies, Inc. | Method and system for occurrence frequency-based scaling of navigation path weights among online content sources |
US20080256034A1 (en) | 2007-04-10 | 2008-10-16 | Chi-Chao Chang | System and method for understanding relationships between keywords and advertisements |
US8086624B1 (en) | 2007-04-17 | 2011-12-27 | Google Inc. | Determining proximity to topics of advertisements |
WO2009012466A2 (en) * | 2007-07-19 | 2009-01-22 | Google Inc. | Ad targeting using reference page information |
US8364529B1 (en) * | 2008-09-05 | 2013-01-29 | Gere Dev. Applications, LLC | Search engine optimization performance valuation |
CN103279538B (zh) * | 2013-06-03 | 2016-09-28 | 北京奇虎科技有限公司 | 预加载访问网站中网页的服务器、浏览器客户端和方法 |
CN105808590B (zh) * | 2014-12-31 | 2019-08-20 | 中国电信股份有限公司 | 搜索引擎实现方法、搜索方法以及装置 |
US10360224B2 (en) * | 2016-03-28 | 2019-07-23 | International Business Machines Corporation | Image and data capture and machine learning for automatic generation of search queries |
-
2017
- 2017-01-18 US US15/408,861 patent/US20180203573A1/en not_active Abandoned
- 2017-05-24 WO PCT/US2017/034267 patent/WO2018136108A1/en active Application Filing
- 2017-05-24 CN CN201780000967.1A patent/CN109074365B/zh active Active
-
2020
- 2020-04-14 US US16/848,046 patent/US11256853B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101986297A (zh) * | 2010-10-28 | 2011-03-16 | 浙江大学 | 基于链接聚类的无障碍网页浏览方法 |
Also Published As
Publication number | Publication date |
---|---|
US11256853B2 (en) | 2022-02-22 |
WO2018136108A1 (en) | 2018-07-26 |
US20180203573A1 (en) | 2018-07-19 |
US20200241712A1 (en) | 2020-07-30 |
CN109074365A (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9374396B2 (en) | Recommended content for an endorsement user interface | |
CN108369709B (zh) | 用于基于网络的广告数据业务时延减小的系统和方法 | |
JP5571091B2 (ja) | サーチ結果の提供 | |
US11693863B1 (en) | Query completions | |
US20190347287A1 (en) | Method for screening and injection of media content based on user preferences | |
US20160359791A1 (en) | Computerized notification system and method for delivering breaking news content | |
US20080282186A1 (en) | Keyword generation system and method for online activity | |
US20120095834A1 (en) | Systems and methods for using a behavior history of a user to augment content of a webpage | |
US20080154951A1 (en) | Link Retrofitting of Digital Media Objects | |
US10007645B2 (en) | Modifying the presentation of a content item | |
US20130054672A1 (en) | Systems and methods for contextualizing a toolbar | |
JP2015053083A (ja) | オーガニックマーケティングキャンペーンの価値を推定する方法、コンピュータ読み取り可能持続性ストレージ媒体、システム | |
US9836766B1 (en) | Customized landing pages | |
US9171045B2 (en) | Recommending queries according to mapping of query communities | |
US9767417B1 (en) | Category predictions for user behavior | |
EP2835779A1 (en) | Systems and methods of optimizing a content campaign | |
US20160098416A1 (en) | Auto complete search box based on the user's context to reduce user's input | |
US9767204B1 (en) | Category predictions identifying a search frequency | |
US10474670B1 (en) | Category predictions with browse node probabilities | |
US11392589B2 (en) | Multi-vertical entity-based search system | |
Duong | SEO management: methods and techniques to achieve success | |
US10387934B1 (en) | Method medium and system for category prediction for a changed shopping mission | |
CN104376066A (zh) | 一种网络特定内容挖掘方法和装置、及一种电子设备 | |
CN109074365B (zh) | 使网络通信路径参数化 | |
US10417286B1 (en) | Content Selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |