CN101517967B - 网站的流量预测 - Google Patents

网站的流量预测 Download PDF

Info

Publication number
CN101517967B
CN101517967B CN2006800430840A CN200680043084A CN101517967B CN 101517967 B CN101517967 B CN 101517967B CN 2006800430840 A CN2006800430840 A CN 2006800430840A CN 200680043084 A CN200680043084 A CN 200680043084A CN 101517967 B CN101517967 B CN 101517967B
Authority
CN
China
Prior art keywords
website
initial
label
traffic profile
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800430840A
Other languages
English (en)
Other versions
CN101517967A (zh
Inventor
维克托·班尼特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101517967A publication Critical patent/CN101517967A/zh
Application granted granted Critical
Publication of CN101517967B publication Critical patent/CN101517967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

流量预测组件可基于用以表征站点的标签自动产生网站的预测流量概况。可基于一组预定规则为网站选择一组初始标签。可基于一组初始标签选择初始流量概况。然后,基于一组初始标签和基于初始流量概况产生预测用户流量。

Description

网站的流量预测
技术领域
本文中所描述的实施方案一般地涉及对在线站点的用户流量的预测。
背景技术
在日益增长的网络世界中,消费者常常使用在线资源来访问信息。例如,搜索引擎是一种流行的工具,用户通过搜索引擎输入用以描述感兴趣的信息的搜索查询,并接收与搜索查询相关的文档或到文档的链接。搜索引擎可适合于特定的兴趣领域,例如通用网页搜索引擎、新闻搜索引擎或购物搜索引擎。
对于在线资源(例如搜索引擎)的操作者期望能够智能地预测关于可能参观特定网站的用户类型的信息。例如,当搜索引擎显示与特定网站链接的广告时,可使用这种类型的“流量预测”。如果搜索引擎的提供商知晓用于表征可能点击特定广告或参观由广告引用的网站的流量的一般概况(profile),则搜索引擎提供商能够侦查出不能反映真实用户兴趣的无效或非真正用户行为。例如,当搜索引擎提供商基于与广告主的网站相关的流量向广告主收费时,从真实用户行为辨别出无效用户行为(即,流量)就特别重要。在这种情况下,搜索引擎提供商希望能够从真实用户行为辨别出无效用户行为,并且仅向广告主收取真实用户行为的费用。
除了广告显示和搜索引擎的情形之外,预测用户行为在多种在线情形中都是有用的。例如,网站设计者希望预测对网站的建议修改将如何影响在网站或对网站的用户行为。
发明内容
本发明一方面涉及一种预测在网站的用户流量概况的计算机实现方法。该方法包括:基于所述网站的至少一个特征表征所述网站;基于所述网站的表征结果选择初始流量概况;和基于所述网站的表征结果和所述初始流量概况生成预测的用户流量概况。
本发明另一方面涉及一种对网站建立模型的计算机实现的方法。该方法包括:基于所述网站的特征向所述模型分配一组初始标签,所述标签中的每一个描述所述网站的至少一个特征。该方法还包括:基于所分配的所述一组初始标签确定所述网站的初始流量概况;和递归地更新所述一组标签和所述流量概况,以获得所述网站的最终预测流量概况。
附图说明
结合并构成本申请一部分的附图与说明书一起示出本发明的实施例,并解释本发明。在附图中,
图1是从总体上概念性示出根据本发明的多个方面的示例性实施方案的示图;
图2是可实施与本发明原理一致的概念的示意性系统的示图;
图3是图2中示出的计算装置中的一个的示例性示图;
图4是示出在产生网站的流量预测模型时的图2中所示的流量预测组件的示例性操作的流程图;
图5是概念性示出网站的示例性模型的产生的示图;和
图6是示出站点的预测流量概况的示例性使用的流程图。
具体实施方式
本发明的以下详细说明引用附图。该详细说明不限制本发明。
概述
根据本发明原理的实施方案基于站点的特征在网站预测流量模型。
图1是从总体上概念性示出根据本发明的多个方面的示例性实施方案的示图。其中,考虑了将用户连接到网站的网络,例如互联网110。示出3个示例性网站:在线购物站点120、通用新闻站点125、和评论新消费者计算机硬件的站点130。在多个方面中,站点120、125和130彼此不同。例如,站点120是购物性站点,而站点125和130是信息性站点。作为新闻站点的站点125可能具有比定向为计算机爱好者的站点130更广泛的访问者。站点120、125和130可能在多个附加方面彼此不同,例如在站点的布局、站点使用的颜色方案和每一站点使用的文字类型。
根据不同网站的不同特征(例如,站点120、125和130的不同特征),网页浏览者可表现出完全不同的行为。即,参观购物站点120的人的行为可能与在参观新闻站点125时不同。例如,新闻站点130可能包含更长的文章,用户读取文章的时间可能比阅读购物站点120上的产品描述的时间更长。
根据本发明的一方面,可基于与站点120、125和130相关的特征分别为站点120、125和130预测用户流量概况121、126和131。流量概况121、126和131中的每一个可从总体描述对站点的一般参观者所期望的行为。
系统描述
图2是可实施与本发明原理一致的概念的示意性系统200的示图。系统200可包括多个客户端210,这些客户端可经由网络240连接到服务器220和230。服务器220和230可包括向客户端210提供服务的装置,例如网页服务器、电子邮件服务器等。在一个实施方案中,一个或多个服务器220和230包括流量预测组件235。如将在下文中更详细描述的,流量预测组件235产生网站的用户流量概况。流量预测组件225并不是在与网络240连接的服务器上实施,而是更一般地在与网络连接或不与网络连接的任意计算装置上实施。
网络240可包括局域网(LAN)、广域网(WAN)、电话网络,例如公共交换电话网(PSTN)、企业网、互联网或这些网络的组合。为了简单,3个客户端210和2个服务器220和230示出为与网络240连接。在实践中,可存在更多客户端和/或服务器。此外,在某些情况下,客户端可执行服务器的一个或多个功能,服务器可执行客户端的一个或多个功能。
客户端210可包括一种装置(例如个人计算机、无线电话、个人数字助理(PDA)、笔记本电脑、或其它类型的计算或通信装置)、在这些装置之一上运行的线程或处理、和/或由这些装置之一可执行的对象。客户端210的用户可访问服务器220和230,或从其接收信息。
示例性计算装置构架
图3是计算装置300(例如,客户端210、服务器220和服务器230中之一)的示例性示图。计算装置300可包括总线310、处理器320、主存储器330、只读存储器(ROM)340、存储装置350、输入装置360、输出装置370和通信接口380。总线310可包括允许在计算装置300的组件之间通信的路径。
处理器320可包括任意类型处理器、微处理器或能解译和执行指令的处理逻辑。主存储器330可包括随机访问存储器(RAM)或能够存储由处理器320执行的信息和指令的其它类型动态存储装置。ROM340可包括ROM装置或能存储由处理器320所使用的静态信息和质量的其它类型静态存储装置。存储装置350可包括磁记录介质和/或光学记录介质,及其对应的驱动器。
输入装置360可包括允许用户向计算装置300输入信息的机构,例如键盘、鼠标、电子笔、语音识别和/或生物机构等。输出装置370可包括向用户输出信息的机构,包括显示器、打印机、扬声器等。通信接口380可包括能使得计算装置300与其它装置和/或系统通信的任意类似收发器的机构。例如,通信接口380可包括经由网络(例如网络240)与其它装置或系统通信的机构。
流量预测组件235可以在软件中实施,并且可存储在计算机可读介质(例如存储器330)中。计算机可读介质可定义为一个或多个物理或逻辑存储器装置和/或载波。
可经由通信接口380,可从其它计算机可读介质(例如数据存储装置350)或其它装置向存储器330中写入用以定义流量预测组件235的软件指令。在存储器330中包含的软件指令使得处理器320能够执行随后将描述的处理。或者,可使用硬连接电路来代替软件指令或与软件指令组合,以实现根据本发明的处理。因此,根据本发明原理的实施方案不限于硬件电路和软件的任意特定组合。
流量预测组件235
流量预测组件235一般地可用于以根据网站的不同的方式对网站分类,其中这些网站的不同可导致或涉及站点的不同流量概况。作为这里所使用的短语,站点的流量概况指的是趋向于表征网站的用户的任意一组数据,或用户在站点所趋向的行为的任意一组数据。可包括在流量概况中的要素实例包括:典型用户将在站点花费多长时间、典型用户将在站点中点击多“深”或多少链接、典型用户的屏幕大小、典型用户的浏览器类型、或用户人口统计信息。
图4是示出在产生网站的流量预测模型时的流量预测组件235的示例性操作的流程图。可通过用以描述站点各方面的多个标记或标签来描述网站(即,分类)。可为网站探试式(heuristically)确定用以描述站点的一组初始标签(操作401)。例如,可使用一组预定规则来产生这组初始标签。
基于用以描述网站的初始标签,可确定站点的初始流量概况(操作402)。初始流量概况可基于在与被建立模型的站点类似的站点所观察的流量概况。初始标签可用于确定哪个站点与被建立模型的站点类似。
然后,网站标签和流量概况可递归修改,直到流量概况和站点标签稳定(操作403)。最后的一组站点标签和最后的流量概况可看作由流量预测组件235产生的站点模型。由该模型所描述的流量概况代表网站的所预测流量概况。
图5是概念性示出网站的模型500(例如,如图4中所示的操作产生的模型)的产生的示图。模型500可包括用以描述或分类站点的一组描述性标签510。一般地,为了分类网站的目的而产生描述性标签510,因此不同网站涉及不同的流量概况。可能有许多不同标签。可使用的实例性标签包括:用以指示由站点所使用的主要语言(例如英语、法语等)的标签;用以按类型或意图来分类站点(例如购物站点或新闻站点)的标签;用以按行业类别来分类站点(例如以计算机爱好者为目标的站点或以房屋承包者为目标的站点)的标签;涉及站点的主机的地理位置的标签;用以指示(购物站点的)待售产品的平均价格的标签;或用以表征站点的超文本标记语言(HTML)布局的标签,例如涉及作为文本或图像的站点视觉布局的一部分的标签。本领域普通技术人员将认可,可以使用额外标签。
可基于探试式信号515设置站点的初始描述性标签。一般地,探试式信号515可包括用于设定在这组描述性标签510中的一个或多个标签的预定规则。探试式信号515可包括例如目录信息信号516,其可基于网站的已知目录设置用以反映网站的类别的标签。可使用的一个这样的网站的已知目录是The Open Directory Project(http://dmoz.org/),其是使用分级目录结构对网站分类的网页人工编译目录。探试式信号515可额外地包括基于网页的词汇分析的信号517。信号517例如可用于设置用以表征由站点所使用的主要语言,或由站点所使用的文字类型的标签(例如,站点是否使用许多技术术语的指示)。探试式信号515可额外地包括基于网站的地理特征的信号518,例如由网站的IP地址所确定的网站主机的位置。可设置一个或多个标签,以定义网站的地理位置。探试式信号515的上述实例是示例性的,本领域普通技术人员将认可,其它探试式信号也可用于产生标签。例如,基于来自与被建立模型的站点链接的站点的文本的探试式信号可用于产生标签。例如,如果一个站点与许多已知购物站点(或其它类型站点)链接,则可设置标签。作为探试式信号515的另一实例,网页的设计可以与网页是否为示例性特定类型站点匹配。例如,具有包含图像、描述和价格的许多网页的网站可能是在线商店。
模型500可额外地包括用以描述或分类站点的流量概况520。流量概况520可包括用以表征在站点的(包含流量行为的)期望流量的值或标签。流量概况520可包括例如以下值:典型用户将在站点花费多长时间、典型用户将在站点中点击多“深”或多少链接、典型用户的屏幕大小、典型用户的浏览器类型、或典型用户统计信息。
可初始设置流量概况520,以反映所估测的流量概况521。可基于在具有与一组初始的描述性标签510类似的一组描述性标签的另一站点的流量的已知流量概况来设置初始流量概况521。例如,如果被建立模型的站点是购物站点,则初始估测的流量概况521可以是来自另一购物站点的已知(即,观察的)流量概况。
可执行操作403的递归分析,以更新所述一组描述性标签510和流量概括520。在一实施方案中,描述性标签510可被随机更新。例如,可潜在应用于网站的(基于流量概况520)的标签的出现被跟踪,并且如果标签出现的足够频繁,则可认为,所述标签从统计方面可能应用于网站。相反,不频繁出现的标签可认为是不应用于网站的虚假标签。
作为实践模型500的实例,考虑用以比较不同汽油卖家的优点的网站。该站点是产品比较站点,尽管在该站点上的用户行为可能与在对用户可能直接在线购买的产品相比较的产品比较站点上的用户行为明显不同。即,用户不浏览用于寻找要卖产品的汽油卖家比较站点,而是浏览在该站点上可用的信息。在这一实例中,站点的流量概况可能与用以比较或提供除了其它产品比较站点之外的不同公司的相关信息类似的站点。当在该站点实践时,模型500趋向于产生与用以比较或提供不同公司的相关信息的站点一致的流量概况。
作为训练模型500的另一实例,考虑新闻网站。对新闻网站的参观者趋向于将他们的焦点放在特定文章上,并通读这些特定文章,直到他们完成了文章的文本的阅读为止。这种行为可以与产品比较站点的流量形成对比,在该站点,一旦用户找到了满足他们需要的产品,则他们很可能停止阅读特定产品页面。在新闻站点上训练时,模型500将倾向于产生与例如这种行为差异一致的流量概况。
通过流量预测组件235产生的模型的示例性使用
现在将描述模型500的特定使用实例。如先前所述,流量预测组件235可用于自动训练模型500,以获得站点的期望流量概况,而不需要在站点进行流量的物理测量或观察。可以以多种方式使用站点的所预测流量概况。
图6是示出站点的预测流量概况的示例性使用的流程图。如图所示,例如可通过接收或识别站点的URL来识别所关心的站点(操作601)。URL可用于查询站点的预测流量概况(操作602),例如由流量预测组件235先前产生的流量概况。然后,在预定时间帧观察站点的实际流量概况(操作603)。可将实际流量概况与所观察的流量概况相比较,并根据多个阈值作出关于实际流量概况是否与预测流量概况不同的判断(操作604)。如果是,则这可能是站点的实际流量不真实的指示(操作605)。
期望检测不真实流量的一个实例出现在在线广告的情况下。广告主可基于“点进”广告主的网站的广告的用户个数来付费,以显示他们的广告。广告主期望仅为真实的点进(即,由真实地对该广告感兴趣的人类用户的点进)付费。由自动程序或由不是实际上对广告感兴趣的恶意用户的广告点进将趋向于产生与预测流量概况不匹配的流量概况。
如流量预测组件235所判定的,使用预测流量概况520的另一方式是通过使用与用户可能在该站点花费的时间相关的预测信息来优化向用户显示的广告。例如,可基于用户期望浏览该站点的时间的量,向用户循环不同的广告。
网页设计者可使用浏览预测组件235来预测用户如何与不同网页布局交互。预测用户可能如何与页面交互可有助于设计者在页面中部署单元。
流量预测组件235的另一用途是在网页服务器负载平衡的领域中。预测用户将如何与网站交互可用于智能管理站点的负载平衡,例如通过智能预提取或延迟图像负载,直到用户期望请求为止。
结论
如上所述的流量预测组件235可用于基于用以表征站点的标签来自动产生预测流量概况。所述标签可包括例如用以指示与该站点相关的行业以及站点的期望用途的标签。可基于预定探试式方式自动发送这些标签。
本发明示例性实施例的以上描述提供了示例和描述,但并没有穷尽或将本发明限制在所公开的精确形式。可以根据以上教导或可以从本发明实践获得修改和改变。
例如,尽管参照图4和图6描述了一系列操作,但是这些操作的顺序在根据本发明的其它实施方案中可以改变。此外,可以并行实现非依赖性的操作。
本领域普通技术人员清楚的是,如上所述的本发明的多个方面可以以如在附图中所示的实施方案中的许多不同形式的软件、固件和硬件来实现。用于实施根据本发明原理的多个方面的实际软件编码或专用控制硬件不限制本发明。因此,在没有引用专用软件代码的情况下描述了本发明的多个方面的操作和行为——本领域普通技术人员可以理解,能够设计软件和控制硬件,以实施基于这里描述的多个方面。
此外,本发明的某些部分可以作为用以执行一个或多个功能的“逻辑”或“组件”来实现。这种逻辑或组件可包括硬件(例如专用集成电路或场可编程栅极阵列)、软件或硬件和软件的组合。
本发明的说明书中所使用的单元、操作或指令不应理解为对本发明的重要的或基本的,除非这里清楚的描述。并且,如此处所使用的,不加数量限制的项旨在包括一个或者多个项。在仅仅指一个项的地方,使用了术语“一个”或者类似表述。此外,短语“基于”指的是“至少部分地基于”,除非清楚说明。

Claims (21)

1.一种预测在网站上的用户流量概况的计算机实现的方法,所述方法包括以下步骤:
基于所述网站的至少一个特征,通过使用描述所述网站的所述至少一个特征的多个标签来表征所述网站;
使用所述多个标签来确定与所述网站相类似的另一个网站;
基于在所述另一个网站观察到的流量概况选择用于所述网站的初始流量概况;以及
基于对所述网站的表征和所述初始流量概况在所述网站生成预测的用户流量概况。
2.根据权利要求1所述的方法,其中选择所述初始流量概况的步骤包括:选择与所述另一网站相关联的初始流量概况,其中所述另一网站与类似于所述网站的所述多个标签的第二多个标签相关联。
3.根据权利要求1所述的方法,其中生成所述预测的用户流量概况的步骤包括:递归更新所述多个标签和所述预测的用户流量概况。
4.根据权利要求1所述的方法,其中所述多个标签包括:涉及所述网站的期望用途的标签。
5.根据权利要求1所述的方法,其中所述多个标签包括:涉及所述网站的行业类别的标签。
6.根据权利要求1所述的方法,其中所述多个标签包括以下标签中的至少一个:
指示由所述网站使用的主要语言的标签;
涉及所述网站的主机的地理位置的标签;或
涉及所述网站的视觉布局的标签。
7.根据权利要求1所述的方法,其中所述预测的用户流量概况包括:对典型用户将在所述网站花费多长时间进行估测的值。
8.根据权利要求1所述的方法,其中所述预测的用户流量概况包括:对典型用户将在所述网站选择多少链接进行估测的值。
9.根据权利要求1所述的方法,其中所述预测的用户流量概况包括:对典型用户的屏幕大小或典型用户的浏览器类型进行估测的值。
10.根据权利要求1所述的方法,还包括:
探试式确定用于所述多个标签的初始值。
11.一种对网站建立模型的计算机实现的方法,所述方法包括以下步骤:
基于所述网站的特征向所述网站分配一组初始标签,所述标签中的每一个描述所述网站的至少一个特征;
使用所述一组初始标签来确定与所述网站相类似的另一个网站;
基于所述另一个网站的流量概况确定所述网站的初始流量概况;以及
递归更新所述一组初始标签和所述初始流量概况,以获得所述网站的最终预测的流量概况。
12.根据权利要求11所述的方法,其中确定所述网站的初始流量概况的步骤包括:基于所观察到的来自所述另一网站的流量概况确定所述初始流量概况。
13.根据权利要求11所述的方法,其中确定所述初始流量概况的步骤包括:从所述另一网站选择所述初始流量概况,其中所述另一网站与类似于所述一组初始标签的第二组标签相关联。
14.根据权利要求12所述的方法,其中所述一组初始标签包括:涉及所述网站的期望用途的标签。
15.根据权利要求11所述的方法,其中所述一组初始标签包括:涉及所述网站的行业类别的标签。
16.根据权利要求11所述的方法,其中所述一组初始标签包括以下标签中的至少一个:
指示由所述网站使用的主要语言的标签;
涉及所述网站的主机的地理位置的标签;或
涉及所述网站的视觉布局的标签。
17.根据权利要求11所述的方法,其中所述初始流量概况包括:对典型用户将在所述网站花费多长时间进行估测的值。
18.根据权利要求11所述的方法,其中所述初始流量概况包括:对典型用户将在所述网站选择多少链接进行估测的值。
19.根据权利要求11所述的方法,其中所述初始流量概况包括:对典型用户的屏幕大小或典型用户的浏览器类型进行估测的值。
20.一种预测在网站上的用户流量概况的设备,所述设备包括:
基于所述网站的特征向所述网站的模型分配一组初始标签的装置,所述标签中的每一个描述所述网站的至少一个特征;
使用所述一组初始标签来确定与所述网站相类似的另一个网站的装置;
用于基于所述另一个网站的流量概况确定所述网站的初始流量概况的装置;和
递归更新所述一组初始标签和所述初始流量概况,以获得所述网站的最终预测的流量概况的装置。
21.一种预测在网站上的用户流量概况的计算机实现的方法,所述方法包括:
基于一组预定规则确定用以表征所述网站的至少一个特征的一组初始标签,所述一组初始标签包括:涉及所述网站的期望用途的标签或涉及所述网站的行业类别的标签;
将所述一组初始标签与为其它网站确定的标签进行比较,以定位具有类似于所述一组初始标签的标签的第二网站;
使用所述第二网站的流量概况作为所述网站的初始流量概况;
递归更新所述初始流量概况和所述一组初始标签,以生成所述网站的模型;
使用所述模型,以预测在所述网站上的流量;
比较所预测的流量与观察到的流量;以及
当所观察到的流量与所预测的流量不相匹配时,输出信号。
CN2006800430840A 2005-09-19 2006-09-18 网站的流量预测 Active CN101517967B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/228,217 US8670319B2 (en) 2005-09-19 2005-09-19 Traffic prediction for web sites
US11/228,217 2005-09-19
PCT/US2006/036470 WO2007035727A2 (en) 2005-09-19 2006-09-18 Traffic prediction for web sites

Publications (2)

Publication Number Publication Date
CN101517967A CN101517967A (zh) 2009-08-26
CN101517967B true CN101517967B (zh) 2013-07-10

Family

ID=37889465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800430840A Active CN101517967B (zh) 2005-09-19 2006-09-18 网站的流量预测

Country Status (5)

Country Link
US (2) US8670319B2 (zh)
CN (1) CN101517967B (zh)
AU (1) AU2006292261B2 (zh)
CA (1) CA2623773A1 (zh)
WO (1) WO2007035727A2 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8095589B2 (en) 2002-03-07 2012-01-10 Compete, Inc. Clickstream analysis methods and systems
US10296919B2 (en) 2002-03-07 2019-05-21 Comscore, Inc. System and method of a click event data collection platform
US9105028B2 (en) 2005-08-10 2015-08-11 Compete, Inc. Monitoring clickstream behavior of viewers of online advertisements and search results
US8209406B2 (en) * 2005-10-28 2012-06-26 Adobe Systems Incorporated Assessment of click or traffic quality
US20090198559A1 (en) * 2008-02-06 2009-08-06 Disney Enterprises, Inc. Multi-resolutional forecasting system
US20090327168A1 (en) * 2008-06-26 2009-12-31 Yahoo! Inc. Playful incentive for labeling content
US8363654B2 (en) * 2008-11-07 2013-01-29 Hewlett-Packard Development Company, L.P. Predictive packet forwarding for a network switch
US8271517B2 (en) * 2008-12-09 2012-09-18 International Business Machines Corporation Presentation of websites to a computer user
KR101010997B1 (ko) * 2009-03-24 2011-01-26 한국과학기술원 다종 웹 서버 간 유사 사용자 추출 시스템 및 그 방법
US9900395B2 (en) * 2012-01-27 2018-02-20 Comscore, Inc. Dynamic normalization of internet traffic
US10373177B2 (en) 2013-02-07 2019-08-06 [24] 7 .ai, Inc. Dynamic prediction of online shopper's intent using a combination of prediction models
CN104217091B (zh) * 2013-06-05 2016-12-28 北京齐尔布莱特科技有限公司 一种基于历史走势权重的网站访问量预测方法
US10275795B1 (en) * 2013-10-16 2019-04-30 Outbrain Inc. System and method for ranking, allocation and pricing of content recommendations
US9509768B2 (en) * 2014-05-08 2016-11-29 Facebook, Inc. Associating user interactions across multiple applications on a client device
US9813259B2 (en) * 2014-05-13 2017-11-07 Cisco Technology, Inc. Probing available bandwidth along a network path
CN104503842B (zh) * 2014-12-22 2018-05-04 广州品唯软件有限公司 基于多层分流实验框架的策略执行方法和装置
US9747648B2 (en) * 2015-01-20 2017-08-29 Kuo-Chun Fang Systems and methods for publishing data on social media websites
US9978018B2 (en) * 2015-04-22 2018-05-22 Aeris Communications, Inc. Method and system for optimizing execution of user commands in relation to power management
CN105279533B (zh) * 2015-10-28 2018-12-21 上汽通用汽车有限公司 一种车辆用户标签管理方法及系统
US10997524B2 (en) * 2016-08-01 2021-05-04 Adobe Inc. Predicting a number of links an email campaign recipient will open
CN109275045B (zh) * 2018-09-06 2020-12-25 东南大学 基于dfi的移动端加密视频广告流量识别方法
US11012336B2 (en) * 2019-02-26 2021-05-18 Intel Corporation Techniques to monitor control plane network traffic
CN113240487B (zh) * 2021-05-11 2024-07-19 北京沃东天骏信息技术有限公司 流量调控方法和装置
US12040914B2 (en) * 2021-12-31 2024-07-16 Samsung Electronics Co., Ltd. System and method for detecting network services based on network traffic using machine learning

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796952A (en) * 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
CN1658576A (zh) * 2005-03-09 2005-08-24 中山大学 一种大型网站数据流的检测与防御方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873109A (en) 1996-06-03 1999-02-16 High; Clifford R. Device and method for displaying text of an electronic document on a screen in real time
US5870559A (en) * 1996-10-15 1999-02-09 Mercury Interactive Software system and associated methods for facilitating the analysis and management of web sites
US6278966B1 (en) 1998-06-18 2001-08-21 International Business Machines Corporation Method and system for emulating web site traffic to identify web site usage patterns
US6510462B2 (en) * 1998-09-01 2003-01-21 Nielsen Media Research, Inc. Collection of images in Web use reporting system
US6338066B1 (en) 1998-09-25 2002-01-08 International Business Machines Corporation Surfaid predictor: web-based system for predicting surfer behavior
SE515805C2 (sv) 1998-12-23 2001-10-08 Tomas Dalstroem Anordning för att understödja läsning av en text från ett visningsorgan
JP3942760B2 (ja) * 1999-02-03 2007-07-11 富士通株式会社 情報収集装置
US7386426B1 (en) * 1999-04-30 2008-06-10 Smartsignal Corporation Method and system for nonlinear state estimation
SE518881C2 (sv) 2000-01-20 2002-12-03 Tomas Dalstroem Anordning och datorprogram för att understödja läsning av en text
US6801945B2 (en) 2000-02-04 2004-10-05 Yahoo ! Inc. Systems and methods for predicting traffic on internet sites
US20020133605A1 (en) * 2001-03-19 2002-09-19 Alok Khanna Generation and use of rules for reading of data for online account aggregation
EP1260914A1 (en) 2001-05-23 2002-11-27 Mediabricks Ab A method for optimizing utilization of client capacity
US7149704B2 (en) * 2001-06-29 2006-12-12 Claria Corporation System, method and computer program product for collecting information about a network user
US6690365B2 (en) 2001-08-29 2004-02-10 Microsoft Corporation Automatic scrolling
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US6810356B1 (en) * 2002-08-30 2004-10-26 Advertising.Com Traffic estimation
US7386611B2 (en) * 2002-12-10 2008-06-10 International Business Machines Corporation Apparatus and methods for co-location and offloading of web site traffic based on traffic pattern recognition
US20060224445A1 (en) * 2005-03-30 2006-10-05 Brian Axe Adjusting an advertising cost, such as a per-ad impression cost, using a likelihood that the ad will be sensed or perceived by users

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796952A (en) * 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
CN1658576A (zh) * 2005-03-09 2005-08-24 中山大学 一种大型网站数据流的检测与防御方法

Also Published As

Publication number Publication date
US20140149333A1 (en) 2014-05-29
US9058562B2 (en) 2015-06-16
CA2623773A1 (en) 2007-03-29
AU2006292261B2 (en) 2010-05-13
AU2006292261A1 (en) 2007-03-29
US20070078958A1 (en) 2007-04-05
WO2007035727A3 (en) 2009-05-07
WO2007035727A2 (en) 2007-03-29
US8670319B2 (en) 2014-03-11
CN101517967A (zh) 2009-08-26

Similar Documents

Publication Publication Date Title
CN101517967B (zh) 网站的流量预测
US11822613B2 (en) Using visitor context and web page features to select web pages for display
Sismeiro et al. Modeling purchase behavior at an e-commerce web site: A task-completion approach
US9576251B2 (en) Method and system for processing web activity data
KR100852034B1 (ko) 분배형 데이터베이스의 문서를 분류하고 제시하기 위한 방법 및 장치
KR102219344B1 (ko) 자동 광고 대행 서버, 자동으로 광고 매체를 위한 캠페인 정보를 생성하여 광고의 집행을 대행하는 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램
US20140222503A1 (en) Dynamic prediction of online shopper's intent using a combination of prediction models
US8185535B2 (en) Methods and systems for determining unknowns in collaborative filtering
KR102191486B1 (ko) 자동 광고 대행 서버, 자동으로 광고 매체를 위한 캠페인 정보를 생성하여 광고의 집행을 대행하는 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램
US8843619B2 (en) System and method for monitoring visits to a target site
CN101390119A (zh) 从所观察的用户行为估计广告质量
TW200912789A (en) Granular data for behavioral targeting
KR20110048065A (ko) 사용자 소셜 정보를 사용하는 온라인 광고를 위한 시스템 및 방법
CN102456044B (zh) 推送信息的方法与系统
CN107507041A (zh) 用户模型的构建方法和构建装置
CN109446431A (zh) 用于信息推荐的方法、装置、介质、和计算设备
Ghose et al. Surviving social media overload: Predicting consumer footprints on product search engines
CN117573973A (zh) 资源推荐方法、装置、电子设备以及存储介质
KR101483618B1 (ko) 웹페이지의 쿠키정보 및 리퍼러 기록을 이용한 광고 서비스 시스템 및 방법
Gupta et al. Click-through rate estimation using CHAID classification tree model
JP2009237824A (ja) 情報分析装置、情報分析方法、及び情報分析プログラム
Sponder et al. Search Engines and the Internet
KR20180058287A (ko) 인터넷 광고 및 이와 연계된 컨텐츠 제공 방법 및 시스템
KR101380946B1 (ko) 웹 사이트 정보에 기반한 광고 서비스 시스템 및 방법
CN115374365A (zh) 信息推荐方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder