CN203206260U - 用于流量分析的系统和方法 - Google Patents

用于流量分析的系统和方法 Download PDF

Info

Publication number
CN203206260U
CN203206260U CN2011900007335U CN201190000733U CN203206260U CN 203206260 U CN203206260 U CN 203206260U CN 2011900007335 U CN2011900007335 U CN 2011900007335U CN 201190000733 U CN201190000733 U CN 201190000733U CN 203206260 U CN203206260 U CN 203206260U
Authority
CN
China
Prior art keywords
user terminal
webpage
data
questionnaire
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011900007335U
Other languages
English (en)
Inventor
托马斯·韦恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ONLINE USERFACTS AS
Original Assignee
ONLINE USERFACTS AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ONLINE USERFACTS AS filed Critical ONLINE USERFACTS AS
Application granted granted Critical
Publication of CN203206260U publication Critical patent/CN203206260U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/062Generation of reports related to network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/564Enhancement of application control based on intercepted application data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种用于流量分析的系统,包括分析仪(100)、内容源(200)和用户终端(300)及认证机制,认证机制允许或拒绝分析仪连接在内容源和用户终端之间的流量流中。分析仪(100)包括:用于存储至少一部分的流量的存储装置(110),和使用所记录的流量数据来生成问卷(120)的问卷生成器,所述问卷(120)具有只与用户终端(300)访问的服务和/或内容有关的问题。响应(130)可包括由用户填充的参数值和/或由用户终端(300)填充的参数值。来自多个用户终端(300)的流量数据和响应(130)可以被存储,用于以后的分析。也描述了本实用新型的程序和优选方面。

Description

用于流量分析的系统和方法
技术领域
本发明涉及用于流量分析的系统和方法。具体地,其公开了包括分析仪、内容源和用户终端的用于数据流量分析的系统。还公开了用于内容源和用户终端之间的数据流量的数据流量分析的方法。
背景技术
服务和/或内容的供应方在电信网络中产生流量。该流量由用户终端接收。该说明书中涵盖的服务和内容可以是基于电话的,诸如来自客户服务部的服务、或由语音生成器朗读的账单,可以是基于因特网的,诸如来自web服务器的HTML、XML或java代码或基于视频的,诸如实时多播、广播和视频点播等。各种类型的数据源自然地适应于递送的服务和/或内容,但是针对本说明书的目的,经由网络发送数据的任何设备被称为“内容源”。术语“用户终端”类似地用于描述从例如电信网络接收流量例如服务和/或内容的任何设备。在本说明书中,术语“用户终端”因此包括电话、移动电话、具有web浏览器的计算机、VCR和能够从电信网络接收数据的任何其他设备。
请注意某些用户终端,即具有浏览器的计算机,与某些内容源,诸如具有Web服务器的计算机可具有共同的几个特征。在这些情况下,术语“用户终端”和“内容源”用于规定它们在网络中起哪些作用,且发送和/或接收数据的任何已知的技术设备或其他类型的装备被这样术语覆盖。
服务和/或内容的供应方将不时地需要分析与提供的服务和/或内容相关的流量。流量分析的目的可以是例如测量一种形式或另一种形式的性能,例如,以确定内容源的大小和/或基于测量的性能修改流量和/或测量用户对新内容或新服务的响应。“性能”应该被广泛地诠释且可例如包括响应时间、可读性(代码质量)、用户对网页等的主观感受等。在一些应用中,因此,除技术参数之外,其是关于测量用户对内容或服务的主观感受。
任何统计分析搜集表示在许多(下文为N)相互独立的实验中的一个或几个变量或参数的数据。然后可例如测试不同的假设和/或估计每个参数对总体结果的影响。
电信流量表示相当大数量的数据,特别是如果内容源和一个或多个(同时)用户终端/用户之间的每个会话的几个参数要被寄存、存储和分析时。
第一高级别的服务实例可以是网站或有线电视提供商递送的视频点播服务。假设提供商希望在预定的时间限制内将视频显示给用户,且假设通过网络的实际数据速度足够用户不间断地看到视频,同时视频的其余部分被下载到后台。这种服务的提供商将有兴趣测量各种参数,诸如例如初始加载时间和中断次数。这些和其他参数可从用户终端获得,而无需用户的参与。另外的需要是从用户终端的有代表性的样本获得数据以编辑相关统计资料。
第二高级别的服务实例是“社交媒体”服务,其中用户自己向服务提供姓名、年龄、性别和其他信息。这些信息稍后会用于呈现有针对性的广告。广告的价值将为广告商提升,因为广告被呈现给选定的目标用户,实际上假设例如十几岁的女孩与中年男性没有看到相同的广告和反之亦然,使得用户觉察到广告信息比它们以其他方式出现更具相关性。为了吸引大量的读者,服务和网站需要被感觉到尽可能地相关、有用和/或吸引人。如果网站包含大量不相关的广告和其他被用户视为噪声的元素,吸引力的目标将失败。服务提供商在这种情况下可能希望测量普通用户在该网站停留多久,网站在不同浏览器中的实际面目怎样和/或用户对广告和其他网站内容的主观感受。
谷歌分析(Google Analytics)是记录用户如何使用网站的工具。日志可以相应地在几个方面,诸如显示用户来自哪儿,用户访问了网站上的哪些网页,用户在任何给定的网页上待了多久等进行分析。该系统是目前最常见的web分析工具之一,其基于技术跟踪日志提供了web用户使用网站的定量分析。
分析高级别流量数据提供了继承的挑战。例如,登记哪些网页被发送到哪些用户,记录电话谈话及其他相关的用户行为可能与国家法规和供应商的隐私政策相冲突。同时重要的是,确保来自一个群体的有代表性的样本容量提供可靠的分析。
未授权的以分析为目的的使用所谓的间谍软件跟踪用户的因特网行为并发送主动提供的广告,所谓的垃圾邮件,是一个众所周知的问题。这种未授权的用户跟踪顶多被负面地觉察到并可被用于欺诈或其他犯罪目的。内容和/或服务的专业供应商通常将不想与这些活动相关联。
涉及高级别流量的给定数量的动态参数不必与分析流量相关。例如,分析到达和来自特定的网站的流量可能与一个给定的研究相关,而其他更成熟的和/或已被证明的网站可能是不相关的。为了简化分析并提高精度,这些不相关的参数可在研究的收集阶段被过滤掉,而不是首先保存数据然后在分析阶段将其舍弃。
在下文中,术语“一个问题”用于描述对给定的网页、网站或服务的给定(统计)参数的请求。从两个不同的服务请求同一参数即响应时间,因此是两个不同的问题。类似地,请求两个不同的参数,即一个服务的响应时间和用户的主观感受,是两个单独的问题。这些问题的集合体在下文中称为“问卷”。应该注意在这种“调查”中询问的一些参数值,例如响应时间和其他时间值、代码质量等,可通过用户终端而不需用户参与来部分地填写,而其他参数值,诸如网页上的内容的主观感受,必须由用户提供。在这两种情况下,返回的响应将从用户终端获得。
所提供的发明的一个目的因此是提供一种避免在已知技术中发现的前述问题的解决方案,即实现在内容源和用户终端之间的代表性高级别流量的解决方案,其中解决了隐私和/或匿名问题。
所提供的发明的另一方面是通过从不相关的参数中去除噪声来提高分析的准确度。
发明内容
根据本发明,这通过提供用于流量分析的系统来实现,所述系统包括分析仪、内容源和由授权机制规定的用户终端,所述授权机制适于允许或拒绝分析仪存在于内容源和用户终端之间的流量流中,且其中分析仪包括用来存储至少部分的流量的存储设备及问卷生成器和通信设备,所述问卷生成器使用流量数据作为输入及使用只请求基于所提到的流量数据的有关参数的问卷作为输出,所述通信设备用于获得来自用户终端的响应,其中响应是基于问卷的。
根据本发明的一个方面,该系统还包括用于采集和分析许多用户响应的装置。
根据本发明的另一个方面,问卷生成器与包括为有序对{服务,参数}的形式的多个问题的数据库逻辑连接,其中服务表示可成为分析的主题的服务和/或内容,及参数表示服务的测量参数,同时,所述集合包括将要进行分析的服务的所有值及每个服务至少一个参数。
根据本发明的又一个方面,该系统还包括用于进行逻辑测试的条件测试装置,其中网页表示输入数据及输出表示路由到用户终端的原始网页,或输出表示路由到用户终端的改变的网页。条件测试装置可以由在数据流量分析之前由供应商设置的系统参数组成。
本发明包括另一个方面,用于内容源和用户终端之间的流量的流量分析的方法,其由以下步骤规定:获得对流量数据的收集和存储的授权,当且仅当获得授权时,将分析仪连接在内容源和用户终端之间以将至少一些流量记录和保存在分析仪上,使用所记录的流量数据来生成基于流量的问卷,并使用问卷获得来自用户终端的反馈。
代表性的数据可以通过各种形式的授权来确保,例如,用户小组(user-panel),其中用户可能会允许全面的数据收集以换取奖励,或供应商授权其中可能无法识别各个用户的数据捕获。通过使用仅捕获有关的数据或参数的问卷来确保相关性。不相关的参数没有被包括在发送到用户终端的参数集合中,因此在随后的分析中不会产生噪声。
根据本发明的一个方面,分析结果用于在额外的分析中调整相关参数的选择,即问卷。
根据本发明的另一个方面,所述方法进一步包括采集和分析多个响应。
根据本发明的又一个方面,所述方法进一步包括基于用户响应建立具有节点和边的图形(graph),其中网页作为节点,而边表示网页之间的数据流量,其中每个节点和每条边包括至少一个属性。
根据本发明的又一个方面,所述方法进一步包括修改问题,并使用可能的问题更新集合。
根据本发明的又一个方面,记录流量数据的方法包括:
-从内容源接收网页;
-将相对地址转换为绝对地址;
-将网页的所有元素存储在分析仪中,及
-将网页从分析仪转发到用户终端。
根据本发明的又一方面,所述方法进一步包括以图像格式生成所接收的网页的图示。根据该方法的这个方面,该方法进一步包括对网页上的可执行代码进行解码以生成静态的XML代码供呈现。
根据本发明的又一个方面,该方法还包括以下步骤:
进行条件逻辑测试,其中网页表示输入数据及输出表示路由到用户终端的原始网页,或
输出表示路由到用户终端的改变的网页。
附图描述
下文将参考附图来描述本发明,在附图中,
图1是根据本发明的系统的一个方面的示意性表示,
图2示出了授权机制,
图3a图示了收集和呈现数据的图,
图3b图示了图中的数据的可替代的表示,
图4图示了问卷生成器的原理,
图5示出了用于收集数据的方法,
图6示出了反馈回路,
图7示出了用于基于web的内容的分析仪100的一个使用方面,及
图8示出了由供应商做出的对用户网页上的内容的更改的实例。
用于实现本发明的方式
图1是本发明的一个方面的示意性表示,其中用于流量分析的系统包括分析仪100、内容源200和用户终端300。内容源200可通过网络诸如因特网或内联网在逻辑连接101上向用户终端300递送能够被人们理解的内容,诸如网页、视频和/或音频。如在引言中提到的,用户终端300可以为能够从源200接收内容的任何设备,例如,PC、TV解码器、移动电话或能够接收和显示/播放出以容易被人们理解的形式的文本、图形、视频和/或声音的手持设备。如在引言中提到的,内容源200和用户终端300两者都是公知的设备,因此不在该部分进行详细描述。
授权机制适于允许或拒绝在内容源和用户终端之间的流量流中出现分析仪100。图1假设已获得授权。从源200到用户终端300的流量流102流过分析仪100。这在图1中通过画为虚线的初始逻辑连接101示出,而通过分析仪100的连接102被画为实线。连接101和102为在例如协议栈的应用层的逻辑连接。设备之间的物理连接及许多其他方面,为了简洁没有在图中示出,但在系统的实践方面仍然是必要的。
分析仪100包括存储设备110,以存储至少一些流量102。存储设备110被示意性地示出为圆柱体,且可以为物理介质诸如磁盘、固态存储器、RAM等上的数据文件、数据库或其他适合的存储格式。物理存储介质和形式应被选择和确定大小以能够存储来自流量流102的必要数据。
分析仪100也包括使用来自流102的流量数据作为输入的问卷生成器(图4)。根据本发明的问卷120将:
i.仅包含基于相关参数的问题,所述相关参数取决于从源200到用户终端300传输的内容,及
ii.如果用户终端300访问了某些服务或某些内容,仅被发送到该用户终端。
问卷120由用户终端300回答,优选从人类用户输入。来自用户终端300的响应示意性地呈现在130中。该响应可存储在分析仪的存储设备110中或等效的存储设备中用于进一步分析。在web环境中,问卷可适当地以XML格式进行传输。在电话或有线电视应用中,其他数据格式可能是更适合的。因此应该注意本发明可以使用任何形式的数据请求120和任何响应130,且问卷120包含用于各种依赖于应用的参数的请求,而响应130此外包含一定范围的参数值或属性。
如上所述,由于分析仪100监视用户终端300访问了哪些服务,且仅将具有相关问题的问卷发送到已使用了特定的服务或接收了特定的内容的分析仪或用户终端300,因此提高了精度并简化了后续的分析。注意尤其当问卷包含由用户回答的问题时,精度水平提高,因为如果用户没有访问某个网站或使用用于分析的讨论中的某项服务,或如果问卷包含与用户或实际使用的服务及用于分析的讨论中的实际内容不相关的参数相关的几个问题,则不能期望人们对被视为不相关的各种问题做出准确的响应。
分析仪也包括通信设备以从用户终端获取响应130。响应基于问卷。回答或响应可例如被转换为成对“参数”=“值”的XML数据。如上所述,在本发明的一些方面中,存储单元可包括数据库,以及可以想象到的是,在适于接收以其中例如记录或数据结构中的具有永久位置的给定字段的响应的情况下,应用程序可提供给定的参数值。在这两种情况,适当的响应中的参数值可被存储在存储设备110中或存储在单独的、类似的存储设备中。术语“通信设备”意在包括所有类型的以软件和/或硬件实现的能够从用户终端300接收响应的解释器。通信设备能够可选地将接收的响应保存在存储设备110中或将其转发到另一设备。收集的数据必须在任一情况下当然可用于分析。
根据本发明的一个方面,系统包含用于收集和分析来自用户的几种响应的模块。该模块可位于分析仪100中或其他地方,并可被用于基于接收的响应130来计算分布、平均值、方差和其他统计数据。
根据本发明的一些方面,用于收集和分析用户响应的模块可创建图形。这在下文结合图3详细描述。
该系统可还包括从内容源200到分析仪100的反馈回路。该反馈回路的目的通常将是查阅/测量细节或由于其他原因基于来自之前分析的结果改变给定的调查中的参数选择。反馈回路可以是完全自动的或涉及人工改变问卷中的参数/问题,例如通过网页。
图2示出了用于本发明的分级授权机制的本发明的另一方面,其中用户被分配授权级别A0、A1或A2,其中A0表示用户不授权记录及A2授权最广泛的记录。本发明的这方面背后的思想是用户可以确定他或她是否允许关于因特网、电话服务、SMS服务等的(匿名)信息被记录用于分析目的。
假设供应商在调查中想包括两组参与者:
授权级别A1:允许自动记录其在一个会话中对网络和服务的使用的用户,及
授权级别A2:愿意更全面地注册和/或报告,且通过参加小组同意参与多个调查的一组用户。
在块210,授权请求被发送到用户,来试图获得授权级别A2。实际上,这样的请求可从包含关于要求参与用户组的信息的邀请中被递交,例如,某人同意在稍后的时间点参与多个调查,及关于为例如折扣、免费服务访问等形式的激励的信息。在230接受该邀请的用户将授予授权级别A2,其向供应商提供最大访问级别以获取关于用户使用服务和/或内容等的信息。
在web环境中使用的邀请可以例如是一个或几个站点上的标题或类似的元素。以其他方式使用的邀请可以通过电子邮件发送或使用其他方法发送。作为介绍,图2示出了对关于使用内容或服务的会话280的邀请。在本发明的其他方面,可以在这样的会话后发送邀请。
是否参与多个调查的问题,意味着授权级别A2,通过测试220示出。
在230,同意参与多个调查的用户授予授权级别A2。在240,关于诸如性别、年龄、住所等参数的信息被记录和存储用于日后使用。
并不是所有的受邀人都将接受加入用户小组,但是他们仍然可以对参与一个单一的研究感兴趣。这在测试250中图示。
接受参与一个研究的邀请的用户可能例如受到被自动记录,且因此将获得较低的补偿,通常由一个单一的价格/利益来表示。在较低的授权级别A1参与的邀请可能实际上例如是“参加我们的调查并赢得…”类型的网站或广告。接受该邀请的用户对测试250做出积极的响应,在图2示出的本发明的这方面,被授予授权级别A1,在该实例中,其可向供应商提供自动获得信息的权利,但是不一定基于与针对小组成员的相同要求。不接受该邀请的用户消极地响应测试250,在系统的这个方面,被授予授权级别A0,这限制了供应商访问来获得原本在用户同意的情况下可获得的信息。这包括例如匿名的流量数据,该信息另外对于例如计费或类似的目的是必要的。在本发明的这个方面显示的授权级别A0不能被解释,好像供应商不能收集来自相关用户终端的任何信息一样。
在网络环境中,用户可能被提供相同的web形式的测试220和250,比如,要求用户打勾:a)参与用户小组(A2)或b)参与一项调查(A1)。
在本发明的一个方面,授权机制可以位于供应商,以及根据本发明之前的方面自动分配相应的级别A0给用户或终端的有代表性的样本。在本发明的这方面,由于隐私的原因以及由于潜在的负面影响(如果公众意识到或怀疑供应商存储了关于各个用户使用其服务的信息,将会产生这些影响),供应商通常会使用户匿名或避免注册可以识别用户的数据。这对于用于计费目的而存储信息和在协议栈中的较低层注册流量是类似的。这两种情况都是合法的且通常不与适用的法律或习惯法相冲突。
图3a显示了图形,这是一个适合用于图示数据的收集和呈现的目的的数据结构。该图形包括节点和表示与该节点相关联的特性或参数值的节点属性。节点通过边和表示与边相关联的特性或参数值连接。
假设在图3a中的节点S1是源节点或中央节点,例如,在计算机上运行的Web服务器上的逻辑地址(URI)。为了简化,假设在这个例子中,计算机有一个IP地址,具有不同地址的来自Web服务器的网页可从用于内容提供商的客户的TCP端口80上获得,并假设端口81用于管理Web服务器。进一步假设我们要分析来自网页的流量,在网页中,绝对URL(URI)的第一部分是“www.dummy.com/exmpl/......”在这个例子中,在该节点上的随后三个相关属性是:1)IP地址,2)TCP端口,和3)URI。如果节点表示整个机器,这根据应用会有所不同,即所有流量来自一个给定的IP地址、整个Web服务器,例如:机器上的端口80的所有流量,来自一个域(在这个例子中为“www.dummy.com”)的所有流量,或来自站点的几个部分(例如,www.dummy.com/exmpl/...)的所有流量。在这个例子中,因此有具有如属性2)TCP端口的值80的几个节点和如属性1)IP地址的计算机的IP地址的几个节点。
同样,节点S2可以具有属性:1)表示用户的PC的IP地址,2)将浏览器流量与其他流量分开的TCP端口,和3)将待分析的站点与不被分析的站点分开的URI。应当指出的是,在不同的应用中,源节点和用户终端可使用电话号码、MAC地址,SIM卡号码等进行识别。关于图1简要描述的问卷生成器,在所有情况下可能使用节点属性只对那些访问特定服务的用户提问题,所述服务例如端口80上递送的URI或URI的一个子集。在下文,节点S1表示将被分析的URI的子集。
一旦流量被记录到节点,例如在用户终端300上(图1),系统检查该节点是否已经在数据结构或图形中。如果节点不存在,则创建一个新节点。在图3a的例子中,节点S2-S6能够已经以这种方式创建。应当指出的是,当来自一个另外的新节点的流量被记录时,S7将被创建等。因此如图3所示的图仅是一个例子,图中的节点的数目不以任何方式被限制在六个节点。节点可以有几个属性来存储感兴趣的参数值,例如,4)“将第一帧加载到点播的视频流的时间”,5)“中断的数量,”6)“在站点的时间”,7)来自用户的任何主观的意见或印象和上文讨论的等。在系统的某些方面,物理网络的地理位置、拓扑或逻辑位置可能是有用的。如关于图2描述的,这样的信息可以用来确保有代表性的地理或拓扑样本的大小。地理和/或拓扑信息可以存储为节点属性。
图形的边,即节点之间的连接,在该情况表示节点之间的流量。在图3a的实例中,其可使流量在任意两个节点之间流动,但没有必要这样做。仅在两个节点之间的流量被注册时才创建图形的边。例如图3示出在S6和S1之间没有边,因为在这两个节点之间尚未注册流量。
如果节点S1-S6表示网页,在它们之间的流量的强度可以表示从一个页面到另一页面的转介数量。表示流量的数据在图3a中由参数Ni表示,可以被存储为边属性。有时,如所示的,用S2和S4之间的箭头在两个方向注册流量将是有用的。在这个例子中N2-4表示从S2到S4的查阅的数量,而N4-2可以表示从S4到S2的查阅的数目。其他时候,每条边仅注册一个流量参数可能是更合适的,例如通过N2所示的,在这种情况下,表示从S2到S1上的查阅的数量,如果查阅在另一个方向上,即查阅从S1到S2,被视为对于分析而言是无关的。
当用户会话终止时,例如,由图1中的用户终端300上的用户导航到调查/分析的范围之外的其他网页或在电信服务中挂断电话导致的,调查生成器(图4)可以使用终止在用户终端300所有的边(即,如上所述,具有终端的IP地址或电话号码的所有节点)来发送只包括由用户终端300访问的内容或服务有关的问题的问卷。对产生的问卷的响应,有用户参与或没有用户参与,可以存储在边和/或节点上的单独的属性中。
在流量被记录期间,边上的流量参数的分布将被更新。例如在流量被注册期间,来自节点S5的N5查阅的数量被证明远远大于N2,即使流量在从S5注册之前从节点S2注册。在随后的分析中,流量参数的分布通常被认为比节点创建的确切顺序更令人感兴趣。
给定节点的所有边的总数字也可以是有趣的。例如,特定网页如S1上的许多用户终端的大量的查阅,可以表明这个特定网页应被优化和/或含有非常相关的信息。这两种情况对于网页S1的所有者都可以是有用的信息。
流量属性,如在网页上的点击数,如在上面的例子中的,响应时间和/或其它的流量参数在测量期间被存储在边上的属性中。测量周期包含有足够数量的用户会话,以确保基于一组预定的标准,结果是有代表性的。
图形中的节点和边可以有利地被表示在一个数据库中,例如具有节点表的关系数据库中,在节点表中,每一行表示一个节点,而列表示属性。相应地,图形中的边可以由一个边表表示,其中第一键列指节点的边的一端,第二键列指节点的另一端部,许多列表示边属性。由于表可能包含含有各种类型的内容的大量的列,两个节点和边缘可以含有具有不同类型的内容的大量的属性。此外,对于专业人员来说,这将是清楚的,即在关系数据库中由于节点或边缘被添加,可以添加新表行,根据在图形中添加节点或边而不是添加树的分支或网络中的连接,这可被有益地完成。例如,第一个键列可能指向源节点,而其他键列可以指向目的节点,因此,两个节点可以如此通过表示每个方向上的流量的两个边连接。也应该很容易地看到,上文描述的这样的图形可以用其他类型的数据库或单独的数据结构实现。如果如上所述的节点和边被表示在一个数据库中,诸如用于高效检索由用户终端300(图1)访问的所有服务的索引和查询工具的传统的数据库机制,例如,如所述的,由具有给定的IP地址或电话号码的所有节点和到用户终端300的边的另一端的相应节点(网页或服务)识别的数据库。标准数据库机制也可以用于检索节点和边的各种属性以便以图形方式表示结果,例如,在上面涉及网站的例子中,查找具有相同的IP地址的所有节点。
对于本领域技术人员公知的是,在流量被记录期间存储的数据可包括原始数据和用于统计目的的累计值的混合物。在上面涉及网站的例子中,可能可取的是保持用户已经访问的网页的容易获得的副本,直到数据被分析。这样做的原因是,很多网站包含动态内容,如商业广告,在每个页面重新加载时其会改变。在某些情况下,这可能是有趣的,即检查在响应和实际的页面内容之间是否有明显的相关性,例如,如果一个商业广告在其他类似的网页上比另一商业广告更奏效。
图3b示出了一种显示图3a中的图形的方式,且图示了数据如何被适当地呈现。例如,网络中的节点的地理和/或拓扑位置可以在节点上注册,以及图3b可以表示一个网络图。在图3b中从源S1到S2再向前的连接,用虚线表示以指示边上的已注册的流量参数表明某些程度的性能不佳。如果N2表示来自一个网站S2的点击率,表现不佳的原因可能是作为用于S1的内容的广告媒介,S2不是特别相关的。同样,S1和S3之间的连接用细实线示出,S1和S4之间的连接用粗实线示出。这说明了图形中的边的正向位置可以指示被存储在边上的强度或其他流量参数的值或值的间隔。在上面涉及网站的例子中,条的粗度和外观指示点击量N2<N3<N5。
使用已知的算法,图3b中的树可以展开自图3a中的图形,所述已知的算法诸如找到遍历平面图形中的所有节点的“最短路线”的“生成树”算法。例如,在图3b中所示的树可能表示网站分析的结果,其中,如上所述,N2表示来自网页S2的点击数。在这种情况下,最差的性能可能为,S2被糟糕地编码或被用户视为不相关。对于S1的所有者而言,这可能是相关的,因为作为S1的内容的广告媒介,S2似乎是不相关的。对于S2的所有者而言,例如,进一步调查S2的编码是否应被改进可能是有趣的。
此外,在图3a的图形中收集的数据的呈现并不需要以图3b中所示的树的形式显示。例如,假设在图3b中的节点在地理位置上相对于彼此被正确地放置。代替在图3b中所示的树结构,所收集的数据可以以网状的形式呈现,所述网在节点S4和S6之间,S6和S5之间,S5和S3之间等具有连接,或在这一地理区域以一些其他方式性能较差。如果节点表示网页及呈现中的节点放置表示地理位置,则通过S2的虚线部分可替换地表示来自一个区域的数据丢失。
在注册期间和随后的分析中捕获的数据,当然也可以以用于该目的的任何其他方式来呈现。这些呈现数据的方法对于专业人员而言会是公知的,因此没有进一步详细描述。
图4示出了问卷生成器400。
“数据库”410表示用于所有服务和内容的所有参数的信息量。应当理解,“数据库”410可以通过列表、数据库或任何其他合适的格式表示。
“问题”被定义为一个有序对{服务,参数},其中服务描述来自提供者的服务和/或内容。因此在某些方面服务还包括网页上的内容。有些参数需要用户通过键盘或其它输入设备输入,而其他参数值,例如不同的测量时间,就可以由用户终端完成而无需人工参与。
在块420,用户终端300(图1)已访问的内容和/或服务的列表被添加。
在块430,在来自块410的所有量的问题和来自块420的访问内容量之间做出切割(incision)。形式上,这是来自410的问题(有序对{服务,参数})的子集,其中的服务发生在块420。换句话说,输出是在所有可能的问题(410)中存在的且与来自块420的内容有关的问题的列表。因此,由此产生的问卷包括关于由适当的用户终端300(图1)访问的服务和/或内容的问题,而没有包括未被访问的服务和/或内容有关的问题。此外,问卷包括一般性质的问题,但它强调的是,在本发明中的问卷的目的是为了避免关于没有被访问的内容和服务的不相关的问题。
问题条件
在435,得到一个或多个问题将被包括在450的情况下的条件。435因此被称为问题条件,并且可包括,但不限于,哪些输出数据从430递送。条件的实例可以基于来自420的访问内容的数量、访问时间、访问内容的顺序、内容或内容要素的类型、对象、文本等,内容的物理组或逻辑组,其可以是供应商的网站的一部分(例如,“产品”类),个人网页和/或网页或网站上的项目(例如,“购物车”或广告),以及这些条件的结合。可被包括的条件类型不限定于上述的例子。组合可以例如表示已经被访问的特定类型的网页,但不是另一种类型的网页。在这个例子中,从410选择的相应问题将在430中基于从435输入的数据来选择。
在块440(可选的)问卷可使用来自块420的内容进行说明。该说明性的内容可以是将呈现给用户的网页的、与所生成的问卷中的一个或多个问题相关的一个或多个小型化的屏幕截图。这种类型的说明性内容在其它应用中可能是不必要的,因此,块440被用虚线绘制以说明它是可选的。
在块450是可用的最终问卷,即可以呈现在用户终端300的参数的请求列表,并且仅包含来自块420的访问内容的参数有关的问题。
图5是描述了根据本发明的用于收集在一个测量周期中的数据的方法500的方框图。
测量周期开始于n=0的应答者。
在块510,新的用户终端被识别。可以根据IP地址,端口号和/或访问的网页来识别。
在块520,获得授权级别。授权可以在测量期间开始之前获得,例如,当用户已同意加入一个用户组/小组等,如关于图2所描述的。在这种情况下,相关的信息,诸如性别、年龄等,可以被存储,如图2中的240所示。授权请求也可以在测量期间被发送,例如以确保与性别、年龄、居住地和可以为研究中的可能的解释参数的其他(人口)数据有关的代表性的样本。
在块530,授权被确认,也就是说,确认用户是否允许收集和储存流量数据。如果授权在测量周期开始之前被授予,该步骤将只包括确认是否已经得到授权。否则,系统将试图获得来自用户的授权,如在图2中示出的。如果在步骤530末没有获得授权,或授权级别不足够高时,一个新的用户终端被识别。
如果授权级别足够高,在步骤540中,分析仪100(图1)将逻辑地连接在内容源和用户终端300之间。因此,步骤540可能对应于如在图2中示出的会话280的开头。
在块550,来自会话的流量数据被记录并存储在分析仪上。来自网站的HTML、XML和/或JavaScript以其看起来和网页完全一样的方式被处理,并和所述用户终端的IP地址、端口号等,和内容源的ID,例如,IP地址、端口号和/或URI一起存储,如上面关于图3所描述的。
在块560,所记录的流量数据用于生成基于流量的问卷。由410所表示的所有可能的问题的量与上面关于图4描述的一样。560和问题的量410之间的两个箭头说明:在块560问卷生成器提取与所讨论的会话中访问的网页或服务有关的问题。以这种方式提取的问题被加入到问卷中。
在块570,使用问卷收集来自用户终端300的响应,并在块570,响应的数目增加1,即从n变为n+1。
该方法包括收集和存储N组流量数据和来自用户终端的响应,其中N是≥1的整数。测试580确定是否获得了少于N的回应,即是否n<N。如果未收集到预定数量的N个反应,该过程返回到块510用于识别一个新的用户终端。如果获得了预定数目的N个用户反应与流量数据,测量将结束,并且该过程前进到数据分析(图5中未示出)。
图6示出了一个反馈回路,该反馈回路使用分析结果来影响可用于问卷中的问题。目的可能是进行进一步调查和/或提高在给定的研究中的问题的精度。这可以通过添加、删除或改变被认为与给定的服务或网页相关的问题来做到。
数据库410中包含可能的问题的集合,并关于图4被进一步描述。该组问题的内容影响在图4中所示的结果,并在图6中用宽箭头示出。
测量结果610可以在测量期间内(在图5中n<N)得到。它们可以被分析,例如以监测应答者的样本,以确保数据收集在样本有足够的代表性之前没有完成。测试结果610也可以替代地是在如图5中599处所示的测量周期结束时存在的流量数据和来自问卷的响应的集合。
在块620,使用公知的方法如统计法来分析测量结果610。分析结果可以以适当的形式,如例如用户终端上的网络界面进行呈现。分析和呈现超出本发明的范围,因此在这里没有进一步详细描述。
在块630,判断参数是否被包括在一个新的问卷中以供确定的进一步分析,如果是这样的话,确定哪些参数包括在该问卷中。形式上改变可能的问题集合410中的可用的问题或有序对{服务,参数}的数量。在许多情况下,在630的评估将包括人的评论,例如,通过将来自分析的发现呈现在屏幕上,根据在哪些方面需要额外的数据,专家针对特定的服务准备了新的问题,而且专家使用公知的用户终端,例如PC将新问题添加到数据库410中。也可以自动地改变问题,例如通过自动收集含有某些参数的更多数据来实现了预定的分布,或应答者的具有代表性的样本。
箭头640示出了问题在卷410内被创建、删除或改变用于后期使用。
图7示出了在分析仪100中使用的用于基于web的内容的方法。
在步骤710中,从内容源200接收到一个网页。网页内容可能包括与时间相关的内容,例如:在页面重新加载时发生改变的广告。网页代码通常会包含HTML、XML和/或JavaScript和定义在同一网站的多个页面的字体、边距、颜色方案和不同的外观的样式表(CSS)的混合物。在此步骤中,在用户终端上的浏览器中执行的JavaScript和任何其他的代码可以被解码。
在步骤720中,供应商的地址被转换为具有供应商的Web服务器之外的含义的地址。例如,一些或所有相对地址可被转换为绝对地址。在广告标题的例子中,其在重新加载时改变,例如相对地址“/产品/something.php&ID=123'转换为'dummydomain.com/产品/something.php&ID=123'。这个实现确定是否所有的地址要被转换。例如,参考样式,“/CSS/stylesheet.css保持相对的。
在步骤730中,网站上的所有项目在分析仪100以这样一种方式存储,即提供者的网页可以由分析仪100再生并呈现给用户终端300。例如,在/CSS/stylesheet.css下相对归档的样式等也在分析仪上的100,或它们可以从分析仪100以外的绝对地址获取。
在块740(可选的),生成网站的说明。该说明在获得某些参数,如关于“页面内容是在左侧吗(图示)<相关性>”的主观感受的问题时可能是有用的。对于图示在所有的浏览器中和/或以缩小的尺寸可读,这有利于创建为例如JPEG或PNG的标准化的格式的网站的图像。在其他情况下,可能更适合使用不同的便携式格式,如Adobe便携式数据格式(PDF)用于图示。
在本实例中,参数<相关性>可能被呈现为有效参数值的列表,例如数字1-5,集合{“有用”,“有用与无用之间”,“无用”}等。影响给定的网页的参数和值从可能问题的集合410中检索到并与图4中所示的图示一起呈现在问卷中。
在块750,将基于在分析仪100中存储的内容的问题呈现给用户。因此,用户终端300上的浏览器必须能够访问项目,所述项目可能与内容提供者的网站上的那些项目具有不同的相对位置。换句话说,网页必须以这样一种方式呈现,即它可以与用户在提供者的网站上看到它的完全一样地再生。
更改的内容
图8示出了本发明的一个方面,其中供应商的网页810可以完全或部分改变地出现在用户终端上。
在根据本发明的另一个方面,供应商的网页810可以完全或部分改变地出现在用户终端中。这样的应用的原因可能是供应商想要更改、替换或另外影响整个或部分的网站/网页,或包括设计、语言、格式、设计、编码的任何项目/对象,但不限于这些例子。这些变化将总称为更改的内容。应用的一个例子是用户终端的一个选择被呈现具有更改的内容的网页,而另一个选择被呈现原来的页面,其中将按照所述用户终端收到的那个版本设计问卷。在这种应用中,供应商将能够测量两种呈现之间的差异。这样的应用的实例可以是用另一个广告取代一个广告,改变颜色方案/风格,但不限于这些实例。
块800示出网页810,其通过逻辑测试820选择哪些网页被发送到850用户终端,是830原始页面或840更改的内容。测试820在流量分析之前由从供应商设置的系统内的参数组成。

Claims (13)

1.一种用于数据流量分析的系统,包括分析仪(100)、内容源(200)和用户终端(300),
其特征在于,授权机制适于允许或拒绝分析仪(100)连接在所述内容源(200)和所述用户终端(300)之间的数据流量流中,且其中所述分析仪(100)包括:
-存储设备(110),所述存储设备(110)适于存储至少部分的所述数据流量;
-问卷生成器(400),所述问卷生成器(400)使用流量数据(420)作为输入数据并将有关基于所述流量数据的相关参数的请求的问卷(120,450)作为输出数据,及
-通信设备,所述通信设备用于从所述用户终端获得响应(130),所述响应是基于所述问卷(120,450)的。
2.根据权利要求1所述的系统,
还包括用于采集和分析许多用户响应的装置(500,620)。
3.根据权利要求1所述的系统,
其中,所述问卷生成器(400)与包括为有序对{服务,参数}的形式的多个问题的数据库(410)逻辑连接,其中服务表示应成为分析的主题的服务和/或内容,及参数表示服务的测量参数,因为所述集合包括将要进行分析的服务的所有值及每个服务的至少一个参数。
4.根据权利要求1所述的系统,
还包括条件测试装置(820),所述条件测试装置(820)用于进行逻辑测试,其中网页(810)表示输入数据及输出表示路由到用户终端(300,850)的原始的网页(830),或所述输出表示路由到用户终端(300,850)的改变的网页(840)。
5.根据权利要求4所述的系统,
其中所述条件测试装置(820)是由在所述数据流量分析之前由供应商设置的系统参数组成。
6.一种用于内容源(200)和用户终端(300)之间的数据流量的数据流量分析的方法,其特征至少在于以下步骤:
-识别(510)用户终端(300);
-获得(520)对流量数据的采集和存储的授权;
-控制(530)是否获得授权,及如果获得授权:
-将分析仪(100)连接(540)在所述内容源(200)和所述用户终端(300)之间;
-在所述分析仪上记录(550)和存储至少一些流量数据;
-使用所记录的流量数据来生成(560)基于数据流量的问卷(120,450),及
-使用所述问卷收集来自所述用户终端(300)的响应(130,570)。
7.根据权利要求6所述的方法,
还包括采集和分析多个响应。
8.根据权利要求6或7所述的方法,
还包括基于所述用户响应建立具有节点和边的图形,其中网页作为节点,而边表示网页之间的数据流量,其中每个节点和每条边包括至少一个属性。
9.根据权利要求7所述的方法,
还包括修改(630)问题和使用可能的问题更新(640)集合(410)。
10.根据权利要求6所述的方法,
其中记录(550)流量数据包括:
-从所述内容源(200)接收(710)网页;
-将相对地址转换(720)为绝对地址;
-将所述网页中的所有元素存储(730)在所述分析仪(100)中,及
-将所述网页从所述分析仪(100)转发到所述用户终端(300)。
11.根据权利要求10所述的方法,
还包括以图像格式生成(740)所接收的网页的图示。
12.根据权利要求10所述的方法,
还包括解码所述网页上可执行的代码,用于生成静态的XML代码进行呈现。
13.根据权利要求6所述的方法,
还包括以下步骤:
进行条件逻辑测试(820),其中网页(810)表示输入数据及输出表示路由到用户终端(300,850)的原始的网页(830),或
所述输出表示路由到用户终端(300,850)的改变的网页(840)。
CN2011900007335U 2010-09-13 2011-09-13 用于流量分析的系统和方法 Expired - Fee Related CN203206260U (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NO20101278 2010-09-13
NO20101278A NO331948B1 (no) 2010-09-13 2010-09-13 System og fremgangsmate for trafikkanalyse
PCT/NO2011/000247 WO2012036557A1 (en) 2010-09-13 2011-09-13 System and method for traffic analysis

Publications (1)

Publication Number Publication Date
CN203206260U true CN203206260U (zh) 2013-09-18

Family

ID=45831807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011900007335U Expired - Fee Related CN203206260U (zh) 2010-09-13 2011-09-13 用于流量分析的系统和方法

Country Status (5)

Country Link
US (1) US8886800B2 (zh)
EP (1) EP2617164A4 (zh)
CN (1) CN203206260U (zh)
NO (1) NO331948B1 (zh)
WO (1) WO2012036557A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957128A (zh) * 2014-03-28 2014-07-30 山东乾云启创信息科技有限公司 云计算环境下监控数据流向的方法及系统
CN106202855A (zh) * 2015-05-27 2016-12-07 英属开曼群岛商慧康生活科技股份有限公司 用以于一通信网络中提供定性数据收集的系统及其方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8812613B2 (en) * 2004-06-03 2014-08-19 Maxsp Corporation Virtual application manager
WO2013050552A2 (en) * 2011-10-07 2013-04-11 Mooncasttv Sa User interfaces for determining the reaction of a group with respect to a set of elements
US10268729B1 (en) 2016-06-08 2019-04-23 Wells Fargo Bank, N.A. Analytical tool for evaluation of message content
CN114238777B (zh) * 2022-02-18 2022-05-27 优游宝科技(深圳)有限公司 基于行为分析的负反馈流量分配方法、装置、设备及介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816456B1 (en) * 2000-02-04 2004-11-09 At&T Corp. Methods and apparatus for network use optimization
US20020029154A1 (en) * 2000-09-07 2002-03-07 Hnc Software, Inc. Mechanism and method for dynamic question handling through an electronic interface
US20020184041A1 (en) 2001-05-31 2002-12-05 International Business Machines Corporation Automated customer survey using the web
US20040088212A1 (en) * 2002-10-31 2004-05-06 Hill Clarke R. Dynamic audience analysis for computer content
US7783740B2 (en) * 2003-09-25 2010-08-24 Rockwell Automation Technologies, Inc. Embedded network traffic analyzer
FR2895180A1 (fr) 2005-12-19 2007-06-22 France Telecom Evaluation de l'utilisation de services accessibles depuis un terminal
EP1871037A1 (en) * 2006-03-31 2007-12-26 Agilent Technologies, Inc. Method, system and apparatus for storing and analysing user interaction experiences
DE102007002533A1 (de) 2007-01-17 2008-08-14 Mindlab Gmbh Netzwerk
GB2464528A (en) 2007-08-30 2010-04-28 Clickstream Technologies Plc Provision of targeted content
US20100169803A1 (en) * 2008-12-05 2010-07-01 Elizabeth Mazzei Method and System for Implementing User Generated Preferences in a Communication System

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957128A (zh) * 2014-03-28 2014-07-30 山东乾云启创信息科技有限公司 云计算环境下监控数据流向的方法及系统
CN103957128B (zh) * 2014-03-28 2017-04-05 山东乾云启创信息科技股份有限公司 云计算环境下监控数据流向的方法及系统
CN106202855A (zh) * 2015-05-27 2016-12-07 英属开曼群岛商慧康生活科技股份有限公司 用以于一通信网络中提供定性数据收集的系统及其方法

Also Published As

Publication number Publication date
EP2617164A4 (en) 2014-07-30
NO20101278A1 (no) 2012-03-14
EP2617164A1 (en) 2013-07-24
US20130173793A1 (en) 2013-07-04
NO331948B1 (no) 2012-05-07
WO2012036557A1 (en) 2012-03-22
US8886800B2 (en) 2014-11-11

Similar Documents

Publication Publication Date Title
Keller et al. Social bots in election campaigns: Theoretical, empirical, and methodological implications
del Rocío Bonilla et al. Insights into user engagement on social media. Case study of a higher education institution
US8478862B2 (en) Method and apparatus for internet traffic monitoring by third parties using monitoring implements
JP6023203B2 (ja) ソーシャル・ネットワーキング・システム上の構造化オブジェクトおよびアクション
Cuevas-Molano et al. Factors increasing consumer engagement of branded content in Instagram
KR100952391B1 (ko) 인터넷 네트워크에서 콘텐츠의 평가에 따른 가치 분석시스템, 방법 및 이를 구현할 수 있는 컴퓨터로 읽을 수있는 기록 매체
CN103649981B (zh) 用于输送目标内容的方法和装置
CN203206260U (zh) 用于流量分析的系统和方法
US20130317808A1 (en) System for and method of analyzing and responding to user generated content
US8943135B2 (en) System and method for measuring the positive or negative impact of digital and social media content on intent and behavior
US20080160490A1 (en) Seeking Answers to Questions
US20090216882A1 (en) Method and apparatus for internet traffic monitoring by third parties using monitoring implements transmitted via piggybacking http transactions
Singer The ethical implications of an elite press
US20220345779A1 (en) System for audience sentiment feedback and analysis
Lim et al. Consumption of pop culture and tourism demand: Through the lens of herding behaviour
Ni Exploring the preferences of US YouTube users and factors related to YouTube uploader’s revenue
Liu et al. User interactions in online travel communities: A social network perspective
KR20120031852A (ko) 온라인 투표를 이용한 개인의 성향정보 구축 시스템 및 그 방법
Bílková et al. Multimedia content in online advertising: insight into generation Z preferences
Guo [Retracted] Micromedia News Dissemination Impact Assessment Integrated with Personalized Recommendation Algorithm
Mekouar et al. Access and sharing contents through the social network: A pomdp approach
US20240185301A1 (en) Systems and methods of delivering anonymized targeted advertisements while providing multi-level compensation to users
Yanga et al. The Impact of Online Word-of-Mouth from Multi-Platform on Product Sales
Wang et al. Online Social Media Content Delivery: A Data-Driven Approach
Asfahani The Impact of Socially Responsible Marketing on TV Viewership and Household Conflicts: A Theoretical Descriptive Study

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130918

Termination date: 20150913

EXPY Termination of patent right or utility model