CN106663258A - 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构 - Google Patents

通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构 Download PDF

Info

Publication number
CN106663258A
CN106663258A CN201480078454.9A CN201480078454A CN106663258A CN 106663258 A CN106663258 A CN 106663258A CN 201480078454 A CN201480078454 A CN 201480078454A CN 106663258 A CN106663258 A CN 106663258A
Authority
CN
China
Prior art keywords
user
data
equipment
group
application program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480078454.9A
Other languages
English (en)
Inventor
汉努·韦尔卡萨罗
克里斯·莫泽莱夫斯基
埃里克·马尔米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rittal Data Research Co
Original Assignee
Rittal Data Research Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rittal Data Research Co filed Critical Rittal Data Research Co
Publication of CN106663258A publication Critical patent/CN106663258A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/875Monitoring of systems including the internet

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

用于获取和分析数据的系统(100、108、110),诸如若干个服务器(108),所述数据关于与可连接互联网的用户设备相关的在线用户行为和其他活动,所述用户设备可选地为移动设备,该系统被配置成从多个数据源采集(404、408)数据,其中采集的所述数据至少包括从用户设备(104、104a、104b、105、217、402)获取的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据(107a、211),其中所述用户级数据是优选地使用具有受控的构成的至少一个用户研究小组(216)采集的,进一步优选地从所述用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、媒体、应用程序和/或设备使用;利用本体的元数据方案将获得的用户级数据和统计级数据组织(406)到分类数据集中,所述数据集优选是多义的;基于所述用户级数据和统计级数据的结合确定电子交付物(112、206、416),其中统计级数据被用于校准用户级数据;在关于使用的设备或在线行为的若干感兴趣因素方面,所述交付物具有动态地可选择的、优选地用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。

Description

通过混合的基于统计和用户测量方法测量多屏幕互联网用户 概况、交易行为和用户群体结构
技术领域
本发明总体上涉及数字设备、包括有线或移动通信的通信以及相关应用程序和服务。具体地,但不完全地,本发明涉及采集(collection)多点互联网硬件和使用数据、将该数据融合到一起并且频繁地发布围绕与数字设备有关的市场级和用户级行为的有代表性的度量以及有关的市场结构信息。
背景技术
各种现代的媒体测量和分析解决方案集中在仅基于一个源收集数据。一般地,源是所谓的小组研究,其中通过专用设备或可下载的软件计量器(meter)来计量用户行为,或者通过采集关于特定的应用程序的数据的嵌入式标签(在(网络)站点或应用程序(应用))或SDK(应用程序)来计量用户行为。替代地,可以通过传统的用户调查研究或访谈来获取所需的数据,这会遇到回答者主观性和不准确性的问题。
在前述研究中,明显的目标是掌握用户的潜在趋势、习惯、问题和需求。然而,现有方法的每个都具有其本身潜在的问题。例如,极少例外地,招募、维持和使合法化一个在行为上且人口统计方面有代表性的小组的花费是过高的。SDK(软件开发工具包)和标签仅提供关于参与属性但不是所有的参与属性的数据。调查和访谈比实际行为更好地表明品牌实力,并且,目前没有能够提供关于互联网生态系统的所有关键领域在如下“硬件的”、对象的、观察驱动的数据方面的概念性信息的方法,所述数据诸如:硬件安装的基础和销售、内容和应用程序分布以及如由用户完成的使用/交易。
当今媒体和互联网服务(诸如网站或网络可访问的服务)的发展比以往任何时候都快,并且新的设备不断出现在市场中。而且,通常一个用户具有多个(不只一个)能够连接互联网的设备。不仅需要对使用的整体理解,而且需要对设备和内容分布的整体理解,以向参与互联网生态系统的关键客户解释市场动态并提供一体化的研究产品。
如一个实例,某个类型设备的普及影响着某个服务的分布,这或者是因为该服务被预嵌入到设备中,或者是因为应用程序商店(或其他内容分布机制)推动用该特定设备下载该服务。如另一个实例,了解多少人从应用程序商店下载某些应用程序是不够的,而越来越重要的是了解从下载到实际使用的转换,并且进一步到用户在使用服务中花钱的转换。进一步地,由于更好的感知功能、用户体验或通过社交圈,在某个设备上可获得的服务的普及性和多样性可以影响着该设备的销售。因此在这个系统中有显著的反馈回路。
另一个普遍的趋势是,人们不仅有多个设备,而且他们还使用由所谓的主设备完全或部分支持着工作的多个用户界面、可穿戴技术产品或附接设备。真实的实例包括智能手表或数字眼镜类型的设备,所述设备进一步附接至智能手机设备。通过这些附接的设备和可穿戴设备的活动测量当然未来也具有关键重要性。
由此,需要更好地适应现代媒体环境的能够进行观察性互联网测量的可扩展的媒体测量解决方案,在现代媒体环境中,设备、应用程序和服务的复杂性和碎片化已变得普遍。因此,这样的媒体测量解决方案将提供动态的、高分辨率的方法,用于全面的互联网计量和分析,将围绕硬件安装的基础、内容分布以及用户行为的度量整合到单个框架中,以及利用一流的方法来捕获在线生态系统的每个方面。结果产生了能够提供远超过系统的各部分的总和且远超过先前孤立的解决方案的一种整合的且迅速响应的系统。
发明内容
因此,根据本发明的一个方面,一种用于获取和分析数据的至少基本上电子的系统,所述数据关于与可连接互联网的用户设备有关的在线用户行为和其他活动,所述用户设备可选地为移动设备,所述系统被配置成:
从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据,其中所述用户级数据是优选地使用具有受控的构成(constitution)的至少一个用户研究小组采集的,进一步优选地是从用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、媒体、应用程序和/或设备使用;
利用本体(ontological)元数据方案将获取的用户级数据和统计级数据组织到分类数据集中,所述分类数据集优选是多义的(multivalent);
基于用户级数据和统计级数据的结合确定电子交付物(deliverable),其中统计级数据用于校准用户级数据;
在关于使用的设备或在线行为的若干感兴趣因素方面,交付物具有动态可选择的范围,所述范围优选是用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
可选地,该系统可以进一步包括采集从样本得到的统计分层(stratification)数据,该统计分层数据估计用户群体上的特征的分布,其中该系统被配置成还将分层数据组织到数据集中并且利用该数据确定交付物,包括校准用户级数据。
在一个实施方案中,从第二、潜在更大的用户小组采集用户级数据。但是,优选地,两个小组自然地均包括多个用户。优选地,小组没有重叠(没有共享的用户)。相比于第一小组,可以减少对第二用户小组构成的控制。第二小组可以对至少非常大数量(如果不是几乎所有)的参与者开放,所述参与者可能需要简单地满足若干基本要求例如法律上成年。
在另一个补充的或替代的实施方案中,利用用户设备的数据采集包括将相关的测量软件嵌入到功能性分离的其他软件片段中,其他软件优选地包括被主要设计用于不同的目的,而不是数据测量/记录和/或在例如娱乐、通信或消息发送相关的功能、数据处理工具等方面提供不同的、有区别的用户益处。在对于用户的单个电子软件交付物中,可以包括测量软件组件作为额外的模块。
在再一个补充的或替代的实施方案中,通过用户的一个或多个主设备采集用户级数据,可以有一个或多个其他附接设备,诸如外部UI(用户界面)设备(智能眼镜等),至少功能性地连接至所述主设备,通过利用主设备作为到网络数据采集服务器的连接点,并且在记录附接设备的活动中直接地(例如,通过附接设备的直接的API呼叫来观察附接设备的状态和活动)或间接地(例如,通过用作所谓的网关设备的设备来观察附接设备与互联网络之间的通讯跟踪)利用主设备来测量所述附接设备的使用。
可选地,在多设备测量的情况下,至少一个附接设备连接至的主设备被配置成执行选自由以下组成的组的至少一个动作:
a.跟踪在附接设备与主设备之间发生的通讯、信号、或其他事件;
b.被动地或主动地轮询附接设备的应用程序编程接口,以采集测量数据;
c.暂时地或在预定的持续时间内将采集的测量数据存储到主设备中;以及
d.将数据发送到基于网络的数据采集服务器以用于分析目的。
在再一个补充的或替代的实施方案中,采集的统计级数据包括描述整个目标群体或目标群体的完整的严格限定的子集中的特征分布的数据,诸如若干数据点,所述数据是从若干以互联网网络中心数据源获得的,并且潜在地包括但不限于载体数据、广告网络数据、广告交换数据、网站/应用程序分析平台提供的数据、网络网关或代理数据和/或基于需求供应或其他内容交付物平台的数据。
应用大体上以与在此提供的描述一致的方式处理且建模的基于互联网(网络)的数据的集合,可以构成例如在给定市场中目标用户(互联网)设备的静态当前用户基础的估计。可以动态地建模不同的特征,诸如这样的群体的增长率或下降率。换句话说,潜在地甚至作为省略在此大体上阐明且优选的用户数据校准方面的单独的解决方案,可以利用统计级数据诸如网络(中心的)数据以估计互联网设备的结构和例如安装基础的增长。
此外,在再一个补充的或者替代的实施方案中,采集的统计级数据包括描述目标群体的集合行为的数据,诸如多个数据点,该数据可以从例如若干内容分发平台获得,诸如从用户通过数字(用户)设备和例如互联网能够访问的公共应用程序商店或数字市场获得。
可选地,在利用统计级数据的情况下,其中获得的统计级数据的数据是不完整的,可以使用适应于可应用的最佳理论和方法实践的若干统计上有效的建模方法(诸如归属、校准和融合)来补充或调整不完整的数据。
在再一个补充的或者替代的实施方案中,通过叠加元数据平台来结合用户级数据源和统计级数据源,该叠加元数据平台将在校准和处理之前和之后在不同数据源中观察的概念、主题与实体之间的相互关系建模。
在再一个补充的或者替代的实施方案中,若干个用户设备被配置成提供与设备外部的行为或情景事件有关的数据,例如自动捕获的摄像机照片或音频记录的环境声音或图像识别交付物,由测量软件将该数据与其他采集的测量数据一起发送到系统的外部数据采集服务器以用于分析目的。
在另一个方面,一种用于获取和分析数据的方法,所述数据关于与可连接互联网的用户设备有关的在线用户行为和其他活动,所述用户设备可选地为移动设备,该方法包括:
从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组,进一步优选地从用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、媒体、应用程序和/或设备的使用;
利用本体元数据方案将获取的用户级数据和统计级数据组织到多义的分类数据集中;以及
基于用户级数据和统计级数据的结合确定电子交付物,其中统计级数据用于校准用户级数据;
其中,在关于用户设备或在线行为的若干感兴趣因素方面,交付物具有动态可选择的范围,所述范围优选地是用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
在再一个方面,包含在非临时性计算机可读介质上的计算机程序产品,包括用于获取和分析数据的代码,所述数据关于与可连接互联网的用户设备(可选地为移动设备)有关的在线用户行为和其他活动,所述获取和分析数据包括:
从多个数据源采集数据,其中所述采集的数据至少包括从用户设备获取的个人用户级数据以及表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组采集的,进一步优选地从用户小组中的每个参与者的多个设备采集的,所述采集的数据表明互联网、内容、媒体、应用程序和/或设备的使用;
利用本体元数据方案将获取的用户级数据和统计级数据组织到优选的多义的分类数据集中;以及
基于用户级数据和统计级数据的结合确定电子交付物,其中统计级数据用于校准用户级数据;
其中,就关于用户设备或在线行为的若干感兴趣因素而言,交付物具有动态可选择的范围,所述范围优选是用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
根据所讨论的具体实施方案,本发明的效用体现在多种方面。本发明提供了一种用于将某些类型的以用户为中心的数据和以网络为中心的数据组合到一起的可行的解决方案,其中,通过整合的方法可以便利地获得所需的电子报告和其他信息交付物,在交付物中可用信息的代表性和范围优于单独使用不同数据源能够获得的可用信息的代表性和范围,并且在硬件和用户行为方面的度量的可用性比先前看到的更广泛。本发明的效用还在于业内人士可以询问这样的数据的方式以通知他们的战术和战略决策,包括围绕产品营销、营销活动设计、产品特征或定价的决策、或者与数字生态系统中的个人参与者相关的投资决策。
进一步地,本发明的不同实施方案使得能够构造交付物以在数字市场中识别市场趋势、获得有竞争力的见解并且了解新出现的机会。所述发明提供了多屏幕框架以及时地了解数字市场的各种特征、有效地确定能够在当今的多屏幕世界(包括移动设备)中获得统计级数据的系统、并且将该系统与从这样的设备采集交易、行为和情景数据、通过结合的元数据框架处理产生的数据、并且通过统一的受众测量投影运算提供聚集市场度量的创新方法关联。
此外,本发明的各种实施方案比现有技术产生了在经济上和技术上更可扩展的解决方案,并且相信该解决方案提供了关于更广泛的典型数字市场的更广泛的度量阵列的更精确的估计。由于其设计且依赖于使用多样的用户级数据、多样的统计级数据和多样的从样本得到的分层数据的多数据源,所述实施方案通常能够更好地适应在数字市场中的变化,尤其是在围绕数字内容开发、分布和使用以及设备制造、分布和使用的盛行的市场趋势中那些可观察的变化。
表述“若干(a number of)”在此指代从一(1)开始的任何正整数,例如一、二或三。
表述“多个(a plurality of)”在此指代从二(2)开始的任何正整数,例如二、三或四。
根据在数据传输动作相关的分析下特定实体的角色(即发送者的角色、接收者的角色或二者),表述“数据传输”可以指代发送数据、接收数据或二者。
术语“一个(a)”和“一个(an)”不表示数量的限制,而表示存在至少一个所引用的项目。
术语“第一”和“第二”不表示任何顺序、数量或重要性,而是用于将一个元件与另一个元件区分。
术语“统计(census)”在此指代反映给定的且精确限定的测量对象(例如用户、服务、设备等)的组的优选地全部成员的行为、特征或性能的系统或数据集。该数据明确地基于限定的和测量的群体的全部对象/成员,不过该限定的和测量的群体可以本身自然地是更大群体的子集。
术语“校准(calibration)”在此指代统计建模过程,通过该统计建模过程数据被加权以调整例如无反应以及其他偏见的样本以更好地反映用户群体、服务或设备的测量。该统计建模过程可能涉及在文献中良好地确立的各种统计技术,包括但不限于样本平衡、特征属性、特征投影以及数据结合。
术语设备的“安装基础(installed base)”指的是沟通和反映例如在给定市场中在某个目标群体中分布或使用的互联网设备(优选地包括主设备和附接设备)的数目、结构和/或交叉所有权的信息和度量。
术语“数据集(data set)”在此指的是例如借助于本体方案的彼此相关联的数据元素的集合。所述数据元素可以被物理地放置为分布在若干设备和/或数据结构(诸如数据库或数据表)中。
在从属权利要求中公开了本发明的不同实施方案。根据以下详细描述,本领域技术人员将明了本发明的各种其他的实施方案和进一步的益处。
附图说明
参考所附附图更详细地说明本发明的各种方面和实施方案,附图中:
图1从硬件的角度例示了根据本发明的系统的一个实施方案。
图2例示了相比于图1具有更多概念的和功能的方法的系统的实施方案。
图3例示了包括若干主设备和附接用户设备的多设备使用的一个实施方案。
图4用功能/逻辑和硬件视图提供了对根据本发明的系统的一个实施方案的内部的更详细观察。
图5例示了可以由本发明的不同实施方案测量的不同的、潜在地以及可能地重叠的群体。
图6例示了能够和本发明结合地利用的网站、或特别是应用程序商店、爬行(crawling)技术的一个实施方案。
图7描述了关于基于以例如应用程序排名的形式的可用信息对下载统计数据(例如应用程序下载的数目)估计的一个实施方案的不同方面。
图8例示了用户设备计量和相关记录文件管理的一个实施方案。
图9例示了用于与本发明结合地使用的情景分类/归类和相关关联的一个可行的应用。
图10例示了为了校准变量和类别选择(缩减)的目的的样本审核程序的一个实施方案,用以使得能够控制用户级数据的数值确定和校准。
图11是根据本发明的一种方法的高级流程图。
具体实施方式
现代社会,设备碎片化是改变个人社交、沟通、消费媒体以及执行个人和专业任务的方式的因素之一。近来消费者与数字媒体以及资源的交互已经变为移动的:他们使用智能手机、平板电脑、笔记本电脑、台式机等来执行这样的任务,并且许多人甚至在日常基础上(每天)利用多个设备用于这些目的。
此处描述的框架可以体现为用于或者至少能够用于测量关于或者围绕在各种数字设备上表示的消费者行为的大量特征的系统。
可以确定的特征包括但不限于消费者、或大体上用户、各种设备的使用、这样的设备的安装基础、用户动作,即用户用他们的设备做什么,由此找出例如用户如何经由这些设备使用应用程序(应用)和网站的方式,用户下载的应用程序、网站或媒体是什么和/或用户与什么应用程序、网站或媒体交互,以及如何将这些应用程序、服务和内容首先分配到设备。可以建立下载应用程序和实际使用应用程序之间的联系。可以分析与数字设备有关的或使用数字设备的经济交互。可以调查在多个数字设备的使用中的区别和联系。
可以如由根据本发明的系统和方法的实施方案提供的,以不同层次的细节(即在全部应用程序上,对于各种类型的应用程序或对于特定的应用程序),为各种受众(即用户/消费者组)和/或在不同的时间周期内(例如在每日/每周/每月基础上)检查以上特征。
通用使用纵向被动计量,此处描述的框架被用于使用大规模持续样本(例如VertoPartner PanelsTM)来观察性地、有利地测量数字行为以捕获碎片化活动的长尾(long-tail)。可以在若干基本上独立的数据源的基础上校准所获得的数据并且对所获得的数据进行质量控制,所述数据源包括例如用于人口分布校准的从样本得到的分层数据、用于行为概况分析的具有被动计量的仔细-分层的纵向小组、以及用于行为校准和衡量的统计-数据。
本文描述的系统的交付物下面的一个概念在于将例如以下三个不同类别的信息桥接在一起的能力:
1:硬件分布数据,该数据表示不同(移动的)平台和设备的普及和分布,反映(移动的)硬件市场中的持续变化;
2:应用程序(应用)分布和货币化数据,该数据表示不同(移动)应用的普及和分布、量化通过这些应用程序的销售和由用户所做的应用程序中的购买产生的收入的数据;以及
3:应用程序/内容使用和参与数据——该数据示出消费者如何与(移动的)内容(例如应用程序、微件、网站)交互和接合。
除了或替代移动平台/设备/应用程序相关的分析,假设有足够的源数据可用,则可以进行涉及基本上不移动的或不可携带的设备的相应的分析。
图1在100处从概念的和以设备为中心的角度例示了根据本发明的系统的一个实施方案。
提供了一个包括若干至少功能性连接的服务器108的电子系统110用于如下活动,像关于用户102(典型为人)的与可连接的网络(优选的可连接的互联网107)、用户设备104诸如台式电脑、笔记本电脑、平板电脑、蜂窝电话并且特别是智能电话、附接设备诸如各种辅助设备104a、104b(例如,眼镜类型的用户界面、智能电视或其他用户界面设备)相关的在线行为或其他活动的数据获取和分析。根据该实施方案和所采用的角度,系统110可被认为包括若干用户设备104——可选地为辅助设备104a、104b——以及另外的元件(诸如数据源)。
除了利用用户设备104、104a、104b,优选地经由用户设备中提供的可被称为研究计量器的计量/数据采集应用逻辑105(软件)捕获的用户级数据之外,还可以从若干用户独立的数据源107a(诸如在线服务)获得表示整个目标群体或例如整个目标群体的完整的且严格限定的子集中的特征分布的统计级数据,所述用户独立的数据源可以包括至少一个网络载体、广告网络、广告交换、网站或应用程序分析平台、网络网关、网络代理和/或内容交付/分发平台例如内容管理平台或应用程序商店。可以由关联的数字、连接网络的设备(诸如服务器)通过由系统110经由例如可用的应用程序编程接口(API)发起的轮询或提取程序,和/或通过由数据源/服务器107a本身根据预定的逻辑例如响应于满足触发条件发起的推送机制来提供来自这些数据源107a的数据,所述触发条件可以包括基于定时器的条件(除了其他选项之外,每日、每周或每月进行数据传输)。
系统110被配置成借助于本体元数据方案和若干不同处理技术将在所获得的数据中观察的实体采集、分类并集合到多级分类本体中以恰当地服务目标实体102a,所述目标实体可能包括一个或多个公司、人或基本上任何订购分析结果和/或对分析结果感兴趣的目标群组或客户。即,这些群组可以被提供有所需类型的交付物,所述交付物潜在地包括但不限于经由适当的客户端装置(诸如计算装置和在计算装置上运行的浏览器)可访问和/或可观察的以数字文件或其他表示(有利地包括视觉表示)形式的电子报告。
实际上,用于访问系统110和/或检查交付物的用户界面112可以包括优选地经由一般网络浏览应用程序可访问的、可选地补充有定制的附加模块以增强使用体验的基于网络的用户界面。基于网络的界面可以被配置成允许用户便利地监测最新的或历史数据(分析结果)、识别数据中的变化(趋势等)和/或可选地如果需要的话使用历史或当前的数据通过基于网络的报告界面的交互和反应的部件来执行点对点(ad-hoc)的分析。另外或替代地,可以经由若干其他输出通道,例如经由通过目标应用程序和/或服务可访问的若干应用程序编程接口,或者经由电子邮件来提供交付物。
由于群组的兴趣可能变化,系统110被配置成根据经由UI 112向系统提供的客户端的需求优选地动态地确定分析的范围和/或交付物的范围。除了其他选项外,可以由用户群体、使用的设备、使用的应用程序、应用程序货币化和/或时间因素来限制范围。例如,系统110可以被配置成提供如下一个用户界面112,该用户界面实现用于调节数据分析和/或数据表示的范围的至少一个用户可改变的特征,所述数据分析和/或数据表示的范围选自由以下组成的组:在例如一个或多个目标组/受众方面的过滤器、用以探索的一个或多个度量的选择、范围(例如设备类别、设备品牌、应用程序类别、特定应用程序、网站等)的选择以及所需时间周期(例如“2014年1月”)和/或时间分辨率(例如每日、每周、每月等)。
图2在200处从更多概念和功能的角度表示了系统的一个实施方案。总体的数据(处理)流程在图中由数据采集活动与产生/输出活动之间的水平箭头表明。
在202处,结构研究208被表示为例如在系统中被用作数据校准的基础的一个信息源。
优选地,结构研究208是独立调查或者包括独立调查,以提供用于诸如确定用于(第一)研究小组216招募的所需小组分层(即配额(quotas))的若干动作以及在数据采集过程202期间采集的以及在数据产生过程204期间采集或收集的结果数据的校准的独立基础(潜在地连同统计级数据211一起)。结构研究208可以被实现为离线研究以最大化例如其覆盖范围/代表性。
结构研究208被设计成概述基础统计假设,所述基础统计假设描述研究的群体。结构研究208可用于回答(概念性地)例如以下问题:
●期望市场(例如,某个国家、州、地区或其他地理区域)的(成人)群体的设备所有权特征是什么?
●测量的设备所有者的社会人口统计特征是什么?
可以通过也将实现本发明描述的系统的群组或替代地以方法的某些实现方式来实现结构研究208,所述研究208可以由有信誉的且可信的市场研究供应者或可用的其他社会研究者授权或委托。存在能够提供足够满足以上所列需求的数据、并且能够容易地从第三方研究供应者授权或委托的多种研究方法。
统计数据211可以包括网络统计数据210,该网络统计数据可以例如通过网络通讯或网络活动监测获得,以及具体地例如应用程序商店数据212。优选地,统计级数据描述了各种对象,在一些实施方案中所述对象可以包括设备、用户、服务、应用程序或网站。由此包括在统计级数据中的每个数据集应当提供关于特定数据集应用到的整个群体的聚集的或者实例级(case-level)的特征和信息。统计数据211可与结构数据208一起使用以校准在数据采集过程202中采集的数据以及在数据生成过程204中采集或收集的数据。
元数据214是、包括或者限定了用于限定实体分类法(taxonomy)的本体数据集,所述实体分类法服务用于将在数据采集过程202和数据生成过程204期间发现或观察的实体(例如移动设备、操作系统、访问的网站、应用程序等)分类。该数据可用于:
●将相关数据项分组到如在数据生产过程204期间所需的类别中,和/或
●在交付物206中获得分类组织的数据。
研究计量器217可以实现为软件,该软件被获得、可选地下载到并且安装在数字设备(例如,计算机、智能手机、平板电脑等)上以监测和记录数字设备上的活动。研究计量器可以基本上作用为用于本发明描述的系统和框架的数据的主要源,并且其数据被用于采集:
●关于在第一研究小组(参见以下)216中监测的设备的行为/活动的观察数据,和/或
●关于在第二研究小组218(例如前述的Verto Partner PanelTM)中监测的设备的行为/活动的观察数据。
现在,最后更详细地考虑小组216、218,第一研究小组216优选地是数字设备用户的被动计量小组,应当优选地使用一种选定的且限定的方法来聘用该小组。在一些实施方案中,该方法可以涉及诸如通过弹出窗口拦截、在线访问小组邀请、机会登记拦截促进的CAWI(计算机辅助网络访谈)、CATI(计算机辅助电话访谈)、CAPI(计算机辅助个人访谈)的技术或其他常用的且很好地建立的研究方法。
应当有利地基于从结构研究中得到的目标配额确定小组组成。小组成员将具有安装在他们数字设备上的研究计量器217,并且研究计量器217将随后被动地监测他们的行为。被动计量通常指的是这样的技术,其中软件跟踪用户活动或情景参数,至少在很大程度上运行在所述设备的后台,用户不需要与该软件单独交互。在将这些软件计量器安装到数字设备时,用户可能需要完成安装相关的步骤。在一些实施方案中,运行在这样的设备的一个软件计量可能还产生关于若干其他数字设备上的测量数据,所述其他数字设备例如功能性附接到主设备并且由此可选地无线地与主设备通信的数字设备。
第一研究小组216的一个目的是为消费者行为提供高质量(即,高度受控、良好校准的)数据源。研究样本的大小将提供有限的数据深度(即,长尾数据的有限可用性),然而该小组将专门为那些对象(例如,应用程序、网站、设备制造商、人口统计组等)提供高质量数据,如果仔细实现的话,所述对象的受众/用户足够多。
详细地并且根据研究计量器217的实施方案,并且在数据生成过程204完成时,小组216可以被设计成提供回答例如以下问题的高质量数据:
●在某个市场的消费者中数字设备的使用率和普及率是多少?
●消费者在他们的数字设备上与什么资源(例如,应用程序、网站、媒体)交互?
●消费者如何经由他们的数字设备与上层资源(例如,应用程序、网站、媒体)交互?
●消费者为什么、何时、如何以及以多少数量在数字设备上花钱?
●当考虑具有多个数字设备的消费者时,以上问题在设备之间如何变化?
●应用程序/内容分布、使用、替换和/或增量使用中的趋势是什么?
来自小组216的数据可以形成或被用于形成一个主要的交付物206,并且将体现基于第二研究小组218(例如,Verto Partner PanelTM)得到的输出数据的形式。
如在此提到的,可以基于一组分层的配额来招募小组216,并且可以基于结构研究208的结果确定小组分层。
在被邀请参加第一研究小组216之前(即,在进入抽样框架之前),回答者应当满足若干基本的标准,所述标准可以包括关于例如回答者的年龄以及住所、设备/网络所有权以及可访问性、调查参与历史等的不同要求。
可以用所期望的形式补偿参加小组216的小组成员。应当与产生这样的小组成员的样本供应者一起合作来为每个特定的小组成员确定满意机制和激励处理。激励可以是数字的并且数字地分派,诸如对数字内容、服务、应用程序等的访问或提升的访问/用户权限。
第二研究小组(例如,Verto Parnter PanelTM)18优选地是最有利地经由任意抽样招募的数字设备用户的被动计量小组。在一些情况下,招募可能是间接的,考虑到例如以下情景,在所述场景中研究计量器217由于嵌入在用户最初不是为了参与研究学习的目的而下载的某个面向终端用户的应用程序中而被包括。小组将由如下的用户组成或包括如下的用户,即用户已经:
●安装捆绑有一个或多个移动应用程序的研究计量器217;
●向系统提供他们的人口统计概况数据;和/或
●同意向系统提供匿名数据。
由于默认情况下小组的组成基本上是不受控制的(即,“基本上都是受欢迎的”)或几乎不受控制的,小组218的作用在于开发能够提供深层次的长尾数据的非常大的样本。小组218可以被具体地配置成为大量的对象(例如,应用程序、网站、设备等)提供补充数据。
并且鉴于前述内容,由于样本的人口统计和行为代表性是不受控制的,样本的数据将不用于校准其他数据。替代地,在数据产生过程204期间用更有代表性和受自然控制的数据(诸如来自第一研究小组216的数据和在数据采集过程202中采集的其他数据)来校准来自小组218的数据本身。
更详细地涉及小组218的哲学和相关技术特征,由于在此描述的框架旨在对于其进行报告的对象非常碎片化,在实际情况下,不可能在没有非常大的样本规模的情况下提供关于数字行为的完整的/深度的数据。使用为第一研究小组216(参见以上)设计的严格的程序招募非常多的样本在每个小组成员的基础上将是非常昂贵的。因此,将通过开发优选地在方便的(不受控制的,或“利用任何可能方法的(catch-as-catch-can)”)基础上发展的第二小组218来补充第一小组216。
小组218优选地不限制规模。然而,在一些实施方案中,当通过应用的质量控制和确认过程选择的小组成员的数量超过预定数量例如20,000(两万)时,仅可以在交付物206中包括来自小组218的数据。
在优选的实施方案中,第二小组218的组成不是先验地受控的,但是确认状态被有利地设计以另选择相关回答者包括为事后确认(标签内)的小组成员。
可以从移动设备用户(即,例如iOS、黑莓、安卓和/或Windows移动设备的用户)群体中招募第二小组218的小组成员。例如,小组成员的特定的源可以是那些已经安装了集成有研究计量器217的一个或多个移动应用程序或例如研究SDK(软件开发工具包)的用户。
原则上,已经安装了集成的应用程序的每个用户可以被邀请参加第二小组218。可以经由应用程序本身,使用例如可视消息提供邀请。该参与是基于用户的自愿选择参加的。但是,为了监管和道德要求,可能必要的是在选择参加的同时,用户表明他们的出生年份作为预选的特征(例如,低于18岁的用户将被自动地退出)。
可以执行招募调查以采集关于回答者的基本的/最小的数据,以适当地对他们的数据加权。在小组218的招募调查中采集的基本的人口统计信息可以包括例如设备类型、移动载体、性别、教育、地理位置、家庭规模等。
从若干源技术性地得到用以给巨大的小组成员数据加权的该信息,可选地自动利用例如基于软件的观察、或者集成选择的第三方以描述小组成员、或者使用一些弹出窗口或问卷形式为小组成员实现这一目的。
交付数据206是在此描述的系统的最终输出,但是显然地如果需求出现,接收交付数据的客户102a可以进一步例如用专有工具等确立数据。交付物206包括例如关于设备使用、应用程序/服务使用和用户行为的校准的、处理的和归类的信息,可选地经由基于网络的用户界面使得交付物对客户完全地或部分地可用。替代地,例如可以利用本地应用程序来消耗该信息。
交付物206可以例如在后端体现为单一的、统一的数据库。然而,每个客户可以被指定特定的用户权限以通过可用的用户界面诸如基于网络的界面访问交付物的有限部分。
例如,交付物可以包括选自由以下组成的组的至少一个元素:硬件分布、内容分布、应用程序/内容使用和参与以及应用程序分析。
图11示出了根据本发明的方法的一个实施方案的总体流程图1100,涉及以上解释的主题和特征。
在开始1102处,该系统被增加,这可能指的是获取和配置相关硬件和软件。系统可以包括可选地布置在例如云计算环境中的若干服务器设备。此外,可能已经在这个阶段发起至少第二用户小组的小组成员的“沉默的”招募,例如经由方便的采样以及传递到多个用户设备(诸如移动终端或其他终端,优选地如捆绑有其他软件)的相关的测量、记录和报告软件。而且,例如可以选择统计级数据的供应者并且可以建立必要的数据通信通道。
在1104处,执行结构研究以确定第一研究小组的分层(配额)、测量领域的属性(人口统计等),这些应当被用于小组数据的校准等。然后可以相应地执行小组成员的招募,特别是为第一小组216。
在1106处,优选地从多个源诸如应用程序商店、网络数据供应者等获得统计级数据。
在1108处,从小组成员接收用户级数据。
在1110处,发生数据处理,包括将数据进行组织。校准用户级数据例如用从样本得到的分层数据(从结构研究208)和/或统计级数据如以下将进一步详细描述的那样执行。
在1112处,构建基于采集的统计级数据和用户级数据的交付物。项目1116指的是形成交付物的内容和/或形式的消费者输入(尽管直到项目1112才在图中表明,但是这样的输入可以在各种处理阶段被系统接收并考虑)。
在1114处,方法执行结束。
如在图中由各种虚线回路箭头表明的,如对于本领域技术人员在该公开文本的基础上清楚的,项目的执行可以是并且通常是重复的和/或迭代的。执行顺序还可以根据例如新数据的可用性改变,并且考虑到例如潜在的用户级数据的迭代校准,并行或替代的项目处理可能并且通常将在现实生活的实现中发生。
参考图3,在300处描述了与本发明结合使用的可行的多设备方法的一个实施方案。总体上,在用户102与他/她的设备104、104a之间的通信用实线例示,并且在设备之间的通信用虚线表明。实际上,在本发明的优选实施方案中,即使由于实际原因这些设备中一个或多个不能或将不被配置成执行基于至少全面的软件或硬件的数据采集技术,依然可以跟踪单个用户的多个设备。特别地,系统被优选地配置,使得即使用户102与可附接或可穿戴设备或者外部用户界面(例如是智能手表设备或数字眼镜类型的数字屏幕)交互,也可以采集相关的测量数据。在这些情况中,系统利用所述附接设备或用户界面104a连接到的在中间的所谓主设备104来执行如下功能中的一个或多个:
1.跟踪在附接设备104a和主设备104之间发生的通讯、信号或其他事件。
2.被动地(基于例如一些情景事件触发器)或主动地(例如基于预限定的间隔)轮询附接设备104a的应用程序编程接口(API),以便采集测量数据。
3.在主设备中暂时地或在预定持续时间内存储采集的测量数据。
4.将数据发送到系统的基于网络的数据采集服务器108,以用于分析的目的。
优选地,主设备被配置成跟踪、存储和发送数据,使得最初涉及特定设备(或者主设备本身或者任何附接设备)的数据可以随后被跟踪返回到同一设备。在一种可行的实现方式中,虽然用户可具有指定给他/她的某个用户识别编码或号码(身份标识),设备中的每个(不管他们是否是主设备104或附接(从)设备104a)也具有它们自己唯一的设备标识号,尽管它们中的一些可能相互连接。
除了在分析阶段期间的潜在利益外,这种实现将使得能够将获得的使用数据分解到不同设备和用户界面中。此外,在某些实现方式中,除了指定例如用户身份标识号码和/或设备身份标识号码(对应于主设备)以外,可能存在于主设备中或远程服务器中的处理跟踪/测量的引擎可以被配置成为连接到主设备104的用户界面/附接设备指定或注册用户界面身份标识。
实际上,在很大程度上由主设备104执行并领导测量(例如该设备被用作数据存储和朝向网络的网关,并且处理使用的不同用户界面的身份识别/注册),但可能例如通过附接的、约束的从设备104a发生接合和用户动作的实现方式中,例如可以执行如下技术步骤:
1.在连接到主设备时由主设备或者通过对新连接的动态监听、或者替代地例如通过定期地轮询关于成对的或连接的设备的信息注册新的或现有的用户界面;
2.对于每个设备,跟踪状态信息,优选地包括心跳(设备处于打开状态,即使没有发生与内容、服务、应用程序的活动接合))。
在此处描述的跟踪多设备或多用户界面行为的系统中,主设备104应当有利地记录事件和其他测量数据(潜在地主要包括屏幕快照),而不用这些活动为附接设备104a增加负担。主设备104可以被配置成使用可用的广泛使用的应用程序编程接口或者其他功能呼叫来采集该数据,或者替代地/额外地在一些实现中,主设备可以跟踪更多基础信令通讯通道、HTTP数据(超文本传输协议数据)(由于主设备被用作一种网络网关)或者其他栈或较低层次的应用程序编程接口。
参考图4,在该图中从功能/逻辑401A和硬件角度401B示出了根据本发明的系统400的一个实施方案的内部。
项目412指的是主控制逻辑,其负责从各种源获取数据、在不同实体之间的数据传输、配置管理等。
项目410指的是若干数据存储库,诸如用于存储采集和处理的数据的数据库。
项目414指的是用于将数据组织和分类到多义数据集中的本体元数据方案。
项目416指的是用于输出包含结合的、归类的多级数据的交付物的用户界面,该多级数据是通过处理和分析采集的用户级数据和统计级数据获得的。
项目408指的是在系统或服务器端的用户级数据采集逻辑,而项目402指的是研究计量器217或(研究软件开发工具包),即在用户设备上并且例如与在线/移动服务结合负责数据计量、记录、潜在地处理并且转发的逻辑。优选地,准备该逻辑,使得可以将该逻辑容易地插入到任何在线或移动服务或者应用程序中,并且当人们使用这些特定的服务或应用程序时,则该逻辑在后台被激活,运行测量并且能够向建议的系统的服务器发送测量数据。所有这些可以发生,而不必须向“主应用程序”提供任何界面或配置可能性影响逻辑如何工作。然而,在一些实现中,可以有在逻辑模块中建立的若干选择的“反馈回路”,使得它可以提供信号、数据或其他某些东西返回主应用程序。
为了监督/管理的目的,将优选地随时保持与逻辑402集成的应用程序的列表。可以给予安装集成的应用程序的每个(移动)用户机会以参加(选择参加)第二研究小组218。由此,该已经安装集成的应用程序的用户群体可以为第二小组218建立样本框架。
项目404相应地指的是统计级数据采集逻辑。尽管在图中没有明确表明,在该情况下在远程实体处(例如在运行和/或管理在线服务的服务器处)安装的研究软件开发工具包或相应的数据采集实体也可以被用于数据采集的目的。
项目406指的是数据分析逻辑,其被配置成利用例如方案414验证、结合、校准、处理和组织采集的数据,以获得所期望类型的交付物用于经由用户界面416输出。
硬件方面401B,应用设备诸如服务器和用户设备(主设备和附接设备二者)中的每个可以包括若干处理设备420,诸如用于处理指令和数据的微处理器、微控制器、信号处理器等。进一步地,它们可以包括用于存储程序指令和其他数据(诸如采集的用户级和/或统计级数据、经处理的数据、本体方案、交付物等)的存储器(芯片)422。
数据接口426可能指的是例如可以为有线或无线的对等接口或网络接口。服务器型设备通常包括具有例如以太网或其他局域网型连接手段的(有线)网络适配器,而移动用户设备通常可以包括用于访问互联网和/或与附近的其他设备通信的若干无线收发器,例如蜂窝收发器(例如3G)和/或WLAN(无线局域网)或蓝牙收发器。还可以包括标签阅读器(例如,RFID(射频识别)或NFC(近场通信))。用户界面可以包括显示器424和数据输入设备430(诸如键区、键盘、触摸界面(例如触摸屏)等)。此外,设备通常包括各种其他元件428,诸如一个或多个传感器、电源部件、外壳等。
用于通过若干计算机设备执行本文所述的方法步骤和总体的程序的程序代码(软件)可以大体上设置在载体介质(诸如存储卡或光盘)上或者通过有线或无线通信介质被传输。
参考图5,在500处示出了经由统计数据211测量的不同潜在群体之间的联系。即,在统计数据211中包括的数据可以被划分为独立的且不相关的数据集,数据集中的每个报告关于整个用户群体(或者“计算机用户”510、“移动网络用户”512或者“移动非网络用户”508)的特定子集的数据。
前述三个群体有可能重叠:个人可以同时是计算机用户、移动设备用户以及移动设备应用程序用户。然而,不同统计数据提供者通常将具有在这三个子群体中的每个中的不同范围。
为了为统计数据211提供可靠的数据以用于在校准中使用,优先选择统计数据供应者,使得同时最大化(优选地接近100%)这三个群体中的每个中的范围,并且最小化(优选地接近0%)在统计数据供应者之间特定用户被两次计数的可能性。
实际上,在全部三个测量子群体之间可靠地接近100%范围的一种方法是结合多个统计数据源。然而,由于必须最小化特定唯一用户已经被两次计数的可能性,在这些统计数据源之间重叠的受众必须先验地被最小化。推荐的是实施本发明的系统的人员仔细选择统计数据供应者,以精确地确定他们在测量的每个子群体中和每个子群体之间的范围和重叠。
为了校准的目的,优选地相对其他数据源在及时的基础上(例如每月)处理和比较统计数据,并且调整校正运算使得例如关于使用中的设备数目或激活的新设备的公布估计值尽可能地接近真实数目。
统计数据可以以原始级形式获得,包括例如对于关于用户或设备类型相关的每个领域,公开在某个时间期间所看到的唯一用户的名义或相对数量和/或例如对于某个国家在某个时间期间观察到的动作的名义或相对数量的表。
在一些实施方案中,系统可以被配置成利用在提供的原始级信息中的原始级字符串来自动地或半自动地(例如,用人力管理)识别用户类型、设备类型以及使用的应用程序。原始级字符串可以包括,例如用作标识符的数据的字母数字片段。类似地,基于例如任何设备相关的身份标识(诸如序列号),设备的暂时的或永久的唯一的号码可以算是统计数据的任何设备和/或应用程序专用部分。
在本发明的一些实施方案中,可以招募小组216、218,而不需要控制在小组相应的样本分层中的行为偏差的技术手段。
虽然结构研究208提供了人口统计控制和校准的一些测量,其声明基础使得其行为价值对于校准小组216、218的行为代表性没有多大意义。
在一些情况下,统计数据可以包括反映用户、设备或服务的整个限定的子群体的行为的特定数据点。可以使用这样的统计数据,以校准由前述无能引起的任何不经意的行为偏差,从而将行为特征纳入相应小组216、218的样本分层。可以提供在校准中使用的统计级行为数据的统计数据的一个实施例是关于在移动应用程序商店(应用程序商店)中可获得的应用程序的统计级信息,其被表示为应用程序商店数据212。
切换到图6,应用程序商店数据或类似的数据可以被机器人/爬行器巧妙地采集,所述机器人/爬行器被编程以例如定期扫描公开可用的或专有的接口,在图中600处例示了其实施方案。
例如每天(每24小时一次),本发明的系统可以被配置成可选地经由适当的应用程序编程接口连接到监测的应用程序商店或其他或多或少对应的内容交付/发布平台,并且通过在应用程序商店列出的每个应用程序迭代。关于每个应用程序,系统可被配置成记录例如一个或多个数据点,诸如讨论中的应用程序商店、时间戳、讨论中的应用程序名称等。
关于每个应用程序,系统可以被配置成记录例如以下数据项目的一个或多个:
●应用程序商店。表明从其中采集数据的应用程序商店的唯一标识符。
●时间戳。表明何时从应用程序商店采集数据的世界标准时间(UTC)时间戳。
●应用程序标识。讨论中的应用程序的身份标识编码或名称(或其他唯一标识符)。
●关于排名列表中应用程序位置的信息。
●应用程序目录。描述如何分类应用程序的数据。
应用程序商店爬行器可以具有主服务器单元608,该主服务器单元能够将数据存储到原始数据库612中并且访问元数据存储610,该元数据存储包括关于已经扫描的且分类的应用程序的信息以及例如应用程序商店爬行器的状态。
然后,应用程序商店爬行器可以被配置成利用多个不同用户账户和/或其他面向仿真器的特征以“假扮”或仿真例如特定无线设备或特定用户,和/或通过使用代理/VPN(虚拟专用网络)隧道606或者通过直接访问应用程序商店的应用程序编程接口(有时公开的,有时私人的),部分地(in patches)或者一个接一个地从例如不同国家中的不同应用程序商店实例602、604请求信息,并且因此将相关数据抓取到平台。由此系统可以被设计成使用面向仿真器的特征和/或其他技术,如选择的隧道和动态IP地址方案,以高效地爬行不同供应者、国家和本地化的应用程序商店的应用程序编程接口。
因为通常没有或者至少不是全部可用的应用程序商店公布(公开地)每个应用程序的实际下载数量,可以基于为每个应用程序采集的各种数据点(诸如但不限于特定国家的应用程序排名、用户评级得分等)来估计下载数量。
图7在700处描述了如下一个实施方案的不同方面,该实施方案关于基于以例如排名和/或评级(涉及估计的目标实体)形式的可用信息的下载统计(例如,下载数量)的创新估计技术。通过该解决方案,除了其他用途之外,其能够为各种各样的应用程序集合产生估计。
许多应用程序商店(诸如iTunesTM和Google PlayTM)的确会公布智能手机应用程序的一些类型的排行榜和例如评级,但是它们不会至少综合地公布不同应用程序的实际下载数量。然而,对于移动应用程序市场中从应用程序开发者到市场研究人员的许多人员对下载信息具有很大的兴趣。优选地,在若干源(诸如前述应用程序商店)中仍然有关于应用程序的公开地可用的排名信息。为了使用关于每个应用程序公开地可用的信息并且除了其他因素之外依赖由讨论中的应用程序商店为每个应用程序公布的排名位置来估计列在应用程序商店中列出的应用程序的例如每日下载数量,接着在下文描述许多种方法。
在介绍进一步的细节之前,首先假设在给定应用程序商店中的排名位置与由给定应用程序实际经历的(每日)下载数量之间的良好限定的数学关系的确存在,并且该排名位置数据可用。此外,在确定若干模型参数时需要一组地面真实(ground truth)数据。
由此,通过例如从应用程序商店为给定的一组应用程序获得的(每日)排名位置数据以及例如从地面真实数据的独立源得到的若干恰当确定的模型参数,使得能够使用数学模型来估计每个所期望的时间参考的下载量,诸如在此取作实例的前述每日下载量。
关于模型本身,先前已经建议了一个简单的幂律模型,但是当相对地面真实数据监测时,存在提供不同精确度的若干其他选项。特别地,阐明以下模型:
指数的:
d(r)=a*exp(b*r)
对数-正态的:
d(r)=a/rb*exp(c*log2(r))
具有指数截断的幂律:
d(r)=a/rb*exp(c*r)
洛马克斯(Lomax):
d(r)=a(1+b*r)c
其中,d(r)指的是(每日)下载量,以及r指的是排名。虽然建议的指数模型仅具有两个参数,但其余的模型具有允许建模更复杂的关系的三个参数。例如,对数正态模型包括如下参数:比例参数a,以及确定模型的坡度和曲度的形状参数b和c。
建议的方法涉及以下步骤:
1.假设模型702。在建议的方法的第一步中,假设应当使用的数学模型。例如,可以(并且优选地)考虑前述的指数的、对数正态的、具有指数截断的幂律以及洛马克斯模型。
2.拟合参数704。给定假设的模型,使用外部数据712、714(诸如已知的排名位置和下载数据)来将参数拟合到模型,以获得重申的模型706。可以通过将模型转换到它们的对数形式来便于该处理。
幂律:
log(d(r))=log(a)+b*log(r)
指数的:log(d(r))=log(a)+b*r
对数正态的:
log(d(r))=log(a)-b*log(r)+c*log2(r)
具有指数截断的幂律:
log(d(r))=log(a)-b*log(r)+c*r
洛马克斯:
log(d(r))=log(a)+c*log(1+b*r)
3.对于每个目标应用程序,利用708重申的模型构建下载估计710。已经将参数拟合到模型后,根据可用的外部数据716,应用例如以下描述的两个算法中的一个为特定的应用程序估计下载数量。
算法1指的是其中当前(每日)数据可用的情况。当外部(地面真实)数据对应用程序的样本是本质上每日的且当前可用的时,能够使用以上描述的参数化/拟合的模型中的任何一个为该样本外的具有给定排名r的应用程序估计下载数量。实现该算法的过程可以采取以下步骤:
1.对于选择的模型,通过假设如从外部(地面真实)数据获得的r的值并且使用算法形式的应用程序模型来估计除了r的所有参数的值,以估计其余的参数。
2.重申选择的初始模型,应用来自(1)的估计的参数值代替模型中表明的参数。
3.在给定的一天中假定应用程序排名r,则可以通过计算在(2)中确定的公式来估计在该给定的一天中该应用程序的下载数量。
算法2指的是其中外部(地面真实)数据具有不连续可用性的情况,使得最初有可用的每日数据并且随后仅有可用的每月数据。然后仍然能够使用以上所述的参数化/拟合的模型中的任何一个为具有给定排名r的应用程序估计下载数量。
实现算法2的过程包括:
1.通过在每日数据可用时计算基于时间周期内的该每日数据准备的每日模型上的适当的参数的平均值,估计可适用的形状参数。
2.通过以下估计比例参数a:
(a)取如在先前两个月内的外部数据中看到的最高下载值;
(b)将从(a)得到的每个值除以30以确定先前两个月的每天内每日下载数量的线性估计,以及;
(c)使用从(b)得到的值,线性推断当前日期(或讨论的日期)内的下载数量d。基于d并且如果需要基于从(1)得到的形状参数,估计参数a。
3.重申选择的初始模型公式,将从(1)和(2)得到的参数值应用代替模型中的参数。
4.在给定的一天中假定应用程序排名r,然后可以通过计算(3)中确定的公式估计在该给定的一天中该应用程序的下载数量。
参考图8以及在800处描述的情景,在用户设备处运行的研究计量应用程序逻辑217被配置成提供数字设备的观察/记录小组成员使用的被动方式。具体地意味着被动地观察、记录并且上传814小组成员活动的日志812到系统的服务器以用于存储和分析816、818。
计量逻辑217存在于被计量设备的存储器中。当在设备上发生特定事件808时,计量器217被触发804并且关于事件的信息被记录806、810。
日志文件管理和传输遵循以下规则和程序中的一个或多个:
●对于特定的小组成员和具体的计量设备,鉴别每个日志文件,
●在被计量设备上本地存储日志文件,
●在被计量设备上使用相关的压缩算法将日志文件本地压缩,
●基于互联网连接的可用性将日志文件异步传输到“等待的”(802)远程服务器,
●为最小化对设备性能的影响,仅当互联网连接可用时发起日志传输,和/或
●在延长时间段内没有互联网连接可用的情况下,将在被计量设备上本地存储最高达预定数量(例如约10MB)的日志文件。
由计量软件217采集的数据将被分成多个(例如,三个)概念类别:
●事件元数据:这是描述事件情景(context)的信息,并且优选地在由研究计量器登记的每个类型事件之间相同;
●事件数据:这是专用于记录事件的信息,并且事件数据的内容可以根据已经记录的事件类型可以改变;和/或
●心跳数据:这是通知系统小组成员/设备保持“活动的”并且连接到互联网的信息。
由计量器217记录的事件数据将优选地主要地由系统的服务器处理,这是为了:
a)清除数据,
b)在需要的地方,将事件元数据连接到底层事件,
c)将标识符映射到相关实体,和/或
d)从记录的数据计算度量。
由研究计量器217记录的每个事件将优选地记录以下元数据中的至少一些,例如:
●小组成员/设备ID。这是识别特定小组成员和具体计量的设备的唯一标识符(小组成员/设备的鉴别性特征)。
●时间戳。这是表明事件何时发生的UTC(世界标准时间)时间戳。
●地理位置。这是关于当事件发生时客户端用户的地理位置的技术信息。如果可以在地理位置坐标的水平上捕获该信息(通过机载全球定位系统或者无线定位软件),则其将是理想的。该数据点可以接受“未知”值。
计量器217可被配置成利用外部服务器来采集若干选择的数据点,该数据点优选地还经常与在设备本身中运行的设备上的计量器相关。这样的实施方式的一个示例性设置将是VPN(虚拟专用网络)或代理服务器,通过它们可以引导且单独地记录所有或一些超文本传输协议数据。
设备上的计量器217可以发起该类型的概况设置,通过该概况设置外部服务器可以用于这样的数据记录目的,并且设备上的计量器217将主动地完成以下两项中的至少一个:
1.通过使用定制的概况设置或通讯中隐藏的鉴别性特征,鉴定和识别用户以促进识别小组成员或设备,并且使得其与设备上的计量器本身正直接采集的数据相当/有关系。
2.通过使用一些同步或隐藏的跟踪或者积极的超文本传输协议数据包传输来匹配时间戳,以产生一个过程,通过该过程可以完美地匹配设备上的计量数据的时间戳和在外部服务器处采集的数据的时间戳(这涉及创建在设备上与外部服务器的记录之间的所谓偏移值)。
计量器217的一个另外的特征是所谓的情景数据处理器,该处理器被配置成将情景信息增加到任何记录的活动,不管记录的活动发生在研究计量器本身中还是在单独的服务器中。该情景处理器可以被配置成将位置信息、设备性能信息和/或屏幕状态信息增加到任何测量。该特征的一个实用目的是将关于用户活动和屏幕状态的信息增加到从外部(许多是虚拟的)服务器(像虚拟专用网络或代理服务器)采集的数据。因此,在任何设备中,积极的使用通讯可以与背景通讯活动分离,积极的使用意味着屏幕打开并且用户正在积极用设备做事情。
为不同事件记录的信息量取决于被记录的事件的性质。采集的事件可以与应用程序使用、互联网页面请求、发出的语音呼叫等相关。
在其原始形式中,由计量器217采集的数据将是非常细粒度的并且可以包含成千上万的网站、移动应用程序、操作系统、用户代理和移动设备。在数据产生过程和数据交付过程中该数据的颗粒性产生了两个独立的问题:
●数据粒度配准。对数据产生过程重要的数据(即,结构研究数据、应用程序商店数据、超文本传输协议数据)是在与计量器217采集的数据的不同的粒度水平下采集的。为了计算和应用从这些部件得到的比例/比率因素,必须对高度颗粒化的数据分类,以使其与较小粒度的数据源配准。
●客户体验。为了客户交付物可导航且可读,客户提供有浏览和搜索他们感兴趣的特定实体(即,网站、移动应用程序、操作系统、用户代理、移动设备)的能力是很重要的。虽然搜索体验可以支持高度颗粒化的数据,但是对交付物等的浏览经验不能经由系统用户界面支持高度颗粒化的数据:将不可能在颗粒水平下包含的成千上万的实体中发现特定的实体。
高效地解决全部这些问题的一种可行方法是开发用于管理元数据214的系统。存在于元数据管理系统内的元数据将在数据生成过程期间被使用并且将对生成最终交付的数据集至关重要。
前述元数据214被用于分类/组织如下实体,所述实体在例如研究计量日志文件、应用程序商店数据212、大体上的统计数据211和/或结构研究数据208内可观察到。因为在此描述的框架包含各种概念实体,该框架应当同时支持多义本体方案。通常,这些方案可以被分成两个不同的类别:
●单义方案。包含在单义方案下的实体具有一个规范(canonical)分类方法。它们的层次由例如管理和更新系统和相关逻辑的系统工作人员规范地限定。
●多义方案。指定到多义方案的实体将具有多个规范组织方法。根据他们特定的商业需求,不同受众的客户端将可能具有不同的实体分类方法。根据由工作人员限定的编辑规则,每个多义方案应该是它们自己的组织方法并且应当被视为规范的。
因为由在此描述的框架测量的许多实体本质上是多义的,这意味着将有多个不同的规范方案,本发明描述的系统根据所述规范方案公布其数据。
参考图9,这些方案中的每个可以从如图中表明的一个或多个源得到。分类编辑器902可以包括例如实现整个方法的实体。可以将由系统工作人员使用例如客户建立的元数据管理系统开发和维护的一个或多个方案假设为“默认”规范方案。此外,考虑到例如在应用程序商店可用的应用程序通常已经被它们的开发者/应用程序商店本身分类的事实,例如应用程序商店914和技术供应者920可以提供分类方案。可以建立系统分类906。然而,例如所提供的报告工具的终端用户可以限定他们自己的分类和类别912,然后通过应用所述分类和类别将数据呈现给他们。
通常,在本发明的情况下,提供期望主题的可靠的、客观的交付物进一步需要验证小组数据并且利用可用的手段校准该数据。
因此,优选地自动地在接收到小组数据时,系统被配置成预处理该数据。特别地,可以采取以下步骤:
●验证小组成员:使用可用于涉及的小组216、218的验证规则来验证小组成员。验证之后,已经被标记为有效的这些小组成员(即,来自小组成员的数据)可以经历进一步的预处理步骤。
●计算度量和/或数据重组。为了加速计算交付物,来自验证的小组成员的原始日志被处理,以确定预定的度量和/或将数据组织到有助于进一步分析的结构中。
●关联元数据。在计算原始数据的必要的度量/重组的同时,记录与相应的元数据条目关联。
预处理小组数据之后,可以使用数据诸如统计级数据211和/或从样本得到的分层数据(可选地结构研究208)来执行校准动作。
校准过程可能是并且通常是半手动或半自动化的过程,潜在地需要例如分析员来计算各种值、将所述值输入到分析系统中、运行计算过程、分析结果并且在需要的时候重复该过程。
概念性地,校准过程可以包括以下阶段:数据复查(review)、控制值计算以及应用一个或多个处理算法诸如搜索算法,以基于建立的控制值为用户级数据确定恰当的校准加权值。
图10仅通过总体实施例的方式例示了样本复查程序的一个实施方案,该样本复查程序用于校准变量和类别选择以使得能够控制值确定。本领域技术人员应理解的是他/她可以调整例如例示的程序,或利用替代的程序,以更好地实现由本发明的每个真实生活使用场景所设置的设计目的。
实际上,可以分析可获得的样本数据1002,并且可以确定例如以下标示:
●类别频率1004,用于校准变量的在验证的小组成员之中的个人类别频率(例如,作为总的未加权的样本中性别为男的百分比)。
●名义总数/方法1006,名义的校准变量的总数值(即,总的移动应用程序下载)和名义的校准变量的平均值。
●类别情况计数1008,用于全部校准变量的在验证的小组成员之中的每个类别中的未加权的实例数(例如,具有性别:男的实例数目)。
基于以上计算,选择的类别可能被缩减(在预定阈值下的频率/计数)以增强例如校准的稳定性。校准变量和类别的优化的集合将被形成1010。
最后,系统被配置成基于这些校准变量和类别通过利用可获得的统计级数据211和例如由结构研究208提供的数据来计算控制值1012。
校对之后,交付物可以进一步经历一系列选择的质量控制检查。在更新结构研究校准数据之后,可以例如按月仔细地实施该质量控制过程。在质量控制程序期间,可以使用如由技术人员理解的任何适合的方法检查数据稳定性和精确度二者。
最终,可以将交付物存储在至少一个数据存储库诸如在系统后端上的数据库,并且可以授权客户经由系统用户界面访问特定的数据项目。
特别地,可以经由基于网络的界面将数据发送到订阅客户。该基于网络的界面可以符合以下特征中的一个或多个:
●与主流浏览器(即,MSIE、火狐(Firefox)、Chrome、Safari)兼容。
●通过加密套接字协议层(SSL)发送。
●所有客户之间相似的功能/外观和感觉(即,客户组之间的可用的数据/内容可能不同,但工具保持相同)。
以上,详细地讨论了本发明的各种实施方案。这些实施方案总体上涉及移动设备和互联网设备以及连接到无线或有线通信网络的其他类似的设备,并且示出了通常可以如何利用可用的移动和互联网设备以自动地和被动地收集关于终端背景的数据(诸如网络或设备参数或性能)或者关于与该特定设备或其他环境设备或网络的使用相关的用户行为的数据,以及最终如何基于采集的数据将所有该数据注入到创建缓存的或实时分析和不同类型的派生信息的系统中,并且可以将该数据与从其他设备得到的数据或与其他人相关的数据组合,并且最终通过各种应用程序将确立的数据呈现回用户或其他接收者。
然而,本领域技术人员将认识到范围不限制于明确公开的实施方案,而是还覆盖落在权利要求措辞下的其他实现方式。

Claims (29)

1.用于获得和分析数据的系统(100、108、110),所述数据关于与可连接互联网的用户设备有关的在线用户(102)行为和其他活动,所述用户设备可选地为移动设备,所述系统被配置成:
从多个数据源采集(404、408)数据,其中,采集的所述数据至少包括从用户设备(104、104a、104b、105、217、402)获取的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据(107a、211),其中所述用户级数据是优选地使用具有受控的构成的至少一个用户研究小组(216)采集的,进一步优选地是从用户小组中的每个参与者的多个设备(104、104a、104b)采集的,采集的所述数据表明互联网(107)、内容、媒体、应用程序和/或设备使用,
利用本体的元数据方案(214、414)将获得的用户级数据和统计级数据组织(406)到分类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据和所述统计级数据的结合确定电子交付物(112、206、416),其中统计级数据被用于校准用户级数据,
就关于使用的设备或在线行为的若干感兴趣因素而言,所述交付物具有动态可选择的范围,所述范围优选为用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
2.根据权利要求1所述的系统,其中,采集的所述数据进一步包括从样本得到的统计分层数据(208),所述统计分层数据估计用户群体上的人口统计特征的分布,所述系统被配置成还将所述分层数据组织到所述数据集中,并且在确定交付物时利用所述分层数据,所述确定交付物包括校准所述用户级数据。
3.根据权利要求1所述的系统,被配置成从具有受控的构成且具有第一数目的参与者的第一用户研究小组(216)和具有降低的注册要求且具有更多数目的参与者的第二用户研究小组(218)采集(217)用户级数据。
4.根据权利要求3所述的系统,被配置成使用统计级数据——可选地为从样本得到的分层数据——以及借助于所述第一用户研究小组获得的用户级数据校准通过所述第二用户研究小组获得的用户级数据。
5.根据权利要求1所述的系统,其中,所述本体的元数据方案包括统一的元数据数据库,所述元数据数据库描述相互关系并且提供匹配概念和对象,即使所述元数据数据库在提供采集的所述数据但反应相同主题的不同平台和数据源中被不同地测量和反映。
6.根据任一前述权利要求所述的系统,其中,所述元数据方案包括用于分类和组织数据的多个规范方案,其中可选地存在若干单义方案和多义方案,进一步可选地所述规范方案中的一个或多个用于生成由交付物接收者动态地选择的交付物。
7.根据任一前述权利要求所述的系统,被配置成利用所述元数据方案以通过数据分类将较大粒度的用户级数据与较小粒度的统计级数据配准。
8.根据任一前述权利要求所述的系统,被配置成利用安装在所述用户设备——可选地为无线终端设备——处的测量和记录应用程序(217)来采集用户级数据。
9.根据任一前述权利要求所述的系统,被配置成利用与旨在用于其他用途的软件集成的测量和记录逻辑(217)来采集用户级数据,所述逻辑与所述软件捆绑。
10.根据任一前述权利要求所述的系统,被配置成采集表明经由设备的传感器——可选地为摄像机——或传声器获得的、用户设备外部的行为或情景事件的用户级数据。
11.根据任一前述权利要求所述的系统,其中,用于使能用户级数据采集的在用户设备(104、104a、104b、217、402)处的测量和记录逻辑包括选自由以下组成的组中的至少一个特征:表明设备或用户活动周期的心跳数据采集器和/或相对于互联网的连接性周期、用户认证、用户识别、用户身份记录、事件数据记录、事件元数据或情景数据记录、时间戳记录、地理位置记录、WiFi状态记录、在线状态记录、载体记录、漫游状态记录、定位模式记录、下载数据记录、上传数据记录、设备上的数据和外部设备提供的数据的匹配和记录。
12.根据权利要求1所述的系统,被配置成通过具有多个用户设备的用户的一个或多个主设备(104)采集所述用户级数据,其中,存在功能性连接到所述主设备中的一个或多个的若干其他用户设备(104a、104b),通过相应的主设备测量所述其他用户设备的使用,所述主设备充当朝向所述系统的数据采集和连接节点。
13.根据权利要求12所述的系统,其中,主设备被配置成执行选自由以下组成的组中的至少一个动作:跟踪和记录在附接设备和主设备之间发生的数据通讯、信号或其他事件;被动地或主动地轮询一个或多个功能性附接设备的应用程序编程接口(API)以采集测量数据;暂时地或在预定的持续时间内存储采集的测量数据;以及将数据发送到一个或多个基于网络的数据采集服务器以用于分析。
14.根据任一前述权利要求所述的系统,被配置成从或经由若干互联网网络中心数据源(107a、602、604)获得统计级数据,所述互联网网络中心数据源包括选自由以下组成的组中的至少一个元素:网络载体、广告网络、广告交换、网站或应用程序分析平台、网络网关、网络代理、内容管理平台、应用程序(APP)商店以及其他内容交付或分发平台。
15.根据权利要求1所述的系统,被配置成从互联网网络中心数据源获得表明对象特征的分布和/或规模的统计级数据。
16.根据权利要求15所述的系统,其中,所述统计级数据包括数据点,所述数据点表明一个或多个限定的用户群体、设备、应用程序、服务或网站在每个预定时间期间的行为,可选地为每天的行为。
17.根据任一前述权利要求所述的系统,被配置成从至少一个内容分发平台(602、604)获得关于若干应用程序的统计级数据,所述内容分发平台可选地包括应用程序商店或数字市场。
18.根据任一前述权利要求所述的系统,被配置成利用爬行器或机器人逻辑实体连接到至少一个应用程序商店(602、604)或其他远程内容分发平台,所述爬行器或机器人逻辑实体被配置成为了获得所述统计级数据,执行选自由以下组成的组中的至少一个动作:仿真与平台关联的用户或用户设备;应用平台相关的API(应用程序编程接口);连接到系统与平台之间的代理(606);以及应用VPN隧道技术。
19.根据权利要求17或18所述的系统,被配置成估计(700)应用程序的下载数量,所述估计基于应用程序的排名位置和应用所述排名位置以提供所述估计的模型进行。
20.根据权利要求19所述的系统,被配置成利用选自由以下组成的组中的至少一个模型:指数模型、对数正态模型、具有指数截断的基于幂律的模型以及洛马克斯模型。
21.根据权利要求19或20所述的系统,其中,基于排名位置信息——优选地为每日排名位置信息——估计每日下载数量。
22.根据权利要求17至21中任一项所述的系统,被配置成使用从所述至少一个内容分发平台获得的所述统计级数据来对基于用户级数据得到的行为估计进行质量控制和/或校准所述用户级数据。
23.根据任一前述权利要求所述的系统,被配置成基于所述统计级数据确定若干人口统计和行为校准因素用于所述用户级数据以进行校准。
24.根据任一前述权利要求所述的系统,包括若干功能性连接的服务器(108)。
25.根据权利要求24所述的系统,进一步包括多个用户设备(104、104a、104b)并可选地包括若干提供统计级数据的网络中心提供数据源。
26.根据任一前述权利要求所述的系统,被配置成基于统计数据估计用户设备的用户基础以及可选地估计该用户基础的改变速率,所述统计数据优选地包括互联网网络中心数据。
27.一种用于获取和分析数据的方法(1100),所述数据关于与可连接互联网的用户设备有关的在线用户行为和其他活动,所述用户设备可选地为移动设备,所述方法包括:
从多个数据源采集(1106、1108)数据,其中,采集的所述数据至少包括从用户设备获取的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据,可选地还包括从样本得到的统计分层数据,所述统计分层数据估计用户群体上的人口统计特征的分布,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组采集的,进一步优选地是从所述用户小组中的每个参与者的多个设备采集的,采集的所述数据表明互联网、内容、媒体、应用程序和/或设备使用,
利用本体的元数据方案将获得的用户级数据、统计级数据以及可选的从样本得到的分层数据组织(1110)到分类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据、统计级数据以及可选的从样本得到的分层数据的结合确定电子交付物,其中统计级数据和可选的从样本得到的分层数据被用于校准用户级数据,
其中,就关于使用的设备或在线行为的若干感兴趣因素而言,所述交付物(1112)具有动态地可选择的范围,所述范围优选为用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
28.一种计算机程序,所述计算机程序包括代码装置,当在计算机上运行时,所述代码装置适于获得和分析关于与可连接互联网的用户设备相关的在线用户行为和其他活动的数据,所述用户设备可选地为移动设备,包括
从多个数据源采集数据,其中,采集的所述数据至少包括从用户设备获取的个人用户级数据和表明整个用户群体、活动设备或测量的服务上的行为和人口统计特征的统计级数据,并且可选地还包括从样本得到的统计分层数据,所述统计分层数据估计用户群体上的人口统计特征的分布,其中所述用户级数据是优选地使用具有受控的构成的至少一个用户小组采集的,进一步优选地是从所述用户小组中的每个参与者的多个设备采集的,采集的所述数据表明互联网、内容、媒体、应用程序和/或设备使用,
利用本体的元数据方案将获得的用户级数据、统计级数据以及可选的从样本得到的分层数据组织到分类数据集中,所述数据集优选是多义的,以及
基于所述用户级数据、统计级数据以及可选的从样本得到的分层数据的结合确定电子交付物,其中统计级数据和可选的从样本得到的分层数据被用于校准用户级数据,
其中,就关于使用的设备或在线行为的若干个感兴趣因素而言,所述交付物具有动态地可选择的范围,所述范围优选是用户可选择的范围,所述感兴趣因素优选地包括应用程序使用、应用程序分布、内容使用、内容分布、应用程序货币化、用户人口统计、设备分布、设备特征、设备使用和/或时间因素。
29.一种包括根据权利要求28所述的计算机程序的载体介质。
CN201480078454.9A 2014-02-26 2014-02-26 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构 Pending CN106663258A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI2014/050140 WO2015128536A1 (en) 2014-02-26 2014-02-26 Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology

Publications (1)

Publication Number Publication Date
CN106663258A true CN106663258A (zh) 2017-05-10

Family

ID=54008222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480078454.9A Pending CN106663258A (zh) 2014-02-26 2014-02-26 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构

Country Status (6)

Country Link
EP (2) EP3111399B1 (zh)
JP (1) JP6419206B2 (zh)
CN (1) CN106663258A (zh)
AU (2) AU2014384203A1 (zh)
ES (1) ES2707978T3 (zh)
WO (1) WO2015128536A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197177A (zh) * 2017-12-21 2018-06-22 北京三快在线科技有限公司 业务对象的监测方法、装置、存储介质和计算机设备
CN110032370A (zh) * 2019-04-16 2019-07-19 北京中电普华信息技术有限公司 信息采集方法及相关装置
CN111352973A (zh) * 2020-03-02 2020-06-30 武汉中旗生物医疗电子有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN111489218A (zh) * 2019-01-28 2020-08-04 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN115943618A (zh) * 2021-06-04 2023-04-07 互动解决方案公司 使共享者检测屏幕共享时的相同性的系统及使共享者检测关于所输入的回答栏的信息的系统

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682027A (zh) * 2015-11-10 2017-05-17 网易(杭州)网络有限公司 一种应用软件的玩家数据估算方法
US10754860B2 (en) * 2016-11-01 2020-08-25 Futurewei Technologies, Inc. Apparatus and method for ranking content categories
US11074599B2 (en) * 2016-12-08 2021-07-27 App Annie Inc. Determining usage data of mobile applications for a population
IT201700105724A1 (it) * 2017-09-25 2019-03-25 Matthaeis Andrea De Metodo per l’estrapolazione di dati da più canali di comunicazione e apparato per l’implementazione di detto metodo
JP2022528981A (ja) 2019-04-15 2022-06-16 スポーツ データ ラボズ,インコーポレイテッド 動物データの収益化
US20220091873A1 (en) 2020-09-24 2022-03-24 Google Llc Systems and methods for cross media reporting by fast merging of data sources
KR102236194B1 (ko) * 2020-11-03 2021-04-05 한국과학기술원 유전자들의 기능 그룹 지표 선정 방법, 질병 판별 시스템 및 이의 동작 방법
CN112965969B (zh) * 2021-03-08 2024-05-07 咪咕文化科技有限公司 统计数据的补录方法、装置、电子设备及存储介质
EP4302185A1 (en) * 2021-03-24 2024-01-10 Data.Ai Inc. Fast estimation of downloads for apps at launch

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117463A (zh) * 2009-12-30 2011-07-06 纳夫特克北美有限责任公司 提供网络使用数据和简档信息的用户控制的系统和方法
US20120089697A1 (en) * 2010-10-07 2012-04-12 Yahoo! Inc. Multisided audience-related hybrid measurements
US20120158959A1 (en) * 1999-08-06 2012-06-21 Lim Or Sim Network resource monitoring and measurement system and method
CN103119565A (zh) * 2010-09-22 2013-05-22 尼尔森(美国)有限公司 利用分布式人口统计信息确定印象的方法和装置
CN103154928A (zh) * 2010-06-24 2013-06-12 奥比融移动有限公司 用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法
WO2013109916A1 (en) * 2012-01-19 2013-07-25 Nike International Ltd. Multi-activity platform and interface
WO2013112312A2 (en) * 2012-01-27 2013-08-01 Compete, Inc. Hybrid internet traffic measurement usint site-centric and panel data
US20130198125A1 (en) * 2012-01-26 2013-08-01 James R. Oliver Systems, methods, and articles of manufacture to measure online audiences
CN103295148A (zh) * 2012-02-27 2013-09-11 埃森哲环球服务有限公司 数字消费者数据模型和客户分析记录

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9331892B2 (en) * 2009-03-09 2016-05-03 The Nielsen Company (Us), Llc System and method for automatic sub-panel creation and management

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158959A1 (en) * 1999-08-06 2012-06-21 Lim Or Sim Network resource monitoring and measurement system and method
CN102117463A (zh) * 2009-12-30 2011-07-06 纳夫特克北美有限责任公司 提供网络使用数据和简档信息的用户控制的系统和方法
CN103154928A (zh) * 2010-06-24 2013-06-12 奥比融移动有限公司 用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法
CN103119565A (zh) * 2010-09-22 2013-05-22 尼尔森(美国)有限公司 利用分布式人口统计信息确定印象的方法和装置
US20120089697A1 (en) * 2010-10-07 2012-04-12 Yahoo! Inc. Multisided audience-related hybrid measurements
WO2013109916A1 (en) * 2012-01-19 2013-07-25 Nike International Ltd. Multi-activity platform and interface
US20130198125A1 (en) * 2012-01-26 2013-08-01 James R. Oliver Systems, methods, and articles of manufacture to measure online audiences
WO2013112312A2 (en) * 2012-01-27 2013-08-01 Compete, Inc. Hybrid internet traffic measurement usint site-centric and panel data
CN103295148A (zh) * 2012-02-27 2013-09-11 埃森哲环球服务有限公司 数字消费者数据模型和客户分析记录

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197177A (zh) * 2017-12-21 2018-06-22 北京三快在线科技有限公司 业务对象的监测方法、装置、存储介质和计算机设备
CN108197177B (zh) * 2017-12-21 2019-12-17 北京三快在线科技有限公司 业务对象的监测方法、装置、存储介质和计算机设备
CN111489218A (zh) * 2019-01-28 2020-08-04 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN111489218B (zh) * 2019-01-28 2023-04-18 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN110032370A (zh) * 2019-04-16 2019-07-19 北京中电普华信息技术有限公司 信息采集方法及相关装置
CN111352973A (zh) * 2020-03-02 2020-06-30 武汉中旗生物医疗电子有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN111352973B (zh) * 2020-03-02 2023-11-03 武汉中旗生物医疗电子有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN115943618A (zh) * 2021-06-04 2023-04-07 互动解决方案公司 使共享者检测屏幕共享时的相同性的系统及使共享者检测关于所输入的回答栏的信息的系统
CN115943618B (zh) * 2021-06-04 2023-10-24 互动解决方案公司 信息处理系统及存储有程序的信息记录介质

Also Published As

Publication number Publication date
WO2015128536A1 (en) 2015-09-03
ES2707978T3 (es) 2019-04-08
EP3111399A1 (en) 2017-01-04
EP3447712A1 (en) 2019-02-27
AU2014384203A1 (en) 2016-09-15
JP2017512343A (ja) 2017-05-18
EP3111399B1 (en) 2018-10-31
EP3447712B1 (en) 2020-07-22
EP3111399A4 (en) 2017-10-04
JP6419206B2 (ja) 2018-11-07
AU2020201854A1 (en) 2020-04-02

Similar Documents

Publication Publication Date Title
CN106663258A (zh) 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构
US10742753B2 (en) Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
Espe et al. Prosumer communities and relationships in smart grids: A literature review, evolution and future directions
Leonelli et al. Data and society: A critical introduction
CN102668515B (zh) 将相对加权方案应用于在线使用数据
US20220292999A1 (en) Real time training
CN109670104A (zh) 基于机器学习的信息推送方法、设备、装置及存储介质
CN106716472A (zh) 用于运行营销活动的计算机实现方法和系统
CN110069706A (zh) 数据处理的方法、端侧设备、云侧设备和端云协同系统
CN109564579A (zh) 用于物联网集成平台的情况预测机制
WO2008091587A1 (en) Method and system for auditing processes and projects for process improvement
CN107820214A (zh) 一种基于时间地理学的用户轨迹分析系统
CN107533714A (zh) 用于针对具有低能力的各方在便携无线装置上实现有效数字营销的系统和方法
CN110807165A (zh) 用于活动资讯的策划、执行的信息处理方法、计算机设备及存储介质
Melo et al. Towards an observatory for mobile participatory sensing applications
Li et al. Capitalize your data: Optimal selling mechanisms for IoT data exchange
Kambham et al. Predicting personality traits using smartphone sensor data and app usage data
US20120059687A1 (en) Organisational tool
Dhingra et al. Effect of Customer Satisfaction on Customer Loyalty with the Moderation of Brand Image
CN108073638A (zh) 数据诊断方法及装置
CN112801446A (zh) 上云服务站和上云服务方法
Salemink et al. A vision on future advanced data collection
Sugumaran Intelligent Information Technologies: Concepts, Methodologies, Tools, and Applications: Concepts, Methodologies, Tools, and Applications
Ibidunni Knowledge and performance in an emerging telecommunication industry: The moderating role of organisational orientation
CN107633422A (zh) 一种基于用户行为的市场预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510

WD01 Invention patent application deemed withdrawn after publication