CN105446706B - 用于评估表单页面使用效果及提供原始数据的方法及装置 - Google Patents

用于评估表单页面使用效果及提供原始数据的方法及装置 Download PDF

Info

Publication number
CN105446706B
CN105446706B CN201410324079.3A CN201410324079A CN105446706B CN 105446706 B CN105446706 B CN 105446706B CN 201410324079 A CN201410324079 A CN 201410324079A CN 105446706 B CN105446706 B CN 105446706B
Authority
CN
China
Prior art keywords
page
user
index
data
submission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410324079.3A
Other languages
English (en)
Other versions
CN105446706A (zh
Inventor
耿霄
谢孟庭
杨昌源
肖裕洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Network Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410324079.3A priority Critical patent/CN105446706B/zh
Publication of CN105446706A publication Critical patent/CN105446706A/zh
Application granted granted Critical
Publication of CN105446706B publication Critical patent/CN105446706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种用于评估表单页面的使用效果的方法和装置、以及一种用于提供表单操作原始数据的方法和装置。其中所述用于评估表单页面的使用效果的方法包括:采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。采用本申请提供的方法,获取的指标数据能够相对准确、全面的反映用户对表单页面的使用情况,有助于评估者解读各个指标数据,正确评估表单页面的使用效果,提高评估过程的效率和准确性。

Description

用于评估表单页面使用效果及提供原始数据的方法及装置
技术领域
本申请涉及用户行为分析领域,具体涉及一种用于评估表单页面的使用效果的方法和装置。本申请同时涉及一种用于提供表单操作原始数据的方法和装置。
背景技术
今时今日,越来越多的产品和服务被部署在互联网上,以网站为主要形态的互联网产品不仅仅只是推送产品、服务或信息的平台,其核心目标通常是通过吸引更多用户来获取收益。为了吸引更多的用户,仅仅采用传统的方式优化网站提供的信息与服务是不够的,还需要进行用户行为分析从而从侧面获知网站提供的信息与产品存在的问题,并进行有针对性的改进。
所谓用户行为分析,是指在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,可以让企业更加详细、清楚地了解用户的行为习惯,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前提供的网络产品以及营销活动中可能存在的问题,并为进一步改进产品或者修正网络营销策略提供依据。用户行为分析受到各个网站以及企业的普遍关注,出现了各种各样的用户行为分析模型以及工具。
随着电子商务的发展,对表单页面的用户使用行为的收集与分析成为了一个新的关注点。表单页面对于电商平台来说,是信息提供的基础,也是电商平台存在的基石,电商平台有相当一部分应用都是基于用户填写表单以及提交表单这一处理流程的,因此如何监控表单页面的用户使用行为、分析评估用户对表单页面的使用效果,并进一步对表单页面的界面和功能做出有效的改进,成为了当前电商平台的重要课题。
而现有的网站用户行为分析工具通常采用的都是通用的评估模型和处理实现方式(比如谷歌的GA工具:Google Analytics是谷歌的一款免费企业级用户行为分析软件),其衡量手段主要有两类:
1)以单个页面为任务中的关键节点,分析在多个页面场景下,用户在页面间的跳转行为;
2)收集用户在页面上的通用点击操作行为。
采用上述现有技术手段进行表单页面的用户使用效果的评估,存在以下缺陷:由于表单整体往往就是在单个页面上,所以第一种方式通常不适用于表单页面;而第二种方式,由于缺乏针对表单页面的指标模型,采用通用方法进行用户行为数据的收集和相关指标的计算,计算出的指标并不能有针对性地反映用户对表单页面的使用情况,评估者往往还需要与表单页面的具体业务场景相结合进行进一步的分析,导致评估过程效率低下、而且评估结果的准确性也得不到保证,自然无法对表单页面的改进提供有效指导。
发明内容
本申请提供一种用于评估表单页面的使用效果的方法,以解决现有技术没有专门针对表单页面的分析和评估手段导致无法有效评估表单页面的用户使用效果的问题。本申请另外提供一种用于评估表单页面的使用效果的装置。
本申请提供一种用于评估表单页面的使用效果的方法,包括:
采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;
根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,在所述采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据之前,执行下述操作:
在所述表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据。
可选的,所述预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败和表单字段失去焦点时发生校验错误;
相应的,与上述四类表单访问事件对应的javascript代码上报的表单操作原始数据包括:与用户进入表单页面相关的数据、与用户提交表单成功相关的数据、与用户提交表单失败相关的数据、以及与表单字段失去焦点时发生校验错误相关的数据;
相应的,所述日志文件用于存储上述四类表单操作原始数据。
可选的,所述与用户进入表单页面相关的数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔;
所述与用户提交表单成功相关的数据包括:表单标识、用户行为标识、表单耗时、成功提交之前的无效提交次数、和表单中各个字段的耗时;
所述与用户提交表单失败相关的数据包括:表单标识、用户行为标识、各个出错字段的标识以及对应的错误信息;
所述与表单字段失去焦点时发生校验错误相关的数据包括:表单标识、用户行为标识、发生校验错误字段的标识以及对应的错误信息。
可选的,在执行所述对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值之前,执行下述操作:
根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表;
相应的,所述对所述日志文件中记录的表单操作原始数据进行分析计算,是指对所述中间数据表进行相应的查询和计算操作。
可选的,所述对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据,包括:
接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标;
按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值;
将已获取的所述指标的值返回给所述评估者,供所述评估者评估表单页面的使用效果。
可选的,所述预先设定的表单页面使用效果指标包括:基础数据指标和复合指标;其中,所述复合指标包括:整体任务完成度指标、字段完成情况指标、用户接受度指标和用户留存度指标。
可选的,所述基础数据指标包括以下元素中的至少一者:表单页面访问数PV,独立访客访问数UV、新老用户分布、用户帐号类型分布、用户地区分布、用户来源渠道分布、上一步访问页面分布、用户浏览器分布、用户设备分布、登录状态分布。
可选的,所述整体任务完成度指标包括以下元素中的至少一者:
有效提交率,其计算规则为:有效提交率=有效提交PV/页面PV;
无效提交率,其计算规则为:无效提交率=无效提交PV/页面PV;
平均无效提交次数,其计算规则为:平均无效提交次数=无效提交PV/有过无效提交页面的UV;
无提交行动率,其计算规则为:无提交行动率=(页面PV—有效提交PV—无效提交PV根据页面标识去重)/页面PV;
有效提交平均耗费时间,其计算规则为:有效提交平均耗费时间=有效提交PV耗时/有效提交PV;
有效提交平均无效提交次数,其计算规则为:有效提交平均无效提交次数=与有效提交PV对应的同一个页面标识下的无效提交PV的总和/有效提交PV;
其中,所述有效提交是指表单提交成功,无效提交是指表单提交失败。
可选的,所述字段完成情况指标包括以下元素中的至少一者:
字段出错率,其计算规则为:字段出错率=某字段出错数/所有字段出错数;
字段耗时,其计算规则为:字段耗时=所有有效提交PV下某字段耗时总和/页面PV;
字段出错原因分布,该指标是指某字段出错原因的各种情况占比;其计算规则为:所述字段因某原因出错的次数/所述字段出现错误的总次数;
字段出错的用户类型占比,该指标是指某字段的出错情况在各种用户维度下的占比,所述各种用户维度包括:新老用户、用户所属国家或地区、会员类型、来源渠道、上一步访问页面、用户所用浏览器、以及用户所用设备;该指标的计算规则为:所述字段在特定维度的特定分类下出错的次数/所述字段出现错误的总次数。
可选的,所述用户接受度指标包括以下元素中的至少一者:
新用户数,该指标是指历史上首次使用本表单的用户数;
新用户无提交行动率,其计算规则为:新用户无提交行动率=(新用户PV—新用户有效提交PV—新用户无效提交PV根据页面标识去重)/新用户PV。
可选的,所述用户留存度指标包括以下元素中的至少一者:
回访用户数,该指标是指回访的独立访客访问数;
回访率,其计算规则为:回访率=回访用户UV/页面UV;
平均使用次数,其计算规则为:平均使用次数=页面PV/页面UV;
平均回访周期,其计算规则为:平均回访周期=用户访问时间跨度/老用户PV;所述访问时间跨度是指最后一次访问日期与第一次访问日期之间的时间间隔。
相应的,本申请还提供一种用于评估表单页面的使用效果的装置,包括:
原始数据采集单元,用于采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;
指标分析计算单元,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,所述装置包括:
代码部署单元,用于在所述表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据。
可选的,所述代码部署单元采用的所述预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败和表单字段失去焦点时发生校验错误。
可选的,所述装置还包括:
中间数据表生成单元,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表;
相应的,所述指标分析计算单元,具体用于根据预先设定的表单页面使用效果指标及其计算规则,对所述中间数据表进行相应的查询和计算操作,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,所述指标分析计算单元包括:
查询请求接收子单元,用于接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标;
查询计算执行子单元,用于按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值;
查询结果返回子单元,用于将已获取的所述指标的值返回给所述评估者,供所述评估者评估所述具体表单页面的使用效果。
此外,本申请还提供一种用于提供表单操作原始数据的方法,所述方法在客户端执行,包括:
接收对表单页面的访问操作,记录与所述访问操作相关的数据;
根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,与所述访问操作相关的数据包括以下元素中的至少一者:
表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。
相应的,本申请还提供一种用于提供表单操作原始数据的装置,包括:
数据记录单元,用于接收对表单页面的访问操作,记录与所述访问操作相关的数据;
数据发送单元,用于根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,所述数据记录单元记录的与所述访问操作相关的数据包括以下元素中的至少一者:表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。
与现有技术相比,本申请具有以下优点:
本申请提供的用于评估表单页面的使用效果的方法,通过采集反映客户端用户对表单及表单字段访问情况的表单操作原始数据,根据预先设定的表单使用效果指标及其计算规则,对所述原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估表单页面使用效果的依据。采用上述方法,由于采集的是专门针对表单页面的用户使用情况的原始数据,并且进行指标计算依据的是预先设定的表单页面使用效果指标及其计算规则,因此提供的指标数据能够相对准确、全面的反映用户对表单页面的使用情况,从而有助于评估者解读各个指标数据,正确评估表单页面的使用效果,提高评估过程的效率和准确性。
附图说明
图1是本申请的一种用于评估表单页面的使用效果的方法实施例的流程图;
图2是本申请实施例提供的根据查询请求获取表单页面指标值的处理过程的流程图;
图3是本申请的一种用于评估表单页面的使用效果的装置实施例的示意图;
图4是本申请的一种用于提供表单操作原始数据的方法实施例的流程图;
图5是本申请的一种用于提供表单操作原始数据的装置实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请中,分别提供了一种用于评估表单页面的使用效果的方法和装置、以及一种用于提供表单操作原始数据的方法和装置,在下面的实施例中逐一进行详细说明。
请参考图1,其为本申请的一种用于评估表单页面的使用效果的方法实施例的流程图,所述方法包括如下步骤:
步骤101:在表单页面中部署与预先设定的表单访问事件相对应的javascript代码。
表单页面是网站接收客户端用户反馈信息的重要窗口,表单页面的设计应该不仅能够吸引用户的注意力,还要让用户能够简单快速的提交信息。而用户对表单页面的使用情况,则可以从侧面反映表单页面的设计是否合理、是否便于用户使用。
表单页面中通常包含供用户提供信息的文本输入框、单选框、复选框、下拉列表框等元素,这些元素的表现形式不一样,其目的都是为了让用户输入或者选择相应的字段信息,因此这类元素通常被称为表单字段。表单页面中除了包含上述表单字段外,通常还包含供用户执行提交操作用的按钮,用户通过点击该按钮就可以将已经选择或者输入的字段信息提交到网站的服务器一侧。
为了评估客户端用户对表单页面的使用效果,先要采集能够反映客户端用户对表单页面及其字段的访问情况的表单操作原始数据。采集所述原始数据可以采用不同的方式,本申请实施例的技术方案采用了在表单页面中部署Javascript代码的方式。具体说,在表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据。
通常情况下,页面自身以及页面中的每个元素都可以产生某些可以触发JavaScript函数的事件,本申请所述的表单访问事件是指,基于表单页面自身的特点,预先设定的用于上报表单操作原始数据的具体时机。例如,客户端用户对特定链接的点击行为会触发浏览器对某个表单页面的一个http请求,当所述表单页面被打开时,就会触发对应的进入表单页面的事件,执行针对该事件预先部署的Javascript代码,收集与用户行为相关的数据,并以http参数的方式通过httpRequest对象向负责采集原始数据的后端服务器上报。而所述后端服务器则按照预先设计好的格式将客户端上报的表单操作原始数据存储在日志文件中。上述过程通常也称作Javascript打点过程。
考虑到表单页面自身的特点,本申请所述的预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败、表单字段失去焦点时发生校验错误这样四类事件。
相应的,与上述四类表单访问事件对应的javascript代码上报的原始数据包括:与用户进入表单页面相关的数据;与用户提交表单成功相关的数据;与用户提交表单失败相关的数据;与表单字段失去焦点时发生校验错误相关的数据。下面对这四类数据以及如何部署相关代码作进一步说明。
1)与用户进入表单页面相关的数据。
此类数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔。
其中,表单标识用于唯一标识用户访问的特定表单,通常称为FormID,对于同一个表单来说,表单标识通常是不会变化的。用户行为标识指定当前数据对应的用户行为,在本类数据中,可以将用户行为标识设置为预先定义好的代表“进入表单”行为的特定数值。
新老用户标识用于指示用户是否首次访问该表单页面。为了实现此功能,客户端可以在本地记录用户访问表单的相关信息。在本实施例的一个具体例子中,利用了客户端浏览器的本地存储(local storage)功能,每次进入表单时,判断在本地存储的FormID中是否存在当前表单的FormID,如果存在,说明之前曾经访问过该表单,因此将新老用户标识设置为代表老用户的特定值;否则说明用户首次访问该表单,将新老用户标识设置为代表新用户的特定值,并在本地存储该表单的FormID。
一定时间段内回访标识和距上一次访问时间间隔这几个数据都是用于反映用户对当前表单的访问频率的数据,其中,一定时间段内回访标识通常包括:7日内回访标识、30日内回访标识、90日内回访标识等。在本实施例的上述具体例子中,每次进入表单时,还可以将访问该表单的时间存储在本地,这样在后续再次访问该表单时,就可以用当前的访问时间与本地存储的上一次访问时间进行比较,从而得出前面列出的用于反映用户对当前表单的访问频率的相关数据。
上面提到的具体例子中,可以利用local storage提供的getItem(key)、setItem(key,value)进行本地数据的存储和读取功能。在其他实施方式中,也可以采用其他技术例如Cookie、User Data等方式进行数据的本地存储与访问。
在本实施例的上述具体例子中,由于进入表单通常会触发Javascript的onload事件,因此在与其对应的处理函数中添加了进行上述处理的Javascript代码,从而生成了与进入表单相关的原始数据,并通过httpRequest对象上报给负责采集原始数据的后端服务器。
2)与用户提交表单成功相关的数据。
此类数据包括:表单标识、用户行为标识、表单耗时、成功提交之前的无效提交次数、和表单中各个字段的耗时。其中表单标识和用户行为标识的含义与第一类数据类似,请参见第一类数据的说明部分。
表单耗时用于记录从进入表单到成功提交表单之间经历的时间。由于在表单提交之前,通常要对表单各个字段进行检验,都交验通过的通常认为会提交成功,因此也可以用进入表单到提交时各个字段都校验成功之间经历的时间作为所述表单耗时。
由于用户填写信息不完备或者格式错误等原因,可能无法一次提交成功,需要进行多次修改并反复提交,未能成功的提交操作即为本申请所述的无效提交,其具体的执行次数即为此类数据中的成功提交之前的无效提交次数。
表单各个字段的耗时,反映用户选择或者输入各个字段信息花费的时间。在具体实现中,为了记录某个字段的耗时,可以在该字段获得输入焦点时,记录获取焦点时间点,在该字段失去输入焦点时,用当前时间点减去获取焦点时间点就得到了该字段的耗时。
在具体实现中,执行提交表单操作时通常会调用类似CheckForm()的函数进行表单各个字段的校验,在各个字段都校验通过的处理分支中,添加向后端服务器上报表单操作原始数据的Javascript代码,将已经记录的表单耗时、各字段耗时等信息上报给后端服务器。
3)与用户提交表单失败相关的数据。
此类数据包括:表单标识、用户行为标识、各个出错字段的标识以及对应的错误信息。
同第二类数据的代码部署方法类似,由于在执行提交表单操作时通常会调用类似CheckForm()的函数进行表单各个字段的校验,可以在某个或者某几个字段未通过校验的处理分支中,添加向后端服务器上报表单操作原始数据的Javascript代码,将出错字段的标识以及对应的错误信息上报给后端服务器。
4)与表单字段失去焦点时发生校验错误相关的数据。
此类数据包括:表单标识、用户行为标识、发生校验错误字段的标识以及对应的错误信息。
为了提高用户体验,一般表单页面还提供即时校验功能,即:当用户完成某个字段的选择或者输入后,通过点击鼠标等方式将焦点移动到页面的其他位置或者其他字段时(上一字段失去输入焦点的行为,也称为blur),表单页面的预设代码会自动检查完成选择或者输入的上一字段的值是否有效,例如:格式是否正确,与提供的其他信息是否存在冲突等。
在具体实现中,由于页面上的某个字段失去输入焦点时通常会执行对应的onblur处理函数,在该处理函数中对失去焦点的字段内的值进行校验,因此可以在该函数的校验错误处理分支中,添加向后端服务器上报表单操作原始数据的Javascript代码,将出错字段的标识以及对应的错误信息上报给后端服务器。
为了便于后端服务器对表单操作原始数据进行分析,生成更为丰富的用户行为数据,在表单页面部署的Javascript代码还可以在上报上述四类数据的同时上报以下数据:表单页面标识(PageID)、用户会话标识(SessionID)和用户标识(UserID)等数据,其中用户会话标识用于根据用户访问表单页面的时长进行不同会话的划分,该数据可以用于统计表单页面的UV(Unique Visitor—独立访客访问数);而UserID则用于区分访问表单页面的不同用户。
此外,为了便于后端服务器进行基于浏览器和设备分布等维度的统计分析,上述四类数据中还可以包含客户端用户使用的浏览器信息、设备信息、以及上一跳URL等信息。在具体实现中,可以在表单页面部署的Javascript代码中添加根据客户端浏览器内置的javascript对象获取并上报这些信息的代码,例如,与客户端浏览器相关的信息可以通过浏览器内置的navigator对象获取,与显示设备相关的信息可以通过windows对象获取,上一跳URL等信息可以通过document.referrer获取。
在具体的实施方式中,通过表单页面中部署的Javascript代码上报的表单操作原始数据可以不同于上面描述的这些具体数据,只要能够满足后续计算评估指标的需求即可。具体上报哪些表单操作原始数据,只是实施方式的变更,并不偏离本申请的核心,都在本申请的保护范围之内。
上面描述了与表单页面相关的四类原始数据,在本实施例的一个具体例子中,针对上述四类原始数据,设计了4类ID,分别代表用户的四种行为(对应4种表单访问事件),如下表所示:
表一、ID设计示例
并在待评估用户使用效果的表单页面中,采用如下示意的Javascript代码对上述四类ID进行部署:
Figure BDA0000534816790000122
通过自定义的事件跟踪设置,当上述四类用户行为触发对应的表单访问事件时,就会执行对应的Javascript打点处理代码,完成对表单操作原始数据的收集和上报处理。上述对ID的设计以及代码的部署方式仅仅是示意性的,在具体的实施过程中,可以进行相应的调整或者采用其他部署方式。
步骤102:采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件。
在表单页面中部署了相应的Javascript代码后,客户端用户访问所述表单页面时,就会有反映客户端用户对表单页面的访问情况的原始数据上报到后端服务器。后端服务器接收客户端上报的表单操作原始数据后,可以直接将这些数据存储在日志文件中,也可以将数据提取出来按照特定的格式存储在日志文件中。在本实施例的一个具体例子中,针对客户端上报的四类原始数据,采用了如下所述的四种日志记录格式进行存储。
1)“进入表单”日志,用于存储与进入表单相关的表单操作原始数据,其格式为:
id={Formid}&ubas=true&ext=act=enterForm|firstVisit={true/false}|backIn7={tr ue/false}|backIn30={true/false}|backIn90={true/false}|lastVisitBlanking={days}
2)“部分字段校验不通过”日志,用于存储与表单提交失败相关的表单操作原始数据,其格式为:
id={Formid}&ubas=true&ext=act=notAllValidatePass|{fieldDotID}={errMsg}|{fieldDotID}={errMsg}
3)“全部字段校验通过及各字段停留时间”日志,用于存储与提交表单成功相关的表单操作原始数据,其格式为:
id={Formid}&ubas=true&ext=act=allValidatePass|costTime={time}|invalidSub mitTimes={times}|{fieldDotID}={fieldTime}|{fieldDotID}={fieldTime}
4)“表单字段blur出错”日志,用于存储与字段失去焦点时校验出错相关的表单操作原始数据,其格式为:
id={Formid}&ubas=true&ext=act=validateFailWhenBlur|{fieldDotID}={errM sg}
至此,后端服务器就采集到了反映客户端用户对表单页面及其所包含字段的访问情况的表单操作原始数据,并生成了相应的日志文件。在具体的实施过程中,本步骤的采集过程和生成日志文件的过程并不是一次完成的,随着客户端用户对表单页面的访问,会不断有相关的表单操作原始数据上报给后端服务器,后端服务器可以不断更新相应的日志文件。
本实施例采用Javascript打点的方式,由客户端主动上报反映客户端用户对表单页面的访问情况的表单操作原始数据。在其他实施方式中,后端服务器可以采用不同的方式采集上述原始数据,也可以在采集上述原始数据的基础上获取能够反映用户对表单页面使用情况的其他原始数据,也可以采用不同的日志文件格式存储采集到的原始数据,上述都只是具体实施方式的变更,都不偏离本申请的核心,都在本申请的保护范围之内。
步骤103:根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表。
在描述本步骤之前,先对本申请实施例采用的预先设定的表单页面使用效果指标及其计算规则作简要的介绍。本申请所述的表单页面使用效果指标及其计算规则是在发明人自行定义的互联网ARITH评估指标模型的基础上构建形成的。所述ARITH评估指标模型,是从大规模用户群的视角出发,将能反映用户行为和态度的商业、用户体验、技术等各方面数据构建成能表征用户与产品间互动关系的评估维度,并基于各个评估维度包含的指标对产品质量进行评估的模型。
而本申请所述的表单页面使用效果指标及其计算规则则是在上述ARITH评估模型的基础上,针对表单应用场景,围绕任务成功率(Task Success)、接受度(Adoption)、留存度(Retention)三个大维度,识别和优化出来的适合表单页面的评估指标及其计算规则,包括基础数据指标和复合指标两个层面。
所述基础数据指标包括:表单页面访问数PV(Page View—页面访问量),独立访客访问数UV(Unique Visitor—独立访客访问数)、新老用户分布、用户帐号类型分布、用户地区分布、用户来源渠道分布、上一步访问页面分布、用户浏览器分布、用户设备分布、和/或登录状态分布。
所述复合指标包括:整体任务完成度指标、字段完成情况指标、用户接受度指标和用户留存度指标,下面对这四类复合指标包括的细化指标作进一步说明。
1)所述整体任务完成度指标包括:
有效提交率,其计算规则为:有效提交率=有效提交PV/页面PV;
无效提交率,其计算规则为:无效提交率=无效提交PV/页面PV;
平均无效提交次数,其计算规则为:平均无效提交次数=无效提交PV/有过无效提交页面的UV;
无提交行动率,其计算规则为:无提交行动率=(页面PV—有效提交PV—无效提交PV根据页面标识去重)/页面PV;
有效提交平均耗费时间,其计算规则为:有效提交平均耗费时间=有效提交PV耗时/有效提交PV;
有效提交平均无效提交次数,其计算规则为:有效提交平均无效提交次数=与有效提交PV对应的同一个页面标识下的无效提交PV的总和/有效提交PV;
其中,所述有效提交是指表单提交成功,无效提交是指表单提交失败。
2)所述字段完成情况指标包括:
字段出错率,其计算规则为:字段出错率=某字段出错数/所有字段出错数;
字段耗时,其计算规则为:字段耗时=所有有效提交PV下某字段耗时总和/页面PV;
字段出错原因分布,该指标是指某字段出错原因的各种情况占比;其计算规则为:所述字段因某原因出错的次数/所述字段出现错误的总次数;
字段出错的用户类型占比,该指标是指某字段的出错情况在各种用户维度下的占比,所述各种用户维度包括:新老用户、用户所属国家或地区、会员类型、来源渠道、上一步访问页面、用户所用浏览器、以及用户所用设备;该指标的计算规则为:所述字段在特定维度的特定分类下出错的次数/所述字段出现错误的总次数。
3)所述用户接受度指标包括:
新用户数,该指标是指历史上首次使用本表单的用户数;
新用户无提交行动率,其计算规则为:新用户无提交行动率=(新用户PV—新用户有效提交PV—新用户无效提交PV根据页面标识去重)/新用户PV;
4)所述用户留存度指标包括:
回访用户数,该指标是指回访的独立访客访问数;
回访率,其计算规则为:回访率=回访用户UV/页面UV;
平均使用次数,其计算规则为:平均使用次数=页面PV/页面UV;
平均回访周期,其计算规则为:平均回访周期=用户访问时间跨度/老用户PV;所述访问时间跨度是指最后一次访问日期与第一次访问日期之间的时间间隔。
需要说明的是,上述指标的定义采用了本领域人员的常规表述方式,在具体计算上述某个指标的值时,都是在指定的时间段内进行的,例如:某表单页面在7天内的有效提交率等。
上面描述的基础数据指标和复合指标是本申请实施例采用的表单页面使用效果指标,在其他实施方式中,可以根据具体的评估需求定义其他的指标以及相应的计算规则,只要通过所述计算规则计算得到的指标能够评估表单页面的使用情况,就都能够实现本申请的技术核心,都在本申请的保护范围之内。
在步骤102中已经将客户端用户对表单页面及其所包含字段的访问情况的表单操作原始数据,存储在日志文件中,因此可以直接对所述日志文件中记录的表单操作原始数据进行分析计算,获得对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
考虑到表单操作原始数据比较零散、而且数量通常比较多,直接基于该数据进行分析计算,会比较耗时,因此本申请提供了一种优选实施方式,在执行上述分析计算之前先执行本步骤,即:根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表。
为了生成便于查询的中间数据表,首先要根据所述表单页面使用效果指标及其计算规则,进行中间数据表的设计,即:确定采用哪几个中间数据表存储日志文件记录的表单操作原始数据,以及每个数据表应该包含哪些字段。例如,设计如下所示的三个数据表:
表二、字段错误数据中间表nbas_fielderror
数据表字段 字段说明
id id自增主键,不用于查询
form_id 表单id
mark_id 打点日志id
og_time 记录时间
err_msg 字段错误信息
country 用户国家
is_old 新老用户
member_type 用户类型
channel 用户来源渠道
refer 用户上一步访问页面
ua 用户设备信息
stat_date 记录日期
page_id 表单页面标识
表三、字段耗时数据中间表nbas_fieldtime
数据表字段 字段说明
id id自增主键,不用于查询
form_id 表单id
mark_id 打点日志id
log_time 记录时间
field_time 字段耗时
country 用户国家
is_old 新老用户
member_type 用户类型
channel 用户来源渠道
refer 用户上一步访问页面
ua 用户设备信息
stat_date 记录日期
表四、form打点数据数据中间表nbas_form
数据表字段 字段说明
mark_id 打点日志id
form_id 表单id
id id自增主键,不用于查询
log_time 记录时间
page_id 表单页面标识
session_id 表单访问会话标识
act 打点行为
elapsed 表单耗时
last_interval 上一次访问时间间隔
country 国家
is_old 新老用户
member_type 用户类型
channel 用户来源渠道
refer 用户上一步访问页面
ua 用户设备
stat_date 记录日期
完成中间数据表的设计后,就可以对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,并按照所述中间数据表的结构生成数据记录,存储在中间数据表中。
所述预先获取的用户基本信息是指与用户属性相关的信息,例如:用户所在的国家(或者地区)、用户的帐号类型(收费用户、免费用户等)等,这些信息都属于用户的基本信息,可以在用户注册过程中获取或者采用其他方式获取,并预先存储在系统中,需要时可以通过用户标识查找到对应的基本信息。
上述对表单操作原始数据和用户基本信息进行汇总分析的过程,通常包括以下操作:把收集到的表单操作原始数据进行加工,去除掉表单操作原始数据中不需要的部分,保留需要的部分,并进行一些必要的关联计算或查询,然后存储到中间数据表中,供后续的查询操作使用。
例如,从“表单字段blur出错”日志中提取出关于某表单字段的出错信息后,并从该条信息中获取对应的用户标识信息(或者用其他方式获取用户标识,例如从表单页面标识PageID字段中提取),然后根据用户标识查询已存储的用户基本信息,获取该用户所在的国家或地区以及该用户的帐号类型等,再将该表单字段的出错信息和对应用户的上述基本信息根据用户标识进行关联拼接,得到关于某表单字段blur出错的更为详细的信息,并按照上述表二定义的数据格式存储在nbas_fielderror表中。上面给出的三个中间数据表以及上述例子描述的汇总分析过程仅仅是示意性的,在实际实施过程中可以根据需求设计不同的中间数据表,实际的汇总分析过程可能会更为复杂。
在具体实施过程中,上述数据处理过程通常也称作ETL(Extraction-Transformation-Loading的英文缩写)计算服务过程,即对表单操作原始数据进行提取、转换、装载的过程,通过该过程,可以将采集到的分散、零乱的表单操作原始数据整合在一起,生成关于表单页面以及表单字段的可供查询的中间数据表,将这些中间数据表存储在数据库中,即得到了关于表单页面的用户行为数据库。
之所以称为中间数据表,是因为所述数据表中存放的并不是最终的指标值,而是可供查询的原子数据,计算某个指标值时还需要基于这些原子数据进行查询和计算。由于预先执行了上述ETL计算服务过程,零散的原始数据按照相互之间的关系整合在不同的数据表中,从而能够通过相对简单的查询和计算过程获取指标的值,有效提高后续查询的执行效率。
上述ETL计算服务过程通常不是一次完成的,随着日志文件的不断更新,该计算服务过程也会定期执行,不断地将日志文件中的新数据存储到中间数据表中,生成新的可供查询的中间数据表。在本实施例的一个具体例子中,每天执行一次ETL计算服务,执行ETL计算服务的频率可以根据具体的需要进行相应的调整,本申请对此不作具体的限定。
步骤104:根据预先设定的表单页面使用效果指标及其计算规则,对所述中间数据表进行相应的查询和计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
执行步骤103生成了可供查询的中间数据表,在本步骤中就可以针对评估者的指标查询请求,获取对应具体表单页面的指标值,供评估者评估表单页面的用户使用效果。具体说该过程包括以下104-1至104-3这三个子步骤,下面结合附图2进行说明。
步骤104-1:接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标。
评估者需要对某个表单页面的用户使用效果进行评估时,会向提供指标查询服务的服务端发送指标查询请求,该请求中包含针对具体表单页面的待查询指标。提供指标查询服务的服务端接收该请求后,执行后续步骤104-2,查询计算所述指标的值。
步骤104-2:按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值。
为了便于查询计算指标的值,可以预先设置指标查询规则。所述指标查询规则是指,根据表单页面使用效果指标及其计算规则设置的、如何将对特定指标的查询请求转换为具体的查询操作,从而从所述中间数据表中查询计算出所述待查询指标的值。如果中间数据表存储在关系型数据库中,则指标查询规则设置的就是如何通过具体的SQL语句从中间数据表中查询计算所述指标的值。
对于基础数据指标,通常可以执行一次查询操作获取所述指标的值;对于复合指标,通常需要执行两次或者多次查询操作,获取计算该指标所需的相关数据,(例如分别获取计算规则中的分子部分和分母部分的值),然后再按照计算规则执行相应的计算,最终获取所述指标的值。
例如,评估者要获取7天内某张表单页面的新老用户分布情况,根据指标查询规则的设置,将对该指标的查询转换成如下所示的SQL语句,通过对上述表四所示的nbas_form数据表的一次查询,即可获取所述指标的值:
select form_id,is_old,count(*)as counts from nbas_form where form_id=#form_id#and act="enterid"and DATE_SUB(CURDATE(),INTERVAL7DAY)<=stat_date group by is_old order by is_old desc;
再例如,评估者要获取某字段7天内新用户提交的错误数量,根据指标查询规则的设置,将对该指标的查询转换成如下所示的SQL语句,通过对上述表二所示的nbas_fielderror数据表的一次查询,即可获取所述指标的值。
select mark_id,count(*)as counts from nbas_fielderror where mark_id=#mark_id#and is_old="yes"and DATE_SUB(CURDATE(),INTERVAL7DAY)<=stat_date;
如果待查询的所述指标是复合指标,例如,某字段在7天内的字段出错率,则需要针对nbas_fielderror数据表执行两次查询操作,分别获取该字段在7天内的出错数,以及7天内所有字段的出错数,然后按照预先设定的表单页面使用效果指标包含的对该指标的计算规则:字段出错率=本字段出错数/所有字段出错数,计算已获取的上述两个数值的比值,就得到了该字段在7天内的字段出错率。
上面描述的实施方式,接收评估者提供的待查询指标后,根据预先设定的指标查询规则生成相应的查询语句执行对应的查询操作、并根据需要按照计算规则执行进一步的计算,最终获取待查询指标的值。在其他实施方式中,可以不设置指标查询规则,而是由评估者或者需要进行指标查询的用户自行输入符合语法规则的查询语句,并进行相应的计算,同样可以实现本申请的技术方案。
步骤104-3:将已获取的所述指标的值返回给所述评估者,供所述评估者评估表单页面的使用效果。
评估者通过上述查询过程获取了关于表单页面的指标值,就可以依据指标值评估表单页面的使用效果了。由于采用了本申请提供的方法,各个指标值反应的就是表单页面的用户使用情况,因此评估者通常可以直接对获取的指标值进行解读,从而获知具体表单页面的用户使用效果。
例如,评估者通过查询操作获取了某个表单页面的有效提交平均耗费时间,如果该指标值明显大于预先设定的阈值或者是常规经验值,说明该表单页面可能存在界面设计不够清晰或者为用户提供的引导、参考信息不够明确等问题。这种情况下,评估者可以进一步查询该表单页面中的各个字段的字段耗时指标以及字段出错率等信息,从而获知该表单页面中是否存在导致用户耗时较长的字段,并针对字段出错原因,进一步有针对性地分析这些字段采用的设计元素是否合理、给出的默认值是否合适、是否有必要的、清晰的提示信息等,从而对表单页面的改进提供有效的指导。
上面通过步骤101-步骤104,描述了本申请技术方案的一种优选实施方式。需要说明的是,上述步骤对于本申请技术方案的实施来说并不都是必需的。例如,步骤101在表单页面中部署Javascript代码是为了通过Javascript打点的方式比较快捷地收集原始数据,在其他实施方式中可以不执行上述步骤101,而是采用其他方式进行原始数据的采集,本申请对此不作具体限定,只要后台服务端能够采集到反映客户端对表单页面及其字段的访问情况的原始数据即可;此外,执行ETL计算服务的步骤103也不是必需的,该步骤是为了对原始数据进行预处理生成中间数据表,以提高后续查询操作的执行效率,在其他实施方式中可以不执行该步骤,而是直接执行步骤104对原始数据进行分析计算,获取具体表单页面的指标值,同样可以实现本申请的技术方案。
本申请提供的用于评估表单页面的使用效果的方法,通过采集反映客户端用户对表单及表单字段访问情况的表单操作原始数据,根据预先设定的表单使用效果指标及其计算规则,对所述原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估表单页面使用效果的依据。采用上述方法,由于采集的是专门针对表单页面的用户使用情况的原始数据,并且进行指标计算依据的是预先设定的表单页面使用效果指标及其计算规则,因此提供的指标数据能够相对准确、全面的反映用户对表单页面的使用情况,从而有助于评估者解读各个指标数据,正确评估表单页面的使用效果,提高评估过程的效率和准确性。
在上述的实施例中,提供了一种用于评估表单页面的使用效果的方法,与之相对应的,本申请还提供一种用于评估表单页面的使用效果的装置。请参看图3,其为本申请的一种用于评估表单页面的使用效果的装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于评估表单页面的使用效果的装置,包括:
代码部署单元301,用于在所述表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据;原始数据采集单元302,用于采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;中间数据表生成单元303,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表;指标分析计算单元304,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述中间数据表进行相应的查询和计算操作,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,所述代码部署单元采用的所述预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败和表单字段失去焦点时发生校验错误。
可选的,所述指标分析计算单元包括:
查询请求接收子单元,用于接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标;
查询计算执行子单元,用于按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值;
查询结果返回子单元,用于将已获取的所述指标的值返回给所述评估者,供所述评估者评估所述具体表单页面的使用效果。
与上述用于评估表单页面的使用效果的方法相对应,本申请还提供一种用于提供表单操作原始数据的方法,该方法在客户端执行。请参考图4,其为本申请提供的一种用于提供表单操作原始数据的方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种用于提供表单操作原始数据的方法包括:
步骤401:接收对表单页面的访问操作,记录与所述访问操作相关的数据。
实施了本申请的用于提供表单操作原始数据的方法的客户端,通常通过所述表单页面的URL信息获取所述表单页面并在本地显示设备上显示所述表单页面,并根据接收到的对所述表单页面的各种访问操作,记录与所述访问操作相关的数据。
本步骤所述的访问操作包括:打开表单页面(即:通常所说的进入表单页面)、对表单页面包含的各个表单字段的点击或编辑操作、以及提交表单页面成功或者失败的操作。
与上述访问操作相关的数据包括以下元素中的至少一者:表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。在具体的实施方式中,可以根据实际需要记录与上述数据不同的其他数据,也可以在上述数据的基础上记录更为丰富的数据。
上述数据可以记录在内存中,例如:被访问的表单字段标识,访问表单字段的开始时间等,便于后续步骤402访问并生成相应的表单操作原始数据;有些数据还可以通过local storage、Cookie以及User Data等方式进行本地存储,例如:表单标识、进入表单页面时间点(即:访问表单页面的时间点)等,每次对表单页面进行访问时,可以根据本地已存储的上述历史数据,区分新老用户以及获取用户对表单页面的访问频率。
在具体实施中,根据接收到的对所述表单页面的各种访问操作,记录与所述访问操作相关的数据的过程,通常采用在所述表单页面中预先部署Javascript代码的方式实现,关于这部分说明,请参见第一实施例的步骤101中的相关说明,此处不再赘述。
步骤402:根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据。
本步骤中根据步骤401中记录的与访问操作相关的数据,生成表单操作原始数据。在本步骤生成所述表单操作原始数据的过程中,还可以参考在本地存储的历史访问数据,例如:曾经访问过的表单标识、上一次访问表单页面的时间点等,来生成与与所述访问操作相关的表单操作原始数据。
本步骤生成的表单操作原始数据可以包括以下四类:1)与用户进入表单页面相关的数据;2)与用户提交表单成功相关的数据;3)与用户提交表单失败相关的数据;以及4)与表单字段失去焦点时发生校验错误相关的数据。在本实施例的一个具体例子中,采用与所述采集表单操作原始数据的服务端存储日志文件的相同格式生成上述四类数据,从而便于所述服务端在接收数据后进行数据的存储和分析,关于所述日志文件格式的示例请参见第一实施例的步骤102中的相关说明。
在本步骤中,可以根据在步骤401中接收到的访问操作以及记录的与访问操作相关的数据,生成相应的表单操作原始数据,并直接发送给采集表单操作原始数据的服务端;也可以根据接收到的多次访问操作及每次记录的与访问操作相关的数据,生成多条表单操作原始数据,并当所述表单操作原始数据的条数或者数据规模达到预先设置的阈值时,采用批量发送的方式向所述服务端发送。上述只是具体实施方式的变更,并不偏离本申请的核心,也在本申请的保护范围之内。
在具体实施中,上述根据已经记录的与访问操作相关的数据生成表单操作原始数据,并发送给采集表单操作原始数据的服务端的过程,通常采用在所述表单页面中预先部署Javascript代码的方式实现,关于这部分说明,请参见第一实施例的步骤101中的相关说明,此处不再赘述。
所述采集表单操作原始数据的服务端则可以在接收所述表单操作原始数据后,根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据。
在上述的实施例中,提供了一种用于提供表单操作原始数据的方法,与之相对应的,本申请还提供一种用于提供表单操作原始数据的装置。请参看图5,其为本申请的一种用于提供表单操作原始数据的装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种用于提供表单操作原始数据的装置,包括:数据记录单元501,用于接收对表单页面的访问操作,记录与所述访问操作相关的数据;数据发送单元502,用于根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据。
可选的,所述数据记录单元记录的与所述访问操作相关的数据包括以下元素中的至少一者:表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (21)

1.一种用于评估表单页面的使用效果的方法,其特征在于,包括:
采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;
根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据;
其中,所述预先设定的表单页面使用效果指标包括:基础数据指标和复合指标;
所述表单操作原始数据包括:与用户进入表单页面相关的数据、与用户提交表单成功相关的数据、与用户提交表单失败相关的数据、以及与表单字段失去焦点时发生校验错误相关的数据;
且所述与用户进入表单页面相关的数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔。
2.根据权利要求1所述的用于评估表单页面的使用效果的方法,其特征在于,在所述采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据之前,执行下述操作:
在所述表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据。
3.根据权利要求2所述的用于评估表单页面的使用效果的方法,其特征在于,所述预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败和表单字段失去焦点时发生校验错误;
相应的,上述四类表单访问事件对应的javascript代码上报上述四类表单操作原始数据,且所述日志文件用于存储上述四类表单操作原始数据。
4.根据权利要求1所述的用于评估表单页面的使用效果的方法,其特征在于,
所述与用户提交表单成功相关的数据包括:表单标识、用户行为标识、表单耗时、成功提交之前的无效提交次数、和表单中各个字段的耗时;
所述与用户提交表单失败相关的数据包括:表单标识、用户行为标识、各个出错字段的标识以及对应的错误信息;
所述与表单字段失去焦点时发生校验错误相关的数据包括:表单标识、用户行为标识、发生校验错误字段的标识以及对应的错误信息。
5.根据权利要求1所述的用于评估表单页面的使用效果的方法,其特征在于,在执行所述对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值之前,执行下述操作:
根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表;
相应的,所述对所述日志文件中记录的表单操作原始数据进行分析计算,是指对所述中间数据表进行相应的查询和计算操作。
6.根据权利要求5所述的用于评估表单页面的使用效果的方法,其特征在于,所述对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据,包括:
接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标;
按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值;
将已获取的所述指标的值返回给所述评估者,供所述评估者评估表单页面的使用效果。
7.根据权利要求1-6任一所述的用于评估表单页面的使用效果的方法,其特征在于,所述复合指标包括:整体任务完成度指标、字段完成情况指标、用户接受度指标和用户留存度指标。
8.根据权利要求7所述的用于评估表单页面的使用效果的方法,其特征在于,所述基础数据指标包括以下元素中的至少一者:表单页面访问数PV,独立访客访问数UV、新老用户分布、用户帐号类型分布、用户地区分布、用户来源渠道分布、上一步访问页面分布、用户浏览器分布、用户设备分布、登录状态分布。
9.根据权利要求7所述的用于评估表单页面的使用效果的方法,其特征在于,所述整体任务完成度指标包括以下元素中的至少一者:
有效提交率,其计算规则为:有效提交率=有效提交PV/页面PV;
无效提交率,其计算规则为:无效提交率=无效提交PV/页面PV;
平均无效提交次数,其计算规则为:平均无效提交次数=无效提交PV/有过无效提交页面的UV;
无提交行动率,其计算规则为:无提交行动率=(页面PV—有效提交PV—无效提交PV根据页面标识去重)/页面PV;
有效提交平均耗费时间,其计算规则为:有效提交平均耗费时间=有效提交PV耗时/有效提交PV;
有效提交平均无效提交次数,其计算规则为:有效提交平均无效提交次数=与有效提交PV对应的同一个页面标识下的无效提交PV的总和/有效提交PV;
其中,所述有效提交是指表单提交成功,无效提交是指表单提交失败。
10.根据权利要求7所述的用于评估表单页面的使用效果的方法,其特征在于,所述字段完成情况指标包括以下元素中的至少一者:
字段出错率,其计算规则为:字段出错率=某字段出错数/所有字段出错数;
字段耗时,其计算规则为:字段耗时=所有有效提交PV下某字段耗时总和/页面PV;
字段出错原因分布,该指标是指某字段出错原因的各种情况占比;其计算规则为:所述字段因某原因出错的次数/所述字段出现错误的总次数;
字段出错的用户类型占比,该指标是指某字段的出错情况在各种用户维度下的占比,所述各种用户维度包括:新老用户、用户所属国家或地区、会员类型、来源渠道、上一步访问页面、用户所用浏览器、以及用户所用设备;该指标的计算规则为:所述字段在特定维度的特定分类下出错的次数/所述字段出现错误的总次数。
11.根据权利要求7所述的用于评估表单页面的使用效果的方法,其特征在于,所述用户接受度指标包括以下元素中的至少一者:
新用户数,该指标是指历史上首次使用本表单的用户数;
新用户无提交行动率,其计算规则为:新用户无提交行动率=(新用户PV—新用户有效提交PV—新用户无效提交PV根据页面标识去重)/新用户PV。
12.根据权利要求7所述的用于评估表单页面的使用效果的方法,其特征在于,所述用户留存度指标包括以下元素中的至少一者:
回访用户数,该指标是指回访的独立访客访问数;
回访率,其计算规则为:回访率=回访用户UV/页面UV;
平均使用次数,其计算规则为:平均使用次数=页面PV/页面UV;
平均回访周期,其计算规则为:平均回访周期=用户访问时间跨度/老用户PV;所述访问时间跨度是指最后一次访问日期与第一次访问日期之间的时间间隔。
13.一种用于评估表单页面的使用效果的装置,其特征在于,包括:
原始数据采集单元,用于采集反映客户端对表单页面及其所包含表单字段的访问情况的表单操作原始数据,生成日志文件;
指标分析计算单元,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据进行分析计算,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据;
其中,所述预先设定的表单页面使用效果指标包括:基础数据指标和复合指标;
所述表单操作原始数据包括:与用户进入表单页面相关的数据、与用户提交表单成功相关的数据、与用户提交表单失败相关的数据、以及与表单字段失去焦点时发生校验错误相关的数据;
且所述与用户进入表单页面相关的数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔。
14.根据权利要求13所述的用于评估表单页面的使用效果的装置,其特征在于,包括:
代码部署单元,用于在所述表单页面中部署与预先设定的表单访问事件相对应的javascript代码,当客户端通过表单页面接收到了与所述表单访问事件对应的表单操作时,触发对应的javascript代码上报与所述表单访问事件相关的表单操作原始数据。
15.根据权利要求14所述的用于评估表单页面的使用效果的装置,其特征在于,所述代码部署单元采用的所述预先设定的表单访问事件包括:进入表单页面、提交表单成功、提交表单失败和表单字段失去焦点时发生校验错误。
16.根据权利要求13所述的用于评估表单页面的使用效果的装置,其特征在于,还包括:
中间数据表生成单元,用于根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中记录的表单操作原始数据以及预先获取的用户基本信息进行汇总分析,生成关于表单页面以及表单字段的可供查询的中间数据表;
相应的,所述指标分析计算单元,具体用于根据预先设定的表单页面使用效果指标及其计算规则,对所述中间数据表进行相应的查询和计算操作,获取对应具体表单页面的指标值,作为评估所述表单页面使用效果的依据。
17.根据权利要求16所述的用于评估表单页面的使用效果的装置,其特征在于,所述指标分析计算单元包括:
查询请求接收子单元,用于接收评估者发送的查询请求,所述查询请求中包含针对具体表单页面的待查询指标;
查询计算执行子单元,用于按照预先设定的表单页面使用效果指标包含的对所述指标的定义,在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相关数据,并按照所述指标的计算规则计算所述指标的值;
查询结果返回子单元,用于将已获取的所述指标的值返回给所述评估者,供所述评估者评估所述具体表单页面的使用效果。
18.一种用于提供表单操作原始数据的方法,所述方法在客户端执行,其特征在于,包括:
接收对表单页面的访问操作,记录与所述访问操作相关的数据;
根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据;
其中,所述预先设定的表单页面使用效果指标包括:基础数据指标和复合指标;
所述表单操作原始数据包括:与用户进入表单页面相关的数据、与用户提交表单成功相关的数据、与用户提交表单失败相关的数据、以及与表单字段失去焦点时发生校验错误相关的数据;
且所述与用户进入表单页面相关的数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔。
19.根据权利要求18所述的用于提供表单操作原始数据的方法,其特征在于,与所述访问操作相关的数据包括以下元素中的至少一者:
表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。
20.一种用于提供表单操作原始数据的装置,其特征在于,所述装置部署在客户端上,包括:
数据记录单元,用于接收对表单页面的访问操作,记录与所述访问操作相关的数据;
数据发送单元,用于根据已经记录的与访问操作相关的数据,生成表单操作原始数据,用于发送给采集表单操作原始数据的服务端,以进一步用于根据预先设定的表单页面使用效果指标及其计算规则,对所述表单操作原始数据进行分析计算,获取对应表单页面的指标值,作为评估所述表单页面使用效果的依据;
其中,所述预先设定的表单页面使用效果指标包括:基础数据指标和复合指标;
所述表单操作原始数据包括:与用户进入表单页面相关的数据、与用户提交表单成功相关的数据、与用户提交表单失败相关的数据、以及与表单字段失去焦点时发生校验错误相关的数据;
且所述与用户进入表单页面相关的数据包括:表单标识、用户行为标识、新老用户标识、一定时间段内回访标识、和距上一次访问时间间隔。
21.根据权利要求20所述的用于提供表单操作原始数据的装置,其特征在于,所述数据记录单元记录的与所述访问操作相关的数据包括以下元素中的至少一者:表单标识、所述访问操作的行为标识、进入表单时间点、被访问的表单字段标识、访问表单字段的开始时间点、访问表单字段的结束时间点、提交表单的时间点、校验出错的表单字段标识及对应的出错信息。
CN201410324079.3A 2014-07-08 2014-07-08 用于评估表单页面使用效果及提供原始数据的方法及装置 Active CN105446706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410324079.3A CN105446706B (zh) 2014-07-08 2014-07-08 用于评估表单页面使用效果及提供原始数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410324079.3A CN105446706B (zh) 2014-07-08 2014-07-08 用于评估表单页面使用效果及提供原始数据的方法及装置

Publications (2)

Publication Number Publication Date
CN105446706A CN105446706A (zh) 2016-03-30
CN105446706B true CN105446706B (zh) 2020-01-10

Family

ID=55556961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410324079.3A Active CN105446706B (zh) 2014-07-08 2014-07-08 用于评估表单页面使用效果及提供原始数据的方法及装置

Country Status (1)

Country Link
CN (1) CN105446706B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107678808A (zh) * 2016-08-02 2018-02-09 阿里巴巴集团控股有限公司 页面信息选取方案生成方法及装置
CN108271072B (zh) * 2016-12-30 2021-02-12 北京国双科技有限公司 电子导航菜单的评估方法及装置
CN107800591B (zh) * 2017-11-07 2022-01-21 南威软件股份有限公司 一种统一日志数据的分析方法
CN108345693B (zh) * 2018-03-16 2022-01-28 中国银行股份有限公司 一种文件处理方法及装置
CN108683739A (zh) * 2018-05-16 2018-10-19 众安信息技术服务有限公司 一种终端应用内容的评估方法及装置
CN109165338A (zh) * 2018-07-04 2019-01-08 华迪计算机集团有限公司 一种信息效能分析方法及系统
CN109582739A (zh) * 2018-12-14 2019-04-05 北京向上心科技有限公司 表单管理方法、系统、设备及计算机可读存储介质
CN110232557A (zh) * 2019-04-29 2019-09-13 北京水滴互保科技有限公司 公益项目管理方法、装置、系统及电子设备、存储介质
CN110334930A (zh) * 2019-06-26 2019-10-15 深圳供电局有限公司 一种移动应用任务完成量的计算方法及系统
CN110489275B (zh) * 2019-07-23 2023-06-02 中国平安财产保险股份有限公司 一种单据信息的处理方法及相关设备
CN112256696A (zh) * 2020-09-30 2021-01-22 上海艾融软件股份有限公司 一种表单数据处理方法、装置、设备及存储介质
CN112540762B (zh) * 2020-12-08 2024-05-28 杭州讯酷科技有限公司 一种基于表及字段优化排序的ui界面快捷制作方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192145A (zh) * 2006-11-20 2008-06-04 阿里巴巴公司 一种错误即时提示的方法及系统
CN101593186A (zh) * 2008-05-29 2009-12-02 阿里巴巴集团控股有限公司 可视化网站编辑方法及可视化网站编辑系统
CN101872365A (zh) * 2010-07-02 2010-10-27 苏州阔地网络科技有限公司 一种在网页上实现的一键登录到其他网站的方法
CN103136335A (zh) * 2013-01-31 2013-06-05 北京千分点信息科技有限公司 一种基于数据平台的数据控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192145A (zh) * 2006-11-20 2008-06-04 阿里巴巴公司 一种错误即时提示的方法及系统
CN101593186A (zh) * 2008-05-29 2009-12-02 阿里巴巴集团控股有限公司 可视化网站编辑方法及可视化网站编辑系统
CN101872365A (zh) * 2010-07-02 2010-10-27 苏州阔地网络科技有限公司 一种在网页上实现的一键登录到其他网站的方法
CN103136335A (zh) * 2013-01-31 2013-06-05 北京千分点信息科技有限公司 一种基于数据平台的数据控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于使用效率的电子商务网站表单交互设计研究;胡丰;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140515;第2.2.3,2.2.5,3.1,4.1.2,4.2.5节 *

Also Published As

Publication number Publication date
CN105446706A (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN105446706B (zh) 用于评估表单页面使用效果及提供原始数据的方法及装置
US11659050B2 (en) Discovering signature of electronic social networks
CN106656536B (zh) 一种用于处理服务调用信息的方法与设备
US10664837B2 (en) Method and system for real-time, load-driven multidimensional and hierarchical classification of monitored transaction executions for visualization and analysis tasks like statistical anomaly detection
CN104426713B (zh) 网络站点访问效果数据的监测方法和装置
CN106201886B (zh) 一种实时数据任务的验证的代理方法及装置
US20110153383A1 (en) System and method for distributed elicitation and aggregation of risk information
WO2015074503A1 (zh) 网页访问数据统计方法及装置
CN112100052B (zh) 一种接口测试场景的回放方法及装置
CN112152823B (zh) 网站运行错误监控方法、装置及计算机存储介质
CN105868256A (zh) 处理用户行为数据的方法和系统
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
US10853359B1 (en) Data log stream processing using probabilistic data structures
US20230214863A1 (en) Methods and apparatus to correct age misattribution
CN110941738A (zh) 推荐方法、装置、电子设备及计算机可读存储介质
US20150278403A1 (en) Methods and systems for modeling crowdsourcing platform
CN109544014B (zh) 基于历史数据回放的反欺诈方法及装置
JP2018165857A (ja) 分析装置、分析システム、分析方法および分析プログラム
CN103440199A (zh) 测试引导方法和装置
US20110093309A1 (en) System and method for predictive categorization of risk
CN109711849B (zh) 以太坊地址画像生成方法、装置、电子设备及存储介质
TWI757169B (zh) 用於實時分析虛擬伺服器記錄的電腦實施系統以及方法
CN104281669A (zh) 社交网络用户影响数值的评估方法和装置
CN114969191A (zh) 基于大数据的数据分析方法、系统、装置及存储介质
CN106789277B (zh) 基于状态机模型的用户行为确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211108

Address after: No. 699, Wangshang Road, Binjiang District, Hangzhou, Zhejiang

Patentee after: Alibaba (China) Network Technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.