CN106126538A - 页面的转化处理方法及装置 - Google Patents

页面的转化处理方法及装置 Download PDF

Info

Publication number
CN106126538A
CN106126538A CN201610424018.3A CN201610424018A CN106126538A CN 106126538 A CN106126538 A CN 106126538A CN 201610424018 A CN201610424018 A CN 201610424018A CN 106126538 A CN106126538 A CN 106126538A
Authority
CN
China
Prior art keywords
page
configuration file
network address
converts
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610424018.3A
Other languages
English (en)
Other versions
CN106126538B (zh
Inventor
马宇峰
王晓元
叶峻
邓鸣捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610424018.3A priority Critical patent/CN106126538B/zh
Publication of CN106126538A publication Critical patent/CN106126538A/zh
Application granted granted Critical
Publication of CN106126538B publication Critical patent/CN106126538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种页面的转化处理方法及装置。其中所述方法包括:当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化。本发明的页面的转化处理方法,通过采用上述技术方案,能够根据多个网站的页面转化创建的转化配置文件,检测用户请求访问的页面是否发生转化,与现有技术中根据管理人员手动主观进行设置的转化规则进行检测相比,本实施例中根据多个网站的页面转化创建的转化配置文件更客观、准确,覆盖的转化规则更全面,因此,可以有效地提高网站的页面的转化检测效率。

Description

页面的转化处理方法及装置
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种页面的转化处理方法及装置。
【背景技术】
随着互联网的发展,互联网的网站上的各种行为的监控与统计也成为网站的运营者所关心的问题。例如各互联网公司开发自己的统计类的应用产品安装在网站上,检测用户的各种点击的行为以及点击之后的页面的转化行为,以统计网站的各个页面的转化率等等。
现有的互联网的统计类的应用产品,通过在网站上进行一定的转化条件设置,明确用户在网站上的哪些行为是转化。具体地,可以设置网页上的某些按钮被点击时,或可以设置网页上的JavaScript(JS)代码中的某个函数被调用时,或者网站上的某个特定统一资源定位符(Uniform Resource Locator;URL)被访问时,认为发生了页面转化。例如当用户点击“预约”、“咨询”按钮,或者是提交一个订单、留下自己的联系方式等等行为,可以设置为发生了页面的转化。
但是,现有技术中网站的转化检测是根据网站的管理人员手动主观进行设置的转化规则进行检测,而管理人员无法枚举所有的转化条件,而且还会出现错设、误设转化条件的情况,从而使得转化条件的设置上会存在较大漏洞,导致网站的页面转化检测效率较低。
【发明内容】
本发明提供了一种页面的转化处理方法及装置,以提高网站的页面转化检测效率。
本发明提供一种页面的转化处理方法,所述方法包括:
当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;
根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化。
本发明提供还提供一种页面的转化处理装置,所述装置包括:
获取模块,用于当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;
检测模块,用于根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化。
本发明的页面的转化处理方法及装置,通过采用上述技术方案,能够根据多个网站的页面转化创建的转化配置文件,检测用户请求访问的页面是否发生转化,与现有技术中根据管理人员手动主观进行设置的转化规则进行检测相比,本发明中根据多个网站的页面转化创建的转化配置文件更客观、准确,覆盖的转化规则更全面,因此,可以有效地提高网站的页面的转化检测效率;进而可以根据网站的转化检测,优选页面的设计,增强用户的体验。
【附图说明】
图1为本发明的页面的转化处理方法实施例一的流程图。
图2为本发明实施例中一类业务表单的示意图;
图3为本发明实施例中一类业务表单的提交按钮元素触发的页面的示意图。
图4为本发明实施例中一类事件转化的界面示意图。
图5为本发明的页面的转化处理方法实施例二的流程图。
图6为本发明的页面的转化处理装置实施例一的结构图。
图7为本发明的页面的转化处理装置实施例二的结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
随着大数据时代的到来,广告商、数据搜集方以及网站的运营者对用户在网站上转化行为的日益关注,了解转化行为对优化网站设计、选择合理广告渠道,有着关键的作用。然而传统的转化设置方法过于复杂,很多网站的运营者并没有足够动力进行专业的转化设置,这也导致了很多已有的转化设置是错设、误设的情况。
在这样的背景下,本发明提供了一种无需依赖于网站的运营者的先验知识,而是根据多个网站的页面转化创建的转化配置文件,再根据转化配置文件检测用户请求访问的页面的转化。
本发明的页面转化检测方案无需依赖于人工主观判断,且可以处理大规模网站,亦可降低转化行为获取遗漏的风险,为数据搜集平台、广告投放平台的转化分析提供了基础。
图1为本发明的页面的转化处理方法实施例一的流程图。如图1所示,本实施例的页面的转化处理方法,具体可以包括:
100、当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;
101、根据转化配置文件,检测用户请求访问的页面是否发生转化。
例如,本实施例的转化配置文件中可以记录有页面转化后的一些特性,以标识页面已经发生了转化。这样,根据页面转化配置文件中记录的页面的转化的特性,可以检测用户请求访问的页面是否与转化配置文件中记录的页面的特性相符,若相符,确定用户请求访问的页面发生了转化,否则,用户请求访问的页面未发生转化。
本实施例的页面的转化处理方法的执行主体为页面的转化处理装置,该页面的转化处理装置在使用时,可以设置在网站上,实现对该网站的用户请求的所有页面进行检测,以确定用户请求的页面是否为转化的页面,从而对网站的页面的转化情况进行统计分析,以便于进一步根据统计分析的结果,优化页面设计,增强用户的体验。
本实施例的转化配置文件可是以预先设定的,具体可以存储在网站的服务器一侧,以在用户请求访问页面的时候,对页面进行处理。本实施例的转化配置文件是根据多个网站的页面转化创建的,与现有技术的由网站的管理人员手动主观进行设置的相比,覆盖的转化条件更广,且具有较强的客观性,从而能够有效地提高网站的页面转化检测效率。
本实施例的转化配置文件还可以包括个人计算机(Person Computer;PC)端的和手机端的。当用户请求访问页面时,可以根据用户使用的PC或者手机选择对应端的转化配置文件进行页面转化检测。
例如,本实施例中的转化配置文件可以包括如下至少一种:页面转化配置文件、表单转化配置文件以及事件转化配置文件。
第一种、页面转化配置文件;该页面配置文件中包括页面中的业务类型的业务状态为成功状态对应的网址的模式;业务类型的成功状态包括成功或者完成状态;业务类型包括注册、提交、发布、预约、预定、开户、申请、下单、留言或者支付;因此,本实施例中的页面转化对应的页面转化规则可以采用如下方式表示:[(业务类型)(.*)(成功状态)],如:(注册|提交|发布|预约|预定|开户|申请|下单|留言|支付)(.*)(成功|完成)。
用户在到达该转化后的页面时,表示某项业务已经完成,例如用户完成注册或提交订单后,跳转到的“注册成功”或者“提交成功”等等页面。另外,对于某些宣传性质的网站,最终的那个“关于我们”的网页,在特殊场景下,也可以认为是业务状态为成功状态的页面。
需要说明的是,本实施例的页面转化配置文件还可以根据业务类型设置不同大小的粒度。例如,该页面转化配置文件中,可以存储每一种业务类型的业务状态为成功状态对应的网址的模式,这样,该页面转化配置文件中,对于每一种业务类型,都对应存储一个业务状态为成功状态对应的网址的模式;例如当业务类型为注册时,可以包括如下的统一资源定位符(Uniform Resoure Locator;URL),即网址:
http://xxx.com/regist_succuss_211232121.html;
http://xxx.com/regist_succuss_312121211.html;
根据上述两个URL,可以将该业务类型为注册的网址模式设置为http://xxx.com/regist_succuss_*.html。同理,也可以根据多个URL得到该业务类型的网址模式。
同理,当业务类型为购买时,可以包括如下的URL):
http://xxx.com/buy_succuss_211232121.html;
http://xxx.com/buy_succuss_312121211.html;
根据上述两个URL,可以将该业务类型为购买的网址模式设置为http://xxx.com/buy_succuss_*.html。同理,也可以根据多个URL得到该业务类型的网址模式。以此例推,可以在页面转化配置文件中存储多个类似的业务类型的成功状态的网址的模式。
另外,该页面转化配置文件中,存储的成功状态对应的网址的模式可以不区分业务类型,例如将上述实施例中的两种业务类型的模式再整合为一个网址的模式,如:
每一种业务类型的业务状态为http://xxx.com/*_succuss_*.html。或者该页面转化配置文件中还可以包括类似的其它的网址模式,如http://yyy.cn/*_succuss_*.html等等。
当转化配置文件中包括页面转化配置文件时,步骤101之前,还可以包括:获取用户请求访问的页面的网址。
此时步骤101具体可以包括:判断用户请求访问的页面的网址,是否符合页面转化配置文件中的业务类型的成功状态对应的网址的模式;若符合,确定页面发生页面转化;否则确定页面未发生页面转化。
第二种、表单转化配置文件;表单转化配置文件包括业务表单的提交按钮元素触发的页面的预设路径;
表单转化主要指网页上一类较特殊的表格。包括注册为网站用户、提交用户个人信息、发布用户需求,或者电商产品购买的订单表单等。表单转化的特征是通过提交表单网站主获得了更多的用户信息,包括用户通讯方式或者用户产品购买意向等。例如图2为一类业务表单的示意图,当用户在该图2中的业务表单中输入信息,并点击其中的“立即申请”的提交按钮时,此时对应的表单可能会转化成功。例如图3为一类业务表单的提交按钮元素触发的页面的示意图。当出现图3所示的界面,表示页面发生了表单转化。
本实施例中,通过在表单转化配置文件记录业务表单的提交按钮元素触发的页面为转化成功的页面路径作为预设路径。且该表单转化配置文件中可以记录有多个上述方式的预设路径。
当转化配置文件中包括表单转化配置文件,步骤101之前,还可以包括:提取用户请求访问的页面中的业务表单被提交后触发的页面的路径。
此时步骤101具体可以包括:判断用户请求访问的页面中的业务表单被提交后触发的页面的路径,是否与表单转化配置文件中的预设路径一致,若一致,确定页面发生表单转化;否则确定页面未发生表单转化;具体地,可以将该用户请求访问的页面中的业务表单被提交后触发的页面的路径,与表单转化配置文件中的多个预设路径进行一一比对,当存在与业务表单被提交后触发的页面的路径一致的预设路径,则确定页面发生表单转化;否则确定页面未发生表单转化。例如本实施例的预设路径可以为“body:div3:tr2:button1”,或根据xpath标准给出的“body/div[3]/tr[2]/button[1]”。
第三种、事件转化配置文件;该事件转化配置文件包括预设的点击事件标识。
其中事件转化主要包含用户在网站的一些特殊点击。例如某些网页上会内置一些聊天窗口,用户点击后就跳转到聊天页面,直接向网站客服人员提出自己的需求。如图4为一类事件转化的界面示意图。用户通过点击指定按钮、触发相关事件后,可以得到想要的效果,例如聊天、用户拨打电话等。由于在点击的背后,实质是触发了相关事件函数,且在实际监控时,也以监听函数为主流。如图4所示,为用户点击了某按钮之后,所跳转的聊天事件。进一步地,还可以点击该界面的某些元素的按钮,如“点击免费通话”或者“QQ在线咨询”等等,还可以进一步触发相应的事件函数,进行相应的事件转化。本实施例的事件转化配置文件中可以包括多个点击事件的标识,该点击事件的标识具体可以为对应的点击事件的函数的名称。
当转化配置文件中包括事件转化配置文件,步骤101之前,还可以包括:从用户请求访问的页面中绑定点击事件的元素的属性中提取点击事件的标识。例如点击事件函数可能绑定在元素的“onclick”的属性中,或以“href=“javascript:…””这样的形式展现在冒号“:”之后,可以按照相应的方式获取点击事件绑定的函数的名称。
此时步骤101具体可以包括:判断点击事件的标识,是否与事件转化配置文件中的预设的点击事件标识一致,若一致,确定页面发生事件转化;否则确定页面未发生事件转化。例如,判断获取的点击事件的函数是否与事件转化配置文件中的某一个预设的点击事件标识一致,若一致,确定页面发生事件转化;否则确定页面未发生事件转化。
本实施例的转化配置文件可以包括上述页面转化配置文件、表单转化配置文件以及事件转化配置文件中的任意一种、两种,或者也可以包括三种,以实现对用户请求的页面的转化的全方位检测。
进一步可选地,在上述实施例的步骤101之后,还可以包括:当检测到用户请求的页面发生转化时,显示转化类型,例如转化类型可以为页面转化、表单转化或者事件转化。具体地,当采用转化配置文件中的页面转化配置文件检测到用户请求的页面发生转化时,确定对应的转化类型为页面转化;当采用转化配置文件中的表单配置文件检测到用户请求的页面发生转化时,确定对应的转化类型为表单转化;当采用转化配置文件中的事件转化配置文件检测到用户请求的页面发生转化时,确定对应的转化类型为事件转化。
本实施例的页面的转化处理方法,通过采用上述技术方案,能够根据多个网站的页面转化创建的转化配置文件,检测用户请求访问的页面是否发生转化,与现有技术中根据管理人员手动主观进行设置的转化规则进行检测相比,本实施例中根据多个网站的页面转化创建的转化配置文件更客观、准确,覆盖的转化规则更全面,因此,可以有效地提高网站的页面的转化检测效率;进而可以根据网站的转化检测,优选页面的设计,增强用户的体验。
进一步可选地,在上述实施例的技术方案的基础上,在步骤100之前,还可以包括根据多个网站的页面转化创建转化配置文件。本实施例的转化配置文件可以根据多个网站的页面转化情况来生成,详细如下述实施例所述。
图5为本发明的页面的转化处理方法实施例二的流程图。如图5所示,本实施例的页面的转化处理方法,具体用于介绍上述“创建转化配置文件”的具体实现方式。如图5所示,本实施例的页面的转化处理方法,具体可以包括如下步骤:
200、采集多个网站的所有页面的网址;
例如本实施例的采集网站的所有页面的网址即URL,具体可以包括两种方式,第一种方式可以通过各网站的首页,通过超链接依次爬取各网站的所有页面的网址;第二种方式、收集各网站的历史访问的页面的网址。
对于第一种方式,各普通网站的所有页面的网址的爬取时,可以从对应的网站的首页出发,通过超链接依次爬取所有的相关网页。但考虑到有部分网站存在着“deep web(深网)”,也就是只有用户在真正浏览时才能触发这些网页(例如通过搜索某些关键词才能看得到的页面),为了避免抓取不够全面的问题,除了上述通过超链进行爬取的过程外,还需要将该网站历史访问过的页面的URL也进行抓取,该部分URL可以从相关应用中存储着的历史数据获得。由于上述两种方式获取的页面的网址都不够全面,本实施例中,优选地,以同时采用上述两种方式获取多个网站的所有页面的网址。
另外,由于用户在实际访问网站的过程中,有可能是通过PC的浏览器、也有可能通过手机访问。所以抓取时也需要分PC、手机端两个模式进行抓取。对应的后续的转化配置文件的建立也可以分为PC对应的转化配置文件,和手机对应的转化配置文件。
需要说明的是,在抓取页面的网址时,为确保抓取所得页面与当时用户浏览时的信息一致,采用抓取动态网页的方法进行抓取,且去除页面内容中样式为“display==none”的部分。
201、根据各个页面的网址,解析各页面的页面内容,并根据解析结果生成转化配置文件。
该步骤的具体实施方式,根据转化配置文件的类型的不同,具体可以包括如下几种情况:
第一种情况,具体可以包括如下步骤:
(a1)根据各个页面的网址打开对应的页面,判断该页面中是否存在业务类型对应的业务状态;当存在时,执行步骤(a2);否则丢掉该页面;
(a2)判断该页面中的业务类型对应的业务状态是否为成功状态;若是执行步骤(a3);否则丢掉该页面;
(a3)提取页面中的业务类型的业务状态为成功状态对应的页面的网址;执行步骤(a4);
(a4)根据各页面中的业务类型的业务状态为成功状态对应的页面的网址,确定业务类型的业务状态为成功状态对应的网址的模式;执行步骤(a5);
(a5)根据业务类型的业务状态为成功状态对应的网址的模式,生成页面转化配置文件;
具体地,根据步骤200采集的各个网站的所有页面的网址,解析每一个页面的内容,例如具体可以通过无界面可编程浏览器打开每一个页面,判断该页面是不是存在业务状态,如果存在,提取该页面的业务状态,如果该页面不存在业务状态,则丢掉该页面。本实施例的页面的业务状态,可以包括成功状态、不成功状态或者其他中间状态。从存在业务状态的剩下的页面中,提取页面中的业务类型的业务状态为成功状态对应的页面的网址;然后对于同一种业务类型,可以根据该业务类型的成功状态对应的所有网址,确定该业务类型的业务状态为成功状态对应的所有网址的模式;例如http://xxx.com/regist_succuss_*.html、以及http://xxx.com/buy_succuss_*.html,可以分别认为是业务类型为注册和购买的网址的模式。或者,也可以不区分业务类型,得到一个总的业务状态为成功状态的网址的模式,例如http://xxx.com/*_succuss_*.html。最后将所有业务类型的业务状态为成功状态对应的网址的模式集合在一起,生成页面转化配置文件。
第二种情况,具体可以包括如下步骤:
(b1)根据各个页面的网址打开对应的页面,判断页面中是否存在业务表单;若存在,执行步骤(b2);否则丢掉该页面;
(b2)获取业务表单的提交按钮元素触发的页面的路径,作为业务表单的提交按钮元素触发的页面的预设路径;
(b3)根据业务表单的提交按钮元素触发的页面的预设路径,生成表单转化配置文件;
具体地,解析步骤200采集的各个网站的所有页面的网址对应的页面内容,提取页面中的业务表单,例如该业务表单的上下文中包括“用户名”、“手机号”等用户信息,如果该页面中存在,记录业务表单的提交按钮元素上绑定的页面的路径,该页面路径对应的页面,即为该业务表单被提交之后,转化的页面。在用户实际访问过程中,若用户触发了该业务表单的提交,且导致新页面打开,则认为触发一次表单转化。
第三种情况,具体可以包括如下步骤:
(c1)根据各个页面的网址打开对应的页面,从页面中绑定的点击事件的元素的属性中提取点击事件的标识;
(c2)获取元素被触发点击事件标识对应的点击事件后请求资源的网址;
(c3)判断请求资源的网址是否符合预设的沟通工具的网址模式,若符合,执行步骤(c4);若不符合,执行步骤(c5);
(c4)确定发生了点击事件;执行步骤(c6);
(c5)确定发生了点击事件;结束。
(c6)将点击事件标识作为预设的点击事件标识;根据预设的点击事件标识,生成事件转化配置文件;结束。
本实施例的点击事件标识具体可以为点击事件的函数名称。具体地,解析步骤200采集的各个网站的所有页面的网址对应的页面内容,提取页面中各元素绑定的点击事件。具体地点击事件函数可能绑定在元素的“onclick”属性中,或以“href=“javascript:…””这样的形式展现,其中冒号“:”之后的“…“的部分即为点击事件的函数。
进一步地,利用无界面可编程浏览器(如headless browser),针对这些点击事件函数,打开对应URL并进行模拟点击执行,分析执行后的效果,以判断哪个点击事件函数可以认为是事件转化。
本实施例中事件转化,具体可以指的是点击事件函数触发了沟通事件。具体地,在网站间比较流行的沟通工具有商务通、百度商桥等工具,在网站使用这些工具进行沟通时,也需要到对应的地址去请求这些工具资源。只要检测在触发这些点击事件函数后,根据http请求的网址判断,有没有请求相关工具的资源,就可以判定该点击事件函数是否为事件转化。例如对于常用的沟通工具的网址,可以预先确定这些沟通工具的网址模式作为预设的沟通工具的网址模式。例如,下面列出几种常用的沟通工具及其对应网址的模式(pattern)。
沟通工具 对应的网址的pattern
商务通 zoosnet.net/LR/chatpre
百度商桥 qiao.baidu.com或linking.baidu.com/im.php
乐语 looyu.com
53客服 53kf.com
talk99 talk99.cn
快商 kuaishang.cn
美恰 meiqia.com
QQ qq.com/wp*
…… ……
然后将请求资源的网址与预设的沟通工具的网址模式中的每一种网址模式进行比对,判断请求资源的网址是否符合预设的沟通工具的某一种网址模式,若符合,将点击事件的标识作为预设的点击事件标识;否则若该请求资源的网址不符合预设的沟通工具的网址模式中的每一种网址模式,则丢掉该点击事件的标识。最后将所有的预设的点击事件标识集合在一起,生成事件转化配置文件。
更进一步地,上面所指的无界面可编程浏览器,可以采用phantomjs、HtmlUnit等。且由于每个点击事件函数在多个URL上出现,故在检查单个点击事件函数是否为沟通函数时,为降低由网络带宽、服务器处理错误引发的失误,可以多次触发,取可信结果。
需要说明的是,本实施例中在遍历转化点击时,遍历目标不是某些具体被点击的按钮,而是所有绑定在各个页面元素上的相关的点击事件函数。
本实施例的转化配置文件可以包括页面转化配置文件、表单转化配置文件以及事件转化配置文件中的一种或者多种。
按照上述实施例的方式,可以分别创建PC端和手机端的转化配置文件,且创建好转化配置文件之后,可以反馈给用户,由用户确认。另外,结合实际使用中,网站的页面转化成功的概率通常不大于该网站转化率的15%,本实施例的转化配置文件在使用之前,可以对其进行检测,若检测到该转化配置文件中的页面转化配置文件对某网站的页面转化率超过15%,可以检测该网站的网址中是不是存在“success”作为网址的关键词,从而导致页面转化率过高;若是,需要重新设置该网站的页面转化配置文件。
本实施例的页面的转化处理方法中,转化配置文件的离线式转化设置提取的核心是在设定一些通用的转化规则基础上,利用无界面可编程式浏览器,遍历网站上所有可能的候选转化行为,并探测触发这些行为后,有没有产生相应的转化现象,进而生成转化配置文件。这些转化配置文件可以推荐给用户,供其选择确认;也可以直接用于统计JS后台监控转化行为,直接提供给用户。
本实施例的页面的转化处理方法,通过采用上述实施例的技术方案,可以实现转化配置文件的创建,进而可以根据该转化配置文件对用户请求访问的页面进行检测;与现有技术的根据管理人员手动主观进行设置的转化规则进行检测相比,本实施例中根据多个网站的页面转化创建的转化配置文件更客观、准确,覆盖的转化规则更全面,因此,可以有效地提高网站的页面的转化检测效率,进而可以根据网站的页面的转化检测,优化页面设计,增强用户的体验。
图6为本发明的页面的转化处理装置实施例一的结构图。如图6,本实施例的页面的转化处理装置,具体可以包括:获取模块10和检测模块11。
其中获取模块10用于当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;检测模块11用于根据获取模块10获取的转化配置文件,检测用户请求访问的页面是否发生转化。
进一步可选地,本实施例的页面的转化处理装置中,转化配置文件包括如下至少一种:页面转化配置文件、表单转化配置文件以及事件转化配置文件。
进一步可选地,本实施例的页面的转化处理装置中,页面转化配置文件中包括页面中的业务类型的业务状态为成功状态对应的网址的模式;业务类型的成功状态标识包括成功或者完成;业务类型包括注册、提交、发布、预约、预定、开户、申请、下单、留言或者支付;
表单转化配置文件包括业务表单的提交按钮元素触发的页面的预设路径;
事件转化配置文件包括预设的点击事件标识。
进一步可选地,本实施例的页面的转化处理装置中,获取模块10还用于当转化配置文件中包括页面转化配置文件时,获取用户请求访问的页面的网址;检测模块11具体用于判断获取模块10获取的用户请求访问的页面的网址,是否符合页面转化配置文件中的业务类型的成功状态对应的网址的模式;若符合,确定页面发生页面转化;否则确定页面未发生页面转。
获取模块10还用于当转化配置文件中包括表单转化配置文件,提取用户请求访问的页面中的业务表单被提交后触发的页面的路径;检测模块11具体还用于判断获取模块10获取的用户请求访问的页面中的业务表单被提交后触发的页面的路径,是否与表单转化配置文件中的一致,若一致,确定页面发生表单转化;否则确定页面未发生表单转化。
获取模块10还用于当转化配置文件中包括事件转化配置文件,从用户请求访问的页面中绑定点击事件的元素的属性中提取点击事件的标识;检测模块11具体还用于判断获取模块10获取的点击事件的标识,是否与事件转化配置文件中的预设的点击事件标识一致,若一致,确定页面发生事件转化;否则确定页面未发生事件转化。
本实施例的页面的转化处理装置,通过采用上述模块实现页面的转化处理,与上述图1所示的相关方法实施例的实现原理以及技术效果相同,详细可以参考上述图1所示的相关方法实施例的记载,在此不再赘述。
图7为本发明的页面的转化处理装置实施例二的结构图。如图7所示,本实施例的页面的转化处理装置还包括:创建模块12用于根据多个网站的页面转化创建沟通配置文件。
进一步可选地,如图7所示,本实施例的页面的转化处理装置中,创建模块12具体可以包括:采集单元121和生成单元122。
其中采集单元121用于采集多个网站的所有页面的网址;生成单元122用于根据采集单元121采集的各个页面的网址,解析各页面的页面内容,并根据解析结果生成转化配置文件。
进一步可选地,其中的采集单元121具体用于:通过各网站的首页,通过超链接依次爬取各网站的所有页面的网址;和/或收集各网站的历史访问的页面的网址。
进一步可选地,生成单元122具体用于执行如下至少一种操作:
根据采集单元121采集的各个页面的网址打开对应的页面,提取页面中的业务类型对应的业务状态;根据各业务类型对应的业务状态,从各页面的网址中提取页面中的业务类型的业务状态为成功状态对应的页面的网址;根据各页面中的业务类型的业务状态为成功状态对应的页面的网址,确定业务类型的业务状态为成功状态对应的网址的模式;根据业务类型的业务状态为成功状态对应的网址的模式,生成页面转化配置文件;
根据采集单元121采集的各个页面的网址打开对应的页面,提取页面中的业务表单,获取业务表单的提交按钮元素触发的页面的路径,作为业务表单的提交按钮元素触发的页面的预设路径;根据业务表单的提交按钮元素触发的页面的预设路径,生成表单转化配置文件;以及
根据采集单元121采集的各个页面的网址打开对应的页面,从页面中绑定的点击事件的元素的属性中提取点击事件标识;获取元素被触发点击事件标识对应的点击事件后请求资源的网址;判断请求资源的网址与预设的沟通工具的网址模式是否相符,若相符,将点击事件标识作为预设的点击事件标识;根据预设的点击事件标识,生成事件转化配置文件。
此时对应的,获取模块10用于当用户请求访问页面时,获取生成单元122生成的的转化配置文件。
本实施例的页面的转化处理装置,通过采用上述模块实现页面的处理,与上述图2所示的相关方法实施例的实现原理以及技术效果相同,详细可以参考上述图2所示的相关方法实施例的记载,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种页面的转化处理方法,其特征在于,所述方法包括:
当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;
根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化。
2.根据权利要求1所述的方法,其特征在于,所述转化配置文件包括如下至少一种:页面转化配置文件、表单转化配置文件以及事件转化配置文件。
3.根据权利要求2所述的方法,其特征在于,所述页面转化配置文件中包括页面中的业务类型的业务状态为成功状态对应的网址的模式;所述业务类型的成功状态包括成功或者完成状态;所述业务类型包括注册、提交、发布、预约、预定、开户、申请、下单、留言或者支付;
所述表单转化配置文件包括业务表单的提交按钮元素触发的页面的预设路径;
所述事件转化配置文件包括预设的点击事件标识。
4.根据权利要求3所述的方法,其特征在于,当所述转化配置文件中包括所述页面转化配置文件时,根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化之前,所述方法还包括:
获取所述用户请求访问的所述页面的网址;
根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化,具体包括:
判断所述用户请求访问的所述页面的网址,是否符合所述页面转化配置文件中的所述业务类型的成功状态对应的网址的模式;若符合,确定所述页面发生页面转化;否则确定所述页面未发生页面转化;
当所述转化配置文件中包括所述表单转化配置文件,根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化之前,所述方法还包括:
提取所述用户请求访问的所述页面中的业务表单被提交后触发的页面的路径;
根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化,具体包括:
判断所述用户请求访问的所述页面中的业务表单被提交后触发的页面的路径,是否与所述表单转化配置文件中的所述预设路径一致,若一致,确定所述页面发生表单转化;否则确定所述页面未发生表单转化;
当所述转化配置文件中包括所述事件转化配置文件,根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化之前,所述方法还包括:
从所述用户请求访问的所述页面中绑定点击事件的元素的属性中提取点击事件的标识;
根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化,具体包括:
判断所述点击事件的标识,是否与所述事件转化配置文件中的所述预设的点击事件标识一致,若一致,确定所述页面发生事件转化;否则确定所述页面未发生事件转化。
5.根据权利要求2-4任一所述的方法,其特征在于,获取转化配置文件之前,所述方法还包括:根据多个网站的页面转化创建所述转化配置文件。
6.根据权利要求5所述的方法,其特征在于,根据多个网站的页面转化创建所述转化配置文件,具体包括:
采集所述多个网站的所有页面的网址;
根据各个页面的网址,解析各所述页面的页面内容,并根据解析结果生成所述转化配置文件。
7.根据权利要求6所述的方法,其特征在于,采集所述多个网站的所有页面的网址,具体包括:
通过各所述网站的首页,通过超链接依次爬取各所述网站的所有页面的网址;和/或
收集各所述网站的历史访问的页面的网址。
8.根据权利要求6所述的方法,其特征在于,根据各个页面的网址,解析各所述页面的页面内容,并根据解析结果生成所述转化配置文件,具体包括如下至少一种:
根据各个所述页面的网址打开对应的所述页面,判断所述页面中是否存在业务类型对应的业务状态;若存在,判断所述业务类型对应的业务状态是否为成功状态;若是,提取所述页面中的所述业务类型的业务状态为成功状态对应的页面的网址;根据各所述页面中的所述业务类型的业务状态为成功状态对应的页面的网址,确定所述业务类型的业务状态为成功状态对应的网址的模式;根据所述业务类型的业务状态为成功状态对应的网址的模式,生成所述页面转化配置文件;
根据各个所述页面的网址打开对应的所述页面,判断所述页面中是否存在业务表单,若存在,获取所述业务表单的提交按钮元素触发的页面的路径,作为所述业务表单的提交按钮元素触发的页面的所述预设路径;根据所述业务表单的提交按钮元素触发的页面的所述预设路径,生成所述表单转化配置文件;以及
根据各个所述页面的网址打开对应的所述页面,从所述页面中绑定的点击事件的元素的属性中提取点击事件的标识;获取所述元素被所述点击事件触发后请求资源的网址;判断所述请求资源的网址是否符合预设的沟通工具的网址模式,若符合,将所述点击事件标识作为所述预设的点击事件标识;根据所述预设的点击事件标识,生成所述事件转化配置文件。
9.一种页面的转化处理装置,其特征在于,所述装置包括:
获取模块,用于当用户请求访问页面时,获取根据多个网站的页面转化创建的转化配置文件;
检测模块,用于根据所述转化配置文件,检测所述用户请求访问的所述页面是否发生转化。
10.根据权利要求9所述的装置,其特征在于,所述转化配置文件包括如下至少一种:页面转化配置文件、表单转化配置文件以及事件转化配置文件。
11.根据权利要求10所述的装置,其特征在于,所述页面转化配置文件中包括页面中的业务类型的业务状态为成功状态对应的网址的模式;所述业务类型的成功状态标识包括成功或者完成;所述业务类型包括注册、提交、发布、预约、预定、开户、申请、下单、留言或者支付;
所述表单转化配置文件包括业务表单的提交按钮元素触发的页面的预设路径;
所述事件转化配置文件包括预设的点击事件标识。
12.根据权利要求11所述的装置,其特征在于:
所述获取模块,还用于当所述转化配置文件中包括所述页面转化配置文件时,获取所述用户请求访问的所述页面的网址;
所述检测模块,具体用于判断所述用户请求访问的所述页面的网址,是否符合所述页面转化配置文件中的所述业务类型的成功状态对应的网址的模式;若符合,确定所述页面发生页面转化;否则确定所述页面未发生页面转化;
所述获取模块,还用于当所述转化配置文件中包括所述表单转化配置文件,提取所述用户请求访问的所述页面中的业务表单被提交后触发的页面的路径;
所述检测模块,具体还用于判断所述用户请求访问的所述页面中的业务表单被提交后触发的页面的路径,是否与所述表单转化配置文件中的所述一致,若一致,确定所述页面发生表单转化;否则确定所述页面未发生表单转化;
所述获取模块,还用于当所述转化配置文件中包括所述事件转化配置文件,从所述用户请求访问的所述页面中绑定点击事件的元素的属性中提取点击事件的标识;
所述检测模块,具体还用于判断所述点击事件的标识,是否与所述事件转化配置文件中的所述预设的点击事件标识一致,若一致,确定所述页面发生事件转化;否则确定所述页面未发生事件转化。
13.根据权利要求10-12任一所述的装置,其特征在于,所述装置还包括:创建模块,用于根据多个网站的页面转化创建所述转化配置文件。
14.根据权利要求13所述的装置,其特征在于,所述创建模块,具体包括:
采集单元,用于采集所述多个网站的所有页面的网址;
生成单元,用于根据各个页面的网址,解析各所述页面的页面内容,并根据解析结果生成所述转化配置文件。
15.根据权利要求14所述的装置,其特征在于,所述采集单元,具体用于:
通过各所述网站的首页,通过超链接依次爬取各所述网站的所有页面的网址;和/或
收集各所述网站的历史访问的页面的网址。
16.根据权利要求14所述的装置,其特征在于,所述生成单元,具体用于执行如下至少一种操作:
根据各个所述页面的网址打开对应的所述页面,判断所述页面中是否存在业务类型对应的业务状态;若存在,判断所述业务类型对应的业务状态是否为成功状态;若是,提取所述页面中的所述业务类型的业务状态为成功状态对应的页面的网址;根据各所述页面中的所述业务类型的业务状态为成功状态对应的页面的网址,确定所述业务类型的业务状态为成功状态对应的网址的模式;根据所述业务类型的业务状态为成功状态对应的网址的模式,生成所述页面转化配置文件;
根据各个所述页面的网址打开对应的所述页面,判断所述页面中是否存在业务表单,若存在,获取所述业务表单的提交按钮元素触发的页面的路径,作为所述业务表单的提交按钮元素触发的页面的所述预设路径;根据所述业务表单的提交按钮元素触发的页面的所述预设路径,生成所述表单转化配置文件;以及
根据各个所述页面的网址打开对应的所述页面,从所述页面中绑定的点击事件的元素的属性中提取点击事件标识;获取所述元素被所述点击事件触发后请求资源的网址;判断所述请求资源的网址是否符合预设的沟通工具的网址模式,若符合,将所述点击事件的标识作为所述预设的点击事件标识;根据所述预设的点击事件标识,生成所述事件转化配置文件。
CN201610424018.3A 2016-06-14 2016-06-14 页面的转化处理方法及装置 Active CN106126538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610424018.3A CN106126538B (zh) 2016-06-14 2016-06-14 页面的转化处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610424018.3A CN106126538B (zh) 2016-06-14 2016-06-14 页面的转化处理方法及装置

Publications (2)

Publication Number Publication Date
CN106126538A true CN106126538A (zh) 2016-11-16
CN106126538B CN106126538B (zh) 2020-09-29

Family

ID=57270718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610424018.3A Active CN106126538B (zh) 2016-06-14 2016-06-14 页面的转化处理方法及装置

Country Status (1)

Country Link
CN (1) CN106126538B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874794A (zh) * 2017-05-08 2018-11-23 广东原昇信息科技有限公司 一种实时sem关键词转化效果分析系统及其分析方法
CN109740100A (zh) * 2019-01-03 2019-05-10 北京字节跳动网络技术有限公司 一种网页节点嗅探方法、装置、设备和储存介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079768A (zh) * 2006-05-25 2007-11-28 阿里巴巴公司 一种统计网页链接点击数据的方法
CN102411573A (zh) * 2010-09-20 2012-04-11 百度在线网络技术(北京)有限公司 一种基于网页中的网页访问者行为的信息获取方法和系统
CN102469111A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 网站访问分析方法和系统
CN102622423A (zh) * 2012-02-22 2012-08-01 优视科技有限公司 网页的显示方法、装置、浏览器及用户终端
CN103593441A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 获取会话的最大转化步数的方法及装置
CN104021015A (zh) * 2014-05-30 2014-09-03 北京奇虎科技有限公司 网银类网站的访问方法及浏览器
CN104156487A (zh) * 2014-08-28 2014-11-19 北京国双科技有限公司 网页数据统计方法及装置
CN104572043A (zh) * 2013-10-16 2015-04-29 阿里巴巴集团控股有限公司 一种对客户端应用的控件进行实时埋点的方法及装置
CN104731807A (zh) * 2013-12-20 2015-06-24 北京风行在线技术有限公司 一种统计和分析页面跳转数据的方法及装置
CN104820667A (zh) * 2014-09-15 2015-08-05 腾讯科技(北京)有限公司 网页点击量的上报方法、装置和系统
WO2016021085A1 (ja) * 2014-08-07 2016-02-11 廣幸 田中 データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル
CN105550184A (zh) * 2014-10-31 2016-05-04 阿里巴巴集团控股有限公司 一种信息获取方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079768A (zh) * 2006-05-25 2007-11-28 阿里巴巴公司 一种统计网页链接点击数据的方法
CN102411573A (zh) * 2010-09-20 2012-04-11 百度在线网络技术(北京)有限公司 一种基于网页中的网页访问者行为的信息获取方法和系统
CN102469111A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 网站访问分析方法和系统
CN102622423A (zh) * 2012-02-22 2012-08-01 优视科技有限公司 网页的显示方法、装置、浏览器及用户终端
CN104572043A (zh) * 2013-10-16 2015-04-29 阿里巴巴集团控股有限公司 一种对客户端应用的控件进行实时埋点的方法及装置
CN103593441A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 获取会话的最大转化步数的方法及装置
CN104731807A (zh) * 2013-12-20 2015-06-24 北京风行在线技术有限公司 一种统计和分析页面跳转数据的方法及装置
CN104021015A (zh) * 2014-05-30 2014-09-03 北京奇虎科技有限公司 网银类网站的访问方法及浏览器
WO2016021085A1 (ja) * 2014-08-07 2016-02-11 廣幸 田中 データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル
CN104156487A (zh) * 2014-08-28 2014-11-19 北京国双科技有限公司 网页数据统计方法及装置
CN104820667A (zh) * 2014-09-15 2015-08-05 腾讯科技(北京)有限公司 网页点击量的上报方法、装置和系统
CN105550184A (zh) * 2014-10-31 2016-05-04 阿里巴巴集团控股有限公司 一种信息获取方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874794A (zh) * 2017-05-08 2018-11-23 广东原昇信息科技有限公司 一种实时sem关键词转化效果分析系统及其分析方法
CN109740100A (zh) * 2019-01-03 2019-05-10 北京字节跳动网络技术有限公司 一种网页节点嗅探方法、装置、设备和储存介质

Also Published As

Publication number Publication date
CN106126538B (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
US11444856B2 (en) Systems and methods for configuring a resource for network traffic analysis
US9792365B2 (en) Method and system for tracking and gathering multivariate testing data
CN104216921B (zh) 一种实现浏览器中快速链接的添加提示方法、装置及系统
US20160140626A1 (en) Web page advertisement configuration and optimization with visual editor and automatic website and webpage analysis
CN104835066A (zh) 一种投放渠道的选择方法及系统
CN108334641B (zh) 采集用户行为数据的方法、系统、电子设备、存储介质
CN102870118B (zh) 用户行为的获取方法、设备及系统
CN107480277A (zh) 用于网站日志采集的方法及装置
CN106326485A (zh) 检测网站链接的方法和装置
CN107357903A (zh) 用户行为数据整合方法、装置及电子设备
CN109684583A (zh) 页面用户行为的分析方法、装置、终端及可读存储介质
CN107483443A (zh) 广告信息处理方法、客户端、存储介质和电子设备
CN109446431A (zh) 用于信息推荐的方法、装置、介质、和计算设备
CN110035053A (zh) 用于检测欺诈性的用户-内容提供者对的方法和系统
CN106126538A (zh) 页面的转化处理方法及装置
CN105450462B (zh) 在线状态的监测方法和系统
CN111858686B (zh) 数据显示方法、装置、终端设备及存储介质
CN107368399A (zh) 一种线上网页监控方法及系统
CN104468857B (zh) 一种对应关系的获取方法及系统
CN103823825B (zh) 在线内容采集
CN112749975B (zh) 自动处理退费请求的方法、自动处理平台
CN106326419A (zh) 网络自动机处理方法及装置
CN106095946B (zh) 页面的处理方法及装置
CN109711123A (zh) 基于模拟浏览器检测的行为检测方法及装置
CN102184175A (zh) 在网络中用于分析访问者性别的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant