CN104252453A - 网页推荐位内容访问轨迹写操作的检测方法和系统 - Google Patents

网页推荐位内容访问轨迹写操作的检测方法和系统 Download PDF

Info

Publication number
CN104252453A
CN104252453A CN201310256164.6A CN201310256164A CN104252453A CN 104252453 A CN104252453 A CN 104252453A CN 201310256164 A CN201310256164 A CN 201310256164A CN 104252453 A CN104252453 A CN 104252453A
Authority
CN
China
Prior art keywords
position content
write operation
clicked
recommendation position
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310256164.6A
Other languages
English (en)
Other versions
CN104252453B (zh
Inventor
杜佳利
李鑫竺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310256164.6A priority Critical patent/CN104252453B/zh
Publication of CN104252453A publication Critical patent/CN104252453A/zh
Application granted granted Critical
Publication of CN104252453B publication Critical patent/CN104252453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种网页推荐位内容访问轨迹中写操作的检测方法和系统,包括:在展示网页的推荐位内容时,构建该推荐位内容的统计标识;在检测到推荐位内容被点击后,获取该推荐位内容对应的目标页面,将该推荐位内容的统计标识传递到目标页面的链接中并跳转;在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述被点击推荐位内容的统计标识,如果包括则将所述统计标识传递到目标页面的链接中并跳转,在被点击的链接为写操作对应的链接时输出对应的写操作日志。利用本发明,可以提高检测的准确率,降低对系统设备资源的浪费。

Description

网页推荐位内容访问轨迹写操作的检测方法和系统
技术领域
本申请涉及计算机和互联网数据处理技术领域,尤其涉及一种网页推荐位内容访问轨迹中写操作的检测方法和系统。
背景技术
目前,随着互联网技术的发展,网络逐渐成为人们获取信息的重要来源,特别是在互联网进入Web2.0时代后,用户既是网站内容的浏览者,也是网站内容的制造者。用户参与创造的内容被称为UGC,如用户发表的日志、照片等。在Web2.0时代,由于UGC的大量涌现,网络信息曝光量呈几何级快速增长,形成一个多、广、专的局面,对人类知识的积累和传播起到了一个非常大的作用。
可以发表UGC的网站系统通常被称为UGC网站系统。例如目前常用的UGC网站系统包括:微博客(MicroBlog)系统、社交网络服务系统(SNS,Social Network Service))、社区论坛系统、知识分享系统等等。其中某些UGC网站系统的功能也是相互融合的,具有多种属性。
例如,微博客(MicroBlog),简称微博,是一个基于用户关系的信息分享、传播以及获取的UGC网站系统,也属于一种SNS系统,用户可以通过有线通信网络或无线通信网络、以及各种客户端访问微博,以指定数目的文字和/或其它多媒体信息更新信息,并实现即时分享。
鉴于UGC系统中UGC页面曝光量大,浏览频率高的特点,目前业界通常为了向目标受众推荐一些厂商的推荐内容,如热门话题、热门用户、功能点入口、专题、活动、广告等信息,往往在UGC网页的固定位置设置网页推荐位,用来投放推荐内容,比如在首页头部导航栏与用户资料之间的首页顶部推荐位。
在具有推荐位的网站系统中,需要检测推荐位内容的访问轨迹。所述推荐位内容的访问轨迹是指:从用户点击推荐位之后到用户点击指定的统计结束点之间的所有访问轨迹,其中包括读操作和写操作,读操作用于从网站系统查询信息并展示出来,写操作需要向网站系统中写入信息。例如在微博系统中,所述写操作包括消息的发表、转转播、评论、用户的收听、收藏、搜索、重要点击等。这种推荐位内容访问轨迹,尤其是其触发的写操作,渐渐成为了衡量推荐位内容热度以及传播广度的一项重要技术参数指标,可以为推荐位内容的推广管理人员提供直接的指导决策方案。
现有技术中,对推荐位内容访问轨迹中写操作的检测技术方案主要是:预先设置对推荐位内容的访问检测层数,例如设置为3层,那么点击一个推荐位内容进入该推荐位内容的详细页面,算是第一层,如果再点击该第一层页面中的某个链接进入该链接的目标页面,则算是第二层,如果再点击该第二层页面中的某个链接进入该连接的目标页面,则算是第三层。现有技术针对从用户点击某一推荐位内容开始,针对每一层记录其中的写操作的操作日志,直到设置的检测层数,结束对本推荐位内容的访问轨迹中写操作的检测。
但是,现有技术存在如下缺点:
所述预设访问检测层数往往是设备运营维护人员根据经验设定的,其层次数往往不准确,尤其是对于目前庞大的UGC网站系统来说,由于发布的UGC数量巨大,通常是数十亿以上的规模,用户数量也是几亿的规模,推荐位的内容千差万别,用户的访问习惯也千差万别,不同用户对不同推荐位内容的访问层数有很大的差别,如果预设的检测层数设置得太小,则无法检测到真实的访问轨迹,检测的准确率太低;如果预设的检测层数设置得太大,则由于检测的结束点太靠后造成检测冗余,往往用户访问完一个推荐位内容又访问了其它推荐位内容后,对第一个推荐位内容的检测还没有结束,不但造成系统设备资源的浪费,而且还会将多个推荐位内容的访问轨迹信息混淆到一起,降低了检测的准确率。
发明内容
有鉴于此,本发明的主要目的是提供一种网页推荐位内容访问轨迹中写操作的检测方法,以提高检测的准确率,降低对系统设备资源的浪费。
本发明的另一目的是提供一种网页推荐位内容访问轨迹中写操作的检测系统,以提高检测的准确率,降低对系统设备资源的浪费。
本发明的技术方案是这样实现的:
一种网页推荐位内容访问轨迹中写操作的检测方法,包括:
在展示网页的推荐位内容时,构建该推荐位内容的统计标识;
在检测到推荐位内容被点击后,获取当前被点击的推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面;
在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述当前被点击推荐位内容的统计标识;在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面,且被点击的链接为写操作对应的链接时输出对应的写操作日志;如果被点击链接中不包括所述统计标识,则结束对当前被点击推荐位内容的检测。
一种网页推荐位内容访问轨迹中写操作的检测系统,该检测系统包括:
标识构建模块,用于在展示网页的推荐位内容时,构建该推荐位内容的统计标识;
标识传递模块,用于在检测到推荐位内容被点击后,获取该推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面;
写操作日志模块,具体包括:
判断子模块,用于在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述被点击推荐位内容的统计标识;
标识传递子模块,用于在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面;
写操作日志输出子模块,用于在被点击的链接为写操作对应的链接时输出对应的写操作日志;
结束检测子模块,用于在被点击链接中不包括所述统计标识时,则结束对本推荐位内容的检测。
与现有技术相比,本发明在网页上展现推荐位内容时就构建该推荐位内容的统计标识,在该推荐位内容被点击后,将该统计标识传递给点击后的目标页面,即需要获取该推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,并展示对应的目标页面;在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述被点击推荐位内容的统计标识;在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,实现了将当前的统计标识再次向下一个目标页面传递,并展示该目标页面,且当被点击的链接为写操作对应的链接时,输出对应的写操作日志;如果被点击链接中不包括所述统计标识,则结束对当前被点击推荐位内容的检测。通过本发明的处理,可以不必预设对推荐位内容的访问检测层数,只要根据预先设置好的结束点特征,则检测的层数即检测结束位置就可以根据用户的点击行为自动适配,从而可以检测到用户对推荐位内容的真实访问轨迹,避免多个推荐位内容的访问轨迹信息的混淆,提高了检测的准确率;同时由于不会发生检测层数的冗余,因此也降低了对系统设备资源的浪费。
附图说明
图1为本发明所述网页推荐位内容访问轨迹中写操作的检测方法的一种流程图;
图2为本发明所述一种具有推荐位内容的网页界面示意图;
图3为图2所述推荐位内容对应的目标页面的示意图;
图4为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的一种实施例组成示意图;
图5为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的另一种实施例的组成示意图;
图6为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的又一种实施例的组成示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
图1为本发明所述网页推荐位内容访问轨迹中写操作的检测方法的一种流程图。参见图1,该方法包括:
步骤101、在展示网页的推荐位内容时,构建该推荐位内容的统计标识。
步骤102、在检测到推荐位内容被点击后,确定该被点击的推荐位内容为当前被点击推荐位内容,开始对该当前被点击推荐位内容的访问轨迹的写操作的检测,具体的检测过程包括后续的过程:获取当前被点击的推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面。
所述将统计标识添加到目标页面中的不符合预设的结束点特征的链接中,相当于将所述统计标识向下一层目标页面进行了传递。
步骤103、在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述当前被点击推荐位内容的统计标识;在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面,且被点击的链接为写操作对应的链接时输出对应的写操作日志,然后在新的目标页面中会重复本步骤103;如果被点击链接中不包括所述统计标识,则结束对当前被点击推荐位内容的检测。
在一种具体实施例中,上述步骤101所述在展示网页的推荐位内容时,构建该推荐位内容的统计标识,具体包括:在展示网页的推荐位内容时,根据该推荐位的标识获取当前在该推荐位展示的推荐位内容标识和推荐位内容类型标识,将所述推荐位标识、推荐位内容标识和推荐位内容类型标识作为该推荐位内容的统计标识添加到该推荐位内容的链接中。
例如,当用户终端访问页面时,会向服务器请求展示该页面中的数据,对于包括推荐位的页面,例如微博推荐位的页面,服务器会根据该推荐位的标识(ID)从推荐位的运营服务器拉取得到推荐位内容的具体数据。所述推荐位的运营服务器用于管理网站系统中的推荐位的位置、所推荐展示的内容的投放,所推荐内容类型的划分等。所述推荐位内容的具体数据包括该推荐位内容的标识(ID)、该推荐位内容的类型标识(ID)、该推荐位内容的展示数据(如文字、图片、多媒体等)、以及该推荐位内容的链接等数据。然后根据获取的推荐位内容的具体数据构建该推荐位的展示代码,所述展示代码可以由浏览器或客户端解析并展示出该推荐位的内容,如文字、图片、多媒体信息、链接等。而且,此时需要向推荐位内容的链接中添加统计标识lp,该统计标识中包括本推荐位的ID、推荐位内容ID,还可以进一步包括推荐位内容类型的ID。所述推荐位内容类型例如可以分为:广告、话题、用户、消息、基础功能等。
例如图2为本发明所述一种具有推荐位内容的网页界面示意图。参见图2,在网页顶部的导航栏200的下方存在一个推荐位,并实时展示了该推荐位所发布的推荐位内容201,此处为一个话题,话题名称为“你恋爱了父母第一句话会说什么”,当鼠标移到该推荐位内容201上时,按照现有浏览器的功能,在浏览器底部可以展示的该推荐位内容201的链接数据,其中的“lp=mbw_home_top,138513,3,1,3”202即为所构建的本推荐位内容的统计标识。当用户点击了推荐位内容201后,跳转到如图3所示的推荐位内容对应的目标页面。参见图3,该目标页面展示了所述话题的详细内容,其中包括众多链接,本发明将推荐位内容201的统计标识202添加到了该目标页面中的不符合预设的结束点特征的所有链接中。例如,当鼠标移到其中某一链接如一“评论”链接300上,那么按照现有浏览器的功能可以在浏览器底部展示出该“评论”链接300的详细链接数据,如图所示,该“评论”链接300的链接数据中已经添加了所述推荐位内容201的统计标识202。当然,对于其它非结束点的链接也都添加了该统计标识202。
在一种优选实施例中,所述预设的结束点为:与当前被点击推荐位内容不同的推荐位内容链接和导航链接。例如图3中的导航栏200中的导航链接,以及图3中网页底部推荐位所推荐的与当前被点击推荐位内容201不同的一个推荐位内容301(是一个推荐用户:阿森纳Arsenal),都是结束点。如果用户点击了与当前被点击推荐位内容不同的推荐位内容301的链接,则结束对当前被点击推荐位内容201的检测,开始检测该新的推荐位内容301;如果用户点击了导航链接,则结束对当前被点击推荐位内容201的检测,跳转到导航链接对应的目标页面。
在一种具体的实施例中,所述步骤103中,所述被点击的链接为写操作对应的链接时,输出对应的写操作日志,具体包括:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,输出包括所述写操作相关信息和当前推荐位内容的统计标识的写操作日志。
所述写操作的相关信息具体包括:写操作的相关标识和/或详情、以及发起该写操作的用户信息。所述写操作的相关标识例如可以为该写操作的动作代码或名称,也可以根据写操作的动作代码从相关模块查询到该写操作的名称以及详情,比如如果写操作为转播某条消息,则根据动作代码可以从网站系统的相关模块查询到是发表消息、且是转播的动作详情。所述发起写操作的用户信息例如可以是用户标识、IP地址、用户终端的机型、相关软件如操作系统或浏览器的版本、网络连接方式(如是wifi还是2G或3G移动通信)等等。
所述写操作相关信息的具体查询方法是:当被点击的链接为写操作对应的链接时,从网站系统的相关写操作模块查询该写操作的相关标识和/或详情、以及发起该写操作的用户信息。这些相关的写操作模块为现有成熟的处理模块,用于存储写操作的标识和详情、以及采集发起写操作的用户信息,外界可以从中查询得到写操作的相关标识和/或详情、以及发起该写操作的用户信息。
在另一种具体的实施例中,所述步骤103中,所述被点击的链接为写操作对应的链接时,输出对应的写操作日志,也可以具体包括:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,并根据当前被点击推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,输出包括所述写操作相关信息和该推荐位名称和推荐位内容详情信息的写操作日志。
所述推荐位名称和推荐位内容设置在推荐位的运营系统中,所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,具体可以为:根据当前推荐位内容的统计标识,直接从推荐位运营系统中查询推荐位名称和推荐位内容的详情信息;其中,如果推荐位内容为用户、话题、消息时,由于这些内容的数量巨大,在一个网络节点(如此处为推荐位的运营系统)上没有全量数据,因此具体会通过调用网站系统中的相应服务接口(如微博系统中的OIDB接口)来查询推荐位内容的名称和详情。
另外,由于目前网站系统本身具有海量的用户访问,每秒产生的写操作量巨大,在输出写操作日志时由于要查询推荐位名称和内容,通常会对网站系统的性能产生较大的压力,影响检测速度。因此,在另一实施例中,所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,具体为:预先定时将推荐位运营系统中的统计标识与推荐位名称和推荐位内容详细信息的映射关系更新到本发明所述方法执行主体(通常是网页前端服务器)的内存中,所述被点击的链接为写操作对应的链接时,根据当前推荐位内容的统计标识从内存中查询推荐位名称和推荐位内容的详细信息。这样,可以提高输出写操作日志的速度,从而提高整体的检测速度。
本发明由于输出的写操作日志中包括写操作相关信息以及对应的推荐位内容的统计标识甚至推荐位内容名称和内容,这样后台管理人员就可以非常方便地得到每个推荐位内容触发的写操作信息的种类、数量等信息,从而进一步方便管理人员衡量推荐位内容热度以及传播广度等参数指标,可以为推荐位内容的推广管理人员提供直接的指导决策方案。
在本发明另一种实施例中,还可以在用户第一次点击一个推荐位内容、以及此后点击了一个新的推荐位内容时,输出点击日志。具体的实现方法为:在上述获取到目标页面后,进一步查找该目标页面中与当前被点击推荐位内容相同的推荐位内容的链接,在该推荐位内容的链接中添加否定标记;在检测到推荐位内容被点击后,进一步判断该被点击推荐位内容的链接中是否有所述否定标记,在没有所述否定标记的情况下,输出点击日志;如果有否定标记则说明该推荐位内容还是用户当前所查看的推荐位内容,不必再输出点击日志。
所述输出点击日志的方式具体包括:查询当前点击操作的相关信息,输出包括该点击操作相关信息和该被点击推荐位内容的统计标识的点击日志。
或者,所述输出点击日志的方式具体也可以包括:查询当前点击操作的相关信息,根据当前被点击推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,输出包括所述点击操作相关信息和该推荐位名称和推荐位内容详情信息的点击操作日志。
所述当前点击操作的相关信息包括:发起当前点击操作的用户信息。例如用户标识、IP地址、用户终端的机型、相关软件如操作系统或浏览器的版本、网络连接方式(如是wifi还是2G或3G移动通信)等等。这些用户信息的具体查询方法是:可以在检测到推荐位内容被点击后,从网站系统的相关点击操作模块查询发起该点击操作的用户信息,这些相关的点击操作模块为现有成熟的处理模块,用于采集发起点击操作的用户信息,外界可以根据查询条件从中查询得到发起点击操作的用户信息。
至于所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息的具体方法,与上述实施例中的具体方法相同。
在另一种具体实施例中,本发明还可以进一步包括:将所述输出的日志(包括所述点击日志和/或所述写操作日志)定期传输到统一的日志服务器上,根据所述日志服务器上的日志中记录的信息,统计写操作与推荐位内容之间的对应关系,以及统计点击操作与推荐位内容之间的对应关系。从而方便统计人员处理这些日志,生成相应的统计报表或其它形式的统计效果展现方式,可以更好的为用户推荐更感兴趣、更有价值的内容,为用户个性化订制内容提供了很好的基础和数据支持,也可以促进UGC网站系统的页面浏览(PV)量、独立访问者(UV)量、写操作数(写消息数)的增长,以及促进用户活跃度和用户粘性的提高。
与上述方法对应,本发明还公开了一种网页推荐位内容访问轨迹中写操作的检测系统,用于执行本发明所述的方法。
图4为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的一种实施例组成示意图。参见图4,该检测系统400包括:
标识构建模块401,用于在展示网页的推荐位内容时,构建该推荐位内容的统计标识。
标识传递模块402,用于在检测到推荐位内容被点击后,获取该推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面。
写操作日志模块403,具体包括:
判断子模块431,用于在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述被点击推荐位内容的统计标识;
标识传递子模块432,用于在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面;
写操作日志输出子模块433,用于在被点击的链接为写操作对应的链接时输出对应的写操作日志;
结束检测子模块434,用于在被点击链接中不包括所述统计标识时,则结束对本推荐位内容的检测。
所述将统计标识添加到目标页面中的不符合预设的结束点特征的链接中,相当于将所述统计标识向下一层目标页面进行了传递。并且针对同一推荐位内容的每一层的目标页面,所述写操作日志模块403都需要执行。
本发明中,所述检测系统通常可以设置在网站系统的前端系统中,所述前端系统通常是指与用户交互端,具体可以通过专门的客户端(Client)实现,也可以通过网络浏览器(Browser)来访问服务器的方式实现。即可以采用浏览器/服务器(B/S)结构,也可以采用客户端/服务器(C/S)结构,但是在网络信息飞速发展的年代,系统架构可能还会发展和变化,但不论是什么架构,本发明的核心思想和核心的功能模块是相同的,只是执行具体功能的模块的所处位置不同而已。
在一种具体的实施例中,所述标识构建模块401具体用于:在展示网页的推荐位内容时,根据该推荐位的标识获取当前在该推荐位展示的推荐位内容标识和推荐位内容类型标识,将所述推荐位标识、推荐位内容标识和推荐位内容类型标识作为该推荐位内容的统计标识添加到该推荐位内容的链接中。具体的实例可以参见上述对图2和图3的描述。
在一种优选实施例中,所述预设的结束点为:与当前被点击推荐位内容不同的推荐位内容链接和导航链接。例如图3中的导航栏200中的导航链接,以及图3中网页底部推荐位所推荐的与当前被点击推荐位内容201不同的一个推荐位内容301(是一个推荐用户:阿森纳Arsenal),都是结束点。
在一种具体的实施例中,所述写操作日志输出子模块433具体用于:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,输出包括所述写操作相关信息和当前推荐位内容的统计标识的写操作日志。
在另一种具体的实施例中,所述写操作日志输出子模块433也可以具体用于:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,根据当前推荐位内容的统计标识查询当前推荐位名称和推荐位内容的详情信息,输出包括所述写操作相关信息和当前推荐位内容的推荐位名称和推荐位内容详情信息的写操作日志。
所述写操作的相关信息具体包括:写操作的相关标识和/或详情、以及发起该写操作的用户信息。所述写操作的相关标识例如可以为该写操作的动作代码或名称,可以根据写操作的动作代码从相关模块查询到该写操作的名称以及详情,比如如果写操作为转播某条消息,则根据动作代码可以从网站系统的相关模块查询到是发表消息、且是转播的动作详情。所述发起写操作的用户信息例如可以是用户标识、IP地址、用户终端的机型、相关软件如操作系统或浏览器的版本、网络连接方式(如是wifi还是2G或3G移动通信)等等。
所述写操作相关信息的具体查询方法是:当被点击的链接为写操作对应的链接时,从网站系统的相关写操作模块查询该写操作的相关标识和/或详情、以及发起该写操作的用户信息。这些相关的写操作模块为现有成熟的处理模块,用于存储写操作的标识和详情、以及采集发起写操作的用户信息,外界可以从中查询得到写操作的相关标识和/或详情、以及发起该写操作的用户信息。
所述推荐位名称和推荐位内容设置在推荐位的运营系统中,所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,具体可以为:根据当前推荐位内容的统计标识,直接从推荐位运营系统中查询推荐位名称和推荐位内容的详情信息;其中,如果推荐位内容为用户、话题、消息时,由于这些内容的数量巨大,在一个网络节点(如此处为推荐位的运营系统)上没有全量数据,因此具体会通过调用网站系统中的相应服务接口(如微博系统中的OIDB接口)来查询推荐位内容。
另外,由于目前网站系统本身具有海量的用户访问,每秒产生的写操作量巨大,在输出写操作日志时由于要查询推荐位名称和内容,通常会对网站系统的性能产生较大的压力,影响检测速度。因此,在另一实施例中,所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,具体为:预先定时将推荐位运营系统中的统计标识与推荐位名称和推荐位内容详细信息的映射关系更新到本检测系统所在设备的内存中,所述被点击的链接为写操作对应的链接时,根据当前推荐位内容的统计标识从内存中查询推荐位名称和推荐位内容的详细信息。这样,可以提高输出写操作日志的速度,从而提高整体的检测速度。
图5为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的另一种实施例的组成示意图。参见图5,该检测系统500除了上述实施例包括的模块外,还进一步包括:
标记添加模块501,用于在所述获取到目标页面后查找该目标页面中与当前被点击推荐位内容相同的推荐位内容的链接,在该推荐位内容的链接中添加否定标记;
点击日志模块502,用于在检测到推荐位内容被点击后,判断该被点击推荐位内容的链接中是否有所述否定标记,在没有所述否定标记的情况下,输出点击日志。
所述输出的点击日志包括:所述点击操作相关信息和所述被点击推荐位内容的统计标识;或者包括所述点击操作相关信息和被点击推荐位内容的推荐位名称和推荐位内容详情信息。所述当前点击操作的相关信息,包括:发起当前点击操作的用户信息。例如用户标识、IP地址、用户终端的机型、相关软件如操作系统或浏览器的版本、网络连接方式(如是wifi还是2G或3G移动通信)等等。
图6为本发明所述网页推荐位内容访问轨迹中写操作的检测系统的又一种实施例的组成示意图,该图6的实施例包括了上述图5所述实施例的模块,当然也可以包括图4所述实施例的模块。由于UGC网站系统通常非常庞大,所有装置和模块不可能集中在一个网络节点上,因此本发明所输出的写操作日志和或点击日志也会分布在一个以上的网络节点上,因此本发明检测系统还可以进一步包括:
日志汇总模块601,用于将所述输出的日志(包括写操作日志和/或点击日志)定期传输到统一的日志服务器上;
统计模块602,用于根据所述日志服务器上的日志中记录的信息,统计写操作与推荐位内容之间的对应关系。该统计模块602可以设置在日志服务器上,也可以设置在日志服务器之外。
通过上述图6所述的实施例,可以方便统计人员处理这些日志,生成相应的统计报表或其它形式的统计效果展现方式,可以更好的为用户推荐更感兴趣、更有价值的内容,为用户个性化订制内容提供了很好的基础和数据支持,也可以促进UGC网站系统的页面浏览(PV)量、独立访问者(UV)量、写操作数(写消息数)的增长,以及促进用户活跃度和用户粘性的提高。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述各实施例的功能模块可以位于一个终端或网络节点,或者也可以分布到多个终端或网络节点上。
另外,本发明的每一个实施例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本发明。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。
因此本发明还公开了一种存储介质,其中存储有数据处理程序,该数据处理程序用于执行本发明上述方法的任何一种实施例。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (22)

1.一种网页推荐位内容访问轨迹中写操作的检测方法,其特征在于,包括:
在展示网页的推荐位内容时,构建该推荐位内容的统计标识;
在检测到推荐位内容被点击后,获取当前被点击的推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面;
在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述当前被点击推荐位内容的统计标识;在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面,且被点击的链接为写操作对应的链接时输出对应的写操作日志;如果被点击链接中不包括所述统计标识,则结束对当前被点击推荐位内容的检测。
2.根据权利要求1所述的方法,其特征在于,在展示网页的推荐位内容时,构建该推荐位内容的统计标识,具体包括:在展示网页的推荐位内容时,根据该推荐位的标识获取当前在该推荐位展示的推荐位内容标识和推荐位内容类型标识,将所述推荐位标识、推荐位内容标识和推荐位内容类型标识作为该推荐位内容的统计标识添加到该推荐位内容的链接中。
3.根据权利要求1所述的方法,其特征在于,所述被点击的链接为写操作对应的链接时,输出对应的写操作日志,具体包括:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,输出包括所述写操作相关信息和当前推荐位内容的统计标识的写操作日志。
4.根据权利要求1所述的方法,其特征在于,所述被点击的链接为写操作对应的链接时,输出对应的写操作日志,具体包括:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,根据当前被点击推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,输出包括所述写操作相关信息和该推荐位名称和推荐位内容详情信息的写操作日志。
5.根据权利要求3或4所述的方法,其特征在于,所述写操作的相关信息具体包括:写操作的相关标识和/或详情、以及发起该写操作的用户信息。
6.根据权利要求1所述的方法,其特征在于,
在所述获取到目标页面后,进一步包括:查找该目标页面中与当前被点击推荐位内容相同的推荐位内容的链接,在该推荐位内容的链接中添加否定标记;
在检测到推荐位内容被点击后,进一步包括:判断该被点击推荐位内容的链接中是否有所述否定标记,在没有所述否定标记的情况下,输出点击日志。
7.根据权利要求6所述的方法,其特征在于,所述输出点击日志,具体包括:查询当前点击操作的相关信息,输出包括该点击操作相关信息和该被点击推荐位内容的统计标识的点击日志。
8.根据权利要求6所述的方法,其特征在于,所述输出点击日志,具体包括:查询当前点击操作的相关信息,根据当前被点击推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,输出包括所述点击操作相关信息和该推荐位名称和推荐位内容详情信息的点击操作日志。
9.根据权利要求4或8所述的方法,其特征在于,所述根据当前推荐位内容的统计标识查询推荐位名称和推荐位内容的详情信息,具体包括:
根据当前推荐位内容的统计标识,从推荐位运营系统中查询推荐位名称和推荐位内容的详情信息;
或者,预先定时将推荐位运营系统中的统计标识与推荐位名称和推荐位内容详细信息的映射关系更新到内存中,根据当前推荐位内容的统计标识从内存中查询推荐位名称和推荐位内容的详细信息。
10.根据权利要求7或8所述的方法,其特征在于,所述当前点击操作的相关信息,包括:发起当前点击操作的用户信息。
11.根据权利要求1、2、3、4、6、7、或8任一项所述的方法,其特征在于,所述预设的结束点为:与当前被点击推荐位内容不同的推荐位内容链接和导航链接。
12.根据权利要求1、2、3、4、6、7、或8任一项所述的方法,其特征在于,该方法进一步包括:将所述输出的日志定期传输到统一的日志服务器上,根据所述日志服务器上的日志中记录的信息,统计写操作与推荐位内容之间的对应关系。
13.一种网页推荐位内容访问轨迹中写操作的检测系统,其特征在于,该检测系统包括:
标识构建模块,用于在展示网页的推荐位内容时,构建该推荐位内容的统计标识;
标识传递模块,用于在检测到推荐位内容被点击后,获取该推荐位内容对应的目标页面,将该推荐位内容的统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到对应的目标页面;
写操作日志模块,具体包括:
判断子模块,用于在目标页面中,如果检测到链接被点击,则判断该被点击链接中是否包括所述被点击推荐位内容的统计标识;
标识传递子模块,用于在被点击链接中包括所述统计标识时,则获取该链接对应的目标页面,将该统计标识添加到该目标页面中的不符合预设的结束点特征的链接中,跳转到该目标页面;
写操作日志输出子模块,用于在被点击的链接为写操作对应的链接时输出对应的写操作日志;
结束检测子模块,用于在被点击链接中不包括所述统计标识时,则结束对本推荐位内容的检测。
14.根据权利要求13所述的检测系统,其特征在于,所述标识构建模块具体用于:在展示网页的推荐位内容时,根据该推荐位的标识获取当前在该推荐位展示的推荐位内容标识和推荐位内容类型标识,将所述推荐位标识、推荐位内容标识和推荐位内容类型标识作为该推荐位内容的统计标识添加到该推荐位内容的链接中。
15.根据权利要求13所述的检测系统,其特征在于,所述写操作日志输出子模块具体用于:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,输出包括所述写操作相关信息和当前推荐位内容的统计标识的写操作日志。
16.根据权利要求13所述的检测系统,其特征在于,所述写操作日志输出子模块具体用于:所述被点击的链接为写操作对应的链接时,查询该写操作的相关信息,根据当前推荐位内容的统计标识查询当前推荐位名称和推荐位内容的详情信息,输出包括所述写操作相关信息和当前推荐位内容的推荐位名称和推荐位内容详情信息的写操作日志。
17.根据权利要求15或16所述的检测系统,其特征在于,所述写操作的相关信息具体包括:写操作的相关标识和/或详情、以及发起该写操作的用户信息。
18.根据权利要求13所述的检测系统,其特征在于,该检测系统进一步包括:
标记添加模块,用于在所述获取到目标页面后查找该目标页面中与当前被点击推荐位内容相同的推荐位内容的链接,在该推荐位内容的链接中添加否定标记;
点击日志模块,用于在检测到推荐位内容被点击后,判断该被点击推荐位内容的链接中是否有所述否定标记,在没有所述否定标记的情况下,输出点击日志。
19.根据权利要求18所述的检测系统,其特征在于,所述输出的点击日志包括:所述点击操作相关信息和所述被点击推荐位内容的统计标识;或者包括所述点击操作相关信息和被点击推荐位内容的推荐位名称和推荐位内容详情信息。
20.根据权利要求19所述的检测系统,其特征在于,所述当前点击操作的相关信息,包括:发起当前点击操作的用户信息。
21.根据权利要求13、14、15、16、18、19、或20所述的检测系统,其特征在于,所述预设的结束点为:与当前被点击推荐位内容不同的推荐位内容链接和导航链接。
22.根据权利要求13、14、15、16、18、19、或20所述的检测系统,其特征在于,进一步包括:
日志汇总模块,用于将所述输出的日志定期传输到统一的日志服务器上;
统计模块,用于根据所述日志服务器上的日志中记录的信息,统计写操作与推荐位内容之间的对应关系。
CN201310256164.6A 2013-06-25 2013-06-25 网页推荐位内容访问轨迹写操作的检测方法和系统 Active CN104252453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310256164.6A CN104252453B (zh) 2013-06-25 2013-06-25 网页推荐位内容访问轨迹写操作的检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310256164.6A CN104252453B (zh) 2013-06-25 2013-06-25 网页推荐位内容访问轨迹写操作的检测方法和系统

Publications (2)

Publication Number Publication Date
CN104252453A true CN104252453A (zh) 2014-12-31
CN104252453B CN104252453B (zh) 2018-09-28

Family

ID=52187361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310256164.6A Active CN104252453B (zh) 2013-06-25 2013-06-25 网页推荐位内容访问轨迹写操作的检测方法和系统

Country Status (1)

Country Link
CN (1) CN104252453B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038194A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 一种页面跳转方法和装置
CN107104927A (zh) * 2016-02-23 2017-08-29 阿里巴巴集团控股有限公司 访问路径采集方法及装置
CN112491602A (zh) * 2020-11-17 2021-03-12 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101193008A (zh) * 2007-03-29 2008-06-04 腾讯科技(深圳)有限公司 一种回放用户的网页访问轨迹的方法及系统
CN101557310A (zh) * 2009-05-20 2009-10-14 北京中企开源信息技术有限公司 一种跟踪用户访问信息的系统及方法
CN101662493A (zh) * 2008-08-25 2010-03-03 阿里巴巴集团控股有限公司 一种用户访问路径的数据采集方法、系统及服务器
CN102122291A (zh) * 2011-01-18 2011-07-13 浙江大学 一种基于树形日志模式分析的博客好友推荐方法
CN102194182A (zh) * 2010-03-12 2011-09-21 上海拓扑网络科技有限公司 电子杂志动态信息交互系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101193008A (zh) * 2007-03-29 2008-06-04 腾讯科技(深圳)有限公司 一种回放用户的网页访问轨迹的方法及系统
CN101662493A (zh) * 2008-08-25 2010-03-03 阿里巴巴集团控股有限公司 一种用户访问路径的数据采集方法、系统及服务器
CN101557310A (zh) * 2009-05-20 2009-10-14 北京中企开源信息技术有限公司 一种跟踪用户访问信息的系统及方法
CN102194182A (zh) * 2010-03-12 2011-09-21 上海拓扑网络科技有限公司 电子杂志动态信息交互系统
CN102122291A (zh) * 2011-01-18 2011-07-13 浙江大学 一种基于树形日志模式分析的博客好友推荐方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107104927A (zh) * 2016-02-23 2017-08-29 阿里巴巴集团控股有限公司 访问路径采集方法及装置
CN107038194A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 一种页面跳转方法和装置
CN107038194B (zh) * 2016-11-17 2020-12-15 创新先进技术有限公司 一种页面跳转方法和装置
CN112491602A (zh) * 2020-11-17 2021-03-12 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质
CN112491602B (zh) * 2020-11-17 2023-09-26 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质

Also Published As

Publication number Publication date
CN104252453B (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
US11687208B2 (en) Evaluation of interactions with a user interface
US20200192955A1 (en) Internet Search Results Annotation for Search Term Elements Present or Absent in Referenced Webpages and Descendant Webpages
CN102317936B (zh) 识别评论以连同文档一起示出
US8429243B1 (en) Web analytics event tracking system
US20120054440A1 (en) Systems and methods for providing a hierarchy of cache layers of different types for intext advertising
US20170147659A1 (en) Systems and Methods for Accessing Applications in Grouped Search Results
US8880996B1 (en) System for reconfiguring a web site or web page based on real-time analytics data
US9418117B1 (en) Displaying relevant messages of a conversation graph
US20120259854A1 (en) Conversion Path Based Segmentation
US8775941B1 (en) System for monitoring and reporting deviations of real-time analytics data from expected analytics data
KR20150130282A (ko) 실시간 비딩용 지능형 플랫폼
CN104850546B (zh) 移动媒介信息的展示方法和系统
CN102542039A (zh) 远程执行的应用的发现
US20130097152A1 (en) Topical activity monitor system and method
US20150206177A1 (en) Using content selection urls
CN104717185A (zh) 短统一资源定位符的展示响应方法、装置、服务器和系统
CN104636394A (zh) 用户生成内容信息的展示方法、系统和装置
US8782166B1 (en) System for generating a site pathing report based on real-time analytics data
CN103959324A (zh) 设备上的组合活动历史
CN103412958A (zh) 一种搜索结果显示方法和装置
US8074234B2 (en) Web service platform for keyword technologies
CN113905045A (zh) 用于提供第三方内容的系统、方法和介质
US20160373513A1 (en) Systems and methods for integrating xml syndication feeds into online advertisement
CN100555283C (zh) 一种直接针对用户的相关信息的发布方法和系统
CN104252453A (zh) 网页推荐位内容访问轨迹写操作的检测方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant