CN104394428A - 数据处理方法及装置 - Google Patents

数据处理方法及装置 Download PDF

Info

Publication number
CN104394428A
CN104394428A CN201410713684.XA CN201410713684A CN104394428A CN 104394428 A CN104394428 A CN 104394428A CN 201410713684 A CN201410713684 A CN 201410713684A CN 104394428 A CN104394428 A CN 104394428A
Authority
CN
China
Prior art keywords
webpage
video
video playback
uniform resource
resource locator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410713684.XA
Other languages
English (en)
Other versions
CN104394428B (zh
Inventor
王晓涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410713684.XA priority Critical patent/CN104394428B/zh
Publication of CN104394428A publication Critical patent/CN104394428A/zh
Application granted granted Critical
Publication of CN104394428B publication Critical patent/CN104394428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2542Management at additional data server, e.g. shopping server, rights management server for selling goods, e.g. TV shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4782Web browsing, e.g. WebTV
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种数据处理方法及装置,该数据处理方法包括:获取访问第一网页的来源统一资源定位符,其中,第一网页为用于执行预定操作的网页;根据来源统一资源定位符判断第二网页是否为视频播放网页;在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件;以及如果判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,则得到第一预设结果,如果判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,则得到第二预设结果。通过本发明,解决了相关技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题。

Description

数据处理方法及装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种数据处理方法及装置。
背景技术
在视频中,通常插入有多媒体文件,例如,广告。在观看视频时,视频开头通常会有一段广告,普通用户无法跳过该广告,而对于付费的会员用户,可以直接跳过该广告,因此,一些用户会为了跳过广告而去购买会员。通过统计用户为了跳过广告而去购买会员的比例可以指导视频提供者对视频中播放的广告进行优化进而提高会员购买率。现有方案通过在购买会员页面嵌入代码,获取页面来源统一资源定位符是否是视频播放页面,如果是视频播放页面,就认为该用户购买会员是因为不想观看广告而购买会员。由于用户购买会员可能是因为想看高清视频,也可能是因为点击了视频播放页面上的非视频播放区域的购买会员链接进入了购买页面,上述操作使得购买会员页面的来源统一资源定位符都是视频播放页面,从而使得统计到的数据不准确。
针对相关技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种数据处理方法及装置,以解决相关技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种数据处理方法。
根据本发明的数据处理方法包括:获取访问第一网页的来源统一资源定位符,其中,第一网页为用于执行预定操作的网页,来源统一资源定位符为跳转至第一网页的第二网页的地址;根据来源统一资源定位符判断第二网页是否为视频播放网页,其中,视频播放网页是指网页用于播放视频;在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件;以及如果判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,则得到第一预设结果,如果判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,则得到第二预设结果。
进一步地,获取访问第一网页的来源统一资源定位符包括:获取第一网页的访问记录;以及从访问记录中获取第一网页的来源统一资源定位符。
进一步地,根据来源统一资源定位符判断第二网页是否为视频播放网页包括:获取目标网站的视频播放网页的统一资源定位符集合,其中,目标网站为第一网页所属的网站;将目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与来源统一资源定位符比较;如果在目标网站的视频播放网页的统一资源定位符集合中存在与来源统一资源定位符相同的统一资源定位符,则确定第二网页是视频播放网页;以及如果在目标网站的视频播放网页的统一资源定位符集合中不存在与来源统一资源定位符相同的统一资源定位符,则确定第二网页不是视频播放网页。
进一步地,在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件包括:获取第一网页的访问时间;获取第二网页中视频播放区域的第一网页的链接的触发时间,其中,视频播放区域为第二网页中用于视频播放的区域;计算第一网页的访问时间与第二网页中视频播放区域的第一网页的链接的触发时间的时间差;判断时间差是否小于预设值;如果判断出时间差小于预设值,则确定从第二网页跳转至第一网页时第二网页是在播放视频中插入的多媒体文件;以及如果判断出时间差不小于预设值,则确定从第二网页跳转至第一网页时第二网页不是在播放视频中插入的多媒体文件。
进一步地,获取第二网页中视频播放区域的第一网页的链接的触发时间包括:获取访问第一网页的用户标识符;根据用户标识符获取用户播放第二网页的视频的播放记录;判断播放记录中是否包含第二网页中视频播放区域的第一网页的链接的触发时间;以及在判断出播放记录中包含第二网页中视频播放区域的第一网页的链接的触发时间时,则获取播放记录中包含的第二网页中视频播放区域的第一网页的链接的触发时间。
为了实现上述目的,根据本发明的另一方面,提供了一种数据处理装置。
根据本发明的数据处理装置包括:获取单元,用于获取访问第一网页的来源统一资源定位符,其中,第一网页为用于执行预定操作的网页,来源统一资源定位符为跳转至第一网页的第二网页的地址;第一判断单元,用于根据来源统一资源定位符判断第二网页是否为视频播放网页,其中,视频播放网页是指网页用于播放视频;第二判断单元,用于在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件;以及确定单元,用于在判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,确定得到第一预设结果,在判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,确定得到第二预设结果。
进一步地,其特征在于,获取单元包括:第一获取模块,用于获取第一网页的访问记录;以及第二获取模块,用于从访问记录中获取第一网页的来源统一资源定位符。
进一步地,第一判断单元包括:第三获取模块,用于获取目标网站的视频播放网页的统一资源定位符集合,其中,目标网站为第一网页所属的网站;比较模块,用于将目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与来源统一资源定位符比较;以及第一确定模块,用于在目标网站的视频播放网页的统一资源定位符集合中存在与来源统一资源定位符相同的统一资源定位符时,确定第二网页是视频播放网页,在目标网站的视频播放网页的统一资源定位符集合中不存在与来源统一资源定位符相同的统一资源定位符时,确定第二网页不是视频播放网页。
进一步地,第二判断单元包括:第四获取模块,用于获取第一网页的访问时间;第五获取模块,用于获取第二网页中视频播放区域的第一网页的链接的触发时间,其中,视频播放区域为第二网页中用于视频播放的区域;计算模块,用于计算第一网页的访问时间与第二网页中视频播放区域的第一网页的链接的触发时间的时间差;判断模块,用于判断时间差是否小于预设值;以及第二确定模块,用于在判断出时间差小于预设值时,确定从第二网页跳转至第一网页时第二网页是在播放视频中插入的多媒体文件,在判断出时间差不小于预设值时,确定从第二网页跳转至第一网页时第二网页不是在播放视频中插入的多媒体文件。
进一步地,第五获取模块包括:第一获取子模块,用于获取访问第一网页的用户标识符;第二获取子模块,用于根据用户标识符获取用户播放第二网页的视频的播放记录;判断子模块,用于判断播放记录中是否包含第二网页中视频播放区域的第一网页的链接的触发时间;以及第三获取子模块,用于在判断出播放记录中包含第二网页中视频播放区域的第一网页的链接的触发时间时,则获取播放记录中包含的第二网页中视频播放区域的第一网页的链接的触发时间。
通过本发明,采用在确定是从视频播放网页跳转至用于会员购买的第一网页后,继续判断是否在视频播放网页播放多媒体文件的期间跳转至第一网页,只有在视频播放网页播放多媒体视频时跳转至第一网页才说明用户是为了跳过视频中插入的对媒体文件才购买会员,解决了相关技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题,进而达到了提高检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据处理方法的流程图;以及
图2是根据本发明实施例的数据处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种数据处理方法,图1是根据本发明实施例的数据处理方法的流程图。
如图1所示,该方法包括如下的步骤S102至步骤S108:
步骤S102:获取访问第一网页的来源统一资源定位符,其中,第一网页为用于执行预定操作的网页,来源统一资源定位符为跳转至第一网页的第二网页的地址。
第一网页为用于执行预定操作的网页,预定操作可以是用户购买会员的相关操作,则第一网页为用于执行会员购买操作的网页。具体地,在本发明实施例中,以第一网页为用于执行视频网站的会员购买的网页为例进行说明,用户通过会员购买可以获得在该视频网站的相应权限,例如,用户在该视频网站播放视频时可以直接跳过广告播放,或是用户可以播放该视频网站中的高清视频,或是用户可以缓存该视频网站的任意视频等。统一资源定位符(Uniform Resource Locator,简称为URL)即网页的地址,第一网页的来源统一资源定位符为跳转至第一网页的网页的地址,例如,用户通过点击第二网页上第一网页的链接访问第一网页,则第一网页的来源统一资源定位符即为第二网页的地址,即第二网页的统一资源定位符。优选地,获取访问第一网页的来源统一资源定位符包括:获取第一网页的访问记录;以及从访问记录中获取第一网页的来源统一资源定位符。
第一网页的访问记录可以通过嵌入在第一网页的代码获取,第一网页的访问记录中包含访问第一网页的用户标识符、访问第一网页的时间、第一网页的来源统一资源定位符、用户在第一网页执行的操作,例如,执行会员购买的操作,等等。具体地,可以获取指定时间内第一网页的全部访问记录,从第一网页全部访问记录中获取包含会员购买操作记录的访问记录,例如,在1天时间内,有100个用户访问了第一网页,其中,有40个用户在第一网页购买了会员,因此,存在100条第一网页的访问记录,其中,有40条第一网页的访问记录中包含会员购买操作记录。在本发明实施例中,可以获取第一网页的访问记录中成功购买了会员的访问记录,并从获取得到的第一网页的访问记录中获取第一网页的来源统一资源定位符,例如,可以通过正则匹配从第一网页的访问记录中获取第一网页的来源统一资源定位符,其中,正则匹配为通过正则表达式设定预设规则来从字符串中匹配出符合该预设规则的字符。
步骤S104:根据来源统一资源定位符判断第二网页是否为视频播放网页,其中,视频播放网页是指网页用于播放视频。
通常,在视频网站中的网页中包含两种类型的网页,一种类型的网页用于播放视频,即视频播放网页,另一种类型的网页用于展示视频网站中的内容,例如,视频网站中用于展示视频列表的网页等。在不同类型的网页中通常都包含第一网页的链接,即会员购买网页的链接。本发明实施例通过第一网页的来源统一资源定位符判断第二网页是否为视频播放网页,优选地,根据来源统一资源定位符判断第二网页是否为视频播放网页包括:获取目标网站的视频播放网页的统一资源定位符集合,其中,目标网站为第一网页所属的网站;将目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与来源统一资源定位符比较;如果在目标网站的视频播放网页的统一资源定位符集合中存在与来源统一资源定位符相同的统一资源定位符,则确定第二网页是视频播放网页;以及如果在目标网站的视频播放网页的统一资源定位符集合中不存在与来源统一资源定位符相同的统一资源定位符,则确定第二网页不是视频播放网页。
目标网站为第一网页所属的网站,例如,第一网页为用于购买爱奇艺网站的会员的网页时,目标网站即为爱奇艺网站。通常,同一视频网站的视频播放网页的地址相似,具体地,可以根据视频播放网页的地址的特点预先获取目标网站的所有视频播放网页的地址即统一资源定位符,并存储在同一区域,组成目标网站的视频播放网页的统一资源定位符集合。通过将目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符分别与第一网页的来源统一资源定位符比较,如果在目标网站的视频播放网页的统一资源定位符集合中存在第一网页的来源统一资源定位符,由于第一网页的来源统一资源定位符为第二网页的地址,则说明第二网页时视频播放网页。上述方法直接通过将第一网页的来源统一资源定位符与目标网站的所有视频播放网页的统一资源定位符分别进行匹配,实现过程简单方便,而且准确性高。
步骤S106:在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件。
在通过上述步骤S104判断出第二网页为视频播放网页时,进一步判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件。视频中插入的多媒体文件可以是视频中插入的广告,具体地,本发明实施例以视频中插入的广告为例进行说明。对于非会员用户,视频播放网页在播放视频的内容之前会先播放广告,在播放广告同时会在视频播放区域显示第一网页的链接,例如,在爱奇艺的视频播放网页播放广告时,会在视频播放区域的右上角显示跳过广告标识,该跳过广告标识关联着第一网页的地址,通过点击该跳过广告标识可以直接跳转至第一网页。但是,在该视频网页的非视频播放区域也会存在购买会员的网页链接,即第一网页的链接。具体地,在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件包括:获取第一网页的访问时间;获取第二网页中视频播放区域的第一网页的链接的触发时间,其中,视频播放区域为第二网页中用于视频播放的区域;计算第一网页的访问时间与第二网页中视频播放区域的第一网页的链接的触发时间的时间差;判断时间差是否小于预设值;如果判断出时间差小于预设值,则确定从第二网页跳转至第一网页时第二网页是在播放视频中插入的多媒体文件;以及如果判断出时间差不小于预设值,则确定从第二网页跳转至第一网页时第二网页不是在播放视频中插入的多媒体文件。
第一网页的访问时间即为用户从第二网页跳转至第一网页的时间,具体地,可以通过在第一网页中嵌入代码记录第一网页的用户操作,例如,用户访问第一网页的时间,用户在第一网页购买会员的操作等。第二网页中视频播放区域的第一网页的链接的触发时间即用户点击第二网页中视频播放区域的第一网页的链接的时间,具体地,可以通过在视频播放器中嵌入代码获得视频的播放记录,例如视频中插入的多媒体文件开始播放的时间、位于视频播放区域的第一网页的链接的触发时间、播放该视频的用户的标识符等。由于用户点击第二网页中视频播放区域的第一网页的链接后需要花费一些时间进行第一网页的加载,因此,需要计算第一网页的访问时间与第二网页中视频播放区域的第一网页的链接的触发时间的时间差,将该时间差与预设值进行比较,只有在上述时间差小于预设值时,说明是通过点击视频播放区域的第一网页的连接跳转至第一网页的,进一步说明第二网页是在播放视频中插入的多媒体文件时跳转至第一网页,否则,用户是通过第二网页中非视频播放区域设置的第一网页的链接跳转至第一网页的。
优选地,获取第二网页中视频播放区域的第一网页的链接的触发时间包括:获取访问第一网页的用户标识符;根据用户标识符获取用户播放第二网页的视频的播放记录;判断播放记录中是否包含第二网页中视频播放区域的第一网页的链接的触发时间;以及在判断出播放记录中包含第二网页中视频播放区域的第一网页的链接的触发时间时,则获取播放记录中包含的第二网页中视频播放区域的第一网页的链接的触发时间。
由于从第二网页跳转至第一网页时用户标识符相同,因此,在得到访问第一网页的用户标识符后,可以根据该用户标识符去获取该用户播放第二网页的视频的播放记录。如果该用户在播放视频中的多媒体文件时触发了视频播放区域的第一网页的链接,则相应的会在该视频播放记录中记载该第一网页的链接触发的时间,如果该用户在播放视频中的多媒体文件时没有触发视频播放区域的第一网页的链接,则在该视频播放记录中不存在该第一网页的链接触发的时间。通过依次检测该用户播放第二网页的视频的播放记录中是否包含第一网页的链接的触发时间,如果在该用户播放第二网页的视频的播放记录中包含第一网页的链接的触发时间,则获取该播放记录中包含的第一网页的链接的触发时间,并进一步计算该第一网页的链接的触发时间与第一网页的访问时间的时间差与预设值比较;如果在该用户播放第二网页的视频的播放记录中不包含第一网页的链接的触发时间,直接可以说明不是通过视频播放区域的第一网页的链接跳转至第一网页的,而是通过在视频播放网页的非视频播放区域的第一网页的链接跳转至第一网页的。本发明实施例预先通过用户标识符从播放第二网页的视频的所有播放记录中筛选出该用户标识符对应的用户播放第二网页的视频的播放记录,再进行后续的判断操作,效率较高。
步骤S108:如果判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,则得到第一预设结果,如果判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,则得到第二预设结果。
第一预设结果用于表示用户是为了跳过广告而购买视频网站的会员,第二预设结果用于表示用户不是为了跳过广告而购买视频网站的会员,而是为了获得从视频网站上观看高清视频、高速缓存视频等权限。具体地,以视频中插入的多媒体文件为广告为例进行说明,如果用户在播放视频中插入的广告的期间跳转至第一网页,即用于购买视频网站会员的网页,并购买视频网站的会员,则说明用户是为了跳过广告而购买视频网站的会员,如果不是在视频中插入的广告的播放期间跳转至第一网页购买视频网站的会员,很有可能是由于观看的视频不够高清、或是缓存较慢导致观看视频不流畅等原因而购买视频网站的会员。
进一步地,可以统计视频网站中因为广告而购买会员的数量和该视频网站所有购买会员的数量统计出用户因为广告而购买会员的比率,用于指导该视频网站的管理者对视频中播放的广告进行优化从而提高会员购买率。由于视频播放器中的代码可以同时获取广告的相关信息,例如,广告的名称、类型等,因此,在判断出用户是为了跳过广告而购买会员,可以同时获取该用户播放的广告的信息,从而统计分析出播放哪些类型的广告更能促进用户购买会员。
从以上的描述中,可以看出,本发明实现了如下技术效果:
本发明实施例通过获取访问第一网页的来源统一资源定位符,根据来源统一资源定位符判断第二网页是否为视频播放网页,在判断出第二网页为视频播放网页时,再继续判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件,如果判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,则得到第一预设结果,即说明用户是为了跳过广告而购买会员,如果判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,则得到第二预设结果,即用户不是为了跳过广告而购买会员。本发明实施例在确定是从视频播放网页跳转至用于会员购买的第一网页后,继续判断是否在视频播放网页播放多媒体文件的期间跳转至第一网页,只有在视频播放网页播放多媒体视频时跳转至第一网页才说明用户是为了跳过视频中插入的对媒体文件才购买会员,相比于现有技术中仅通过判断出是从视频播放网页跳转至用于会员购买的第一网页就确定用户是为了跳过广告而购买会员,准确性更高,解决了现有技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例的另一方面,提供了一种数据处理装置,该数据处理装置可以用于执行本发明实施例的数据处理方法,本发明实施例的数据处理方法也可以通过本发明实施例的数据处理装置来执行。
图2是根据本发明实施例的数据处理装置的示意图,如图2所示,该数据处理装置包括:获取单元10,第一判断单元20,第二判断单元30和确定单元40。
获取单元10,用于获取访问第一网页的来源统一资源定位符,其中,第一网页为用于执行预定操作的网页,来源统一资源定位符为跳转至第一网页的第二网页的地址。
第一网页为用于执行预定操作的网页,预定操作可以是用户购买会员的相关操作,则第一网页为用于执行会员购买操作的网页。具体地,在本发明实施例中,以第一网页为用于执行视频网站的会员购买的网页为例进行说明,用户通过会员购买可以获得在该视频网站的相应权限。
第一判断单元20,用于根据来源统一资源定位符判断第二网页是否为视频播放网页,其中,视频播放网页是指网页用于播放视频。
通常,在视频网站中的网页中包含两种类型的网页,一种类型的网页用于播放视频,即视频播放网页,另一种类型的网页用于展示视频网站中的内容,例如,视频网站中用于展示视频列表的网页等。
第二判断单元30,用于在判断出第二网页为视频播放网页时,判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件。
在判断出第二网页为视频播放网页时,进一步判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件。视频中插入的多媒体文件可以是视频中插入的广告,具体地,本发明实施例以视频中插入的广告为例进行说明。对于非会员用户,视频播放网页在播放视频的内容之前会先播放广告,在播放广告同时会在视频播放区域显示第一网页的链接,例如,在爱奇艺的视频播放网页播放广告时,会在视频播放区域的右上角显示跳过广告标识,该跳过广告标识关联着第一网页的地址,通过点击该跳过广告标识可以直接跳转至第一网页。但是,在该视频网页的非视频播放区域也会存在购买会员的网页链接,即第一网页的链接。
确定单元40,用于在判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,确定得到第一预设结果,在判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,确定得到第二预设结果。
第一预设结果用于表示用户是为了跳过广告而购买视频网站的会员,第二预设结果用于表示用户不是为了跳过广告而购买视频网站的会员,而是为了获得从视频网站上观看高清视频、高速缓存视频等权限。
本发明实施例通过获取单元10获取访问第一网页的来源统一资源定位符,第一判断单元20根据来源统一资源定位符判断第二网页是否为视频播放网页,在判断出第二网页为视频播放网页时,第二判断单元30判断从第二网页跳转至第一网页时第二网页是否在播放视频中插入的多媒体文件,确定单元40在判断出从第二网页跳转至第一网页时第二网页在播放视频中插入的多媒体文件时,确定得到第一预设结果,即说明用户是为了跳过广告而购买会员,在判断出从第二网页跳转至第一网页时第二网页不在播放视频中插入的多媒体文件,得到第二预设结果,即用户不是为了跳过广告而购买会员。本发明实施例在确定是从视频播放网页跳转至用于会员购买的第一网页后,继续判断是否在视频播放网页播放多媒体文件的期间跳转至第一网页,只有在视频播放网页播放多媒体视频时跳转至第一网页才说明用户是为了跳过视频中插入的对媒体文件才购买会员,相比于现有技术中仅通过判断出是从视频播放网页跳转至用于会员购买的第一网页就确定用户是为了跳过广告而购买会员,准确性更高,解决了现有技术中检测用户为了跳过视频中插入的多媒体文件而购买会员的结果准确性低的问题。
优选地,获取单元10包括:第一获取模块,用于获取第一网页的访问记录;以及第二获取模块,用于从访问记录中获取第一网页的来源统一资源定位符。
可选地,第一判断单元20包括:第三获取模块,用于获取目标网站的视频播放网页的统一资源定位符集合,其中,目标网站为第一网页所属的网站;比较模块,用于将目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与来源统一资源定位符比较;以及第一确定模块,用于在目标网站的视频播放网页的统一资源定位符集合中存在与来源统一资源定位符相同的统一资源定位符时,确定第二网页是视频播放网页,在目标网站的视频播放网页的统一资源定位符集合中不存在与来源统一资源定位符相同的统一资源定位符时,确定第二网页不是视频播放网页。
可选地,第二判断单元30包括:第四获取模块,用于获取第一网页的访问时间;第五获取模块,用于获取第二网页中视频播放区域的第一网页的链接的触发时间,其中,视频播放区域为第二网页中用于视频播放的区域;计算模块,用于计算第一网页的访问时间与第二网页中视频播放区域的第一网页的链接的触发时间的时间差;判断模块,用于判断时间差是否小于预设值;以及第二确定模块,用于在判断出时间差小于预设值时,确定从第二网页跳转至第一网页时第二网页是在播放视频中插入的多媒体文件,在判断出时间差不小于预设值时,确定从第二网页跳转至第一网页时第二网页不是在播放视频中插入的多媒体文件。
优选地,第五获取模块包括:第一获取子模块,用于获取访问第一网页的用户标识符;第二获取子模块,用于根据用户标识符获取用户播放第二网页的视频的播放记录;判断子模块,用于判断播放记录中是否包含第二网页中视频播放区域的第一网页的链接的触发时间;以及第三获取子模块,用于在判断出播放记录中包含第二网页中视频播放区域的第一网页的链接的触发时间时,则获取播放记录中包含的第二网页中视频播放区域的第一网页的链接的触发时间。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取访问第一网页的来源统一资源定位符,其中,所述第一网页为用于执行预定操作的网页,所述来源统一资源定位符为跳转至所述第一网页的第二网页的地址;
根据所述来源统一资源定位符判断所述第二网页是否为视频播放网页,其中,所述视频播放网页是指所述网页用于播放视频;
在判断出所述第二网页为视频播放网页时,判断从所述第二网页跳转至所述第一网页时所述第二网页是否在播放视频中插入的多媒体文件;以及
如果判断出从所述第二网页跳转至所述第一网页时所述第二网页在播放所述视频中插入的多媒体文件时,则得到第一预设结果,如果判断出从所述第二网页跳转至所述第一网页时所述第二网页不在播放所述视频中插入的多媒体文件,则得到第二预设结果。
2.根据权利要求1所述的数据处理方法,其特征在于,获取访问第一网页的来源统一资源定位符包括:
获取所述第一网页的访问记录;以及
从所述访问记录中获取所述第一网页的来源统一资源定位符。
3.根据权利要求1所述的数据处理方法,其特征在于,根据所述来源统一资源定位符判断所述第二网页是否为视频播放网页包括:
获取目标网站的视频播放网页的统一资源定位符集合,其中,所述目标网站为所述第一网页所属的网站;
将所述目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与所述来源统一资源定位符比较;
如果在所述目标网站的视频播放网页的统一资源定位符集合中存在与所述来源统一资源定位符相同的统一资源定位符,则确定所述第二网页是视频播放网页;以及
如果在所述目标网站的视频播放网页的统一资源定位符集合中不存在与所述来源统一资源定位符相同的统一资源定位符,则确定所述第二网页不是视频播放网页。
4.根据权利要求1所述的数据处理方法,其特征在于,在判断出所述第二网页为视频播放网页时,判断从所述第二网页跳转至所述第一网页时所述第二网页是否在播放视频中插入的多媒体文件包括:
获取所述第一网页的访问时间;
获取所述第二网页中视频播放区域的所述第一网页的链接的触发时间,其中,所述视频播放区域为所述第二网页中用于视频播放的区域;
计算所述第一网页的访问时间与所述第二网页中视频播放区域的所述第一网页的链接的触发时间的时间差;
判断所述时间差是否小于预设值;
如果判断出所述时间差小于所述预设值,则确定从所述第二网页跳转至所述第一网页时所述第二网页是在播放所述视频中插入的多媒体文件;以及
如果判断出所述时间差不小于所述预设值,则确定从所述第二网页跳转至所述第一网页时所述第二网页不是在播放所述视频中插入的多媒体文件。
5.根据权利要求4所述的数据处理方法,其特征在于,获取所述第二网页中视频播放区域的所述第一网页的链接的触发时间包括:
获取访问所述第一网页的用户标识符;
根据所述用户标识符获取所述用户播放所述第二网页的视频的播放记录;
判断所述播放记录中是否包含所述第二网页中视频播放区域的所述第一网页的链接的触发时间;以及
在判断出所述播放记录中包含所述第二网页中视频播放区域的所述第一网页的链接的触发时间时,则获取所述播放记录中包含的所述第二网页中视频播放区域的所述第一网页的链接的触发时间。
6.一种数据处理装置,其特征在于,包括:
获取单元,用于获取访问第一网页的来源统一资源定位符,其中,所述第一网页为用于执行预定操作的网页,所述来源统一资源定位符为跳转至所述第一网页的第二网页的地址;
第一判断单元,用于根据所述来源统一资源定位符判断所述第二网页是否为视频播放网页,其中,所述视频播放网页是指所述网页用于播放视频;
第二判断单元,用于在判断出所述第二网页为视频播放网页时,判断从所述第二网页跳转至所述第一网页时所述第二网页是否在播放视频中插入的多媒体文件;以及
确定单元,用于在判断出从所述第二网页跳转至所述第一网页时所述第二网页在播放所述视频中插入的多媒体文件时,确定得到第一预设结果,在判断出从所述第二网页跳转至所述第一网页时所述第二网页不在播放所述视频中插入的多媒体文件,确定得到第二预设结果。
7.根据权利要求6所述的数据处理装置,其特征在于,所述获取单元包括:
第一获取模块,用于获取所述第一网页的访问记录;以及
第二获取模块,用于从所述访问记录中获取所述第一网页的来源统一资源定位符。
8.根据权利要求6所述的数据处理装置,其特征在于,所述第一判断单元包括:
第三获取模块,用于获取目标网站的视频播放网页的统一资源定位符集合,其中,所述目标网站为所述第一网页所属的网站;
比较模块,用于将所述目标网站的视频播放网页的统一资源定位符集合中的每一条统一资源定位符与所述来源统一资源定位符比较;以及
第一确定模块,用于在所述目标网站的视频播放网页的统一资源定位符集合中存在与所述来源统一资源定位符相同的统一资源定位符时,确定所述第二网页是视频播放网页,在所述目标网站的视频播放网页的统一资源定位符集合中不存在与所述来源统一资源定位符相同的统一资源定位符时,确定所述第二网页不是视频播放网页。
9.根据权利要求6所述的数据处理装置,其特征在于,所述第二判断单元包括:
第四获取模块,用于获取所述第一网页的访问时间;
第五获取模块,用于获取所述第二网页中视频播放区域的所述第一网页的链接的触发时间,其中,所述视频播放区域为所述第二网页中用于视频播放的区域;
计算模块,用于计算所述第一网页的访问时间与所述第二网页中视频播放区域的所述第一网页的链接的触发时间的时间差;
判断模块,用于判断所述时间差是否小于预设值;以及
第二确定模块,用于在判断出所述时间差小于所述预设值时,确定从所述第二网页跳转至所述第一网页时所述第二网页是在播放所述视频中插入的多媒体文件,在判断出所述时间差不小于所述预设值时,确定从所述第二网页跳转至所述第一网页时所述第二网页不是在播放所述视频中插入的多媒体文件。
10.根据权利要求9所述的数据处理装置,其特征在于,所述第五获取模块包括:
第一获取子模块,用于获取访问所述第一网页的用户标识符;
第二获取子模块,用于根据所述用户标识符获取所述用户播放所述第二网页的视频的播放记录;
判断子模块,用于判断所述播放记录中是否包含所述第二网页中视频播放区域的所述第一网页的链接的触发时间;以及
第三获取子模块,用于在判断出所述播放记录中包含所述第二网页中视频播放区域的所述第一网页的链接的触发时间时,则获取所述播放记录中包含的所述第二网页中视频播放区域的所述第一网页的链接的触发时间。
CN201410713684.XA 2014-11-28 2014-11-28 数据处理方法及装置 Active CN104394428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410713684.XA CN104394428B (zh) 2014-11-28 2014-11-28 数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410713684.XA CN104394428B (zh) 2014-11-28 2014-11-28 数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN104394428A true CN104394428A (zh) 2015-03-04
CN104394428B CN104394428B (zh) 2017-11-21

Family

ID=52612256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410713684.XA Active CN104394428B (zh) 2014-11-28 2014-11-28 数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN104394428B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229993A (zh) * 2016-12-15 2018-06-29 北京国双科技有限公司 一种数据处理的方法及装置
CN109993515A (zh) * 2018-01-02 2019-07-09 索尼公司 通过挖矿支付内容

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046463A (ja) * 2001-07-31 2003-02-14 I Broadcast:Kk 映像配信方法
CN101796836A (zh) * 2007-09-07 2010-08-04 雅虎公司 在视频中标书签
KR20110067222A (ko) * 2009-12-14 2011-06-22 (주)판도라티비 오픈맥스 인코더를 이용한 메타데이터 동영상 광고
CN103268207A (zh) * 2012-01-04 2013-08-28 国际商业机器公司 用于渲染在多个窗口上观看的视频的方法和系统
CN103731692A (zh) * 2012-10-16 2014-04-16 阿里巴巴集团控股有限公司 贴片数据的播放方法和系统
CN103975354A (zh) * 2011-09-23 2014-08-06 谷歌公司 用于视频广告的按观看收费

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046463A (ja) * 2001-07-31 2003-02-14 I Broadcast:Kk 映像配信方法
CN101796836A (zh) * 2007-09-07 2010-08-04 雅虎公司 在视频中标书签
KR20110067222A (ko) * 2009-12-14 2011-06-22 (주)판도라티비 오픈맥스 인코더를 이용한 메타데이터 동영상 광고
CN103975354A (zh) * 2011-09-23 2014-08-06 谷歌公司 用于视频广告的按观看收费
CN103268207A (zh) * 2012-01-04 2013-08-28 国际商业机器公司 用于渲染在多个窗口上观看的视频的方法和系统
CN103731692A (zh) * 2012-10-16 2014-04-16 阿里巴巴集团控股有限公司 贴片数据的播放方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229993A (zh) * 2016-12-15 2018-06-29 北京国双科技有限公司 一种数据处理的方法及装置
CN108229993B (zh) * 2016-12-15 2022-03-01 北京国双科技有限公司 一种数据处理的方法及装置
CN109993515A (zh) * 2018-01-02 2019-07-09 索尼公司 通过挖矿支付内容
CN109993515B (zh) * 2018-01-02 2023-08-08 索尼公司 用于支付内容的方法、装置和存储介质

Also Published As

Publication number Publication date
CN104394428B (zh) 2017-11-21

Similar Documents

Publication Publication Date Title
US20150058874A1 (en) Method and Device for Setting Properties
US10299011B2 (en) Method and system for user interaction with objects in a video linked to internet-accessible information about the objects
US8782693B2 (en) Interfaces to allow video ad serving into a mobile phone application video stream
US9374411B1 (en) Content recommendations using deep data
US9807466B2 (en) Managing interactive subtitle data
US11188603B2 (en) Annotation of videos using aggregated user session data
US7930391B1 (en) Method and system for determining viewing time of an online video
US20080189733A1 (en) Content rating systems and methods
KR20090018919A (ko) 미디어 콘텐츠를 분배하는 시스템 및/또는 방법
CN101849414A (zh) 内容收视装置及内容推荐方法
US20180249206A1 (en) Systems and methods for providing interactive video presentations
US20200296456A1 (en) Systems and methods for evaluating the engagement factor of videos
EP2533185A1 (en) Remotely configuring content
CN102216945A (zh) 通过媒体指纹进行联网
US20120330758A1 (en) Segmenting ad inventory by creators, recommenders and their social status
CN104462339A (zh) 多媒体文件的推送方法及装置
US20060212580A1 (en) Method and system of providing a personal audio/video broadcasting architecture
US10845948B1 (en) Systems and methods for selectively inserting additional content into a list of content
CN105100840A (zh) 一种用于插播推荐媒体信息的方法和装置
US20110161169A1 (en) Advertisement selection for a product or service to display to user
CN104394428A (zh) 数据处理方法及装置
US9479839B2 (en) Method and system for providing a representative phrase based on keyword searches
US10084841B2 (en) Systems and methods for managing media content playback
US20160294907A1 (en) Systems and methods for managing media content playback using social media data
US20060212534A1 (en) Method and system of providing a personal audio/video broadcasting architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Improved data with video transmitter

Effective date of registration: 20190531

Granted publication date: 20171121

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20171121