CN110007979A - 浏览器信息应用方法、装置、计算机设备及存储介质 - Google Patents

浏览器信息应用方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110007979A
CN110007979A CN201811526546.5A CN201811526546A CN110007979A CN 110007979 A CN110007979 A CN 110007979A CN 201811526546 A CN201811526546 A CN 201811526546A CN 110007979 A CN110007979 A CN 110007979A
Authority
CN
China
Prior art keywords
browser
host
information
address
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811526546.5A
Other languages
English (en)
Inventor
胡金星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN201811526546.5A priority Critical patent/CN110007979A/zh
Publication of CN110007979A publication Critical patent/CN110007979A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44521Dynamic linking or loading; Link editing at or after load time, e.g. Java class loading
    • G06F9/44526Plug-ins; Add-ons

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种浏览器信息应用方法、装置、计算机设备及存储介质,包括下述步骤:调用预设的目标程序;判断所述宿主浏览器的内容是否加载完毕;当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。通过跨域通信的方式又能够实时的收集用户通过浏览器所进行的所有行为信息,从而突破了互联网内容提供商服务器之间的壁垒,能够对用户的行为信息进行全面的收集和整理。

Description

浏览器信息应用方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及数据处理领域,尤其是一种浏览器信息应用方法、装置、计算机设备及存储介质。
背景技术
伴随着计算机技术的发展,对于用户来讲计算机仅仅是一种办公、通信或者娱乐的工具。但是对于计算机内容的提供商而言,用户在计算机上的任何操作均能够作为数据进行深度挖掘,并形成用户的行为画像,以便于根据用户行为更新产品或者推送商品。
现有技术中,对用户的行为进行分析,首先要获取用户的行为信息。相关技术中,对于用户行为信息的收集是离散的,例如,用户通过浏览器在不同的商务平台上进行浏览,不同的商务平台仅仅能够获取的用户在各自平台上的浏览信息,即只能通过用户在各个平台上的账户对用户行为进行归类。
本发明创造的发明人在研究中发现,对于用户行为的归纳局限于各个服务商自有的平台痕迹,用户行为数据的收集离散性较强,且处于商业保护的目的,各个行为信息数据之间具有壁垒。因此,无法全面的对用户行为信息进行收集,造成行为数据分析缺乏数据支撑,分析结果过于片面准确度不高的问题。
发明内容
本发明实施例提供一种能够对用户在浏览器上的所有行为进行收集,并以目标终端中具有不变性的IP地址作为文件名的浏览器信息应用方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种浏览器信息应用方法,包括:
调用预设的目标程序,其中,所述目标程序用于宿主浏览器与内联框架之间的跨域通信;
判断所述宿主浏览器的内容是否加载完毕;
当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,其中,所述第一消息中包括所述宿主浏览器所在目标终端的IP地址和用户的行为信息;
所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。
可选地,所述第一消息中包括所述宿主浏览器的属性信息,所述当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息之后,还包括:
获取预设的特征列表,其中,所述特征列表中包括用于表征各浏览器名称的多个特征字段;
依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段;
确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称。
可选地,依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段包括:
依次使用所述特征列表中的特征字段在所述属性信息中进行检索;
若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
可选地,所述属性信息中包括所述宿主浏览器的版本号,所述确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称之后,还包括:
根据所述宿主浏览器的名称在预设的策略数据库中进行检索,其中,所述策略数据库中包括描述各浏览器版本信息辨识方式的策略信息;
获取与所述宿主浏览器的名称具有映射关系的策略信息;
根据所述策略信息在所述属性信息中识别所述宿主浏览器的版本号。
可选地,所述属性信息中包括所述目标终端的Mac地址,所述确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称之后,还包括:
检测所述宿主浏览器中是否安装预设的目标插件;
当所述宿主浏览器中安装所述目标插件时,在所述属性信息中查找所述宿主浏览器的Mac地址。
为解决上述技术问题,本发明实施例还提供一种浏览器信息应用装置,包括:
调用模块,用于调用预设的目标程序,其中,所述目标程序用于宿主浏览器与内联框架之间的跨域通信;
判断模块,用于判断所述宿主浏览器的内容是否加载完毕;
处理模块,用于当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,其中,所述第一消息中包括所述宿主浏览器所在目标终端的IP地址和用户的行为信息;
执行模块,用于所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。
可选地,所述第一消息中包括所述宿主浏览器的属性信息,所述浏览器信息应用装置还包括:
第一获取子模块,用于获取预设的特征列表,其中,所述特征列表中包括用于表征各浏览器名称的多个特征字段;
第一处理子模块,用于依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段;
第一执行子模块,用于确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称。
可选地,所述浏览器信息应用装置还包括:
第一检索子模块,用于依次使用所述特征列表中的特征字段在所述属性信息中进行检索;
第一判断子模块,用于若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
可选地,所述属性信息中包括所述宿主浏览器的版本号,所述浏览器信息应用装置还包括:
第二检索子模块,用于根据所述宿主浏览器的名称在预设的策略数据库中进行检索,其中,所述策略数据库中包括描述各浏览器版本信息辨识方式的策略信息;
第二获取子模块,用于获取与所述宿主浏览器的名称具有映射关系的策略信息;
第二执行子模块,用于根据所述策略信息在所述属性信息中识别所述宿主浏览器的版本号。
可选地,所述属性信息中包括所述目标终端的Mac地址,所述浏览器信息应用装置还包括:
第一检测子模块,用于检测所述宿主浏览器中是否安装预设的目标插件;
第三执行子模块,用于当所述宿主浏览器中安装所述目标插件时,在所述属性信息中查找所述宿主浏览器的Mac地址。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述浏览器信息应用方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述浏览器信息应用方法的步骤。
本发明实施例的有益效果是:在浏览器中植入内联框架,内联框架用于对用户行为信息和目标终端的IP地址进行收集,内联框架与宿主浏览器之间通过跨域通信的方式进行信息交换。由于,目标终端的IP地址具有较强的稳定性,因此,用户通过目标终端所进行的行为都能够归类至目标终端的IP地址文件夹中,使用户行为收集具有大的目标来源。而通过跨域通信的方式又能够实时的收集用户通过浏览器所进行的所有行为信息,从而突破了互联网内容提供商服务器之间的壁垒,能够对用户的行为信息进行全面的收集和整理。能够为进一步的数据分析提供充足的数据支撑,使分析结果更加的准确。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例浏览器信息应用方法的基本流程示意图;
图2为本发明实施例宿主浏览器的名称获取流程示意图;
图3为本发明实施例通过检索结果确定目标特征字段的流程示意图;
图4为本发明实施例宿主浏览器的版本号获取流程示意图;
图5为本发明实施例获取目标终端Mac地址的流程示意图;
图6为本发明实施例浏览器信息应用装置的基本结构示意图;
图7为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体请参阅图1,图1为本实施例浏览器信息应用方法的基本流程示意图。
如图1所示,一种浏览器信息应用方法,包括:
S1100、调用预设的目标程序,其中,所述目标程序用于宿主浏览器与内联框架之间的跨域通信;
本实施方式中目标程序为采用window.postMessage()方法可以安全地实现跨源通信。通常,对于两个不同页面的脚本,只有当执行它们的页面位于具有相同的协议(通常为https),端口号(443为https的默认值),以及主机(两个页面的模数Document.domain设置为相同的值)时,这两个脚本才能相互通信。window.postMessage()方法提供了一种受控机制来规避此限制,只要正确的使用,这种方法就很安全。
本实施方式中,内联框架为IFRAME。IFRAME是HTML标签,作用是文档中的文档,或者浮动的框架(FRAME)。iframe元素会创建包含另外一个文档的内联框架(即行内框架)。<iframe>标签规定一个内联框架。一个内联框架被用来在当前HTML文档中嵌入另一个文档。
内联框架的作用在于设置在宿主浏览器中,收集宿主浏览器中终端的IP地址和用户行为信息,并将IP地址和用户的行为信息发送至对应的服务器中。由于宿主浏览器在进行信息交互时,需要使用到IP地址(互联网协议地址),且每个终端的IP地址理论上仅有一个,但不排除通过虚拟IP地址的方式,使一个终端具有多个IP地址。因此,宿主浏览器被开启后,向服务器请求加载数据时,就能够得到该终端的IP地址。而用户的行为信息则能够通过记录用户浏览网站的网页地址进行收集。
window.postMessage()方法被调用时,会在所有宿主浏览器的页面脚本执行完毕之后,向目标窗口派发一个MessageEvent消息。该消息中包括用户的IP地址信息和用户行为信息。
S1200、判断所述宿主浏览器的内容是否加载完毕;
在调用了目标程序之后,为不影响宿主浏览器执行用户的正常指令,需要检测宿主浏览器的内容是否加载完毕。加载完毕的衡量方法在于:检测目标终端的数据传输模块(网卡)是否还具有浏览器的下载数据。若是,则表明宿主浏览器的内容还未加载完毕;若否,则表明宿主浏览器的内容加载完毕。
S1300、当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,其中,所述第一消息中包括所述宿主浏览器所在目标终端的IP地址和用户的行为信息;
当宿主浏览器的内容加载完毕时。调用目标程序,即调用window.postMessage()方法。window.postMessage()方法被调用时,会在所有宿主浏览器的页面脚本执行完毕之后,向目标窗口派发一个预设的第一消息。其中,第一消息为MessageEvent消息。该消息中包括用户的IP地址信息和用户行为信息。
S1400、所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。
内联框架在接收到IP地址和行为信息后,根据预定的通信目标,将IP地址和行为信息发送至目标服务器端。目标服务器端能够是宿主浏览器服务商的服务器,也能够是专业用于收集用户行为信息的服务商的服务器。
目标服务器端在接收到的IP地址和行为信息后,首先通过IP地址在已有的数据库中进行检索,是否具有已经建立了以该IP地址命名或者以IP地址为标签的文件夹。若存在,则直接将该行为信息存储在该IP地址对应的文件夹中,完成行为信息的收集;若不存在,则新建以IP地址命名或者命名标签的文件夹,并将行为信息存储在新建的文件夹中进行存储。
在一些选择性实施方式中,为了更好地对行为信息记性归类,目标服务器端在获取行为信息后,通过行为信息中的网页地址访问该网页,并解析网页中的内容,通过内容对该行为信息进行归纳分类存储,以便于后续对数据进行细分挖掘。
上述事实方式在浏览器中植入内联框架,内联框架用于对用户行为信息和目标终端的IP地址进行收集,内联框架与宿主浏览器之间通过跨域通信的方式进行信息交换。由于,目标终端的IP地址具有较强的稳定性,因此,用户通过目标终端所进行的行为都能够归类至目标终端的IP地址文件夹中,使用户行为收集具有大的目标来源。而通过跨域通信的方式又能够实时的收集用户通过浏览器所进行的所有行为信息,从而突破了互联网内容提供商服务器之间的壁垒,能够对用户的行为信息进行全面的收集和整理。能够为进一步的数据分析提供充足的数据支撑,使分析结果更加的准确。
在一些实施方式中,数据的收集被用于对用户使用浏览器习惯的分析,因此,需要对宿主浏览器的名称进行收集。在宿主浏览器发送至内联框架的第一信息中包括宿主浏览器的属性信息。属性信息具体是指宿主浏览器的程序代码,属性信息中包括有该宿主浏览器的名称信息。需要通过检索的方式进行获取。请参阅图2,图2为本实施例宿主浏览器的名称获取流程示意图。
如图2所示,步骤S1300之后还包括下述步骤:
S1311、获取预设的特征列表,其中,所述特征列表中包括用于表征各浏览器名称的多个特征字段;
为在宿主浏览器的属性信息中获取浏览器的名称。设置特征列表,特征列表中收录有能够表征各个浏览器名称的特征字段。例如,firefox(火狐浏览器)、IE(IE浏览器)或Google(谷歌浏览器)。由于属性信息实则为宿主浏览器的源代码,因此,浏览器的名称信息被写入到源代码中,需要通过特征字段的比对在才能够确认。
S1312、依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段;
依次使用特征列表中的特征字段在属性信息中进行检索,以确定属性信息中与特征列表中的那个特征字段相符,则该特征字段对应的浏览器名称,为宿主浏览器的名称,而该特征字段也被定义为目标特征字段。
S1313、确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称。
根据目标特征字段与浏览器名称之间的对应关系确定宿主浏览器的名称。例如,通过检索确定特征字段“firefox”在属性信息中检索结果数量大于等于1,即表明属性信息中包括与“firefox”相同的字段。则确认该特征字段为目标特征字段。而“firefox”对应的浏览器名称为“火狐浏览器”,则确认宿主浏览器的名称为“火狐浏览器”。
通过对浏览器名称进行确定,第三方的信息收集方和挖掘方,能够分析出目标终端安装的浏览器种类,以及用户惯常使用的浏览器名称。更进一步地,在获取用户在使用宿主浏览器的行为信息后,记录用户通过浏览器执行失败的任务,并分析失败任务所需的浏览器配置,并确认具有改配置或者该功能的浏览器种类或者版本,向用户进行推荐。而在一些实施例中,部分任务内容只能通过特定的浏览器信息进行执行,使用其他浏览器时往往会出错,例如,部分政府网站。通过获取上述行为信息后,确定用户需要访问的特殊网站,并获取该网站需要使用的浏览器名称,推荐用户下载上述浏览器。然后将下载的浏览器与对应的行为信息进行关联,当用户使用宿主浏览器浏览特殊网站时,调用与该特殊网站对应的浏览器执行该访问指令。
在一些实施方式中,确认目标特征字段时,需要通过特征字段的检索结果的数量进行确认。请参阅图3,图3为通过检索结果确定目标特征字段的流程示意图。
如图3所示,步骤S1312还包括:
S1321、依次使用所述特征列表中的特征字段在所述属性信息中进行检索;
依次使用特征列表中的特征字段在属性信息中进行检索,以确定属性信息中与特征列表中的那个特征字段相符,则该特征字段对应的浏览器名称,为宿主浏览器的名称,而该特征字段也被定义为目标特征字段。
S1322、若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
根据目标特征字段与浏览器名称之间的对应关系确定宿主浏览器的名称。例如,通过检索确定特征字段“firefox”在属性信息中检索结果数量大于等于1,即表明属性信息中包括与“firefox”相同的字段。则确认该特征字段为目标特征字段。而“firefox”对应的浏览器名称为“火狐浏览器”,则确认宿主浏览器的名称为“火狐浏览器”。
通过检索结果中是否存在相同的特征字段,以及相同字段的数量来判定特征列表中那个特征字段为目标特征字段,能够缩短判断时间,提高判断的效率。
在一些是实施方式中,为更进一步地对数据的收集被用于对用户使用浏览器习惯的分析,因此,需要对宿主浏览器的版本号进行收集。在宿主浏览器发送至内联框架的第一信息中包括宿主浏览器的属性信息。属性信息具体是指宿主浏览器的程序代码,属性信息中包括有该宿主浏览器的版本信息。不同浏览器在程序代码中写入浏览器版本号的位置有所不同,需要通过查询对应的识别规则,以识别浏览器的版本信息。请参阅图4,图4为本实施例宿主浏览器的版本号获取流程示意图。
如图4所示,步骤S1313之后,还包括:
S1331、根据所述宿主浏览器的名称在预设的策略数据库中进行检索,其中,所述策略数据库中包括描述各浏览器版本信息辨识方式的策略信息;
在识别出宿主浏览器的浏览器名称后,根据该名称在预设的策略数据库中进行检索。策略数据库中包括描述各浏览器版本信息辨识方式的策略信息。策略信息中包括各个浏览器的辨识策略。例如,IE8默认背景色为红色、IE7默认背景为黑色以及IE6默认背景为橘色。则辨识上述三种IE版本的浏览器的方式为:当判断浏览器为IE浏览器时,读取属性信息中通过颜色判断IE浏览器版本号的策略信息。但是判断浏览器的策略信息不局限于浏览器的背景颜色,由于,各个浏览器在版本升级时均会存在与前版本存在区别的地方,这种区别能够是(不限于):背景格式的更改、添加新的功能模块或使用新版本的功能部件等。上述区别特征均能够作为策略信息,用于对浏览器的版本识别。
S1332、获取与所述宿主浏览器的名称具有映射关系的策略信息;
通过使用宿主浏览器的名称在策略数据库中进行检索,获取与宿主浏览器名称具有映射关系的策略信息。在策略数据库中各个策略信息均设有索引标签,索引标签均为与策略信息对应的浏览器名称。因此,通过浏览器名称能够快速的检索到对应的策略信息。
S1333、根据所述策略信息在所述属性信息中识别所述宿主浏览器的版本号。
策略信息中包括各个浏览器的辨识策略,例如,IE8默认背景色为红色、IE7默认背景为黑色以及IE6默认背景为橘色。则辨识上述三种IE版本的浏览器的方式为:当判断浏览器为IE浏览器时,读取属性信息中通过颜色判断IE浏览器版本号的策略信息。通过该策略信息,读取属性信息中浏览器默认的背景颜色,然后通过背景颜色判断宿主浏览器为那个版本的IE浏览器。
在一些实施方式中,当部分浏览器在安装了目标插件后,能够直接获取目标终端的Mac(Media Access Control或者Medium Access Control)地址,意译为媒体访问控制,或称为物理地址、硬件地址,用来定义网络设备的位置。一个主机会有一个Mac地址,而每个网络位置会有一个专属于它的IP地址。由于,Mac地址相对于IP地址更加具有唯一性,因此,更加适合作为目标终端的归集参照。请参阅图5,图5为本实施例获取目标终端Mac地址的流程示意图。
如图5所示,步骤S1313之后还包括:
S1341、检测所述宿主浏览器中是否安装预设的目标插件;
部分浏览器在使用了ActiveX插件后,宿主页面就具有了终端的Mac地址信息,通过判断宿主页面是否安装ActiveX插件,当已经安装时,将获取用户公网IP的指令转换为获取用户Mac地址信息。
S1342、当所述宿主浏览器中安装所述目标插件时,在所述属性信息中查找所述宿主浏览器的Mac地址。
当检测到宿主浏览器中安装目标插件时,内联框架将获取目标终端IP地址的指令转换为获取用户Mac地址信息的指令。并在属性信息中查找到该Mac地址信息。由于Mac地址具有全球唯一性,因此,获取Mac地址后,能够将该终端上所有的用户行为均关联在一起,组件覆盖面更加广泛的用户行为收集渠道,为用户行为数据挖掘提供更广阔的数据资源,使数据挖掘结果更加准确。
为解决上述技术问题,本发明实施例还提供一种浏览器信息应用装置。
请参阅图6,图6为本实施例浏览器信息应用装置的基本结构示意图。
如图6所示,一种浏览器信息应用装置,包括:调用模块2100、判断模块2200、处理模块2300和执行模块2400。其中,调用模块2100用于调用预设的目标程序,其中,目标程序用于宿主浏览器与内联框架之间的跨域通信;判断模块2200用于判断宿主浏览器的内容是否加载完毕;处理模块2300用于当宿主浏览器的内容加载完毕时,宿主浏览器通过目标程序向内联框架发送预设的第一消息,其中,第一消息中包括宿主浏览器所在目标终端的IP地址和用户的行为信息;执行模块2400用于内联框架将IP地址和行为信息发送至预设的目标服务器端,以使业务服务器端根据IP地址,将用户在目标终端上使用宿主浏览器进行的行为信息均归类至IP地址名下进行记录。
浏览器信息应用装置在浏览器中植入内联框架,内联框架用于对用户行为信息和目标终端的IP地址进行收集,内联框架与宿主浏览器之间通过跨域通信的方式进行信息交换。由于,目标终端的IP地址具有较强的稳定性,因此,用户通过目标终端所进行的行为都能够归类至目标终端的IP地址文件夹中,使用户行为收集具有大的目标来源。而通过跨域通信的方式又能够实时的收集用户通过浏览器所进行的所有行为信息,从而突破了互联网内容提供商服务器之间的壁垒,能够对用户的行为信息进行全面的收集和整理。能够为进一步的数据分析提供充足的数据支撑,使分析结果更加的准确。
在一些实施方式中,第一消息中包括宿主浏览器的属性信息,浏览器信息应用装置还包括:第一获取子模块、第一处理子模块和第一执行子模块。其中,第一获取子模块用于获取预设的特征列表,其中,特征列表中包括用于表征各浏览器名称的多个特征字段;第一处理子模块用于依次使用特征列表中的特征字段在属性信息中进行检索,以确定属性信息中包括的特征字段,并定义特征字段为目标特征字段;第一执行子模块用于确认与目标特征字段对应的浏览器名称为宿主浏览器的名称。
在一些实施方式中,浏览器信息应用装置还包括:第一检索子模块和第一判断子模块。其中,第一检索子模块用于依次使用特征列表中的特征字段在属性信息中进行检索;第一判断子模块用于若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
在一些实施方式中,属性信息中包括宿主浏览器的版本号,浏览器信息应用装置还包括:第二检索子模块、第二获取子模块和第二执行子模块。其中,第二检索子模块用于根据宿主浏览器的名称在预设的策略数据库中进行检索,其中,策略数据库中包括描述各浏览器版本信息辨识方式的策略信息;第二获取子模块用于获取与宿主浏览器的名称具有映射关系的策略信息;第二执行子模块用于根据策略信息在属性信息中识别宿主浏览器的版本号。
在一些实施方式中,属性信息中包括目标终端的Mac地址,浏览器信息应用装置还包括:第一检测子模块和第三执行子模块。第一检测子模块用于检测宿主浏览器中是否安装预设的目标插件;第三执行子模块用于当宿主浏览器中安装目标插件时,在属性信息中查找宿主浏览器的Mac地址。
为解决上述技术问题,本发明实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
如图7所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种浏览器信息应用方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种浏览器信息应用方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图6中调用模块2100、判断模块2200、处理模块2300和执行模块2400的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有人脸图像关键点检测装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
计算机设备在浏览器中植入内联框架,内联框架用于对用户行为信息和目标终端的IP地址进行收集,内联框架与宿主浏览器之间通过跨域通信的方式进行信息交换。由于,目标终端的IP地址具有较强的稳定性,因此,用户通过目标终端所进行的行为都能够归类至目标终端的IP地址文件夹中,使用户行为收集具有大的目标来源。而通过跨域通信的方式又能够实时的收集用户通过浏览器所进行的所有行为信息,从而突破了互联网内容提供商服务器之间的壁垒,能够对用户的行为信息进行全面的收集和整理。能够为进一步的数据分析提供充足的数据支撑,使分析结果更加的准确。
本发明还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例浏览器信息应用方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

Claims (10)

1.一种浏览器信息应用方法,其特征在于,包括:
调用预设的目标程序,其中,所述目标程序用于宿主浏览器与内联框架之间的跨域通信;
判断所述宿主浏览器的内容是否加载完毕;
当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,其中,所述第一消息中包括所述宿主浏览器所在目标终端的IP地址和用户的行为信息;
所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。
2.根据权利要求1所述的浏览器信息应用方法,其特征在于,所述第一消息中包括所述宿主浏览器的属性信息,所述当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息之后,还包括:
获取预设的特征列表,其中,所述特征列表中包括用于表征各浏览器名称的多个特征字段;
依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段;
确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称。
3.根据权利要求2所述的浏览器信息应用方法,其特征在于,依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段包括:
依次使用所述特征列表中的特征字段在所述属性信息中进行检索;
若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
4.根据权利要求2所述的浏览器信息应用方法,其特征在于,所述属性信息中包括所述宿主浏览器的版本号,所述确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称之后,还包括:
根据所述宿主浏览器的名称在预设的策略数据库中进行检索,其中,所述策略数据库中包括描述各浏览器版本信息辨识方式的策略信息;
获取与所述宿主浏览器的名称具有映射关系的策略信息;
根据所述策略信息在所述属性信息中识别所述宿主浏览器的版本号。
5.根据权利要求2所述的浏览器信息应用方法,其特征在于,所述属性信息中包括所述目标终端的Mac地址,所述确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称之后,还包括:
检测所述宿主浏览器中是否安装预设的目标插件;
当所述宿主浏览器中安装所述目标插件时,在所述属性信息中查找所述宿主浏览器的Mac地址。
6.一种浏览器信息应用装置,其特征在于,包括:
调用模块,用于调用预设的目标程序,其中,所述目标程序用于宿主浏览器与内联框架之间的跨域通信;
判断模块,用于判断所述宿主浏览器的内容是否加载完毕;
处理模块,用于当所述宿主浏览器的内容加载完毕时,所述宿主浏览器通过所述目标程序向所述内联框架发送预设的第一消息,其中,所述第一消息中包括所述宿主浏览器所在目标终端的IP地址和用户的行为信息;
执行模块,用于所述内联框架将所述IP地址和行为信息发送至预设的目标服务器端,以使所述业务服务器端根据所述IP地址,将用户在所述目标终端上使用所述宿主浏览器进行的行为信息均归类至所述IP地址名下进行记录。
7.根据权利要求6所述的浏览器信息应用装置,其特征在于,所述第一消息中包括所述宿主浏览器的属性信息,所述浏览器信息应用装置还包括:
第一获取子模块,用于获取预设的特征列表,其中,所述特征列表中包括用于表征各浏览器名称的多个特征字段;
第一处理子模块,用于依次使用所述特征列表中的特征字段在所述属性信息中进行检索,以确定所述属性信息中包括的特征字段,并定义所述特征字段为目标特征字段;
第一执行子模块,用于确认与所述目标特征字段对应的浏览器名称为所述宿主浏览器的名称。
8.根据权利要求7所述的浏览器信息应用装置,其特征在于,所述浏览器信息应用装置还包括:
第一检索子模块,用于依次使用所述特征列表中的特征字段在所述属性信息中进行检索;
第一判断子模块,用于若当前使用的特征字段检索得到的检索结果大于等于1时,确定当前使用的特征特征字段为目标特征字段;否则,则替换至下一位特征字段进行检索。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述浏览器信息应用方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述浏览器信息应用方法的步骤。
CN201811526546.5A 2018-12-13 2018-12-13 浏览器信息应用方法、装置、计算机设备及存储介质 Pending CN110007979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811526546.5A CN110007979A (zh) 2018-12-13 2018-12-13 浏览器信息应用方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811526546.5A CN110007979A (zh) 2018-12-13 2018-12-13 浏览器信息应用方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN110007979A true CN110007979A (zh) 2019-07-12

Family

ID=67165132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811526546.5A Pending CN110007979A (zh) 2018-12-13 2018-12-13 浏览器信息应用方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110007979A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132833A1 (en) * 2008-04-15 2013-05-23 Foresee Results, Inc. Systems and Methods For Remote Tracking And Replay Of User Interaction With A Webpage
US20150156084A1 (en) * 2012-12-02 2015-06-04 Bot Or Not, Llc System and method for reporting on automated browser agents
CN105940391A (zh) * 2013-12-04 2016-09-14 维克斯网有限公司 第三方应用活动数据收集
CN106656577A (zh) * 2016-11-24 2017-05-10 中国通信建设集团设计院有限公司 一种app及浏览器的用户行为统计方法及智能路由器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132833A1 (en) * 2008-04-15 2013-05-23 Foresee Results, Inc. Systems and Methods For Remote Tracking And Replay Of User Interaction With A Webpage
US20150156084A1 (en) * 2012-12-02 2015-06-04 Bot Or Not, Llc System and method for reporting on automated browser agents
CN105940391A (zh) * 2013-12-04 2016-09-14 维克斯网有限公司 第三方应用活动数据收集
CN106656577A (zh) * 2016-11-24 2017-05-10 中国通信建设集团设计院有限公司 一种app及浏览器的用户行为统计方法及智能路由器

Similar Documents

Publication Publication Date Title
US9141697B2 (en) Method, system and computer-readable storage medium for detecting trap of web-based perpetual calendar and building retrieval database using the same
CN105608134A (zh) 一种基于多线程的网络爬虫系统及其网页爬取方法
US20150227276A1 (en) Method and system for providing an interactive user guide on a webpage
CN110674360B (zh) 一种用于数据的溯源方法和系统
CN111737692B (zh) 应用程序的风险检测方法及装置、设备、存储介质
US9230034B2 (en) Related page identification based on page hierarchy and subject hierarchy
CN104978213B (zh) 实现应用安装包的链接获取方法和装置
CN111859076B (zh) 数据爬取方法、装置、计算机设备及计算机可读存储介质
WO2019071966A1 (zh) 基于爬虫数据的用户行为分析方法、应用服务器及可读存储介质
CN107133165A (zh) 浏览器兼容性检测方法及装置
US10291492B2 (en) Systems and methods for discovering sources of online content
CN111355628B (zh) 一种模型训练方法、业务识别方法、装置和电子装置
CN114817968A (zh) 无特征数据的路径追溯方法、装置、设备及存储介质
CN113641873B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN106060023A (zh) 一种恶意数据的拦截处理方法及装置
Almishari et al. Ads-portal domains: Identification and measurements
CN112231696A (zh) 恶意样本的识别方法、装置、计算设备以及介质
CN109684844B (zh) 一种webshell检测方法、装置以及计算设备、计算机可读存储介质
CN110007979A (zh) 浏览器信息应用方法、装置、计算机设备及存储介质
CN112384940A (zh) 用于web爬取电子商务资源页面的机制
CN109032924A (zh) 识别页面中资源类型的方法、装置、设备和储存介质
CN113094286B (zh) 页面测试方法和装置、存储介质和电子设备
CN111563153B (zh) 基于剪切板信息共享实现的推荐方法以及终端
CN105589870B (zh) 网页广告的过滤方法和系统
CN111950037A (zh) 检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination