CN107797906A - 一种实时监控多种浏览器网页浏览记录的方法 - Google Patents

一种实时监控多种浏览器网页浏览记录的方法 Download PDF

Info

Publication number
CN107797906A
CN107797906A CN201710928194.5A CN201710928194A CN107797906A CN 107797906 A CN107797906 A CN 107797906A CN 201710928194 A CN201710928194 A CN 201710928194A CN 107797906 A CN107797906 A CN 107797906A
Authority
CN
China
Prior art keywords
network address
browser
title
time duration
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710928194.5A
Other languages
English (en)
Other versions
CN107797906B (zh
Inventor
梁效宁
雷珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Art Beats Nature Information Security Intelligent Equipment Co Ltd
Original Assignee
Sichuan Art Beats Nature Information Security Intelligent Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Art Beats Nature Information Security Intelligent Equipment Co Ltd filed Critical Sichuan Art Beats Nature Information Security Intelligent Equipment Co Ltd
Priority to CN201710928194.5A priority Critical patent/CN107797906B/zh
Publication of CN107797906A publication Critical patent/CN107797906A/zh
Application granted granted Critical
Publication of CN107797906B publication Critical patent/CN107797906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种实时监控多种浏览器网页浏览记录的方法,其特征在于包括以下步骤:S100:配置多种类型浏览器的特征库;S200:将所述类型浏览器访问网址的累计时长T赋初值0;S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长;S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300。S500:输出所述网址、网址的标题及所述累计时长。通过本发明提出的方法,可以解决成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题。

Description

一种实时监控多种浏览器网页浏览记录的方法
技术领域
本发明属于网络监控领域,涉及监控网页浏览记录的方法,尤其涉及一种实时监控多种浏览器网页浏览记录的方法。
背景技术
随着信息化时代的飞速发展,如何更加高效地管控用户的互联网访问情况成为了不可缺少的研究课题。目前,国内外已有很多厂商推出了不同的技术方案,部分厂商通过安装一个监控主机,各个被监控端通过连该主机访问互联网,然后抓取网络数据包并解析,这样基本实现了管控目的;但是,定制一个监控主机成本太高,而且不能解决重复数据包及加密数据包的问题,访问互联网的累计时长也无法获取。另外的厂商采用在普通PC机上安装监控端程序以用做监控主机,在被监控端PC机上安装被监控端程序,监控程序获取网络数据包并进行解析后将结果回传给监控主机;这样虽然解决了高成本的问题,但是还是存在通过解析数据包实现监控目的的弊端。
上述的现有技术解决方案中,都需要搭建复杂的网络环境,安装数据包分析设备,不仅成本高,而且获取网络数据包、监控网页浏览情况时,不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页。
发明内容
本发明针对现有技术的不足和上述问题,提出了一种实时监控多种浏览器网页浏览记录的方法,通过窗口结构查看工具inspect.exe查看浏览器的窗体,并利用Windows操作系统的API(IUI Automation)获取窗体信息,配置多种类型浏览器的特征库,并监控网页浏览记录。通过本发明提出的方法,可以解决成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题;所述方法包括以下步骤:
S100:配置多种类型浏览器的特征库,包括以下步骤:
S101:运行窗口结构查看工具;
S102:打开任一类型浏览器并浏览任意网页;
S103:利用所述窗口结构查看工具查找所述类型浏览器的窗体;
S104:获取所述类型浏览器的标题控件及网址输入控件,并将所述标题控件及所述网址输入控件存储于所述类型浏览器的特征库中;
S105:是否配置完所有类型浏览器的特征库,如果是,执行步骤S200,否则,执行步骤S102。
S200:将所述类型浏览器访问网址的累计时长T赋初值0,其中,T为大于0的正整数。
S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长,包括以下步骤:
S301:获取前台窗体的进程号PID;
S302:根据所述前台窗体的所述进程号PID,在进程列表中匹配所述进程号PID对应的所述类型浏览器;
S303:是否匹配到所述类型浏览器,如果是,执行步骤S304,否则执行步骤S301;
S304:判断所述类型浏览器的特征库中是否获取到所述网址输入控件,如果是,执行步骤S305,否则,执行步骤S306;
S305:获取所述网址输入控件的键值Value作为所述网址,执行步骤S307;
S306:获取所述网址输入控件中各层控件的信息,直至获取到网址输入控件并获取所述网址输入控件的键值Value作为所述网址;
S307:获取所述浏览器第一层控件名称的键值Name作为所述网址的标题;
S308:经过时间间隔t后,所述键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,t为大于0的正整数;
S309:所述累计时长T=T+t,执行步骤S400;
S310:输出所述网址、所述网址的标题及所述累计时长T,并将所述累计时长T置为0。
S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300。
S500:输出所述网址、网址的标题及所述累计时长。
作为优选,所述浏览器特征库还包括标题控件及网址输入控件的各自的层级及位置信息、类型信息及名称信息。
作为优选,所述时间间隔t为2秒。
本发明的有益效果是解决了成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题。
附图说明
图1为本发明的主流程图;
图2为本发明中步骤S100的流程图;
图3为本发明实施例中IE11浏览器的窗体示意图;
图4为本发明实施例中“导航栏”窗格的信息体的示意图;
图5为本发明实施例中“”窗格的信息体的示意图;
图6为本发明实施例中“地址栏”窗格的信息体的示意图;
图7为本发明实施例中网址编辑窗格的信息体的示意图;
图8为本发明实施例中标题窗格的信息体的示意图;
图9为本发明中步骤S300的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步阐述。
本实施例中,选用IE11浏览器浏览网页,并选用inspect.exe作为窗口结构查看工具。
如图1所示,一种实时监控多种浏览器网页浏览记录的方法,包括以下步骤:
S100:配置多种类型浏览器的特征库,包括如图2所示的以下步骤:
S101:运行窗口结构查看工具inspect.exe;
S102:本实施例中,用IE11浏览器浏览百度首页,其网址为https://www.baidu.com/;
S103:利用inspect.exe查找IE11浏览器的窗体,如图3所示,运行inspect.exe后,查看“桌面”窗格下的“百度一下,你就知道-Internet Explorer”窗口字样,即为IE11浏览器的窗体;
S104:获取IE11浏览器的标题控件及网址输入控件,并将标题控件及网址输入控件存储于IE11浏览器的特征库中:
配置网址输入控件特征:运行inspect.exe并获取IE11浏览器的窗体,逐层解析并记录包括网址输入控件在内的各控件的层级及位置,并利用Windows操作系统的IUIAutomation接口获取各控件相应的控件类型ControlType,本实施例的IE11浏览器窗体结构中:
如图3所示,IE11浏览器的标题控件位于层级为第一层中且名称为“百度一下,你就知道-Internet Explorer”窗口;层级为第二层中,位置1是“”窗格,位置2是“导航栏”窗格;如图4所示,利用Windows操作系统的IUI Automation接口获取的“导航栏”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第三层中,位置为1是“”窗格;如图5所示,利用Windows操作系统的IUI Automation接口获取的“”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第四层中,位置1是“”窗格,位置2是“地址栏”窗格;如图6所示,利用Windows操作系统的IUI Automation接口获取的“地址栏”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第五层中,位置1是“使用百度搜索查找网址和搜索”编辑;如图7所示,利用Windows操作系统的IUI Automation接口获取的“使用百度搜索查找网址和搜索”编辑控件类型ControlType为UIA_EditControlTypeId控件,该控件即为网址输入控件。
根据上述IE11浏览器窗体结构,设置网址输入控件特征为:
’url’:[{index:2,name:’导航栏’,type:UIA_PaneControlTypeId},{index:1,name:”,type:UIA_PaneControlTypeId},{index:2,name:’地址栏’,type:UIA_PaneControlTypeId},{index:1,name:’使用百度搜索查找网址和搜索’,type:UIA_EditControlTypeId}],并将该特征存储于IE11浏览器的特征库中,其中,index后面的数字表示相应控件所在层级的位置。
同样,配置标题控件特征:如图3所示,IE11浏览器的标题控件位于层级为第一层中且名称为“百度一下,你就知道-Internet Explorer”窗口;如图8所示,利用Windows操作系统的IUI Automation接口获取的“百度一下,你就知道-Internet Explorer”控件类型ControlType为UIA_WindowsControlTypeId,设置标题控件特征为:
“Internet Explorer”:{title:[],’url’:[{index:2,name:’导航栏’,type:UIA_PaneControlTypeId},{index:1,name:”,type:UIA_PaneControlTypeId},{index:2,name:’地址栏’,type:UIA_PaneControlTypeId},{index:1,name:’使用百度搜索查找网址和搜索’,type:UIA_EditControlTypeId}]},并将该特征存储于IE11浏览器的特征库中。至此,IE11浏览器的特征库配置完毕。
S105:重复步骤S104的方法以配置其他类型浏览器的特征库,如果配置完所有类型浏览器的特征库,执行步骤S200,否则,执行步骤S102。
S200:将IE11浏览器访问百度首页的累计时长T赋初值0,其中,T为大于0的正整数。
S300:获取IE11浏览器访问百度首页的网址及累计时长,包括如图9所示,的以下步骤:
S301:如图4至图8任一所示,获取前台窗体的进程号PID,即ProcessId为17868;
S302:根据该前台窗体的进程号PID 17868,在进程列表中匹配进程号PID17868对应的浏览器为Internet Explorer,即本实施例中的IE11浏览器;
S303:是否匹配到IE11浏览器,如果是,执行步骤S304,否则执行步骤S301;本实施例中,由于匹配到IE11浏览器,故执行步骤S304;
S304:判断IE11浏览器的特征库中是否获取到网址输入控件,如果是,执行步骤S305,否则执行步骤S306;
S305:获取网址输入控件的键值Value作为网址,如图7所示,本实施例中,在IE11浏览器的特征库中查找名称“使用百度搜索查找网址和搜索”,并获取其网址输入控件的键值Value,即图7所示的LegacyIAccessible.Value的值https://www.baidu.com/?tn=98012088_5_dg&ch=12作为网址,接着,执行步骤S307;
S306:对浏览器的特征库中获取不到网址输入控件的情况,则表示浏览器的特征库中未存储过所访问的网址,换言之,表示该浏览器未曾浏览过该网页;在此情况下,根据步骤S104的方法,获取当前浏览器的标题控件及网址输入控件,并获取访问的网址输入控件的键值Value作为访问的网址,并将标题控件及网址输入控件存储于浏览器的特征库中;
S307:获取IE11浏览器第一层控件名称的键值Name作为网址的标题:如图8所示,获取名称Name的键值“百度一下,你就知道-Internet Explorer”,即为标题。
S308:经过时间间隔t后,键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,时间间隔t为大于0的正整数;本实施例中,时间间隔t为2秒;
S309:累计时长T=T+t,执行步骤S400;
S310:输出网址、网址的标题及累计时长T并将累计时长T置为0;即,如果当前网址和先前的网址不一样,则表明用户已经离开先前的网址并访问不同的网址;此时,输出先前访问的网址、网址的标题及累计时长T,并将累计时长T置为0,以便统计当前访问的网址的累计时长T。
S400:是否停止获取网址及累计时长,如果是,执行步骤S500,否则,执行步骤S300。
S500:输出网址、网址的标题及累计时长。
应当理解的是,本发明不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (3)

1.一种实时监控多种浏览器网页浏览记录的方法,其特征在于包括以下步骤:
S100:配置多种类型浏览器的特征库,包括以下步骤:
S101:运行窗口结构查看工具;
S102:打开任一类型浏览器并浏览任意网页;
S103:利用所述窗口结构查看工具查找所述类型浏览器的窗体;
S104:获取所述类型浏览器的标题控件及网址输入控件,并将所述标题控件及所述网址输入控件存储于所述类型浏览器的特征库中;
S105:是否配置完所有类型浏览器的特征库,如果是,执行步骤S200,否则,执行步骤S102;
S200:将所述类型浏览器访问网址的累计时长T赋初值0,其中,T为大于0的正整数;
S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长,包括以下步骤:
S301:获取前台窗体的进程号PID;
S302:根据所述前台窗体的所述进程号PID,在进程列表中匹配所述进程号PID对应的所述类型浏览器;
S303:是否匹配到所述类型浏览器,如果是,执行步骤S304,否则执行步骤S301;
S304:判断所述类型浏览器的特征库中是否获取到所述网址输入控件,如果是,执行步骤S305,否则,执行步骤S306;
S305:获取所述网址输入控件的键值Value作为所述网址,执行步骤S307;
S306:获取所述网址输入控件中各层控件的信息,直至获取到网址输入控件并获取所述网址输入控件的键值Value作为所述网址;
S307:获取所述浏览器第一层控件名称的键值Name作为所述网址的标题;
S308:经过时间间隔t后,所述键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,t为大于0的正整数;
S309:所述累计时长T=T+t,执行步骤S400;
S310:输出所述网址、所述网址的标题及所述累计时长T,并将所述累计时长T置为0;
S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300;
S500:输出所述网址、网址的标题及所述累计时长。
2.根据权利要求1所述的一种实时监控多种浏览器网页浏览记录的方法,其特征在于,所述浏览器特征库还包括标题控件及网址输入控件的各自的层级及位置信息、类型信息及名称信息。
3.根据权利要求1所述的一种实时监控多种浏览器网页浏览记录的方法,其特征在于,所述时间间隔t为2秒。
CN201710928194.5A 2017-10-09 2017-10-09 一种实时监控多种浏览器网页浏览记录的方法 Active CN107797906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710928194.5A CN107797906B (zh) 2017-10-09 2017-10-09 一种实时监控多种浏览器网页浏览记录的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710928194.5A CN107797906B (zh) 2017-10-09 2017-10-09 一种实时监控多种浏览器网页浏览记录的方法

Publications (2)

Publication Number Publication Date
CN107797906A true CN107797906A (zh) 2018-03-13
CN107797906B CN107797906B (zh) 2020-10-13

Family

ID=61532977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710928194.5A Active CN107797906B (zh) 2017-10-09 2017-10-09 一种实时监控多种浏览器网页浏览记录的方法

Country Status (1)

Country Link
CN (1) CN107797906B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499071A (zh) * 2008-01-30 2009-08-05 国际商业机器公司 创建和使用用户定制的统一资源定位符的设备和方法
CN103324673A (zh) * 2013-05-23 2013-09-25 中国科学院计算机网络信息中心 一种互联网用户行为数据的采集方法
US20140024335A1 (en) * 2012-07-17 2014-01-23 Chidopi Co., Ltd. Methods for collecting usage information of portable devices, and utilizing methods and platforms thereof
CN103544325A (zh) * 2013-11-11 2014-01-29 北京国双科技有限公司 用于网页页面点击分布的数据处理方法和装置
CN103559203A (zh) * 2013-10-08 2014-02-05 北京奇虎科技有限公司 网页排序方法、装置和系统
CN103970803A (zh) * 2013-02-05 2014-08-06 腾讯科技(深圳)有限公司 浏览器访问提示方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499071A (zh) * 2008-01-30 2009-08-05 国际商业机器公司 创建和使用用户定制的统一资源定位符的设备和方法
US20140024335A1 (en) * 2012-07-17 2014-01-23 Chidopi Co., Ltd. Methods for collecting usage information of portable devices, and utilizing methods and platforms thereof
CN103970803A (zh) * 2013-02-05 2014-08-06 腾讯科技(深圳)有限公司 浏览器访问提示方法和系统
CN103324673A (zh) * 2013-05-23 2013-09-25 中国科学院计算机网络信息中心 一种互联网用户行为数据的采集方法
CN103559203A (zh) * 2013-10-08 2014-02-05 北京奇虎科技有限公司 网页排序方法、装置和系统
CN103544325A (zh) * 2013-11-11 2014-01-29 北京国双科技有限公司 用于网页页面点击分布的数据处理方法和装置

Also Published As

Publication number Publication date
CN107797906B (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN109862064B (zh) 一种用于设备远程监控的组态方法及装置
Hong et al. WebQuilt: A proxy-based approach to remote web usability testing
US8335838B2 (en) Web page load time prediction and simulation
JP4024426B2 (ja) ネットワーク・ユーザによるウェブ・サイトの使用パターンの特性を記述し視覚化する方法
EP1488353A2 (en) Recording user interaction with an application
CN103544100B (zh) 便携数据处理设备应用程序的测试方法、系统和客户端
EP2500834A1 (en) Method and System for Transferring Application Program Settings Between Applications
US20160371235A9 (en) Method and System for Testing Websites
US20060117055A1 (en) Client-based web server application verification and testing system
US20020103896A1 (en) HTTP transaction monitor
CN103092936B (zh) 一种物联网动态页面实时信息采集方法
US7818686B2 (en) System and method for accelerated web page navigation using keyboard accelerators in a data processing system
WO2002100034A1 (en) System and process for testing an application
CN101346720A (zh) 用于重建网上内容的方法和数据处理系统
US20220350857A1 (en) Methods and systems for browser extension used to generate relative xpath, absolute xpath and/or css selectors
CN107342910A (zh) 模拟多用户进行网络访问的自动化测试方法及工具
CN105718533A (zh) 信息推送方法和装置
US7363368B2 (en) System and method for transaction recording and playback
CN109787974A (zh) 报文数据流生成方法、装置、计算机设备和存储介质
CN106776638A (zh) 数据库操作方法和装置
CN109408763B (zh) 一种对不同模板的简历进行管理的方法及系统
US20060150111A1 (en) Methods and apparatus for evaluating aspects of a web page
US20020191015A1 (en) Method and apparatus for managing history logs in a data processing system
CN106970962A (zh) 一种获取搜索引擎搜索结果的方法和装置
CN104715060B (zh) 一种基于网页的图片显示方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liang Xiaoning

Inventor after: Zuo Yu

Inventor after: Lei Ke

Inventor before: Liang Xiaoning

Inventor before: Lei Ke

GR01 Patent grant
GR01 Patent grant