CN107797906B - 一种实时监控多种浏览器网页浏览记录的方法 - Google Patents
一种实时监控多种浏览器网页浏览记录的方法 Download PDFInfo
- Publication number
- CN107797906B CN107797906B CN201710928194.5A CN201710928194A CN107797906B CN 107797906 B CN107797906 B CN 107797906B CN 201710928194 A CN201710928194 A CN 201710928194A CN 107797906 B CN107797906 B CN 107797906B
- Authority
- CN
- China
- Prior art keywords
- website
- title
- browser
- acquiring
- accumulated time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Technology Law (AREA)
- Computer And Data Communications (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种实时监控多种浏览器网页浏览记录的方法,其特征在于包括以下步骤:S100:配置多种类型浏览器的特征库;S200:将所述类型浏览器访问网址的累计时长T赋初值0;S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长;S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300。S500:输出所述网址、网址的标题及所述累计时长。通过本发明提出的方法,可以解决成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题。
Description
技术领域
本发明属于网络监控领域,涉及监控网页浏览记录的方法,尤其涉及一种实时监控多种浏览器网页浏览记录的方法。
背景技术
随着信息化时代的飞速发展,如何更加高效地管控用户的互联网访问情况成为了不可缺少的研究课题。目前,国内外已有很多厂商推出了不同的技术方案,部分厂商通过安装一个监控主机,各个被监控端通过连该主机访问互联网,然后抓取网络数据包并解析,这样基本实现了管控目的;但是,定制一个监控主机成本太高,而且不能解决重复数据包及加密数据包的问题,访问互联网的累计时长也无法获取。另外的厂商采用在普通PC机上安装监控端程序以用做监控主机,在被监控端PC机上安装被监控端程序,监控程序获取网络数据包并进行解析后将结果回传给监控主机;这样虽然解决了高成本的问题,但是还是存在通过解析数据包实现监控目的的弊端。
上述的现有技术解决方案中,都需要搭建复杂的网络环境,安装数据包分析设备,不仅成本高,而且获取网络数据包、监控网页浏览情况时,不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页。
发明内容
本发明针对现有技术的不足和上述问题,提出了一种实时监控多种浏览器网页浏览记录的方法,通过窗口结构查看工具inspect.exe查看浏览器的窗体,并利用Windows操作系统的API(IUI Automation)获取窗体信息,配置多种类型浏览器的特征库,并监控网页浏览记录。通过本发明提出的方法,可以解决成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题;所述方法包括以下步骤:
S100:配置多种类型浏览器的特征库,包括以下步骤:
S101:运行窗口结构查看工具;
S102:打开任一类型浏览器并浏览任意网页;
S103:利用所述窗口结构查看工具查找所述类型浏览器的窗体;
S104:获取所述类型浏览器的标题控件及网址输入控件,并将所述标题控件及所述网址输入控件存储于所述类型浏览器的特征库中;
S105:是否配置完所有类型浏览器的特征库,如果是,执行步骤S200,否则,执行步骤S102。
S200:将所述类型浏览器访问网址的累计时长T赋初值0,其中,T为大于0的正整数。
S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长,包括以下步骤:
S301:获取前台窗体的进程号PID;
S302:根据所述前台窗体的所述进程号PID,在进程列表中匹配所述进程号PID对应的所述类型浏览器;
S303:是否匹配到所述类型浏览器,如果是,执行步骤S304,否则执行步骤S301;
S304:判断所述类型浏览器的特征库中是否获取到所述网址输入控件,如果是,执行步骤S305,否则,执行步骤S306;
S305:获取所述网址输入控件的键值Value作为所述网址,执行步骤S307;
S306:获取所述网址输入控件中各层控件的信息,直至获取到网址输入控件并获取所述网址输入控件的键值Value作为所述网址;
S307:获取所述浏览器第一层控件名称的键值Name作为所述网址的标题;
S308:经过时间间隔t后,所述键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,t为大于0的正整数;
S309:所述累计时长T=T+t,执行步骤S400;
S310:输出所述网址、所述网址的标题及所述累计时长T,并将所述累计时长T置为0。
S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300。
S500:输出所述网址、网址的标题及所述累计时长。
作为优选,所述浏览器特征库还包括标题控件及网址输入控件的各自的层级及位置信息、类型信息及名称信息。
作为优选,所述时间间隔t为2秒。
本发明的有益效果是解决了成本高、不能获取https加密网页数据、无法获取网页浏览的累计时长及网页标题、无法判断网址是否是用户访问的可见网页的技术问题。
附图说明
图1为本发明的主流程图;
图2为本发明中步骤S100的流程图;
图3为本发明实施例中IE11浏览器的窗体示意图;
图4为本发明实施例中“导航栏”窗格的信息体的示意图;
图5为本发明实施例中“”窗格的信息体的示意图;
图6为本发明实施例中“地址栏”窗格的信息体的示意图;
图7为本发明实施例中网址编辑窗格的信息体的示意图;
图8为本发明实施例中标题窗格的信息体的示意图;
图9为本发明中步骤S300的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步阐述。
本实施例中,选用IE11浏览器浏览网页,并选用inspect.exe作为窗口结构查看工具。
如图1所示,一种实时监控多种浏览器网页浏览记录的方法,包括以下步骤:
S100:配置多种类型浏览器的特征库,包括如图2所示的以下步骤:
S101:运行窗口结构查看工具inspect.exe;
S102:本实施例中,用IE11浏览器浏览百度首页,其网址为https://www.baidu.com/;
S103:利用inspect.exe查找IE11浏览器的窗体,如图3所示,运行inspect.exe后,查看“桌面”窗格下的“百度一下,你就知道-Internet Explorer”窗口字样,即为IE11浏览器的窗体;
S104:获取IE11浏览器的标题控件及网址输入控件,并将标题控件及网址输入控件存储于IE11浏览器的特征库中:
配置网址输入控件特征:运行inspect.exe并获取IE11浏览器的窗体,逐层解析并记录包括网址输入控件在内的各控件的层级及位置,并利用Windows操作系统的IUIAutomation接口获取各控件相应的控件类型ControlType,本实施例的IE11浏览器窗体结构中:
如图3所示,IE11浏览器的标题控件位于层级为第一层中且名称为“百度一下,你就知道-Internet Explorer”窗口;层级为第二层中,位置1是“”窗格,位置2是“导航栏”窗格;如图4所示,利用Windows操作系统的IUI Automation接口获取的“导航栏”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第三层中,位置为1是“”窗格;如图5所示,利用Windows操作系统的IUI Automation接口获取的“”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第四层中,位置1是“”窗格,位置2是“地址栏”窗格;如图6所示,利用Windows操作系统的IUI Automation接口获取的“地址栏”窗格控件类型ControlType为UIA_PaneControlTypeId控件;
如图3所示,层级为第五层中,位置1是“使用百度搜索查找网址和搜索”编辑;如图7所示,利用Windows操作系统的IUI Automation接口获取的“使用百度搜索查找网址和搜索”编辑控件类型ControlType为UIA_EditControlTypeId控件,该控件即为网址输入控件。
根据上述IE11浏览器窗体结构,设置网址输入控件特征为:
’url’:[{index:2,name:’导航栏’,type:UIA_PaneControlTypeId},{index:1,name:”,type:UIA_PaneControlTypeId},{index:2,name:’地址栏’,type:UIA_PaneControlTypeId},{index:1,name:’使用百度搜索查找网址和搜索’,type:UIA_EditControlTypeId}],并将该特征存储于IE11浏览器的特征库中,其中,index后面的数字表示相应控件所在层级的位置。
同样,配置标题控件特征:如图3所示,IE11浏览器的标题控件位于层级为第一层中且名称为“百度一下,你就知道-Internet Explorer”窗口;如图8所示,利用Windows操作系统的IUI Automation接口获取的“百度一下,你就知道-Internet Explorer”控件类型ControlType为UIA_WindowsControlTypeId,设置标题控件特征为:
“Internet Explorer”:{title:[],’url’:[{index:2,name:’导航栏’,type:UIA_PaneControlTypeId},{index:1,name:”,type:UIA_PaneControlTypeId},{index:2,name:’地址栏’,type:UIA_PaneControlTypeId},{index:1,name:’使用百度搜索查找网址和搜索’,type:UIA_EditControlTypeId}]},并将该特征存储于IE11浏览器的特征库中。至此,IE11浏览器的特征库配置完毕。
S105:重复步骤S104的方法以配置其他类型浏览器的特征库,如果配置完所有类型浏览器的特征库,执行步骤S200,否则,执行步骤S102。
S200:将IE11浏览器访问百度首页的累计时长T赋初值0,其中,T为大于0的正整数。
S300:获取IE11浏览器访问百度首页的网址及累计时长,包括如图9所示,的以下步骤:
S301:如图4至图8任一所示,获取前台窗体的进程号PID,即ProcessId为17868;
S302:根据该前台窗体的进程号PID 17868,在进程列表中匹配进程号PID17868对应的浏览器为Internet Explorer,即本实施例中的IE11浏览器;
S303:是否匹配到IE11浏览器,如果是,执行步骤S304,否则执行步骤S301;本实施例中,由于匹配到IE11浏览器,故执行步骤S304;
S304:判断IE11浏览器的特征库中是否获取到网址输入控件,如果是,执行步骤S305,否则执行步骤S306;
S305:获取网址输入控件的键值Value作为网址,如图7所示,本实施例中,在IE11浏览器的特征库中查找名称“使用百度搜索查找网址和搜索”,并获取其网址输入控件的键值Value,即图7所示的LegacyIAccessible.Value的值https://www.baidu.com/?tn=98012088_5_dg&ch=12作为网址,接着,执行步骤S307;
S306:对浏览器的特征库中获取不到网址输入控件的情况,则表示浏览器的特征库中未存储过所访问的网址,换言之,表示该浏览器未曾浏览过该网页;在此情况下,根据步骤S104的方法,获取当前浏览器的标题控件及网址输入控件,并获取访问的网址输入控件的键值Value作为访问的网址,并将标题控件及网址输入控件存储于浏览器的特征库中;
S307:获取IE11浏览器第一层控件名称的键值Name作为网址的标题:如图8所示,获取名称Name的键值“百度一下,你就知道-Internet Explorer”,即为标题。
S308:经过时间间隔t后,键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,时间间隔t为大于0的正整数;本实施例中,时间间隔t为2秒;
S309:累计时长T=T+t,执行步骤S400;
S310:输出网址、网址的标题及累计时长T并将累计时长T置为0;即,如果当前网址和先前的网址不一样,则表明用户已经离开先前的网址并访问不同的网址;此时,输出先前访问的网址、网址的标题及累计时长T,并将累计时长T置为0,以便统计当前访问的网址的累计时长T。
S400:是否停止获取网址及累计时长,如果是,执行步骤S500,否则,执行步骤S300。
S500:输出网址、网址的标题及累计时长。
应当理解的是,本发明不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (3)
1.一种实时监控多种浏览器网页浏览记录的方法,其特征在于包括以下步骤:
S100:配置多种类型浏览器的特征库,包括以下步骤:
S101:运行窗口结构查看工具;
S102:打开任一类型浏览器并浏览任意网页;
S103:利用所述窗口结构查看工具查找所述类型浏览器的窗体;
S104:获取所述类型浏览器的标题控件及网址输入控件,并将所述标题控件及所述网址输入控件存储于所述类型浏览器的特征库中;
S105:是否配置完所有类型浏览器的特征库,如果是,执行步骤S200,否则,执行步骤S102;
S200:将所述类型浏览器访问网址的累计时长T赋初值0,其中,T为大于0的正整数;
S300:获取所述类型浏览器访问的所述网址、所述网址的标题及所述累计时长,包括以下步骤:
S301:获取前台窗体的进程号PID;
S302:根据所述前台窗体的所述进程号PID,在进程列表中匹配所述进程号PID对应的所述类型浏览器;
S303:是否匹配到所述类型浏览器,如果是,执行步骤S304,否则执行步骤S301;
S304:判断所述类型浏览器的特征库中是否获取到所述网址输入控件,如果是,执行步骤S305,否则,执行步骤S306;
S305:获取所述网址输入控件的键值Value作为所述网址,执行步骤S307;
S306:获取所述网址输入控件中各层控件的信息,并获取所述网址输入控件的键值Value作为所述网址;
S307:获取所述浏览器第一层控件名称的键值Name作为所述网址的标题;
S308:经过时间间隔t后,所述键值Value是否保持不变,如果是,执行步骤S309,否则,执行步骤S310;其中,t为大于0的正整数;
S309:所述累计时长T=T+t,执行步骤S400;
S310:输出所述网址、所述网址的标题及所述累计时长T,并将所述累计时长T置为0;
S400:是否停止获取所述网址、所述网址的标题及所述累计时长,如果是,执行步骤S500,否则,执行步骤S300;
S500:输出所述网址、网址的标题及所述累计时长。
2.根据权利要求1所述的一种实时监控多种浏览器网页浏览记录的方法,其特征在于,所述浏览器特征库还包括标题控件及网址输入控件的各自的层级及位置信息、类型信息及名称信息。
3.根据权利要求1所述的一种实时监控多种浏览器网页浏览记录的方法,其特征在于,所述时间间隔t为2秒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710928194.5A CN107797906B (zh) | 2017-10-09 | 2017-10-09 | 一种实时监控多种浏览器网页浏览记录的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710928194.5A CN107797906B (zh) | 2017-10-09 | 2017-10-09 | 一种实时监控多种浏览器网页浏览记录的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107797906A CN107797906A (zh) | 2018-03-13 |
CN107797906B true CN107797906B (zh) | 2020-10-13 |
Family
ID=61532977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710928194.5A Active CN107797906B (zh) | 2017-10-09 | 2017-10-09 | 一种实时监控多种浏览器网页浏览记录的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107797906B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499071A (zh) * | 2008-01-30 | 2009-08-05 | 国际商业机器公司 | 创建和使用用户定制的统一资源定位符的设备和方法 |
CN103324673A (zh) * | 2013-05-23 | 2013-09-25 | 中国科学院计算机网络信息中心 | 一种互联网用户行为数据的采集方法 |
CN103544325A (zh) * | 2013-11-11 | 2014-01-29 | 北京国双科技有限公司 | 用于网页页面点击分布的数据处理方法和装置 |
CN103559203A (zh) * | 2013-10-08 | 2014-02-05 | 北京奇虎科技有限公司 | 网页排序方法、装置和系统 |
CN103970803A (zh) * | 2013-02-05 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 浏览器访问提示方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140024335A1 (en) * | 2012-07-17 | 2014-01-23 | Chidopi Co., Ltd. | Methods for collecting usage information of portable devices, and utilizing methods and platforms thereof |
-
2017
- 2017-10-09 CN CN201710928194.5A patent/CN107797906B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499071A (zh) * | 2008-01-30 | 2009-08-05 | 国际商业机器公司 | 创建和使用用户定制的统一资源定位符的设备和方法 |
CN103970803A (zh) * | 2013-02-05 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 浏览器访问提示方法和系统 |
CN103324673A (zh) * | 2013-05-23 | 2013-09-25 | 中国科学院计算机网络信息中心 | 一种互联网用户行为数据的采集方法 |
CN103559203A (zh) * | 2013-10-08 | 2014-02-05 | 北京奇虎科技有限公司 | 网页排序方法、装置和系统 |
CN103544325A (zh) * | 2013-11-11 | 2014-01-29 | 北京国双科技有限公司 | 用于网页页面点击分布的数据处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107797906A (zh) | 2018-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6460060B1 (en) | Method and system for searching web browser history | |
US7814083B2 (en) | Method and system for supporting information access and record media therefor | |
JP4906672B2 (ja) | ウェブアプリケーションの処理記録方法および処理記録装置 | |
US8276061B2 (en) | Marking and annotating electronic documents | |
CN102368245B (zh) | 相关网站的确定和显示 | |
US8095644B2 (en) | System and method for analyzing web paths | |
US10339197B2 (en) | Method and system for bookmarking a webpage | |
JP2013508807A (ja) | インターネットナビゲーションページを生成する方法および装置 | |
US20150012987A1 (en) | Multi-account login method and apparatus | |
US20060059133A1 (en) | Hyperlink generation device, hyperlink generation method, and hyperlink generation program | |
WO2002100034A1 (en) | System and process for testing an application | |
US8584001B2 (en) | Managing bookmarks in applications | |
US9251281B2 (en) | Web browsing using placemarks and contextual relationships in a data processing system | |
US20110029559A1 (en) | Method, apparatus, and program for extracting relativity of web pages | |
US20200293592A1 (en) | Methods and systems for browser extension used to generate relative xpath, absolute xpath and/or css selectors | |
EP2933731A1 (en) | Method for configuring browser bookmarks, device and terminal thereof | |
US20020191015A1 (en) | Method and apparatus for managing history logs in a data processing system | |
EP1895740B2 (en) | Structured data support using metadata and a type library in a control system | |
CN107797906B (zh) | 一种实时监控多种浏览器网页浏览记录的方法 | |
KR101681851B1 (ko) | 웹 브라우저 동작 방법 및 시스템 | |
KR102624680B1 (ko) | 이종 데이터를 통합하기 위한 매쉬업 방법 및 그 장치 | |
KR100614931B1 (ko) | 웹 응용프로그램의 취약점 분석 장치 및 방법 | |
KR20030051577A (ko) | 검색사이트의 검색결과 표시방법 | |
WO2021049272A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN107181800B (zh) | 一种状态监测媒体数据的Web实时共享实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Liang Xiaoning Inventor after: Zuo Yu Inventor after: Lei Ke Inventor before: Liang Xiaoning Inventor before: Lei Ke |
|
GR01 | Patent grant | ||
GR01 | Patent grant |