CN109189642A - 基于插件的应用系统业务行为特征获取方法及监控系统 - Google Patents
基于插件的应用系统业务行为特征获取方法及监控系统 Download PDFInfo
- Publication number
- CN109189642A CN109189642A CN201811025110.8A CN201811025110A CN109189642A CN 109189642 A CN109189642 A CN 109189642A CN 201811025110 A CN201811025110 A CN 201811025110A CN 109189642 A CN109189642 A CN 109189642A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- plug
- application system
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开一种基于插件的应用系统业务特征获取方法及业务监控系统,通过浏览器插件捕捉用户在客户端的业务操作行为,总结出用户对应用系统每个业务操作的行为特征,在业务监测分析系统中,不需在WEB服务器上部署任何应用程序,通过在网络流量数据中根据这些行为特征分析出用户在客户端做了哪些业务操作行为。本发明可以自动高效地提供用户对应用系统客户端操作行为的数据采集功能,由于采用了客户端浏览器插件和服务器端旁路流量采集机制,使得系统可以高效、精准的获取用户在应用系统上的对应用功能的操作行为及状态。
Description
技术领域
本发明公开了一种基于插件机制的应用系统操作行为特征的获取方法,属于计算机领域。
背景技术
在WEB系统中,系统的使用性能,包括WEB服务器的性能、客户端浏览器系统的性能、WEB应用程序的性能都可以实时监测,但缺乏WEB系统的用户对应用系统业务操作行为的有效鉴别手段。
浏览器插件技术
插件是一种遵循一定规范的应用程序接口编写出来的程序。很多软件都有插件,插件有很多种。例如在IE中,安装相关的插件后,WEB浏览器能够直接调用插件程序,用于处理特定类型的功能,IE浏览器插件会随着IE浏览器的启动自动执行的程序。
浏览器辅助技术
浏览器辅助是微软推出的作为浏览器对第三方程序员开放交互接口的业界标准,通过相应的代码就可以进入浏览器领域的“交互接口”(INTERACTIVED Interface)。通过这个接口,程序员可以编写代码获取浏览器的行为,比如“后退”、“前进”、“当前页面”等。
通过浏览器插件获取用户在应用系统的业务行为特征有以下优点:
数据全面,一个插件程序就可以对客户端浏览器操作行为进行检测,插件程序可以捕捉用户在浏览器上的操作行为,包含用户的操作事件及页面交互数据。
实时性好,插件程序实时监测浏览器进程,用户在浏览器上的操作页面数据,插件能实时进行解析记录并保存到数据服务器。
检测手段专业,有效地解决一般只能使用在所有用户客户端安装采集程序的方式,来监控用户对应用系统的业务行为,这种方式影响用户的操作性能及安全,创新地用网络流量方式来监控分析用户的业务行为。
发明内容
本发明针对用户对WEB应用系统业务行为监控与分析手段存在的不足,提出了一种基于浏览器插件机制的高效、精确,通过客户端对用户业务行为页面数据的采集,分析获取应用系统业务行为的特征数据的方法,通过该方法,可以建立一套针对应用系统的业务监控系统。
本发明具体采用如下技术方案:
一种基于浏览器插件的应用系统业务特征获取方法,其特征在于包括如下步骤:
(一)分析插件捕捉用户对浏览器的所有操作事件;
(二)分析插件对捕捉到的操作事件进行解析;
(三)从解析结果中选择可以标识相应页面的页面特征数据,并保存到页面特征数据库;
(四)采集应用系统服务器端的业务流量数据并解析,将解析得到的业务流量关键数据与页面特征数据库中的数据作比对,确定用户的业务行为。
一种基于浏览器插件的应用系统业务监控系统,其特征在于包括:
页面数据拦截模块,用于捕捉用户对浏览器的所有操作事件;
页面特征解析模块,用于对捕捉到的操作事件进行解析,获取与页面相关的特征信息;
特征数据选择模块,用于从解析结果中选择可以标识相应页面的页面特征数据;
特征数据存储模块,用于存储页面特征数据;
特征识别模块,用于将采集到的业务流量关键数据与存储的页面特征数据做比对,确定用户的业务行为。
本发明通过浏览器插件捕捉用户在客户端的业务操作行为,总结出用户对应用系统每个业务操作的行为特征,在业务监测分析系统中,不需在WEB服务器上部署任何应用程序,通过在网络流量数据中根据这些行为特征分析出用户在客户端做了哪些业务操作行为。
本发明的优点在于:可以自动高效地提供用户对应用系统客户端操作行为的数据采集功能,由于采用了客户端浏览器插件和服务器端旁路流量采集机制,使得系统可以高效、精准的获取用户在应用系统上的对应用功能的操作行为及状态。
附图说明
图1是应用系统物理架构图;
图2是本明流程图。
具体实施方式
浏览器用户业务操作行为数据具有分布广、格式多样、非结构化等大数据的典型特点,若要对这些数据进行分析,需要有针对性地进行采集、分析和存储。
应用系统的业务监控系统由Microsoft Visual C++开发,系统的主要组成部分包括:页面数据拦截
通过IE浏览器开放的接口,利用浏览器插件实现。将分析插件安装到浏览器中,用户打开IE浏览器后,分析插件被IE浏览器加载运行,插件运行后,用户对浏览器的所有操作事件,都被分析插件捕捉。通过分析插件和IE浏览器接口的挂接,浏览器对页面的加载过程所产生的消息及数据,实时的传递给分析插件
页面特征解析
分析插件程序通过对浏览器页面数据的解析,可以捕获到有意义的与页面相关的特征信息。解析可以用已有的工具库,也可以对页面内容直接做逐行分析来解析。
与页面相关的特征信息一般有:URL,用户信息标识,系统信息,标签信息,关键数据等。页面被解析后,分析插件会将页面关键数据展示到对话框窗口,分析人员在这些数据中选择可以标识该页面的特征数据,保存到页面特征数据库中。在用户操作浏览器时,通过采集应用系统服务器端的业务流量数据,分析人员将流量数据与页面特征数据库中的特征项做比对,就可以通过流量数据确定用户在应用系统的页面动作,从而确定用户的业务行为,完成对应用系统的业务监控与分析。
一般的静态页面,每个页面对应不同的URL,通过URL能反推用户操作的页面,但对于动态页面,则不能通过URL确定页面操作,现在大多数的企业应用系统都是基于业务的复杂动态页面,所以必须结合对页面数据解析,通过提取页面关键特征数据,确定用户操作的页面,确定用户的业务行为。
特征数据存储
分析人员在这些被解析的业务页面数据中选择可以标识该页面的特征数据,比如一些页面数据里包含应用系统业务节点的名称,并且该名称具有唯一性,分析人员选择特征项及数据后,插件程序将这些特征项及对应的业务节点名称发送到后端服务器上的MySQL数据库进行存储。
数据存储的内容:业务节点特征表
这个表里面存放的是用户在访问应用系统时所产生的特征数据。表里面的数据主要包括业务节点名称、访问的时间戳、访问的URL、用户标识信息、作为特征项的页面标签及标签文本。业务节点特征表的内容可以由分析员通过浏览器插件提供的接口进行查询、维护,不需要直接进行数据库操作。
流量旁路采集
流量旁路采集一般是指通过交换机等网络设备的“端口镜像”功能来复制通过应用系统WEB服务器的网络流量数据。这种方式部署起来比较灵活方便,只需要在交换机上面配置镜像端口即可,不会影响现有的网络结构。旁路模式分析的是镜像端口拷贝过来的数据,对原始传递的数据包不会造成延时,不会对网速造成任何影响。旁路流量采集设备一旦故障或者停止运行,不会影响现有网络。
业务行为解析
业务识别、业务关联、用户行为关联
即分析用户所做的业务操作,对业务操作数据根据相关性采用一定的算法进行分析整理,如统计某个URL页面总共点击频率,某个动作的平均响应时间,某用户经常访问的页面等,也可以根据自定义规则来分析某个流程的完成度等。这些数据通过外部接口方式提供给行为数据的使用方进行二次分析。
业务系统监控
通过对旁路流量根据业务特征数据的解析,就可以获取用户的业务行为,从而可以实现应用系统业务情况的统计分析,比如:
用户访问情况统计:
用户视角监控功能,提供对每一个用户及其行为活动的监测,对真实用户动作进行分析。实时分析每一个用户的每一个交易,测量用户交易对基础平台影响及系统资源的耗用情况,以便有针对性的对资源分配、调度及优化进行数据支撑。快速识别用户行为模式、预测发展趋势并迅速做出反映。建立业务活动与用户的关联关系,实现业务与用户的绑定。
功能模块访问情况:
跟踪应用系统功能使用真实情况,记录每一个业务功能调用次数、响应时间、错误率,自动检测业务活动瓶颈,检测出业务交易何时未按预期工作,确保所有的系统应用都能提供出色的性能和用户体验;真实反映出应用系统功能模块的使用频度及高峰时段,为资源分配优化及服务部署优化提供数据支撑。
业务流程监控:
以业务流程监控为出发点,基于建立的完整业务流程,跟踪业务流程中各流程节点的业务处理情况,监控业务单据流转情况(如:每日发起单据数、单据流转时长、每个环节的单据数、每个环节的流转时长),为业务流程的持续优化提供数据依据。
本发明基于浏览器插件的应用系统业务监控系统包括:
页面数据拦截模块:用于捕捉用户对浏览器的所有操作事件;
页面特征解析模块:用于对捕捉到的操作事件进行解析,获取与页面相关的特征信息;
特征数据选择模块:用于从解析结果中选择可以标识相应页面的页面特征数据;
特征数据存储模块:用于存储页面特征数据;
业务流量数据旁路采集模块:用于采集应用系统服务器端的业务流量数据;
业务流量数据解析模块:用于对应用系统服务器端的业务流量数据进行解析,获取关键数据信息;
特征识别模块:用于将业务流量关键数据与存储的页面特征数据做比对,确定用户的业务行为。
本发明涉及的插件系统支持Windows平台,采集的页面特征数据存储服务器使用Mysql数据库。通过执行插件安装程序完成系统的安装与部署。
插件开发,利用VC++插件开发工具,开发出具有业务特征采集、存储功能的浏览器数据采集插件(本文称为分析插件),并打包成可以进行注册的插件包。
插件的基本功能:
1.基于浏览器辅助对象功能,可实时捕捉浏览器事件;
2.可对浏览器页面进行解析;
3.提供对话框,标识页面特征数据;
4.可保存业务特征数据。
插件注册,登录到系统用户控制台,通过插件升级服务,将插件包添加到系统,对同一类型的插件包可以查询升级历史。
插件配置,对已经部署的浏览器数据采集插件配置其运行参数。
插件运行,IE浏览器运行时,自动启动业务特征分析插件,插件启动时从数据库获取插件的配置信息。
插件升级,插件升级服务扫描到正在运行的插件有新的版本,可以触发自动或者手动升级。插件管理服务将先停止当前正在运行的插件,从数据库下载对应的插件可执行文件,并重新加载。
插件配置变更,插件配置服务将变更后的配置信息保存到数据库,并通知插件管理服务,插件管理服务下载最新的配置后,调用对应插件的更新配置接口。
插件使用,插件运行后,通过在浏览器客户端访问应用系统,进行业务操作,插件同时解析业务页面数据,并将数据通过对话框进行展示,分析人员从中分析选择该业务的特征数据,并进行保存。
现有的业务监控一般是通过在客户端安装浏览器插件,监控用户对页面的操作,获取对业务系统的操作行为。我们的方法是先用分析插件获取业务特征数据,再在实际的业务应用系统中通过采集网络流量同业务特征数据比对,推定用户的业务操作。采用浏览器插件机制的应用系统业务特征获取系统具有以下的应用创新之处:
可以高效,实时地实现应用系统业务特征的获取,并业务特征数据。
基于获取的业务特征数据,可以实现对应用系统的业务监控
基于浏览器插件机制,可以快速地构建出满足获取浏览器业务操作行为的插件程序。
可以根据用户的要求,动态添加、移除、配置相关的插件。
单独对插件进行升级,不影响系统。
Claims (8)
1.一种基于浏览器插件的应用系统业务特征获取方法,其特征在于包括如下步骤:
(一)分析插件捕捉用户对浏览器的所有操作事件;
(二)分析插件对捕捉到的操作事件进行解析;
(三)从解析结果中选择可以标识相应页面的页面特征数据,并保存到页面特征数据库;
(四)采集应用系统服务器端的业务流量数据并解析,将解析得到的业务流量关键数据与页面特征数据库中的数据作比对,确定用户的业务行为。
2.如权利要求1所述的基于浏览器插件的应用系统业务特征获取方法,其特征在于分析插件和浏览器接口挂接,浏览器对页面的加载过程产生的消息及数据,实时传递给分析插件。
3.如权利要求1所述的基于浏览器插件的应用系统业务特征获取方法,其特征在于页面特征数据主要包括:业务节点名称、访问的时间戳、访问的URL、用户标识信息、标签信息及标签文本。
4.如权利要求1所述的基于浏览器插件的应用系统业务特征获取方法,其特征在于采用流量旁路采集的方式来获取应用系统服务器端的业务流量数据。
5.如权利要求1所述的基于浏览器插件的应用系统业务特征获取方法,其特征在于页面特征数据库以业务节点特征表存放页面特征数据,通过浏览器插件提供的接口对业务节点特征表进行查询、维护,不需要直接进行数据库操作。
6.一种基于浏览器插件的应用系统业务监控系统,其特征在于包括:
页面数据拦截模块,用于捕捉用户对浏览器的所有操作事件;
页面特征解析模块,用于对捕捉到的操作事件进行解析,获取与页面相关的特征信息;
特征数据选择模块,用于从解析结果中选择可以标识相应页面的页面特征数据;
特征数据存储模块,用于存储页面特征数据;
特征识别模块,用于将采集到的业务流量关键数据与存储的页面特征数据做比对,确定用户的业务行为。
7.如权利要求6所述的基于浏览器插件的应用系统业务监控系统,其特征在于还包括业务流量数据旁路采集模块,用于采集应用系统服务器端的业务流量数据。
8.如权利要求6所述的基于浏览器插件的应用系统业务监控系统,其特征在于还包括业务流量数据解析模块,用于对应用系统服务器端的业务流量数据进行解析,获取关键数据信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811025110.8A CN109189642A (zh) | 2018-09-04 | 2018-09-04 | 基于插件的应用系统业务行为特征获取方法及监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811025110.8A CN109189642A (zh) | 2018-09-04 | 2018-09-04 | 基于插件的应用系统业务行为特征获取方法及监控系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109189642A true CN109189642A (zh) | 2019-01-11 |
Family
ID=64914249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811025110.8A Pending CN109189642A (zh) | 2018-09-04 | 2018-09-04 | 基于插件的应用系统业务行为特征获取方法及监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109189642A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112910976A (zh) * | 2021-01-22 | 2021-06-04 | 朱模卿 | 基于浏览器技术的应用数据分析方法、系统和电子设备 |
CN113094419A (zh) * | 2021-04-13 | 2021-07-09 | 上海携宁计算机科技股份有限公司 | 数据分析的系统、方法、客户端及存储介质 |
CN113242255A (zh) * | 2021-05-24 | 2021-08-10 | 深圳市联软科技股份有限公司 | 一种基于企业安全的智能流量分析方法及系统 |
WO2022066848A1 (en) * | 2020-09-24 | 2022-03-31 | Capital One Services, Llc | Systems and methods for decentralized detection of software platforms operating on website pages |
CN114518912A (zh) * | 2022-02-21 | 2022-05-20 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
CN114780164A (zh) * | 2022-02-28 | 2022-07-22 | 深圳开源互联网安全技术有限公司 | 基于浏览器插件筛选网页信息的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886068A (zh) * | 2014-03-20 | 2014-06-25 | 北京国双科技有限公司 | 用于互联网用户行为分析的数据处理方法和装置 |
CN107483622A (zh) * | 2017-09-06 | 2017-12-15 | 广州供电局有限公司 | 基于组件的浏览器操作行为数据采集方法 |
CN108234431A (zh) * | 2016-12-22 | 2018-06-29 | 阿里巴巴集团控股有限公司 | 一种后台登陆行为检测方法和检测服务器 |
CN108429721A (zh) * | 2017-02-15 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 一种网络爬虫的识别方法及装置 |
-
2018
- 2018-09-04 CN CN201811025110.8A patent/CN109189642A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886068A (zh) * | 2014-03-20 | 2014-06-25 | 北京国双科技有限公司 | 用于互联网用户行为分析的数据处理方法和装置 |
CN108234431A (zh) * | 2016-12-22 | 2018-06-29 | 阿里巴巴集团控股有限公司 | 一种后台登陆行为检测方法和检测服务器 |
CN108429721A (zh) * | 2017-02-15 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 一种网络爬虫的识别方法及装置 |
CN107483622A (zh) * | 2017-09-06 | 2017-12-15 | 广州供电局有限公司 | 基于组件的浏览器操作行为数据采集方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022066848A1 (en) * | 2020-09-24 | 2022-03-31 | Capital One Services, Llc | Systems and methods for decentralized detection of software platforms operating on website pages |
US11729247B2 (en) | 2020-09-24 | 2023-08-15 | Capital One Services, Llc | Systems and methods for decentralized detection of software platforms operating on website pages |
US12081613B2 (en) | 2020-09-24 | 2024-09-03 | Capital One Services, Llc | Systems and methods for decentralized detection of software platforms operating on website pages |
CN112910976A (zh) * | 2021-01-22 | 2021-06-04 | 朱模卿 | 基于浏览器技术的应用数据分析方法、系统和电子设备 |
CN113094419A (zh) * | 2021-04-13 | 2021-07-09 | 上海携宁计算机科技股份有限公司 | 数据分析的系统、方法、客户端及存储介质 |
CN113242255A (zh) * | 2021-05-24 | 2021-08-10 | 深圳市联软科技股份有限公司 | 一种基于企业安全的智能流量分析方法及系统 |
CN113242255B (zh) * | 2021-05-24 | 2023-04-07 | 深圳市联软科技股份有限公司 | 一种基于企业安全的智能流量分析方法及系统 |
CN114518912A (zh) * | 2022-02-21 | 2022-05-20 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
CN114518912B (zh) * | 2022-02-21 | 2023-04-25 | 度小满科技(北京)有限公司 | 一种页面加载方法、装置、设备及可读存储介质 |
CN114780164A (zh) * | 2022-02-28 | 2022-07-22 | 深圳开源互联网安全技术有限公司 | 基于浏览器插件筛选网页信息的方法及系统 |
CN114780164B (zh) * | 2022-02-28 | 2023-04-25 | 深圳开源互联网安全技术有限公司 | 基于浏览器插件筛选网页信息的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189642A (zh) | 基于插件的应用系统业务行为特征获取方法及监控系统 | |
US10762110B2 (en) | Method and system for real-time, false positive resistant, load independent and self-learning anomaly detection of measured transaction execution parameters like response times | |
Cherkasova et al. | Automated anomaly detection and performance modeling of enterprise applications | |
Calzarossa et al. | Workload characterization issues and methodologies | |
CN111291384B (zh) | 漏洞扫描方法、装置及电子设备 | |
CN105283866A (zh) | 使用相似频率的优化分析 | |
CN105283851A (zh) | 用于选择跟踪目标的成本分析 | |
CN105283848A (zh) | 用分布式目标来进行应用跟踪 | |
CN105122212A (zh) | 自动化跟踪系统中的周期性优化 | |
CN105122234A (zh) | 使用成本分析来部署跟踪目标 | |
CN101393535B (zh) | 将运行时事件与组件相关联的方法和系统 | |
CN105740042B (zh) | 虚拟机内存的管理方法和管理系统 | |
Jayathilaka et al. | Response time service level agreements for cloud-hosted web applications | |
CN109656792A (zh) | 基于网络调用日志的应用性能分析方法、装置、计算机设备及存储介质 | |
Brünink et al. | Mining performance specifications | |
CN109460307A (zh) | 基于日志埋点的微服务调用跟踪方法及其系统 | |
CN103491165A (zh) | 自动检测屏蔽的通用分布式爬虫系统 | |
US20100082378A1 (en) | Business Process Optimization And Problem Resolution | |
CN107704369A (zh) | 一种操作日志的记录方法、电子设备、存储介质、系统 | |
CN114064144A (zh) | 一种跨应用数据获取的通信插件以及通信方法 | |
CN108089978A (zh) | 一种分析asp.net应用软件性能及故障的诊断方法 | |
CN107707433B (zh) | 一种从网络平台测试业务流程的方法及计算机设备 | |
CN106897387B (zh) | 基于动作模拟的业务探测方法 | |
CN116049138A (zh) | 交易数据的数据追溯方法、追溯装置和追溯系统 | |
Jiang | Automated analysis of load testing results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190111 |