CN115665286B - 接口聚类方法、装置、计算机设备及存储介质 - Google Patents
接口聚类方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN115665286B CN115665286B CN202211672425.8A CN202211672425A CN115665286B CN 115665286 B CN115665286 B CN 115665286B CN 202211672425 A CN202211672425 A CN 202211672425A CN 115665286 B CN115665286 B CN 115665286B
- Authority
- CN
- China
- Prior art keywords
- interface
- analysis result
- result
- analysis
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了接口聚类方法、装置、计算机设备及存储介质。所述方法包括:获取由客户端抓取的网络流量信息;对所述网络流量信息识别URL内容,以得到识别结果;利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;展示所述接口分析结果。通过实施本发明实施例的方法可实现减少接口存储量,提升接口识别准确率。
Description
技术领域
本发明涉及接口处理方法,更具体地说是指接口聚类方法、装置、计算机设备及存储介质。
背景技术
随着数字化时代来临,企业信息化建设不断深入,系统之间接口调用越来越复杂,导致流量越来越大,接口数据量不断激增,用户接口识别准确率不高,企业安全运营面临着严峻的数据安全挑战,运营人员工作压力随之变大。在国家监管要求愈发严格的大背景下,急需有效减少接口数据存储量,较为精准识别用户接口数据,提升接口识别的准确率,进一步加强企业数据安全管理能力。
但是目前的接口聚类方式是通过人工识别用户接口,由人工聚类,接口的识别准确率较低。
因此,有必要设计一种新的方法,实现减少接口存储量,提升接口识别准确率。
发明内容
本发明的目的在于克服现有技术的缺陷,提供接口聚类方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:接口聚类方法,包括:
获取由客户端抓取的网络流量信息;
对所述网络流量信息识别URL内容,以得到识别结果;
利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;
根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;
展示所述接口分析结果。
其进一步技术方案为:所述网络流量信息是通过在客户端预先配置数据采集策略后,根据数据采集策略采集所得的流量数据,其中,所述数据采集策略包括所需采集数据的应用、接口、用户、频率和采集数据量。
其进一步技术方案为:所述对所述网络流量信息识别URL内容,以得到识别结果,包括:
从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;
对所述URL内容进行提取接口数据;
对所述接口数据进行分割和识别,以得到识别结果。
其进一步技术方案为:所述对所述接口数据进行分割和识别,以得到识别结果,包括:
将所述接口数据按照分隔符分割成多个组成部分;
对各个所述组成部分进行类型的识别,以得到识别结果。
其进一步技术方案为:所述利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果,包括:
利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
其进一步技术方案为:所述根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果,包括:
关联所述识别结果与所述分析结果;
判断所述分析结果是否超过设定阈值;
若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;
若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
本发明还提供了接口聚类装置,包括:
流量获取单元,用于获取由客户端抓取的网络流量信息;
识别单元,用于对所述网络流量信息识别URL内容,以得到识别结果;
概率值分析单元,用于利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;
聚类分析单元,用于根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;
展示单元,用于展示所述接口分析结果。
其进一步技术方案为:所述识别单元包括:
数据提取子单元,用于从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;
接口提取子单元,用于对所述URL内容进行提取接口数据;
处理子单元,用于对所述接口数据进行分割和识别,以得到识别结果。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过对流量数据进行采集,并识别出URL路径参数组成类型,利用马尔科夫随机过程概率方法分析计算各组成类型的随机概率值,通过关联URL路径参数组成类型概率值和接口信息进行接口聚类分析,接口分析结果将用列表进行展示,实现减少接口存储量,提升接口识别准确率。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的接口聚类方法的应用场景示意图;
图2为本发明实施例提供的接口聚类方法的流程示意图;
图3为本发明实施例提供的接口聚类方法的子流程示意图;
图4为本发明实施例提供的接口聚类方法的子流程示意图;
图5为本发明实施例提供的接口聚类方法的子流程示意图;
图6为本发明实施例提供的接口聚类装置的示意性框图;
图7为本发明实施例提供的接口聚类装置的识别单元的示意性框图;
图8为本发明实施例提供的接口聚类装置的处理子单元的示意性框图;
图9为本发明实施例提供的接口聚类装置的聚类分析单元的示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的接口聚类方法的应用场景示意图。图2为本发明实施例提供的接口聚类方法的示意性流程图。该接口聚类方法应用于服务器中。该服务器与客户端进行数据交互,实现流量分析结合马尔科夫随机过程计算方法,将客户端采集到的流量在服务器进行解析,利用随机算法得出URL路径参数组成类型的随机概率值,将分析结果提交至服务器统一进行接口聚类分析和展示,以减少接口存储量,提升接口识别准确率。
在本实施例的方法基于客户端的使用,按需合理配置采集策略;资源占用小,高效全面采集解析网络流量;分析路径参数组成类型随机概率,得出随机概率值,支撑接口聚类分析;基于服务器的使用,高效聚类分析接口,减少接口数据存储量,提升接口识别准确度。
图2是本发明实施例提供的接口聚类方法的流程示意图。如图2所示,该方法包括以下步骤S110至S150。
S110、获取由客户端抓取的网络流量信息。
在本实施例中,网络流量信息是通过在客户端预先配置数据采集策略后,根据数据采集策略采集所得的流量数据,其中,所述数据采集策略包括所需采集数据的应用、接口、用户、频率和采集数据量。
具体地,企业在日常业务开展过程中产生的各类数据;在业务系统部署流量探针客户端,配置端口信息与服务器成功建立通讯,执行数据采集策略;根据应用系统实际流量设定数据采集策略,对网络流量进行采集并上传至服务器进行解析;业务系统部署客户端与服务器建立通讯通道,以使得服务器接收客户端采集的数据。
S120、对所述网络流量信息识别URL内容,以得到识别结果。
在本实施例中,识别结果是指网络流量信息中的接口信息,包括接口名称、URL路径参数各组成类型等。
在一实施例中,请参阅图3,上述的步骤S120可包括步骤S121~S123。
S121、从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容。
在本实施例中,URL内容包括用户标识信息,比如用户账号、IP、MAC、浏览器信息等;用户访问时间,访问结果,访问数据、访问次数等;协议字段及内容数据,如HTTP字段名称、字段中对应的信息;应用传输中请求数据和响应数据;应用调用的接口信息和数据;具体地提取方式可参照中国专利CN115426299A,此处不再赘述。
S122、对所述URL内容进行提取接口数据。
在本实施例中,接口数据是指与接口相关的数据,比如应用调用的接口信息和数据。
S123、对所述接口数据进行分割和识别,以得到识别结果。
在一实施例中,请参阅图4,上述的步骤S123可包括步骤S1231~ S1232。
S1231、将所述接口数据按照分隔符分割成多个组成部分;
S1232、对各个所述组成部分进行类型的识别,以得到识别结果。
将接口数据按照分隔符‘/’分割成多个组成部分,对各组成部分进行类型的识别,包括全英文、全数字、数字英文混合、特殊符号等类型进行随机概率分析。
S130、利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果。
在本实施例中,分析结果是指URL路径参数各组成类型的常用字符组成的出现概率。
具体地,利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
通过模型算法分析字母、中文、数字、符号常用字符组成的出现概率,如果出现可聚类的接口,该常用字符组成的随机性较高,如果出现非聚类的接口,该常用字符随机性较低,从而得出各类型随机概率值。
S140、根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果。
在本实施例中,接口分析结果是指确定该接口是否是聚类接口。
在一实施例中,请参阅图5,上述的步骤S140可包括步骤S141~ S144。
S141、关联所述识别结果与所述分析结果;
S142、判断所述分析结果是否超过设定阈值;
S143、若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;
S144、若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
在本实施例中,设定阈值可根据实际情况确定,将关联各类型随机概率值和解析出的接口信息,将概率值与设定阈值进行比较,若概率值超过阈值则认为该接口字符组成随机性较高,能判断为聚类接口,若概率值不超过阈值则认为该接口字符随机性较低,能判断为非聚类接口,从而有效对接口进行聚类分析。
S150、展示所述接口分析结果。
在本实施例中,接口分析结果以列表形式进行展示。
借助客户端采集网络流量,上传至服务器进行解析,识别URL内容,利用马尔科夫随机过程概率方法分析计算出URL路径参数组成类型随机概率值,分析结果提交至服务器统一进行接口聚类分析和结果展示。有效减少接口存储量,提升接口识别准确率,保障企业数据安全合规建设,促进创新技术发展。
借助客户端解析原始HTTP内容,识别URL路径参数组成类型,覆盖面更全面;利用马尔科夫随机过程概率方法分析URL路径参数组成类型随机概率,精准识别用户接口数据,提升接口识别的准确率;改变以往接口数据量大,难以有效聚类,有效减少接口存储数据量的问题
上述的接口聚类方法,通过对流量数据进行采集,并识别出URL路径参数组成类型,利用马尔科夫随机过程概率方法分析计算各组成类型的随机概率值,通过关联URL路径参数组成类型概率值和接口信息进行接口聚类分析,接口分析结果将用列表进行展示,实现减少接口存储量,提升接口识别准确率。
图6是本发明实施例提供的一种接口聚类装置300的示意性框图。如图6所示,对应于以上接口聚类方法,本发明还提供一种接口聚类装置300。该接口聚类装置300包括用于执行上述接口聚类方法的单元,该装置可以被配置于服务器中。具体地,请参阅图6,该接口聚类装置300包括流量获取单元301、识别单元302、概率值分析单元303、聚类分析单元304以及展示单元305。
流量获取单元301,用于获取由客户端抓取的网络流量信息;识别单元302,用于对所述网络流量信息识别URL内容,以得到识别结果;概率值分析单元303,用于利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;聚类分析单元304,用于根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;展示单元305,用于展示所述接口分析结果。
在一实施例中,如图7所示,所述识别单元302包括数据提取子单元3021、接口提取子单元3022以及处理子单元3023。
数据提取子单元3021,用于从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;接口提取子单元3022,用于对所述URL内容进行提取接口数据;处理子单元3023,用于对所述接口数据进行分割和识别,以得到识别结果。
在一实施例中,如图8所示,所述处理子单元3023包括分割模块30231以及识别模块30232。
分割模块30231,用于将所述接口数据按照分隔符分割成多个组成部分;识别模块30232,用于对各个所述组成部分进行类型的识别,以得到识别结果。
在一实施例中,概率值分析单元303,用于利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
在一实施例中,如图9所示,所述聚类分析单元304包括关联子单元3041、判断子单元3042、第一确定子单元3043以及第二确定子单元3044。
关联子单元3041,用于关联所述识别结果与所述分析结果;判断子单元3042,用于判断所述分析结果是否超过设定阈值;第一确定子单元3043,用于若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;第二确定子单元3044,用于若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述接口聚类装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述接口聚类装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种接口聚类方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种接口聚类方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取由客户端抓取的网络流量信息;对所述网络流量信息识别URL内容,以得到识别结果;利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;展示所述接口分析结果。
所述网络流量信息是通过在客户端预先配置数据采集策略后,根据数据采集策略采集所得的流量数据,其中,所述数据采集策略包括所需采集数据的应用、接口、用户、频率和采集数据量。
在一实施例中,处理器502在实现所述对所述网络流量信息识别URL内容,以得到识别结果步骤时,具体实现如下步骤:
从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;对所述URL内容进行提取接口数据;对所述接口数据进行分割和识别,以得到识别结果。
在一实施例中,处理器502在实现所述对所述接口数据进行分割和识别,以得到识别结果步骤时,具体实现如下步骤:
将所述接口数据按照分隔符分割成多个组成部分;对各个所述组成部分进行类型的识别,以得到识别结果。
在一实施例中,处理器502在实现所述利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果步骤时,具体实现如下步骤:
利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
在一实施例中,处理器502在实现所述根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果步骤时,具体实现如下步骤:
关联所述识别结果与所述分析结果;判断所述分析结果是否超过设定阈值;若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
应当理解,在本申请实施例中,处理器502可以是中央处理单元 (CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路 (Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取由客户端抓取的网络流量信息;对所述网络流量信息识别URL内容,以得到识别结果;利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;展示所述接口分析结果。
所述网络流量信息是通过在客户端预先配置数据采集策略后,根据数据采集策略采集所得的流量数据,其中,所述数据采集策略包括所需采集数据的应用、接口、用户、频率和采集数据量。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述网络流量信息识别URL内容,以得到识别结果步骤时,具体实现如下步骤:
从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;对所述URL内容进行提取接口数据;对所述接口数据进行分割和识别,以得到识别结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述接口数据进行分割和识别,以得到识别结果步骤时,具体实现如下步骤:
将所述接口数据按照分隔符分割成多个组成部分;对各个所述组成部分进行类型的识别,以得到识别结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果步骤时,具体实现如下步骤:
利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果步骤时,具体实现如下步骤:
关联所述识别结果与所述分析结果;判断所述分析结果是否超过设定阈值;若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (7)
1.接口聚类方法,其特征在于,包括:
获取由客户端抓取的网络流量信息;
对所述网络流量信息识别URL内容,以得到识别结果;
利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;
根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;
展示所述接口分析结果;
所述对所述网络流量信息识别URL内容,以得到识别结果,包括:
从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;
对所述URL内容进行提取接口数据;
对所述接口数据进行分割和识别,以得到识别结果;
所述利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果,包括:
利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
2.根据权利要求1所述的接口聚类方法,其特征在于,所述网络流量信息是通过在客户端预先配置数据采集策略后,根据数据采集策略采集所得的流量数据,其中,所述数据采集策略包括所需采集数据的应用、接口、用户、频率和采集数据量。
3.根据权利要求1所述的接口聚类方法,其特征在于,所述对所述接口数据进行分割和识别,以得到识别结果,包括:
将所述接口数据按照分隔符分割成多个组成部分;
对各个所述组成部分进行类型的识别,以得到识别结果。
4.根据权利要求1所述的接口聚类方法,其特征在于,所述根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果,包括:
关联所述识别结果与所述分析结果;
判断所述分析结果是否超过设定阈值;
若所述分析结果超过阈值,则确定所述识别结果的接口为聚类接口,以得到接口分析结果;
若所述分析结果不超过阈值,则确定所述识别结果的接口为非聚类接口,以得到接口分析结果。
5.接口聚类装置,其特征在于,包括:
流量获取单元,用于获取由客户端抓取的网络流量信息;
识别单元,用于对所述网络流量信息识别URL内容,以得到识别结果;
概率值分析单元,用于利用马尔科夫随机过程概率方法对所述识别结果进行随机概率值的分析,以得到分析结果;
聚类分析单元,用于根据所述识别结果与所述分析结果进行接口聚类分析,以得到接口分析结果;
展示单元,用于展示所述接口分析结果;
所述识别单元包括:
数据提取子单元,用于从所述网络流量信息中的HTTP内容提取所需要的不同类型数据,以得到URL内容;
接口提取子单元,用于对所述URL内容进行提取接口数据;
处理子单元,用于对所述接口数据进行分割和识别,以得到识别结果;
所述概率值分析单元,用于利用马尔科夫随机过程概率对所述识别结果的URL路径参数各组成类型进行随机概率分析,以得到分析结果。
6.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。
7.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211672425.8A CN115665286B (zh) | 2022-12-26 | 2022-12-26 | 接口聚类方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211672425.8A CN115665286B (zh) | 2022-12-26 | 2022-12-26 | 接口聚类方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115665286A CN115665286A (zh) | 2023-01-31 |
CN115665286B true CN115665286B (zh) | 2023-03-28 |
Family
ID=85022494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211672425.8A Active CN115665286B (zh) | 2022-12-26 | 2022-12-26 | 接口聚类方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115665286B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013130066A1 (en) * | 2012-02-29 | 2013-09-06 | Hewlett-Packard Development Company, L.P. | Network service interface analysis |
CN115189914A (zh) * | 2022-06-09 | 2022-10-14 | 奇安信科技集团股份有限公司 | 网络流量的应用程序编程接口api识别方法和装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102487293B (zh) * | 2010-12-06 | 2014-09-03 | 中国人民解放军理工大学 | 基于网控的卫星通信网异常检测系统 |
CN103678490B (zh) * | 2013-11-14 | 2017-01-11 | 桂林电子科技大学 | 一种基于Hadoop平台的Deep Web查询接口聚类方法 |
US10205627B2 (en) * | 2014-06-24 | 2019-02-12 | Vmware, Inc. | Method and system for clustering event messages |
CN105447204B (zh) * | 2016-01-04 | 2017-12-12 | 北京百度网讯科技有限公司 | 网址识别方法和装置 |
CN105871832B (zh) * | 2016-03-29 | 2018-11-02 | 北京理工大学 | 一种基于协议属性的网络应用加密流量识别方法及其装置 |
CN109766262B (zh) * | 2018-12-15 | 2022-05-06 | 深圳壹账通智能科技有限公司 | 接口数据处理方法、自动化测试方法、装置、设备和介质 |
CN112352412B (zh) * | 2020-09-29 | 2023-06-09 | 山石网科通信技术股份有限公司 | 网络流量处理方法、装置、存储介质及计算机设备 |
WO2022094926A1 (zh) * | 2020-11-06 | 2022-05-12 | 中国科学院深圳先进技术研究院 | 一种加密流量识别方法、系统、终端以及存储介质 |
CN114697068A (zh) * | 2020-12-31 | 2022-07-01 | 华为技术有限公司 | 一种恶意流量识别方法及相关装置 |
CN113360800A (zh) * | 2021-06-03 | 2021-09-07 | 深圳红途科技有限公司 | 无特征数据处理方法、装置、计算机设备及存储介质 |
CN115426299B (zh) * | 2022-10-20 | 2023-03-21 | 深圳红途科技有限公司 | 无特征数据标识方法、装置、计算机设备及存储介质 |
-
2022
- 2022-12-26 CN CN202211672425.8A patent/CN115665286B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013130066A1 (en) * | 2012-02-29 | 2013-09-06 | Hewlett-Packard Development Company, L.P. | Network service interface analysis |
CN115189914A (zh) * | 2022-06-09 | 2022-10-14 | 奇安信科技集团股份有限公司 | 网络流量的应用程序编程接口api识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115665286A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10243967B2 (en) | Method, apparatus and system for detecting fraudulant software promotion | |
CN106294219B (zh) | 一种设备识别、数据处理方法、装置及系统 | |
CN111131320A (zh) | 资产识别方法、装置、系统、介质、和程序产品 | |
CN112765324B (zh) | 一种概念漂移检测方法及装置 | |
CN110807068A (zh) | 换设备用户的识别方法、装置、计算机设备和存储介质 | |
CN111064719B (zh) | 文件异常下载行为的检测方法及装置 | |
EP3292819B1 (en) | Noisy signal identification from non-stationary audio signals | |
CN114785616A (zh) | 数据风险检测方法、装置、计算机设备及存储介质 | |
CN112347100B (zh) | 数据库索引优化方法、装置、计算机设备和存储介质 | |
CN115665286B (zh) | 接口聚类方法、装置、计算机设备及存储介质 | |
CN116074183B (zh) | 一种基于规则引擎的c3超时分析方法、装置及设备 | |
CN110599278A (zh) | 聚合设备标识符的方法、装置和计算机存储介质 | |
CN113297249A (zh) | 慢查询语句的识别和分析、查询语句的统计方法及装置 | |
CN112435045A (zh) | 处理用户反馈信息的方法、装置、存储介质及计算机设备 | |
CN112231696A (zh) | 恶意样本的识别方法、装置、计算设备以及介质 | |
CN112445687A (zh) | 一种计算设备的卡顿检测方法及相关装置 | |
CN112182520A (zh) | 非法账号的识别方法、装置、可读介质及电子设备 | |
CN109214846B (zh) | 信息存储方法和装置 | |
CN113792291B (zh) | 一种受域生成算法恶意软件感染的主机识别方法及装置 | |
CN113946717A (zh) | 一种子图指标特征获得方法、装置、设备及存储介质 | |
JP2018022305A (ja) | 境界値特定プログラム、境界値特定方法および境界値特定装置 | |
CN113014555A (zh) | 一种攻击事件的确定方法、装置、电子设备和存储介质 | |
CN112073360A (zh) | 超文本传输数据的检测方法、装置、终端设备及介质 | |
CN112800003B (zh) | 创建快照的推荐方法、快照创建方法、装置及电子设备 | |
CN113987309B (zh) | 个人隐私数据识别方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |