CN114157648B - 请求匹配规则生成方法及装置、网站服务器和存储介质 - Google Patents
请求匹配规则生成方法及装置、网站服务器和存储介质 Download PDFInfo
- Publication number
- CN114157648B CN114157648B CN202111439281.7A CN202111439281A CN114157648B CN 114157648 B CN114157648 B CN 114157648B CN 202111439281 A CN202111439281 A CN 202111439281A CN 114157648 B CN114157648 B CN 114157648B
- Authority
- CN
- China
- Prior art keywords
- resource
- request
- identification
- rare
- identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000014509 gene expression Effects 0.000 claims abstract description 41
- 238000010276 construction Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供一种请求匹配规则生成方法及装置、网站服务器和存储介质,涉及互联网技术领域。本申请通过提取待归纳URL请求集包括的具有相同请求特征的多个目标URL请求各自的多个请求资源标识,并按照资源标识类别基于所有请求资源标识中的多个罕见资源标识构建至少一个扩展标识区间,使每个扩展标识区间包括的至少一个罕见资源标识对应同一种资源标识类别,接着针对具有罕见资源标识的目标URL请求,采用包括该罕见资源标识的扩展标识区间替换该罕见资源标识,构建待归纳URL请求集的一个目标匹配规则表达式,从而自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
Description
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种请求匹配规则生成方法及装置、网站服务器和存储介质。
背景技术
随着互联网技术的不断发展,HTTP服务的功能与报文结构也变得越发复杂,通常会在HTTP服务的基础上配置多种用于实现特定功能(例如,负载均衡、网站应用级入侵防御系统(Web Application Firewall,WAF)、数据缓存等)的第三方服务。而对第三方服务来说,HTTP服务的请求报文(例如,统一资源定位符(Uniform Resource Locator,URL)请求报文)中往往包含有大量冗余信息(例如,请求资源标识、用于特定目的的随机值、用于实现本地化的特定子域名等),需要配置合适的匹配规则来表征具有特定功能的URL请求报文,以通过配置出的匹配规则识别出第三方服务能够针对性处理的URL请求报文。
但值得注意的是,目前针对第三方服务构建对应的匹配规则时需要由管理员人工编写实现,整体存在规则编辑效率低,人工编辑工作量大,且编辑准确度不高的问题。
发明内容
有鉴于此,本申请的目的在于提供一种请求匹配规则生成方法及装置、网站服务器和存储介质,能够自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请提供一种请求匹配规则生成方法,所述方法包括:
获取待归纳URL请求集,其中所述待归纳URL请求集包括具有相同请求特征的多个目标URL请求;
提取所述待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识;
在提取出的所有请求资源标识中确定多个罕见资源标识;
按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,其中每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识;
针对具有罕见资源标识的目标URL请求,采用包括所述罕见资源标识的扩展标识区间替换该目标URL请求中的所述罕见资源标识,构建所述待归纳URL请求集的一个目标匹配规则表达式。
在可选的实施方式中,所述在提取出的所有请求资源标识中确定多个罕见资源标识的步骤,包括:
在提取出的所有请求资源标识中统计每个请求资源标识的出现频次;
根据各请求资源标识的出现频次对所述所有请求资源标识进行排序,得到对应的标识分布序列,其中所述标识分布序列中各请求资源标识的出现频次呈降序分布;
依次计算所述标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值;
在所述标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识;
将所述标识分布序列中位于所述罕见临界标识之后的剩余请求资源标识作为所述罕见资源标识。
在可选的实施方式中,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数,所述按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间的步骤,包括:
根据多个请求资源标识在所述待归纳URL请求集中的分布级联状况,按照所述资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在所述资源标识树结构处对应一个树节点层级,所有层级的查询参数在所述资源标识树结构处对应同一个树节点层级;
自顶向下地遍历所述资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点;
若判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间;
若判定该树节点的子节点中存在多个目标子节点,则将所述多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
在可选的实施方式中,所述方法还包括:
获取与所述待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式,其中所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种;
将至少一个所述历史匹配规则表达式与所述待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与所述请求特征对应的期望匹配规则表达式。
第二方面,本申请提供一种请求匹配规则生成装置,所述装置包括:
URL请求获取模块,用于获取待归纳URL请求集,其中所述待归纳URL请求集包括具有相同请求特征的多个目标URL请求;
资源标识提取模块,用于提取所述待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识;
罕见标识确定模块,用于在提取出的所有请求资源标识中确定多个罕见资源标识;
标识区间构建模块,用于按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,其中每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识;
匹配规则构建模块,用于针对具有罕见资源标识的目标URL请求,采用包括所述罕见资源标识的扩展标识区间替换该目标URL请求中的所述罕见资源标识,构建所述待归纳URL请求集的一个目标匹配规则表达式。
在可选的实施方式中,所述罕见标识确定模块包括:
出现频次统计子模块,用于在提取出的所有请求资源标识中统计每个请求资源标识的出现频次;
资源标识排序子模块,用于根据各请求资源标识的出现频次对所述所有请求资源标识进行排序,得到对应的标识分布序列,其中所述标识分布序列中各请求资源标识的出现频次呈降序分布;
频次差值计算子模块,用于依次计算所述标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值;
临界标识确定子模块,用于在所述标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识;
罕见标识选取子模块,用于将所述标识分布序列中位于所述罕见临界标识之后的剩余请求资源标识作为所述罕见资源标识。
在可选的实施方式中,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数,所述标识区间构建模块包括:
标识树构建子模块,用于根据多个请求资源标识在所述待归纳URL请求集中的分布级联状况,按照所述资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在所述资源标识树结构处对应一个树节点层级,所有层级的查询参数在所述资源标识树结构处对应同一个树节点层级;
树节点遍历子模块,用于自顶向下地遍历所述资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点;
区间构建子模块,用于若所述树节点遍历子模块判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间;
所述区间构建子模块,还用于若所述树节点遍历子模块判定该树节点的子节点中存在多个目标子节点,则将所述多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
在可选的实施方式中,所述装置还包括:
历史规则获取模块,用于获取与所述待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式,其中所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种;
匹配规则融合模块,用于将至少一个所述历史匹配规则表达式与所述待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与所述请求特征对应的期望匹配规则表达式。
第三方面,本申请提供一种网站服务器,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现前述实施方式中任意一项所述的请求匹配规则生成方法。
第四方面,本申请提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现前述实施方式中任意一项所述的请求匹配规则生成方法。
在此情况下,本申请实施例的有益效果包括以下内容:
本申请在获取到包括具有相同请求特征的多个目标URL请求的待归纳URL请求集后,会相应提取每个目标URL请求的多个请求资源标识,并在提取出的所有请求资源标识中确定多个罕见资源标识,按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,使每个扩展标识区间包括的至少一个罕见资源标识对应同一种资源标识类别,接着针对具有罕见资源标识的目标URL请求,采用包括该罕见资源标识的扩展标识区间替换该目标URL请求中的罕见资源标识,构建待归纳URL请求集的一个目标匹配规则表达式,从而自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的网站服务器的组成示意图;
图2为本申请实施例提供的请求匹配规则生成方法的流程示意图之一;
图3为图2中的步骤S230包括的子步骤的流程示意图;
图4为本申请实施例提供的待归纳URL请求集的请求资源标识组成示意列表;
图5为与图4所示的请求资源标识组成示意列表对应的出现频次分布示意图;
图6为图2中的步骤S240包括的子步骤的流程示意图;
图7为与图4所示的请求资源标识组成示意列表对应的资源标识树结构示意图;
图8为本申请实施例提供的请求匹配规则生成方法的流程示意图之二;
图9为本申请实施例提供的请求匹配规则生成装置的组成示意图之一;
图10为图9中的罕见标识确定模块的组成示意图;
图11为图9中的标识区间构建模块的组成示意图;
图12为本申请实施例提供的请求匹配规则生成装置的组成示意图之二。
图标:10-网站服务器;11-存储器;12-处理器;13-通信单元;100-请求匹配规则生成装置;110-URL请求获取模块;120-资源标识提取模块;130-罕见标识确定模块;140-标识区间构建模块;150-匹配规则构建模块;131-出现频次统计子模块;132-资源标识排序子模块;133-频次差值计算子模块;134-临界标识确定子模块;135-罕见标识选取子模块;141-标识树构建子模块;142-树节点遍历子模块;143-区间构建子模块;160-历史规则获取模块;170-匹配规则融合模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要理解的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
请参照图1,图1是本申请实施例提供的网站服务器10的组成示意图。在本申请实施例中,所述网站服务器10能够自动且快速地针对得到的多个特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。其中,所述多个特定URL请求具有相同请求特征,所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种;所述URL请求层级为对应URL请求中记录的服务器地址之后使用斜线划分的层级数量,其值与斜线数量相同;所述URL请求资源种类为对应URL请求所需返回的资源类型,包括网页、图片、Word文档等;所述URL请求方式种类为对应URL请求实现请求功能的方法类型,包括GET、POST、PUT、DELETE、HEAD等。
在本实施例中,所述网站服务器10可以包括存储器11、处理器12、通信单元13及请求匹配规则生成装置100。所述存储器11、所述处理器12及所述通信单元13各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,所述存储器11、所述处理器12及所述通信单元13这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
在本实施例中,所述存储器11可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,所述存储器11用于存储计算机程序,所述处理器12在接收到执行指令后,可相应地执行所述计算机程序。
在本实施例中,在本实施例中,所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、图形处理器(Graphics Processing Unit,GPU)及网络处理器(NetworkProcessor,NP)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件中的至少一种。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。
在本实施例中,所述通信单元13用于通过网络建立所述网站服务器10与其他终端设备之间的通信连接,并通过所述网络收发数据,其中所述网络包括有线通信网络及无线通信网络。例如,所述网站服务器10通过所述通信单元13向某个终端设备反馈该某个终端设备所请求的资源服务。
在本实施例中,所述请求匹配规则生成装置100包括至少一个能够以软件或固件的形式存储于所述存储器11中或者固化在所述网站服务器10的操作系统中的软件功能模块。所述处理器12可用于执行所述存储器11存储的可执行模块,例如所述请求匹配规则生成装置100所包括的软件功能模块及计算机程序等。所述网站服务器10可通过所述请求匹配规则生成装置100自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
可以理解的是,图1所示的框图仅为所述网站服务器10的一种组成示意图,所述网站服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
在本申请中,为确保所述网站服务器10能够自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度,本申请实施例通过提供一种应用于上述网站服务器10的请求匹配规则生成方法实现前述功能,下面对本申请提供的请求匹配规则生成方法进行详细阐述。
请参照图2,图2是本申请实施例提供的请求匹配规则生成方法的流程示意图之一。在本申请实施例中,图2所示的请求匹配规则生成方法可以包括步骤S210~步骤S250。
步骤S210,获取待归纳URL请求集,其中待归纳URL请求集包括具有相同请求特征的多个目标URL请求。
在本实施例中,所述网站服务器10可按照预设时间间隔地获取该网站服务器10在该预设时间间隔所对应的时间段内记录的多个URL请求,而后各URL请求表现出的请求特征对所述多个URL请求进行分组,得到不同请求特征各自对应的一个需要归纳生成URL匹配规则的待归纳URL请求集,以确保同一待归纳URL请求集包括的多个目标URL请求具有相同请求特征。
步骤S220,提取待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识。
在本实施例中,所述网站服务器10在获取到某个待归纳URL请求集后,可根据该待归纳URL请求集中每个目标URL请求所对应的资源标识类别提取出该目标URL请求存在的多个请求资源标识,其中同一目标URL请求中的每个请求资源标识对应一种资源标识类别,同一目标URL请求所对应的多个请求资源标识相互配合用于表示所述目标URL请求所需资源的具体分布信息。其中,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数。以URL请求“http://username:password@a.example.com:123/pathA/dataA?key=valueA&key2=valueZ#fraqidA”为例,其中“a.example.com”代表该URL请求的服务器地址,“a”即为该URL请求的第一层级服务器地址host_1;“pathA/dataA”代表该URL请求的资源路径,“pathA”即为该URL请求的第一层级资源路径path_1,“dataA”即为该URL请求的第二层级资源路径path_2;“key=valueA&key2=valueZ”代表该URL请求的查询参数,“pathA”即为该URL请求的第一层级查询参数key_1,“valueZ”即为该URL请求的第二层级查询参数key_2。
步骤S230,在提取出的所有请求资源标识中确定多个罕见资源标识。
在本实施例中,所述罕见资源标识用于表示所述待归纳URL请求集中出现频次较少的需要进行匹配规则归纳的资源标识。在本实施例的一种实施方式中,所述网站服务器10可选择某个出现频次阈值作为挑选罕见资源标识的边界条件,将对应出现频次小于该出现频次阈值的请求资源标识作为所述罕见资源标识。
在本实施例的另一种实施方式中,也可根据各请求资源标识的出现频次分布状况,适应性地确定各请求资源标识中属于临界点的出现频次,而后选取对应出现频次小于该临界点的出现频次的请求资源标识作为所述罕见资源标识。
可选地,请参照图3,图3是图2中的步骤S230包括的子步骤的流程示意图。在本实施例中,所述步骤S230可以包括子步骤S231~子步骤S235。
子步骤S231,在提取出的所有请求资源标识中统计每个请求资源标识的出现频次。
在本实施例中,以如下五个目标URL请求“http://username:password@a.example.com:123/path0/data0?key=value0&key2=value9#fraqid1”、“http://username:password@a.example.com:123/path1/data1?key=value1&key2=value8#fraqid1”、“http://username:password@a.example.com:123/path2/data2?key=value2&key2=value7#fraqid1”、“http://username:password@b.example.com:123/pathA/dataA?key=valueA&key2=valueZ#fraqidA”以及“http://username:password@b.example.com:123/pathA/dataB?key=valueB&key2=valueY#fraqidB”为例,这五个目标URL请求各自提取出的请求资源标识即按照图4所示的待归纳URL请求集的请求资源标识组成示意列表进行分布,其中“a”的出现频次为3,“b”与“pathA”的出现频次为2,“path0”、“data0”、“value0”、“value9”、“path1”、“data1”、“value1”、“value8”、“path2”、“data2”、“value2”、“value7”、“dataA”、“valueA”、“valueZ”、“dataB”、“valueB”及“valueY”各自的出现频次为1。
子步骤S232,根据各请求资源标识的出现频次对所有请求资源标识进行排序,得到对应的标识分布序列。
在本实施例中,所述标识分布序列中各请求资源标识的出现频次呈降序分布,即所述标识分布序列中排名靠前的请求资源标识的出现频次往往大于排名靠后的请求资源标识的出现频次,此时前述五个目标URL请求各自提取出的请求资源标识的标识分布序列可按照图5所示的出现频次分布示意图进行表达。
子步骤S233,依次计算标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值。
子步骤S234,在标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识。
在本实施例中,以图5所示的出现频次分布示意图为例,最大频次差值为1,最后一次出现最大频次差值的相邻两个请求资源标识为“pathA”和“path0”,其中出现频次较大的请求资源标识即为“pathA”,由此“pathA”即为上述五个目标URL请求各自提取出的请求资源标识中的罕见临界标识。
子步骤S235,将标识分布序列中位于罕见临界标识之后的剩余请求资源标识作为罕见资源标识。
在本实施例中,以图5所示的出现频次分布示意图为例,当选取“pathA”作为罕见临界标识时,则“path0”、“data0”、“value0”、“value9”、“path1”、“data1”、“value1”、“value8”、“path2”、“data2”、“value2”、“value7”、“dataA”、“valueA”、“valueZ”、“dataB”、“valueB”及“valueY”即为上述五个目标URL请求各自提取出的请求资源标识中的罕见资源标识。
由此,本申请可通过执行上述子步骤S231~子步骤S235,适应性地确定出所述待归纳URL请求集包括的多个罕见资源标识。
步骤S240,按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间。
在本实施例中,每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识。所述网站服务器10可将具有相同资源标识类别的罕见资源标识划分到一起,并将归属于同一资源标识类别的多个罕见资源标识按照字符类型分别进行集成,使同一个扩展标识区间对应一种字符类型的资源标识类别,以通过构建出的扩展标识区间表征该待收纳URL请求集的可调特征内容。
例如,与资源标识类别key_1对应的罕见资源标识包括“value0”、“value1”、“value2”、“valueA”及“valueB”,其中“value0”、“value1”、“value2”属于同一种字符类型1,而“valueA”及“valueB”属于同一种字符类型2,此时可相应构建出与字符类型1的资源标识类别key_1对应的扩展标识区间“value[0-5]”,并构建出与字符类型2的资源标识类别key_1对应的扩展标识区间“value[A-C]”。
可选地,请参照图6,图6是图2中的步骤S240包括的子步骤的流程示意图。在本实施例中,所述步骤S240可以包括子步骤S241~子步骤S244。
子步骤S241,根据多个请求资源标识在待归纳URL请求集中的分布级联状况,按照资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在资源标识树结构处对应一个树节点层级,所有层级的查询参数在资源标识树结构处对应同一个树节点层级。
在本实施例中,所述分布级联状况用于描述对应涉及的多个请求资源标识在同一URL请求中的依次级联递进关系,所述分布级联状况在所述资源标识树结构处将对应表现为父子节点关系。以图7所示的资源标识树结构示意图为例,图7所示的资源标识树结构与图4所示的请求资源标识组成示意列表相匹配,并能够有效表征前述五个目标URL请求中各请求资源标识的分布级联状况。
子步骤S242,自顶向下地遍历资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点。
子步骤S243,若判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间。
子步骤S244,若判定该树节点的子节点中存在多个目标子节点,则将多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
以图7所示的资源标识树结构示意图为例,节点“a”存在三个与path_1对应的目标子节点“path0”、“path1”及““path2”,可将这三个目标子节点“path0”、“path1”及“path2”融合为节点“path[0-2]”,此时可将与path_2对应的节点“data0”、“data1”及“data 2”视为节点“path[0-2]”的三个目标子节点进行融合得到节点“data[0-2]”,此时与key_1对应的节点“value0”、“value1”及“value2”将作为节点“data[0-2]”的三个目标子节点进行融合,得到与key_1对应的节点“value[0-2]”,与key_2对应的节点“value9”、“value8”及“value7”将作为节点“data[0-2]”的三个目标子节点进行融合,得到与key_2对应的节点“value[7-9]”,此时对应构建出的扩展标识区间即为前述融合节点,即与path_1对应的“path[0-2]”、与path_2对应的“data[0-2]”、与key_1对应的“value[0-2]”和与key_2对应的“value[7-9]”。
由此,本申请可通过执行上述子步骤S241~子步骤S244,有效确定用于表征所述待归纳URL请求集的可调特征内容的扩展标识区间。
步骤S250,针对具有罕见资源标识的目标URL请求,采用包括罕见资源标识的扩展标识区间替换该目标URL请求中的罕见资源标识,构建待归纳URL请求集的一个目标匹配规则表达式。
在本实施例中,所述网站服务器10在确定出所述待归纳URL请求集所对应的所有扩展标识区间,可通过在具有罕见资源标识的目标URL请求中采用包括该罕见资源标识的扩展标识区间替换该罕见资源标识的方式,使对应扩展标识区间能够继承该目标URL请求中各请求资源标识之间的分布级联关系,并配合该目标URL请求中剩余请求资源标识,构建出所述待归纳URL请求集的一个目标匹配规则表达式。
在本实施例的一种实施方式中,可在构建完所有扩展标识区间的资源标识树结构的基础上,直接利用该资源标识树结构已记录的各节点之间的父子关系,反向地构建出对应的目标匹配规则表达式。
由此,本申请可通过执行上述步骤S210~步骤S250,自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
可选地,请参照图8,图8是本申请实施例提供的请求匹配规则生成方法的流程示意图之二。在本申请实施例中,与图2所示的请求匹配规则生成方法相比,图8所示的请求匹配规则生成方法还可以包括步骤S260及步骤S270。
步骤S260,获取与待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式。
在本实施例中,所述历史匹配规则表达式与所述待归纳URL请求集的目标匹配规则表达式各自对应的生成时机可仅差一个预设时间间隔。
步骤S270,将至少一个历史匹配规则表达式与待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与请求特征对应的期望匹配规则表达式。
在本实施例中,所述网站服务器10可通过所述步骤S270确保最终构建出的期望匹配规则表达式能够更进一步地表征出具有所述请求特征的特定URL请求需要具备的请求资源标识特征,提升匹配规则表达式的可靠性。
由此,本申请可通过执行上述步骤S260及步骤S270,确保最终构建出的期望匹配规则表达式能够更进一步地表征出具有所述请求特征的特定URL请求需要具备的请求资源标识特征,提升匹配规则表达式的可靠性。
在本申请中,为确保所述网站服务器10能够通过所述请求匹配规则生成装置100执行上述请求匹配规则生成方法,本申请通过对所述请求匹配规则生成装置100进行功能模块划分的方式实现前述功能。下面对本申请提供的请求匹配规则生成装置100的具体组成进行相应描述。
请参照图9,图9是本申请实施例提供的请求匹配规则生成装置100的组成示意图之一。在本申请实施例中,所述请求匹配规则生成装置100可以包括URL请求获取模块110、资源标识提取模块120、罕见标识确定模块130、标识区间构建模块140及匹配规则构建模块150。
URL请求获取模块110,用于获取待归纳URL请求集,其中所述待归纳URL请求集包括具有相同请求特征的多个目标URL请求。
资源标识提取模块120,用于提取所述待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识。
罕见标识确定模块130,用于在提取出的所有请求资源标识中确定多个罕见资源标识。
标识区间构建模块140,用于按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,其中每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识。
匹配规则构建模块150,用于针对具有罕见资源标识的目标URL请求,采用包括罕见资源标识的扩展标识区间替换该目标URL请求中的罕见资源标识,构建待归纳URL请求集的一个目标匹配规则表达式。
可选地,请参照图10,图10是图9中的罕见标识确定模块130的组成示意图。在本实施例中,所述罕见标识确定模块130可以包括出现频次统计子模块131、资源标识排序子模块132、频次差值计算子模块133、临界标识确定子模块134及罕见标识选取子模块135。
出现频次统计子模块131,用于在提取出的所有请求资源标识中统计每个请求资源标识的出现频次。
资源标识排序子模块132,用于根据各请求资源标识的出现频次对所述所有请求资源标识进行排序,得到对应的标识分布序列,其中所述标识分布序列中各请求资源标识的出现频次呈降序分布。
频次差值计算子模块133,用于依次计算所述标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值。
临界标识确定子模块134,用于在所述标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识。
罕见标识选取子模块135,用于将所述标识分布序列中位于所述罕见临界标识之后的剩余请求资源标识作为所述罕见资源标识。
可选地,请参照图11,图11是图9中的标识区间构建模块140的组成示意图。在本实施例中,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数,所述标识区间构建模块140可以包括标识树构建子模块141、树节点遍历子模块142及区间构建子模块143。
标识树构建子模块141,用于根据多个请求资源标识在所述待归纳URL请求集中的分布级联状况,按照所述资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在所述资源标识树结构处对应一个树节点层级,所有层级的查询参数在所述资源标识树结构处对应同一个树节点层级。
树节点遍历子模块142,用于自顶向下地遍历所述资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点。
区间构建子模块143,用于若所述树节点遍历子模块142判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间。
所述区间构建子模块143,还用于若所述树节点遍历子模块142判定该树节点的子节点中存在多个目标子节点,则将所述多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
可选地,请参照图12,图12是本申请实施例提供的请求匹配规则生成装置100的组成示意图之二。在本申请实施例中,所述请求匹配规则生成装置100还可以包括历史规则获取模块160及匹配规则融合模块170。
历史规则获取模块160,用于获取与所述待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式,其中所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种。
匹配规则融合模块170,用于将至少一个所述历史匹配规则表达式与所述待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与所述请求特征对应的期望匹配规则表达式。
需要说明的是,本申请实施例所提供的请求匹配规则生成装置100,其基本原理及产生的技术效果与前述的请求匹配规则生成方法相同。为简要描述,本实施例部分未提及之处,可参考上述的针对请求匹配规则生成方法的描述内容。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,在本申请实施例提供的请求匹配规则生成方法及装置、网站服务器和存储介质中,本申请在获取到包括具有相同请求特征的多个目标URL请求的待归纳URL请求集后,会相应提取每个目标URL请求的多个请求资源标识,并在提取出的所有请求资源标识中确定多个罕见资源标识,按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,使每个扩展标识区间包括的至少一个罕见资源标识对应同一种资源标识类别,接着针对具有罕见资源标识的目标URL请求,采用包括该罕见资源标识的扩展标识区间替换该目标URL请求中的罕见资源标识,构建待归纳URL请求集的一个目标匹配规则表达式,从而自动且快速地针对特定URL请求构建对应的匹配规则,降低规则编辑作业的人力损耗,并有效提高匹配规则准确度。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应当以权利要求的保护范围为准。
Claims (8)
1.一种请求匹配规则生成方法,其特征在于,所述方法包括:
获取待归纳URL请求集,其中所述待归纳URL请求集包括具有相同请求特征的多个目标URL请求;
提取所述待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识;
在提取出的所有请求资源标识中确定多个罕见资源标识;
按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,其中每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数;
针对具有罕见资源标识的目标URL请求,采用包括所述罕见资源标识的扩展标识区间替换该目标URL请求中的所述罕见资源标识,构建所述待归纳URL请求集的一个目标匹配规则表达式;
其中,所述按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间的步骤,包括:
根据多个请求资源标识在所述待归纳URL请求集中的分布级联状况,按照所述资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在所述资源标识树结构处对应一个树节点层级,所有层级的查询参数在所述资源标识树结构处对应同一个树节点层级;
自顶向下地遍历所述资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点;
若判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间;
若判定该树节点的子节点中存在多个目标子节点,则将所述多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
2.根据权利要求1所述的方法,其特征在于,所述在提取出的所有请求资源标识中确定多个罕见资源标识的步骤,包括:
在提取出的所有请求资源标识中统计每个请求资源标识的出现频次;
根据各请求资源标识的出现频次对所述所有请求资源标识进行排序,得到对应的标识分布序列,其中所述标识分布序列中各请求资源标识的出现频次呈降序分布;
依次计算所述标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值;
在所述标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识;
将所述标识分布序列中位于所述罕见临界标识之后的剩余请求资源标识作为所述罕见资源标识。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取与所述待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式,其中所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种;
将至少一个所述历史匹配规则表达式与所述待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与所述请求特征对应的期望匹配规则表达式。
4.一种请求匹配规则生成装置,其特征在于,所述装置包括:
URL请求获取模块,用于获取待归纳URL请求集,其中所述待归纳URL请求集包括具有相同请求特征的多个目标URL请求;
资源标识提取模块,用于提取所述待归纳URL请求集中所有目标URL请求各自包括的多个请求资源标识;
罕见标识确定模块,用于在提取出的所有请求资源标识中确定多个罕见资源标识;
标识区间构建模块,用于按照资源标识类别基于多个罕见资源标识构建匹配的至少一个扩展标识区间,其中每个扩展标识区间对应一种资源标识类别,同一扩展标识区间包括至少一个罕见资源标识,所述资源标识类别包括不同层级的服务器地址、不同层级的资源路径及不同层级的查询参数;
匹配规则构建模块,用于针对具有罕见资源标识的目标URL请求,采用包括所述罕见资源标识的扩展标识区间替换该目标URL请求中的所述罕见资源标识,构建所述待归纳URL请求集的一个目标匹配规则表达式;
其中,所述标识区间构建模块包括:
标识树构建子模块,用于根据多个请求资源标识在所述待归纳URL请求集中的分布级联状况,按照所述资源标识类别构建该待归纳URL请求集的资源标识树结构,其中每个层级的服务器地址与每个资源路径分别在所述资源标识树结构处对应一个树节点层级,所有层级的查询参数在所述资源标识树结构处对应同一个树节点层级;
树节点遍历子模块,用于自顶向下地遍历所述资源标识树结构中的每个树节点,并判断该树节点的子节点中是否存在罕见资源标识所对应的目标子节点;
区间构建子模块,用于若所述树节点遍历子模块判定该树节点的子节点中仅存在一个目标子节点,则单独针对该目标子节点构建一个仅包括该目标子节点的扩展标识区间;
所述区间构建子模块,还用于若所述树节点遍历子模块判定该树节点的子节点中存在多个目标子节点,则将所述多个目标子节点按照资源标识类别进行节点融合,得到包括多个目标子节点的扩展标识区间。
5.根据权利要求4所述的装置,其特征在于,所述罕见标识确定模块包括:
出现频次统计子模块,用于在提取出的所有请求资源标识中统计每个请求资源标识的出现频次;
资源标识排序子模块,用于根据各请求资源标识的出现频次对所述所有请求资源标识进行排序,得到对应的标识分布序列,其中所述标识分布序列中各请求资源标识的出现频次呈降序分布;
频次差值计算子模块,用于依次计算所述标识分布序列中相邻两个请求资源标识的出现频次之间的频次差值;
临界标识确定子模块,用于在所述标识分布序列中选取最后一次出现的最大频次差值所对应的出现频次较大的请求资源标识作为罕见临界标识;
罕见标识选取子模块,用于将所述标识分布序列中位于所述罕见临界标识之后的剩余请求资源标识作为所述罕见资源标识。
6.根据权利要求4或5所述的装置,其特征在于,所述装置还包括:
历史规则获取模块,用于获取与所述待归纳URL请求集具有相同请求特征的至少一个历史匹配规则表达式,其中所述请求特征的特征类型包括URL请求层级、URL请求资源种类、URL请求方式种类中任意一种;
匹配规则融合模块,用于将至少一个所述历史匹配规则表达式与所述待归纳URL请求集的所有目标匹配规则表达式按照资源标识类别进行标识区间融合,得到与所述请求特征对应的期望匹配规则表达式。
7.一种网站服务器,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现权利要求1-3中任意一项所述的请求匹配规则生成方法。
8.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-3中任意一项所述的请求匹配规则生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111439281.7A CN114157648B (zh) | 2021-11-30 | 2021-11-30 | 请求匹配规则生成方法及装置、网站服务器和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111439281.7A CN114157648B (zh) | 2021-11-30 | 2021-11-30 | 请求匹配规则生成方法及装置、网站服务器和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114157648A CN114157648A (zh) | 2022-03-08 |
CN114157648B true CN114157648B (zh) | 2023-11-28 |
Family
ID=80454910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111439281.7A Active CN114157648B (zh) | 2021-11-30 | 2021-11-30 | 请求匹配规则生成方法及装置、网站服务器和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114157648B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426474A (zh) * | 2015-11-18 | 2016-03-23 | 福建星网锐捷网络有限公司 | 统一资源定位符url匹配的方法及装置 |
CN107404392A (zh) * | 2016-05-20 | 2017-11-28 | 中兴通讯股份有限公司 | 统一资源定位符url的调度规则的处理方法及装置 |
CN109561163A (zh) * | 2017-09-27 | 2019-04-02 | 阿里巴巴集团控股有限公司 | 统一资源定位符重写规则的生成方法及装置 |
CN110990205A (zh) * | 2019-11-28 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 接口调用测试方法、装置和计算机可读存储介质 |
CN111859207A (zh) * | 2020-08-04 | 2020-10-30 | 浪潮卓数大数据产业发展有限公司 | 一种基于url规则匹配的网页采集任务自动化分拣方法 |
CN112052413A (zh) * | 2020-08-28 | 2020-12-08 | 上海谋乐网络科技有限公司 | Url模糊匹配方法、装置和系统 |
CN113067743A (zh) * | 2020-01-02 | 2021-07-02 | 中国移动通信有限公司研究院 | 流规则提取方法、装置、系统及存储介质 |
-
2021
- 2021-11-30 CN CN202111439281.7A patent/CN114157648B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426474A (zh) * | 2015-11-18 | 2016-03-23 | 福建星网锐捷网络有限公司 | 统一资源定位符url匹配的方法及装置 |
CN107404392A (zh) * | 2016-05-20 | 2017-11-28 | 中兴通讯股份有限公司 | 统一资源定位符url的调度规则的处理方法及装置 |
CN109561163A (zh) * | 2017-09-27 | 2019-04-02 | 阿里巴巴集团控股有限公司 | 统一资源定位符重写规则的生成方法及装置 |
CN110990205A (zh) * | 2019-11-28 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 接口调用测试方法、装置和计算机可读存储介质 |
CN113067743A (zh) * | 2020-01-02 | 2021-07-02 | 中国移动通信有限公司研究院 | 流规则提取方法、装置、系统及存储介质 |
CN111859207A (zh) * | 2020-08-04 | 2020-10-30 | 浪潮卓数大数据产业发展有限公司 | 一种基于url规则匹配的网页采集任务自动化分拣方法 |
CN112052413A (zh) * | 2020-08-28 | 2020-12-08 | 上海谋乐网络科技有限公司 | Url模糊匹配方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114157648A (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rueda et al. | Robustness comparison of 15 real telecommunication networks: Structural and centrality measurements | |
US10404731B2 (en) | Method and device for detecting website attack | |
CN103685207A (zh) | 跨数据源的数据整合系统、装置及方法 | |
Shi et al. | A social sensing model for event detection and user influence discovering in social media data streams | |
CN110995664B (zh) | 基于区块链的物联网异构标识解析系统及方法 | |
CN111932380B (zh) | 基于大数据的信息处理方法、装置及信息处理共享平台 | |
CN111563560A (zh) | 基于时序特征学习的数据流分类方法及装置 | |
CN114157648B (zh) | 请求匹配规则生成方法及装置、网站服务器和存储介质 | |
CN112784025A (zh) | 一种目标事件的确定方法和装置 | |
CN116842099B (zh) | 一种多源异构数据处理方法和系统 | |
CN106844553A (zh) | 基于样本数据的数据探测和扩充方法及装置 | |
Morichetta et al. | LENTA: Longitudinal exploration for network traffic analysis from passive data | |
CN112532448B (zh) | 网络拓扑处理方法、装置和电子设备 | |
CN112231481A (zh) | 网址的分类方法、装置、计算机设备和存储介质 | |
KR102409160B1 (ko) | 복수개의 커뮤니티를 포함하는 네트워크에서 커뮤니티 재구성 방법 및 이를 위한 전자 장치 | |
CN116362955A (zh) | 图数据存储、访问、处理方法、训练方法、设备及介质 | |
CN113869703A (zh) | 一种基于云计算的智慧城市管理方法及系统 | |
CN113204476A (zh) | 一种用户行为数据安全检测方法 | |
US20200007499A1 (en) | Big-data-based business logic learning method and protection method and apparatuses thereof | |
CN112085589A (zh) | 规则模型的安全性的确定方法、装置和服务器 | |
CN112711480B (zh) | 数据链路解析方法及系统 | |
Morichetta et al. | Clustering and evolutionary approach for longitudinal web traffic analysis | |
CN112214694B (zh) | 可见节点查询方法及装置、终端设备及可读存储介质 | |
CN112380418B (zh) | 一种基于网络爬虫的数据处理方法、系统及云平台 | |
CN117828382B (zh) | 基于url的网络接口聚类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |