CN109857958A

CN109857958A - 一种http输入点查找的方法

Info

Publication number: CN109857958A
Application number: CN201910116161.XA
Authority: CN
Inventors: 范丙华
Original assignee: Hangzhou Xiaodao Technology Co Ltd
Current assignee: Hangzhou Xiaodao Technology Co Ltd
Priority date: 2019-02-13
Filing date: 2019-02-13
Publication date: 2019-06-07
Anticipated expiration: 2039-02-13
Also published as: CN109857958B

Abstract

本发明涉及一种互联网方法，具体是一种http输入点查找的方法，所述方法包括：从访问请求中提取到HTTP报文；根据HTTP报文中请求方法划分为GET型HTTP报文输入点查找和POST型HTTP报文输入点查找；对于GET型的请求，查找url或body中自定义字段来提取到输入点，对于POST型的请求，依据不同的content‑type，查找到对应的输入点。本发明可通过树型结构解析Content‑type为application/json和application/xml格式的深层属性作为输入点，并且支持HTTP请求头(含自定义头)输入点查找，以满足输入点全覆盖。

Description

一种http输入点查找的方法

技术领域

本发明涉及一种互联网方法，具体是一种http输入点查找的方法。

背景技术

市面上部分产品运用的技术是查找URL输入点和Content-type为application/x-www-form-urlencoded的输入点。

另外部分产品会运用技术查找特征Content-type为application/json和Content-type为application/xml输入点，但是不能解析深层属性作为输入点，也不能解决HTTP自定义头的输入点查找。

发明内容

本发明的目的在于提供一种http输入点查找的方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种http输入点查找的方法，所述方法包括：从访问请求中提取到HTTP报文；根据HTTP报文中请求方法划分为GET型HTTP报文输入点查找和POST型HTTP报文输入点查找；对于GET型的请求，查找url或body中自定义字段来提取到输入点，对于POST型的请求，依据不同的content-type，查找到对应的输入点。

作为本发明进一步的方案：所述的从访问请求中提取到HTTP报文方式为：获取web站点中的url，访问url，从中获取对应的http报文。

作为本发明进一步的方案：所述的GET型的请求，查找url或body中自定义字段来提取到输入点方式为：针对不同的输入点，使用不同的算法来提取。

作为本发明进一步的方案：所述针对不同的输入点，使用不同的算法来提取的内容包括：(1)参数值：对http报文数据进行正则匹配，过滤出URL中“？”后面的数据，并对过滤后的数据以“&”进行分割，进而以key-value的形式，提取出该输入点；(2)自定义头部：遍历HTTP报文的所有头部，与HTTP协议中定义的头部进行对比，若不在HTTP协议定义的头部，则提取该头部的值视为输入点。

作为本发明进一步的方案：所述的POST型的请求，依据不同的content-type，查找到对应的输入点。

作为本发明进一步的方案：所述依据不同的content-type，查找到对应的输入点的方法如下：

Content-type为application/json，提取出HTTP报文中请求内容值，这里含有两个输入点：一个输入点将整个请求内容作为输入点；另一个输入点利用python中json解析器将json数据转化为dict数据p，迭代数据p，得到value值v，对v进行判断，若为string类型，则作为输入点，若为dict格式，递归迭代，直到数据类型为string，并将其作为输入点。

作为本发明进一步的方案：所述Content-type为multipart/form-data，以？s:\r\n--.*规则对HTTP报文进行正则匹配，记录匹配值p1，再对此报文以--.*正则匹配，得到匹配值p2，将p1以p2为节点分割，得到数组p3，迭代p3，对每个值以\r\n\r\n.*规则进行正则匹配，匹配的值作为输入点。

作为本发明进一步的方案：所述Content-type为application/x-www-form-urlencoded，提取出HTTP报文中请求内容值，以&作为节点分割，得到数组p，迭代p，对每个元素再以＝分割，得到数组p2，取出数组中第二个元素a，a就为输入点。

作为本发明再进一步的方案：所述Content-type为application/xml或text/xml，提取出HTTP报文中请求内容值，这里含有两个输入点:一个输入点是将整个请求内容值作为输入点；另一个输入点采用树型结构，将根标签作为根节点，属性、元素、子标签作为子节点，递归形成一颗树，取出所有的叶子节点作为输入点。

与现有技术相比，本发明的有益效果是：本发明可通过树型结构解析Content-type为application/json和application/xml格式的深层属性作为输入点，并且支持HTTP请求头(含自定义头)输入点查找，以满足输入点全覆盖。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：一种http输入点查找的方法，所述方法包括：从访问请求中提取到HTTP报文；根据HTTP报文中请求方法划分为GET型HTTP报文输入点查找和POST型HTTP报文输入点查找；对于GET型的请求，查找url或body中自定义字段来提取到输入点，对于POST型的请求，依据不同的content-type，查找到对应的输入点。

实施例2：一种http输入点查找的方法，所述方法包括：从访问请求中提取到HTTP报文；根据HTTP报文中请求方法划分为GET型HTTP报文输入点查找和POST型HTTP报文输入点查找；对于GET型的请求，查找url或body中自定义字段来提取到输入点，对于POST型的请求，依据不同的content-type，查找到对应的输入点，所述的从访问请求中提取到HTTP报文方式为：获取web站点中的url，访问url，从中获取对应的http报文。

实施例3：在实施例1或2的基础上，所述的GET型的请求，查找url或body中自定义字段来提取到输入点方式为：针对不同的输入点，使用不同的算法来提取。

实施例4：在实施例3的基础上，所述针对不同的输入点，使用不同的算法来提取的内容包括：(1)参数值：对http报文数据进行正则匹配，过滤出URL中“？”后面的数据，并对过滤后的数据以“&”进行分割，进而以key-value的形式，提取出该输入点；(2)自定义头部：遍历HTTP报文的所有头部，与HTTP协议中定义的头部进行对比，若不在HTTP协议定义的头部，则提取该头部的值视为输入点。

实施例5：在实施例4的基础上，：所述的POST型的请求，依据不同的content-type，查找到对应的输入点。

所述依据不同的content-type，查找到对应的输入点的方法如下：

所述Content-type为multipart/form-data，以？s:\r\n--.*规则对HTTP报文进行正则匹配，记录匹配值p1，再对此报文以--.*正则匹配，得到匹配值p2，将p1以p2为节点分割，得到数组p3，迭代p3，对每个值以\r\n\r\n.*规则进行正则匹配，匹配的值作为输入点。

所述Content-type为application/x-www-form-urlencoded，提取出HTTP报文中请求内容值，以&作为节点分割，得到数组p，迭代p，对每个元素再以＝分割，得到数组p2，取出数组中第二个元素a，a就为输入点。

所述Content-type为application/xml或text/xml，提取出HTTP报文中请求内容值，这里含有两个输入点:一个输入点是将整个请求内容值作为输入点；另一个输入点采用树型结构，将根标签作为根节点，属性、元素、子标签作为子节点，递归形成一颗树，取出所有的叶子节点作为输入点。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种http输入点查找的方法，其特征在于，所述方法包括：从访问请求中提取到HTTP报文；根据HTTP报文中请求方法划分为GET型HTTP报文输入点查找和POST型HTTP报文输入点查找；对于GET型的请求，查找url或body中自定义字段来提取到输入点，对于POST型的请求，依据不同的content-type，查找到对应的输入点。

2.根据权利要求1所述的http输入点查找的方法，其特征在于，所述的从访问请求中提取到HTTP报文方式为：获取web站点中的url，访问url，从中获取对应的http报文。

3.根据权利要求1所述的http输入点查找的方法，其特征在于，所述的GET型的请求，查找url或body中自定义字段来提取到输入点方式为：针对不同的输入点，使用不同的算法来提取。

4.根据权利要求3所述的http输入点查找的方法，其特征在于，所述针对不同的输入点，使用不同的算法来提取的内容包括：(1)参数值：对http报文数据进行正则匹配，过滤出URL中“？”后面的数据，并对过滤后的数据以“&”进行分割，进而以key-value的形式，提取出该输入点；(2)自定义头部：遍历HTTP报文的所有头部，与HTTP协议中定义的头部进行对比，若不在HTTP协议定义的头部，则提取该头部的值视为输入点。

5.根据权利要求1所述的http输入点查找的方法，其特征在于，所述的POST型的请求，依据不同的content-type，查找到对应的输入点。

6.根据权利要求5所述的http输入点查找的方法，其特征在于，所述依据不同的content-type，查找到对应的输入点的方法如下：

7.根据权利要求5所述的http输入点查找的方法，其特征在于，所述Content-type为multipart/form-data，以？s:\r\n--.*规则对HTTP报文进行正则匹配，记录匹配值p1，再对此报文以--.*正则匹配，得到匹配值p2，将p1以p2为节点分割，得到数组p3，迭代p3，对每个值以\r\n\r\n.*规则进行正则匹配，匹配的值作为输入点。

8.根据权利要求5所述的http输入点查找的方法，其特征在于，所述Content-type为application/x-www-form-urlencoded，提取出HTTP报文中请求内容值，以&作为节点分割，得到数组p，迭代p，对每个元素再以＝分割，得到数组p2，取出数组中第二个元素a，a就为输入点。

9.根据权利要求5所述的http输入点查找的方法，其特征在于，所述Content-type为application/xml或text/xml，提取出HTTP报文中请求内容值，这里含有两个输入点:一个输入点是将整个请求内容值作为输入点；另一个输入点采用树型结构，将根标签作为根节点，属性、元素、子标签作为子节点，递归形成一颗树，取出所有的叶子节点作为输入点。