CN109462598A - 一种从网络报文中提取账号信息的方法 - Google Patents

一种从网络报文中提取账号信息的方法 Download PDF

Info

Publication number
CN109462598A
CN109462598A CN201811508719.0A CN201811508719A CN109462598A CN 109462598 A CN109462598 A CN 109462598A CN 201811508719 A CN201811508719 A CN 201811508719A CN 109462598 A CN109462598 A CN 109462598A
Authority
CN
China
Prior art keywords
node
condition
rule
type
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811508719.0A
Other languages
English (en)
Other versions
CN109462598B (zh
Inventor
张广兴
景阳
夏可强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Future Networks Innovation Institute
Original Assignee
Jiangsu Future Networks Innovation Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Future Networks Innovation Institute filed Critical Jiangsu Future Networks Innovation Institute
Priority to CN201811508719.0A priority Critical patent/CN109462598B/zh
Publication of CN109462598A publication Critical patent/CN109462598A/zh
Application granted granted Critical
Publication of CN109462598B publication Critical patent/CN109462598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种从网络报文中提取账号信息的方法,属于大数据技术领域,包括制定xml格式文件和按照xml文件中的规则从报文中提取数据,解决了通过定制规则、解读规则、按照规则提取信息的方式,来实现各种应用信息的提取的技术问题,本发明可以有效的使报文分析人员的工作(编写规则)与信息提取人员的工作(解读规则)解耦合,更好的适配用户需求的变更,使提取账号信息装置的修改达到最小化,通过在提取信息前预先标记是否要从该节点中匹配信息的方式,减少了报文查找、匹配次数,有效提高了装置性能。

Description

一种从网络报文中提取账号信息的方法
技术领域
本发明属于大数据技术领域,尤其涉及一种从网络报文中提取账号信息的方法。
背景技术
随着深度报文解析技术的日益发展,人们对报文解析的程度也越来越深入。比如,从开始的在大量网络报文中识别各种应用,到现在需要在从各种具体的应用中,能够提取到用户所关注的各类信息,如账号信息、位置信息等等。目前人们对深度报文解析的实现方式,大多还是按照以下流程进行的:1)让客户列出具体的需要提取的信息;2)组织专门的报文分析工程师,按照客户指定的应用、指定的信息,在网络上抓取相关的报文分析;3)编码实现,按照分析出来的报文特征提取信息;4)不断完善不同版本、不同应用的各类信息。
当前的处理方式的缺点是:1)分析报文的人和编码实现的人可能不是同一个人,那么就需要分析报文和编码实现的人都要熟悉一遍特定报文的特征信息;2)客户需求只要有一点的变化,上述流程就需要重新做一遍,严重增加人力成本;3)随着应用类型的增加,还有需要提取的特征的种类的增加,网络分析设备的负载越来越重,因为按照当前大多数的处理方式,会在每一个报文上检查一遍所有的应用和特征,然后提取信息;4)提取到的信息的准确度无法衡量。
发明内容
本发明的目的是提供一种从网络报文中提取账号信息的方法,解决了通过定制规则、解读规则、按照规则提取信息的方式,来实现各种应用信息的提取的技术问题。
为实现上述目的,本发明采用如下技术方案:
一种从网络报文中提取账号信息的方法,其特征在于:包括如下步骤:
步骤1:用户通过客户端输入网络报文,客户端将网络报文传送给中心服务器;
步骤2:中心服务器制定xml格式文件;xml格式文件包括六层:第一层设置应用的名称<name>;第二层设置应用对应的id号<id>和传输协议;第三层设置要提取的信息的类型;第四层设置提取信息的方式<type>;第五层包括<condition>节点和<get_data>节点,<condition>节点表示只有当报文信息满足了其中某个<type>下的任意一个<condition>节点后,才能在这个<type>中的<get_data>节点中提取信息;第六层设置<condition>节点的子规则和<get_data>节点的子规则,<condition>节点的子规则和<get_data>节点的子规则均由用户自定义设定;
步骤3:中心服务器将xml格式文件中的规则保存起来,xml格式文件中的每一层次的节点均对应设定一种结构体,在结构体中保存具体数据;
步骤4:中心服务器根据xml格式文件中的规则,采用链表和hash表管理结构体及其结构体内保存测数据,其包括以下步骤:
步骤S1:将所有的<type>节点对应的结构体,用链表链接起来;
步骤S2:将所有的含有子规则的<condition>节点对应的结构体用hash表链接起来;
步骤S3:将所有的<get_data>节点对应的结构体用hash表链接起来;
步骤5:中心服务器接收到网络报文后,按照xml格式文件中第六层设置的<condition>节点的子规则,从网络报文中获取条件信息;
步骤6:匹配xml格式文件中<condition>节点下的非字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤7:匹配xml格式文件中<condition>节点下的字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤8:检查每个<type>节点中的<condition>节点的匹配情况,只要有某个<condition>节点的所有子规则被都满足,就将该<condition>节点所在的<type>节点设置为matched状态;
步骤9:在matched状态的<type>节点中,根据该<type>节点下所有<get_data>节点的子规则,逐个提取所有账号信息;
步骤10:中心服务器将步骤9提取的账号信息返回给客户端,供客户查看。
优选的,在执行步骤6时,包括如下步骤:
步骤A1:在网络报文中提取非字符匹配项;
步骤A2:遍历所有<type>节点下的所有<condition>节点,获取每个<condition>节点下的非字符子规则,并与步骤A1中提取到的非字符匹配项比较,对于匹配成功的子规则,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤A3:检查步骤A2中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
优选的,在执行步骤7时,包括如下步骤:
步骤B1:在网络报文中提取字符匹配项;
步骤B2:利用AC算法匹配所述字符匹配项,获取匹配到的字符;
步骤B3:遍历所有<type>节点下的,所有非match状态的<condition>节点,获取该<condition>节点中的字符子规则,与步骤B2中得到的字符比较,如果匹配成功,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤B4:检查B3中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值(即流程图3中的thread_bit_map)的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
优选的,在执行步骤9时,<get_data>节点的子规则包括按照偏移量来获取信息和按照关键字来获取信息;
按照偏移量来获取信息的具体步骤如下:
步骤C1:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,逐一获取该<type>节点的<get_data>节点的数据;
步骤C2:将<get_data>节点的数据与<get_data>节点的子规则进行匹配,提取匹配正确的<get_data>节点的提取信息;
按照关键字来获取信息的具体步骤如下:
步骤C3:获取所有<get_data>节点中的字符匹配项;
步骤C4:用AC算法匹配字符匹配项,获取匹配正确的字符匹配项;
步骤C5:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,获取该<type>节点下<get_data>中的关键字,将该关键字与步骤C4中获得字符信息做比较,对于匹配成功的关键字,则按照该关键字对应的规则提取账号信息。
本发明所述的一种从网络报文中提取账号信息的方法,解决了通过定制规则、解读规则、按照规则提取信息的方式,来实现各种应用信息的提取的技术问题,本发明可以有效的使报文分析人员的工作(编写规则)与信息提取人员的工作(解读规则)解耦合,更好的适配用户需求的变更,使提取账号信息装置的修改达到最小化,通过在提取信息前预先标记是否要从该节点中匹配信息的方式,减少了报文查找、匹配次数,有效提高了装置性能。
附图说明
图1为本发明的xml文件存储结构;
图2为本发明的condition匹配条件中非字符类型匹配流程;
图3为本发明的condition匹配条件中字符类型匹配流程;
图4为本发明的get_data中按照偏移量类获得信息的流程;
图5为本发明的get_data中按照关键字来获取信息的流程。
具体实施方式
由图1-图5所示的一种从网络报文中提取账号信息的方法,包括如下步骤:
步骤1:用户通过客户端输入网络报文,客户端将网络报文传送给中心服务器;
步骤2:中心服务器制定xml格式文件;xml格式文件包括六层:第一层设置应用的名称<name>,如<qq></qq>表示应用名称为“qq”;
第二层设置应用对应的id号<id>和传输协议,如<id>1</id>表示应用的id为1,<tcp></tcp>表示传输层协议为tcp;
第三层设置要提取的信息的类型,如<account></account>表示要提取的信息类型为账号;
第四层设置提取信息的方式<type>,提取信息的方式<type></type>,方式可以有很多个,<type value="1">表示第一种提取方式,<type value="2">表示第二种提取方式,本实施例提取信息的方式为按照偏移量来获取信息和按照关键字来获取信息;
第五层包括<condition>节点和<get_data>节点,<condition>节点表示只有当报文信息满足了其中某个<type>下的任意一个<condition>节点后,才能在这个<type>中的<get_data>节点中提取信息;
第六层设置<condition>节点的子规则和<get_data>节点的子规则,<condition>节点的子规则和<get_data>节点的子规则均由用户自定义设定;
步骤3:中心服务器将xml格式文件中的规则保存起来,xml格式文件中的每一层次的节点均对应设定一种结构体,在结构体中保存具体数据;
步骤4:中心服务器根据xml格式文件中的规则,采用链表和hash表管理结构体及其结构体内保存测数据,其包括以下步骤:
步骤S1:将所有的<type>节点对应的结构体,用链表链接起来;
步骤S2:将所有的含有子规则的<condition>节点对应的结构体用hash表链接起来;
步骤S3:将所有的<get_data>节点对应的结构体用hash表链接起来;
步骤5:中心服务器接收到网络报文后,按照xml格式文件中第六层设置的<condition>节点的子规则,从网络报文中获取条件信息;
步骤6:匹配xml格式文件中<condition>节点下的非字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤7:匹配xml格式文件中<condition>节点下的字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤8:检查每个<type>节点中的<condition>节点的匹配情况,只要有某个<condition>节点的所有子规则被都满足,就将该<condition>节点所在的<type>节点设置为matched状态;
步骤9:在matched状态的<type>节点中,根据该<type>节点对应的<get_data>节点的子规则提取账号信息;
步骤10:中心服务器将步骤10提取的账号信息返回给客户端,供客户查看。
优选的,在执行步骤6时,包括如下步骤:
步骤A1:在网络报文中提取非字符匹配项;
步骤A2:遍历所有<type>节点下的所有<condition>节点,获取每个<condition>节点下的非字符子规则,并与步骤A1中提取到的非字符匹配项比较,对于匹配成功的子规则,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤A3:检查步骤A2中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
优选的,在执行步骤7时,包括如下步骤:
步骤B1:在网络报文中提取字符匹配项;
步骤B2:利用AC算法匹配所述字符匹配项,获取匹配到的字符;
步骤B3:遍历所有<type>节点下的,所有非match状态的<condition>节点,获取该<condition>节点中的字符子规则,与步骤B2中得到的字符比较,如果匹配成功,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤B4:检查B3中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
优选的,在执行步骤9时,<get_data>节点的子规则包括按照偏移量来获取信息和按照关键字来获取信息;
按照偏移量来获取信息的具体步骤如下:
步骤C1:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,逐一获取该<type>节点的<get_data>节点的数据;
步骤C2:将<get_data>节点的数据与<get_data>节点的子规则进行匹配,提取匹配正确的<get_data>节点的提取信息;
按照关键字来获取信息的具体步骤如下:
步骤C3:获取所有<get_data>节点中的字符匹配项;
步骤C4:用AC算法匹配字符匹配项,获取匹配正确的字符匹配项;
步骤C5:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,获取该<type>节点下<get_data>中的关键字,将该关键字与步骤C4中获得字符信息做比较,对于匹配成功的关键字,则按照该关键字对应的规则提取账号信息。
如图3所示为xml文件存储结构,其中在map中,QQ、WeChat、others均为第一层设置应用的名称<name>,TCP为传输协议,acct为要提取的信息的类型,T1、T2和Tk为<type>节点,C1-Cn为<condition>节点的子规则,D1-Dn为<get_data>节点的子规则。
以提取应用的名称为<wechat>的账号信息为例:
首先根据步骤2的方法编写和制定<wechat>的xml格式文件,然后,根据步骤3和步骤4的方法,中心服务器读取xml格式文件并保存,中心服务器根据xml格式文件建立存储结构及其对应的map,再然后,中心服务器获取获取网络报文后,按照步骤6和步骤7的方法分别匹配非字符匹配条件和字符匹配条件,在然后,检查每个<type>节点中的<condition>节点的匹配情况,只要有某个<condition>节点的所有子规则被都满足,就将该<condition>节点所在的<type>节点设置为matched状态,再然后,根据步骤9的方法按照偏移量来获取信息或按照关键字来获取信息从<get_data>节点提取信息。
本发明所述的一种从网络报文中提取账号信息的方法,解决了通过定制规则、解读规则、按照规则提取信息的方式,来实现各种应用信息的提取的技术问题,本发明可以有效的使报文分析人员的工作(编写规则)与信息提取人员的工作(解读规则)解耦合,更好的适配用户需求的变更,使提取账号信息装置的修改达到最小化,通过在提取信息前预先标记是否要从该节点中匹配信息的方式,减少了报文查找、匹配次数,有效提高了装置性能。

Claims (4)

1.一种从网络报文中提取账号信息的方法,其特征在于:包括如下步骤:
步骤1:用户通过客户端输入网络报文,客户端将网络报文传送给中心服务器;
步骤2:中心服务器制定xml格式文件;xml格式文件包括六层:第一层设置应用的名称<name>;第二层设置应用对应的id号<id>和传输协议;第三层设置要提取的信息的类型;第四层设置提取信息的方式<type>;第五层包括<condition>节点和<get_data>节点,<condition>节点表示只有当报文信息满足了其中某个<type>下的任意一个<condition>节点后,才能在这个<type>中的<get_data>节点中提取信息;第六层设置<condition>节点的子规则和<get_data>节点的子规则,<condition>节点的子规则和<get_data>节点的子规则均由用户自定义设定;
步骤3:中心服务器将xml格式文件中的规则保存起来,xml格式文件中的每一层次的节点均对应设定一种结构体,在结构体中保存具体数据;
步骤4:中心服务器根据xml格式文件中的规则,采用链表和hash表管理结构体及其结构体内保存测数据,其包括以下步骤:
步骤S1:将所有的<type>节点对应的结构体,用链表链接起来;
步骤S2:将所有的含有子规则的<condition>节点对应的结构体用hash表链接起来;
步骤S3:将所有的<get_data>节点对应的结构体用hash表链接起来;
步骤5:中心服务器接收到网络报文后,按照xml格式文件中第六层设置的<condition>节点的子规则,从网络报文中获取条件信息;
步骤6:匹配xml格式文件中<condition>节点下的非字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤7:匹配xml格式文件中<condition>节点下的字符匹配条件,如果匹配成功,将相应的bitmap位置位;
步骤8:检查每个<type>节点中的<condition>节点的匹配情况,只要有某个<condition>节点的所有子规则被都满足,就将该<condition>节点所在的<type>节点设置为matched状态;
步骤9:在matched状态的<type>节点中,根据该<type>节点下所有<get_data>节点的子规则,逐个提取所有账号信息;
步骤10:中心服务器将步骤9提取的账号信息返回给客户端,供客户查看。
2.如权利要求1所述的一种从网络报文中提取账号信息的方法,其特征在于:在执行步骤6时,包括如下步骤:
步骤A1:在网络报文中提取非字符匹配项;
步骤A2:遍历所有<type>节点下的所有<condition>节点,获取每个<condition>节点下的非字符子规则,并与步骤A1中提取到的非字符匹配项比较,对于匹配成功的子规则,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤A3:检查步骤A2中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
3.如权利要求1所述的一种从网络报文中提取账号信息的方法,其特征在于:在执行步骤7时,包括如下步骤:
步骤B1:在网络报文中提取字符匹配项;
步骤B2:利用AC算法匹配所述字符匹配项,获取匹配到的字符;
步骤B3:遍历所有<type>节点下的,所有非match状态的<condition>节点,获取该<condition>节点中的字符子规则,与步骤B2中得到的字符比较,如果匹配成功,将该子规则所在的<condition>节点中对应的bitmap位置位。
步骤B4:检查B3中获得的bitmap值与<condition>中预先设定的标示<condition>节点中所有匹配项的bitmap值(即流程图3中的thread_bit_map)的关系,如果相等则将该<condition>节点所在的<type>节点设置为matched状态。
4.如权利要求1所述的一种从网络报文中提取账号信息的方法,其特征在于:在执行步骤9时,<get_data>节点的子规则包括按照偏移量来获取信息和按照关键字来获取信息;
按照偏移量来获取信息的具体步骤如下:
步骤C1:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,逐一获取该<type>节点的<get_data>节点的数据;
步骤C2:将<get_data>节点的数据与<get_data>节点的子规则进行匹配,提取匹配正确的<get_data>节点的提取信息;
按照关键字来获取信息的具体步骤如下:
步骤C3:获取所有<get_data>节点中的字符匹配项;
步骤C4:用AC算法匹配字符匹配项,获取匹配正确的字符匹配项;
步骤C5:判断当<type>节点的链表不为空,并且<type>节点为matched状态时,获取该<type>节点下<get_data>中的关键字,将该关键字与步骤C4中获得字符信息做比较,对于匹配成功的关键字,则按照该关键字对应的规则提取账号信息。
CN201811508719.0A 2018-12-11 2018-12-11 一种从网络报文中提取账号信息的方法 Active CN109462598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811508719.0A CN109462598B (zh) 2018-12-11 2018-12-11 一种从网络报文中提取账号信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811508719.0A CN109462598B (zh) 2018-12-11 2018-12-11 一种从网络报文中提取账号信息的方法

Publications (2)

Publication Number Publication Date
CN109462598A true CN109462598A (zh) 2019-03-12
CN109462598B CN109462598B (zh) 2021-08-17

Family

ID=65612962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811508719.0A Active CN109462598B (zh) 2018-12-11 2018-12-11 一种从网络报文中提取账号信息的方法

Country Status (1)

Country Link
CN (1) CN109462598B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111694990A (zh) * 2020-06-08 2020-09-22 深圳市富中奇科技有限公司 车辆数据的处理方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025636A (zh) * 2010-12-09 2011-04-20 北京星网锐捷网络技术有限公司 报文特征处理方法、装置及网络设备
CN104933095A (zh) * 2015-05-22 2015-09-23 中国电子科技集团公司第十研究所 异构信息通用性关联分析系统及其分析方法
CN106452859A (zh) * 2016-09-29 2017-02-22 南京邮电大学 一种固网WiFi环境下手机号码特征关键字自动提取方法
CN106656655A (zh) * 2016-10-31 2017-05-10 海纳信成(北京)信息技术有限公司 一种手机号码提取方法和装置
CN107193843A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 一种基于ac自动机和后缀表达式的字符串筛选方法及装置
CN107222369A (zh) * 2017-07-07 2017-09-29 北京小米移动软件有限公司 应用程序的识别方法、装置、交换装置和存储介质
US20180288197A1 (en) * 2013-09-16 2018-10-04 Amazon Technologies, Inc. Configurable parser and a method for parsing information units

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025636A (zh) * 2010-12-09 2011-04-20 北京星网锐捷网络技术有限公司 报文特征处理方法、装置及网络设备
US20180288197A1 (en) * 2013-09-16 2018-10-04 Amazon Technologies, Inc. Configurable parser and a method for parsing information units
CN104933095A (zh) * 2015-05-22 2015-09-23 中国电子科技集团公司第十研究所 异构信息通用性关联分析系统及其分析方法
CN107193843A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 一种基于ac自动机和后缀表达式的字符串筛选方法及装置
CN106452859A (zh) * 2016-09-29 2017-02-22 南京邮电大学 一种固网WiFi环境下手机号码特征关键字自动提取方法
CN106656655A (zh) * 2016-10-31 2017-05-10 海纳信成(北京)信息技术有限公司 一种手机号码提取方法和装置
CN107222369A (zh) * 2017-07-07 2017-09-29 北京小米移动软件有限公司 应用程序的识别方法、装置、交换装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冉萌等: "DPI技术在移动大数据中的应用", 《邮电设计技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111694990A (zh) * 2020-06-08 2020-09-22 深圳市富中奇科技有限公司 车辆数据的处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN109462598B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN109635117B (zh) 一种基于知识图谱识别用户意图方法及装置
CN108737423B (zh) 基于网页关键内容相似性分析的钓鱼网站发现方法及系统
CN105528422B (zh) 一种主题爬虫处理方法及装置
CN103313248B (zh) 一种识别垃圾信息的方法和装置
CN102662966B (zh) 一种面向主题的获取动态页面内容的方法及系统
CN105095415B (zh) 网络情绪的确定方法和装置
CN109508458A (zh) 法律实体的识别方法及装置
CN109670843A (zh) 投诉业务的数据处理方法、装置、计算机设备及存储介质
CN109740159B (zh) 用于命名实体识别的处理方法及装置
CN110891030B (zh) 一种基于机器学习的http流量特征识别与提取方法
CN103051637A (zh) 用户识别方法与装置
CN111726336B (zh) 一种联网智能设备识别信息提取方法及系统
CN111866196B (zh) 一种域名流量特征提取方法、装置、设备及可读存储介质
CN104765882B (zh) 一种基于网页特征字符串的互联网网站统计方法
CN106933972A (zh) 利用自然语言处理技术定义数据元素的方法以及装置
CN111177367A (zh) 案件分类方法、分类模型训练方法及相关产品
CN109462598A (zh) 一种从网络报文中提取账号信息的方法
Rowe et al. Data. dcs: Converting Legacy Data into Linked Data.
CN108650145A (zh) 一种家庭宽带WiFi下手机号码特征自动提取方法
CN107368500A (zh) 数据抽取方法及系统
CN102984242A (zh) 一种应用协议的自动识别方法和装置
CN110489740B (zh) 语义解析方法及相关产品
CN113779110B (zh) 家庭关系网络提取方法、装置、计算机设备及存储介质
CN116055448A (zh) 一种电力作业的标识数据管理平台
CN108549707A (zh) 一种基于行为感知的大数据提取系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant