CN107707549B - 一种自动提取应用特征的装置及方法 - Google Patents

一种自动提取应用特征的装置及方法 Download PDF

Info

Publication number
CN107707549B
CN107707549B CN201710917644.0A CN201710917644A CN107707549B CN 107707549 B CN107707549 B CN 107707549B CN 201710917644 A CN201710917644 A CN 201710917644A CN 107707549 B CN107707549 B CN 107707549B
Authority
CN
China
Prior art keywords
message
protocol
data
application program
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710917644.0A
Other languages
English (en)
Other versions
CN107707549A (zh
Inventor
杨超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201710917644.0A priority Critical patent/CN107707549B/zh
Publication of CN107707549A publication Critical patent/CN107707549A/zh
Application granted granted Critical
Publication of CN107707549B publication Critical patent/CN107707549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及数据通信领域,其公开了一种自动提取应用特征的方法,解决传统技术中手动提取应用特征存在的工作量大、容易出错的问题。其包括以下步骤:a.缓存应用程序的数据流中的报文;b.从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;c.利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据;d.从解析的报文数据中提取应用程序的特征;e.通过日志输出提取的应用程序的特征。此外,本发明还提供了一种自动提取应用特征的装置,适用于应用程序的权限控制。

Description

一种自动提取应用特征的装置及方法
技术领域
本发明涉及数据通信领域,具体涉及一种自动提取应用特征的装置及方法。
背景技术
随着企业安全防护过程中对应用程序的关注,基于深度包检测技术(DPI)和深度流检测技术(DFI)成为安全领域的热门技术之一。现阶段,基于端口进行应用协议的识别是最为通常的手段。例如发现某数据报文中源或目的端口为80,则认为该报文是HTTP协议相关报文,交给HTTP协议分析引擎进行协议解码和攻击检测。
但随着各种网络应用的逐步丰富,这种基于端口来识别报文所属协议类型的方法暴露出其存在的不足,由于无法分析出具体的应用,就无法针对不同的应用实施不同的策略。例如,新浪和搜狐两个应用对应的报文都是HTTP报文,如果不能区分到底是新浪和搜狐,给用户针对这两个应用程序做控制就带来了麻烦,对这两个不同的软件,只能采取相同的安全策略。
DPI技术中提出了特征的概念,所谓特征,就是应用程序的唯一标识,针对每款应用程序,都可以根据这款应用的特征信息在经过设备的报文中做识别,如果特征匹配,就认为经过设备的报文流信息就是对应应用程序产生的流信息。
现有技术中通常采取静态方式分析应用程序的特征,所谓静态的方式,以一个互联网应用程序(APP)为例,一般流程如下:
1、开启抓包软件;
2、手机等终端打开APP,使用APP;
3、停止抓包,获取到APP对应的报文;
4、人工查看APP使用过程中产生的报文,如果是HTTP报文,则检查同一条数据流的多条报文之间,头部字段或者报文体中是否存在相同的内容,如果存在相同的内容,就可以提取出来做特征,如果是TCP或者UDP报文,可以从TCP/UDP报文体部分提取相同的内容作为特征;
但是,市场上的应用程序成千上万,完全靠人力来提取特征,工作量是巨大的,且容易出错导致应用程序识别错误。
发明内容
本发明所要解决的技术问题是,提出一种自动提取应用特征的装置及方法,解决传统技术中手动提取应用特征存在的工作量大、容易出错的问题。
一方面,本发明实施例提供一种自动提取应用特征的装置,其包括:
报文缓存模块,用于缓存应用程序的数据流中的报文;
协议判断器,用于从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
协议解析器,用于解析对应协议类型的报文,获取解析的报文数据;
特征提取器,用于从解析的报文数据中提取应用程序的特征;
特征输出模块,用于通过日志输出提取的应用程序的特征。
作为进一步优化,该装置还包括:
特征生成器,用于根据提取的应用程序的特征制作特征库;
特征部署模块,用于将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
作为进一步优化,所述协议解析器获取解析的报文数据包括:
获取解析的报文的头部数据或报文体数据。
作为进一步优化,所述特征提取器从解析的报文数据中提取应用程序的特征,具体为:
通过对比缓存的同一个数据流的多个报文的解析数据,提取相同内容的部分作为数据流对应的应用程序的特征。
作为进一步优化,所述对应类型的协议解析器包括:
HTTP头解析器、TCP报文体解析器、UDP报文体解析器;分别用于解析HTTP协议头部数据、TCP报文体数据、UDP报文体数据。
此外,基于上述装置,本发明实施例还提供了一种自动提取应用特征的方法,其包括以下步骤:
a.缓存应用程序的数据流中的报文;
b.从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
c.利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据;
d.从解析的报文数据中提取应用程序的特征;
e.通过日志输出提取的应用程序的特征。
作为进一步优化,该方法还包括步骤:
f.根据提取的应用程序的特征制作特征库;
g.将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
作为进一步优化,步骤c中,所述获取解析的报文数据包括:
获取解析的报文的头部数据或报文体数据。
作为进一步优化,步骤d中,所述从解析的报文数据中提取应用程序的特征,具体为:
通过对比缓存的同一个数据流的多个报文的解析数据,提取相同内容的部分作为数据流对应的应用程序的特征。
作为进一步优化,步骤c中,利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据,具体包括:
若协议类型为HTTP协议,则调用HTTP头解析器解析HTTP协议头部数据;
若协议类型为TCP协议,则调用TCP报文体解析器解析TCP报文体数据;
若协议类型为UDP协议,则调用UDP报文体解析器解析UDP报文体数据。
本发明的有益效果是:
通过对应用程序的数据流中的报文进行缓存,并进行协议类型判断,从而根据相应的协议类型调用相应的解析器进行报文解析,然后从解析的报文数据中自动提取特征;本发明中的应用特征自动提取方案可以加快特征提取效率,减小人工参与带来的错误几率,将提取的特征制作成特征库部署到网络设备/安全设备中,供管理员对应用的权限进行配置,从而进行应用管控。
附图说明
图1为本发明实施例中自动提取应用特征的装置结构框图;
图2为本发明实施例中自动提取应用特征的方法流程图。
具体实施方式
本发明旨在提出一种自动提取应用特征的装置及方法,解决传统技术中手动提取应用特征存在的工作量大、容易出错的问题。
下面结合附图及实施例对本发明的方案做进一步的描述:
如图1所示,本实施例中的自动提取应用特征的装置包括:
报文缓存模块,用于缓存应用程序的数据流中的报文;
协议判断器,用于从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
协议解析器,用于解析对应协议类型的报文,获取解析的报文数据;
特征提取器,用于从解析的报文数据中提取应用程序的特征;
特征输出模块,用于通过日志输出提取的应用程序的特征;
特征生成器,用于根据提取的应用程序的特征制作特征库;
特征部署模块,用于将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
基于上述装置,本发明实施例实现的自动提取应用特征的方法如图2所示,其包括以下步骤:
a.缓存应用程序的数据流中的报文;
本步骤中,在开启应用程序后,应用程序运行产生的数据流中的报文经过路由设备或其它安全设备,通过缓存模块对应用程序中的数据流中的报文进行缓存,一般只需要缓存前N个报文即可,N的值可以根据实际需要进行调整。
b.从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
在本步骤中,在判断缓存的报文中的协议类型后,调用对应类型的协议解析器,比如:若协议类型为HTTP协议,则调用HTTP头解析器;若协议类型为TCP协议,则调用TCP报文体解析器;若协议类型为UDP协议,则调用UDP报文体解析器。
c.利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据;
在本步骤中,若调用HTTP头解析器,则对报文的HTTP头进行解析,获得HTTP头信息,若调用TCP报文体解析器,则对报文的TCP报文体进行解析,获得TCP报文体信息;若调用UDP报文体解析器,则对报文的UDP报文体进行解析,获得UDP报文体信息。
d.从解析的报文数据中提取应用程序的特征;
本步骤中,可以通过预设的提取程序从同一个数据流的多个缓存的报文的解析数据中提取特征,即提取相同的内容,如:若报文为HTTP协议,则从多个报文的HTTP头信息中提取相同的内容,若报文为TCP协议,则从多个报文的TCP报文体信息中提取相同的内容,若报文为UDP协议,则从多个报文的UDP报文体信息中提取相同的内容。
e.通过日志输出提取的应用程序的特征;
本步骤中,将提取的应用程序的特征通过日志进行自动化输出。
f.根据提取的应用程序的特征制作特征库;
本步骤中,特征库的制作为了便于下一步的部署,特征库可以涵盖多个应用程序的特征,由于特征具有唯一的标志性,因而可以相互区分。
g.将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
本步骤中,在将特征库部署到网络设备中后,管理员可以选择进行应用权限配置,比如针对某个应用配置其行为阻断,则内网用户再次使用被配置的特征对应的应用程序时,报文将会被网络设备所阻断,从而达到应用控制的效果。

Claims (6)

1.一种自动提取应用特征的装置,其特征在于,包括:
报文缓存模块,用于缓存应用程序的数据流中的报文;
协议判断器,用于从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
协议解析器,用于解析对应协议类型的报文,获取解析的报文数据;
特征提取器,用于从解析的报文数据中提取应用程序的特征:通过对比缓存的同一个数据流的多个报文的解析数据,提取相同内容的部分作为数据流对应的应用程序的特征;
特征输出模块,用于通过日志输出提取的应用程序的特征;
特征生成器,用于根据提取的应用程序的特征制作特征库;
特征部署模块,用于将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
2.如权利要求1所述的装置,其特征在于,所述协议解析器获取解析的报文数据包括:
获取解析的报文的头部数据或报文体数据。
3.如权利要求1或2所述的装置,其特征在于,所述对应类型的协议解析器包括:
HTTP头解析器、TCP报文体解析器、UDP报文体解析器;分别用于解析HTTP协议头部数据、TCP报文体数据、UDP报文体数据。
4.一种自动提取应用特征的方法,其特征在于,包括以下步骤:
a.缓存应用程序的数据流中的报文;
b.从缓存的报文中判断报文的协议类型,根据协议类型,调用对应类型的协议解析器;
c.利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据;
d.从解析的报文数据中提取应用程序的特征:通过对比缓存的同一个数据流的多个报文的解析数据,提取相同内容的部分作为数据流对应的应用程序的特征;
e.通过日志输出提取的应用程序的特征;
f.根据提取的应用程序的特征制作特征库;
g.将制作的特征库部署到网络设备中,供管理员对应用程序的权限进行配置。
5.如权利要求4所述的方法,其特征在于,步骤c中,所述获取解析的报文数据包括:
获取解析的报文的头部数据或报文体数据。
6.如权利要求4或5所述的方法,其特征在于,步骤c中,利用对应类型的协议解析器解析对应协议类型的报文,获取解析的报文数据,具体包括:
若协议类型为HTTP协议,则调用HTTP头解析器解析HTTP协议头部数据;
若协议类型为TCP协议,则调用TCP报文体解析器解析TCP报文体数据;
若协议类型为UDP协议,则调用UDP报文体解析器解析UDP报文体数据。
CN201710917644.0A 2017-09-30 2017-09-30 一种自动提取应用特征的装置及方法 Active CN107707549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710917644.0A CN107707549B (zh) 2017-09-30 2017-09-30 一种自动提取应用特征的装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710917644.0A CN107707549B (zh) 2017-09-30 2017-09-30 一种自动提取应用特征的装置及方法

Publications (2)

Publication Number Publication Date
CN107707549A CN107707549A (zh) 2018-02-16
CN107707549B true CN107707549B (zh) 2020-07-28

Family

ID=61184048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710917644.0A Active CN107707549B (zh) 2017-09-30 2017-09-30 一种自动提取应用特征的装置及方法

Country Status (1)

Country Link
CN (1) CN107707549B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768929B (zh) * 2018-04-09 2021-04-13 平安科技(深圳)有限公司 电子装置、征信反馈报文的解析方法及存储介质
CN108632286A (zh) * 2018-05-14 2018-10-09 国家计算机网络与信息安全管理中心 一种多应用混合数据的解析方法
CN110943873B (zh) * 2018-09-21 2021-08-17 中移(杭州)信息技术有限公司 一种报文流的处理方法、装置和可读介质
CN111835542B (zh) * 2019-04-19 2022-02-11 四川大学 一种自动提取及检验用于识别应用程序特征的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744594A (zh) * 2004-08-30 2006-03-08 北京航空航天大学 Web服务传输协议适配器及其生成方法
CN1968278A (zh) * 2006-11-24 2007-05-23 杭州华为三康技术有限公司 数据包内容的分析处理方法及系统
CN101741644A (zh) * 2009-12-16 2010-06-16 成都市华为赛门铁克科技有限公司 流量检测方法及装置
CN105591973A (zh) * 2015-12-31 2016-05-18 杭州数梦工场科技有限公司 应用识别方法及装置
CN105991373A (zh) * 2015-04-30 2016-10-05 杭州迪普科技有限公司 一种应用协议识别方法及装置
CN107222369A (zh) * 2017-07-07 2017-09-29 北京小米移动软件有限公司 应用程序的识别方法、装置、交换装置和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101207571B (zh) * 2007-12-12 2011-04-20 华为技术有限公司 转发报文的方法和设备
CN102025636B (zh) * 2010-12-09 2012-09-05 北京星网锐捷网络技术有限公司 报文特征处理方法、装置及网络设备
CN103248530B (zh) * 2012-02-09 2015-12-16 深圳市恒扬科技股份有限公司 一种基于浮动位置的特征字分流检测方法及装置
CN103297270A (zh) * 2013-05-24 2013-09-11 华为技术有限公司 应用类型识别方法及网络设备
CN103475537A (zh) * 2013-08-30 2013-12-25 华为技术有限公司 一种报文特征提取方法和装置
CN105939231B (zh) * 2016-05-16 2020-04-03 杭州迪普科技股份有限公司 共享接入检测方法和共享接入检测装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744594A (zh) * 2004-08-30 2006-03-08 北京航空航天大学 Web服务传输协议适配器及其生成方法
CN1968278A (zh) * 2006-11-24 2007-05-23 杭州华为三康技术有限公司 数据包内容的分析处理方法及系统
CN101741644A (zh) * 2009-12-16 2010-06-16 成都市华为赛门铁克科技有限公司 流量检测方法及装置
CN105991373A (zh) * 2015-04-30 2016-10-05 杭州迪普科技有限公司 一种应用协议识别方法及装置
CN105591973A (zh) * 2015-12-31 2016-05-18 杭州数梦工场科技有限公司 应用识别方法及装置
CN107222369A (zh) * 2017-07-07 2017-09-29 北京小米移动软件有限公司 应用程序的识别方法、装置、交换装置和存储介质

Also Published As

Publication number Publication date
CN107707549A (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
CN107707549B (zh) 一种自动提取应用特征的装置及方法
US8015605B2 (en) Scalable monitor of malicious network traffic
CN111800412B (zh) 高级可持续威胁溯源方法、系统、计算机设备及存储介质
CN107204965B (zh) 一种密码破解行为的拦截方法及系统
CN110245273B (zh) 一种获取app业务特征库的方法及相应的装置
CN102739457A (zh) 一种基于dpi和svm技术的网络流量识别系统及方法
CN110958231A (zh) 基于互联网的工控安全事件监测平台及其方法
CN110868409A (zh) 一种基于tcp/ip协议栈指纹的操作系统被动识别方法及系统
CN105991628A (zh) 网络攻击的识别方法和装置
US20220141252A1 (en) System and method for data filtering in machine learning model to detect impersonation attacks
CN111464526A (zh) 一种网络入侵检测方法、装置、设备及可读存储介质
CN110581780B (zh) 针对web服务器资产的自动识别方法
CN112491883A (zh) 一种检测web攻击的方法、装置、电子装置和存储介质
CN109474567B (zh) Ddos攻击溯源方法、装置、存储介质及电子设备
van De Wiel et al. Enabling non-expert analysis of large volumes of intercepted network traffic
CN103685298A (zh) 一种基于深度包检测的ssl中间人攻击发现方法
CN112565232B (zh) 一种基于模板和流量状态的日志解析方法及系统
CN108259416B (zh) 检测恶意网页的方法及相关设备
CN113922992B (zh) 一种基于http会话的攻击检测方法
CN109379356A (zh) 自动捕获cpu攻击报文的方法及装置
CN105703930A (zh) 基于应用的会话日志处理方法及装置
CN112565259B (zh) 过滤dns隧道木马通信数据的方法及装置
CN105530098B (zh) 一种协议指纹自动提取方法及系统
US9049170B2 (en) Building filter through utilization of automated generation of regular expression
KR102001814B1 (ko) 모바일 장치 기반의 악성 스크립트 탐지 방법 및 그 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 610041 nine Xing Xing Road 16, hi tech Zone, Sichuan, Chengdu

Patentee after: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 610041, 17 floor, maple building, 1 building, 288 Tianfu street, Chengdu, Sichuan.

Patentee before: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.