CN113141370A

CN113141370A - 一种内部网络流量的恶意dns隧道识别方法

Info

Publication number: CN113141370A
Application number: CN202110480418.7A
Authority: CN
Inventors: 秦志鹏; 朱杰; 刘泳锐; 杨朝晖; 陈解元; 安黎东; 李华; 范广; 吕志梅
Original assignee: Shanxi Branch Of National Computer Network And Information Security Management Center
Current assignee: Shanxi Branch Of National Computer Network And Information Security Management Center
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2021-07-20
Anticipated expiration: 2041-04-30
Also published as: CN113141370B

Abstract

本发明适用于计算机网络安全技术领域，提供了一种内部网络流量的恶意DNS隧道识别方法，本方法根据建立的黑名单库以及域名白名单库对域名进行初步的筛选，再从DNS请求频率，域名子域名文本特征，域名请求类型，域名文本熵值等多个维度来分析DNS请求是否属于有害的DNS隧道，并对有害的有害DNS隧道的特征重新加入到有害DNS隧道的特征识别库，作为数据的补充，帮助机器学习，提高预测以及检测的识别精准度，提高了工作的效率，避免了原有的人工投诉、人工审核这种方式，导致的工作速度和进度低下的问题。

Description

一种内部网络流量的恶意DNS隧道识别方法

技术领域

本发明属于计算机网络安全技术领域，尤其涉及一种内部网络流量的恶意DNS隧道识别方法。

背景技术

计算机网络安全领域内，DNS隧道是常被使用来作为被入侵主机与黑客之间的通信桥梁。当前的业内普遍对该场景没有较好的解决方案，大部分依靠人工和威胁情报协同处理，误报率非常高。

现有的技术主要依靠威胁情报和人工的方式在DNS流量中，判断域名和IP是否被威胁情报标记为黑IP，如果是黑IP则人工跟进确认并且封禁，此方法存在误报率高，并且过于依靠威胁情报导致防御DNS的措施滞后，威胁情报作为一种社区内的共享消息，在复杂多变的网络环境中消息存在滞后和无法及时同步的问题，因此导致出现较多的DNS隧道的误报和漏洞。

发明内容

本发明提供一种内部网络流量的恶意DNS隧道识别方法，旨在解决上述技术问题。

本发明是这样实现的，一种内部网络流量的恶意DNS隧道识别方法，包括如下步骤：

步骤一：数据采集阶段；在机房网络出口镜像流量中，将部分流量数据拷贝出来，并对这部分流量数据进行过滤，提取出内部所有的DNS数据并存储为DNS数据库。

步骤二：搜集网络上正常提供业务的域名，建立域名白名单库；

步骤三：搜集网络上的已暴露的黑名单域名，并将之与建立的DNS流量库相匹配遍寻，发现在DNS流量库中出现的黑名单域名，建立黑名单域名库，并根据该黑名单域名库中的各个黑名单域名在企业内部的周期内访问频率特征和域名请求类型，建立可疑域名库，并在可疑域名库中将这些域名特征的共性作为恶意的DNS隧道识别特征，建立特征识别库并存储在服务器上；

步骤四：基于n-gram的自然域名模型对域名做预测，主要依靠特征的均值和方差，使用已有特征识别库内的DNS隧道使用的域名特征进行模型训练，并将n-gram模型预测出来的域名认为是可疑域名加入到可疑域名库中；

步骤五、所有可疑域名均采用黑域名文本特征方法进行检测，判断是否为黑域名，

若是，则进行主动防御与溯源，并将其加入到黑名单域名库中；

若否，则引入人工介入判断是否是白名单域名，若是白名单域名则加入白名单中。

优选的，步骤一中：DNS数据获取，在交换机下联口通过分光和镜像的技术，将流量数据拷贝一份到目标网卡上，接收之后过滤流量内所有的DNS数据并存储形成DNS数据库。

优选的，步骤二中：使用alex排名前10w的根域名，以及基于人工反馈且人工确认的该域名为无害域名，作为域名白名单库。

优选的，步骤三中：周期内访问频率特征为：一个周期内，排除白名单域名，基于时间序列的域名解析频率日均10w+的域名；一个周期内，与之前100个周期相比没出现过的新域名；一个周期内，基于时间序列的解析频率存在有突增/突降的域名。

优选的，步骤三中：域名请求类型为：请求为TXT的解析方式，并且域名具有NS记录的域名。

优选的，步骤四中：特征的均值和方差包括如下：

1)域名长度均值/方差；

2)域名中数字占比均值/方差；

3)域名中英文字幕占比均值/方差；

4)域名中特殊符号占比均值/方差；

5)域名信息熵均值/方差；

6)域名基尼系数均值/方差；

7)域名unigram平均排名均值/方差；

8)域名bigram平均排名均值/方差；

9)域名trigram平均排名均值/方差。

优选的，步骤五中：黑域名文本特征方法为：base64解码后是否带有关键字符串或者域名文本敏感信息特征。

与现有技术相比，本发明的有益效果是：本发明的一种内部网络流量的恶意DNS隧道识别方法，本方法根据建立的黑名单库以及域名白名单库对域名进行初步的筛选，再从DNS请求频率，域名子域名文本特征，域名请求类型，域名文本熵值等多个维度来分析DNS请求是否属于有害的DNS隧道，并对有害的有害DNS隧道的特征重新加入到有害DNS隧道的特征识别库，作为数据的补充，帮助机器学习，提高预测以及检测的识别精准度，提高了工作的效率，避免了原有的人工投诉、人工审核这种方式，导致的工作速度和进度低下的问题。

附图说明

图1为本发明的方法流程示意图；

图2为依靠n-gram模型做的DNS隧道检测时纬度数据指标示意图；

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1-2，本发明提供一种技术方案：一种内部网络流量的恶意DNS隧道识别方法，包括如下步骤：

步骤一：数据采集阶段；在机房网络出口镜像流量中，将部分流量数据拷贝出来，并对这部分流量数据进行过滤，提取出内部所有的DNS数据并存储为DNS数据库。其中关于DNS数据的获取，在交换机下联口通过分光和镜像的技术，将流量数据拷贝一份到目标网卡上，接收之后过滤流量内所有的DNS数据。

步骤二：搜集网络上正常提供业务的域名，即alex排名前10w的根域名，以及基于人工反馈且人工确认的该域名为无害域名，建立域名白名单库。

步骤三：搜集网络上的已暴露的黑名单域名，并将之与建立的DNS流量库相匹配遍寻，发现在DNS流量库中出现的黑名单域名，建立黑名单域名库。

进一步，根据该黑名单域名库中的各个黑名单域名在企业内部的周期内访问频率特征和域名请求类型，建立可疑域名库。

其中周期内访问频率特征为：一个周期内，排除白名单域名，基于时间序列的域名解析频率日均10w+的域名；一个周期内，与之前100个周期相比没出现过的新域名；一个周期内，基于时间序列的解析频率存在有突增/突降的域名。

域名请求类型为：请求为TXT的解析方式，并且域名具有NS记录的域名。

进一步，在可疑域名库中将这些域名特征的共性作为恶意的DNS隧道识别特征，建立特征识别库并存储在服务器上。

其中，特征的均值和方差包括如下：1)域名长度均值/方差；2)域名中数字占比均值/方差；3)域名中英文字幕占比均值/方差；4)域名中特殊符号占比均值/方差；5)域名信息熵均值/方差；6)域名基尼系数均值/方差；7)域名unigram平均排名均值/方差；8)域名bigram平均排名均值/方差；9)域名trigram平均排名均值/方差。

步骤五、所有可疑域名均采用黑域名文本特征方法，即base64解码后是否带有关键字符串或者域名文本敏感信息特征进行检测，判断是否为黑域名，

实施例一：zys.com进入本系统判断是否是黑域名。

第一步：判断zys.com是否属于黑名单域名库中；

若不属于，则继续往下，判断是否属于域名白名单库中；

若属于，则直接警告并封禁。

第二步：判断zys.com是否属于域名白名单库；

若不属于，则继续往下，利用可疑域名库规则判断是否属于可疑域名；

若属于，则将对其进行放行并将其加入白名单中。

第三步：判断zys.com是否属于可疑域名；

若不属于，则引入人工介入判断是否是白名单域名，若是白名单域名则加入白名单中。

若属于，则通过判断域名的文本特征的方式判断是否属于黑域名。

第四步：判断zys.com是否属于黑域名；

若属于，则认为是黑域名，认为存在有DNS隧道，对其进行封禁，并将其特征反馈给本系统的特征识别库完善判断规则，

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种内部网络流量的恶意DNS隧道识别方法，其特征在于，包括如下步骤：

步骤一：数据采集阶段；在机房网络出口镜像流量中，将部分流量数据拷贝出来，并对这部分流量数据进行过滤，提取出内部所有的DNS数据并存储为DNS数据库；

2.如权利要求1所述的一种内部网络流量的恶意DNS隧道识别方法，其特征在于：步骤一中：DNS数据获取，在交换机下联口通过分光和镜像的技术，将流量数据拷贝一份到目标网卡上，接收之后过滤流量内所有的DNS数据并存储形成DNS数据库。

3.如权利要求1所述的一种内部网络流量的恶意DNS隧道识别方法，其特征在于：步骤二中：使用alex排名前10w的根域名，以及基于人工反馈且人工确认的该域名为无害域名，作为域名白名单库。

4.如权利要求1所述的一种内部网络流量的恶意DNS隧道识别方法，其特征在于：步骤三中：周期内访问频率特征为：一个周期内，排除白名单域名，基于时间序列的域名解析频率日均10w+的域名；一个周期内，与之前100个周期相比没出现过的新域名；一个周期内，基于时间序列的解析频率存在有突增/突降的域名。

5.如权利要求1所述的一种内部网络流量的恶意DNS隧道识别方法，其特征在于：步骤三中：域名请求类型为：请求为TXT的解析方式，并且域名具有NS记录的域名。

6.如权利要求1所述的一种内部网络流量的恶意DNS隧道识别方法，其特征在于：步骤四中：特征的均值和方差包括如下：