CN116233317A

CN116233317A - 面向网络流量的实时VoLTE语音还原、检测方法和装置

Info

Publication number: CN116233317A
Application number: CN202310085077.2A
Authority: CN
Inventors: 李书豪; 葛瑞海; 杜冰; 王昕培; 周国桥; 姚军亮; 王维光; 赵光泽
Original assignee: Institute of Information Engineering of CAS
Current assignee: Institute of Information Engineering of CAS
Priority date: 2023-01-19
Filing date: 2023-01-19
Publication date: 2023-06-06

Abstract

本公开涉及一种面向网络流量的实时VoLTE语音还原、检测方法和装置，涉及网络信息安全领域。所述语音检测方法包括：基于配置的检测规则，生成规则树；构建会话流表和语音流表；在网络流量中，捕获传输层协议是UDP协议的数据包；根据所述数据包的应用层协议和语音流表，判断所述数据包是否包含实时传输协议；在所述数据包包含实时传输协议的情况下，获取与该数据包同源且包含实时传输协议的数据包，并基于所有数据包的实时传输协议中的payload字段，进行语音文件还原；将所述文本信息输入所述规则树，并在所述文本信息命中所述规则条件的情况下，执行对应的响应动作。本公开可以研判数据流中是否有电信广告推销等行为。

Description

面向网络流量的实时VoLTE语音还原、检测方法和装置

技术领域

本发明涉及网络信息安全领域，涉及一种面向网络流量的实时VoLTE语音还原、检测方法和装置。

背景技术

近年来，随着智能手机的普及和新一代网络快速发展，越来越多的手机支持高清语音VoLTE通话，同时，层出不穷的广告推销电话也使用了VoLTE通话，而且语音编码方式多种多样。为了快速高效的发现VoLTE通话中的垃圾信息，及时的制止网络广告推销行为，需要能够从网络流量中实时还原出各种编码的VoLTE语音信息，并对还原的语音信息进行分析和研判，做出响应动作。然而，普通的语音还原技术还存在一些问题：

(1)一般的语音还原技术只能基于离线的pcap包进行语音还原，不能对网络流量实时采集并检测还原其中的语音信息。

(2)基于网络流量的语音还原系统，只能对单一语音编码方式进行解析，难以支持复杂多样的语音编码。

(3)基于网络流量的语音还原系统，只能对语音进行还原和解码，难以实时的对语音内容进行分析并根据语音内容及时做出响应动作。

发明内容

针对上述存在的问题，本发明公开了一种面向网络流量的实时VoLTE语音还原、检测方法和装置。该实时VoLTE语音检测方法可以研判数据流中是否有电信广告推销等行为，使得相关人员发起语音中断信号以停止会话。

本发明的技术方案包括：

一种面向网络流量的实时VoLTE语音文件还原方法，所述方法包括：

构建语音流表；所述语音流表包括：会话初始协议协商的四元组信息、语音编码信息、语音数据包序号和其他会话信息；

在网络流量中，捕获传输层协议是UDP协议的数据包；

根据所述数据包的应用层协议和语音流表，判断所述数据包是否包含实时传输协议；

在所述数据包包含实时传输协议的情况下，获取与该数据包同源且包含实时传输协议的数据包，并基于所有数据包的实时传输协议中的payload字段，进行语音文件还原。

进一步地，所述构建语音流表，包括：

在网络流量中，捕获传输层协议是TCP和UDP协议的数据包；

解析并还原数据包的应用层协议；

分析所述应用层协议中是否包含会话初始协议；

在所述应用层协议中包含会话初始协议的情况下，基于会话初始协议协商的会话信息，提取语音通话中实时传输协议使用的四元组信息、会话ID、编码类型；其中，所述四元组信息包括：源IP、源端口、目的IP和目的端口；

提取会话初始协议的五元组信息，使用五元组信息或反转后五元组信息查询会话流表；

未在会话流表中查询到会话信息的情况下，将所述五元组信息插入会话流表，并返回至所述在网络流量中，捕获传输层协议是TCP和UDP协议的数据包；

在会话流表中查询到会话信息的情况下，判断会话流表是否有完整的实时传输协议使用的四元组信息；

在会话流表没有完整的实时传输协议使用的四元组信息的情况下，返回至所述在网络流量中，捕获传输层协议是TCP协议和UDP协议的数据包；

在会话流表有完整的实时传输协议使用的四元组信息的情况下，使用该四元组信息和反转四元组信息查询语音流表；

未在语音流表中查询到四元组信息的情况下，将四元组信息插入语音流表，并返回至所述在网络流量中，捕获传输层协议是TCP协议和UDP协议的数据包；

在语音流表中查询到语音信息的情况下，返回至所述在网络流量中，捕获传输层协议是TCP协议和UDP协议的数据包。

进一步地，所述在网络流量中，捕获传输层协议是UDP协议的数据包，包括：

捕获网络流量中的数据包；

对所述数据包进行隧道剥离和分片重组之后，进行ETH层、IP层、TCP/UDP层的解析，判断所述数据包的传输层协议是否为UDP协议的数据包。

进一步地，所述根据所述数据包的应用层协议和语音流表，判断所述数据包是否包含实时传输协议，包括：

解析并还原所述数据包的应用层协议；

分析所述应用层协议中是否包含会话初始协议；

在所述应用层协议中不包含会话初始协议的情况下，提取所述数据包的四元组信息，所述四元组信息包括：源IP、源端口、目的IP和目的端口；

使用所述四元组信息和反转四元组信息作为KEY查询语音流表；

在语音流表中未获取相关信息的情况下，则认为该数据包不包括实时传输协议，丢弃该数据包；

在语音流表中获取相关信息的情况下，判断所述数据包是包含实时传输协议的数据包。

进一步地，所述语音编码信息包括：媒体数据编码类型，所述其他会话信息包括：会话ID、用户终端、接收与发送媒体数据的地址和支持的媒体数据编码类型列表。

进一步地，所述在所述数据包包含实时传输协议的情况下，获取与该数据包同源且包含实时传输协议的数据包，并基于所有数据包的实时传输协议中的payload字段，进行语音文件还原，包括

在所述数据包包含实时传输协议的情况下，解析所述UDP协议的payload字段中的实时传输协议信息，并提取所述UDP协议的payload字段中的原始语音数据；所述实时传输协议信息包括：有效载荷类型、序号和同步源标识符；

基于所述同步源标识符，获取该数据包的同源数据包；

将所述数据包与所述同源数据包进行序号比对；

在比对结果显示所述数据包的序号为乱序的情况下，丢弃该数据包；

在比对结果显示所述数据包的序号正常的情况下，构建包含所述数据包与所述同源数据包的数据包集合；

针对数据包集合中每一数据包，提取所述实时传输协议的payload字段中的原始语音数据；

根据序号重组所述原始语音数据，且填充空缺数据包中的原始语音数据；

根据有效载荷类型对应编码类型的采样率、编码位数和通道数，对所述原始语音数据进行还原和解析后，添加音频头数据，以得到还原后的语音文件。

进一步地，所述在网络流量中，捕获传输层协议是UDP协议的数据包之前，还包括：初始化硬件和初始化软件；其中，所述硬件包括：网卡、CPU核和内存，所述软件包括：软件主句柄、日志模块、配置管理模块、插件模块、会话流表和语音流表和通信队列。

一种面向网络流量的实时VoLTE语音文件还原装置，所述装置包括：

构建模块，用于构建语音流表；所述语音流表包括：会话初始协议协商的四元组信息、语音编码信息和其他会话信息；

捕获模块，用于在网络流量中，捕获原始流量数据包；

判断模块，用于据所述数据包的应用层协议和语音流表，判断所述数据包是否包含实时传输协议；

还原模块，用于在所述数据包包含实时传输协议的情况下，获取与该数据包同源且包含实时传输协议的数据包，并基于所有数据包的实时传输协议中的payload字段，进行语音文件还原。

一种面向网络流量的实时VoLTE语音文件检测方法，所述方法包括：

基于配置的检测规则，生成规则树；其中，每一检测规则包含一规则条件，且对应于一响应动作；

基于上述任一方法，还原语音文件；

将所述语音文件转换为文本信息；

将所述文本信息输入所述规则树，并在所述文本信息命中所述规则条件的情况下，执行对应的响应动作。

一种面向网络流量的实时VoLTE语音文件检测装置，所述装置包括：

生成模块，用于基于配置的检测规则，生成规则树；

捕获模块，用于在网络流量中，捕获原始流量数据包；

转换模块，用于将所述语音文件转换为文本信息；

检测模块，用于将所述文本信息输入所述规则树，并在所述文本信息命中所述规则条件的情况下，执行对应的响应动作。

与现有技术相比，本发明具有如下的技术优势：

(1)本发明能够在高速骨干网络环境中，实时高效捕获数据口的LTE移动网流量，快速检测还原流量中的VoLTE语音信息。

(2)本发明支持对已知的20余种语音编码格式的音频文件进行解码分析，并转换为可以直接播放的语音文件。

(3)本发明可以对实时还原的语音信息进行分析，研判是否有电信广告推销行为，并实时做出切断语音的响应动作。

附图说明

图1为面向网络流量的实时VoLTE语音还原、检测方法的流程图。

图2为面向网络流量的实时VoLTE语音还原、检测装置的结构模块图。

具体实施方式

下面将结合附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本发明特定实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

本发明的VoLTE语音还原方法，通过实时采集LTE移动网中的原始流量，提取数据链路层数据帧，完成IP分片重组，还原传输层报文，根据配置信息提取协议变量，解析应用层协议，识别会话初始协议数据包，提取会话信息，建立会话流表和VoLTE语音流表，识别实时传输协议数据包提取语音编码信息和原始语音信息，实时还原并分析通话内容之后，根据相关规则中的关键词，研判是否有电信广告推销行为，并及时发起语音中断信号停止会话。

如图1所示，该VoLTE语音还原、检测方法包括以下步骤。

本发明公开了一种面向网络流量可以实时检测还原VoLTE语音的方法和系统，具体步骤如下：

(1)系统初始化

系统初始化包括硬件初始化和软件初始化，硬件初始化主要包括网卡、CPU核、内存等初始化；软件初始化主要包括软件主句柄、日志模块、配置管理模块、插件模块、会话流表和语音流表、通信队列等初始化。

一示例中，系统初始化过程包括：

a.程序启动后首先需要读取配置文件中的硬件配置信息，初始化硬件设备，确定捕获数据包网卡名，获取数据接收、数据处理、数据发送分配的CPU核心，获取内存页大小参数；其次配置系统软件参数，配置会话流表和语音流表的默认大小，配置需要加载的插件模块，初始化主句柄内存并返回首地址指针，初始化日志发送模块和配置规则接收模块，初始化后转至步骤(1)-b。

b.判断系统是否初始化成功，系统初始化成功后转至步骤(2)-a，否则系统自动打印初始化失败信息并退出。

(2)配置规则解析

主要包含配置接收解析和规则接收解析，配置用于对系统的各项参数进行约束，包括网卡名、系统工作模式、插件路径、会话数量、文件保存地址等系统配置参数，配置接收可以实时接收下发配置或者读取离线的配置文件，实时加载到系统中，控制系统运行方式。

规则用于对流量细粒度的筛选比对，通过不同的规则来精细化分类网络流量，系统对特定协议字段流量中的VoLTE语音还原分析，并根据规则中的动作信息做出响应动作。规则解析包括规则格式校验、规则条件解析、规则动作解析、规则条件编译等阶段。

一示例中，配置规则解析过程，包括：

a.读取本地静态规则文件，逐条解析规则内容，提取过滤条件和响应动作，编译成规则树，加载进系统，每条规则包括规则ID、规则名、规则条件和响应动作；规则提取完成转至步骤(2)-b。

b.判断规则是否解析成功，规则解析成功转至步骤(3)，否则系统自动打印规则解析失败信息并退出。

(3)原始流量捕获解析

原始流量捕获通过轮询机制直接将数据包从网卡映射到用户态内存空间，应用层程序直接在用户态的数据平面层获取数据，减少了CPU中断，节省了CPU中断和内存拷贝花费的时间。

一示例中，通过监听网卡实时从网卡获取流量。为了提升数据处理效率，本发明采用线程分工机制，线程分为捕获流量线程，流量处理线程和数据输出线程等，其中，线程与CPU核心绑定，提高特定线程的性能，为了减少线程访问同一内存的竞争，采用内存池分配机制，为每个线程分配独立的内存空间，每个线程分配独立的流表内存空间。

数据捕获线程根据数据包的五元组信息将数据包哈希到唯一的线程和会话流表中，从而保证同源同溯的数据包分配到同一线程和会话流表。其中，该五元组信息包括：源IP地址、源端口、目的IP地址、目的端口和传输层协议。

数据流量处理线程将获取的数据包分别在数据链路层、IP层和传输层解析。数据链路层用于根据以太网帧的协议结构，从以太网帧头提取MAC地址和上一层的协议类型等信息；IP层用于完成数据包分片重组，并还原完整的IP数据包；传输层用于提取端口等信息，并分析传输层有效载荷是否包含会话初始协议和实时传输协议。

数据输出线程主要根据配置文件里面的传输方式和传输地址，将数据包解析后生成的日志、音频等信息发送出去。

(4)会话协议解析及会话语音关联

1)会话初始协议解析

通过解析还原应用层协议，分析应用层协议中是否包含会话初始协议，识别提取会话初始协议中的实时传输协议信息，分别在上行数据包和下行数据包中提取会话初始协议协商的会话信息，包括语音通话四元组信息(源IP、目的IP、源端口、目的端口)、语音编码信息(媒体数据编码类型)和其他会话信息(会话ID、用户终端、接收与发送媒体数据的地址、支持的媒体数据编码类型列表)，将会话初始协议提取的信息插入会话流表，具体提取的信息如表1。

表1会话初始协议提取信息

2)会话语音关联

会话初始协议解析，通过正向和反向流提取该会话初始协议协商的会话信息，将提取语音通话四元组信息插入语音流表；捕获到新的数据包时，先识别应用层协议是否包含会话初始协议，如果不包含会话初始协议，提取该数据包的四元组信息查询语音流表，如果查到说明是实时传输协议，提取语音信息。

一示例中，会话协议解析及会话语音关联过程，包括：

a.识别会话初始协议，通过分析应用层协议，即TCP和UDP协议的payload字段，匹配该payload字段是否包含会话初始协议的特征字段，根据会话初始协议的特征字段识别流量中是否包含会话初始协议，如果识别数据包不是会话初始协议数据包，则转至步骤(5)，如果识别出数据包是会话初始协议数据包，则转至步骤(4)-b解析会话初始协议。

b.解析会话初始协议，提取会话初始协议协商的会话信息，提取语音通话四元组，会话ID，编码类型，实时传输协议使用的IP和端口等信息，提取完字段后转至步骤(4)-c。

c.判断会话是否在会话流表，通过解析会话初始协议，提取会话初始协议数据包五元组信息，使用该五元组作为KEY查询会话流表，如果没有查询到，则反转五元组的源目的IP和端口，重新查询会话流表，如果两次都没有在会话流表查询到会话信息，说明该数据包是一个新网络流中的数据包，转至步骤(4)-d，插入会话信息至会话流表；否则通过五元组信息或者反转后的五元组信息在会话流表查询到相关信息，说明该数据包所在的网络流已经存在，则转至步骤(4)-e判断会话流表是否有完整的语音通话四元组信息。

d.插入会话信息至会话流表，通过该五元组新建会话流记录插入会话流表，同时将会话初始协议提取的会话信息插入会话流表，则转至步骤(3)继续捕获数据包。

e.判断会话流表是否有完整的语音通话四元组，判断会话流表中是否已经保存有完整的会话信息，即分别从会话初始协议的上行数据包和下行数据包提取到实时传输协议使用的语音通话四元组，如果会话流表中没有完整的语音通话四元组信息，则转至步骤(3)继续捕获数据包；如果发现会话流表已经有协商好的实时传输协议使用的语音通话四元组信息，则转至步骤(4)-f,判断该四元组是否在语音流表。

f.判断该四元组是否在语音流表，使用该四元组信息作为KEY查询语音流表，如果查询不到，反转四元组信息继续查找，如果能查询到，说明会话初始协议协商的语音通话四元组信息已经建立了语音流表，则同步会话流表和语音流表中的信息，转至步骤(3)继续捕获数据包；否则说明该四元组不在语音流表，则转至步骤(4)-g插入语音信息至语音流表。

g.插入语音信息至语音流表，如果查询不到说明会话初始协议协商的语音通话四元组还没有插入到语音流表，则使用该四元组新建语音流记录插入语音流表，同时同步语音流表和会话流表中的信息，转至步骤(3)继续捕获数据包。

(5)实时传输语音协议解析

新的数据包通过查找语音流表，识别实时传输协议，提取协议中各个字段信息，具体提取信息如表2：

表2实时传输协议提取信息

一示例中，实时传输语音协议解析过程，包括：

a.识别实时传输协议，通过层层解析数据包，判断传输层是否为UDP协议，如果传输层不是UDP协议转至步骤(3)继续捕获数据包；否则提取数据包的四元组信息，使用该四元组信息作为KEY查询语音流表，如果查询不到，反转四元组信息重新查找语音流表，如果查询不到则转至步骤(3)继续捕获数据包；否则通过四元组信息或者反转后的四元组信息在语音流表查询到相关信息，说明该数据包所在的网络流已经存在语音流表，从而识别该数据包为实时传输协议，转至步骤(5)-b解析实时传输协议。

b.解析实时传输协议，提取数据包UDP协议的payload字段，解析payload中的实时传输协议信息，提取有效载荷类型、序号、时间戳，同步源标识符等信息，根据有效载荷类型查询语音编码信息，根据同步源标识符判断该数据包是否来自同一数据源，将提取的协议信息插入到语音流表中，转至步骤(6)-a判断语音数据包序列。

(6)语音信息解码还原

通过查找语音流表确定是实时传输协议，提取协议字段中的有效载荷编码类型和协议载荷信息，根据协议序列号缓存语音信息，依据乱序包丢弃和缺失包填充的原则处理乱序数据包和缺失数据包。根据协议字段中有效载荷编码类型对原始语音数据添加采样率、编码位数和通道数等信息，实时将语音原始数据转换为语音文件。系统支持的语音解码类型如表3：

表3系统支持的语音解码类型

一示例中，语音信息解码还原过程，包括：

a.判断语音数据包是否乱序，将实时传输协议中提取的序号与语音流表中同源的上个数据包的序号对比，如果是乱序则丢弃该数据包转至步骤(3)继续捕获数据包，否则转至步骤(6)-b解码还原语音信息。

b.解码还原语音信息，识别出实时传输协议，提取实时传输协议payload中的原始语音数据，根据序号重组原始语音数据并填充空缺数据包中的语音数据，同时提取有效载荷类型编号，根据有效载荷类型对应编码类型的采样率、编码位数和通道数等信息对提取出的原始语音数据进行还原和解析，将还原语音数据添加音频头数据形成语音文件，实时传送到语音识别模块中，转至步骤(7)-a进行语音分析。

(7)语音识别研判

1)文字转储与识别

通过语音识别模块将解码的音频流实时转换为文本信息，将文本信息输入到规则树中，从树根正向推理，每个节点进行分析比对，直到叶子节点。规则树是根据规则文件在规则编译阶段生成，如果文本流可以到达叶子节点说明该语音命中规则，将启动响应动作。

2)安全响应

通过分析语音文件，过滤规则树，发现语音流中是否存在规则中的关键词，如果命中规则内容，将根据规则对应的响应动作执行安全响应，留存相应的音频文件和日志，并构造一个会话初始协议的结束会话数据包，发送给会话发起方。

一示例中，语音识别研判过程，包括：

a.将还原出的语音文件，输入到语音识别模块，将语音信息识别转换为文字信息，并把生成的文字信息输入到编译生成规则树中，该规则树根据规则文件解析编译生成，在规则树中推理匹配，转至步骤(7)-b判断是否命中规则。

b.判断语音内容是否命中规则，通过将语音的文本文件输入给规则树，过滤匹配语音文件是否包含规则中的条件信息，当发现命中规则条件后，转至步骤(7)-c，做出该规则对应的响应动作；否则转至步骤(8)。

c.当语音内容命中规则条件后，根据该规则中响应动作实时做出相应动作，发送特定的“Bye”信令包中断通话，转至步骤(8)输出格式化数据。

(8)数据格式化发送

1)各类日志输出

日志主要包含系统运行状态日志、处理机状态日志、系统信息日志等，通过构造传输层报文和http接口发送日志，日志留存的字段如表4：

表4日志字段信息

序号	字段值	说明
			1	Call-ID	会话ID
2	From	主叫地址
			3	To	被叫地址
4	S-IP-Calling	主叫会话地址
			5	S-Port-Calling	主叫会话端口
6	S-IP-Called	被叫会话地址
			7	S-Port-Called	被叫会话端口
8	C-IP-Calling	主叫通话地址
			9	C-Port-Calling	主叫通话端口
10	C-IP-Called	被叫通话地址
			11	C-Port-Called	被叫通话端口
12	User-Agent-Calling	主叫客户端
			13	User-Agent-Called	被叫客户端
14	RTP/AVP-Calling	主叫编码列表
			15	RTP/AVP-Called	被叫编码列表
16	Payload-Type	通话编码类型
			17	Bye-From	挂断发起地址
18	Duration	会话持续时间

2)原始文件落盘

根据不同有效载荷编码类型对应的采样频率、编码位数和通道数，给原始音频文件添加不同格式的音频文件头，将原始音频文件转换为可以直接播放的音频文件存储本地磁盘。

一示例中，将系统运行的状态日志、处理机日志和系统信息等日志通过日志接口模块发送到日志处理系统，主要包含会话ID、客户端类型、通话时间、通话IP地址等信息。并将还原的音频文件添加对应的扩展名，将生成音频文件存储到本地，形成可直接播放的音频文件。

综上所述，本发明能够在高速骨干网络环境中，实时高效捕获数据口的LTE移动网流量，快速检测还原流量中的VoLTE语音信息，并对实时还原的语音信息进行分析，研判是否有电信广告推销行为，并实时做出切断语音的响应动作。实验表明，本发明支持对已知的20余种语音编码格式的音频文件进行解码分析，并转换为可以直接播放的语音文件。

基于同一发明构思，本发明还公开了一种面向网络流量的实时VoLTE语音还原装置，包括：

捕获模块，用于在网络流量中，捕获原始流量数据包；

上述实时VoLTE语音还原装置的各个实施例的具体处理及其带来的技术效果，可分别参考上述方法实施例中的相关说明，在此不再赘述。

基于同一发明构思，本发明还公开了一种面向网络流量的实时VoLTE语音检测装置，如图2所示，包括：

生成模块，用于基于配置的检测规则，生成规则树；

捕获模块，用于在网络流量中，捕获原始流量数据包；

转换模块，用于将所述语音文件转换为文本信息；

同样的，上述实时VoLTE语音检测装置的各个实施例的具体处理及其带来的技术效果，可分别参考上述方法实施例中的相关说明，在此不再赘述。

基于同一发明构思，本发明的另一实施例提供一种电子装置(计算机、服务器、智能手机等)，其包括存储器和处理器，所述存储器存储计算机程序，所述计算机程序被配置为由所述处理器执行，所述计算机程序包括用于执行本发明方法中各步骤的指令。

基于同一发明构思，本发明的另一实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘)，所述计算机可读存储介质存储计算机程序，所述计算机程序被计算机执行时，实现本发明方法的各个步骤。

尽管为说明目的公开了本发明的具体实施流程和实例附图，其目的在于帮助理解本发明的内容并据以实施，但是本领域的技术人员可以理解：在不脱离本发明及所附的权利要求的精神和范围内，各种替换、变化和修改都是可能的。因此，本发明不应局限于所展示实施流程和实例附图所公开的内容。

Claims

1.一种面向网络流量的实时VoLTE语音文件还原方法，其特征在于，所述方法包括：

在网络流量中，捕获传输层协议是UDP协议的数据包；

2.如权利要求1所述的方法，其特征在于，所述构建语音流表，包括：

在网络流量中，捕获传输层协议是TCP和UDP协议的数据包；

解析并还原数据包的应用层协议；

分析所述应用层协议中是否包含会话初始协议；

3.如权利要求1所述的方法，其特征在于，所述在网络流量中，捕获传输层协议是UDP协议的数据包，包括：

捕获网络流量中的数据包；

4.如权利要求1所述的方法，其特征在于，所述根据所述数据包的应用层协议和语音流表，判断所述数据包是否包含实时传输协议，包括：

解析并还原所述数据包的应用层协议；

分析所述应用层协议中是否包含会话初始协议；

5.如权利要求1所述的方法，其特征在于，所述语音编码信息包括：媒体数据编码类型，所述其他会话信息包括：会话ID、用户终端、接收与发送媒体数据的地址和支持的媒体数据编码类型列表。

6.如权利要求1所述的方法，其特征在于，所述在所述数据包包含实时传输协议的情况下，获取与该数据包同源且包含实时传输协议的数据包，并基于所有数据包的实时传输协议中的payload字段，进行语音文件还原，包括

基于所述同步源标识符，获取该数据包的同源数据包；

将所述数据包与所述同源数据包进行序号比对；

7.如权利要求1-6任一项所述的方法，其特征在于，所述在网络流量中，捕获传输层协议是UDP协议的数据包之前，还包括：初始化硬件和初始化软件；其中，所述硬件包括：网卡、CPU核和内存，所述软件包括：软件主句柄、日志模块、配置管理模块、插件模块、会话流表和语音流表和通信队列。

8.一种面向网络流量的实时VoLTE语音文件还原装置，其特征在于，所述装置包括：

捕获模块，用于在网络流量中，捕获原始流量数据包；

9.一种面向网络流量的实时VoLTE语音文件检测方法，其特征在于，所述方法包括：

基于权利要求1-7项的任一方法，还原语音文件；

将所述语音文件转换为文本信息；

10.一种面向网络流量的实时VoLTE语音文件检测装置，其特征在于，所述装置包括：

生成模块，用于基于配置的检测规则，生成规则树；

捕获模块，用于在网络流量中，捕获原始流量数据包；

转换模块，用于将所述语音文件转换为文本信息；