CN114244911A

CN114244911A - 语音解析方法、装置、接收端设备及存储介质

Info

Publication number: CN114244911A
Application number: CN202111591603.XA
Authority: CN
Inventors: 张红飞; 黄晓光; 付磊
Original assignee: Guangzhou Huiruisitong Technology Co Ltd
Current assignee: Guangzhou Huiruisitong Technology Co Ltd
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2022-03-25

Abstract

本公开涉及一种语音解析方法、装置、接收端设备及存储介质。该方法包括接收待解析语音IP数据包；基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型；基于业务类型，获取待解析语音IP数据包中的载荷数据；确定载荷数据的帧类型；按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。由于能够根据待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型及帧类型，并基于该业务类型确定待解析语音IP数据包中的载荷数据，所以即使不对待解析语音IP数据包进行解压缩，也能得到基于载荷数据解析得到语音数据，相比于相关技术大大提高了语音解析的效率。

Description

语音解析方法、装置、接收端设备及存储介质

技术领域

本公开涉及通信领域，尤其涉及一种语音解析方法、装置、接收端设备及存储介质。

背景技术

在3GPP(3rd Generation Partnership Project，第三代合作伙伴计划)LTE(LongTerm Evolution，长期演进)中，为了提高空口宽带利用效率，使用压缩算法对PDCP层(Packet Data Convergence Protocol，分组数据集中协议)中IP(Internet Protocol，网际互连协议)/UDP(User Datagram Protocol，数据报文协议)/RTP(Real-time TransportProtocol，实时传输协议)头部进行压缩。

具体应用时，发送端根据Profile(数据配置文件)和上下文对报文进行头部压缩，接收端根据Profile和上下文对压缩后的报文头部进行解压缩，在解压缩之后，还需要解析IP/UDP/RTP协议头才能得到报文中的语音数据。

发明内容

发明人在对相关技术的研究过程中发现，对报文头部进行解压缩、以及解析IP/UDP/RTP协议头耗费的时间较长，会导致解析语音数据的效率较低。

第一方面，提供一种语音解析方法，包括：

接收待解析语音IP数据包；

基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型；

基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据；

确定所述载荷数据的帧类型；

按照所述帧类型和所述业务类型，转换得到与所述载荷数据对应的数据帧。

可选地，所述基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型，包括：

从所述待解析语音IP数据包的尾部提取第一长度的第一字节数据；

获取所述第一字节数据中位于预设比特位的第一目标数据；

当确定所述第一目标数据与第一数值相同时，确定所述业务类型为所述第一长度所匹配的业务类型。

可选地，所述从所述待解析语音IP数据包的尾部提取第一长度的第一字节数据之前，还包括：

获取所述待解析语音IP数据包的字节长度；

确定所述字节长度大于所述第一长度。

可选地，所述基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据，包括：

当所述业务类型为所述第一长度所匹配的业务类型时，获取所述第一目标数据中指示帧类型的字段的第一字段值；

当所述第一字段值为第二数值时，确定所述第一字节数据为载荷数据；

当所述第一字段值不为所述第二数值时，从所述第一字节数据的尾部提取第二长度的第二字节数据，当确定所述第二字节数据指示帧类型的字段的第二字段值为第三数值时，确定所述第二字节数据为载荷数据。

可选地，所述确定所述载荷数据的帧类型，包括：

当所述第一字段值为所述第二数值时，确定所述帧类型为语音帧；

当所述第二字段值为所述第三数值时，确定所述帧类型为噪音帧。

可选地，所述基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型，还包括：

当确定所述第一目标数据与所述第一数值不相同时，从所述待解析语音IP数据包的尾部提取第三长度的第三字节数据，所述第三长度大于所述第一长度；

获取所述第三字节数据中位于所述预设比特位的第二目标数据；

当确定所述第二目标数据与第四数值相同时，确定所述业务类型为所述第三长度所匹配的业务类型。

可选地，所述基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据，还包括：

当所述业务类型为所述第三长度所匹配的业务类型时，获取所述第二目标数据中指示帧类型的字段的第三字段值；

当所述第三字段值为第五数值时，确定所述第三字节数据为载荷数据；

当所述第三字段值不为所述第五数值时，从所述第三字节数据的尾部提取第四长度的第四字节数据，当确定所述第四字节数据中指示帧类型的字段值为第六数值时，确定所述第四字节数据为载荷数据。

可选地，所述确定所述载荷数据的帧类型，还包括：

当所述第三字段值为所述第五数值时，确定所述帧类型为语音帧；

当所述第四字段值为所述第六数值时，确定所述帧类型为噪音帧。

可选地，所述待解析语音IP数据包为语音解析过程中的任一数据包；

所述按照所述帧类型和所述业务类型，转换得到与所述待解析语音IP数据包对应的数据帧之后，还包括：

当确定获得所述语音解析过程中所有的语音IP数据包的数据帧后，获取与所述业务类型对应的语音帧头；

生成与所述语音帧头和所述所有的语音IP数据包的数据帧对应的语音音频文件，其中所述语音帧头为所述语音音频文件的帧头。

可选地，所述确定获得所述语音解析过程中所有的语音IP数据包的数据帧，包括：

当接收到语音结束信令时，确定获得所述语音解析过程中所有的语音IP数据包的数据帧；

或，

当在预设时间内未接收到语音IP数据包时，确定获得所述语音解析过程中所有的语音IP数据包的数据帧。

第二方面，提供一种语音解析装置，包括：

接收单元，用于接收待解析语音IP数据包；

第一确定单元，用于基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型；

获取单元，用于基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据；

第二确定单元，用于确定所述载荷数据的帧类型；

转换单元，用于按照所述帧类型和所述业务类型，转换得到与所述载荷数据对应的数据帧。

第三方面，提供一种接收端设备，包括：处理器、存储器和通信总线，其中，处理器和存储器通过通信总线完成相互间的通信；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述存储器中所存储的程序，实现第一方面所述的语音解析方法。

第四方面，提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的语音解析方法。

本公开实施例提供的上述技术方案与现有技术相比具有如下优点：本公开实施例提供的该方法，接收待解析语音IP数据包；基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型；基于业务类型，获取待解析语音IP数据包中的载荷数据；确定载荷数据的帧类型；按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。由于能够根据待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型及帧类型，并基于该业务类型确定待解析语音IP数据包中的载荷数据，所以即使不对待解析语音IP数据包进行解压缩，也能得到基于载荷数据解析得到语音数据，相比于相关技术大大提高了语音解析的效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例中语音解析方法的流程示意图；

图2为本公开实施例中语音解析装置的结构示意图；

图3为本公开实施例中接收端设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于理解本公开的实施例，下面对本公开涉及的部分术语进行解释说明。

CMR，codec mode request，编码模式请求；

FT，Frame Type，帧类型；

Q，Quality，帧质量；

P，Padding，填充。

本公开实施例提供一种语音解析方法，该方法可应用于接收端设备；

本公开实施例所描述接收端设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、视频矩阵、监控平台、移动互联网设备(MID，Mobile Internet Devices)、穿戴式设备、基站(如宏基站、小基站等)等，上述仅是举例，而非穷举，包含但不限于上述装置，当然，上述接收端设备还可以为服务器，例如，云服务器。

如图1所示，该方法可以包括以下步骤：

步骤101、接收待解析语音IP数据包。

应理解，待解析语音IP数据包为来自于发送端设备、且经过压缩的数据包。

应用中，由于设备通常在UM模式(非确认模式)下传输语音数据，所以，本实施例中的接收端设备和发送端设备在传输语音IP数据包时均处于UM模式。

步骤102、基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型。

本实施例中，待解析语音IP数据包的业务类型为窄带(NB，Narrow Band)业务或宽带(WB，Wide Band)业务。应理解，本实施例并不限定待解析语音IP数据包的业务类型只能为NB业务或WB业务。

一个具体实施例中，从待解析语音IP数据包的尾部提取第一长度的第一字节数据；获取第一字节数据中位于预设比特位的第一目标数据；当确定第一目标数据与第一数值相同时，确定业务类型为第一长度所匹配的业务类型。

其中此处与第一长度所匹配的业务类型可以为NB业务。协议中规定，对于属于NB业务的语音IP数据包，其payload(载荷数据)的长度为32字节，且基于经验发现该32字节数据的前2～10bit的十进制值为463。因此可以通过设置第一长度为32字节、预设比特位为32字节中前2～10bit以及第一数值为463，来确定待解析语音IP数据包的业务类型是否为NB业务。应当理解，从待解析语音IP数据包的尾部提取第一长度的第一字节数据，该第一字节数据由待解析语音IP数据包的末位字节开始计算，截取长度为第一长度的数据，该段数据即为第一字节数据。其中，第一目标数据为第一字节数据即32字节数据中前2～10bit，即假设接收待解析语音IP数据包时，按照接收时间先后顺序，先接收报文头部，再接收32字节的载荷数据，该第一目标数据即32字节的载荷数据中靠近报文头部的前2～10bit，即32字节的载荷数据中靠近报文头部第一个字节(1字节＝8bit)中第二个到第八个比特，加上第二字节中第一个到第二个比特组成的9个比特的数据。可以理解的是，第一数值463为十进制数据，在实际应用时，需要将第一目标数据(二进制数据)转换为十进制数据进行判断。

本实施例中，为了提高处理效率，避免无效操作，在从待解析语音IP数据包的尾部提取第一长度的第一字节数据之前，还可以获取待解析语音IP数据包的字节长度，并确定字节长度大于第一长度。

其中当确定待解析语音IP数据包的业务类型不为NB业务时，还可以进一步确定待解析语音IP数据包的业务类型是否为WB业务。

一个具体实施例中，当确定第一目标数据与第一数值不相同时，从待解析语音IP数据包的尾部提取第三长度的第三字节数据，第三长度大于第一长度；获取第三字节数据中位于预设比特位的第二目标数据；当确定第二目标数据与第四数值相同时，确定业务类型为第三长度所匹配的业务类型。

协议中规定，对于属于WB业务的语音IP数据包，其payload(载荷数据)的长度为61字节，且基于经验发现该61字节数据的前2～10bit的十进制值为465。因此可以通过设置第二长度为61字节、预设比特位为前2～10bit以及第二数值为465，来确定待解析语音IP数据包的业务类型是否为WB业务。对于此实施例所指的第三字节数据、第二目标数据以及第四数值的具体解释参照前述NB业务相关解释，此处不再赘述。

本实施例中，为了提高处理效率，避免无效操作，在从待解析语音IP数据包的尾部提取第三长度的第三字节数据之前，还可以获取待解析语音IP数据包的字节长度，并确定字节长度大于第三长度。

应理解，在本公开的其它实施例中，也可以先基于待解析语音IP数据包尾部的第三字节数据判定待解析语音IP数据包是否为WB业务，并当确定不为WB业务时，再基于待解析语音IP数据包尾部的第一字节数据判定待解析语音IP数据包是否为NB业务。也就是说，本公开并不限定确定待解析语音IP数据包为NB业务或WB业务的执行顺序。

本公开另一实施例中，为了提高语音解析效率，还可以基于接收的上一个待解析语音IP数据包的业务类型，确定当前接收的待解析语音IP数据包的业务类型。具体地，将上一个待解析语音IP数据包的业务类型，作为待解析语音IP数据包的业务类型。

应理解，当当前接收的待解析语音IP数据包为接收端设备接收的第一个待解析语音IP数据包，即不存在当前接收的待解析语音IP数据包的上一个待解析语音IP数据包时，通过待解析语音IP数据包的尾部的特征确定该待解析语音IP数据包的业务类型。

步骤103、基于业务类型，获取待解析语音IP数据包中的载荷数据。

当业务类型为第一长度所匹配的业务类型时，一个具体实施例中，

获取第一目标数据中指示帧类型的字段的第一字段值；当第一字段值为第二数值时，确定第一字节数据为载荷数据；当第一字段值不为第二数值时，从第一字节数据的尾部提取第二长度的第二字节数据，当确定第二字节数据指示帧类型的字段的第二字段值为第三数值时，确定第二字节数据为载荷数据。

应理解这里第一长度所匹配的业务类型可以为NB业务。

基于经验发现，对于NB业务，第一目标数据可以为待解析IP数据包尾部的32字节数据的前2～10bit数据，第一字段值可以为第一目标数据的前5～8bit的值，也就是说，第一目标数据是指32字节数据中靠近报文头部的第一字节中第二个到第八个比特，加上第二字节中第一个到第二个比特组成的9个比特的数据，而第一目标数据的前5～8bit是指32字节数据中靠近报文头部的第一字节中第六个到第八个比特，加上第二字节中第一个比特组成的4个比特的数据，第一字段值是指该4个比特的值。第二数值可以为7，第二长度可以为7字节，第二字节数据为第一字节数据尾部提取的7字节数据，即第二字节数据为32字节数据中最后7字节的数据。第二字节数据指示帧类型的字段值即为第二字节数据前6～9bit的值，也就是7个字节中第一个字节的第六到第八比特以及第二个字节的第一个比特武城的4个比特的数据的值，第三数值可以为8。可以理解的是，第二数值7及第三数值8为十进制数据，在实际应用时，需要将对应比特位上的二进制数据转换为十进制数据进行判断。

应理解，当第二字节数据中指示帧类型的字段的第二字段值不为第三数值时，表示待解析语音IP数据包中不存在属于NB业务的载荷数据，此时结束流程。

当业务类型为第三长度所匹配的业务类型时，一个具体实施例中，获取第二目标数据中指示帧类型的字段的第三字段值；当第三字段值为第五数值时，确定第三字节数据为载荷数据；当第三字段值不为第五数值时，从第三字节数据的尾部提取第四长度的第四字节数据，当确定第四字节数据中指示帧类型的字段值为第六数值时，确定第四字节数据为载荷数据。

应理解，这里第三长度所匹配的业务类型可以为WB业务。

基于经验发现，对于WB业务，第二目标数据可以为待解析IP数据包尾部的61字节数据中的前2～10bit数据，第三字段值可以为第二目标数据的前5～8bit的值，第五数值可以为8，第四长度可以为7字节，第四字节数据为从61字节数据的尾部提取的7字节数据，第四字节数据中指示帧类型的字段值可以为第四字节数据中前6～9bit的值，第六数值可以为9。对于此实施例所指的第二目标数据、第四字节数据以及第三字段值、第五数值及第六数值的具体解释参照前述NB业务相关解释，此处不再赘述。

步骤104、确定载荷数据的帧类型。

本实施例中，载荷数据的帧类型为语音帧或噪音帧。其中可以通过载荷数据中指示帧类型的字段值确定载荷数据的帧类型。

当载荷数据为第一字节数据或第二字节数据时，一个具体实施例中，当第一字段值为第二数值时，确定帧类型为语音帧；当第二字段值为第三数值时，确定帧类型为噪音帧。

当载荷数据为第三字节数据或第四字节数据时，一个具体实施例中，当第三字段值为第五数值时，确定帧类型为语音帧；当第四字段值为第六数值时，确定帧类型为噪音帧。

步骤105、按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。

以下分别针对NB业务和WB业务两种业务类型的待解析语音IP数据包，展开说明转换过程。

当待解析语音IP数据包的业务类型为NB业务时：

若载荷数据的帧类型为语音帧，那么载荷数据的帧结构为：

CMR(4比特)+P(1比特填充)+FT(4比特)+Q(1比特)+语音比特(244比特)+填充比特；

转换得到的数据帧的帧结构为：

P(1比特填充)+FT(4比特)+Q(1比特)+P(2比特填充)+语音比特(244比特)+填充比特(4比特)。

应理解，转换得到的数据帧的帧结构中填充比特字段的填充值可以为0。

若载荷数据的帧类型为噪音帧，那么载荷数据的帧结构为：

CMR(4比特)+P(1比特填充)+FT(4比特)+Q(1比特)+语音比特(39比特)+填充比特；

转换得到的数据帧的帧结构为：

P(1比特填充)+FT(4比特)+Q(1比特)+P(2比特填充)+语音比特(39比特)+填充比特(1比特)。

当待解析语音IP数据包的业务类型为WB业务时：

若载荷数据的帧类型为语音帧，那么载荷数据的帧结构为：

CMR(4比特)+P(1比特填充)+FT(4比特)+Q(1比特)+语音比特(WB为477比特)+填充比特；

转换得到的数据帧的帧结构为：

P(1比特填充)+FT(4比特)+Q(1比特)+P(2比特填充)+语音比特(WB为477比特)+填充比特(3比特)。

若载荷数据的帧类型为噪音帧，那么载荷数据的帧结构为：

CMR(4比特)+P(1比特填充)+FT(4比特)+Q(1比特)+语音比特(WB为40比特)+填充比特；

转换得到的数据帧的帧结构为：

P(1比特填充)+FT(4比特)+Q(1比特)+P(2比特填充)+语音比特(WB为40比特)。

本公开实施例提供的技术方案中，接收待解析语音IP数据包；基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型；基于业务类型，获取待解析语音IP数据包中的载荷数据；确定载荷数据的帧类型；按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。由于能够根据待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型及帧类型，并基于该业务类型确定待解析语音IP数据包中的载荷数据，所以即使不对待解析语音IP数据包进行解压缩，也能得到基于载荷数据解析得到语音数据，相比于相关技术大大提高了语音解析的效率。

本公开另一实施例中，接收端设备还可以在收集齐语音解析过程中所有数据帧后，对收集的数据帧添加语音帧头文件，得到语音音频文件。

一个具体实施例中，待解析语音IP数据包为语音解析过程中的任一数据包，按照帧类型和业务类型，转换得到与待解析语音IP数据包对应的数据帧之后，当确定获得语音解析过程中所有的语音IP数据包的数据帧后，获取与业务类型对应的语音帧头；生成与语音帧头和所有的语音IP数据包的数据帧对应的语音音频文件，其中语音帧头为语音音频文件的帧头。

本实施例中，不同业务类型对应的语音帧头文件不同。例如，对于NB业务，对应的语音帧头文件可以为0x2321414D520A；对于WB业务，对应的语音帧头文件可以为0x2321414D522D57420A。

本实施例中，可以通过语音结束信令或预设时间内是否收到语音IP数据包，确定语音解析过程是否结束。

一个具体实施例中，当接收到语音结束信令时，确定获得语音解析过程中所有的语音IP数据包的数据帧；或，当在预设时间内未接收到语音IP数据包时，确定获得语音解析过程中所有的语音IP数据包的数据帧。

应用中，预设时间可以人为基于经验设置。

基于同一构思，本公开实施例中提供了一种语音解析装置，该装置的具体实施可参见方法实施例部分的描述，重复之处不再赘述，如图2所示，该装置200主要包括：

接收单元201，用于接收待解析语音IP数据包；

第一确定单元202，用于基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型；

获取单元203，用于基于业务类型，获取待解析语音IP数据包中的载荷数据；

第二确定单元204，用于确定载荷数据的帧类型；

转换单元205，用于按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。

可选地，第一确定单元202用于：

从待解析语音IP数据包的尾部提取第一长度的第一字节数据；

获取第一字节数据中位于预设比特位的第一目标数据；

当确定第一目标数据与第一数值相同时，确定业务类型为第一长度所匹配的业务类型。

可选地，该装置200还包括：

字节长度提取单元，用于从待解析语音IP数据包的尾部提取第一长度的第一字节数据之前，获取待解析语音IP数据包的字节长度；

字节长度确定单元，用于确定字节长度大于第一长度。

可选地，获取单元203用于：

当业务类型为第一长度所匹配的业务类型时，获取第一目标数据中指示帧类型的字段的第一字段值；

当第一字段值为第二数值时，确定第一字节数据为载荷数据；

当第一字段值不为第二数值时，从第一字节数据的尾部提取第二长度的第二字节数据，当确定第二字节数据指示帧类型的字段的第二字段值为第三数值时，确定第二字节数据为载荷数据。

可选地，第二确定单元204用于：

当第一字段值为第二数值时，确定帧类型为语音帧；

当第二字段值为第三数值时，确定帧类型为噪音帧。

可选地，第一确定单元202还用于：

当确定第一目标数据与第一数值不相同时，从待解析语音IP数据包的尾部提取第三长度的第三字节数据，第三长度大于第一长度；

获取第三字节数据中位于预设比特位的第二目标数据；

当确定第二目标数据与第四数值相同时，确定业务类型为第三长度所匹配的业务类型。

可选地，获取单元203还用于：

当业务类型为第三长度所匹配的业务类型时，获取第二目标数据中指示帧类型的字段的第三字段值；

当第三字段值为第五数值时，确定第三字节数据为载荷数据；

当第三字段值不为第五数值时，从第三字节数据的尾部提取第四长度的第四字节数据，当确定第四字节数据中指示帧类型的字段值为第六数值时，确定第四字节数据为载荷数据。

可选地，第二确定单元204还用于：

当第三字段值为第五数值时，确定帧类型为语音帧；

当第四字段值为第六数值时，确定帧类型为噪音帧。

可选地，待解析语音IP数据包为语音解析过程中的任一数据包；

该装置200还包括：

语音帧头获取单元，用于按照帧类型和业务类型，转换得到与待解析语音IP数据包对应的数据帧之后，当确定获得语音解析过程中所有的语音IP数据包的数据帧后，获取与业务类型对应的语音帧头；

音频文件生成单元，用于生成与语音帧头和所有的语音IP数据包的数据帧对应的语音音频文件，其中语音帧头为语音音频文件的帧头。

可选地，该装置200还包括：

第一检测单元，用于当接收到语音结束信令时，确定获得语音解析过程中所有的语音IP数据包的数据帧；

或，

第二检测单元，用于当在预设时间内未接收到语音IP数据包时，确定获得语音解析过程中所有的语音IP数据包的数据帧。

基于同一构思，本公开实施例中还提供了一种接收端设备，如图3所示，该接收端设备300主要包括：处理器301、存储器302和通信总线303，其中，处理器301和存储器302通过通信总线303完成相互间的通信。其中，存储器302中存储有可被处理器301执行的程序，处理器301执行存储器302中存储的程序，实现如下步骤：

接收待解析语音IP数据包；

基于待解析语音IP数据包的尾部的特征，确定待解析语音IP数据包的业务类型；

基于业务类型，获取待解析语音IP数据包中的载荷数据；

确定载荷数据的帧类型；

按照帧类型和业务类型，转换得到与载荷数据对应的数据帧。

上述接收端设备300中提到的通信总线303可以是外设部件互连标准(PeripheralComponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture，简称EISA)总线等。该通信总线303可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器302可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器301的存储装置。

上述的处理器301可以是通用处理器，包括中央处理器(Central ProcessingUnit，简称CPU)、网络处理器(Network Processor，简称NP)等，还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本公开的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当该计算机程序在计算机上运行时，使得计算机执行上述实施例中所描述的语音解析方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时，全部或部分地产生按照本公开实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种语音解析方法，其特征在于，包括：

接收待解析语音IP数据包；

确定所述载荷数据的帧类型；

2.根据权利要求1所述的方法，其特征在于，所述基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型，包括：

获取所述第一字节数据中位于预设比特位的第一目标数据；

3.根据权利要求2所述的方法，其特征在于，所述从所述待解析语音IP数据包的尾部提取第一长度的第一字节数据之前，还包括：

获取所述待解析语音IP数据包的字节长度；

确定所述字节长度大于所述第一长度。

4.根据权利要求2所述的方法，其特征在于，所述基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述确定所述载荷数据的帧类型，包括：

6.根据权利要求2所述的方法，其特征在于，所述基于所述待解析语音IP数据包的尾部的特征，确定所述待解析语音IP数据包的业务类型，还包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述业务类型，获取所述待解析语音IP数据包中的载荷数据，还包括：

8.根据权利要求7所述的方法，其特征在于，所述确定所述载荷数据的帧类型，还包括：

9.根据权利要求1-8任一项所述的方法，其特征在于，所述待解析语音IP数据包为语音解析过程中的任一数据包；

10.根据权利要求9所述的方法，其特征在于，所述确定获得所述语音解析过程中所有的语音IP数据包的数据帧，包括：

或，

11.一种语音解析装置，其特征在于，包括：

接收单元，用于接收待解析语音IP数据包；

第二确定单元，用于确定所述载荷数据的帧类型；

12.一种接收端设备，其特征在于，包括：处理器、存储器和通信总线，其中，处理器和存储器通过通信总线完成相互间的通信；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述存储器中所存储的程序，实现权利要求1-10任一项所述的语音解析方法。

13.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-10任一项所述的语音解析方法。