CN113572736A

CN113572736A - 一种VoLTE语音报文双向合并实时播放方法

Info

Publication number: CN113572736A
Application number: CN202110710092.2A
Authority: CN
Inventors: 张波; 谢敏; 龙海波
Original assignee: Beijing Changkun Technology Co ltd
Current assignee: Beijing Changkun Technology Co ltd
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2021-10-29
Anticipated expiration: 2041-06-25
Also published as: CN113572736B

Abstract

本发明具体涉及一种VoLTE语音报文双向合并实时播放方法，首先将接收到的RTP文本创建上行、下行两路或多路RTP语音报文缓冲区队列；然后每到20ms定时器超时的情况，解析报文的RTP第一个timestamp信息，通过计算每个报文距离通话开始的时间差，找出上下行两个队列中各自时间差最大的语音帧；通过解析RTP头中的SN信息，遍历搜索其所在队列中具有相同SN的报文，从缓冲区中删除；将加权后的PCM信号直接送入播放器进行播放。本发明的有益效果是：保证语音报文顺序正确、到达时间对称。

Description

一种VoLTE语音报文双向合并实时播放方法

技术领域

本发明涉及VoLTE语音播放领域，具体涉及一种VoLTE语音报文双向合并实时播放方法。

背景技术

VoLTE全称为Voice over LTE(长期演进语音承载),是LTE网络中终端设备和网络传输语音数据的技术。VoLTE通信是一种基于LTE系统和IMS(InternetProtocolMultimedia System，互联网协议多媒体系统)网络的语音业务。

对于支持VoLTE技术的终端来说，语音播放只需要将网络发送到终端的语音报文解码播放即可，但在某些特殊场景需求下，网络发送给终端、终端发送给网络两个方向的语音报文需要双向实时播放，普通终端和通用技术则无法支持。

例如，专利申请号为202010074382.8的专利公布了一种VoLTE语音优化方法，针对VoLTE语音报文的传输从无线通信的角度提出了优化的策略，提高语音通话的MOS值，但该发明未提出关于双向语音报文播放的方法，所以不能解决上述问题。

又例如，专利申请号为201911358366.5的专利提出了一种RTP语音报文的混音方法，按照语音报文RTP头中信息区分出静音帧和目标终端信息，从而将语音报文发送到相应的终端上，从而实现了语音报文的混音。该发明虽然提出了一定的流程进行多路音频报文的混音，但对于多路音频报文的合并策略、报文乱序、多路达到时间不对称等问题未提出解决方法，所以也不能解决VoLTE语音报文双向合合并实时播放的问题。

由于本发明对于VoLTE语音报文双向合并播放的主要过程如语音报文乱序、到达时间不对称、双向合并等均提出了高效的处理方法，所有可以实现VoLTE语音报文的双向实时播放。

发明内容

针对现有技术存在的缺陷，本发明提出了一种VoLTE语音报文双向合并实时播放方法。

本发明的技术方案如下：

一种VoLTE语音报文双向合并实时播放方法，具体包括以下步骤：

步骤1、将接收到的RTP报文按照上行和下行、按接收的顺序存入上行和下行两个缓冲区；

步骤2、分别解析上行和下行缓冲区中第一个接收的报文RTP头中的timestamp(时间戳)字段中，记录为t1和t2；

步骤3、当上行和下行任何一个缓冲区域存储达到最大值后，启动20ms定时器；

步骤4、当20ms定时器超时的时候时，从上行缓冲区底部的报文开始，逐个解析RTP第一个timestamp，计算deltT＝timestamp-t1；通过遍历缓冲区中所有报文，找到deltT(两个语音报文的时间差)最大的语音帧，并记录最大的语音帧帧的位置为n1、时间差为delt1；

步骤5、重复步骤4中缓冲区处理部分，对下行缓冲区做与步骤4相同的处理，得到的位置记为n2、时间差记为delt2；

步骤6、解析n1位置语音报文RTP第一个的SN号，并检查上行缓冲区中所有报文，解析并进行对比，当有相同的SN号报文时，则将相同的SN号的报文从缓冲区中删除；

步骤7、解析n2位置语音报文RTP第一个的SN号，按步骤6，将重复的下行缓冲区n2位置的报文删除，并按照下列情况分别处理：

步骤7.1、当delt1大于delt2时，则只送n1位置的报文到语音解码器解码；

步骤7.2、当delt1小于delt2时，则只送n2位置的报文到语音解码器解码；

步骤7.3、当delt1等于delt2时，则送n1和n2位置两个报文到语音解码器解码；

步骤8、p1和p2是上行和下行语音音量权值，取值范围均为[0,1]，p1和p2通过预设置的方式确定参数，用于对语音解码器输出的PCM信号进行加权，设解码器输出上行和下行PCM信号分别记为pcm1、pcm2，加权后的信号分别为rpcm1、rpcm2，则语音音量加权计算公式(1)、公式(2)为：

rpcm1＝pcm1*p1……(1)，

rpcm2＝pcm2*p2……(2)，

步骤9、在步骤8的基础上，当步骤8中解码器输出的是一路PCM信号时，即只有上行的rpcm1或下行的rpcm2，则将rpcm1、rpcm2直接发送给播放器进行播放；

当步骤8中解码器输出的是二路PCM信号时，则生成rpcm信号，并将生成rpcm信号发送到播放器进行播放，rpcm生成的公式(3)如下：

rpcm＝rpcm1+rpcm2……(3)，

步骤10、生成的pcm数据流即为最终播放的数据，将最终的播放数据送入播放器(语音的编码译码器)进行播放。

进一步地，在步骤5中，当上述步骤确定的两个语音帧时间差不同，则取时间差大的语音帧，将时间差大的语音帧的RTP报文送入语音解码器，得到一个语音帧的PCM数据流；当上述步骤确定的两个语音帧时间差相等，则将这两个语音帧的RTP报文分别送入解码器，得到两个PCM数据流。

本发明所述VoLTE语音报文双向合并实时播放方法的有益效果是：

本发明在VoLTE语音报文双向合并播放的过程，克服了语音报文乱序、到达时间不对称、双向合并的弊端，保证语音报文顺序正确、到达时间对称，能够实现VoLTE语音报文的双向实时播放。

附图说明

图1为现有技术中典型VoLTE的传输RTP报文时间顺序示意图。

图2为本发明所述VoLTE语音报文双向合并实时播放方法提出的处理策略示意图。

图3为本发明所述VoLTE语音报文双向合并实时播放方法提出的方法软件流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。

如图2、图3所示，本发明的具体的实施步骤如下：

骤1、将接收到的RTP报文按照上行和下行、按接收的顺序存入上行和下行两个缓冲区；

步骤4、当20ms定时器超时的时候时，从上行缓冲区底部的报文开始，逐个解析RTP第一个timestamp，计算deltT＝timestamp-t1；通过遍历缓冲区中所有报文，找到deltT(两个语音报文的时间差)最大的语音帧，并记录该帧的位置为n1、时间差为delt1；

步骤7、解析n2位置语音报文RTP第一个的SN号，按步骤6方法，将重复的下行缓冲区n2位置的报文删除，并按照下列情况分别处理：

rpcm1＝pcm1*p1……(1)，

rpcm2＝pcm2*p2……(2)，

rpcm＝rpcm1+rpcm2……(3)，

本发明并不限于上述实施方式，在不背离本发明实质内容的情况下，本领域技术人员可以想到的任何变形、改进、替换均落入本发明的保护范围。

Claims

1.一种VoLTE语音报文双向合并实时播放方法，其特征在于，包括以下步骤：

步骤2、分别解析上行和下行缓冲区中第一个接收的报文RTP头中的timestamp字段中，记录为t1和t2；

步骤4、当20ms定时器超时的时候时，从上行缓冲区底部的报文开始，逐个解析RTP第一个timestamp，计算deltT＝timestamp-t1；通过遍历缓冲区中所有报文，找到deltT两个语音报文的时间差最大的语音帧，并记录该帧的位置为n1、时间差为delt1；

步骤6、解析n1位置语音报文RTP第一个的SN号，并检查上行缓冲区中所有报文，解析并进行对比，当有SN号相同的报文时，则将该SN号的报文从缓冲区中删除；

步骤8、p1和p2是上行和下行语音音量权值，取值范围均为[0,1]，p1和p2通过预设置的方式确定参数，用于对语音解码器输出的PCM信号进行加权，设解码器输出上行和下行PCM信号分别记为pcm1、pcm2，加权后语音音量的信号为rpcm1、rpcm2，则语音音量加权计算公式(1)、公式(2)为：

rpcm1＝pcm1*p1……(1)，

rpcm2＝pcm2*p2……(2)，

当步骤8中解码器输出的是二路PCM信号时，则生成rpcm信号，并将生成rpcm信号发送到播放器进行播放，rpcm生成的计算公式如下：

rpcm＝rpcm1+rpcm2……(3)，

步骤10、生成的pcm数据流即为最终播放的数据，将最终的播放数据送入播放器进行播放。

2.根据权利要求1所述的一种VoLTE语音报文双向合并实时播放方法，其特征在于，在步骤5中，当两个语音帧时间差不同，则取时间差大的语音帧，并将时间差大的语音帧的RTP报文送入语音解码器，得到一个语音帧的PCM数据流；当两个语音帧时间差相等，则将这两个语音帧的RTP报文分别送入解码器，得到两个PCM数据流。

3.根据权利要求1所述的一种VoLTE语音报文双向合并实时播放方法，其特征在于，步骤8中，加权后的语音音量信号rpcm1、rpcm2加权计算分别按照下式(1)、(2)计算：

rpcm1＝pcm1*p1……(1)，

rpcm2＝pcm2*p2……(2)。

4.根据权利要求1所述的一种VoLTE语音报文双向合并实时播放方法，其特征在于，步骤9中，rpcm生成的计算公式(3)如下：

rpcm＝rpcm1+rpcm2……(3)。