CN110418021A

CN110418021A - 一种基于双缓冲区智能缓存的语音对讲实现方法

Info

Publication number: CN110418021A
Application number: CN201910697141.6A
Authority: CN
Inventors: 洪靖云; 李雪松; 殷翰扬
Original assignee: Nanjing Anpu Software Co Ltd
Current assignee: Nanjing Anpu Software Co Ltd
Priority date: 2019-07-30
Filing date: 2019-07-30
Publication date: 2019-11-05
Anticipated expiration: 2039-07-30
Also published as: CN110418021B

Abstract

本发明提出了一种基于双缓冲区智能缓存的语音对讲实现方法，包括：设置第一语音缓冲区和第二语音缓冲区；对第一语音缓冲区和第二语音缓冲区进行初始化；当检测到一个讲话方的语音到来时，发出话权信令将话权切换到第一语音缓冲区，根据写指针的位置向第一语音缓冲区写入语音数据直至话权结束；当话权切换至另一个讲话方时，则发出话权信令将话权切换到第二语音缓冲区，根据写指针的位置向第二语音缓冲区写入语音数据直至话权结束；当话权再次切换时，则发出话权信令将话权切换到第一语音缓冲区，如此往复。本发明采用语音双缓冲区的方案，解决网络不佳引发的报文抖动、语音不连续、语音话权切换等问题，提升公网对讲语音的质量。

Description

一种基于双缓冲区智能缓存的语音对讲实现方法

技术领域

本发明涉及信息通讯技术领域，特别涉及一种基于双缓冲区智能缓存的语音对讲实现方法。

背景技术

众所周知，基于运营商网络的VOIP语音在实际传输和业务应用中，都会碰到网络丢包、网络抖动等问题，从而导致语音不连续、质量下降，影响客户体验。而解决网络抖动问题的主要手段就是进行语音缓存，通过语音缓存保证语音连续性。

然而基于运营商网络的语音对讲业务，除了解决网络抖动的语音缓存外，还需要解决话权切换场景下的语音播放问题。语音对讲业务，解决的方法一般还是延续VOIP语音的方案，采用单缓冲区进行语音缓存，这种方案存在如下一些问题：

(1)无法灵活调整缓冲区大小，导致语音不连续或者语音延时较大。

(2)语音话权切换时，无法准确判断语音播放的起始和停止点，从而导致语音漏字现象，也无法准确播放提示音。

(3)尤其是在遇到语音话权抢占时，可能导致话权切换失败，状态异常，从而影响正常对讲业务。

发明内容

本发明的目的旨在至少解决所述技术缺陷之一。

为此，本发明的目的在于提出一种基于双缓冲区智能缓存的语音对讲实现方法。

为了实现上述目的，本发明的实施例提供一种基于双缓冲区智能缓存的语音对讲实现方法，包括如下步骤:

步骤S1，设置第一语音缓冲区和第二语音缓冲区，其中，每个所述语音缓冲区对应一段语音通话的一个话权的讲话方，当话权切换时，语音缓冲区也相应切换；

步骤S2，对所述第一语音缓冲区和第二语音缓冲区进行初始化；

步骤S3，当检测到一个讲话方的语音到来时，发出话权信令将话权切换到第一语音缓冲区，根据写指针的位置向第一语音缓冲区写入语音数据直至话权切换；当话权切换至另一个讲话方时，则发出话权信令将话权切换到第二语音缓冲区，根据写指针的位置向第二语音缓冲区写入语音数据直至话权切换；当话权再次切换时，则发出话权信令将话权切换到第一语音缓冲区，如此往复。

进一步，在所述步骤S1中，采用智能缓冲策略根据统计得到的网络时延对所述第一语音缓冲区和第二语音缓冲区的大小进行调整。

进一步，在所述步骤S2中，所述对第一语音缓冲区和第二语音缓冲区进行初始化，包括如下步骤：将第一语音缓冲区和第二语音缓冲区的数据清零、初始化读指针的位置和写指针的位置。

进一步，每个所述语音缓冲区设置有读数据指针标识和写数据指针标识，其中，所述读数据指针标识用于判断读语音数据标识，所述写数据指针标识用于判断写语音数据标识。

进一步，每个语音缓冲区均循环使用。

进一步，在所述步骤S3中，从每个语音缓冲区读取语音数据时，等待语音数据在语音缓冲区缓冲到预设长度后开始读取数据，并持续读数据和播放语音，直到将所有写的数据读完为止。

进一步，在所述步骤S3中，在根据话权信令的基础上，进一步根据当前语音播放的位置判断话权切换。

进一步，在所述步骤S3中，当话权用户切换时，语音报文对应的会话ID会变化，当检测到会话ID变化时，则开始切换对应的写数据的语音缓冲区，并向该语音缓冲区持续写入语音数据，直至下一次会话切换。

进一步，在所述步骤S3中，当读数据缓冲到预设长度后，开始读语音数据并解码播放，直至将已有数据全部读完且话权用户已经切换，则停止读取本次会话的语音数据。

根据本发明实施例的基于双缓冲区智能缓存的语音对讲实现方法，具有以下有益效果：

(1)区别于传统的VOIP语音的单缓冲区方案，采用语音双缓冲区的方案，解决网络不佳引发的报文抖动、语音不连续、语音话权切换等问题，提升公网对讲语音的质量；

(2)根据语音数据的大小，能够准确判断语音开始和结束播放的位置点，避免漏字现象，从而更准确进行话权结束的声音提示；

(3)在进行话权切换时，能够解决话权抢占场景下语音尾音的问题，保证不会漏播语音包；

(4)通过智能缓存，能够适应不同的网络场景，保证语音总是连续的。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明实施例的基于双缓冲区智能缓存的语音对讲实现方法的流程图；

图2为根据本发明实施例的基于双缓冲区智能缓存的语音对讲实现方法的示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

本发明提供一种基于双缓冲区智能缓存的语音对讲实现方法，可以应用于公网对讲通讯领域，解决网络不佳引发的报文抖动、语音话权切换等问题，提升公网对讲语音的质量。

如图1所示，本发明实施例的基于双缓冲区智能缓存的语音对讲实现方法，包括如下步骤：

步骤S1，设置第一语音缓冲区和第二语音缓冲区。通过设置语音缓冲区进行语音缓存，可以解决网络抖动造成的报文乱序、报文延时等问题。

其中，每个语音缓冲区对应一段语音通话的一个话权的讲话方，当话权切换时，语音缓冲区也相应切换。在本发明的实施例中，每个语音缓冲区均循环使用。即：两个语音缓冲区循环使用，不需要多个缓冲区，这是由语音对讲的特点决定。因为PTT语音的特点，在同一时刻只能一个人讲话，即同一时刻只会有一个写缓冲区。读和写只会发生一次切换。因此，只需要两个缓冲区来回切换即可。

在本步骤中，根据网络抖动的统计数据，灵活计算缓冲区的大小。具体的，采用智能缓冲策略根据统计得到的网络时延对第一语音缓冲区和第二语音缓冲区的大小进行调整。采用智能缓冲策略可以更好地解决语音缓存大小的问题，能够适应不同的网络。

在本发明的实施例中，分别初始化2个固定大小的语音缓冲区，语音缓冲区的大小取决于最大的语音缓存时长。需要说明的是，上述“固定大小”是指语音缓冲区对应的最大的语音缓存时长。

在本发明的实施例中，每个语音缓冲区设置有读数据指针标识和写数据指针标识。其中，读数据指针标识用于判断读语音数据标识，写数据指针标识用于判断写语音数据标识。

步骤S2，在使用语音缓冲区前，对第一语音缓冲区和第二语音缓冲区进行初始化。

具体的，对第一语音缓冲区和第二语音缓冲区进行初始化，包括如下步骤：将第一语音缓冲区和第二语音缓冲区的数据清零、初始化读指针的位置和写指针的位置，初始化当前读指针的位置和当前写指针的位置等。

此外，从每个语音缓冲区读取语音数据时，等待语音数据在语音缓冲区缓冲到预设长度后开始读取数据，并持续读数据和播放语音，直到将所有写的数据读完为止。

下面参考图2对语音缓冲区的初始化和读写数据的流程进行说明：

(1)当一个用户话权A的语音到来时，切换到第一语音缓冲区，开始按照写指针的位置写语音数据，语音缓冲区是循环使用的，当写指针位置到末尾时，再继续从头开始写。读数据时，需要等语音数据缓冲到预设长度才开始读操作，并持续读数据和播放语音，直至将所有写的数据读完为止。

(2)当话权切换时，另一个用户话权B的语音到来时，切换到第二语音缓冲区，开始按照写指针的位置写语音数据。读语音的位置，也跟随切换到第二语音缓冲区读语音数据。

(3)当话权再次切换时，重新回到第一语音缓冲区进行写数据和读数据。

需要说明的是，在根据话权信令的基础上，本发明可以进一步根据当前语音播放的位置判断话权切换。即，采用话权信令和语音播放的位置进行综合判断话权切换。

下面对循环切换缓冲区的流程：

(1)写数据切换的判断：当话权用户切换时，语音报文对应的会话ID会变化，当检测到会话ID变化时，则开始切换对应的写数据的语音缓冲区，并向该语音缓冲区持续写入语音数据，直至下一次会话切换。

(2)读数据切换的判断：当读数据缓冲时间满足后(即读数据缓冲到预设长度)，开始读语音数据并解码播放，直到将已有数据全部读完，且话权用户已经切换，则停止读本次会话数据。当读数据结束时，如果话权用户已切换，则读指针跟随切换到另一个缓冲区。如果没有新话权用户，则保持现有缓冲区不变。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

Claims

1.一种基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，包括如下步骤：

步骤S3，当检测到一个讲话方的语音到来时，发出话权信令将话权切换到第一语音缓冲区，根据写指针的位置向第一语音缓冲区写入语音数据直至话权结束；当话权切换至另一个讲话方时，则发出话权信令将话权切换到第二语音缓冲区，根据写指针的位置向第二语音缓冲区写入语音数据直至话权结束；当话权再次切换时，则发出话权信令将话权切换到第一语音缓冲区，如此往复。

2.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S1中，采用智能缓冲策略根据统计得到的网络时延对所述第一语音缓冲区和第二语音缓冲区的大小进行调整。

3.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S2中，所述对第一语音缓冲区和第二语音缓冲区进行初始化，包括如下步骤：将第一语音缓冲区和第二语音缓冲区的数据清零、初始化读指针的位置和写指针的位置。

4.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，每个所述语音缓冲区设置有读数据指针标识和写数据指针标识，其中，所述读数据指针标识用于判断读语音数据标识，所述写数据指针标识用于判断写语音数据标识。

5.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，每个语音缓冲区均循环使用。

6.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S3中，从每个语音缓冲区读取语音数据时，等待语音数据在语音缓冲区缓冲到预设长度后开始读取数据，并持续读数据和播放语音，直到将所有写的数据读完为止。

7.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S3中，在根据话权信令的基础上，进一步根据当前语音播放的位置判断话权切换。

8.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S3中，当话权用户切换时，语音报文对应的会话ID会变化，当检测到会话ID变化时，则开始切换对应的写数据的语音缓冲区，并向该语音缓冲区持续写入语音数据，直至下一次会话切换。

9.如权利要求1所述的基于双缓冲区智能缓存的语音对讲实现方法，其特征在于，在所述步骤S3中，当读数据缓冲到预设长度后，开始读语音数据并解码播放，直至将已有数据全部读完且话权用户已经切换，则停止读取本次会话的语音数据。