WO2018040432A1

WO2018040432A1 - 一种音频通话的实现方法、系统及智能会议设备

Info

Publication number: WO2018040432A1
Application number: PCT/CN2016/113264
Authority: WO
Inventors: 刘荣
Original assignee: 广州视源电子科技股份有限公司
Priority date: 2016-08-31
Filing date: 2016-12-29
Publication date: 2018-03-08
Also published as: CN106385517A

Abstract

本发明公开了一种音频通话的实现方法、系统及智能会议设备。该方法包括：接收对端发送的音频信号数据并缓存到播放缓存区；如果播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将无声信号写入所述参考缓存区；获取基于音频输入设备拾取的输入信号数据并写入输入缓存区；对从参考缓存区及输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。利用该方法，能够实时地保证信号数据连续地写入参考缓存区，由此保证了进行回声消除处理的信号数据的连续性，从而降低了回声消除的处理时间，同时提高了回声消除的处理效率，为提高回声消除性能的稳定性提供了基础。

Description

一种音频通话的实现方法、系统及智能会议设备

技术领域

本发明实施例涉及语音信号处理技术领域，尤其涉及一种音频通话的实现方法、系统及智能会议设备。

背景技术

对于具有通话功能的电子设备而言，主要依据集成在电子设备中的语音通话系统实现本端设备与对端设备的语音通话。当前的语音通话的实现过程可描述为：接收对端发送的语音信号数据并缓存至播放缓存区，然后从播放缓存区读取语音信号数据并通过调用系统的播放接口基于扬声器播放音频信号数据，同时将所播放的音频信号数据写入参考缓存区；之后通过调用系统的音频采集接口获取到基于麦克风拾取的输入信号数据，并将获取的输入信号数据写入输入缓存区，其中，该输入信号数据包括语音信号数据播放后形成了的回声信号和本端说话者产生的语音信号数据；接着分别从参考缓存区和输入缓存区中读取一定长度的信号数据进行回声消除处理，最终将回声消除处理后的信号数据发送给对端。

一般地，在网络不畅时无法正常接收对端发送的语音信号数据，此时如果播放缓存区没有足够的语音信号数据则会造成播放延迟，还会影响向参考缓存区写入音频信号数据的连续性。然而进行回声消除处理的信号数据主要从参考缓存区和输入缓存区中读取，如果不能连续向参考缓存区写入音频信号数据，则有可能无法正常进行回声消除，从而影响回音消除的处理时间及处理效率，同时降低回声消除性能的稳定性，进而影响整个通话过程的通话质量。

发明内容

本发明提供了一种音频通话的实现方法、系统及智能会议设备，保证了进行回声消除处理的信号数据的连续性，降低了回声消除的处理时间，为提高回声消除性能的稳定性提供了基础。

本发明实施例采用以下技术方案：

第一方面，本发明实施例提供了一种音频通话的实现方法，该方法包括：

在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；

从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

第二方面，本发明实施例还提供了一种音频通话的实现系统，该系统包括：

信号数据接收模块，用于在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；

信号数据播放模块，用于从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

信号数据采集模块，用于获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；

回声消除处理模块，用于对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

第三方面，本发明实施例又提供了一种智能会议设备，该智能会议设备集成了本发明实施例提供的一种音频通话的实现系统。

本发明提供了一种音频通话的实现方法、系统及智能会议设备，该方法首先接收对端发送的音频信号数据，并写入播放缓存区；然后从播放缓存区读取设定数据长度的音频信号数据进行播放，并将音频信号数据写入到参考缓存区，如果播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入参考缓存区；之后，获取基于音频输入设备拾取的输入信号数据，并将输入信号数据写入输入缓存区；最终对从参考缓存区及输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。利用该方法，能够实时地保证信号数据连续地写入参考缓存区，由此保证了进行回声消除处理的信号数据的连续性，从而降低了回声消除的处理时间，同时提高了回声消除的处理效率，为提高回声消除性能的稳定性提供了基础。

附图说明

图1为本发明实施例一提供的一种音频通话的实现方法的流程图；

图2为本发明实施例二提供的一种音频通话的实现方法的流程图；

图3为本发明实施例三提供的一种音频通话的实现方法的流程图；

图4为本发明实施例四提供的一种音频通话的实现系统的结构框图。

具体实施方式

下面结合附图和实施例对本发明作进一步地详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1为本发明实施例一提供的一种音频通话的实现方法的流程图，本实施例可适用于基于具有通话功能的电子设备进行语音通话的情况，该方法可以由音频通话的实现系统来执行，该系统可通过硬件和/或软件的方式实现，并一般可集成于具有语音通话功能的电子设备中。

一般地，对于具有语音通话功能的电子设备而言，主要基于电子设备中的现有的语音通话方法来实现与其他具有语音通话功能的电子设备的通话，然而，基于现有的语音通话方法通话时，在进行相应的回声消除处理时有可能无法连续地从参考缓存区中读取的信号数据，影响了回声消除的处理时间，进而有可能影响整个语音通话的工作性能。因此，本发明实施例提供了一种音频通话的实现方法，以解决参考缓存区在本实施例中，所述电子设备具体可指手机、电脑、智能会议设备等能够实现语音通话的设备。

如图1所示，本实施例提供的一种音频通话的实现方法，具体包括：

S101、在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区。

在本实施例中，所述本端和对端均可指具有通话功能的电子设备，可以理解的是，只有基于相应的通话协议将本端与对端建立通话连接后才可以进行语音通话。具体地，在本端与对端建立通话连接后，本端可以接收对端基于网络传输的音频信号数据，需要说明的是，接收到的音频信号数据并不直接被本端的音频输出设备播放，而是需要先缓存到设定的播放缓存区，其中，所述音频输出设备具体可指电子设备中的听筒和扬声器等用于播放音频数据的音频播放器件。

S102、从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区。

一般地，在将对端发送的音频信号数据缓存至所述播放缓存区之后，可以从所述播放缓存区中读取设定数据长度的音频信号数据并通过调用系统的播放接口基于音频输出设备播放所述音频信号数据，且在播放所述音频信号数据的同时将所述音频信号数据缓存到设定的参考缓存区中。

在本实施例中，如果本端与对端语音通话时的网络不畅，则会影响音频信号数据的传输，使得音频信号数据不能及时缓存到播放缓存区中，由此在播放缓存区中所具有音频信号数据的数据长度小于设定数据长度时，无法正常播放音频信号数据，此时可以让所述音频输出设备播放无声信号数据，并将所播放的无声信号数据写入所述参考缓存区，由此来确保向所述参考缓存区缓存信号数据的连续性。需要说明的是，对所述无声信号的播放及缓存存在时间及长度限制，具体地，可以在播放缓存区中音频信号数据的数据长度小于设定数据长度播放时开始播放设定数据长度的无声信号数据，当音频信号数据的数据长度不小于设定数据长度时，则可正常进行音频信号数据的播放操作。

在本实施例中，所述无声信号具体可理解为数值为0的信号数据，所述设定数据长度可以是人为设定或系统默认的长度，一般地，可以将所述设定数据长度优选为单位时间帧所对应的数据长度。示例性地，在已知采样率的前提下可以确定单位帧所包含的采样点数，所述采样点数就可以看做所述单位帧对应的数据长度，假设采用率为16KHz，且设定单位帧的时长为10ms，则单位帧所包含的采样点数为160，即可认为所述设定数据长度的值为160。

S103、获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

在本实施例中，基于音频输入设备播放的信号数据会在外界环境的干扰下形成相应的关联信号数据，示例性地，所述关联信号数据具体可以是被播放信号数据基于外界环境产生的回声信号数据。

在本实施例中，所述关联信号数据可以再次被音频输入设备拾取，此外，本端说话者产生的音频数据也会被音频输入设备拾取，本实施例将基于音频输入设备拾取的信号数据称为输入信号数据，且所采集的输入信号数据也会被写入设定的输入缓存区，其中，所述音频输入设备具体可指电子设备的话筒以及麦克风等能够进行音频拾取的器件。

在本实施例中，进行回声消除的过程可描述为：首先对从所述参考缓存区中获取的设定数据长度的信号数据进行自适应滤波获得对应的设定数据长度的模拟信号数据，其中，所述信号数据可以是无声信号也可以是正常的音频信号数据；之后，将从所述输入缓存区中获取的设定数据长度的输入信号数据与所述模拟信号数据相减，获得回声消除后的待发送信号数据，由此完成当前的回声消除处理。

可以理解的是，所述输入信号数据中包括了关联信号数据以及本端说话者的音频数据，而对端所需的只是本端说话者的音频数据，因此，而需要消除掉所述关联信号数据，在本实施例中，可以将基于自适应滤波所获得的模拟信号数据等同于所述关联信号数据，因此，只要输入信号数据与所述模拟信号数据相减就可以消除掉所述输入信号数据中的关联信号数据，其中，可以将回声消除处理后获得的信号数据称为待发送信号数据。

本发明实施例一提供的一种音频通话的实现方法，首先接收对端发送的音频信号数据，并写入播放缓存区；然后从播放缓存区读取设定数据长度的音频信号数据进行播放，并将音频信号数据写入到参考缓存区，如果播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入参考缓存区；之后，获取基于音频输入设备拾取的输入信号数据，并将输入信号数据写入输入缓存区；最终对从参考缓存区及输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。利用该方法，能够实时地保证信号数据连续地写入参考缓存区，由此保证了进行回声消除处理的信号数据的连续性，从而降低了回声消除的处理时间，同时提高了回声消除的处理效率，为提高回声消除性能的稳定性提供了基础。

在上述实施例的基础上，本实施例还进一步优化增加了本端与对端进行音频通话时的后续操作步骤。具体地，在对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理之后，还包括：将回声消除处理后获得的待发送信号数据写入待发送缓存区，并向对端发送从所述待发送缓存区中读取的待发送信号数据。

在本实施例中，执行上述步骤S102之后，可以保证缓存至所述参考缓存区的信号数据的连续性，之后在基于步骤S103就可以从所述参考缓存区中连续地读取信号数据。具体地，在基于步骤S103进行回声消除处理后，获得了待发送信号数据，所述待发送数据不能直接发送至对端，还需要将所述待发送信号数据先缓存至设定的待发送缓存区中，然后再从所述待发送缓存区中读取设定数据长度的待发送信号数据，最终将所读取的待发送信号数据发送给对端。在完成上述步骤后，就实现了本端与对端的一次音频通话。

实施例二

图2为本发明实施例二提供的一种音频通话的实现方法的流程图。本发明实施例二以上述实施例为基础进行优化，在本实施例中，该优化增加了：在本端与对端建立通话连接之前，基于设定的音频测试信号确定回声时延，其中，所述音频测试信号为至少一路单频信号。

进一步地，所述基于设定的音频测试信号确定回声时延，包括：在本端与对端建立通话连接之前，从所述播放缓存区中读取包含所述音频测试信号的信号数据进行播放，并将所述信号数据写入所述参考缓存区；获取基于音频输入设备拾取的输入测试信号数据，并将所述输入测试信号数据写入所述输入缓存区，其中，所述输入测试信号数据中包含了所述音频测试信号的关联信号数据；确定在所述参考缓存区中搜索到音频测试信号时对应的当前时间信息，记为第一时间信息；确定在所述输入缓存区中搜索到所述关联信号数据时对应的当前时间信息，记为第二时间信息；基于所述第一时间信息以及所述第二时间信息确定所述回声时延。

在上述优化的基础上，在所述基于设定的音频测试信号确定回声时延之后，还包括：删除所述输入缓存区中第二时间信息所对应信号数据之前的设定帧数的信号数据，以对所述输入缓存区中的关联信号数据与所述参考缓存区中的音频测试信号同时进行回声消除处理；其中，所述设定帧数等于所述回声时延对应的时间帧数。

如图2所示，本发明实施例二提供的一种音频通话的实现方法，具体包括如下操作：

在本实施例中，步骤S201至步骤S205具体阐述了回声时延的确定操作。需要说明的是，本实施例对回声时延的确定主要在本端启动语音通话功能后与对端建立通话连接前进行，且主要基于设定的音频测试信号来实现。

S201、在本端与对端建立通话连接之前，从所述播放缓存区中读取包含所述音频测试信号的信号数据进行播放，并将所述信号数据写入所述参考缓存区。

在本实施例中，在检测到本端启动语音通话功能后，会首先发出包含音频测试信号的音频信号数据，同时基于上述实施例一阐述的通话原理，所述音频信号数据会存放于一个播放缓存区中，之后会从该播放缓存中读取所述音频信号数据并通过音频输出设备播放所述音频信号数据，在基于所述音频输出设备播放所述音频信号数据的同时，还需要获取所述音频信号数据并存放至所述参考缓存区中。

在本实施例中，所述音频测试信号具体为预先设定的至少一路单频信号，所述单频信号可以是任一路单频率的音频信号并一般存放于设定的信号缓存中，由于所述单频信号具有周期短、波动简单等特点，所以适用于作为音频测试信号。所述音频信号数据具体可理解为确定所述回声时延所需的能够从音频输出设备播放的信号数据，需要说明的是，本实施例为了保证回声时延的有效量测，所述音频信号数据除包含所述音频测试信号外，也包括一段无声信号数据。

S202、获取基于音频输入设备拾取的输入测试信号数据，并将所述输入测试信号数据写入所述输入缓存区，其中，所述输入测试信号数据中包含了所述音频测试信号的关联信号数据。

在本实施例中，基于音频输出设备播放所述音频测试信号后，所述音频测试信号可能会形成相应的关联信号数据，该关联信号数据会被音频输入设备重新拾取并与音频输出设备所拾取的其他信号数据一起称为输入测试信号数据。此外，在拾取所述输入测试信号数据后，所述输入测试信号数据会首先存放于设定的输入缓存区中，之后会以设定的方式从所述输入缓存区中读取所述输入测试信号数据并用于进行回声消除处理。

S203、确定在所述参考缓存区中搜索到音频测试信号时对应的当前时间信息，记为第一时间信息。

S204、确定在所述输入缓存区中搜索到所述关联信号数据时对应的当前时间信息，记为第二时间信息。

一般地，所述回声时延具体可理解为音频信号数据被写入所述参考缓存区对应的时间与相应关联信号数据被写入所述输入缓存区所对应时间之间形成的时间差，所述时间差可以基于步骤S201至步骤S205所描述的回声时延的确定操作来获取。具体地，由步骤S203以及S204可知，为了确定所述回声时延，首先需要在所述参考缓存区以及所述输入缓存区分别读取设定长度的信号数据；然后在所读取的信号数据中分别搜索所述音频测试信号及所述关联信号数据，如果在参考缓存区中搜索到所述音频测试信号，则记录搜索到所述音频测试信号时的时间信息；同样，如果在输入缓存区中搜索到所述关联信号数据，则记录搜索到所述关联信号数据时的时间信息；最终，基于所记录的两个时间信息，就可以确定所述回声时延。

在本实施例中，由于在上述两缓存区中分别搜索所述音频测试信号及所述关联信号数据时没有限定时间顺序，所以在确定所述回声时延时，需要将搜索到所述音频测试信号时记录的时间信息具体为一个相对的时间段信息，且所述时间段信息为在当前读取的信号数据中搜索到所述音频测试信号或所述关联信号数据的时刻与开始在缓存区(参考缓存区或输入缓存区)中读取信号数据的时刻的时间差。

在本实施例中，可以基于具体时刻来描述所述时间段信息，如时间段信息为搜索到音频测试信号的时刻与首次从缓存区(参考缓存区或输入缓存区)中读取信号数据的时刻之差；还可以基于时间帧(每帧时长为T，例如10ms)来描述所述时间段信息，如将首次从缓存区中读取信号数据记为第0帧，则所述时间段信息为搜索到音频测试信号时对应的当前帧号。

S205、基于所述第一时间信息以及所述第二时间信息确定所述回声时延。

在本实施例中，基于上述步骤S203以及S204分别确定所述第一时间信息以及第二时间信息之后，可以确定所述第二时间信息与第一时间信息的时间差，示例性地，如，基于具体时刻来描述所述第一时间信息以及第二时间信息时，可以确定所述第一时间信息对应的时间段，以及所述第二时间信息对应的时间段，由此可将上述两个时间段之差确定为所述回声时延；又如，基于时间帧来描述所述第一时间信息以及第二时间信息时，可以确定所述第一时间信息对应的时间帧数，以及所述第二时间信息对应的时间帧数，由此可将上述两个时间帧数之差确定为所述回声时延。

S206、删除所述输入缓存区中第二时间信息所对应信号数据之前的设定帧数的信号数据，以对所述输入缓存区中的关联信号数据与所述参考缓存区中的音频测试信号同时进行回声消除处理。

在本实施例中，通过上述回声时延的确定可知，所述音频测试信号的关联信号数据进入所述输入缓存区的时间延后于进入参考缓存区的时间，即，在参考缓存区中读取到所述音频测试信号时，还不能在所述输入缓存区中读取到所述关联信号数据。因此，需要在所述输入缓存区中删除关联信号数据前与回声时延长度相对应的信号数据，才能保证回音消除模块在参考缓存区中读取到所述音频测试信号的同时也在所述输入缓存区中读取到关联信号数据，由此才能消除回声时延对语音通话的影响。

需要说明的是，基于本实施例进行步骤S312的操作后，参考缓存区中缓存的信号数据长度将比输入缓存区中缓存的信号数据长度多出回声时延所对应的数据长度。这样可以保证在基于语音通话系统进行实际通话时，所述参考缓存区中的音频信号数据与所述输入缓存区中的关联信号数据能够同时被读取并用来进行回声消除处理，由此降低了自适应滤波器对音频信号数据的处理时间，进而保证了回音消除的工作效率。

S207、在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区。

在本实施例，上述步骤S201至步骤S206相当于进行音频通话的预处理操作，在完成上述操作后，可以将本端与对端建立通话连接，并基于步骤S207至步骤S210开始正常的音频通话操作，且可以保证所述参考缓存区中的音频信号数据与所述输入缓存区中的关联信号数据能够同时被读取并进行回声消除处理。

S208、从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

S209、获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

S210、将回声消除处理后获得的待发送信号数据写入待发送缓存区，并向对端发送从所述待发送缓存区中读取的待发送信号数据。

在本实施例中，上述步骤S207至步骤S210已在实施例一中具体阐述，这里不再赘述。

本发明实施例二提供的一种音频通话的实现方法，具体优化增加了回声时延的确定过程，以确定音频通话过程中信号数据写入参考缓存区时和写入输入缓存区时存在的时间差；同时还在确定回声时延之后优化增加了信号数据的删除操作，由此来保证参考缓存区和输入缓存区中相关联的信号数据同时被读取并同时进行回声消除处理。利用该方法，不仅消除了参考缓存区中所缓存信号数据对回声消除处理的影响，还降低了回声时延对回声消除处理的影响，从而提高了回声消除的处理效率，进而提高了整个音频通话的工作性能。

实施例三

图3为本发明实施例三提供的一种音频通话的实现方法的流程图。本发明实施例以上述实施例为基础进行优化，在本实施例中，在对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理之前，还优化：对所述参考缓存区和/或输入缓存区中的信号数据进行处理，以使所述参考缓存区与所述输入缓存区中信号数据的数据长度差保持不变。

在上述优化的基础上，对所述参考缓存区和/或输入缓存区中的信号数据进行处理，包括：获取所述参考缓存区在当前处理周期内所具有信号数据的数据长度信息以及所述输入缓存区在所述处理周期内所具有信号数据的数据长度信息；基于所述参考缓存区以及输入缓存区对应的数据长度信息，确定所述参考缓存区与输入缓存区所缓存信号数据的数据长度差信息；确定所述数据长度差信息与设定的标准数据长度差信息的比对结果，基于所述比对结果对存放于所述参考缓存区和/或所述输入缓存区中的信号数据进行重采样处理。

如图3所示，本发明实施例三提供的一种音频通话的实现方法，具体包括如下操作：

S301、在本端与对端建立通话连接之前，基于设定的音频测试信号确定回声时延，其中，所述音频测试信号为至少一路单频信号。

示例性地，首先基于设定的音频测试信号确定音频通话时的回声时延。

S302、从所述输入缓存区中删除与所述回声时延相对应数据长度的信号数据，以使所述输入缓存区中的关联信号数据与所述参考缓存区中的音频测试信号同时进行回声消除处理。

示例性地，在确定所述输入缓存区中关联信号数据的所在位置后，可以将所述关联信号数据之前的设定长度的信号数据删除。其中，所述设定长度具体可为所述回声时延的时间段内对应的数据长度，如，确定所述回声时延为两个单位帧，假设单位帧的数据长度为160，则两个单位帧的数据长度为320，因此，需要将所述关联信号数据之前的320个信号数据删除。

S303、在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区。

S304、从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区。

S305、获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区。

示例性地，所述输入信号数据可以包括与所播放的信号数据相关的关联信号数据以及本端说话者产生的音频数据。

S306、获取所述参考缓存区在当前处理周期内所具有信号数据的数据长度信息以及所述输入缓存区在所述处理周期内所具有信号数据的数据长度信息。

在本实施例中，步骤S305至步骤S307给出了实时对所述参考缓存区和/或所述输入缓存区进行信号数据处理具体操作。其中，所述处理周期具体可理解为预先设定的一个时间段(可以用基本的时间单位(如秒)表示；也可以用帧为单位表示)，主要用于统计参考缓存区及输入缓存区在一个时间段内的数据长度信息。

在本实施例中，所述数据长度信息可以是当前处理周期内缓存区(参考缓存区和输入缓存区)中累加数据长度后得到的总数据长度，也可以是当前处理周期内缓存区中累加数据长度后确定的数据长度平均值。在本实施例中，所述数据长度主要以缓存区所具有离散信号数据的个数表示。

S307、基于所述参考缓存区以及输入缓存区对应的数据长度信息，确定所述参考缓存区与输入缓存区所缓存信号数据的数据长度差信息。

在本实施例中，所述数据长度差信息等于所述参考缓存区的数据长度信息与所述输入缓存区的数据长度信息的差值。具体地，当所述数据长度信息为处理周期内累加数据长度后得到的总数据长度时，所述数据长度差信息为所述参考缓存区与输入缓存区在处理周期内所对应的总数据长度值的差值；当所述数据长度信息为在所述处理周期内累加数据长度后确定的数据长度平均值时，所述数据长度差信息为所述参考缓存区与输入缓存区在处理周期内所对应的数据长度平均值的差值。

S308、确定所述数据长度差信息与设定的标准数据长度差信息的比对结果，基于所述比对结果对存放于所述参考缓存区和/或所述输入缓存区中的信号数据进行重采样处理。

在本实施例中，所述标准数据长度差信息具体可理解为预先设定的两缓存区的数据长度信息的标准差值，也可理解为在进行信号数据的处理过程中基于两缓存区的数据长度信息确定的差值，例如，可以在进行信号数据处理时将首次获取的数据长度差信息确定标准数据长度差信息。此外，对所述标准数据长度差信息的设定基于所述数据长度差信息所表示具体内容的不同而存在不同，例如，当所述数据长度差信息表示的具体内容为数据长度平均值的差值时，所述标准数据长度差信息的设定值相对小于数据长度差信息为总数据长度的差值时对应的设定值。

在本实施例中，可以将所述数据长度差信息与所述标准数据长度差信息的差值作为比对结果，并且可以基于所确定的比对结果对存放于所述参考缓存区或者存放于输入缓存区中的信号数据进行重采样处理，由此保证所述参考缓存区与所述输入缓存区中信号数据的数据长度差保持不变。

在本实施例中，所述重采样具体可理解为对采样率不同的信号数据重新进行采样，使得采样率不同信号数据的能够转换为相同的采样率，包括降采样和升采样。一般地，对于采样率不同的两路信号数据而言，如果两路信号的采样率差别很小，则可以对其中一路信号数据使用间隔丢弃信号数据的方式进行降采样或对另一路信号数据使用间隔插入信号数据的方式进行升采样。由于本实施例中参考缓存区与输入缓存区所对应采样率的差别很小，因此可以采用上述两种方式进行重采样处理。

S309、对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

S310、将回声消除处理后获得的待发送信号数据写入待发送缓存区，并向对端发送从所述待发送缓存区中读取的待发送信号数据。

本发明实施例三提供的一种音频通话的实现方法，在对参考缓存区和输入缓存区中的信号数据进行回声消除处理之前，优化增加了对参考缓存区或输入缓存区中信号数据的处理操作，由此能够在参考缓存区和输入缓存区对应的采样率不同时让可以保持所述参考缓存区与所述输入缓存区中信号数据的数据长度差保持不变，进而实时地保证音频通话时两缓存区中进行回声消除的信号数据能够同时进行回音消除处理。利用该方法，不仅消除了参考缓存区中所缓存信号数据对回声消除处理的影响，降低了回声时延对回声消除处理的影响，还实时地保证了音频通话时进行回声消除的信号数据能够同时进行回音消除处理，从而提高了回声消除的处理效率，进而提高了整个音频通话的工作性能。

实施例四

图4为本发明实施例四提供的一种音频通话的实现系统的结构框图，本实施例可适用于基于具有通话功能的电子设备进行语音通话的情况，该系统可通过硬件和/或软件的方式实现，并一般可集成于具有语音通话功能的电子设备中。如图4所示，该实现系统首先包括了：信号数据接收模块42、信号数据播放模块43、信号数据采集模块44以及回声消除处理模块45。

其中，信号数据接收模块42，用于在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；

信号数据播放模块43，用于从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

信号数据采集模块44，用于获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；

回声消除处理模块45，用于对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

在本实施例中，该系统首先通过信号数据接收模块42在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；然后通过信号数据播放模块43从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；之后通过信号数据采集模块44获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；接着通过回声消除处理模块45对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。

本发明实施例提供的一种音频通话的实现系统，能够实时地保证信号数据连续地写入参考缓存区，由此保证了进行回声消除处理的信号数据的连续性，从而降低了回声消除的处理时间，同时提高了回声消除的处理效率，为提高回声消除性能的稳定性提供了基础。

在上述实施例的基础上，该系统优化增加了：信号数据发送模块46，其中，信号数据发送模块46，用于将回声消除处理后获得的待发送信号数据写入待发送缓存区，并向对端发送从所述待发送缓存区中读取的待发送信号数据。

进一步地，该系统该优化增加了：回声时延确定模块40，其中，所述回声时延确定模块40，用于在本端与对端建立通话连接之前，基于设定的音频测试信号确定回声时延，其中，所述音频测试信号为至少一路单频信号。

在上述优化的基础上，所述回声时延确定模块40具体用于：在本端与对端建立通话连接之前，从所述播放缓存区中读取包含所述音频测试信号的信号数据进行播放，并将所述信号数据写入所述参考缓存区；获取基于音频输入设备拾取的输入测试信号数据，并将所述输入测试信号数据写入所述输入缓存区，其中，所述输入测试信号数据中包含了所述音频测试信号的关联信号数据；确定在所述参考缓存区中搜索到音频测试信号时对应的当前时间信息，记为第一时间信息；确定在所述输入缓存区中搜索到所述关联信号数据时对应的当前时间信息，记为第二时间信息；基于所述第一时间信息以及所述第二时间信息确定所述回声时延。

在上述优化的基础上，该系统还优化增加了信号数据删除模块41，其中，所述信号数据删除模块41，用于在基于设定的音频测试信号确定回声时延之后，删除所述输入缓存区中第二时间信息所对应信号数据之前的设定帧数的信号数据，以对所述输入缓存区中的关联信号数据与所述参考缓存区中的音频测试信号同时进行回声消除处理；其中，所述设定帧数等于所述回声时延对应的时间帧数。

进一步地，该系统又优化增加了信号数据处理模块47，其中，所述信号数据处理模块47，用于在对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理之前，对所述参考缓存区和/或输入缓存区中的信号数据进行处理，以使所述参考缓存区与所述输入缓存区中信号数据的数据长度差保持不变。

在上述优化的基础上，所述信号数据处理模块47具体用于：获取所述参考缓存区在当前处理周期内所具有信号数据的数据长度信息以及所述输入缓存区在所述处理周期内所具有信号数据的数据长度信息；基于所述参考缓存区以及输入缓存区对应的数据长度信息，确定所述参考缓存区与输入缓存区所缓存信号数据的数据长度差信息；确定所述数据长度差信息与设定的标准数据长度差信息的比对结果，基于所述比对结果对存放于所述参考缓存区和/或所述输入缓存区中的信号数据进行重采样处理。

实施例五

本发明实施例五提供了一种智能会议设备，该智能会议设备集成了上述实施例四提供的一种音频通话的实现系统。可以通过上述实施例一至实施例三提供的音频通话的实现方法与其他电子设备进行音频通话。

在本实施例中，由于所述述智能会议设备中集成了本发明实施例提供的音频通话的实现系统，使得所述智能会议设备具有通话功能。同时所述智能会议设备还具备了音频输出设备以及音频输出设备，主要通过调用各自的接口来进行相应的操作。

在所述智能会议设备中集成本发明上述实施例提供的一种音频通话的实现系统之后，能够在与其他具有通话功能的电子设备进行音频通话，并能够实时地保证信号数据连续地写入参考缓存区，由此保证进行回声消除处理的信号数据的连续性，降低回声消除的处理时间，提高音频通话过程中回声消除的处理效率，也进一步提高了智能会议设备的用户体验。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

一种音频通话的实现方法，其特征在于，包括：

在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；

从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。
根据权利要求1所述的方法，其特征在于，还包括：

在本端与对端建立通话连接之前，基于设定的音频测试信号确定回声时延，其中，所述音频测试信号为至少一路单频信号。
根据权利要求2所述的方法，其特征在于，基于设定的音频测试信号确定回声时延，包括：

从所述播放缓存区中读取包含所述音频测试信号的信号数据进行播放，并将所述信号数据写入所述参考缓存区；

获取基于音频输入设备拾取的输入测试信号数据，并将所述输入测试信号数据写入所述输入缓存区，其中，所述输入测试信号数据中包含了所述音频测试信号的关联信号数据；

确定在所述参考缓存区中搜索到音频测试信号时对应的当前时间信息，记为第一时间信息；

确定在所述输入缓存区中搜索到所述关联信号数据时对应的当前时间信息，记为第二时间信息；

基于所述第一时间信息以及所述第二时间信息确定所述回声时延。
根据权利要求3所述的方法，其特征在于，在所述基于设定的音频测试信号确定回声时延之后，还包括：

删除所述输入缓存区中第二时间信息所对应信号数据之前的设定帧数的信号数据，以对所述输入缓存区中的关联信号数据与所述参考缓存区中的音频测试信号同时进行回声消除处理；

其中，所述设定帧数等于所述回声时延对应的时间帧数。
根据权利要求1所述的方法，其特征在于，在对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理之前，还包括：

对所述参考缓存区和/或输入缓存区中的信号数据进行处理，以使所述参考缓存区与所述输入缓存区中信号数据的数据长度差保持不变。
根据权利要求5所述的方法，其特征在于，所述对所述参考缓存区和/或输入缓存区中的信号数据进行处理，包括：

获取所述参考缓存区在当前处理周期内所具有信号数据的数据长度信息以及所述输入缓存区在所述处理周期内所具有信号数据的数据长度信息；

基于所述参考缓存区以及输入缓存区对应的数据长度信息，确定所述参考缓存区与输入缓存区所缓存信号数据的数据长度差信息；

确定所述数据长度差信息与设定的标准数据长度差信息的比对结果，基于所述比对结果对存放于所述参考缓存区和/或所述输入缓存区中的信号数据进行重采样处理。
根据权利要求1-6任一所述的方法，其特征在于，还包括：

将回声消除处理后获得的待发送信号数据写入待发送缓存区，并向对端发送从所述待发送缓存区中读取的待发送信号数据。
一种音频通话的实现系统，其特征在于，包括：

信号数据接收模块，用于在本端与对端建立通话连接后，接收对端发送的音频信号数据并缓存到播放缓存区；

信号数据播放模块，用于从所述播放缓存区读取设定数据长度的音频信号数据进行播放，并将所述音频信号数据写入到参考缓存区，如果所述播放缓存区中的音频信号数据不足设定数据长度，则播放设定数据长度的无声信号并将所述无声信号写入所述参考缓存区；

信号数据采集模块，用于获取基于音频输入设备拾取的输入信号数据，并将所述输入信号数据写入输入缓存区；

回声消除处理模块，用于对从所述参考缓存区及所述输入缓存区中读取的设定数据长度的信号数据进行回声消除处理。
根据权利要求8所述的系统，其特征在于，还包括：

回声时延确定模块，用于在本端与对端建立通话连接之前，基于设定的音频测试信号确定回声时延，其中，所述音频测试信号为至少一路单频信号。
一种智能会议设备，其特征在于，该智能会议设备集成了如权利要求8或9所述的音频通话的实现系统。