CN112509590A

CN112509590A - 一种音频传输方法和装置

Info

Publication number: CN112509590A
Application number: CN202011396362.9A
Authority: CN
Inventors: 陈宜义; 王刚; 李颀
Original assignee: Hefei Xingkong Iot Information Technology Co ltd
Current assignee: Hefei Xingkong Iot Information Technology Co ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-03-16

Abstract

本发明公开了一种音频传输方法和装置，通过将第一音频数据分成时间连续的多个音频数据段并进行VAD检测，根据检测结果标记为有效音频数据段或静音音频数据段，对有效音频数据段进行编码并添加数据包头，然后多个时间连续的有效音频数据段进行数据传输；根据传输的多个时间连续的有效音频数据段，还原静音音频数据段并对有效音频数据段进行解码，根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。在数据传输过程中，只传输有效音频数据段，无需传输静音音频数据段，通过标记静音音频数据段的位置信息还原静音音频数据段再进行组合，实现了音频数据的传输，因为没有传输静音音频数据段，大幅度减少了数据传输量，降低了对带宽的需求。

Description

一种音频传输方法和装置

技术领域

本发明涉及音频传输技术领域，尤其涉及一种音频传输方法和装置。

背景技术

耳机、录音笔、翻译机、智能音箱等智能电子设备普遍使用蓝牙与手机连接，以将音频传输给手机。然而，随着电子设备智能化不断提高，应用场景也日趋复杂。例如，传统蓝牙耳机只需要传输音乐或者电话音频，而智能蓝牙耳机可能需要在传输音乐或者电话音频的同时，还需要传输语言翻译的音频或者录音音频。随着所需要传输的数据量逐渐增加，对数据带宽的需求也越来越大，进而导致蓝牙的传输带宽和传输速度无法满足要求。

现有音频传输技术通过对原始音频进行编码压缩来减少数据量，常见的编码压缩方式包括WBC、AAC、MP3、G722等等。传统音频压缩方式都采用统一编码压缩方式对所有音频数据进行复杂的编码压缩，完成传输之后在对端进行解码，因此在目前编码技术基础上已经无法进一步减少数据量和对带宽的需求。

发明内容

为解决背景技术中存在的技术问题，本发明提出一种音频传输方法和装置。

本发明提出了一种音频传输方法，包括：

获取第一音频数据；

将第一音频数据分成时间连续的多个音频数据段；

对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段；

对有效音频数据段进行编码并添加数据包头，数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息；

对多个时间连续的有效音频数据段进行数据发送。

优选地，所述对有效音频数据段进行编码并添加数据包头，具体包括：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

数据包头包括每个有效音频数据段在第一音频数据中的位置信息，并且，添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。

优选地，所述对多个时间连续的有效数据段进行数据发送，具体包括：将多个时间连续的有效音频数据段进行数据打包后进行数据发送。

本发明还提出了一种音频传输方法，包括：

接收多个时间连续的有效音频数据段；

根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段；

对有效音频数据段进行解码；

根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。

优选地，所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段，具体包括：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。

优选地，所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据，具体包括：根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。

本发明还提出了一种音频传输装置，包括：

获取模块，用于获取第一音频数据；

划分模块，用于将第一音频数据分成时间连续的多个音频数据段；

检测模块，用于对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段；

编码模块，用于对有效音频数据段进行编码并添加数据包头，数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息；

发送模块，用于对多个时间连续的有效音频数据段进行数据发送。

优选地，编码模块具体用于：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

优选地，发送模块具体用于，所述对多个时间连续的有效数据段进行数据发送，具体包括：将多个时间连续的有效音频数据段进行数据打包后进行数据发送。

本发明还提出了一种音频传输装置，包括：

接收模块，用于接收多个时间连续的有效音频数据段；

还原模块，用于根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段；

解码模块，用于对有效音频数据段进行解码；

组合模块，用于根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。

优选地，还原模块具体用于：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。

优选地，组合模块具体用于，根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。

本发明的音频传输方法，应用在包括第一智能终端和第二智能终端的数据传输系统中，第一智能终端通过将第一音频数据分成时间连续的多个音频数据段并进行VAD检测，根据检测结果标记为有效音频数据段或静音音频数据段，对有效音频数据段进行编码并添加数据包头，然后多个时间连续的有效音频数据段进行数据发送；第二智能终端根据接收的多个时间连续的有效音频数据段，还原静音音频数据段并对有效音频数据段进行解码，根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。在数据传输过程中，只传输有效音频数据段，无需传输静音音频数据段，通过标记静音音频数据段的位置信息还原静音音频数据段再进行组合，实现了音频数据的传输，因为没有传输静音音频数据段，大幅度减少了数据传输量，降低了对带宽的需求。

附图说明

图1为本发明实施例一提出的一种音频传输方法的流程示意图。

图2为本发明实施例二提出的一种音频传输方法的流程示意图。

具体实施方式

在本发明提出的一种音频传输方法，应用在包括第一智能终端和第二智能终端的数据传输系统中，其中，第一智能终端可以为耳机、录音笔、翻译机、智能音箱等智能设备，第二智能终端可以为手机、平板等智能设备，第一智能终端和第二智能终端可以通过蓝牙进行连接，以实现音频数据传输。

在不同的应用场景下，上述两个智能终端还可以进行互换。

在本发明实施例中，以第一智能终端为耳机，第二智能终端为手机作为应用场景，耳机和手机通过蓝牙连接，对本发明的技术方案进行详细说明。

如图1所示，图1为本发明实施例一提出的一种音频传输方法的流程示意图。

参照图1，本发明实施例一提出的一种音频传输方法，应用于耳机，包括：

S1、获取第一音频数据；

S2、将第一音频数据分成时间连续的多个音频数据段；

S3、对音频数据段进行VAD(Voice Activity Detection，语音活动检测)检测并标记为有效音频数据段或静音音频数据段；

S4、对有效音频数据段进行编码并添加数据包头，数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息；

S5、对多个时间连续的有效音频数据段进行数据发送。

所述对有效音频数据段进行编码并添加数据包头，具体包括：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

所述对多个时间连续的有效数据段进行数据发送，具体包括：将多个时间连续的有效音频数据段进行数据打包后进行数据发送。

如图2所示，图2为本发明实施例二提出的一种音频传输方法的流程示意图。

参照图2，本发明实施例二提出的一种音频传输方法，应用于手机，包括：

S1、接收多个时间连续的有效音频数据段；

S2、根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段；

S3、对有效音频数据段进行解码；

S4、根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。

所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段，具体包括：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。

所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据，具体包括：根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。

本发明实施例三提出了一种音频传输装置，具体为耳机，包括：

获取模块，用于获取第一音频数据；

其中，编码模块具体用于：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

发送模块具体用于，所述对多个时间连续的有效数据段进行数据发送，具体包括：将多个时间连续的有效音频数据段进行数据打包后进行数据发送。

本发明实施例四提出了一种音频传输装置，具体为手机，包括：

接收模块，用于接收多个时间连续的有效音频数据段；

解码模块，用于对有效音频数据段进行解码；

还原模块具体用于：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。

组合模块具体用于，根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种音频传输方法，其特征在于，包括：

获取第一音频数据；

将第一音频数据分成时间连续的多个音频数据段；

对多个时间连续的有效音频数据段进行数据发送。

2.根据权利要求1所述的音频传输方法，其特征在于，所述对有效音频数据段进行编码并添加数据包头，具体包括：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

3.根据权利要求1或2所述的音频传输方法，其特征在于，所述对多个时间连续的有效数据段进行数据发送，具体包括：将多个时间连续的有效音频数据段进行数据打包后进行数据发送。

4.一种音频传输方法，其特征在于，包括：

接收多个时间连续的有效音频数据段；

对有效音频数据段进行解码；

5.根据权利要求4所述的音频传输方法，其特征在于，所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段，具体包括：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。

6.根据权利要求4所述的音频传输方法，其特征在于，所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据，具体包括：根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。

7.一种音频传输装置，其特征在于，包括：

获取模块，用于获取第一音频数据；

8.根据权利要求7所述的音频传输装置，其特征在于，编码模块具体用于：对每个有效音频数据段进行编码，并为每个有效音频数据段添加数据包头；

9.一种音频传输装置，其特征在于，包括：

接收模块，用于接收多个时间连续的有效音频数据段；

解码模块，用于对有效音频数据段进行解码；

10.根据权利要求9所述的音频传输装置，其特征在于，还原模块具体用于：根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息，还原静音音频数据段。