CN112509590A - 一种音频传输方法和装置 - Google Patents
一种音频传输方法和装置 Download PDFInfo
- Publication number
- CN112509590A CN112509590A CN202011396362.9A CN202011396362A CN112509590A CN 112509590 A CN112509590 A CN 112509590A CN 202011396362 A CN202011396362 A CN 202011396362A CN 112509590 A CN112509590 A CN 112509590A
- Authority
- CN
- China
- Prior art keywords
- audio data
- data segment
- mute
- effective
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 238000004806 packaging method and process Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种音频传输方法和装置,通过将第一音频数据分成时间连续的多个音频数据段并进行VAD检测,根据检测结果标记为有效音频数据段或静音音频数据段,对有效音频数据段进行编码并添加数据包头,然后多个时间连续的有效音频数据段进行数据传输;根据传输的多个时间连续的有效音频数据段,还原静音音频数据段并对有效音频数据段进行解码,根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。在数据传输过程中,只传输有效音频数据段,无需传输静音音频数据段,通过标记静音音频数据段的位置信息还原静音音频数据段再进行组合,实现了音频数据的传输,因为没有传输静音音频数据段,大幅度减少了数据传输量,降低了对带宽的需求。
Description
技术领域
本发明涉及音频传输技术领域,尤其涉及一种音频传输方法和装置。
背景技术
耳机、录音笔、翻译机、智能音箱等智能电子设备普遍使用蓝牙与手机连接,以将音频传输给手机。然而,随着电子设备智能化不断提高,应用场景也日趋复杂。例如,传统蓝牙耳机只需要传输音乐或者电话音频,而智能蓝牙耳机可能需要在传输音乐或者电话音频的同时,还需要传输语言翻译的音频或者录音音频。随着所需要传输的数据量逐渐增加,对数据带宽的需求也越来越大,进而导致蓝牙的传输带宽和传输速度无法满足要求。
现有音频传输技术通过对原始音频进行编码压缩来减少数据量,常见的编码压缩方式包括WBC、AAC、MP3、G722等等。传统音频压缩方式都采用统一编码压缩方式对所有音频数据进行复杂的编码压缩,完成传输之后在对端进行解码,因此在目前编码技术基础上已经无法进一步减少数据量和对带宽的需求。
发明内容
为解决背景技术中存在的技术问题,本发明提出一种音频传输方法和装置。
本发明提出了一种音频传输方法,包括:
获取第一音频数据;
将第一音频数据分成时间连续的多个音频数据段;
对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段;
对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
对多个时间连续的有效音频数据段进行数据发送。
优选地,所述对有效音频数据段进行编码并添加数据包头,具体包括:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
优选地,所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
本发明还提出了一种音频传输方法,包括:
接收多个时间连续的有效音频数据段;
根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
对有效音频数据段进行解码;
根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
优选地,所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段,具体包括:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
优选地,所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据,具体包括:根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
本发明还提出了一种音频传输装置,包括:
获取模块,用于获取第一音频数据;
划分模块,用于将第一音频数据分成时间连续的多个音频数据段;
检测模块,用于对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段;
编码模块,用于对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
发送模块,用于对多个时间连续的有效音频数据段进行数据发送。
优选地,编码模块具体用于:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
优选地,发送模块具体用于,所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
本发明还提出了一种音频传输装置,包括:
接收模块,用于接收多个时间连续的有效音频数据段;
还原模块,用于根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
解码模块,用于对有效音频数据段进行解码;
组合模块,用于根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
优选地,还原模块具体用于:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
优选地,组合模块具体用于,根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
本发明的音频传输方法,应用在包括第一智能终端和第二智能终端的数据传输系统中,第一智能终端通过将第一音频数据分成时间连续的多个音频数据段并进行VAD检测,根据检测结果标记为有效音频数据段或静音音频数据段,对有效音频数据段进行编码并添加数据包头,然后多个时间连续的有效音频数据段进行数据发送;第二智能终端根据接收的多个时间连续的有效音频数据段,还原静音音频数据段并对有效音频数据段进行解码,根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。在数据传输过程中,只传输有效音频数据段,无需传输静音音频数据段,通过标记静音音频数据段的位置信息还原静音音频数据段再进行组合,实现了音频数据的传输,因为没有传输静音音频数据段,大幅度减少了数据传输量,降低了对带宽的需求。
附图说明
图1为本发明实施例一提出的一种音频传输方法的流程示意图。
图2为本发明实施例二提出的一种音频传输方法的流程示意图。
具体实施方式
在本发明提出的一种音频传输方法,应用在包括第一智能终端和第二智能终端的数据传输系统中,其中,第一智能终端可以为耳机、录音笔、翻译机、智能音箱等智能设备,第二智能终端可以为手机、平板等智能设备,第一智能终端和第二智能终端可以通过蓝牙进行连接,以实现音频数据传输。
在不同的应用场景下,上述两个智能终端还可以进行互换。
在本发明实施例中,以第一智能终端为耳机,第二智能终端为手机作为应用场景,耳机和手机通过蓝牙连接,对本发明的技术方案进行详细说明。
如图1所示,图1为本发明实施例一提出的一种音频传输方法的流程示意图。
参照图1,本发明实施例一提出的一种音频传输方法,应用于耳机,包括:
S1、获取第一音频数据;
S2、将第一音频数据分成时间连续的多个音频数据段;
S3、对音频数据段进行VAD(Voice Activity Detection,语音活动检测)检测并标记为有效音频数据段或静音音频数据段;
S4、对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
S5、对多个时间连续的有效音频数据段进行数据发送。
所述对有效音频数据段进行编码并添加数据包头,具体包括:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
如图2所示,图2为本发明实施例二提出的一种音频传输方法的流程示意图。
参照图2,本发明实施例二提出的一种音频传输方法,应用于手机,包括:
S1、接收多个时间连续的有效音频数据段;
S2、根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
S3、对有效音频数据段进行解码;
S4、根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段,具体包括:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据,具体包括:根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
本发明实施例三提出了一种音频传输装置,具体为耳机,包括:
获取模块,用于获取第一音频数据;
划分模块,用于将第一音频数据分成时间连续的多个音频数据段;
检测模块,用于对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段;
编码模块,用于对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
发送模块,用于对多个时间连续的有效音频数据段进行数据发送。
其中,编码模块具体用于:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
发送模块具体用于,所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
本发明实施例四提出了一种音频传输装置,具体为手机,包括:
接收模块,用于接收多个时间连续的有效音频数据段;
还原模块,用于根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
解码模块,用于对有效音频数据段进行解码;
组合模块,用于根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
还原模块具体用于:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
组合模块具体用于,根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种音频传输方法,其特征在于,包括:
获取第一音频数据;
将第一音频数据分成时间连续的多个音频数据段;
对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段;
对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
对多个时间连续的有效音频数据段进行数据发送。
2.根据权利要求1所述的音频传输方法,其特征在于,所述对有效音频数据段进行编码并添加数据包头,具体包括:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
3.根据权利要求1或2所述的音频传输方法,其特征在于,所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
4.一种音频传输方法,其特征在于,包括:
接收多个时间连续的有效音频数据段;
根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
对有效音频数据段进行解码;
根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
5.根据权利要求4所述的音频传输方法,其特征在于,所述根据数据包头中静音音频数据段在音频数据的位置信息还原静音音频数据段,具体包括:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
6.根据权利要求4所述的音频传输方法,其特征在于,所述根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据,具体包括:根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
7.一种音频传输装置,其特征在于,包括:
获取模块,用于获取第一音频数据;
划分模块,用于将第一音频数据分成时间连续的多个音频数据段;
检测模块,用于对音频数据段进行VAD检测并标记为有效音频数据段或静音音频数据段;
编码模块,用于对有效音频数据段进行编码并添加数据包头,数据包头包括有效音频数据段或静音音频数据段在第一音频数据的位置信息;
发送模块,用于对多个时间连续的有效音频数据段进行数据发送。
8.根据权利要求7所述的音频传输装置,其特征在于,编码模块具体用于:对每个有效音频数据段进行编码,并为每个有效音频数据段添加数据包头;
数据包头包括每个有效音频数据段在第一音频数据中的位置信息,并且,添加在静音音频数据段之后的首个有效音频数据段的数据包头还包括所有时间连续的静音音频数据段在第一音频数据中的位置信息。
优选地,发送模块具体用于,所述对多个时间连续的有效数据段进行数据发送,具体包括:将多个时间连续的有效音频数据段进行数据打包后进行数据发送。
9.一种音频传输装置,其特征在于,包括:
接收模块,用于接收多个时间连续的有效音频数据段;
还原模块,用于根据数据包头中静音音频数据段在第一音频数据的位置信息还原静音音频数据段;
解码模块,用于对有效音频数据段进行解码;
组合模块,用于根据有效音频数据段和静音音频数据段以及位置信息组合形成第二音频数据。
10.根据权利要求9所述的音频传输装置,其特征在于,还原模块具体用于:根据添加在静音音频数据段之后的首个有效音频数据段的数据包头中前面所有时间连续的静音音频数据段在第一音频数据中的位置信息,还原静音音频数据段。
优选地,组合模块具体用于,根据有效音频数据段和静音音频数据段并根据两者在第一音频数据的位置信息进行组合形成第二音频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011396362.9A CN112509590A (zh) | 2020-12-03 | 2020-12-03 | 一种音频传输方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011396362.9A CN112509590A (zh) | 2020-12-03 | 2020-12-03 | 一种音频传输方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112509590A true CN112509590A (zh) | 2021-03-16 |
Family
ID=74969533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011396362.9A Pending CN112509590A (zh) | 2020-12-03 | 2020-12-03 | 一种音频传输方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112509590A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1960520A (zh) * | 2006-09-30 | 2007-05-09 | 中兴通讯股份有限公司 | 一种在移动多媒体广播中传递辅助数据的方法 |
CN101605252A (zh) * | 2009-07-17 | 2009-12-16 | 深圳创维数字技术股份有限公司 | 将节目流转换成传输流的方法和系统 |
CN102355484A (zh) * | 2011-08-05 | 2012-02-15 | 多玩娱乐信息技术(北京)有限公司 | 一种音频数据传输的方法 |
CN102655584A (zh) * | 2011-03-04 | 2012-09-05 | 中兴通讯股份有限公司 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
CN102800318A (zh) * | 2012-06-27 | 2012-11-28 | 优视科技有限公司 | 音频数据流的发送、接收装置及方法 |
CN107623860A (zh) * | 2017-08-09 | 2018-01-23 | 北京奇艺世纪科技有限公司 | 多媒体数据分割方法和装置 |
-
2020
- 2020-12-03 CN CN202011396362.9A patent/CN112509590A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1960520A (zh) * | 2006-09-30 | 2007-05-09 | 中兴通讯股份有限公司 | 一种在移动多媒体广播中传递辅助数据的方法 |
CN101605252A (zh) * | 2009-07-17 | 2009-12-16 | 深圳创维数字技术股份有限公司 | 将节目流转换成传输流的方法和系统 |
CN102655584A (zh) * | 2011-03-04 | 2012-09-05 | 中兴通讯股份有限公司 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
CN102355484A (zh) * | 2011-08-05 | 2012-02-15 | 多玩娱乐信息技术(北京)有限公司 | 一种音频数据传输的方法 |
CN102800318A (zh) * | 2012-06-27 | 2012-11-28 | 优视科技有限公司 | 音频数据流的发送、接收装置及方法 |
CN107623860A (zh) * | 2017-08-09 | 2018-01-23 | 北京奇艺世纪科技有限公司 | 多媒体数据分割方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11109138B2 (en) | Data transmission method and system, and bluetooth headphone | |
CN108347716B (zh) | 一种蓝牙通信系统及通信方法 | |
CN103401984A (zh) | 蓝牙耳机及通讯装置 | |
CN109246671A (zh) | 数据传输方法、装置及系统 | |
CN1333603A (zh) | 具有短距离移动系统的耳机 | |
US11395065B2 (en) | Audio device, audio system, and audio processing method | |
CN103167371A (zh) | 具有录音保存功能的蓝牙耳机及装有该蓝牙耳机的车辆 | |
CN105704601A (zh) | 一种可语音拨号的蓝牙耳机 | |
CN101277338A (zh) | 一种记录通信终端下行语音信号的方法及该通信终端 | |
KR101552830B1 (ko) | 스마트 기기를 이용한 블루투스 헤드셋 구현 방법 | |
CN203193859U (zh) | 一种具有电话录音功能的蓝牙音响系统 | |
CN213906675U (zh) | 一种便携式无线蓝牙录音设备 | |
CN113225644B (zh) | 低延迟蓝牙音频系统及其音频源端和音频接收端 | |
CN112509590A (zh) | 一种音频传输方法和装置 | |
CN111713119B (zh) | 耳机、耳机系统和耳机系统中的方法 | |
CN110740208A (zh) | 一种语音通话录音方法、耳机及通话终端 | |
CN111385780A (zh) | 一种蓝牙音频信号传输方法和装置 | |
CN111225102A (zh) | 一种蓝牙音频信号传输方法和装置 | |
CN102752019B (zh) | 基于耳机插孔的数据发送、接收、传输方法及系统 | |
CN103986818B (zh) | 一种信息处理方法和电子设备 | |
CN115243238A (zh) | 传输音频数据的装置、方法以及电子设备 | |
CN102480672A (zh) | 音效处理装置、多音源音效应用系统以及方法 | |
CN107273087A (zh) | 一种基于Type‑C接口的音频输入/输出系统、设备及方法 | |
CN110234046A (zh) | 一种基于双通道耳机的翻译方法、装置和系统 | |
CN101360141A (zh) | 具有多种录音功能的移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |