CN103347199B

CN103347199B - 一种音频直播方法及系统

Info

Publication number: CN103347199B
Application number: CN201310269135.3A
Authority: CN
Inventors: 徐漫
Original assignee: Yeelion Online Network Technology Beijing Co Ltd
Current assignee: Yeelion Online Network Technology Beijing Co Ltd
Priority date: 2013-06-28
Filing date: 2013-06-28
Publication date: 2016-09-14
Anticipated expiration: 2033-06-28
Also published as: CN103347199A

Abstract

本发明公开了一种音频直播方法，包括：发布端将实时采集到的音频数据进行混音压缩以生成AAC数据；在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器；在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。本发明还公开了一种音频直播系统。

Description

一种音频直播方法及系统

技术领域

本发明涉及直播技术领域，尤其涉及一种音频直播方法及系统。

背景技术

所谓“网络直播”是指：在现场架设信号采集设备采集音视频信息，再通过网络上传至服务器，以将采集的音视频发布至网址供人下载观看。直播是采用流式传输方式实现的，即信息上传方将采集的信息实时上传至服务器，信息下载方不必像非流式播放那样等到整个文件全部下载完毕后才能看到当中的内容，而是只需要经过几秒钟或几十秒的启动延时即可在用户计算机上利用相应的播放器对下载的视频或音频等流式媒体文件进行播放，剩余的部分将继续进行下载，直至播放完毕。

在现有技术中，为了实现音频直播，首先利用独立声卡将采集到的原始音频数据进行混音(所述独立声卡拥有较多的滤波电容以及功放管，经过数次级的信号放大，降噪电路，使得输出音频的信号精度提升，所以音质输出效果很好)，再利用FlashPlayer将连续的混音后的音频数据进行压缩编码，最后，FlashPlayer将编码后的音频数据经流通道上传至流媒体服务器，流媒体服务器的主要功能是以流式协议将音频文件传输到客户端，供用户在线观看，这样用户便可以边下载边观看，而不必等待整个文件下载完毕。

现有技术是利用所述独立声卡进行混音的，但是，通常情况下，独立声卡是需要单独购买的，如果没有独立声卡是不能对采集到的音频数据进行混音，便无法实现音频的立体声直播。

发明内容

有鉴于此，本发明实施例的主要目的在于提供一种音频直播方法及系统，以实现在没有独立声卡的情况下实现立体声直播的目的。

为实现上述目的，本发明实施例提供了一种音频直播方法，包括：

发布端将实时采集到的音频数据进行混音压缩以生成AAC数据；

在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器；

在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。

优选地，在上述方法中，所述将实时采集到的音频数据进行混音压缩以生成AAC数据包括：

实时采集音频数据，所述音频数据为麦克风输出的声音数据和伴奏声音数据；

利用AAC编码器将所述采集到的音频数据进行压缩编码，以生成AAC数据。

优选地，在上述方法中，所述音频流的格式为FLV格式或MP3格式或MP4格式。

优选地，在上述方法中，

所述发布端通过发送通道上传关键帧数据至所述流媒体服务器；

所述接收端通过接收通道从所述流媒体服务器下载关键帧数据。

本发明还提供了一种音频直播系统，包括：发布端、流媒体服务器和接收端；

所述发布端，用于将实时采集到的音频数据进行混音压缩以生成AAC数据；在与所述流媒体服务器建立发布连接后，将所述AAC数据以关键帧的形式上传至所述流媒体服务器；

所述接收端，用于在与所述流媒体服务器建立接收连接后，截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。

优选地，在上述系统中，所述发布端包括：

数据采集单元，用于实时采集音频数据，所述音频数据为麦克风输出的声音数据和伴奏声音数据；

数据编码单元，用于利用AAC编码器将所述数据采集单元采集到的数据进行压缩编码，以生成AAC数据；

第一连接单元，用于与流媒体服务器建立发布连接；

数据上传单元，用于在所述第一连接单元与流媒体服务器建立发布连接后，将所述数据编码单元生成的AA C数据以关键帧的形式上传至所述流媒体服务器。

优选地，在上述系统中，所述接收端包括：

第二连接单元，用于与所述流媒体服务器建立接收连接；

数据截获单元，用于在所述第二连接单元与所述流媒体服务器建立接收连接后，截获所述关键帧；

数据处理单元，用于将所述数据截获单元截获的关键帧处理成用于直播的音频流。

优选地，在上述系统中，所述音频流的格式为FLV格式或MP3格式或MP4格式。

优选地，在上述系统中，

本发明实施例提供的一种音频直播方法及系统，本发明实施例提供的一种音频直播方法，发布端将实时采集到的音频数据进行混音压缩以生成AAC数据；在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器；在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。由于本发明实施例是利用Adobe Alchemy技术对采集的原始音频数据进行混音压缩，以获取具有较好音效的立体声，不必使用独立声卡也可以对采集的原始音频数据进行混音，使得直播用户在没有独立声卡的情况下实现了立体声直播。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例音频直播方法的一种流程示意图；

图2为本发明实施例直播系统框图；

图3为本发明实施例音频直播方法的另一种流程示意图；

图4为本发明实施例音频直播系统的一种结构示意图；

图5为本发明实施例音频直播系统的另一种结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1所示，图1为本发明实施例提供的音频直播方法的一种流程示意图，结合图2，实现该方法的步骤包括：

步骤101：发布端将实时采集到的音频数据进行混音压缩以生成AA C数据。

其中，本实施例中的所述发布端便是上传音频数据到网络上的上传方。

举例说明，如果要实现某人所唱歌曲的网络直播，则所述发布端首先利用信号采集设备采集通过麦克风输出的人声和伴奏声音，所述麦克风输出的人声和伴奏声音是原始声音，为了达到较好的播放效果，需要对采集的原始声音即人声和伴奏声等多种音源予以混合处理；然后发布端再将混音后的数据进行压缩编码，以生成AAC格式的音频数据。

其中，AAC(Advanced Audio Coding，高级音频编码)是一种专为声音数据设计的文件压缩格式，利用AAC格式，可使人感觉声音质量没有明显降低的前提下，更加小巧。

步骤102：在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器。

步骤103：在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。

其中，本实施例中的所述接收端便是从网络下载音频数据的用户。

需要说明的是，所述发布端通过发送通道上传关键帧数据至所述流媒体服务器；所述接收端通过接收通道从所述流媒体服务器下载关键帧数据。

当利用传统的流传输通道来传输音频等流媒体数据时，如果发布端上传数据所使用的流通道是基于第三方软件实现的，那么发布端便不能对上传数据进行自主控制；而本发明实施例是将音频数据以关键帧的形式进行上传，即利用传输关键帧数据的传输通道来传输音频压缩数据，这样发布端可以对所述压缩数据的传输时间、传输间隔等方面进行自动控制。

参见图2所示，图2为本发明实施例提供的音频直播方法的另一种流程示意图，结合图2，实现该方法的步骤包括：

步骤201：发布端与流媒体服务器建立发布连接。

步骤202：所述发布端利用flash实时采集音频数据。

其中，所述音频数据为麦克风输出的声音数据和伴奏声音数据，当然还可以是其它多种音源组成的声音数据。

步骤203：所述发布端利用AAC编码器将所述采集到的音频数据进行压缩编码，以生成AAC数据。

步骤204：所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器。

步骤205：接收端与所述流媒体服务器建立接收连接。

步骤206：在所述接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。

本发明实施将截获的关键帧进行解析，并对所述解析后的关键帧进行后续处理，以生成可以用于进行播放的音频流。其中，所述音频流的格式为FLV格式或MP3格式或MP4格式等等。FLV是FLASHVIDEO的简称，FLV流媒体格式是一种视频格式。

本发明实施例可利用Adobe Alchemy技术，将flash采集到的音频数据利用AAC编码器进行压缩编码，然后将压缩后的音频数据通过流媒体服务器FMS广播出去，然后收看端即所述接收端再将接收的音频数据进行解析处理成可以进行播放的音频流。

本发明实施例提供的一种音频直播方法，发布端将实时采集到的音频数据进行混音压缩以生成AAC数据；在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器；在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。由于本发明实施例是利用AdobeAlchemy技术对采集的原始音频数据进行混音压缩，以获取具有较好音效的立体声，不必使用独立声卡也可以对采集的原始音频数据进行混音，使得直播用户在没有独立声卡的情况下实现了立体声直播。

参见图4所示，图4为本发明实施例提供的一种音频直播系统的一种结构示意图，该系统包括：发布端1、流媒体服务器2和接收端3；

所述发布端1，用于将实时采集到的音频数据进行混音压缩以生成AAC数据；在与所述流媒体服务器2建立发布连接后，将所述AAC数据以关键帧的形式上传至所述流媒体服务器；

所述接收端3，用于在与所述流媒体服务器2建立接收连接后，截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。

参见图5所示，图5为本发明实施例提供的一种音频直播系统的另一种结构示意图，该系统包括上述实施例1中的发布端1、流媒体服务器2和接收端3；：

其中，所述发布端1包括：

数据采集单元11，用于实时采集音频数据，所述音频数据为麦克风输出的声音数据和伴奏声音数据；

数据编码单元12，用于利用AAC编码器将所述数据采集单元11采集到的数据进行压缩编码，以生成AAC数据；

第一连接单元13，用于与流媒体服务器2建立发布连接；

数据上传单元14，用于在所述第一连接单元13与流媒体服务器2建立发布连接后，将所述数据编码单元12生成的AAC数据以关键帧的形式上传至所述流媒体服务器2。

其中，所述接收端3包括：

第二连接单元31，用于与所述流媒体服务器2建立接收连接；

数据截获单元32，用于在所述第二连接单元31与所述流媒体服务器2建立接收连接后，截获所述关键帧；

数据处理单元33，用于将所述数据截获单元32截获的关键帧处理成用于直播的音频流。

所述音频流的格式为FLV格式或MP3格式或MP4格式。

本发明实施例提供的一种音频直播系统，本发明实施例提供的一种音频直播方法，发布端将实时采集到的音频数据进行混音压缩以生成AAC数据；在所述发布端与流媒体服务器建立发布连接后，所述发布端将所述AAC数据以关键帧的形式上传至所述流媒体服务器；在接收端与所述流媒体服务器建立接收连接后，所述接收端截获所述关键帧，并将所述截获的关键帧处理成用于直播的音频流。由于本发明实施例是利用Adobe Alchemy技术对采集的原始音频数据进行混音压缩，以获取具有较好音效的立体声，不必使用独立声卡也可以对采集的原始音频数据进行混音，使得直播用户在没有独立声卡的情况下实现了立体声直播。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本发明各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的方法而言，由于其与实施例公开的系统相对应，所以描述的比较简单，相关之处参见系统部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种音频直播方法，其特征在于，包括：

在所述发布端与流媒体服务器建立发布连接后，所述发布端利用传输关键帧数据的传输通道将所述AAC数据以关键帧的形式上传至所述流媒体服务器，通过所述流媒体服务器广播出去；

2.根据权利要求1所述的方法，其特征在于，所述将实时采集到的音频数据进行混音压缩以生成AAC数据包括：

3.根据权利要求1所述的方法，其特征在于，所述音频流的格式为FLV格式或MP3格式或MP4格式。

4.根据权利要求1至3任一项所述的方法，其特征在于，

5.一种音频直播系统，其特征在于，包括：发布端、流媒体服务器和接收端；

所述发布端，用于将实时采集到的音频数据进行混音压缩以生成AAC数据；在与所述流媒体服务器建立发布连接后，利用传输关键帧数据的传输通道将所述AAC数据以关键帧的形式上传至所述流媒体服务器，通过所述流媒体服务器广播出去；

6.根据权利要求5所述的系统，其特征在于，所述发布端包括：

第一连接单元，用于与流媒体服务器建立发布连接；

数据上传单元，用于在所述第一连接单元与流媒体服务器建立发布连接后，将所述数据编码单元生成的AAC数据以关键帧的形式上传至所述流媒体服务器。

7.根据权利要求5所述的系统，其特征在于，所述接收端包括：

第二连接单元，用于与所述流媒体服务器建立接收连接；

8.根据权利要求7所述的系统，其特征在于，所述音频流的格式为FLV格式或MP3格式或MP4格式。

9.根据权利要求5至7任一项所述的系统，其特征在于，