WO2020124725A1

WO2020124725A1 - 基于WebRTC协议的音视频推送方法和推流客户端

Info

Publication number: WO2020124725A1
Application number: PCT/CN2019/072181
Authority: WO
Inventors: 林新建
Original assignee: 网宿科技股份有限公司
Priority date: 2018-12-19
Filing date: 2019-01-17
Publication date: 2020-06-25
Also published as: US20210409476A1; EP3902272A4; EP3902272A1; CN109547844A

Abstract

本发明公开了一种基于WebRTC协议的音视频推送方法和推流客户端，属于流媒体技术领域。所述方法包括：推流客户端调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据；所述推流客户端将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。本发明可以降低传输过程中使用的带宽。

Description

基于WebRTC协议的音视频推送方法和推流客户端

技术领域

本发明涉及流媒体技术领域，尤其涉及一种基于WebRTC协议的音视频推送方法和推流客户端。

背景技术

随着互联网技术的不断发展，实时音视频通信日益受到人们的青睐，越来越多的人通过网络收听音频直播或者收看视频直播。WebRTC(Web Real-Time Communication，源自网页实时通信)协议可以支持网页浏览器进行实时语音对话或视频对话，能够基于浏览器实现视频、音频的实时传输，被广泛应用在上述业务场景中。

通过WebRTC协议进行音视频直播时，推流客户端可以先与资源服务器建立WebRTC连接，推流客户端在录制直播视频时，可以基于WebRTC连接将录制的直播的音视频数据(可称为源数据)推送至资源服务器。之后，与资源服务器建立了WebRTC连接的拉流客户端就可以从资源服务器获取该直播的源数据，从而播放上述直播视频。

在实现本发明的过程中，发明人发现现有技术中至少存在以下问题：

在使用WebRTC协议传输音视频的过程中，如果想在源数据中添加背景音乐、特效音等音频数据，只能将要加入的音频数据(可称为附加数据)与源数据分别传输，然后同时播放。然而有些浏览器不支持同时播放多个音视频数据，无法同时播放源数据与附加数据，并且这样会造成传输过程中占用带宽较高；源数据与附加数据只能被分别录制，不方便回看。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种基于WebRTC协议的音视频推送方法和推流客户端。所述技术方案如下：

第一方面，提供了一种基于WebRTC协议的音视频推送方法，所述方法包括：

推流客户端调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；

所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；

所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据；

所述推流客户端将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。

进一步的，所述方法还包括：

所述推流客户端在所述音频处理模块上设置源数据输入单元和附加数据输入单元；

所述推流客户端通过所述源数据输入单元和所述混合输出单元搭建源数据处理线；

所述推流客户端通过所述附加数据输入单元和所述混合输出单元搭建附加数据处理线。

进一步的，所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据，包括：

所述推流客户端将所述源数据输入所述源数据输入单元，并通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元；

所述推流客户端将所述附加数据输入所述附加数据输入单元，并通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元；

所述推流客户端通过所述混合输出单元对所述源数据输入单元的输出数据和附加数据输入单元的输出数据进行处理，生成所述处理数据。

进一步的，所述源数据处理线上所述源数据输入单元和所述混合输出单元间设置有源音量调节单元；

所述推流客户端通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元，包括：

所述推流客户端通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述源音量调节单元，并将所述源音量调节单元的输出数据导入所述混合输出单元。

进一步的，所述附加数据处理线上所述附加数据输入单元和所述混合输出单元间设置有附加音量调节单元；

所述推流客户端通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元，包括：

所述推流客户端通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述附加音量调节单元，并将所述附加音量调节单元的输出数据导入所述混合输出单元。

进一步的，所述推流客户端将附加数据输入所述附加数据输入单元，包括：

所述推流客户端调用所述音频处理模块的decodeAudioData函数，对所述附加数据进行解码，将解码后的附加数据输入所述附加数据输入单元。

进一步的，所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据，包括：

所述推流客户端调用所述浏览器的数据处理接口提取所述源数据中的视频数据；

所述推流客户端调用所述浏览器的数据处理接口提取所述处理数据中的音频数据；

所述推流客户端调用所述浏览器的数据处理接口将所述视频数据和所述音频数据合并后，生成所述混音数据。

进一步的，所述方法还包括：

所述推流客户端调用所述浏览器的数据采集接口采集所述源数据，并将所述源数据输入所述音频处理模块。

进一步的，所述方法还包括：

所述推流客户端调用所述浏览器的附加数据接口获取所述附加数据，并将所述附加数据输入所述音频处理模块。

进一步的，所述推流客户端将所述混音数据推送给资源服务器，包括：

所述推流客户端调用所述浏览器的连接接口创建推送模块；

所述推流客户端通过所述推送模块与所述资源服务器建立连接；

所述推流客户端将所述混音数据输入所述推送模块，并通过所述推送模块推送给所述资源服务器。

第二方面，提供了一种基于WebRTC协议的音视频推流客户端，所述推流客户端用于：

调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；

将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；

将所述源数据和所述处理数据进行合并，生成混音数据；

将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。

进一步的，所述推流客户端还用于：

在所述音频处理模块上设置源数据输入单元和附加数据输入单元；

通过所述源数据输入单元和所述混合输出单元搭建源数据处理线；

通过所述附加数据输入单元和所述混合输出单元搭建附加数据处理线。

进一步的，所述推流客户端具体用于：

将所述源数据输入所述源数据输入单元，并通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元；

将所述附加数据输入所述附加数据输入单元，并通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元；

通过所述混合输出单元对所述源数据输入单元的输出数据和附加数据输入单元的输出数据进行处理，生成所述处理数据。

所述推流客户端具体用于：通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述源音量调节单元，并将所述源音量调节单元的输出数据导入所述混合输出单元。

所述推流客户端具体用于：通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述附加音量调节单元，并将所述附加音量调节单元的输出数据导入所述混合输出单元。

进一步的，所述推流客户端具体用于：

调用所述音频处理模块的decodeAudioData函数，对所述附加数据进行解码，将解码后的附加数据输入所述附加数据输入单元。

进一步的，所述推流客户端具体用于：

调用所述浏览器的数据处理接口提取所述源数据中的视频数据；

调用所述浏览器的数据处理接口提取所述处理数据中的音频数据；

调用所述浏览器的数据处理接口将所述视频数据和所述音频数据合并后，生成所述混音数据。

进一步的，所述推流客户端还用于：

调用所述浏览器的数据采集接口采集所述源数据，并将所述源数据输入所述音频处理模块。

进一步的，所述推流客户端还用于：

调用所述浏览器的附加数据接口获取所述附加数据，并将所述附加数据输入所述音频处理模块。

进一步的，所述推流客户端具体用于：

调用所述浏览器的连接接口创建推送模块；

通过所述推送模块与所述资源服务器建立连接；

将所述混音数据输入所述推送模块，并通过所述推送模块推送给所述资源服务器。

本发明实施例提供的技术方案带来的有益效果是：

本发明实施例中，推流客户端调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据；所述推流客户端将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。这样，将源数据和附加数据合并成为一份混音数据，在传输过程中减少了一份数据的传输，降低传输过程中使用的带宽；播放和录制时也只需要处理一份数据，可以支持更多种类的浏览器进行播放，有利于后期回看。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于WebRTC协议的音视频推送方法的流程图；

图2是本发明实施例提供的一种基于WebRTC协议的音视频推送方法中源数据和附加数据生成处理数据的处理流程图；

图3是本发明实施例提供的一种基于WebRTC协议的音视频推送方法中源数据和处理数据合并得到混音数据的处理流程图；

图4是本发明实施例提供的一种基于WebRTC协议的音视频推送方法中推流客户端向资源服务器推送混音数据的原理图；

图5是本发明实施例提供的一种基于WebRTC协议的音视频推流客户端的结构示意图；

图6是本发明实施例提供的一种基于WebRTC协议的音视频推流客户端的结构示意图；

图7是本发明实施例提供的一种基于WebRTC协议的音视频推流客户端的结构示意图；

图8是本发明实施例提供的一种基于WebRTC协议的音视频推流客户端的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种基于WebRTC协议的音视频推送方法，该方法可以适用于采用WebRTC协议传输直播的音视频数据的推流客户端上，并可以具体由推流客户端中设置的推流模块来实现，推流客户端通过WebRTC协议与资源服务器建立连接，并基于该连接向资源服务器推送直播数据流。下述所有推流客户端的处理，均可以理解为实际由推流客户端中的推流模块执行。本实施例的应用场景可以是：推流客户端通过摄像头或麦克风等设备采集直播的音视频数据作为源数据，同时，通过网络下载或其他方法获取想要加入源数据的音频数据作为附加数据，之后，推流客户端对源数据和附加数据处理后生成处理数据；推流客户端再将源数据和处理数据合并，就得到了将附加数据加入源数据后的混音数据，推流客户端可以通过和资源服务器建立的WebRTC连接，将该混音数据推送给资源服务器，这样，拉流客户端就可以从资源服务器上获取该混音数据。

下面将结合具体实施方式，对图1所示的一种基于WebRTC协议的音视频推送流程进行详细的说明，内容可以如下：

步骤101：推流客户端调用浏览器的音频接口创建音频处理模块，并在音频处理模块上设置混合输出单元。

在实施中，当利用推流客户端进行音视频直播时，推流客户端上安装有以AudioContext接口作为音频接口的浏览器，推流客户端调用浏览器的AudioContext接口创建音频处理模块AC(AudioContext)，然后在音频处理模块AC中通过createMediaStreamDestination函数设置用于将源数据OS(OriginalStream)和附加数据FD(FileData)混合后输出的混合输出单元MDN(MediaStreamAudioDestinationNode)，设置方法可以采用如下公式：

MDN＝AC.createMediaStreamDestination()

音频处理模块AC上还设置有输入单元，相应的处理可以如下：推流客户端在音频处理模块上设置源数据输入单元和附加数据输入单元；推流客户端通过源数据输入单元和混合输出单元搭建源数据处理线；推流客户端通过附加数据输入单元和混合输出单元搭建附加数据处理线。

在实施中，在设置混合输出单元MDN的同时，推流客户端还可以在音频处理模块AC中通过createMediaStreamSource函数设置用于输入源数据OS的源数据输入单元MSN(MediaStreamAudioSourceNode)，然后，推流客户端通过connect函数将源数据输入单元MSN和混合输出单元MDN连接起来，使得源数据OS可以顺次经过源数据输入单元MSN和混合输出单元MDN，并在各单元进行相应的处理，这样，就形成了一个用于处理源数据OS的单向线路，即通过源数据输入单元MSN和混合输出单元MDN搭建的源数据处理线。

通过createMediaStreamSource函数设置源数据输入单元MSN的方法可以采用如下公式：

MSN＝AC.createMediaStreamSource(OS)

通过connect函数将源数据输入单元MSN和混合输出单元MDN连接起来的方法可以采用如下公式：

MSN.connect(MDN)

同理，推流客户端在音频处理模块AC中通过createBufferSource函数设置用于输入附加数据FD的附加数据输入单元BSN(AudioBufferSourceNode)，然后，推流客户端同样通过connect函数将附加数据输入单元BSN和混合输出单元MDN连接起来，使得附加数据FD可以顺次经过附加数据输入单元BSN和混合输出单元MDN，并在各单元进行相应的处理，这样，就形成了一个用于处理附加数据FD的单向线路，即通过附加数据输入单元BSN和混合输出单元MDN搭建的附加数据处理线。

通过createBufferSource函数设置附加数据输入单元BSN的方法可以采用如下公式：

BSN＝AC.createBufferSource()

通过connect函数将附加数据输入单元BSN和混合输出单元MDN连接起来的方法可以采用如下公式：

BSN.connect(MDN)

步骤102：推流客户端将源数据和附加数据输入音频处理模块，并通过混合输出单元生成处理数据。

在实施中，在设置完成混合输出单元MDN后，推流客户端获取源数据OS和附加数据FD，并输入音频处理模块AC，然后，推流客户端通过混合输出单元MDN，根据源数据OS和附加数据FD生成处理数据DS(DisposeStream)。

基于上文搭建的源数据处理线和附加数据处理线，步骤102的处理具体可以如下：推流客户端将源数据输入源数据输入单元，并通过源数据处理线，将源数据输入单元的输出数据导入混合输出单元；推流客户端将附加数据输入附加数据输入单元，并通过附加数据处理线，将附加数据输入单元的输出数据导入混合输出单元；推流客户端通过混合输出单元对源数据输入单元的输出数据和附加数据输入单元的输出数据进行处理，生成处理数据。

在实施中，在搭建好源数据处理线和附加数据处理线之后，推流客户端将源数据OS输入源数据输入单元MSN，根据源数据处理线，推流客户端可以就将源数据输入单元MSN的输出数据，导入混合输出单元MDN。推流客户端将附加数据FD输入附加数据输入单元BSN，根据附加数据处理线，推流客户端就可以将附加数据输入单元BSN的输出数据，导入混合输出单元MDN。混合输出单元MDN在被导入源数据输入单元MSN的输出数据和附加数据输入单元BSN的输出数据后，对两份输出数据进行处理生成处理数据DS。

在对源数据OS进行处理的过程中，可以对源数据OS的音量大小进行调节，相应的处理可以如下：源数据处理线上源数据输入单元和混合输出单元间设置有源音量调节单元；推流客户端通过源数据处理线，将源数据输入单元的输出数据导入源音量调节单元，并将源音量调节单元的输出数据导入混合输出单元。

在实施中，推流客户端还可以在音频处理模块AC中通过createGain函数设置源音量调节单元GN(GainNode)。

通过createGain函数设置源音量调节单元GN的方法可以采用如下公式：

GN＝AC.createGain()

然后，推流客户端将源音量调节单元GN设置在源数据输入单元MSN和混合输出单元MDN之间。具体的，推流客户端通过connect函数将源数据输入单元MSN、源音量调节单元GN和混合输出单元MDN顺次连接起来，构成源数据处理线，从而使得源数据OS被输入源数据输出单元MSN后，源数据输入单元MSN的输出数据，可以被导入源音量调节单元GN，经过源音量调节单元GN处理后的输出数据，可以被导入混合输出单元MDN。

通过connect函数将源数据输入单元MSN、源音量调节单元GN和混合输出单元MDN顺次连接起来的方法可以采用如下公式：

MSN.connect(GN)；

GN.connect(MDN)

在对附加数据FD进行处理的过程中，可以对附加数据FD的音量大小进行调节，相应的处理可以如下：附加数据处理线上附加数据输入单元和混合输出单元间设置有附加音量调节单元；推流客户端通过附加数据处理线，将附加数据输入单元的输出数据导入附加音量调节单元，并将附加音量调节单元的输出数据导入混合输出单元。

在实施中，推流客户端还可以在音频处理模块AC中通过createGain函数设置附加音量调节单元GN1。

通过createGain函数设置附加音量调节单元GN1的方法可以采用如下公式：

GN1＝AC.createGain()

然后，推流客户端将附加音量调节单元GN1设置在附加数据输入单元BSN和混合输出单元MDN之间。具体的，推流客户端通过connect函数将附加数据输入单元BSN、附加音量调节单元GN1和混合输出单元MDN顺次连接起来，构成附加数据处理线，从而使得附加数据FD被输入附加数据输出单元BSN后，附加数据输入单元BSN的输出数据，可以被导入附加音量调节单元GN1，经过附加音量调节单元GN1处理后的输出数据，可以被导入混合输出单元MDN。

通过connect函数将附加数据输入单元BSN、附加音量调节单元GN和混合输出单元MDN顺次连接起来的方法可以采用如下公式：

BSN.connect(GN1)；

GN1.connect(MDN)

推流服务器得到的附加数据FD还需要进行相应的解码处理，以便于和源数据OS混合，相应的处理可以如下：推流客户端调用音频处理模块的decodeAudioData函数，对附加数据进行解码，将解码后的附加数据输入附加数据输入单元。

在实施中，推流客户端在得到附加数据FD后，调用音频处理模块AC的decodeAudioData函数，对附加数据FD进行解码，得到音频PCM(Pulse Code Modulation，脉冲编码调制)数据DFD，然后将解码后的附加数据DFD输入附加数据输入单元BSN。

调用decodeAudioData函数对附加数据FD进行解码的方法可以采用如下公式：

DFD＝AC.decodeAudioData(FD)

上述根据源数据OS和附加数据FD生成处理数据DS的处理过程可以参考图2所示。

在进行音视频直播的过程中，可以通过推流客户端采集直播的音视频数据作为源数据OS，相应的处理可以如下：推流客户端调用浏览器的数据采集接口采集源数据，并将源数据输入音频处理模块。

在实施中，推流客户端上内置或外接有摄像头和/或麦克风等音视频采集设备，当用户进行直播时，推流客户端可以调用浏览器提供的数据采集接口，例如getUserMedia接口，启动这些采集设备进行音视频数据采集。推流客户端将采集到的音视频数据作为源数据OS，输入音频处理模块AC。

通过getUserMedia接口采集源数据OS的方法可以如下：

getUserMedia(config)

.then((stream)＝>{

OS＝stream；

})

为了在音视频直播的过程中加入其他音视频，可以通过推流客户端从网络上下载所需的音视频数据作为附加数据FD，相应的处理可以如下：推流客户端调用浏览器的附加数据接口获取附加数据，并将附加数据输入音频处理模块。

在实施中，用户在直播过程中，可能需要增加一些背景音乐、特殊音效等音视频来增加直播效果，因此，可以通过网络获取这些音视频数据。在得到附加数据FD的链接地址后，推流客户端调用浏览器提供的附加数据接口，例如XMLHttpRequest接口，从网络中下载音视频数据作为附加数据FD，并输入音频处理模块AC。

步骤103：推流客户端将源数据和处理数据进行合并，生成混音数据。

在实施中，在通过混音数据输出单元MDN得到处理数据DS后，推流客户端将源数据OS和处理数据DS进行合并，最终生成混音数据MS(MixingStream)。

在本发明的一实施方式中，推流客户端的页面包括推流区域和显示区域。其中推流区域提供一些按钮及文本框等常见网页元素，推流用户可以进行相应操作，以实现混音数据MS的推送。显示区域提供一个页面外部容器(页面div，页面division)，该页面外部容器可以与推流客户端进行交互，用于显示推送给资源服务器的混音数据MS，便于推流客户端本地预览混音数据的效果。推流客户端在生成混音数据MS之后，可以将该混音数据MS实时展示在显示区域中。具体地，在生成混音数据MS后，推流客户端可以创建显示视频(Video)标签，并将混音数据MS加载至显示视频标签中。其中，该显示视频标签的播放属性可以设置为可见，这样，推流用户在外部便可以直接观看到混音数据MS的画面。然后，推流客户端可以创建内部容器(内部div，内部division)，并将显示视频标签中加载的混音数据MS展示于内部容器中。然后，浏览器页面可以通过回调展示混音数据MS的内部容器，从而将展示混音数据MS的内部容器填充于预先在浏览器页面中设置的页面外部容器内。页面外部容器可以在显示区域中自定义画面展示的效果样式。

由于源数据OS自身包含有音频数据，直接将源数据OS与处理数据DS合并，会导致混音数据MS中含有多个音频数据，进而影响传输过程中对混音数据MS的编解码，故而，生成混音数据MS的处理可以如下：推流客户端调用浏览器的数据处理接口提取源数据中的视频数据；推流客户端调用浏览器的数据处理接口提取处理数据中的音频数据；推流客户端调用浏览器的数据处理接口将视频数据和音频数据合并后，生成混音数据。

在实施中，浏览器的数据处理接口可以是MediaStream接口或者其他接口，在得到处理数据DS后，推流客户端调用浏览器的MediaStream接口，通过getVideoTracks函数，从源数据OS中提取视频数据VT(VideoTracks)。

通过getVideoTracks函数从源数据OS中提取视频数据VT的方法可以采用如下公式：

VT＝OS.getVideoTracks()[0]

同时，推流客户端调用浏览器的MediaStream接口，通过getAudioTracks函数，从处理数据DS中提取音频数据AT(AudioTracks)。

通过getVideoTracks函数从处理数据DS中提取音频数据AT的方法可以采用如下公式：

AT＝DS.getAudioTracks()[0]

之后，推流客户端继续调用浏览器的MediaStream接口将提取得到的视频数据VT和音频数据AT合并，生成混音数据MS。

将提取得到的视频数据VT和音频数据AT合并生成混音数据MS的方法可以采用如下公式：

MS＝MediaStream([AT,VT])

上述根据源数据OS和处理数据DS合并得到混音数据MS的处理过程可以参考图3所示。当混音数据MS被推流客户端推送至资源服务器后，资源服务器会对混音数据MS的音频数据和视频数据重新编解码，合并后得到的混音数据MS中由于只有一个音频数据和一个视频数据，这样，可以提高资源服务器编解码的兼容性。

步骤104：推流客户端将混音数据推送给资源服务器，以使拉流客户端从资源服务器获取混音数据。

在实施中，推流客户端在生成混音数据MS后，可以将混音数据MS推送给资源服务器，这样，拉流客户端与资源服务器建立连接后，就可以从资源服务器上获取混音数据MS。

在本发明的一实施方式中，拉流客户端的页面包括拉流区域和显示区域。其中拉流区域提供一些按钮及文本框等常见网页元素，拉流用户可以进行相应操作，以实现混音数据MS的拉取。具体的，在拉流区域设置好相关流的配置信息后，拉流客户端开始拉流；拉流用户查看显示区域所显示的混音数据MS画面，用音频输出设备如耳机或者电脑扬声器收听是否有混音效果(如同时听到推流端主播说话声和背景音乐声)。

推流客户端在将混音数据MS发送给资源服务器之前，还需要先与资源服务器建立连接，相应的处理可以如下：推流客户端调用浏览器的连接接口创建推送模块；推流客户端通过推送模块与资源服务器建立连接；推流客户端将混音数据输入推送模块，并通过推送模块推送给资源服务器。

在实施中，当需要向资源服务器推送音视频数据时，推流客户端调用浏览器提供的连接接口创建推送模块，通常，推流客户端可以使用RTCPeerConnection接口作为连接接口。推流客户端通过推送模块，基于WebRTC协议与资源服务器建立连接，之后，推流客户端就可以将混音数据MS输入推送模块，然后再通过推送模块将混音数据MS推送给资源服务器，上述过程可以参考图4所示。拉流客户端可以同样基于WebRTC协议与资源服务器建立连接，在资源服务器接收到混音数据MS之后，与资源服务器建立连接的拉流客户端就可以从资源服务器上拉取混音数据MS。

基于相同的技术构思，本发明实施例还提供了一种基于WebRTC协议的音视频推流客户端，如图5所示，所述推流客户端500用于：

调用浏览器510的音频接口创建音频处理模块511，并在所述音频处理模块511上设置混合输出单元521；

将源数据和附加数据输入所述音频处理模块511，并通过所述混合输出单元521生成处理数据；

将所述源数据和所述处理数据进行合并，生成混音数据；

可选的，如图6所示，所述推流客户端500还用于：

在所述音频处理模块511上设置源数据输入单元522和附加数据输入单元523；

通过所述源数据输入单元522和所述混合输出单元521搭建源数据处理线；

通过所述附加数据输入单元523和所述混合输出单元521搭建附加数据处理线。

可选的，所述推流客户端500具体用于：

将所述源数据输入所述源数据输入单元522，并通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元521；

将所述附加数据输入所述附加数据输入单元523，并通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元521；

通过所述混合输出单元521对所述源数据输入单元522的输出数据和附加数据输入单元523的输出数据进行处理，生成所述处理数据。

可选的，如图7所示，所述源数据处理线上所述源数据输入单元522和所述混合输出单元521间设置有源音量调节单元524；

所述推流客户端500具体用于：通过所述源数据处理线，将所述源数据输入单元522的输出数据导入所述源音量调节单元524，并将所述源音量调节单元524的输出数据导入所述混合输出单元521。

可选的，如图7所示，所述附加数据处理线上所述附加数据输入单元523 和所述混合输出单元521间设置有附加音量调节单元525；

所述推流客户端500具体用于：通过所述附加数据处理线，将所述附加数据输入单元523的输出数据导入所述附加音量调节单元525，并将所述附加音量调节单元525的输出数据导入所述混合输出单元521。

可选的，所述推流客户端500具体用于：

调用所述音频处理模块511的decodeAudioData函数，对所述附加数据进行解码，将解码后的附加数据输入所述附加数据输入单元521。

可选的，所述推流客户端500具体用于：

调用所述浏览器510的数据处理接口提取所述源数据中的视频数据；

调用所述浏览器510的数据处理接口提取所述处理数据中的音频数据；

调用所述浏览器510的数据处理接口将所述视频数据和所述音频数据合并后，生成所述混音数据。

可选的，所述推流客户端500还用于：

调用所述浏览器510的数据采集接口采集所述源数据，并将所述源数据输入所述音频处理模块511。

可选的，所述推流客户端500还用于：

调用所述浏览器510的附加数据接口获取所述附加数据，并将所述附加数据输入所述音频处理模块511。

可选的，如图8所示，所述推流客户端500具体用于：

调用所述浏览器510的连接接口创建推送模块512；

通过所述推送模块512与所述资源服务器建立连接；

将所述混音数据输入所述推送模块512，并通过所述推送模块512推送给所述资源服务器。

需要说明的是：上述实施例提供的基于WebRTC协议的音视频推流客户端在实现基于WebRTC协议的音视频推送时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将推流客户端的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。同时，上述实施例提供的基于WebRTC协议的音视频推流客户端与基于WebRTC协议的音视频推送方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务端，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

基于WebRTC协议的音视频推送方法，其特征在于，所述方法包括：

推流客户端调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；

所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；

所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据；

所述推流客户端将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述推流客户端在所述音频处理模块上设置源数据输入单元和附加数据输入单元；

所述推流客户端通过所述源数据输入单元和所述混合输出单元搭建源数据处理线；

所述推流客户端通过所述附加数据输入单元和所述混合输出单元搭建附加数据处理线。
根据权利要求2所述的方法，其特征在于，所述推流客户端将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据，包括：

所述推流客户端将所述源数据输入所述源数据输入单元，并通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元；

所述推流客户端将所述附加数据输入所述附加数据输入单元，并通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元；

所述推流客户端通过所述混合输出单元对所述源数据输入单元的输出数据和附加数据输入单元的输出数据进行处理，生成所述处理数据。
根据权利要求3所述的方法，其特征在于，所述源数据处理线上所述源数据输入单元和所述混合输出单元间设置有源音量调节单元；

所述推流客户端通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元，包括：

所述推流客户端通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述源音量调节单元，并将所述源音量调节单元的输出数据导入所述混合输出单元。
根据权利要求3所述的方法，其特征在于，所述附加数据处理线上所述附加数据输入单元和所述混合输出单元间设置有附加音量调节单元；

所述推流客户端通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元，包括：

所述推流客户端通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述附加音量调节单元，并将所述附加音量调节单元的输出数据导入所述混合输出单元。
根据权利要求3所述的方法，其特征在于，所述推流客户端将附加数据输入所述附加数据输入单元，包括：

所述推流客户端调用所述音频处理模块的decodeAudioData函数，对所述附加数据进行解码，将解码后的附加数据输入所述附加数据输入单元。
根据权利要求1所述的方法，其特征在于，所述推流客户端将所述源数据和所述处理数据进行合并，生成混音数据，包括：

所述推流客户端调用所述浏览器的数据处理接口提取所述源数据中的视频数据；

所述推流客户端调用所述浏览器的数据处理接口提取所述处理数据中的音频数据；

所述推流客户端调用所述浏览器的数据处理接口将所述视频数据和所述音频数据合并后，生成所述混音数据。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述推流客户端调用所述浏览器的数据采集接口采集所述源数据，并将所述源数据输入所述音频处理模块。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述推流客户端调用所述浏览器的附加数据接口获取所述附加数据，并将所述附加数据输入所述音频处理模块。
根据权利要求1所述的方法，其特征在于，所述推流客户端将所述混音数据推送给资源服务器，包括：

所述推流客户端调用所述浏览器的连接接口创建推送模块；

所述推流客户端通过所述推送模块与所述资源服务器建立连接；

所述推流客户端将所述混音数据输入所述推送模块，并通过所述推送模块推送给所述资源服务器。
基于WebRTC协议的音视频推流客户端，其特征在于，所述推流客户端用于：

调用浏览器的音频接口创建音频处理模块，并在所述音频处理模块上设置混合输出单元；

将源数据和附加数据输入所述音频处理模块，并通过所述混合输出单元生成处理数据；

将所述源数据和所述处理数据进行合并，生成混音数据；

将所述混音数据推送给资源服务器，以使拉流客户端从所述资源服务器获取所述混音数据。
根据权利要求11所述的推流客户端，其特征在于，所述推流客户端还用于：

在所述音频处理模块上设置源数据输入单元和附加数据输入单元；

通过所述源数据输入单元和所述混合输出单元搭建源数据处理线；

通过所述附加数据输入单元和所述混合输出单元搭建附加数据处理线。
根据权利要求12所述的推流客户端，其特征在于，所述推流客户端具体用于：

将所述源数据输入所述源数据输入单元，并通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述混合输出单元；

将所述附加数据输入所述附加数据输入单元，并通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述混合输出单元；

通过所述混合输出单元对所述源数据输入单元的输出数据和附加数据输入单元的输出数据进行处理，生成所述处理数据。
根据权利要求13所述的推流客户端，其特征在于，所述源数据处理线上所述源数据输入单元和所述混合输出单元间设置有源音量调节单元；

所述推流客户端具体用于：通过所述源数据处理线，将所述源数据输入单元的输出数据导入所述源音量调节单元，并将所述源音量调节单元的输出数据导入所述混合输出单元。
根据权利要求13所述的推流客户端，其特征在于，所述附加数据处理线上所述附加数据输入单元和所述混合输出单元间设置有附加音量调节单元；

所述推流客户端具体用于：通过所述附加数据处理线，将所述附加数据输入单元的输出数据导入所述附加音量调节单元，并将所述附加音量调节单元的输出数据导入所述混合输出单元。
根据权利要求13所述的推流客户端，其特征在于，所述推流客户端具体用于：

调用所述音频处理模块的decodeAudioData函数，对所述附加数据进行解码，将解码后的附加数据输入所述附加数据输入单元。
根据权利要求11所述的推流客户端，其特征在于，所述推流客户端具体用于：

调用所述浏览器的数据处理接口提取所述源数据中的视频数据；

调用所述浏览器的数据处理接口提取所述处理数据中的音频数据；

调用所述浏览器的数据处理接口将所述视频数据和所述音频数据合并后，生成所述混音数据。
根据权利要求11所述的推流客户端，其特征在于，所述推流客户端还用于：

调用所述浏览器的数据采集接口采集所述源数据，并将所述源数据输入所述音频处理模块。
根据权利要求11所述的推流客户端，其特征在于，所述推流客户端还用于：

调用所述浏览器的附加数据接口获取所述附加数据，并将所述附加数据输入所述音频处理模块。
根据权利要求11所述的推流客户端，其特征在于，所述推流客户端具体用于：

调用所述浏览器的连接接口创建推送模块；

通过所述推送模块与所述资源服务器建立连接；

将所述混音数据输入所述推送模块，并通过所述推送模块推送给所述资源服务器。