WO2016119560A1

WO2016119560A1 - 音频传输的自适应方法及装置

Info

Publication number: WO2016119560A1
Application number: PCT/CN2015/099813
Authority: WO
Inventors: 刘霖; 赵旭; 刘聪
Original assignee: 中国移动通信集团公司
Priority date: 2015-01-29
Filing date: 2015-12-30
Publication date: 2016-08-04
Also published as: CN105989844A; CN105989844B

Abstract

一种音频传输的自适应方法及装置，其方法包括：获取与流媒体客户端之间的当前网络的传输速率（S10）；根据待传输的音频流在预定编码策略下的音频帧的比特数与传输速率，计算音频帧的传输时间(S20)；判断传输时间是否超出一预设的传输时延阈值(S30)；若未超出，按照预定编码策略，对音频流进行编码后并发送至向流媒体客户端；若超出，则调整预定编码策略，降低音频流编码后的音频帧的比特数，并将编码后的音频流发送至流媒体客户端(S40)。

Description

音频传输的自适应方法及装置

相关申请的交叉引用

本申请主张在2015年1月29日在中国提交的中国专利申请号No.201510047890.6的优先权，其全部内容通过引用包含于此。

技术领域

本公开涉及流媒体传输领域，尤其涉及一种音频传输的自适应方法及装置。

背景技术

目前流媒体传输已成为网络通信中的一常用功能，在流媒体传输的框架中，存在某些对于音频流的限制，其中一个比较普遍的问题是对于音频流时延的要求。音频流时延包括：网络传输时延和编码设备时延，为了降低音频流时延通常由两个方向入手：一是降低网络时延，优化网络结构，例如建立端到端的直接物理连接，采用高效传输控制协议，以及优化网络环境等；一是优化设备处理效率，提高设备的运算速率，优化处理逻辑，提高程序效率。

虽然以上两种方式可以在很大程度上解决音频流时延的问题，但均不能解决网络环境的随机性问题。现有技术中，无论物理层基于何种网络拓扑结构，何种网络介质，网络抖动、网络不稳定都无法避免，在这样的情况下，可能出现高于标准要求的时延，从而可能导致设备之间配合异常。

发明内容

为了解决上述技术问题，本公开提供了一种音频传输的自适应方法及装置，解决了当网络抖动时，音频流时延超标的问题。

依据本公开的一个方面，提供了一种音频传输的自适应方法，应用于流媒体服务器端，包括：

获取与流媒体客户端之间的当前网络的传输速率；

根据待传输的音频流在预定编码策略下的音频帧的比特数与传输速率，计算音频帧的传输时间；

判断传输时间是否超出一预设的传输时延阈值；

若未超出，按照预定编码策略对音频流进行编码，并发送至向流媒体客户端；

若超出，则调整预定编码策略，降低音频流编码后的音频帧的比特数，并将编码后的音频流发送至流媒体客户端。

其中，获取与流媒体客户端之间的当前网络的传输速率的步骤包括：

向流媒体客户端发送网络探测消息，其中，网络探测消息携带有发送网络探测消息的第一时间；

接收流媒体客户端响应网络探测消息后发送的探测响应消息，其中，探测响应消息携带有流媒体客户端接收到网络探测消息的第二时间；

根据第二时间与第一时间的时间差，以及网络探测消息的比特数，计算与流媒体客户端之间的传输速率。

其中，调整预定编码策略，降低编码后的音频帧的比特数的步骤包括：

检测编码特性是否支持第一编码策略；

若支持，则根据第一编码策略降低音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出传输时延阈值；若未超出，则将编码后的音频流发送至流媒体客户端；若超出，则检测编码特性是否支持第二编码策略；

若不支持，则检测编码特性是否支持第二编码策略；若不支持第二编码策略，则丢弃音频流编码后的音频帧中的部分帧；若支持第二编码策略，则根据第二编码策略降低音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出传输时延阈值；若未超出，则将编码后的音频流发送至流媒体客户端；若超出，则丢弃音频流编码后的音频帧中的部分帧；

第一编码策略为分帧策略和多码率策略中的一种，第二编码策略为另一种。

其中，第一编码策略为分帧策略，分帧策略包括多种帧长；根据第一编码策略降低音频流编码后的音频帧的比特数的步骤包括：

将音频流分为多个第一音频流，并按照当前编码码率对第一音频流进行编码，其中，第一音频流的长度为分帧策略中的最短帧长。

其中，第二编码策略为多码率策略，多码率策略包括：所支持的编码码率集合；根据第二编码策略降低音频流编码后的音频帧的比特数的步骤包括：

采用编码码率集合中低于当前编码码率的编码码率对第一音频流重新编码。

其中，第一编码策略为多码率策略，多码率策略包括：所支持的编码码率集合；根据第一编码策略降低音频流编码后的音频帧的比特数的步骤包括：

采用编码码率集合中低于当前编码码率的编码码率对音频流重新编码。

其中，第二编码策略为分帧策略，分帧策略包括多种帧长，根据第二编码策略降低音频流编码后的音频帧的比特数的步骤包括：

将编码后的音频帧分为多个第一音频帧，第一音频帧的长度为分帧策略中的最短帧长。

依据本公开的另一个方面，还提供了一种音频传输的自适应装置，应用于流媒体服务器端，包括：

获取模块，用于获取与流媒体客户端之间的当前网络的传输速率；

计算模块，用于根据待传输的音频流在预定编码策略下的音频帧的比特数与传输速率，计算音频帧的传输时间；

判断模块，用于判断是否超出一预设的传输时延阈值；

第一调整模块，用于当传输时间未超出传输时延阈值时，按照预定编码策略对音频流进行编码，并发送至向流媒体客户端；

第二调整模块，用于当传输时间超出传输时延阈值时，调整预定编码策略，降低音频流编码后的音频帧的比特数，并将编码后的音频流发送至流媒体客户端。

其中，获取模块包括：

发送单元，用于向流媒体客户端发送网络探测消息，其中，网络探测消息携带有发送网络探测消息的第一时间；

接收单元，用于接收流媒体客户端响应网络探测消息后发送的探测响应消息，其中，探测响应消息携带有流媒体客户端接收到网络探测消息的第二时间；

计算单元，用于根据第二时间与第一时间的时间差，以及网络探测消息的比特数，计算与流媒体客户端之间的传输速率。

其中，第二调整模块包括：

第一检测单元，用于检测编码特性是否支持第一编码策略；

第一调整单元，用于当支持第一编码策略时，根据第一编码策略降低音频流编码后的音频帧的比特数；

第一判断单元，用于判断降低比特数后的音频帧的传输时间是否超出传输时延阈值；若未超出，则将编码后的音频流发送至流媒体客户端；若超出，则检测编码特性是否支持第二编码策略；

第二检测单元，用于当不支持第一编码策略时，检测编码特性是否支持第二编码策略；

第二调整单元，用于当不支持第二编码策略时，丢弃音频流编码后的音频帧中的部分帧；当支持第二编码策略时，根据第二编码策略降低音频流编码后的音频帧的比特数；

第二判断单元，用于判断降低比特数后的音频帧的传输时间是否超出传输时延阈值；若未超出，则将编码后的音频流发送至流媒体客户端；若超出，则丢弃音频流编码后的音频帧中的部分帧；

其中，第一编码策略为分帧策略和多码率策略中的一种，第二编码策略为另一种。

其中，第一编码策略为分帧策略，分帧策略包括多种帧长；第一调整单元包括：

第一调整子单元，用于将音频流分为多个第一音频流，并按照当前编码码率对第一音频流进行编码，其中，第一音频流的长度为分帧策略中的最短帧长。

其中，第二编码策略为多码率策略，多码率策略包括：所支持的编码码率集合；第二调整单元包括：

第二调整子单元，用于采用编码码率集合中低于当前编码码率的编码码率对第一音频流重新编码。

其中，第一编码策略为多码率策略，多码率策略包括：所支持的编码码率集合；第一调整单元还包括：

第三调整子单元，用于采用编码码率集合中低于当前编码码率的编码码率对音频流重新编码。

其中，第二编码策略为分帧策略，分帧策略包括多种帧长，第二调整单元还包括：

第四调整子单元，用于将编码后的音频帧分为多个第一音频帧，第一音频帧的长度为分帧策略中的最短帧长。

本公开的实施例的有益效果是：一种音频传输的自适应方法及装置，通过发送网络探测消息的方式，计算当前网络的传输速率，根据待传输音频流在预定编码策略下的音频帧的比特数与传输速率，计算该音频帧的传输时间，再判断得到的传输时间是否超出了预设的传输时延阈值，若未超出，则按照预定编码策略对该音频流进行编码并发送至流媒体客户端，若超出，则调整预定编码策略，降低音频流编码后的比特数，并将编码后的音频流发送至流媒体客户端。根据当前网络传输速率与预设传输时延阈值的关系，来调整音频流的编码策略，以使音频传输适应当前网络的传输速率，解决了因网络抖动或网络不稳定而造成的高于标准要求的时延，进而影响设备之间配合异常的问题。

附图说明

图1表示本公开的音频传输的自适应方法的流程图；

图2表示本公开的实施例一的流程图；

图3表示本公开的实施例二的流程图；

图4表示本公开的音频传输的自适应装置的模块示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

随着流媒体传输功能的发展与普及，对流媒体传输过程中的时延要求越来越高，而当前情况下，无论是物理层基于何种网络拓扑结构，何种网络介质，都无法避免网络抖动和网络不稳定的问题，这样即使优化了设备处理效率，优化了网络拓扑结构，仍然可能出现高于标准要求的时延，从而导致设备之间配合异常。为了解决上述问题，如图1所示，本公开的实施例提供了一种音频传输的自适应方法，应用于流媒体服务器端，根据当前网络状态来调整音频流的编码策略，其方法主要包括：

步骤10：获取与流媒体客户端之间的当前网络的传输速率。

流媒体服务器通过向流媒体客户端发送一网络探测消息，其中，该网络探测消息中携带有流媒体服务器发送该网络探测消息的第一时间，当流媒体客户端收到该网络探测消息后对该消息进行响应，并将探测响应消息反馈至流媒体服务器，其中，该探测响应消息中携带有流媒体客户端接收到网络探测消息的第二时间，以及反馈探测响应消息的第三时间。由第二时间与第一时间的时间差可计算出该网络探测消息的下行传输时间，由于网络探测消息的字节数或比特数是确定的，根据网络探测消息的数据量与计算出的传输时间的比值，计算出当前网络的下行传输速率。其中，网络探测消息根据网络协议的类型而定，本实施例中以RTSP消息为例。由于RTSP消息携带的比特数很少，为了得到准确的传输速率，优选地可选用发送多个RTSP消息，取多次RTSP探测消息传输速率的平均数，作为权衡网络下行传输速率的依据。虽然RTSP消息携带的比特数很少，但频繁发送仍会对网络造成一定的负荷，故设定每隔预定时间对网络状况进行一次探测，并根据当时网络状况对音频流的编码策略进行调整。

步骤20：根据待传输的音频流在预定编码策略下的音频帧的比特数与传输速率，计算音频帧的传输时间。

在配置流媒体服务器时，会对流媒体服务器端的编码器进行初始配置，例如配置编码器的：编码码率，编码帧长等，这样流媒体服务器端有一预定编码策略。根据待传输的音频流在该预定编码策略下的编码比特数，与上述计算得到的传输速率的比值，计算该音频流的传输时间，即在当前网络情况下，传输该音频流所需要的传输时间。

步骤30：判断传输时间是否超出一预设的传输时延阈值。

预设的传输时延阈值的具体计算方法如下，标准要求时延为：建立传输通道的时间、流媒体服务器端的处理时间、流媒体客户端的处理时间以及传输音频流的时间，故传输时延阈值的上限即为标准要求时延减去建立传输通道的时间，再减去流媒体服务器端的处理时间和流媒体客户端的处理时间，例如：标准要求时延为40ms，流媒体服务器端和流媒体客户端之间建立传输通道的时间为20ms，流媒体服务器端和流媒体客户端的处理一帧音频信号的时间均为3ms，则传输一帧音频信号的时间的传输时延阈值为14ms。

步骤40：若未超出，按照预定编码策略对音频流进行编码，并发送至向流媒体客户端；若超出，则调整预定编码策略，降低音频流编码后的音频帧的比特数，并将编码后的音频流发送至流媒体客户端。

若步骤20中计算出的传输时间未超出传输时延阈值，说明当前网络状态良好，按照初始设置的预定编码策略对待传输的音频流进行编码即可实现音频流的可靠传输。

若步骤20中计算出的传输时间已超出传输时延阈值，说明当前网络状态较差或网络状态不稳定，则需要调整音频流的编码策略，以降低音频流编码后的音频帧的比特数，以使得每一音频帧能够可靠传输。

其中，调整预定编码策略，降低编码后的音频帧的比特数的具体包括以下步骤：

检测流媒体服务器端自身的编码特性是否支持第一编码策略；

若支持第一编码策略，则根据第一编码策略降低音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出传输时延阈值，若未超出，则将编码后的音频流发送至流媒体客户端；若超出，则检测自身编码特性是否支持第二编码策略；

若不支持第一编码策略，则检测自身编码特性是否支持第二编码策略；

若不支持第二编码策略，则丢弃音频流编码后的音频帧中的部分帧；

若支持第二编码策略，则根据第二编码策略降低音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出传输时延阈值，若未超过，则将编码后的音频流发送至流媒体客户端；若超出，则丢弃音频流编码后的音频帧中的部分帧。

第一编码策略为分帧策略和多码率策略中的一种，第二编码策略为另一种。其中，支持分帧策略的编码器包括现有的可变帧长编码器，例如典型代表AMR-WB+编码器，其特点在于编码器提供了多种帧长模式，包括：20ms帧长、40ms帧长和80ms帧长等，20ms帧长为将2ms的音频流封装为一帧，即一帧音频帧携带20ms的音频信号。支持多码率策略的编码器包括现有的编码码率可变编码器，例如典型代表：AMR-NB和AMR-WB等，其特点在于虽然每帧音频帧携带的音频信号时间长度不可变，但对于每帧音频帧的编码比特数可变，例如AMR-WB有多种编码码率，每帧音频帧的编码比特数为477、461、397和365等。无论是采用较短帧长的方式，还是采用较低编码码率的方式，都是为了降低每帧音频帧的比特数，以缩短每帧音频帧的传输时间，使得音频流在当前网络状态下可靠传输。

其中，由于发生网络抖动或网络不稳定的时间很短，故只对待传输音频流的当前帧进行调整编码策略，即仅音频流的第一帧按照第一编码策略或第二编码策略进行编码，音频流的第二帧则采用预定编码策略进行编码；其中，丢弃音频流编码后的音频帧中的部分帧，指的是丢弃音频流的第一帧，从第二帧开始进行编码传输。因为通常一音频帧的长度不超过100ms，改变一帧音频信号的编码策略或丢弃一帧音频信号并不会对音频质量在感知上造成任何影响，因此该自适应方法对于音频流质量的影响可忽略不计，而且使得在网络抖动或网络不稳定时保证了音频流的可靠传输。

其中，当第一编码策略为分帧策略，第二编码策略为多码率策略时，分帧策略包括多种帧长，多码率策略包括所支持的编码码率集合。该音频传输的自适应方法的具体实现方式可参照图2所示，

获取当前网络的传输速率，即通过流媒体服务端向流媒体客户端发送网络探测消息对当前网络的下行传输速率进行探测。

是否超过预设传输时延阈值，检测计算得到的当前网络的传输速率是否超过了预设传输时延阈值。

若未超过，按照预定编码策略对音频流进行编码，并发送至流媒体客户端。

若超过，则检测流媒体服务器端的编码器的编码特性是否支持分帧策略；

若支持，则将音频流按照最短帧长进行分流，并按照当前编码码率进行编码，然后再检测编码后的音频流的每帧音频帧的传输时间是否超过预设传输时延阈值；若未超过，则将编码后的音频流发送至流媒体客户端，若超过，则检测编码特性是否支持多码率策略；若不支持，则丢弃音频流编码后的音频帧中的部分帧，若支持，则采用低于当前编码码率的编码码率对分流后的音频流进行编码，然后再检测编码后的音频流的每帧音频帧的传输时间是否超过了预设传输时延阈值，若未超过，则将编码后的音频流发送至流媒体客户端；若经过两次编码策略调整后的音频帧的传输时间仍超过了传输时延阈值，则丢弃音频流编码后的音频帧中的部分帧。

若不支持分帧策略，则检测编码器的编码特性是否支持多码率策略；若不支持，则丢弃音频流编码后的音频帧中的部分帧，若支持，则采用低于当前编码码率的编码码率对分流后的音频流进行编码，然后再检测编码后的音频帧的传输时间是否超过预设传输时延阈值，若未超过，则将编码后的音频流发送至流媒体客户端；若经编码策略调整后的音频帧的传输时间仍超过了传输时延阈值，则丢弃音频流编码后的音频帧中的部分帧。

本实施例中，根据当前网络传输速率与预设传输时延阈值的关系，来调整音频流的编码策略，若在当前网络传输速率下，当前音频帧的传输时间未超出传输时延阈值，则按照预定编码策略对音频流进行编码，并将编码后的音频帧传输至流媒体客户端。若在当前网络传输速率下，当前音频帧的传输时间超出了传输时延阈值，则依次检测是否支持分帧策略和多码率策略，并按照相应编码策略对音频流进行编码，以使音频传输适应当前网络的传输速率，解决了因网络抖动或网络不稳定而造成的高于标准要求的时延，进而影响设备之间配合异常的问题。

实施例二

其中，当第一编码策略为多码率策略，第二编码策略为分帧策略时，多码率策略包括所支持的编码码率集合，分帧策略包括多种帧长。该音频传输的自适应方法的具体实现方式可参照图3所示，

若超过，则检测流媒体服务器端的编码器的编码特性是否支持多码率策略；

若支持，则将音频流采用低于当前编码码率的编码码率对音频流进行编码，优选地可采用最低编码码率对音频流进行编码，然后再检测编码后的音频流的每帧音频帧的传输时间是否超过预设传输时延阈值；若未超过，则将编码后的音频流发送至流媒体客户端，若超过，则检测编码特性是否支持分帧策略；若不支持，则丢弃音频流编码后的音频帧中的部分帧，若支持，则将音频流按照最短帧长进行分流，并按照当前编码码率进行编码，即按照最短帧长和最低编码码率对音频流进行编码，然后再检测编码后的音频流的每帧音频帧的传输时间是否超过了预设传输时延阈值，若未超过，则将编码后的音频流发送至流媒体客户端；若经过两次编码策略调整后的音频帧的传输时间仍超过了传输时延阈值，则丢弃音频流编码后的音频帧中的部分帧。

若不支持多码率策略，则检测编码器的编码特性是否支持分帧策略；若不支持，则丢弃音频流编码后的音频帧中的部分帧，若支持，则将音频流按照最短帧长进行分流，并按照当前编码码率进行编码，然后再检测编码后的音频帧的传输时间是否超过预设传输时延阈值，若未超过，则将编码后的音频流发送至流媒体客户端；若经编码策略调整后的音频帧的传输时间仍超过了传输时延阈值，则丢弃音频流编码后的音频帧中的部分帧。

本实施例中，根据当前网络传输速率与预设传输时延阈值的关系，来调整音频流的编码策略，若在当前网络传输速率下，当前音频帧的传输时间未超出传输时延阈值，则按照预定编码策略对音频流进行编码，并将编码后的音频帧传输至流媒体客户端。若在当前网络传输速率下，当前音频帧的传输时间超出了传输时延阈值，则依次检测是否支持多码率策略和分帧策略，并按照相应编码策略对音频流进行编码，以使音频传输适应当前网络的传输速率，解决了因网络抖动或网络不稳定而造成的高于标准要求的时延，进而影响设备之间配合异常的问题。

如图4所示，本公开的实施例中还提供了一种音频传输的自适应装置，应用于流媒体服务器端，包括：

判断模块，用于判断是否超出一预设的传输时延阈值；

其中，获取模块包括：

其中，第二调整模块包括：

第一检测单元，用于检测编码特性是否支持第一编码策略；

第二调整子单元，用于采用编码码率集合中低于当前编码码率的编码码率对第一音频流重新编码，并向流媒体客户端告知当前的编码码率。

第三调整子单元，用于采用编码码率集合中低于当前编码码率的编码码率对音频流重新编码，并向流媒体客户端告知当前的编码码率。

需要说明的是，该装置是与上述音频传输的自适应方法对应的装置，上述方法实施例中所有实现方式均适用于该装置的实施例中，也能达到相同的技术效果。

以上所述的是本公开的优选实施方式，应当指出对于本技术领域的普通人员来说，在不脱离本公开所述的原理前提下还可以作出若干改进和润饰，这些改进和润饰也在本公开的保护范围内。

Claims

一种音频传输的自适应方法，应用于流媒体服务器端，所述方法包括：

获取与流媒体客户端之间的当前网络的传输速率；

根据待传输的音频流在预定编码策略下的音频帧的比特数与所述传输速率，计算所述音频帧的传输时间；

判断所述传输时间是否超出一预设的传输时延阈值；

若未超出，按照所述预定编码策略对所述音频流进行编码，并发送至所述流媒体客户端；

若超出，则调整所述预定编码策略，降低所述音频流编码后的音频帧的比特数，并将编码后的音频流发送至所述流媒体客户端。
根据权利要求1所述的音频传输的自适应方法，其中，获取与流媒体客户端之间的当前网络的传输速率的步骤包括：

向所述流媒体客户端发送网络探测消息，其中，所述网络探测消息携带有发送所述网络探测消息的第一时间；

接收所述流媒体客户端响应所述网络探测消息后发送的探测响应消息，其中，所述探测响应消息携带有所述流媒体客户端接收到所述网络探测消息的第二时间；

根据所述第二时间与所述第一时间的时间差，以及所述网络探测消息的比特数，计算与所述流媒体客户端之间的传输速率。
根据权利要求1或2所述的音频传输的自适应方法，其中，调整所述预定编码策略，降低编码后的音频帧的比特数的步骤包括：

检测所述编码特性是否支持第一编码策略；

若支持，则根据所述第一编码策略降低所述音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出所述传输时延阈值；若未超出，则将编码后的音频流发送至所述流媒体客户端；若超出，则检测所述编码特性是否支持第二编码策略；

若不支持，则检测所述编码特性是否支持第二编码策略；若不支持所述第二编码策略，则丢弃所述音频流编码后的音频帧中的部分帧；若支持所述第二编码策略，则根据所述第二编码策略降低所述音频流编码后的音频帧的比特数，并判断降低比特数后的音频帧的传输时间是否超出所述传输时延阈值；若未超出，则将编码后的音频流发送至所述流媒体客户端；若超出，则丢弃所述音频流编码后的音频帧中的部分帧；

所述第一编码策略为分帧策略和多码率策略中的一种，所述第二编码策略为另一种。
根据权利要求3所述的音频传输的自适应方法，其中，所述第一编码策略为分帧策略，所述分帧策略包括多种帧长；根据所述第一编码策略降低所述音频流编码后的音频帧的比特数的步骤包括：

将所述音频流分为多个第一音频流，并按照当前编码码率对所述第一音频流进行编码，其中，第一音频流的长度为所述分帧策略中的最短帧长。
根据权利要求4所述的音频传输的自适应方法，其中，所述第二编码策略为多码率策略，所述多码率策略包括：所支持的编码码率集合；根据所述第二编码策略降低所述音频流编码后的音频帧的比特数的步骤包括：

采用所述编码码率集合中低于当前编码码率的编码码率对所述第一音频流重新编码。
根据权利要求3所述的音频传输的自适应方法，其中，所述第一编码策略为多码率策略，所述多码率策略包括：所支持的编码码率集合；根据所述第一编码策略降低所述音频流编码后的音频帧的比特数的步骤包括：

采用所述编码码率集合中低于当前编码码率的编码码率对所述音频流重新编码。
根据权利要求6所述的音频传输的自适应方法，其中，所述第二编码策略为分帧策略，所述分帧策略包括多种帧长，根据所述第二编码策略降低所述音频流编码后的音频帧的比特数的步骤包括：

将编码后的音频帧分为多个第一音频帧，所述第一音频帧的长度为所述分帧策略中的最短帧长。
一种音频传输的自适应装置，应用于流媒体服务器端，包括：

获取模块，用于获取与流媒体客户端之间的当前网络的传输速率；

计算模块，用于根据待传输的音频流在预定编码策略下的音频帧的比特数与所述传输速率，计算所述音频帧的传输时间；

判断模块，用于判断是否超出一预设的传输时延阈值；

第一调整模块，用于当所述传输时间未超出所述传输时延阈值时，按照所述预定编码策略对所述音频流进行编码，并发送至向所述流媒体客户端；

第二调整模块，用于当所述传输时间超出所述传输时延阈值时，调整所述预定编码策略，降低所述音频流编码后的音频帧的比特数，并将编码后的音频流发送至所述流媒体客户端。
根据权利要求8所述的音频传输的自适应装置，其中，所述获取模块包括：

发送单元，用于向所述流媒体客户端发送网络探测消息，其中，所述网络探测消息携带有发送所述网络探测消息的第一时间；

接收单元，用于接收所述流媒体客户端响应所述网络探测消息后发送的探测响应消息，其中，所述探测响应消息携带有所述流媒体客户端接收到所述网络探测消息的第二时间；

计算单元，用于根据所述第二时间与所述第一时间的时间差，以及所述网络探测消息的比特数，计算与所述流媒体客户端之间的传输速率。
根据权利要求8或9所述的音频传输的自适应装置，其中，所述第二调整模块包括：

第一检测单元，用于检测所述编码特性是否支持第一编码策略；

第一调整单元，用于当支持所述第一编码策略时，根据所述第一编码策略降低所述音频流编码后的音频帧的比特数；

第一判断单元，用于判断降低比特数后的音频帧的传输时间是否超出所述传输时延阈值；若未超出，则将编码后的音频流发送至所述流媒体客户端；若超出，则检测所述编码特性是否支持第二编码策略；

第二检测单元，用于当不支持所述第一编码策略时，检测所述编码特性是否支持第二编码策略；

第二调整单元，用于当不支持所述第二编码策略时，丢弃所述音频流编码后的音频帧中的部分帧；当支持所述第二编码策略时，根据所述第二编码策略降低所述音频流编码后的音频帧的比特数；

第二判断单元，用于判断降低比特数后的音频帧的传输时间是否超出所述传输时延阈值；若未超出，则将编码后的音频流发送至所述流媒体客户端；若超出，则丢弃所述音频流编码后的音频帧中的部分帧；

其中，所述第一编码策略为分帧策略和多码率策略中的一种，所述第二编码策略为另一种。
根据权利要求10所述的音频传输的自适应装置，其中，所述第一编码策略为分帧策略，所述分帧策略包括多种帧长；所述第一调整单元包括：

第一调整子单元，用于将所述音频流分为多个第一音频流，并按照当前编码码率对所述第一音频流进行编码，其中，第一音频流的长度为所述分帧策略中的最短帧长。
根据权利要求11所述的音频传输的自适应方法装置，其中，所述第二编码策略为多码率策略，所述多码率策略包括：所支持的编码码率集合；所述第二调整单元包括：

第二调整子单元，用于采用所述编码码率集合中低于当前编码码率的编码码率对所述第一音频流重新编码。
根据权利要求10所述的音频传输的自适应装置，其中，所述第一编码策略为多码率策略，所述多码率策略包括：所支持的编码码率集合；所述第一调整单元还包括：

第三调整子单元，用于采用所述编码码率集合中低于当前编码码率的编码码率对所述音频流重新编码。
根据权利要求13所述的音频传输的自适应装置，其中，所述第二编码策略为分帧策略，所述分帧策略包括多种帧长，所述第二调整单元还包括：

第四调整子单元，用于将编码后的音频帧分为多个第一音频帧，所述第一音频帧的长度为所述分帧策略中的最短帧长。