WO2017107750A1

WO2017107750A1 - 呼叫放音控制方法及装置

Info

Publication number: WO2017107750A1
Application number: PCT/CN2016/108113
Authority: WO
Inventors: 常诚; 吴亮
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-12-25
Filing date: 2016-11-30
Publication date: 2017-06-29
Also published as: CN106921609A

Abstract

一种呼叫放音控制方法和装置，该方法包括：媒体网关接收携带音包信息的呼叫放音请求；根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；以及根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

Description

呼叫放音控制方法及装置

技术领域

本公开涉及移动通信技术领域，例如涉及一种呼叫放音控制方法及装置。

背景技术

随着移动通信技术的发展，电话普及率的提高，用户对电信业务的要求越来越高，呼叫放音业务成为一项重要的电信业务。目前，在云计算平台中，媒体网关在呼叫放音时，对媒体流的交互的码型具备编解码器(Transcoder，TC)的编解码转换的功能，包括采用G.711单一解编码格式文件的管理呼叫放音的音元文件，并在虚拟机中直接采用在实时传输协议-编解码-音元(Real-time Transport Protocol，RTP-TC-TONE)的接续方式来进行呼叫放音。即在虚拟化的硬件平台上，可直接在虚拟机中进行音元文件的TC处理，而虚拟机处理语音编解码的能力相对比较差，一个虚拟机仅能处理有限的TC转换，因此放音业务中可能需要占用大量的虚拟机，同时编解码转换对虚拟机CPU和内存资源占用非常大。因此在通过在虚拟机中完成语音编解码处理后再进行呼叫放音具有局限性，这将导致放音的配置成本很高，会造成云平台的硬件资源的浪费，同时也对媒体流的传输业务的性能造成了较大的影响。

发明内容

本公开提供一种呼叫放音控制方法及装置，可解决当前呼叫放音流程中需要在虚拟机中进行语音编解码处理的问题。

本公开实施例提供的一种呼叫放音控制方法，所述呼叫放音控制方法包括以下步骤：

媒体网关接收携带音包信息的呼叫放音请求；

根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；以及

根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

可选地，所述根据呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息的步骤包括：

根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；以及

根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。

可选地，所述根据音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件的步骤包括：

根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址；以及

根据所述音元地址确定所述音元文件。

可选地，所述媒体网关接收携带音包信息的呼叫放音请求的步骤之前还包括：

加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。

可选地，所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件的步骤之后，还包括：

在所述媒体网关进行放音后，若检测到当前的会话描述请求SDP的参数发生改变时，则获取与所述会话描述请求SDP的参数发生改变时对应的音元文件。

在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。

此外，本公开实施例还提供一种呼叫放音控制装置，所述呼叫放音控制装置包括：

接收模块，设置为接收携带音包信息的呼叫放音请求；

第一获取模块，设置为根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；以及

选择模块，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

可选地，所述第一获取模块包括：

查询单元，用于根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；

获取单元，设置为根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。

可选地，所述选择模块包括：

第一确定单元，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址；以及

第二确定单元，设置为根据所述音元地址确定所述音元文件。

可选地，所述呼叫放音控制装置还包括：

加载模块，设置为在所述媒体网关接收携带音包信息的呼叫放音请求之前，加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。

可选地，所述呼叫放音控制装置还包括：

第二获取模块，设置为在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，以及

可选地，所述呼叫放音控制装置还包括：

第三获取模块，设置为在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，以及

此外，本公开实施例还提供一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述呼叫放音控制方法。

此外，本公开实施例还提供一种电子设备，该电子设备包括一个或多个处理器、存储器以及一个或多个程序，所述一个或多个程序存储在存储器中，当被一个或多个处理器执行时，执行上述呼叫放音控制方法。

本公开实施例通过媒体网关接收携带音包信息的呼叫放音请求，根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息，并根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。由于在云计算平台的媒体网关放音业务使用中，根据接收到的呼叫放音请求，该媒体网关直接出放音需要的码型数据流到RTP，不在虚拟机内进行码型的转换处理，使得媒体网关直接通过音元寻址获取到对应的音元文件，并播放该音元文件，节省了编解码转换资源，并加快了放音效率，减少虚拟机对CPU等硬件资源的占用，提升物理机运行的虚拟机数量，从而提高了物理硬件平台的资源利用率。

附图说明

图1为本公开呼叫放音控制方法的第一实施例的流程示意图；

图2为相关技术中呼叫放音方式的构架示意图；

图3为本公开实施例呼叫放音方式的构架示意图；

图4为本公开实施例的音元文件制作与装载示意图；

图5为本公开实施例的用户面音元寻址示意图；

图6为本公开呼叫放音控制方法的第二实施例中根据呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息的细化流程示意图；

图7为本公开呼叫放音控制方法的第三实施例中根据音元列表信息、编解码信息及音元编号信息选择对应的音元文件的流程示意图；

图8为本公开呼叫放音控制方法的第四实施例的流程示意图；

图9为本公开呼叫放音控制方法的第五实施例的流程示意图；

图10为本公开呼叫放音控制方法的第六实施例的流程示意图；

图11为本公开呼叫放音控制装置的第一实施例的功能模块示意图；

图12为本公开呼叫放音控制装置的第二实施例中第一获取模块的功能模块示意图；

图13为本公开呼叫放音控制装置的第三实施例中选择模块的功能模块示意图；

图14为本公开呼叫放音控制装置的第四实施例的功能模块示意图；

图15为本公开呼叫放音控制装置的第五实施例的功能模块示意图；

图16为本公开呼叫放音控制装置的第六实施例的功能模块示意图；以及

图17为本公开一种电子设备的硬件结构示意图。

具体实施方式

应当理解，此处所描述的可选实施例仅仅用以解释本公开，并不用于限定本公开。在不冲突的情况下，以下实施例和实施例中的特征可以相互组合。

参照图1，图1为本公开呼叫放音控制方法的第一实施例的流程示意图。

在本实施例中，所述呼叫放音控制方法包括S10-S30。

在S10中，媒体网关接收携带音包信息的呼叫放音请求；

在本实施例中，媒体网关接收到服务器发送的携带音包信息的呼叫放音请求，以请求该媒体网关向放音收听端放音。该音包信息包含放音业务参数，如统一资源定位符(Uniform Resource Locator，URL)地址。

在S20中，根据所述呼叫放音请求，媒体网关获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；

在接收到该呼叫放音请求后，基于H.248协议，根据该呼叫放音请求，该媒体网关获取已制作并已加载完成的、与该音包信息关联的音元列表信息、编解码信息及音元编号信息，并获取用户面语音资源。

在S30中，根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

在获取到该音元列表信息、编解码信息及音元编号信息后，基于该媒体网关中的H.248协议，进行TC资源分析和接续处理，使得该媒体网关中的用户面语音模块的电路接通。在该用户面语音模块的电路接通后，该用户面语音模块根据该音元列表信息、编解码信息及音元编号信息选择对应的音元文件进行播放。

基于该媒体网关中的H.248协议，对G.711码型放音环节的改造包括：放音流程改造；多种停放音流程改造；收号流程改造；多种停收号流程改造；上下文资源分析流程和接续拆续分析和处理流程改造，以支持以下场景的接续和TC资源分析：

场景1：G.711码型的放音流程为：RTP的码型为G.711，TONE采用G.711码型的音元，与网关内部A/U律一致；

场景2：G.711放音+TC方式收号流程改造为：RTP的码型为G.711，TONE采用G.711码型的音元，与网关内部AU律一致；

场景3：压缩码型放音流程改造为：RTP的码型为压缩码型，TONE采用G.711码型的音元，与网关内部A/U律一致；

场景4：压缩码型放音+TC方式收号流程改造为：RTP的码型为压缩码型，TONE采用G.711码型的音元，与网关内部A/U律一致。

基于该媒体网关中的H.248协议，对其他压缩码型放音环节的改造包括：放音流程改造；多种停放音流程改造；收号流程改造；多种停收号流程改造；上下文资源分析流程和接续拆续分析和处理流程改造，以支持以下场景的接续和TC资源分析：

场景1：压缩码型放音流程为：RTP的码型与TONE的码型一致的场景；

场景2：放音+TC方式收号流程为：RTP的码型任意，TONE采用G.711码型的音元，与网关内部A/U律一致；其中，如果RTP的码型不是G.711，不收号。

需要说明的是，当没有加载压缩码型的音库时，如果需要放音，可以统一采用默认的G.711码型的音元进行放音。

图2为相关技术中呼叫放音方式的构架示意图，相关技术中的呼叫放音方式是在放音时，将需要放音的音数据编解码成放音终端识别的码型，从而达到呼叫放音的目的。

图3为本公开实施例的呼叫放音方式的构架示意图，本公开实施例的呼叫放音方式是在放音时，不需要编解码，可通过音元寻址的方式查询到需要播放的音元文件，从而达到呼叫放音的目的。

图4为音元文件制作与装载示意图，输入标准的.wav格式的音元文件后，将该音元文件转换成媒体网关支持的编解码信息(如压缩码型净荷文件)，并将该编解码信息加载且存储到该媒体网关中，以提供呼叫放音的音元文件。

图5为用户面音元寻址示意图，不同类型的音元文件对应不同类型的编解码信息，因此用户面放音可以根据不同类型的编解码信息包含的编解码参数和音元身份标识(Identification，ID)来索引音元地址，为此，可以建立两级索引，为每种编解码型(如：自适应多速率编解码(Adaptive Multi-Rate Codec，AMR)的速率)建立一个音元索引数组，根据码型信息索引该种码型的音元地址。

本实施例通过媒体网关接收携带音包信息的呼叫放音请求，根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息，并根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

由于在云计算平台的媒体网关放音业务使用中，根据接收到的呼叫放音请求，该媒体网关直接输出放音需要的码型数据流到RTP处理模块，不在虚拟机内进行码型的转换处理，使得媒体网关可直接通过音元寻址获取到对应的音元文件，并播放该音元文件，可节省编解码转换资源，该方法可加快放音效率，减少虚拟机对CPU等硬件资源的占用，提升物理机运行的虚拟机数量，从而可提高物理硬件平台的资源利用率。

可选地，基于所述第一实施例，本公开实还包括呼叫放音控制方法的第二实施例，在本实施例中，参照图6，上述S20可以包括S21-S22。

在S21中，根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；

在本实施例中，根据该呼叫放音请求，查询并获取与该呼叫放音请求携带的音包信息关联的放音标识信息、语言类型及所述编解码信息。

其中，该放音标识信息可包括呼叫放音配置参数，该解编码信息可包括编解码参数和音元ID等。

在S22中，根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。

在获取到与该呼叫放音请求携带的音包信息关联的放音标识信息和语言类型后，基于该媒体网关中的H.248协议，查询该与该放音标识信息、语言类型对应的音元列表信息，并申请用户面语音资源，该音元列表信息存储的是多个编解码音元索引地址。

本实施例通过根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息，并根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。由于该音元列表信息是一个检索表格，记录了每个音元文件的音元地址，而该音元编号信息是记录该音元列表信息每个音元地址的存储顺序，因此可使得媒体网关能够快速的获取到呼叫放音的音元地址，从而可加快放音效率。

可选地，基于所述第一实施例，在本公开呼叫放音控制方法的第三实施例中，参照图7，上述S30包括S31-S32。

在S31中，根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址；

在本实施例中，在获取到音元列表信息、音元编号信息后，结合与该呼叫放音请求关联的编解码信息，确定该呼叫放音与获取的音元文件的音元地址。

在S32中，根据所述音元地址确定所述音元文件。

不同类型的音元文件对应不同类型的编解码信息，因此用户面放音需要根据不同类型的编解码信息包含的编解码参数和音元ID来索引音元地址。为此，可以建立两级索引，需要为每种编解码(如：AMR速率)建立一个对应的音元索引数组，根据码型信息索引该种码型的音元地址，该索引表需要占用用户面一定的内存空间。

用户面放音时音元文件寻址处理，即在获取到该音元地址后，根据该音元地址确定该音元文件，以供该媒体网关向放音收听端播放该音元文件。

本实施例通过根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址，根据所述音元地址确定所述音元文件，使得媒体网关直接通过音元寻址获取到对应的音元文件，并播放该音元文件，而可以无需在呼叫放音时进行码型转换处理，可节省编解码转换资源，该方法可加快放音效率，减少虚拟机对CPU等硬件资源的占用，提升物理机运行的虚拟机数量，从而可提高物理硬件平台的资源利用率。

可选地，基于所述第一实施例，在本公开呼叫放音控制方法的第四实施例中，参照图8，上述S10之前，所述呼叫放音控制方法还可以包括S40。

在S40中，加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。

在本实施例中，在输入标准的.wav格式的音元文件后，如G.711编解码(A/U律)类型的音元文件，通过转换为二进制文件格式，根据不同的编解码输出不同压缩码型的语音净荷信息文件；该转换按照一定规则，对生成的不同编解码(如G.729//EVRC/GSM_FR/…等)的音元文件进行组织。

将编解码的音库文件加载到该媒体网关主音管理任务中/进程中。根据用户的选择需要加载的音元(可以指定是否过滤已加载音元)；从网管-＞语音任务(主)发起请求，语音任务(主)进入加载状态；语音任务(主)通过文件传输协议(File Transfer Protocol，FTP)连接到网管服务端，获取需要加载的文件大小，并获取需要加载的文件到本地的语音进程(主)；语音任务(主)更新本地的音元配置信息，并做持久化的保存；语音任务(主)对批量保存的音元文件上报下载的进度；当所有的待加载的编解码音元处理完成后，上报处理完成的响应。

需要说明的是，语音进程(主)与用户面语音进程/语音进程(备)校验与同步，可包含以下的处理步骤：

用户面语音进程/语音进程(备)上电处理：用户面语音进程/语音进程(备)在上电时，读取语音配置信息和音元编号信息并加载；用户面语音任务/语音任务(备)定期比较加载的配置信息和音元编号信息(包括是否存在，且大小、时间、CRC信息等一致比较)，并删除不一致的信息；向语音任务(主)发起音校验请求并收到响应；用户面语音进程/语音进程(备)音元发起校验：语音进程(主)定期向语音任务(主)发送通信状态正常的模块信息；语音任务(主)开音元校验使用的数据区；语音任务(主)进行本地保存收到用户面语音进程/语音进程(备)上电后发起音校验请求；语音任务(主)在空闲态的情况下发起语音校验；当某个模块的语音校验完成后判断是否还有待校验的模块，如果存在则语音任务(主)主动或定时发起语音轮循校验。

用户面语音进程/语音进程(备)音元校验过程：语音任务(主)发起语音校验；进入音元同步态；用户面语音任务/语音任务(备)收到语音校验后保存语音任务(主)信息并获取音元配置信息与本地音元配置信息进行比较；发现不一致的信息后通过FTP从语音进程(主)重新获取语音元文件，修改本地的语音配置信息并持久化保存；批量处理完不一致的数据后上报进度给语音任务(主)；当所有音元检查请求完成后，语音任务(主)进入空闲态。

同时，用户面增加对音内存管理组织方式，即对生成的不同编解码(如G.729//EVRC/GSM_FR/…等)的音元文件进行组织。首先使用两个队列(节点方式均动态申请和释放)，例如，音元文件队列及空闲块队列。其中，音元文件队列，设置为管理插入的音元文件；空闲块队列，设置为管理空闲内存块。

在分配内存时，可找到一个比所要求尺寸条件的空闲内存块稍大的目标内存块，将该目标内存块分裂为第一子目标内存块和第二子目标内存块，第一子目标内存块的大小为所要求的尺寸大小，第二子目标内存块的大小为该目标内存块的大小去除第一子目标内存块的大小后的剩余大小。产生新的文件队列节点，指向第一子目标内存块的的内存，并将该文件节点链入文件队列。将空闲结点指向第二子目标内存块的内存。此外，本领域技术人员应该理解，当可以找到一个完全符合所要求尺寸条件的空闲内存块时，则该空闲节点就不需要了，可以将该空闲节点释放掉。

在用户面内存释放时，可以找到需要释放的内存对应的文件节点，并检查文件节点指向的内存，如果该文件节点指向的内存的相邻两侧内存均为空闲内存，则将相邻两侧的空闲内存和该文件节点指向的内存进行合并。并用一个新的空闲节点指向该合并的内存，即新的空闲节点链入空闲节点队列，则分别指向该相邻两侧的空闲节点被释放，同时，释放文件节点。如果仅该文件节点指向的内存一侧为空闲内存，则将本内存和该一侧的空闲内存进行合并；如果该文件节点指向的内存的相邻两侧内存均不空闲，则产生一个新的空闲节点管理该文件节点指向的内存。

在用户面内存紧缩时，即当共享内存中的空闲碎片过多，虽然总的空闲容量能满足一个音元的记录，但是没有一个单一的碎片能容纳音元的记录，则需要内存紧缩。内存紧缩实际就是内存移位，即将有文件的内存向前拷贝，空闲内存合并到一起。

本实施例通过加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息，使得媒体网关直接通过音元寻址获取到对应的音元文件，并播放该音元文件，而不需要在呼叫放音时进行码型转换处理，节省了编解码转换资源，该方法加快了放音效率，减少虚拟机对CPU等硬件资源的占用，提升物理机运行的虚拟机数量，从而提高了物理硬件平台的资源利用率。

可选地，基于上述第一至第三任一实施例，在本公开呼叫放音控制方法的第五实施例中，参照图9，上述S30之后，所述呼叫放音控制方法还包括S50。

在S50中，在所述媒体网关进行放音后，若检测到会话描述协议(Session Description Protocol，SDP)的参数发生改变时，则获取与所述SDP的参数发生改变时对应的音元文件，其中，SDP是一种会话描述格式，可以为会话通知、会话邀请和其他形式的多媒体会话初始化等目的提供多媒体会话描述。

在本实施例中，在放音过程中，当放音终端发生SDP切换(如：SDP中的放音编解码等参数修改)，可及时对应修改放音参数，达到放音终端的音元文件可以继续播放。

若SDP参数切换前后都需要编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP需要TC，并且当前也正在使用TC，则使用原有TC和音元资源继续播放，不修改放音元文件。

若SDP参数切换前后都不需要编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP不需要TC，并且当前也未使用TC，则当前的流程保持不变。

若SDP参数切换前无编解码，切换后有编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP需要TC，并且当前不在使用TC，则可以首先申请TC资源，拆除RTP和TONE之间的接续(此时用户面的放音通道保持不释放)，接续RTP和TC，接续TC和TONE；再通知用户面控制进程；然后用户面控制进程可以通知TONE放音通道；最后放音通道切换到新的码型(G.711与网元内部A/U律一致)的音元文件，且可计算得到切换码型之前播放的时间，从切换码型开始使用新的码型播放。

若SDP参数切换前有编解码，切换后无编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP不需要TC，并且当前在使用TC，则可以拆除RTP和TC之间的接续，拆除TC和TONE之间的接续(用户面的放音通道保持不释放)，释放TC资源，接续RTP和TONE；再通知用户面控制进程；然后用户面控制进程可以通知TONE放音通道；最后放音通道切换到新的码型的音元文件，且可通过计算得到切换码型之前播放的时间，从切换码型开始使用新的码型播放。

本实施例通过在所述媒体网关进行放音后，若检测到当前的SDP的参数发生改变时，则获取与所述SDP的参数发生改变时对应的音元文件，使得本公开实施例在呼叫放音终端发生SDP切换时，可以及时对应修改呼叫放音的编解码信息，从而达到呼叫放音终端的音元文件可以继续播放。

可选地，基于所述第一至第三任一实施例，在本公开呼叫放音控制方法的第六实施例中，参照图10，在上述S30之后，所述呼叫放音控制方法还包括S60。

在S60中，在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。

在本公开实施例的放音过程中，若收听端发生了主动AMR速率调整，多媒体网管可自动识别收听端AMR速率调整，并且可以立即切换到新的AMR速率上继续播放。

在媒体网关加载了AMR调整前后不同速率集的音库的情况下，语音资源模块可识别收听端RTP发送的速率调整报文，并进行分析处理。当识别到发生AMR速率调整时，用户面语音放音通道自行切换到新的AMR速率上，且可重新计算得到切换码型之前播放的时间，从切换码型开始使用新的码型播放。并通知用户面的控制进程AMR速率发生变化，用户面的控制进程对放音统计信息进行修改。若调整后的AMR速率对应的音元未加载，则语音放音通道自动播放G.711码型的音元进行播放。

本实施例通过在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。当放音收听端所在的无线信号弱，宽带小的情况下，可以在进行AMR编解码放音时请求降低播放的速率，从而保证放音的质量。

参照图11，图11为本公开呼叫放音控制装置的第一实施例的功能模块示意图。

在本实施例中，所述呼叫放音控制装置包括：接收模块10、第一获取模块20和选择模块30。

所述接收模块10，设置为接收携带音包信息的呼叫放音请求；

在本实施例中，媒体网关中的接收模块10接收到服务器发送的携带音包信息的呼叫放音请求，请求该媒体网关向放音收听端放音。该音包信息可以包含放音业务参数，如URL地址。

所述第一获取模块20，设置为根据所述呼叫放音请求，获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；

在接收到该呼叫放音请求后，基于H.248协议，根据该呼叫放音请求，媒体网关中的第一获取模块20获取已制作并已加载完成的、与该音包信息关联的音元列表信息、编解码信息及音元编号信息，并获取用户面语音资源。

所述选择模块30，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息，选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

在获取到该音元列表信息、编解码信息及音元编号信息后，基于该媒体网关中的H.248协议进行TC资源分析和接续处理，使得该媒体网关中的用户面语音模块的电路接通。在该用户面语音模块的电路接通后，该用户面语音模块根据该音元列表信息、编解码信息及音元编号信息选择对应的音元文件进行播放。

基于该媒体网关中的H.248协议，对G.711码型放音环节的改造可以包括：放音流程改造；多种停放音流程改造；收号流程改造；多种停收号流程改造；上下文资源分析流程和接续拆续分析和处理流程改造，以支持以下场景的接续和TC资源分析：

场景2：G.711放音+TC方式收号流程改造为：RTP的码型为G.711，TONE采用G.711码型的音元，与网关内部A/U律一致；

场景4：压缩码型放音+TC方式收号流程改造为：RTP的码型为压缩，TONE 采用G.711码型的音元，与网关内部A/U律一致。

基于该媒体网关中的H.248协议，对其他压缩码型放音环节的改造可以包括：放音流程改造；多种停放音流程改造；收号流程改造；多种停收号流程改造；上下文资源分析流程和接续拆续分析和处理流程改造，以支持以下场景的接续和TC资源分析：

本实施例通过接收模块10接收携带音包信息的呼叫放音请求，第一获取模块20根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息，选择模块30根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件。

由于在云计算平台的媒体网关放音业务使用中，根据接收到的呼叫放音请求，该媒体网关可以直接输出放音需要的码型数据流到RTP处理模块，不在虚拟机内进行码型的转换处理，使得媒体网关可以直接通过音元寻址获取到对应的音元文件，并播放该音元文件，可节省编解码转换资源，该方法可加快放音效率，减少虚拟机对CPU等硬件资源的占用，提升物理机运行的虚拟机数量，从而可提高物理硬件平台的资源利用率。

可选地，本公开呼叫放音控制装置的第二实施例中，参照图12，所述第一获取模块20可包括查询单元21和获取单元22。

所述查询单元21，设置为根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；

在本实施例中，根据该呼叫放音请求，查询并获取与该呼叫放音请求携带的音包信息关联的放音标识信息、语言类型及所述编解码信息，该放音标识信息可以包括呼叫放音配置参数，该解编码信息可以包括编解码参数和音元ID等。

所述获取单元22，设置为根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。

在获取到该与该呼叫放音请求携带的音包信息关联的放音标识信息和语言类型后，基于该媒体网关中的H.248协议，查询该与该放音标识信息、语言类型对应的音元列表信息，并申请用户面语音资源，该音元列表信息存储的是多个编解码音元索引地址。

本实施例通过根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息，并根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。由于该音元列表信息是一个检索表格，记录了每个音元文件的音元地址，而该音元编号信息是记录该音元列表信息每个音元地址的存储顺序，因此可以使得媒体网关能够快速的获取到呼叫放音的音元地址，从而可加快放音效率。

可选地，在本公开呼叫放音控制装置的第三实施例，参照图13，所述选择模块30可包括第一确定单元31和第二确定单元32。

所述第一确定单元31，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址；

所述第二确定单元32，设置为根据所述音元地址确定所述音元文件。

不同类型的音元文件对应不同类型的编解码信息，因此用户面放音需要根据不同类型的编解码信息包含的编解码参数和音元ID来索引音元地址，为此，可以建立两级索引，需要为每种编解码(如：AMR速率等)建立一个对应的音元索引数组，根据码型信息索引该种码型的音元地址，该索引表需要占用用户面一定的内存空间。

可选地，在本公开呼叫放音控制装置的第四实施例，参照图14，所述呼叫放音控制装置还可以包括：加载模块40。

所述加载模块40，设置为加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。

将编解码的音库文件加载到该媒体网关主音管理任务中/进程中。根据用户的选择需要加载的音元(可以指定是否过滤已加载音元)；从网管-＞语音任务(主)发起请求，语音任务(主)进入加载状态；语音任务(主)通过FTP连接到网管服务端，获取需要加载的文件大小，并获取需要加载的文件到本地的语音进程(主)；语音任务(主)更新本地的音元配置信息，并做持久化的保存；语音任务(主)对批量保存的音元文件上报下载的进度；当所有的待加载的编解码音元处理完成后，上报处理完成的响应。

需要说明的是，语音进程(主)与用户面语音进程/语音进程(备)校验与同步，包含以下的处理步骤：

同时，用户面增加对音内存管理组织方式，即对生成的不同编解码(如G.729//EVRC/GSM_FR/…等)的音元文件进行组织。首先使用两个队列(节点方式均动态申请和释放)，例如，音元文件队列及空闲块队列。其中，音元文件队列，用于管理插入的音元文件；空闲块队列，用于管理空闲内存块。

在分配内存时，可以找到一个比所要求尺寸条件的空闲内存块稍大的目标内存块，将该目标内存块分裂为第一子目标内存块和第二子目标内存块，第一子目标内存块的大小为所要求的尺寸大小，第二子目标内存块的大小为该目标内存块的大小去除第一子目标内存块的大小后的剩余大小。产生新的文件队列节点，指向第一子目标内存块的的内存，并将该文件节点链入文件队列。将空闲结点指向第二子目标内存块的内存。此外，本领域技术人员应该理解，当可以找到一个完全符合所要求容量条件的空闲内存块，则该空闲节点就不需要了，可以将该空闲节点释放掉。

在用户面内存释放时，找到需要释放的内存对应的文件节点，并检查文件节点指向的内存，如果该文件节点指向的内存的相邻两侧内存均为空闲内存，则将相邻两侧的空闲内存和该文件节点指向的内存进行合并。并用一个新的空闲节点指向该合并的内存，即新的空闲节点链入空闲节点队列，则分别指向该相邻两侧的空闲节点释放，同时，释放文件节点。如果仅该文件节点指向的内存一侧为空闲内存，则将本内存和该一侧的空闲内存进行合并；如果该文件节点指向的内存的相邻两侧的内存均不空闲，则产生一个新的空闲节点管理该文件节点指向的内存。

可选地，基于上述第一至第三任一实施例，在本公开呼叫放音控制装置的第五实施例中，参照图15，所述呼叫放音控制装置还包括：第二获取模块50。

所述第二获取模块50，设置为在所述媒体网关进行放音后，若检测到当前的会话描述协议SDP的参数发生改变时，则获取与所述SDP的参数发生改变时对应的音元文件。

若SDP参数切换前无编解码，切换后有编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP需要TC，并且当前不在使用TC，则可以首先申请TC资源，拆除RTP和TONE之间的接续(此时用户面的放音通道保持不释放)，接续RTP和TC，接续TC和TONE；再通知用户面控制进程；然后用户面控制进程可以通知TONE放音通道；最后放音通道切换到新的码型(G.711与网元内部A/U律一致)的音元文件，且可以计算得到切换码型之前播放的时间，从切换码型开始使用新的码型播放。

若SDP参数切换前有编解码，切换后无编解码。在SDP切换流程中，如果放音流程判断当前正在放音或正在放音和收号，则采用新SDP编解码参数对是否需要TC进行重新分析。如果分析结果为新的SDP不需要TC，并且当前在使用TC，则可以拆除RTP和TC之间的接续，拆除TC和TONE之间的接续(用户面的放音通道保持不释放)，释放TC资源，接续RTP和TONE；再通知用户面控制进程；然后用户面控制进程可以通知TONE放音通道；最后放音通道切换到新的码型的音元文件，且可以通过计算得到切换码型之前播放的时间，从切换码型开始使用新的码型播放。

可选地，基于上述第一至第三任一实施例，在呼叫放音控制装置的第六实施例中，参照图16，所述呼叫放音控制装置还包括：

所述第三获取模块60，设置为在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。

在本公开实施例的放音过程中，若收听端发生了主动AMR速率调整，本公开可以自动识别收听端AMR速率调整，并且可切换到新的AMR速率上继续播放。

在媒体网关加载了AMR调整前后不同速率集的音库的情况下，语音资源模块识别对端RTP处理模块发送过来的速率调整报文，并进行分析处理。当识别到发生AMR速率调整时，用户面语音放音通道自行切换到新的AMR速率上，且可以重新计算下切换码型之前播放的时间，从切换码型开始使用新的码型播放。并通知用户面的控制进程AMR速率发生变化，用户面的控制进程对放音统计信息进行修改。若调整后的AMR速率对应的音元未加载，则语音放音通道可以自动播放G.711码型的音元进行播放。

本实施例通过在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。当放音收听端所在的无线信号弱，宽带小的情况下，在进行AMR编解码放音时请求降低播放的速率，从而保证放音的质量。

基于上述实施例，本公开实施例七还提供了一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述呼叫放音控制方法。

基于上述实施例，本公开实施例八还提供了一种电子设备。参照图17所示，该电子设备可以包括：

处理器(processor)710和存储器(memory)720；还可以包括通信接口(Communications Interface)730和总线740。

其中，处理器710、存储器720和通信接口730可以通过总线740完成相互间的通信。通信接口730可以用于信息传输。处理器710可以调用存储器720中的逻辑指令，以执行上述实施例的呼叫放音控制方法。

此外，上述的存储器720中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质，包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质，也可以是暂态存储介质。

最后需要说明的是，本领域普通技术人员可理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来执行相关的硬件来完成的，该程序可存储于一个非暂态计算机可读存储介质中，该程序在执行时，可包括如上述方法的实施例的流程，其中，该计算机可读存储介质可以为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

以上仅为本公开的可选实施例，并非因此限制本公开的专利范围，凡是利用本公开说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本公开的专利保护范围内。

工业实用性

本公开实施例通过公开的呼叫放音控制方法实现在云计算平台的媒体网关放音业务使用中，该媒体网关可以出放音需要的码型数据流到RTP处理模块，可以不在虚拟机内进行码型的转换处理，可节省编解码转换资源，并加快放音效率，减少虚拟机对CPU等硬件资源的占用，从而提高了物理硬件平台的资源利用率。

Claims

一种呼叫放音控制方法，包括：

媒体网关接收携带音包信息的呼叫放音请求；

根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；以及

根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫编解码器TC资源分析和接续处理后向放音收听端播放所述音元文件。
如权利要求1所述的呼叫放音控制方法，其中，所述根据呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息包括：

根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；以及

根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。
如权利要求1所述的呼叫放音控制方法，其中，所述根据音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件包括：

根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址：以及

根据所述音元地址确定所述音元文件。
如权利要求1所述的呼叫放音控制方法，在所述媒体网关接收携带音包信息的呼叫放音请求之前，还包括：

加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。
如权利要求1-3任一项所述的呼叫放音控制方法，在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，还包括：

在所述媒体网关进行放音后，若检测到当前的会话描述协议SDP的参数发生改变时，则获取与所述SDP的参数发生改变时对应的音元文件。
如权利要求1-3任一项所述的呼叫放音控制方法，在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，还包括：

在所述媒体网关进行放音后，若检测所述放音收听端的自适应多速率编解码AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。
一种呼叫放音控制装置，包括：

接收模块，设置为接收携带音包信息的呼叫放音请求；

第一获取模块，设置为根据所述呼叫放音请求获取与所述音包信息关联的音元列表信息、编解码信息及音元编号信息；以及

选择模块，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息选择对应的音元文件，以供所述媒体网关在进行呼叫编解码器TC资源分析和接续处理后向放音收听端播放所述音元文件。
如权利要求7所述的呼叫放音控制装置，其中，所述第一获取模块包括：

查询单元，设置为根据所述呼叫放音请求，查询与所述音包信息关联的放音标识信息、语言类型及编解码信息；以及

获取单元，设置为根据所述放音标识信息及所述语言类型获取所述音元列表信息及所述音元编号信息。
如权利要求7所述的呼叫放音控制装置，其中，所述选择模块包括：

第一确定单元，设置为根据所述音元列表信息、所述编解码信息及所述音元编号信息确定音元地址；以及

第二确定单元，设置为根据所述音元地址确定所述音元文件。
如权利要求7所述的呼叫放音控制装置，还包括：

加载模块，设置为在所述媒体网关接收携带音包信息的呼叫放音请求之前，加载已进行编解码处理的所述音元文件对应的所述音元列表信息、所述编解码信息及所述音元编号信息。
如权利要求7-9任一项所述的呼叫放音控制装置，还包括：

第二获取模块，设置为在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，以及

在所述媒体网关进行放音后，若检测到当前的会话描述协议SDP的参数发生改变时，则获取与所述SDP的参数发生改变时对应的音元文件。
如权利要求7-9任一项所述的呼叫放音控制装置，还包括：

第三获取模块，设置为在所述根据音元列表信息、所述编解码信息选择及所述音元编号信息对应的音元文件，以供所述媒体网关在进行呼叫TC资源分析和接续处理后向放音收听端播放所述音元文件之后，以及

在所述媒体网关进行放音后，若检测所述放音收听端的所述AMR速率发生改变时，则获取到与所述AMR速率发生改变时对应的音元文件。
一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1-6任一项的呼叫放音控制方法。