WO2021103741A1

WO2021103741A1 - 内容处理方法、装置、计算机设备及存储介质

Info

Publication number: WO2021103741A1
Application number: PCT/CN2020/114352
Authority: WO
Inventors: 欧阳才晟; 陈祺; 郑杨
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2019-11-29
Filing date: 2020-09-10
Publication date: 2021-06-03
Also published as: CN110971685B; US20220059073A1; CN110971685A; US12073820B2

Abstract

一种内容处理方法，包括：获取第一内容块；所述第一内容块为结构化数据；通过基于应用层协议建立的双向通信单链路，按照获取所述第一内容块的第一顺序，对所述第一内容块进行流式发送；通过所述双向通信单链路，接收流式返回的第二内容块；所述第二内容块，是通过对所述第一内容块进行内容类型转化得到；发送所述第一内容块和接收所述第二内容块是在所述双向通信单链路中异步进行的；按照接收所述第二内容块的第二顺序，依次输出所述第二内容块。

Description

内容处理方法、装置、计算机设备及存储介质

本申请要求于2019年11月29日提交中国专利局、申请号为201911200739.6、申请名称为“内容处理方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域和人工智能技术领域，特别是涉及一种内容处理方法、装置、计算机设备及存储介质。

背景技术

随着科学技术的飞速发展，线上处理内容已经是当前比较主流的方式。很多应用场景下都会涉及到内容的线上处理，比如，语音识别应用场景，都是通过线上方式对语音内容进行识别。

通过线上方式进行内容处理时，通常会涉及到内容的线上传输，传统方法中，是基于底层协议建立通信链路，这样在传输数据时只能传输二进制数据，二进制数据无法直接被识别，所以需要经过比较复杂的转换处理，这样就需要耗费一定的系统资源。

发明内容

根据本申请提供的各种实施例，提供一种内容处理方法、装置、计算机设备及存储介质。

根据本申请的一个方面，提供了一种内容处理方法，由计算机设备执行，包括：

获取第一内容块；该第一内容块为结构化数据；

通过基于应用层协议建立的双向通信单链路，按照获取该第一内容块的第一顺序，对该第一内容块进行流式发送；

通过该双向通信单链路，接收流式返回的第二内容块；该第二内容块，是通过对该第一内容块进行内容类型转化得到；发送该第一内容块和接收该第二内容块是在该双向通信单链路中异步进行的；及

按照接收该第二内容块的第二顺序，依次输出该第二内容块。

根据本申请的一个方面，提供了一种内容处理装置，设置于计算机设备中，包括：

获取模块，用于获取第一内容块；该第一内容块为结构化数据；

流式传输模块，用于通过基于应用层协议建立的双向通信单链路，按照获取该第一内容块的第一顺序，对该第一内容块进行流式发送；通过该双向通信单链路，接收流式返回的第二内容块；该第二内容块，是通过对该第一内容块进行内容类型转化得到；发送该第一内容块和接收该第二内容块是在该双向通信单链路中异步进行的；及

输出模块，用于按照接收该第二内容块的第二顺序，依次输出该第二内容块。

一种计算机设备，包括存储器和一个或多个处理器，存储器中存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行本申请各实施例的内容处理方法中的步骤。

一个或多个计算机可读存储介质，计算机可读存储介质上存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行本申请各实施例的内容处理方法中的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。基于本申请的说明书、附图以及权利要求书，本申请的其它特征、目的和优点将变得更加明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中内容处理方法的应用场景图；

图2为另一个实施例中内容处理方法的应用场景图；

图3为一个实施例中内容处理方法的流程示意图；

图4至图7为一个实施例中语音识别的界面示意图；

图8为一个实施例中内容处理的流程简示图；

图9为一个实施例中流式传输示意图；

图10为一个实施例中内容处理的架构框图；

图11为一个实施例中的中控转发的示意图；

图12为一个实施例中内容处理装置的框图；

图13为另一个实施例中内容处理装置的框图；及

图14为一个实施例中计算机设备的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中内容处理方法的应用场景图。参照图1，该应用场景中包括网络连接的终端110和服务器120。终端110可以是智能电视机、智能音箱、台式计算机或移动终端，移动终端可以包括手机、平板电脑、笔记本电脑、个人数字助理和穿戴式设备等中的至少一种。服务器120可以用独立的服务器或者是多个物理服务器组成的服务器集群来实现。

用户可以通过终端110输入初始内容。终端110可以对输入的初始内容进行结构化处理，生成属于结构化数据的第一内容块。终端110和服务器120之间基于应用层协议建立了双向通信单链路。终端110可以通过双向通信单链路，按照获取第一内容块的第一顺序，将第一内容块流式发送至服务器120。服务器120可以对第一内容块进行内容类型转化，得到第二内容块。服务器120可以将第二内容块流式返回至终端110。其中，终端110向服务器120发送第一内容块，以及服务器120向终端110返回第二内容块的处理，都是在双向通信单链路中进行的，且是相互不干扰、异步进行的。终端110可以按照接收第二内容块的第二顺序，依次输出第二内容块。比如，终端110可以对第二内容块进行展示或者播放等形式的输出。

在一个实施例中，如图2所示，服务器120包括代理服务器120a、适配服务器120b以及解码服务器120c。终端110可以与代理服务器120a之间基于应用层协议建立双向通信单链路。终端110可以按照获取第一内容块的第一顺序，将第一内容块流式发送至代理服务器120a。代理服务器120a可以将第一内容块发送至适配服务器120b。适配服务器120b可以对第一内容块进行逻辑的适配转换，并将适配转换后的内容块分发至解码服务器120c。解码服务器120c可以对第一内容块进行内容类型转化，得到第二内容块。解码服务器120c可以依次经适配服务器120b和代理服务器120a，将第二内容块流式返回至终端110。。终端110可以按照接收第二内容块的第二顺序，依次输出第二内容块。

需要说明的是，当代理服务器120a和解码服务器120c之间能够直接通信，而不需要适配转换时，则可以省略适配服务器120b。

可以理解，本申请各实施例中的内容处理方法，相当于使用人工智能技术来自动内容类型的转化和输出。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

可以理解，本申请各实施例中的内容处理方法可以应用语音识别或语音合成处理等语音处理场景中。语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式之一。

图3为一个实施例中内容处理方法的流程示意图。本实施例中的该内容处理方法可以应用于计算机设备，现主要以计算机设备为图1中的终端110进行举例说明。参照图3，该方法具体包括如下步骤：

S302，获取第一内容块。

其中，第一内容块为结构化数据。结构化数据(Struct Data)，是指初始数据经过封装后的结构化数据，在应用层可以直接被识别使用，而不需要进行数据格式转换。

在一个实施例中，计算机设备可以流式获取第一内容块。其中，流式，即指连续地。流式获取第一内容块，即指，连续地获取第一内容块。

可以理解，第一内容块相当于数据流中的一部分，本申请实施例中，并非得到一个完整的内容后进行发送，而是在边获取第一内容块，边发送第一内容块，是一个实时的、流式传输过程。

比如，流式地边采集语音数据，并将其结构化后，边发送语音数据，而非录制一个完整的音频进行传输。相当于，边说话，边识别，用户说话的过程中，进行分段的语音识别，而不需要全部的语音就能返回已经说话的文字结果。

在一个实施例中，计算机设备可以直接获取属于结构化数据的第一内容块。

在一个实施例中，计算机设备也可以获取初始内容，并对初始内容进行结构化封装处理，生成属于结构化数据的第一内容块。

在一个实施例中，计算机设备可以直接获取初始内容。

在一个实施例中，步骤S302包括：接收触发指令；响应于触发指令，获取初始内容；对初始内容进行结构化处理，生成第一内容块。

其中，触发指令，用于触发获取初始内容。即，计算机设备在被触发后，获取初始内容。

在一个实施例中，触发指令可以包括语音识别指令和语音生成指令中的任意一种。

在一个实施例中，计算机设备可以先对初始内容进行预处理，并对预处理后的内容进行结构化封装处理，生成第一内容块。可以理解，预处理，是指从初始内容中提取目标内容的过程。那么，则可以对预处理提取的目标内容进行结构化封装处理，封装成第一内容块。目标内容，是指待进行内容类型转化的内容。

其中，初始内容，是指未进行结构化处理的内容。内容，是指能够传达信息的数据。

在一个实施例中，内容，可以包括文本内容和媒体内容等中的至少一种。媒体内容，是通过媒体方式传达的内容。在一个实施例中，媒体内容可以包括音频内容、视频内容和图片内容等中的至少一种。

S304，通过基于应用层协议建立的双向通信单链路，按照获取第一内容块的第一顺序，对第一内容块进行流式发送。

其中，双向通信单链路，是用于进行双向流式传输的单链路。即，一条链路中可以实现双向流式传输。双向流式传输，是指两端之间可以异步地进行流式发送和接收数据。即，一端可以向另一端流式发送数据，且可以从该另一端流式地接收数据。可以理解，异步，是指数据的接收和发送相互间独立、互不干扰。

应用层协议(application layer protocol)，定义了运行在不同端系统上的应用程序进程相互间传递报文的规范。可以理解，本申请实施例中的应用层协议，是用于建立双向通信单链路的应用层协议，而并非泛指所有的应用层协议。因为，有的应用层协议(比如，http协议，HyperText Transfer Protocol,超文本传输协议)就无法建立双向通信单链路。

可以理解，计算机设备可以在获取第一内容块之前，预先基于应用层协议建立双向通信单链路。计算机设备也可以在获取首个第一内容块之后，触发基于应用层协议建立双向通信单链路。并不限定建立双向通信单链路的时机，只要满足能够在流式发送第一内容块之间建立即可。

在一个实施例中，计算机设备可以直接基于已有的应用层协议，建立双向通信单链路。在一个实施例中，已有的用于建立双向通信单链路的应用层协议，可以包括网络套接字协议。

其中，网络套接字协议(WebSocket协议)，是一种在单个TCP(Transmission Control Protocol，传输控制协议)连接上进行全双工通信的协议，其于2011年被IETF定为标准RFC 6455，并由RFC7936补充规范。

在其他实施例中，计算机设备还可以使用其他已有的应用层协议，建立双向通信单链路。

在一个实施例中，计算机设备可以对传输控制协议或多链路应用层协议进行协议封装，生成用于建立双向通信单链路的应用层协议。

其中，传输控制协议(TCP，Transmission Control Protocol)是一种面向连接的基于字节流的传输层通信协议，由IETF的RFC 793定义。

多链路应用层协议，是用于通过建立至少两条链路实现双向通信的应用层协议。即，多链路应用层协议自身无法建立双向通信单链路。

在一个实施例中，计算机设备可以在传输控制协议的上层进行协议封装，生成用于建立双向通信单链路的应用层协议。

在一个实施例中，计算机设备也可以针对多链路应用层协议进行协议封装，将其封装为用于建立双向通信单链路的应用层协议。比如，Http协议就属于多链路应用层协议，计算机设备可以对Http协议进行协议封装，将其封装为用于建立双向通信单链路的应用层协议。

第一顺序，是获取各第一内容块的顺序。可以理解，由于计算机设备是流式地获取第一内容块，所以，获取的各第一内容块之间是有先后顺序的，即为第一顺序。

流式发送，是指连续地发送第一内容块。比如，计算机设备在获取第一内容块之后，则将第一内容块进行发送，然后获取下一个第一内容块，并将下一个第一内容块进行发送，如此连续地发送第一内容块，形成流式发送。

可以理解，获取第一内容块，以及按照第一顺序，流式发送第一内容块，整个过程是连续性的，相当于边获取第一内容块，边发送第一内容块。

S306，通过双向通信单链路，接收流式返回的第二内容块。

其中，第二内容块，是通过对第一内容块进行内容类型转化得到。内容类型，用于表征内容的呈现形式。发送第一内容块和接收第二内容块是在双向通信单链路中异步进行的。流式返回的第二内容块，是指连续返回的第二内容块。

在一个实施例中，内容类型可以包括音频、视频、文本和图片等中的至少一种。图片可以包括静态图片和动态图片中的至少一种。

可以理解，第一内容块和第二内容块，属于不同内容类型。比如，第一内容块是音频数据，可以通过语音识别处理，对其进行内容类型转化，生成文本内容块。那么，音频数据和文本内容块就属于不同的内容类型。

具体地，计算机设备在将各第一内容块流式发送至服务器后，服务器可以对第一内容块进行内容类型转化处理，生成第二内容块，并向计算机设备流式返回第二内容块。

可以理解，双向通信单链路建立于计算机设备和服务器之间。

S308，按照接收第二内容块的第二顺序，依次输出第二内容块。

其中，第二顺序，是接收第二内容块的顺序。可以理解，由于第二内容块是流式返回的，所以，计算机设备是连续接收第二内容块的，那么，接收的第二内容块之间是有顺序的，即为第二顺序。

具体地，计算机设备可以按照第二顺序，依次输出第二内容块。可以理解，在前接收的第二内容块先于在后接收的第二内容块输出。即，在前接收的第二内容块，比在后接收的第二内容块先输出。

上述内容处理方法，在基于应用层协议建立的双向通信单链路中，对属于结构化数据的第一内容块进行流式发送，并接收流式返回的第二内容块；第二内容块，是通过对第一内容块进行内容类型转化得到。按照接收第二内容块的第二顺序，依次输出第二内容块。由于，发送第一内容块和接收第二内容块是在双向通信单链路中异步进行的，从而实现在同一条通信链路中流式地双向传输结构化的内容，相较于二进制数据而言，不需要额外的数据转化处理，节省了系统资源。

此外，由于传统方法中是基于底层协议传输的，所以，会存在不支持部分应用场景的情况(比如，不支持小程序或html5的接入)。而使用基于应用层协议建立的双向通信单链路，能够支持传统方法中所不能支持的应用场景，提高了适用性，此外，避免了不支持问题所导致的错误，提高了内容处理的准确性。同时，也避免了由于不支持产生错误所导致的系统资源的浪费。

然后，传统方法中基于底层协议建立的通信链路，必须基于固定IP地址来建立链接。这样一来，在流量比较大时，就会由于IP地址不够而受限。本申请的方案，不受限于固定IP地址的限制，在流量大的情况下，仍然能够通过均衡分流处理，进行合理的适配分配。

最后，基于应用层协议建立的双向通信单链路，能够将上下行数据通过同一条链路进行流式传输，实现了稳定的双向流式传输处理，避免了多链路容易出现的同步失败的问题，既提高了准确性，又避免了多链路所导致的系统资源耗费。

在一个实施例中，触发指令为语音识别指令；响应于触发指令，获取初始内容包括：响应于语音识别指令，采集音频数据。本实施例中，对初始内容进行预处理，以从初始内容中提取目标内容包括：从采集的音频数据中提取目标语音数据。对目标内容进行结构化处理，生成第一内容块包括：对目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。

其中，语音识别(ASR，Automatic Speech Recognition),是指将语音数据转化为文本内容的处理过程。

语音识别指令，是用于触发语音识别处理的指令。在一个实施例中，语音识别指令，可以包括直接触发语音识别的指令和间接触发语音识别的指令。

其中，直接触发语音识别的指令，是专门用于触发语音识别的指令。即，该指令专门用于触发语音识别。

间接触发语音识别的指令，是在触发生成目标指令的过程中，触发了语音识别处理。在一个实施例中，间接触发语音识别的指令可以包括语音搜索指令。语音搜索指令，是用于根据语音数据进行信息搜索的指令。可以理解，在语音搜索过程中，需要对语音进行识别，则会间接触发语音识别。

音频数据，即为数字化的声音数据。目标语音数据，是指需要转化为文本内容的语音数据。可以理解，目标语音数据是音频数据中除干扰语音之外的语音数据。干扰语音，是指不用被转化为文本内容的语音数据。

在一个实施例中，干扰语音可以包括环境音数据和非目标对象的语音数据中的至少一种。非目标对象，是指除提供目标语音数据的目标对象之外的对象。

具体地，用户可以对计算机设备输入语音识别指令，计算机设备可以响应于语音识别指令，基于应用层协议建立双向通信单链路。用户可以开始说话，计算机设备则可以采集音频数据。计算机设备可以对音频数据进行预处理，从中提取目标语音数据。计算机设备可以对目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。

可以理解，计算机设备是边接收音频数据，边生成语音数据块，属于一个流式处理过程，而并非录制完整视频后，生成语音数据块。

在一个实施例中，计算机设备中安装有客户端，在该客户端中预先安装了软件包(SDK，Software Development Kit)。

其中，客户端是具备音频采集入口的客户端。可以理解，客户端可以是需要通过音频采集入口实现自身特性的客户端，也可以是将音频采集作为辅助功能的额外集成音频采集入口的客户端。

在一个实施例中，客户端可以包括内容播放平台的客户端、智能家居设备的信号接收器(比如，机顶盒)和即时通信客户端等中的至少一种。

内容播放平台的客户端，可以包括视频播放客户端和音频播放客户端等中的至少一种。

智能家居(smart home,home automation)是以住宅为平台，利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成。在一个实施例中，智能家居设备，包括智能电视、智能音箱和智能空调等中的至少一种。

具体地，用户可以在客户端上进行语音识别操作，以输入语音识别指令，客户端可以响应于语音识别指令，调用安装的软件包启动语音识别处理。当计算机设备通过软件包启动语音识别处理时，则基于应用层协议，建立与服务器之间的双向通信单链路。

在一个实施例中，客户端的界面上可以展示语音识别触发控件，当接收到由对语音识别触发控件的触发所生成的语音识别指令时，跳转至语音搜索界面进行音频数据采集，并基于应用层协议建立与服务器之间的双向通信单链路。当采集到音频数据时，则对音频数据进行预处理，从中提取目标语音数据。计算机设备可以通过客户端对目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。接着，通过双向通信单链路将语音数据块发送至服务器进行语音识别处理。其中，语音搜索界面，是基于语音数据搜索媒体内容的界面。

在一个实施例中，该方法还包括：将展示的第二内容块按照第二顺序进行拼接组合，生成搜索语句；根据搜索语句，搜索与搜索语句匹配的媒体内容；展示搜索到的媒体内容。

在一个实施例中，媒体内容可以包括音频内容、视频内容和图片内容等中的至少一种。

具体地，计算机设备可以将展示的第二内容块按照其被接收的先后顺序(即第二顺序)进行拼接组合，生成一个完整的搜索语句。计算机设备可以根据该搜索与搜索语句匹配的媒体内容，并展示该媒体内容。

可以理解，计算机设备可以通过图片和文字中的至少一种方式来展示该媒体内容。

在一个实施例中，计算机设备可以调用软件包，基于应用层协议建立客户端与代理服务器之间的双向通信单链路。其中，代理服务器(Proxy Server)，是指用于与客户端之间建立链接，并进行流量分发的服务器。

用户开始说话时，计算机设备则可以采集音频数据。计算机设备可以对音频数据进行预处理，从中提取目标语音数据。计算机设备可以对目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。

在一个实施例中，计算机设备可以对音频数据进行降噪、活动检测和压缩等至少一种预处理，以从中得到目标语音数据。

在一个实施例中，第二内容块，是通过对语音数据块进行语音识别，得到的文本内容块。按照接收第二内容块的第二顺序，依次输出第二内容块包括：按照接收文本内容块的第二顺序，在界面上依次展示文本内容块。

可以理解，语音识别处理，相当于内容类型转化处理。

需要说明的是，按照第二顺序在界面上依次展示文本内容块，即指按照接收文本内容块的先后顺序，依次在界面上展示该文本内容块。可以理解，展示文本内容块，即展示这部分文本内容。

图4至图7为一个实施例中语音识别的界面示意图。以客户端为视频客户端为例进行举例说明。参照图4，视频客户端的搜索框附近有一个语音按钮402(即，语音识别触发控件)。用户可以点击语音按钮，进入语音搜索界面。图5即为语音搜索界面，并调用软件包建立双向通信单链路。用户可以说话，假设，用户说“我想看刘德华最新的电影”。那么，则可以通过该语音搜索界面采集音频数据，并生成语音数据块。客户端则可以将语音数据块通过双向通信单链路发送至服务器，由服务器对其进行语音识别处理，并将识别的文本内容块流式返回。客户端则可以按照接收文本内容块的顺序，在界面上依次展示文本内容块。可以理解，因为是流式发送语音数据块和接收文本内容块，所以，是用户边说边将其识别转化为文字，则可以用户一边说一边在语音搜索界面上出现对应的文字内容。如图6所示，当用户只说到“我想看”，而并未说完“我想看刘德华最新的电影”这一整句话时，则就可以将 “我想看”作为一个语音数据块进行发送，然后，就会在该语音搜索界面上显示识别出来的文字内容块“我想看”。图7即为将流式返回的文本内容块依次展示，得到“我想看刘德华最新的电影”这一最终的文本内容。

图8为一个实施例中内容处理的流程简示图。参照图8，以应用层协议为websocket协议为例进行举例说明。用户通过客户端(app)开始语音识别，通过客户端调用软件包(sdk)并启动语音识别处理，软件包启动语音识别处理时，首先基于websocket协议，在客户端与代理服务器之间建立一个双向通信单链路，以供流式传输上行的语音数据，和下行的所识别转化的文本内容。其中，上行，是指从客户端向网络传送信息。下行，是指从网络中接收信息至客户端。然后，用户开始说话时软件包sdk开始采集音频数据，并对得到的音频数据做降噪、活动检测和压缩等处理，得到目标语音数据。然后，将目标语音数据进行结构化处理，生成语音数据块。计算机设备可以通过双向通信单链路将语音数据块流式发送至代理服务器，由代理服务器将其分发至解码服务器。解码服务器对其进行语音识别转化，生成文本内容块。解码服务器将文本内容块返回至代理服务器，由代理服务器通过双向通信单链路将文本内容块流式返回至客户端。客户端按照接收文本内容块的第二顺序，在界面上依次展示文本内容块。

图9为一个实施例中流式传输示意图。参照图9，客户端和代理服务器之间建立了双向通信单链路。客户端发送的语音数据块、以及代理服务器返回的文本内容块(即结果)，都是在该双向通信单链路中传输，而且二者之间是异步进行。

上述实施例中，通过应用层协议建立的双向通信单链路，即可以实现对结构化的语音识别相关数据的双向流式传输，在保证传输稳定性的同时，节省了系统资源。

在一个实施例中，触发指令，为语音合成指令。响应于触发指令，获取初始内容包括：响应于语音合成指令，获取输入的文本内容。本实施例中，对初始内容进行结构化处理，生成第一内容块包括：将文本内容进行结构化处理，生成文本内容块，作为第一内容块。

其中，语音合成(TTS，Text To Speech)，是指将文本转化为对应语音的的处理过程。

可以理解，本实施例中，第二内容块，是通过将文本内容块进行语音合成，得到的语音数据块。按照接收第二内容块的第二顺序，依次输出第二内容块包括：按照接收语音数据块的第二顺序，依次播放语音数据块。

具体地，用户可以在计算机设备中输入文本内容。计算机设备可以在用户输入文本内容的过程中，将已输入的文本内容进行结构化处理，生成文本内容块。计算机设备可以将文本内容块通过双向通信单链路流式发送至服务器。服务器则可以对文本内容块进行语音合成处理，以生成与该文本内容块对应的语音数据块。服务器可以将生成的语音数据块流式返回至计算机设备。计算机设备可以按照接收语音数据块的第二顺序，依次播放语音数据块。

可以理解，本实施例中，相当于边输入文本内容，边生成语音数据块。即，边输入文字边输出语音，是一个流式地处理过程，而不是需要输入完整的文本内容后，再将其合成为语音。

在一个实施例中，得到的语音数据块，是将文本内容块与预设声音模板进行结合，进行语音合成得到的。

其中，预设声音模板，是预先建立的声音模板。即，语音数据块通过语音数据块生成步骤得到。语音数据块生成步骤包括：将文本内容块与预设声音模板结合，合成与该预设声音模板的声音特征相符的语音数据块。

比如，预设声音模板为某一个游戏角色的声音模板。那么，语音数据块，即与该游戏角色的声音特征相符，相当于，用该游戏角色说出该文本内容。

上述实施例中，通过应用层协议建立的双向通信单链路，即可以实现对结构化的语音合成相关数据的双向流式传输，在保证传输稳定性的同时，节省了系统资源。

在一个实施例中，该方法还包括：获取应用层协议；基于应用层协议，在本端与代理服务器之间建立双向通信单链路；其中，双向通信单链路，是用于进行双向流式传输的单链路。

可以理解，应用层协议，可以是已有的用于建立双向通信单链路的应用层协议。应用层协议，也可以是基于不能建立双向通信单链路的通信协议进行协议封装得到。

具体地，计算机设备可以基于应用层协议，在本端与代理服务器之间建立双向通信单链路。其中，本端，是计算机设备的本端。

可以理解，计算机设备是通过双向通信单链路向代理服务器流式发送第一内容块。由代理服务器返回针对第一内容块进行内容类型转化处理后的第二内容块。

需要说明的是，代理服务器可以将第一内容块分流至用于进行语音识别的服务器。代理服务器也可以自身对第一内容块进行语音识别处理。

上述实施例中，基于应用层协议，在本端与代理服务器之间建立双向通信单链路，能够通过代理服务器进行均衡分发处理，提高了资源利用的合理性。此外，也能够提高内容处理的准确性和处理效率。

在一个实施例中，该方法还包括：基于传输控制协议或多链路应用层协议进行协议封装，生成用于建立双向通信单链路的应用层协议。

在一个实施例中，计算机设备可以对传输控制协议进行协议封装，生成用于建立双向通信单链路的应用层协议。

在一个实施例中，计算机设备可以对多链路应用层协议进行协议封装，生成用于建立双向通信单链路的应用层协议。

其中，多链路应用层协议，是用于通过建立至少两条链路实现双向通信的应用层协议。即，多链路应用层协议自身无法建立双向通信单链路。

具体地，计算机设备可以对传输控制协议进行协议封装、或者对多链路应用层协议进行协议封装，生成一套能够实现客户端和服务器之间交互的应用层协议。

本实施例中，基于应用层协议，在本端与代理服务器之间建立双向通信单链路包括：向代理服务器发送上行链路请求和下行链路请求；通过应用层协议，将上行链路请求和下行链路请求进行合并封装，生成本端与代理服务器之间的双向通信单链路。

其中，本端，是指计算机设备的本地端。上行链路请求，用于请求建立从客户端向网络传送信息的通信链路。下行链路请求，用于请求建立客户端从网络中接收信息的通信链路。

具体地，计算机设备可以向代理服务器发送上行链路请求和下行链路请求，并通过封装的应用层协议，将上行链路请求和下行链路请求进行合并封装，生成本端与代理服务器之间的双向通信单链路。这样一来，则可以通过该双向通信单链路实现上行和下行数据的发送和接收处理。

在一个实施例中，在保持双向通信单链路稳定的同时，计算机设备还可以接收应用接口适配指令，响应于该应用接口适配指令，在接入层适配至少一个应用的接口。这样一来，所适配的接口所对应的各应用，皆可以通过该双向通信单链路实现数据的发送和接收处理，达到泛化的目的，从而提高适用性。

上述实施例中，可以对底层协议或已有应用层协议进行封装，生成用于建立双向通信单链路的应用层协议，进而建立双向通信单链路，是不同于使用既有的应用层协议直接建立双向通信单链路的、扩展的新方案，提高了适用性。

在一个实施例中，按照获取第一内容块的第一顺序，对第一内容块进行流式发送包括：按照获取第一内容块的第一顺序，向代理服务器流式发送第一内容块；第一内容块，用于指示代理服务器将第一内容块分发至解码服务器。本实施例中，通过双向通信单链路，接收流式返回的第二内容块包括：通过双向通信单链路，接收由代理服务器流式返回的第二内容块；第二内容块，是由解码服务器对第一内容块进行内容类型转化得到。

其中，解码服务器(Decoder Server)，是指负责进行内容类型转化的服务器。

在一个实施例中，代理服务器可以直接将第一内容块分发至解码服务器。代理服务器也可以将第一内容块分发至适配服务器，由适配服务器将第一内容块分流至解码服务器。

其中，适配服务器，用于数据进行逻辑的适配转换，并将适配转换后的内容分发。

图10为一个实施例中内容处理的架构框图。图10是以语音识别为应用场景进行举例说明。参照图10，用户说话，客户端采集音频数据，并对其进行预处理以及结构化处理，生成语音数据块，并将语音数据块传递至所安装的软件包。软件包与代理服务器之间建立了双向通信单链路。通过该双向通信单链路将语音数据块分发至适配服务器，由适配服务器通过数据进程(Data process)将其分流至解码服务器。解码服务器对其进行语音识别，生成文本内容块，并通过数据进程将文本内容块返回至适配服务器。适配服务器则将结构化的文本内容块返回至代理服务器。代理服务器则通过双向通信单链路，将结构化的文本内容块返回至软件包，进而，将其传回客户端。即，通过双向通信单链路实现上下行传输。客户端则会对该文本内容块进行展示。可以理解，在传输语音数据块的过程中，仍然在采集音频数据，所以是流式发送语音数据块，以及流式返回文本内容块，实现用户边说话边识别文字的效果。而且，发送语音数据块和接收文本内容块在双向通信单链路中是异步进行的。

上述实施例中，在服务器端，通过代理服务器、解码服务器等多个服务器的协同分工来进行内容处理，能够提高处理效率和准确性。

在一个实施例中，代理服务器包括第一代理服务器和第二代理服务器；第一代理服务器是第一对象提供的代理服务器；第二代理服务器，是第二对象提供的代理服务器；第一内容块，是基于第二对象的客户端获取得到；双向通信单链路，是基于应用层协议和第一对象提供的软件包，建立于客户端和第一代理服务器之间。

本实施例中，第一内容块还用于指示第一代理服务器将第一内容块转发至第二代理服务器，由第二代理服务器将第一内容块分发至解码服务器。

可以理解，第一对象不同于第二对象。第一对象，是服务提供方，即用于提供实现内容处理方法的工具。第二对象，相当于业务方，用于根据第一对象提供的软件包，实现本申请各实施例中的内容处理方法。

在一个实施例中，第二对象可以是内容播放平台方、智能家居平台方、以及即时通信平台方等中的至少一种。

具体地，计算机设备预先在第二对象提供的客户端中安装第一对象提供的软件包。在接收到触发指令后，计算机设备可以基于应用层协议和所安装的软件包，在客户端和第一对象提供的第一代理服务器之间建立双向通信单链路。计算机设备可以通过该客户端获取第一内容块，并将第一内容块通过双向通信单链路流式发送至第一代理服务器。第一代理服务器可以将该第一内容块转发至第二对象提供的第二代理服务器。第二代理服务器再将第一内容块分流至解码服务器进行内容类型转化处理。

可以理解，第二代理服务器可以直接将第一内容块发送至解码服务器进行内容类型转化处理。第二代理服务器也可以将第一内容块分发至适配服务器，由适配服务器根据负载均衡原理，将第一内容块分流至解码服务器进行解码处理。

图11为一个实施例中中控转发的示意图。第一代理服务器作为中央控制中心，将第一内容块中控转发至对应地区和业务的第二代理服务器，由第二代理服务器将第一内容块均衡分流至适配服务器。适配服务器进行逻辑适配处理，将数据入队列后，再将第一内容块分发至该业务对应的解码服务器，有解码服务器对其进行解码识别，即进行内容类型转化处理。然后，解码服务器将内容类型转化后的第二内容块，依次经过适配服务器和第二代理服务器，返回至第一代理服务器。再由第一代理服务器通过双向通信单链路将第二内容块传回至客户端，由客户端依次输出各第二内容块。

上述实施例中，将第一内容块转发至业务方的代理服务器(即第二代理服务器)，继而由业务方的代理服务器进行分发处理，一方面相当于进行安全管控，提高了安全性。另一方面，让对应业务方的代理服务器进行分发处理，相当于考虑了业务特征，提高了内容处理的准确性。

如图12所示，在一个实施例中，提供了一种内容处理装置1200，设置于计算机设备。该计算机设备可以为终端或服务器。该装置1200包括：获取模块1202、流式传输模块1204以及输出模块1206，其中：

获取模块1202，用于获取第一内容块；第一内容块为结构化数据。

流式传输模块1204，用于通过基于应用层协议建立的双向通信单链路，按照获取第一内容块的第一顺序，对第一内容块进行流式发送；通过双向通信单链路，接收流式返回的第二内容块；第二内容块，是通过对第一内容块进行内容类型转化得到；发送第一内容块和接收第二内容块是在双向通信单链路中异步进行的。

输出模块1206，用于按照接收第二内容块的第二顺序，依次输出第二内容块。

在一个实施例中，获取模块1202还用于接收触发指令；响应于触发指令，获取初始内容；对初始内容进行结构化处理，生成第一内容块。

在一个实施例中，触发指令，为语音识别指令；获取模块1202还用于响应于语音识别指令，采集音频数据；从采集的音频数据中提取目标语音数据；对目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。

在一个实施例中，第二内容块，是通过对语音数据块进行语音识别，得到的文本内容块；输出模块1206还用于按照接收文本内容块的第二顺序，在界面上依次展示文本内容块。

在一个实施例中，输出模块1206还用于将展示的第二内容块按照第二顺序进行拼接组合，生成搜索语句；根据搜索语句，搜索与搜索语句匹配的媒体内容；展示搜索到的媒体内容。

在一个实施例中，触发指令，为语音合成指令；获取模块1202还用于响应于语音合成指令，获取输入的文本内容；对文本内容进行结构化处理，生成文本内容块，作为第一内容块。

在一个实施例中，第二内容块，是通过将文本内容块进行语音合成，得到的语音数据块；输出模块1206还用于按照接收语音数据块的第二顺序，依次播放语音数据块。

如图13所示，在一个实施例中，该装置1200还包括：

链路建立模块1203，用于获取应用层协议；基于应用层协议，在本端与代理服务器之间建立双向通信单链路；其中，双向通信单链路，是用于进行双向流式传输的单链路。

在一个实施例中，链路建立模块1203还用于基于传输控制协议或多链路应用层协议进行协议封装，生成用于建立双向通信单链路的应用层协议；向代理服务器发送上行链路请求和下行链路请求；通过应用层协议，将上行链路请求和下行链路请求进行合并封装，生成本端与代理服务器之间的双向通信单链路。

在一个实施例中，流式传输模块1204还用于按照获取第一内容块的第一顺序，向代理服务器流式发送第一内容块；第一内容块，用于指示代理服务器将第一内容块分发至解码服务器；通过双向通信单链路，接收由代理服务器流式返回的第二内容块；第二内容块，是由解码服务器对第一内容块进行内容类型转化得到。

在一个实施例中，代理服务器包括第一代理服务器和第二代理服务器；第二代理服务器，是业务方的代理服务器；第一内容块，是基于业务方的客户端获取得到；第一内容块还用于指示第一代理服务器将第一内容块转发至第二代理服务器，由第二代理服务器将第一内容块分发至解码服务器。

上述内容处理装置，在基于应用层协议建立的双向通信单链路中，对属于结构化数据的第一内容块进行流式发送，并接收流式返回的第二内容块；第二内容块，是通过对第一内容块进行内容类型转化得到。按照接收第二内容块的第二顺序，依次输出第二内容块。由于，发送第一内容块和接收第二内容块是在双向通信单链路中异步进行的，从而实现在同一条通信链路中流式地双向传输结构化的内容，相较于二进制数据而言，不需要额外的数据转化处理，节省了系统资源。

关于内容处理装置的具体限定可以参见上文中对于内容处理方法的限定，在此不再赘述。上述内容处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

图14为一个实施例中计算机设备的框图。参照图14，该计算机设备可以图1中的终端110。该计算机设备包括通过系统总线连接的一个或多个处理器、存储器、网络接口、显示屏和输入装置。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质可存储操作系统和计算机可读指令。该计算机可读指令被执行时，可使得一个或多个处理器执行一种内容处理方法。该计算机设备的一个或多个处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该内存储器中可储存有计算机可读指令，该计算机可读指令被一个或多个处理器执行时，可使得一个或多个处理器执行一种内容处理方法。计算机设备的网络接口用于进行网络通信。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏等。计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是终端外壳上设置的按键、轨迹球或触控板，也可以是外接的键盘、触控板或鼠标等。该计算机设备可以是个人计算机、智能音箱、移动终端或车载设备，移动终端包括手机、平板电脑、个人数字助理或可穿戴设备等中的至少一种。

本领域技术人员可以理解，图14中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的内容处理装置可以实现为一种计算机可读指令的形式，计算机可读指令可在如图14所示的计算机设备上运行，计算机设备的非易失性存储介质可存储组成该内容处理装置的各个程序模块。比如，图12所示的获取模块1202、流式传输模块1204以及输出模块1206。各个程序模块所组成的计算机可读指令用于使该计算机设备执行本说明书中描述的本申请各个实施例的内容处理方法中的步骤。

例如，计算机设备可以通过如图12所示的内容处理装置1200中的获取模块1202获取第一内容块；第一内容块为结构化数据。计算机设备可以通过流式传输模块1204通过基于应用层协议建立的双向通信单链路，按照获取第一内容块的第一顺序，对第一内容块进行流式发送；通过双向通信单链路，接收流式返回的第二内容块；第二内容块，是通过对第一内容块进行内容类型转化得到；发送第一内容块和接收第二内容块是在双向通信单链路中异步进行的。计算机设备可以通过输出模块1206按照接收第二内容块的第二顺序，依次输出第二内容块。

在一个实施例中，提供了一种计算机设备，包括存储器和一个或多个处理器，存储器存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述内容处理方法的步骤。此处内容处理方法的步骤可以是上述各个实施例的内容处理方法中的步骤。

在一个实施例中，提供了一个或多个计算机可读存储介质，存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述内容处理方法的步骤。此处内容处理方法的步骤可以是上述各个实施例的内容处理方法中的步骤。

需要说明的是，本申请各实施例中的“第一”和“第二”等仅用作区分，而并不用于大小、先后、从属等方面的限定。本申请各实施例中的“多个”即为至少两个。

应该理解的是，虽然本申请各实施例中的各个步骤并不是必然按照步骤标号指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种内容处理方法，由计算机设备执行，所述方法包括：

获取第一内容块；所述第一内容块为结构化数据；

通过基于应用层协议建立的双向通信单链路，按照获取所述第一内容块的第一顺序，对所述第一内容块进行流式发送；

通过所述双向通信单链路，接收流式返回的第二内容块；所述第二内容块，是通过对所述第一内容块进行内容类型转化得到；发送所述第一内容块和接收所述第二内容块是在所述双向通信单链路中异步进行的；及

按照接收所述第二内容块的第二顺序，依次输出所述第二内容块。
根据权利要求1所述的方法，其特征在于，所述获取第一内容块包括：

接收触发指令；

响应于所述触发指令，获取初始内容；及

对所述初始内容进行结构化处理，生成第一内容块。
根据权利要求2所述的方法，其特征在于，所述对所述初始内容进行结构化处理，生成第一内容块，包括：

对所述初始内容进行预处理，以从所述初始内容中提取目标内容；所述目标内容，是指待进行内容类型转化的内容；

对所述目标内容进行结构化处理，生成第一内容块。
根据权利要求3所述的方法，其特征在于，所述触发指令，为语音识别指令；所述响应于所述触发指令，获取初始内容包括：

响应于所述语音识别指令，采集音频数据；

所述对所述初始内容进行预处理，以从所述初始内容中提取目标内容包括：

从采集的所述音频数据中提取目标语音数据；及

所述对所述目标内容进行结构化处理，生成第一内容块，包括：

对所述目标语音数据进行结构化处理，生成语音数据块，作为第一内容块。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

展示语音识别触发控件；

所述响应于所述语音识别指令，采集音频数据，包括：

当接收到由对所述语音识别触发控件的触发所生成的语音识别指令时，跳转至语音搜索界面进行音频数据采集，并基于应用层协议建立所述双向通信单链路。
根据权利要求4所述的方法，其特征在于，所述第二内容块，是通过对所述语音数据块进行语音识别，得到的文本内容块；及

所述按照接收所述第二内容块的第二顺序，依次输出所述第二内容块包括：

按照接收所述文本内容块的第二顺序，在界面上依次展示所述文本内容块。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

将展示的所述第二内容块按照所述第二顺序进行拼接组合，生成搜索语句；

根据所述搜索语句，搜索与所述搜索语句匹配的媒体内容；及

展示搜索到的所述媒体内容。
根据权利要求2所述的方法，其特征在于，所述触发指令，为语音合成指令；所述响应于所述触发指令，获取初始内容包括：

响应于语音合成指令，获取输入的文本内容；

所述对所述初始内容进行结构化处理，生成第一内容块包括：及

对所述文本内容进行结构化处理，生成文本内容块，作为第一内容块。
根据权利要求8所述的方法，其特征在于，所述第二内容块，是通过将所述文本内容块进行语音合成，得到的语音数据块；及

所述按照接收所述第二内容块的第二顺序，依次输出所述第二内容块包括：

按照接收所述语音数据块的第二顺序，依次播放所述语音数据块。
根据权利要求9所述的方法，其特征在于，所述语音数据块通过语音数据块生成步骤得到，所述语音数据块生成步骤包括：

将文本内容块与预设声音模板结合，合成与所述预设声音模板的声音特征相符的语音数据块。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取应用层协议；及

基于所述应用层协议，在本端与代理服务器之间建立双向通信单链路；

其中，所述双向通信单链路，是用于进行双向流式传输的单链路。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

基于传输控制协议和多链路应用层协议中的任意一种进行协议封装，生成用于建立双向通信单链路的应用层协议；

所述基于所述应用层协议，在本端与代理服务器之间建立双向通信单链路包括：

向代理服务器发送上行链路请求和下行链路请求；及

通过所述应用层协议，将所述上行链路请求和下行链路请求进行合并封装，生成本端与代理服务器之间的双向通信单链路。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收应用接口适配指令；

响应于该应用接口适配指令，在接入层适配至少一个应用的接口；所适配的接口所对应的应用，为用于通过所述双向通信单链路进行数据的发送和接收处理的应用。
根据权利要求1所述的方法，其特征在于，所述按照获取所述第一内容块的第一顺序，对所述第一内容块进行流式发送包括：

按照获取所述第一内容块的第一顺序，向代理服务器流式发送所述第一内容块；所述第一内容块，用于指示所述代理服务器将所述第一内容块分发至解码服务器；及

所述通过所述双向通信单链路，接收流式返回的第二内容块包括：

通过所述双向通信单链路，接收由所述代理服务器流式返回的第二内容块；所述第二内容块，是由所述解码服务器对所述第一内容块进行内容类型转化得到。
根据权利要求14所述的方法，其特征在于，所述代理服务器包括第一代理服务器和第二代理服务器；所述第一代理服务器是第一对象提供的代理服务器；所述第二代理服务器，是第二对象提供的代理服务器；所述第一内容块，是基于所述第二对象的客户端获取得到；所述双向通信单链路，是基于所述应用层协议和所述第一对象提供的软件包，建立于所述客户端和所述第一代理服务器之间；

所述第一内容块还用于指示所述第一代理服务器将所述第一内容块转发至第二代理服务器，由所述第二代理服务器将所述第一内容块分发至所述解码服务器。
一种内容处理装置，其特征在于，设置于计算机设备中，包括：

获取模块，用于获取第一内容块；所述第一内容块为结构化数据；

流式传输模块，用于通过基于应用层协议建立的双向通信单链路，按照获取所述第一内容块的第一顺序，对所述第一内容块进行流式发送；通过所述双向通信单链路，接收流式返回的第二内容块；所述第二内容块，是通过对所述第一内容块进行内容类型转化得到；发送所述第一内容块和接收所述第二内容块是在所述双向通信单链路中异步进行的；及

输出模块，用于按照接收所述第二内容块的第二顺序，依次输出所述第二内容块。
根据权利要求16所述的装置，其特征在于，所述流式传输模块还用于按照获取所述第一内容块的第一顺序，向代理服务器流式发送所述第一内容块；所述第一内容块，用于指示所述代理服务器将所述第一内容块分发至解码服务器；通过所述双向通信单链路，接收由所述代理服务器流式返回的第二内容块；所述第二内容块，是由所述解码服务器对所述第一内容块进行内容类型转化得到。
根据权利要求16所述的装置，其特征在于，所述装置还包括：

链路建立模块，用于基于传输控制协议和多链路应用层协议中的任意一种进行协议封装，生成用于建立双向通信单链路的应用层协议；向代理服务器发送上行链路请求和下行链路请求；及通过所述应用层协议，将所述上行链路请求和下行链路请求进行合并封装，生成本端与代理服务器之间的双向通信单链路。
一种计算机设备，其特征在于，包括存储器和一个或多个处理器，所述存储器中存储有计算机程序，所述计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行权利要求1至15中任一项所述方法的步骤。
一个或多个计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，使得所述一个或多个处理器执行权利要求1至15中任一项所述方法的步骤。