WO2019228078A1

WO2019228078A1 - 一种视频转码系统、方法、装置及存储介质

Info

Publication number: WO2019228078A1
Application number: PCT/CN2019/082227
Authority: WO
Inventors: 张宏顺; 程曦铭; 侯慧慧
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-05-31
Filing date: 2019-04-11
Publication date: 2019-12-05
Also published as: CN110213598A; EP3806477B1; EP3806477A4; CN110213598B; EP3806477A1; US11184627B2; US20200382803A1

Abstract

本申请实施例提供了一种视频转码系统、方法及相关产品，其中系统包括：主转码器和备转码器；所述主转码器获得输入视频，对所述输入视频进行转码，将转码后的视频发往接收设备；所述备转码器获得所述输入视频并缓存所述输入视频，在所述主转码器宕机的情况下获得所述主转码器的转码位置信息，依据所述转码位置信息对缓存的输入视频进行转码获得输出视频，将所述输出视频发往所述接收设备。

Description

一种视频转码系统、方法、装置及存储介质

本申请要求于2018年5月31日提交中国专利局、申请号为201810548780.1，申请名称为“一种视频转码系统、方法及相关产品”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种视频转码系统、方法、装置及存储介质。

背景技术

视频转码(video transcoding)是指将视频码流转换成另一种视频码流，以适应不同的网络带宽、不同的终端处理能力和不同的用户需求。视频转码本质上是再编码的过程，因此转换前后的码流可能遵循相同的视频编码标准，也可能不遵循相同的视频编码标准。

发明内容

本申请实施例公开一种视频转码系统、方法及相关产品，用于提高视频转码的可靠性。

第一方面本申请实施例提供了一种视频转码系统，包括：

主转码器和备转码器；

所述主转码器获得输入视频，对所述输入视频进行转码，将转码后的视频发往接收设备；

所述备转码器获得所述输入视频并缓存所述输入视频，在所述主转码器宕机的情况下获得所述主转码器的转码位置信息，依据所述转码位置信息对缓存的输入视频进行转码获得输出视频，将所述输出视频发往所述接收设备。

第二方面本申请实施例还提供了一种视频转码方法，由计算设备执行，该方法包括：

将输入视频发往主转码器和备转码器，控制所述主转码器对所述输入视频进行转码并将转码后的视频发往接收设备，控制所述备转码器缓存所述输入视频；

在所述主转码器宕机的情况下，获得所述主转码器的转码位置信息；

向所述备转码器发送所述转码位置信息，控制所述备转码器依据所述转码位置信息对缓存的输入视频进行转码获得输出视频，将所述输出视频发往所述接收设备。

第三方面本申请实施例还提供了一种视频转码装置，包括存储器和处理器，所述存储器用于存储程序指令，所述程序指令适于由所述处理器加载；

所述处理器，用于加载所述程序指令并执行如本申请实施例提供的任一项所述视频转码方法。

第四方面本申请实施例还提供了一种存储介质，所述存储介质中存储有多条程序指令，所述程序指令适于由处理器加载并执行如本申请实施例提供的任一项所述视频转码方法。

第五方面本申请实施例还提供了一种计算机程序产品，所述计算机程序产品包含多条程序指令，所述程序指令适于由处理器加载并执行如本申请实施例提供的任一项所述视频转码方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例中所需要使用的附图进行说明。

图1为本申请实施例系统结构示意图；

图2为本申请实施例方法流程示意图；

图3为本申请实施例备转码器结构示意图；

图4为本申请实施例转码对应及拼接示意图；

图5为本申请实施例先进先出队列结构示意图；

图6为本申请实施例方法流程示意图；

图7为本申请实施例系统结构示意图；

图8为本申请实施例转码对应及拼接示意图；

图9为本申请实施例转码后打包示意图；

图10为本申请实施例转码后打包示意图；

图11为本申请实施例切换后起始编码位置示意图；

图12为本申请实施例并发编码拼接视频的示意图；

图13为本申请实施例视频转码装置示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本申请一实施例中，以大型视频直播应用场景为例：专人在现场采集高清原始视频，然后按高带宽编码上传到后台，经后台转码成适应于不同带宽、不同分辨率的码流发送给用户侧，供用户选择观看。整个过程对实时和现场同步要求较高；因此，对编码过程要求也相应较高。一旦后台转码宕机，会导致观看不到视频，出现黑屏、卡死等现象。

目前针对转码宕机的问题，主要处理方式为：通知接收端保持显示上一个正常视频，同时重启后台的编码器，向发送端申请I帧，编码器从I帧开始重新拉取视频流，经解码和重新编码后发往接收端。但是以上方案虽然不会黑屏，但是会有长时间卡死，因此可靠性仍然很低。

如图1所示为本申请实施例提供的网络系统架构示意图，其中包含有视频采集设备、视频转码系统(也可称为视频转码设备)、传输网络以及接收设备。视频采集设备采集视频源码，发往视频转码设备，视频转码设备转码后经传输网络发往接收设备。其中视频转码系统中包含有主转码器和备转码器，左侧输入为输入视频，由于视频通常是以流形式传输的，因此也可以称为输入流，或者输入视频流等；另外，在直播行业，视频产生于用户侧，视频转码后会发往服务器或者经网络转发到接收设备，因此视频需要上传，所以输入流也可以称为上传流，上行流等；在该视频转码系统中，左侧输入的视频流会同时发给主转码器和备转码器；在主转码器正常工作的情况下，备转码器可以不必执行转码操作，仅需缓存输入视频；在主转码器宕机的情况下，备转码器执行转码操作。

如图2所示，本申请实施例提供了一种视频转码系统，包含主转码器和备转码器。视频转码系统的具体工作流程如下：

201：所述主转码器和所述备转码器获得输入视频；所述输入视频经所述主转码器转码后发往接收设备；所述备转码器缓存所述输入视频；

上述输入视频是指输入视频转码器的视频，通常来说可以是视频采集设备所采集的原始视频的码流，例如：视频直播行业中，由摄像头所采集的视频码流。

主转码器对输入数据进行转码的过程，可以遵循一般转码方法，先使用解码器对输入视频进行解码，然后将解码结果转码为适应于不同带宽、不同分辨率的码流。

如果采用硬转码，那么上述主转码器和备转码器可以是相互独立的硬件；如果使用软转码，那么上述主转码器和备转码器可以分别对应到一个转码进程，或者虚拟的转码器。对此本申请实施例不作唯一性限定。

202：所述备转码器获得所述主转码器的转码位置信息；在所述主转码器宕机的情况下，所述备转码器依据所述转码位置信息对缓存的输入视频进行转码获得输出视频发往所述接收设备。

以上转码位置信息用于定位主转码器宕机时转码的位置，这样备转码器继续转码得到的输出视频则可以接续到已转码得到的输出视频；由于转码通常是以帧为单位的，因此这里的转码位置信息可以包含宕机时主转码器转码的帧序号，另外相应地转码位置还会对应有已发送的数据包的序号等信息。

获得主转码器是否宕机的方式有很多，例如对主转码器的输出视频进行监测，如果没有输出视频则可以确定宕机了；本申请实施例对如何确定主转码器是否宕机的具体手段不作唯一性限定。对于备转码器而言，可以是备转码器自己确定主转码器宕机，也可以是其他硬件、虚拟设备或进程获知主转码器宕机后告知备转码器。

由于备转码器输出的视频可以接续主转码器宕机导致的视频中断，因此上述输出视频是相对于主转码器生成的输出视频而言的视频数据。

基于本实施例的说明，使用主转码器和备转码器配合，由于主转码器在对输入视频数据进行转码过程中会存在一定数量的未转码的数据，备转码器在主转码器宕机的情况下继续对这些未转码的数据进行转码，可以实现无缝迁移，因此接收端不会出现卡顿和黑屏现象，具有更高的可靠性。

在一个实施例中，如图3所示，提供了备转码器更详细的结构图，所述备转码器包括解码器、第一编码器和第二编码器；在图3所示的结构图中还包含了存储器用于缓存输入视频。需说明的是，该存储器可以位于备转码器之外，例如主转码器和备转码器的公共存储器；另外，对于存储器而言，缓存的输入视频可以是原始视频，也可以是经过解码器解码后的视频；前者由于未预解码会更节省能源，后者有预解码因此后续切换更快，可以根据实际需求选择这两种方式中的任意方式缓存视频。

所述备转码器依据所述转码位置信息对缓存的输入视频进行转码包括：

所述解码器依据所述位置信息对缓存的输入视频进行解码后将缓存解码数据发往所述第一编码器，所述第一编码器对所述缓存解码数据进行编码；

所述解码器还用于将获得的新输入视频解码为新解码数据，将所述新解码数据发往所述第二编码器，所述第二编码器对所述新解码数据进行编码；所述新输入视频为所述主转码器宕机后接收到的输入视频。

基于本实施例，第一编码器用于主转码器宕机导致的视频缺失的接续，第二编码器用于新输入视频的编码，在第一编码器完成编码后第二编码器的输出视频接续第一编码器的输出；备解码器包含的两个编码器分别独立编码；如图4所示为视频数据的接续示意图。

如图4中，最上一行前两格假定为输入视频，其中分隔位置为转码位置信息对应的视频帧，那么第一段输入视频由主转码器转码，第二段输入视频由备转码器转码，其中第二段视频具体由备转码器的解码器解码后经第一编码器编码得到相应的输出视频；新输入视频则由备转码器转码，具体由备转码器的解码器解码后经第二编码器编码得到相应的输出视频。最后输出的三段视频可以无缝接续在一起。

在一个实施例中，第一编码器用于主转码器宕机导致的视频缺失的接续，第二编码器用于新输入视频的编码；为了适于不同编码器的需求，本申请实施例可以采用如下方案：所述第一编码器的编码时延低于所述第二编码器的编码时延；所述第二编码器的编码质量高于所述第一编码器的编码质量。

上述编码质量可以指算法相对复杂压缩性能或者图像编码质量。

其中第一编码器可以采用IPP帧模式编码，IPP帧模式编码是指码流中帧类型只有I帧和P帧，时延极小，压缩性能略弱。第二编码器可以采用IPB帧模式编码，IPB帧模式编码是指码流中帧类型有I帧、B帧及P帧，该IPB帧模式编码时延略大，编码复杂度较大，压缩性能更高。

其中，I帧又称帧内编码帧，是一种自带全部信息的独立帧，无需参考其他图像便可独立进行解码，可以简单理解为一张静态画面。视频序列中的第一个帧始终都是I帧，因为它是关键帧。

P帧又称帧间预测编码帧，需要参考前面的I帧才能进行编码。表示的是当前帧画面与前一帧(前一帧可能是I帧也可能是P帧)的差别。解码时需要用之前缓存的画面叠加上本帧定义的差别，生成最终画面。与I帧相比，P帧通常占用更少的数据位，但不足是，由于P帧对前面的P和I参考帧有着复杂的依耐性，因此对传输错误非常敏感。

B帧又称双向预测编码帧，也就是B帧记录的是本帧与前后帧的差别。也就是说要解码B帧，不仅要取得之前的缓存画面，还要解码之后的画面，通过前后画面的与本帧数据的叠加取得最终的画面。B帧压缩率高，但是对解码性能要求较高。

在一个实施例中，由于第二编码器编码效率更高，使用B帧，该B帧需要前后的P帧才能正确解码，因此本申请实施例还提供了视频帧打包的实现方案：所述第二编码器的编码结果包含B帧；所述第二编码器还用于对所述缓存输入视频最后一个非B帧位置的视频帧进行编码得到能被连续解码的画面组，将所述画面组缓存；

将所述画面组打包发往输出缓存，然后打包对新解码数据编码得到的视频帧的第一个I帧或P帧发往所述输出缓存。

在本实施例中，第二编码器使用B帧可以提高编码效率，在打包时打包了前面一个P帧的画面组，因此在视频接收端解码时可以正确地连续解码，从而实现了不同编码质量的视频无缝拼接。

在一个实施例中，还提供了避免第一编码器和第二编码器同步编码可能导致的编码结果冲突的方案：所述第一编码器还用于将所述第一编码器编码获得的视频帧发往输出缓存；所述第二编码器还用于将所述第二编码器编码获得的视频帧发往缓冲区；

在所述第一编码器编码结束后，按照先入先出的顺序将所述缓冲区内的视频帧发往所述输出缓存。

本实施例将第二编码器获得的视频帧先发往缓冲区，而不是直接发往输出缓存，因此采用异步方式避免了第一编码器和第二编码器分别获得的视频帧在输出缓存冲突，导致丢帧的问题；相应地也避免了在接收端出现显示花屏的问题。

在一个实施例中，还提供了缓存输入视频的具体实现方式，所述备转码器缓存所述输入视频包括：

所述备转码器通过先进先出的队列以视频帧为单位存储所述输入视频流，在所述队列满时丢弃先进入所述队列的视频帧。

如图5所示为先进先出缓存队列的示意图，假定每个矩形格对应一个帧的存储空间，矩形格内的序号为帧序号；第一行示意为空队列开始缓存，第二行为队列刚好存满，第三行为队列满后继续存储，丢弃了帧序号为1的视频帧。该队列总共可以存储N个视频帧。这里的N可以任意设定，本申请实施例对此不作唯一性限定。

在一个实施例中，还提供了转码位置信息的具体可选参数：所述备转码器获得所述主转码器的转码位置信息包括：

所述备转码器接收由监控设备反馈的所述主转码器生成的最后一个视频帧的哈希信息和帧序号、最后一个音频帧序号，以及最后一个数据包包号。

在一个实施例中，由于转码位置信息可能获取失败，本实施例提供了此种情况下的解决方案，具体如下：

在获取所述转码位置信息失败的情况下，或者，在所述转码位置信息未成功确定所述主转码器宕机时正确转码的位置的情况下，所述备转码器从所述缓存的起始位置开始对输入视频进行转码获得输出视频发往所述接收设备。

如图5所示，假定在帧序号为N-4的视频帧主转码器宕机了，那么备转码器需要继续转码，那么需要获知“N-4”这个帧序号；视频通常会有相应的声音，图像帧与音频帧是对应的，相应地要获得音频帧序号；另外，编码结果会发送出去，发送方式通常是以数据包形式发送的，还需获得数据包的包号。由此，备转码器就知道从哪一个视频帧开始继续转码，对应的音频帧号是哪一个，发送时如何对数据包进行编号。

本申请实施例还提供了一种视频转码方法，该方法可以由计算设备执行。该方法的具体流程可参考前一实施例中视频转码系统的说明，如图2所示，该方法包括：

201：将输入视频发往主转码器和备转码器，使所述主转码器对所述输入视频进行转码，使所述备转码器缓存所述输入视频；

特别地，本实施例提供的方法的执行主体可以是具有转码控制功能的硬件，如计算设备，也可以是具有转码控制功能的软件或者虚拟设备。如果采用硬转码，那么上述主转码器和备转码器可以是相互独立的硬件；如果使用软转码，那么上述主转码器和备转码器可以分别对应到一个转码进程，或者虚拟的转码器。对此本申请实施例不作唯一性限定。

202：在所述主转码器宕机的情况下，获得所述主转码器的转码位置信息；

以上转码位置信息是用于定位主转码器宕机时转码的位置，这样备转码器继续转码则可以接续到已发送的视频；由于转码通常是以帧为单位的，因此这里的转码位置信息可以包含宕机时主转码器转码的帧序号，另外相应地转码位置还会对应有已发送的数据包的序号等信息。

在一个实施例中，所述获得所述主转码器的转码位置信息包括：

获得所述主转码器生成的最后一个视频帧的哈希信息和帧序号、最后一个音频帧序号，以及最后一个数据包包号。

203：向所述备转码器发送所述转码位置信息，控制所述备转码器依据所述转码位置信息对缓存的输入视频进行转码。

在一个实施例中，还提供了缓存的输入视频和新输入视频分别独立转码的实现方式，具体如下：所述控制所述备转码器依据所述转码位置信息对缓存的输入视频进行转码包括：

控制所述备解码器的第一编码器依据所述转码位置信息对缓存的输入视频进行转码；

所述方法还包括：

将新输入视频发往所述第二编码器，使所述第二编码器对所述新解码数据进行编码；所述新输入视频为所述主转码器宕机后接收到的输入视频。

基于本实施例，第一编码器用于主转码器宕机导致的视频缺失的接续，第二编码器用于新输入视频的编码，在第一编码器完成编码后第二编码器的输出视频接续第一编码器的输出；备解码器包含的两个编码器分别独立编码；如图4所示为视频数据的接续示意图。本实施例特别适应于硬解码和硬编码的应用场景。

在一个实施例中，为了适应于缓存的输入视频和新输入视频不同的转码需求，本实施例提供了如下方案：所述第一编码器的编码时延低于所述第二编码器的编码时延；所述第二编码器的编码质量高于所述第一编码器的编码质量。

在一个实施例中，由于第二编码器编码效率更高，使用B帧，该B帧需要前后的P帧才能正确解码，因此本申请实施例还提供了视频帧打包的实现方案：所述第二编码器的编码结果包含B帧；使用所述第二编码器对所述缓存输入视频最后一个非B帧位置的视频帧进行编码得到能被连续解码的画面组，将所述画面组缓存；

在一个实施例中，还提供了避免第一编码器和第二编码器同步编码可能导致的编码结果冲突的方案，即所述方法还包括：

将所述第一编码器编码获得的视频帧发往输出缓存；将所述第二编码器编码获得的视频帧发往缓冲区；

在一个实施例中，两个转码器可以是对称设置的，即：主转码器和备转码器结构相同，以当前执行转码的转码器作为主转码器，另一转码器作为备转码器，那么所述方法还包括：

在所述主转码器宕机后将所述备转码器设置为主转码器，将已宕机的主转码器设置为备转码器，重启已宕机的所述主转码器。

基于前文说明，本申请实施例可以创建两路编码，一路为主编码，另一路为备编码，主编码宕机后，切换到备编码。主编码可以包含一个解码器和一个编码器，其中的解码器用于上传流的解码，并给编码器输入视频源，编码器采用IPB帧模式编码；而另一路备编码过程可以包括一个解码器和两个编码器，其中，两个编码器中一个为低时延的IPP帧模式编码，另一个为高质量的IPB帧模式编码。备编码和主编码同步获取上传流，解码器解码后缓存一定解码图像，备编码的两个编码器创建后并不编码，当主编码宕机后才开始编码；然后将码流拼接在一起，实现主编码宕机后直播码流的无缝衔接。

在一个实施例中，由于转码位置信息可能获取失败，本实施例提供了此种情况下的解决方案，即所述方法还包括：

在获取所述转码位置信息失败的情况下，或者，在所述转码位置信息未成功确定所述主转码器宕机时正确转码的位置的情况下，控制所述备转码器从所述缓存的起始位置开始对输入视频进行转码获得输出视频发往所述接收设备。

图6为本申请实施例提供的视频转码方法的流程示意图。如图6所示，该方法包括如下步骤：

上传流同步发往主转码器和备转码器；其中主转码器会执行转码，备转码器仅缓存一定数量的上传流，缓存方式可以参考图5所示的缓存队列。

步骤601：代理(proxy)从主转码器拉视频流，发现主转码器断流，那么proxy获取断流状态后，代理向备转码器拉视频流。

上述代理可以是与接收设备之间的接口功能模块。代理可以在拉视频流(简称“拉流”)时将转码位置信息发送给备转码器。

步骤602：备转码器在收到proxy的拉流请求后，执行两部分操作：

A、低时延拉流：

将缓存(buffer)中的缓存图像帧放到低时延的编码器中编码，同时可以启动高质量的编码器，将新视频帧发往高质量的编码器；

在以上A部分中，低时延的编码器可以近0时延的出流，高质量编码缓存新的视频帧并初始化；低时延的编码器出流耗尽时，高质量的编码器的初始化已经完成故可以继续出流。

B、高质量拉流：

在低时延的编码器出流耗尽时，低时延的编码器停机，高质量的编码器继续编码出流，直至备拉流结束。

在以上流程中，依靠低时延的编码器来抵消高质量编码器的前处理时延，完成主备无缝切换的0时延过渡。

以大型直播系统的视频转码为例，如图7所示，为系统架构示意图，包括：主机(master)，其下的主转码服务器(Main transcoding server)、备转码服务器(Backup transcoding server)；主代理(Main proxy)、备代理(Backup proxy)、数据中心(Data Center，DC)，其中数据中心可以有多个，在图7中示意了DC0和DC1两个。其中备转码服务器和主转码服务器分别对应到前文中的备转码器和主转码器。

源码(source)即原始的视频帧的数据，对应到前文中的上传流；源码经主转码服务器或备转码服务器转码后被主代理或备代理拉流发往数据中心，数据中心的视频流可以发往接收设备。

以上视频直播系统在开始直播前会初始化，在完成初始化之后，转码机器分成主转码服务器和备份转码服务器，它们都会从视频源服务器拉取视频数据(即源码)。其中主转码服务器处于转码输出流的状态，备转码器对输入流可以只解码不编码，在备份转码服务器内部可以维护一个先入先出队列，对输入的视频和音频数据缓存一定的视频帧和音频帧。主转码服务器在打包输出的时候可以在数据包中插入原始视频帧解码YUV(一种颜色编码方法)对应的哈希(hash)信息。其中先入先出队列的数量可以有多个，分别缓存对等网络(peer to peer，P2P)包头，音频数据包以及解码之后的视频帧。P2P包头、音频数据包与视频帧之间具有对应关系，在时间上相关联。

具体流程如下：

在Proxy启动之后，由DC触发proxy拉流；DC触发proxy拉流时，如果proxy处于未初始化的状态，proxy从master查询视频直播的状态信息，执行自身的初始化操作。

Proxy分成主proxy和备proxy，如果有直播用户开始观看视频流，DC便朝proxy拉流，proxy向主转码服务器拉流，与主转码服务器之间维持心跳连接。如果心跳连接超时，并且proxy拉取不到视频流，那么proxy可以记录收到的最后一个数据包中的hash信息，确定最后一个视频帧序号，最后一个音频帧序号，最后一个数据包包号，并把这些信息发送给备转码服务器。

备转码服务器在收到proxy发送的信息之后，利用其中的hash信息在子线程中的缓存中寻找到对应的视频帧，备转码服务器的主线程开始启动对新视频流的编码，子线程找到对应视频帧之后，使用低时延模式编码缓存内的视频帧；在输出时优先打包输出低时延的帧对应的数据包，然后输出正常编码帧对应的数据包。

基于以上流程，主转码服务器宕机后，DC拉流从主转码服务器切换到备份转码服务器，直播的视频流是连续的，因此用户看到的画面和听到的声音都是连续的。

在以上直播系统中代理(Proxy)的功能是代理网络用户去取得网络信息，它是网络信息的中转站。

如图6所示，本申请实施例提供的技术方案主要包含：双路转码设计、主备切换、以及码流拼接3个部分，以下实施例将分别就这三个方面进行说明。

(1)双路编码设计：

两路转码分别对应主转码和备转码，其中主转码由主转码器完成，备转码由备转码器完成，其中主转码和备转码可以是硬转码也可以是软转码，如果是软转码后续实施例中的转码器所包含的编码器和解码器都可以由相应功能的进程或子进程实现，后续实施例将不再赘述。

主转码器包含一个解码器和一个编码器，其中的解码器用于对上传流解码，将解码结果作为编码器的输入视频源，编码器对来自解码器的视频源采用IPB帧模式编码；

备编码器包含一个解码器和两个编码器，其中，解码器用于与主转码器同步拉流获得上传流；缓存上传流的一定数量的视频帧；如果主转码器宕机，那么备编码器对缓存的视频帧进行解码，将解码结果传递给其中一个编码器，该编码器采用低时延的IPP帧模式编码，同时解码器还拉取新视频帧，在解码后发送给另一个采用高质量的IPB帧模式编码的解码器。

(2)主备切换：

基于前文介绍，一旦主转码器宕机，会立即启动备转码器进行转码，可以将备转码器作为主转码器，然后重启已经宕机的主转码器，并将重启的主转码器作为备转码器以备下次切换。

由于在主转码器中采用是IPB帧模式编码，为了进一步提高压缩率，一般会通过提前量(lookahead)做一些前处理，因此真正编码过程会延迟几十帧，延迟的帧数由lookahead的长度决定，因此在主转码器宕机时，还会存在几十帧的数据没有编码。因此，启动备转码器时，可以同时启动2个编码器，即低时延的IPP帧模式编码和高质量的IPB帧模式编码。

不管是主转码器还是备转码器，在对上传流的视频帧解码后，均可以计算每视频帧的hash值并记录下来。主转码器只需记录最后一帧，备转码器可以记录最新的N个图像帧，如图5所示，其中N大于lookahead的长度，缓存最新的N帧解码的YUV数据。使用如图5所示的先进先出队列可以保持缓存内的视频帧保持更新，并与视频帧的hash值对应。但主转码器宕机时，备转码器内缓存的视频帧可以不必继续更新。

当启动备转码器时，备转码器所包含的两个编码器同时开始编码。按下列方式操作。

低时延编码器：如图4中所示的第一编码器，只编码从主转码器宕机时，缓存内的YUV数据，以无时延的方式快速编码，通过hash值来判断缓存内从哪一个视频帧开始编码，hash值的作用就是定位。对缓存内的YUV数据编码完成后，关闭该低时延编码器。低时延编码可以使用x265实现，不产生B帧，编码器送入YUV数据后会立刻输出视频帧的数据，中间没有预处理过程。由于此时低时延编码处理的帧比较少，这里I帧间隔不需要调节太大，同时由于低时延编码效率比较低，此时输出码率也不需调节过高，所以输出的视频帧的画面质量相对较差。由于缓存的待处理视频帧不多，proxy切换的时间也比较短，因此低时延编码不会处理太多的视频帧，在主转码器宕机后用户看到画面质量变差的时间会很短，并且图像声音是连续的，随后图像质量恢复正常。

高质量编码器：如图4中所示的第二编码器，和原先主转码器中的编码器的配置可以一样，只编码新视频帧解码后的YUV图像，并一直编码下去。

这样，整个上传流都经过了转码，转码后的码流是个连续过程，没有帧丢失，也没有峰值码流突变。

(3)码流拼接：

该部分主要是将原主转码器生成的视频流、备转码器中低时延编码器生成的视频流以及高质量编码器生成的视频流拼接成一个完整的视频流。如图8所示，在原主转码器宕机前会有第一段主转码器的视频流，备转码器的低时延编码器从主转码器宕机时图像帧的帧序号开始编码获得低时延的IPP的图像帧，高质量编码器对新视频帧进行编码得到IPB的图像帧，依次衔接。

码流拼接依赖于图像帧的打包，本申请实施例还提供了图像帧的具体打包方式。编码器打包方式可以分成两类，即：低时延编码器输出的打包和保证B帧输出无缝衔接的主备机编码器打包方式。分别对应到前文中IPP的图像帧打包和IPB的图像帧的打包。

一、低时延编码的打包：

低时延编码的输出打包参考图9所示，编码器输出的视频数据如图9上面一行左侧I帧前面的部分(最左边的连续的P帧)。首先编码器输出的视频数据按照视频应用的私有协议加上协议头(header)的私有数据头，获得对应编码输出的原始YUV的哈希(hash)信息，目前使用的是消息摘要算法第五版(message digest algorithm MD5，MD5)hash，把这个hash数据放在了整个单帧数据包的结尾。这样每一帧视频数据单独打包发往输出缓存。输出缓存是用来缓存待发送数据的缓存。

低时延编码没有B帧编码，每一个帧无论是I帧还是P帧编码打包都按照上面的方式来操作。这样就可以保证proxy发送断流的位置之后，备转码器总是可以找到下一个视频帧。而且主转码器和备转码器都是按照原始流解码之后的数据进行hash，所以相同的视频帧对应的hash值一定相同。

二、高质量编码包含B帧的打包方式：

由于编码器的B帧编码会导致图像的编码顺序和图像的显示顺序，即图像序列(picture order count，POC)不一致，主编码器宕机位置在B帧编码的时候如果采用单帧打包方式会导致输出画面紊乱。因此主编码器输出的视频流没有办法和备编编码器的输出流合并在一起。

本实施例提供的解决方案是：在打包时缓存可以连续解码的画面组(group of pictures，GOP)，该GOP在x265中叫做迷你GOP(mini-GOP)。打包的示意图如图10所示，其中添加了虚线框代表这几帧数据要一起处理好之后整体一起发往输出缓存。当遇到编码器输出I帧时，把缓存中的mini-GOP的视频帧一起打包，然后再把单独的I帧打包；遇到编码器输出P帧时，也把缓存中的mini-GOP的视频帧一起打包，然后把单独的P帧打包。这样每一个整体的输出都可以作为一个单独的解码序列。在本实施例中，编码器输出的连续B帧可以设置得小一些，提高编码打包效率。

具体到某一个虚线框内视频帧打包时，首先会获得mini-GOP的第一个非B帧的视频hash信息(每个mini-GOP的第一个视频帧一定是一个非B帧)，虚线框内部每一个视频帧打包的时候先按照视频应用的私有协议加上对应的私有协议头，非B帧直接把自己的hash信息放在包的末尾，B帧复制一份mini-GOP开头非B帧的hash信息也放在自己包的末尾。

为了保证编码器输出P帧时，上一个mini-GOP能够形成一个可解码的视频序列，可以关闭编码器的开放GOP(Open-GOP)的功能。另外，为了使编码器输出的码流可以让用户随机接入，可以开启重复头(repeat-header)在每个关键帧输出的时候整合H.264中的图像参数集(picture paramater set，PPS)，序列参数集(sequence paramater set，SPS)数据包。

上面的打包方式就可以保证proxy每次断流的时候总是会断在虚线框的位置，这样知道mini-GOP的第一个非B帧的hash信息(这一帧恰好是mini-GOP播放顺序的最后一帧)，就可以在转码备机把视频流连接起来。

具体如果在转码的过程中知道输出的帧是I/P/B帧，知道对应的输入YUV的hash信息，修改ffmpeg(快进动态图像专家组，fast forward moving picture experts group，是一种可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序)的代码，添加对应的和x265连接的相关接口即可。

在前述实施例的备机切换的策略中，主转码器宕机之后，需要切换到备转码器。备转码器为了能实现和主转码器断流后无缝拼接，备转码器在断流之前需要完成一些初始化工作，具体补充说明如下：

启动备转码器成功之后，立刻初始化备转码器的两个编码器，一个编码器在主线程初始化，设置高质量编码的编码参数，另一个编码器在子线程初始化，设置成低时延的编码参数。子线程自动进入等待状态。

备转码器可以维护三个先入先出(first input first output，FIFO)队列，分别缓存一定数目的P2P包头，音频数据包，解码之后的YUV视频数据包。

这些初始化工作完成之后，备转码器状态稳定，一旦收到拉流请求，立刻转变成备转码器转码的状态，主要执行的内容包括如下两个部分：

第一部分：寻找切换后起始编码的视频帧：

Proxy朝备转码器拉流会发送hash信息，需要从缓存YUV视频数据包的FIFO中寻找对应的视频帧。备转码器在缓存中对比hash值，找到相同的hash值的YUV帧，从相同的hash值的下一帧开始启动低时延编码，新来的视频帧在解码之后的原始YUV不再向缓存YUV视频数据包的FIFO中存储，而是直接送给高质量的编码器。此时开始两个编码器并发编码。

如图11所示：包含主编码器宕机前主编码器的编码输出(output)，即从x到y之前的视频帧；在Proxy输入目标框架(target frame)告知FIFO中对应的视频帧y后，开始低时延视频编码(low-latency video encoder)并输出，新的视频输入(input)后，使用高质量编码，即普通视频编码(normal video encoder)。

第二部分：低时延编码直接输出，高质量编码输出在缓冲区：

在备转码器内两个编码器并发编码时，两个编码器处于不同的线程。低时延编码输出如上图9或10的前面未被虚线框框住的部分(全部为P帧)，此部分编码输出会直接发往输出缓存中。由于高质量的编码器编码的输出需要等到低时延的编码器编码结束之后才能真正的输出，所以暂时放在一个缓冲区(buffer)缓存起来。低时延编码器编码结束之后，高质量的编码器开始按照一定的速度将buffer缓存中的视频帧发往输出缓存，继续编码新输入的视频帧。

实际应用中，使用单线程控制，把buffer输出到输出缓存并继续编码，接收端的视频有一定概率出现花屏。这是由于buffer中的数据量有可能比较多，可能会使高质量的编码器出现阻塞，输出的视频帧可能会丢帧。

本实施例使用异步buffer输出，也就是高质量的编码器的输出采用异步输出策略；高质量的编码器正常编码，将编码的结果放在buffer缓存中，在子线程中按照一定的速度从buffer缓存中取数据，然后把取到的视频帧发往输出缓存。采用本实施例的方案，接收端的视频不会出现花屏的现象。

如图12所示，第一行为主转码器转码结果，使用高质量IPB帧模式编码，其中在第一行第二个虚线框(mini-GOP)之前主转码器发生宕机，备转码器(backup transcode machine)开始工作，第二行虚线框前的部分是低时延的编码器编码；第二行虚线框中的部分是高质量编码器编码。获得mini-GOP的哈希信息，传递到备转码器，备转码器在打包时会使用该mini-GOP和哈希信息，具体参考前文打包的说明，在此不再赘述。

参见图13，图13是本申请另一实施例提供的一种视频转码装置的示意框图。如图13所示的本实施例中的视频转码装置可以包括：一个或多个处理器1301；一个或多个输入设备1302，一个或多个输出设备1303和存储器1304。上述处理器1301、输入设备1302、输出设备1303和存储器1304通过总线1305连接。存储器1302用于存储计算机程序，该计算机程序包括程序指令，处理器1301用于执行存储器1302存储的程序指令。其中，处理器1301被配置用于调用该程序指令执行以下操作：

应当理解，在本申请实施例中，所称处理器1301可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备1302可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等，输出设备1303可以包括显示器(LCD等)、扬声器等。

该存储器1304可以包括只读存储器和随机存取存储器，并向处理器1301提供指令和数据。存储器1304的一部分还可以包括非易失性随机存取存储器。例如，存储器1304还可以存储设备类型的信息。

具体实现中，本申请实施例中所描述的处理器1301、输入设备1302、输出设备1303可执行本申请任一实施例提供的视频转码方法，在此不再赘述。

本实施例中的处理器1301可以执行前述方法实施例的方法流程。如果编码器和解码器均为软编码器和解码器，那么以上编码器和解码器的功能由程序指令被处理器1301执行实现。

基于前文说明本申请实施例还提供了一种视频转码装置，包括存储器和处理器，所述存储器用于存储程序指令，所述程序指令适于由所述处理器加载；

基于前文说明本申请实施例还提供了一种存储介质，所述存储介质中存储有多条程序指令，所述程序指令适于由处理器加载并执行如本申请实施例提供的任一项所述视频转码方法。

基于前文说明本申请实施例还提供了一种计算机程序产品，所述计算机程序产品包含多条程序指令，所述程序指令适于由处理器加载并执行如本申请实施例提供的任一项所述视频转码方法。

基于以上实施例，使用主转码器和备转码器配合，由于主转码器在对输入视频数据进行转码过程中会存在一定数量的未转码的数据，备转码器在主转码器宕机的情况下继续对这些未转码的数据进行转码，可以实现无缝迁移，因此接收端不会出现卡顿和黑屏现象，具有更高的可靠性。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的通信装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时，全部或部分地产生按照本申请实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中，或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，数字通用光盘(digital versatile disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，该流程可以由计算机程序来指令相关的硬件完成，该程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法实施例的流程。而前述的存储介质包括：只读存储器(read-only memory，ROM)或随机存储存储器(random access memory，RAM)、磁碟或者光盘等各种可存储程序代码的介质。

Claims

一种视频转码系统，包括：

主转码器和备转码器；

所述主转码器获得输入视频，对所述输入视频进行转码，将转码后的视频发往接收设备；

所述备转码器获得所述输入视频并缓存所述输入视频，在所述主转码器宕机的情况下获得所述主转码器的转码位置信息，依据所述转码位置信息对缓存的输入视频进行转码获得输出视频，将所述输出视频发往所述接收设备。
根据权利要求1所述视频转码系统，所述备转码器包括解码器、第一编码器和第二编码器；

所述解码器依据所述转码位置信息对缓存的输入视频进行解码后得到缓存解码数据，将所述缓存解码数据发往所述第一编码器；

所述第一编码器接收所述缓存解码数据并对所述缓存解码数据进行编码；

所述解码器还用于将获得的新输入视频解码为新解码数据，将所述新解码数据发往所述第二编码器，所述新输入视频为所述主转码器宕机后接收到的输入视频；

所述第二编码器接收所述新解码数据并对所述新解码数据进行编码。
根据权利要求2所述视频转码系统，所述第一编码器的编码时延低于所述第二编码器的编码时延；所述第二编码器的编码质量高于所述第一编码器的编码质量。
根据权利要求2所述视频转码系统，所述第二编码器的编码结果包含B帧；

所述第二编码器还用于对所述缓存的输入视频最后一个非B帧位置的视频帧进行编码得到能被连续解码的画面组，将所述画面组缓存；

将所述画面组打包发往输出缓存，然后打包对所述新解码数据编码得到的视频帧的第一个I帧或P帧发往所述输出缓存。
根据权利要求2所述视频转码系统，

所述第一编码器还用于将所述第一编码器编码获得的视频帧发往输出缓存；

所述第二编码器还用于将所述第二编码器编码获得的视频帧发往缓冲区，以便在所述第一编码器编码结束后，按照先入先出的顺序将所述缓冲区内的视频帧发往所述输出缓存。
根据权利要求1至5任意一项所述视频转码系统，

所述备转码器通过先进先出的队列以视频帧为单位存储所述输入视频，在所述队列满时丢弃先进入所述队列的视频帧。
一种视频转码方法，由计算设备执行，包括：

将输入视频发往主转码器和备转码器，控制所述主转码器对所述输入视频进行转码并将转码后的视频发往接收设备，控制所述备转码器缓存所述输入视频；

在所述主转码器宕机的情况下，获得所述主转码器的转码位置信息；

向所述备转码器发送所述转码位置信息，控制所述备转码器依据所述转码位置信息对缓存的输入视频进行转码获得输出视频，将所述输出视频发往所述接收设备。
根据权利要求7所述方法，所述控制所述备转码器依据所述转码位置信息对缓存的输入视频进行转码包括：

控制所述备转码器的解码器依据所述转码位置信息对缓存的输入视频进行解码后得到缓存解码数据，将所述缓存解码数据发往所述备转码器的第一编码器；

控制所述备转码器的第一编码器依据所述转码位置信息对所述缓存解码数据进行编码；

所述方法还包括：

将新输入视频发往所述解码器，控制所述解码器将所述新输入视频解码为新解码数据，将所述新解码数据发往所述第二编码器，控制所述第二编码器对所述新解码数据进行编码；所述新输入视频为所述主转码器宕机后接收到的输入视频。
根据权利要求8所述方法，所述第一编码器的编码时延低于所述第二编码器的编码时延；所述第二编码器的编码质量高于所述第一编码器的编码质量。
根据权利要求8所述方法，所述第二编码器的编码结果包含B帧；

该方法还包括：

控制所述第二编码器对所述缓存的输入视频最后一个非B帧位置的视频帧进行编码得到能被连续解码的画面组，将所述画面组缓存；

将所述画面组打包发往输出缓存，然后打包对所述新解码数据编码得到的视频帧的第一个I帧或P帧发往所述输出缓存。
根据权利要求8所述方法，还包括：

将所述第一编码器编码获得的视频帧发往输出缓存；将所述第二编码器编码获得的视频帧发往缓冲区；

在所述第一编码器编码结束后，按照先入先出的顺序将所述缓冲区内的视频帧发往所述输出缓存。
根据权利要求7至11任意一项所述方法，还包括：

在所述主转码器宕机后将所述备转码器设置为主转码器，将已宕机的所述主转码器设置为备转码器，重启已宕机的所述主转码器。
一种视频转码装置，包括存储器和处理器，所述存储器用于存储程序指令，所述程序指令适于由所述处理器加载；

所述处理器，用于加载所述程序指令并执行如权利要求7至12任一项所述视频转码方法。
一种存储介质，所述存储介质中存储有多条程序指令，所述程序指令适于由处理器加载并执行如权利要求7至12任一项所述视频转码方法。