CN107959884A

CN107959884A - 一种单声道多音频流媒体文件的转码处理方法

Info

Publication number: CN107959884A
Application number: CN201711288740.XA
Authority: CN
Inventors: 唐杰; 马大江; 杨健
Original assignee: SHANGHAI WONDERTEK SOFTWARE CO Ltd
Current assignee: SHANGHAI WONDERTEK SOFTWARE CO Ltd
Priority date: 2017-12-07
Filing date: 2017-12-07
Publication date: 2018-04-24
Anticipated expiration: 2037-12-07
Also published as: CN107959884B

Abstract

一种单声道多音频流媒体文件的转码处理方法，包括步骤：读取媒体源文件，将所述媒体源文件分离成一个视频流和n个音频流，n大于等于2；根据语言标签信息对音频流进行分类并建立语言类别列表；构建声道合并原则，将同一种语言类别的多个单声道音频流进行合并，生成多个语言类别的多声道音频媒体文件；对视频流进行分辨、转码、并拼接转码后的视频片段，生成视频媒体文件；将视频媒体文件逐一与多个语言类别的多声道音频媒体文件进行合并，生成相对应语言类别的转码发布文件。该方法不需要采编人员参与，解放采编人员压力，避免引入人为错误，不生成中间媒体文件，直接使用源文件进入转码平台进行转码，降低单个媒体文件转码资源占用。

Description

一种单声道多音频流媒体文件的转码处理方法

技术领域

本发明涉及多媒体技术领域，具体涉及一种单声道多音频流媒体文件的转码处理方法。

背景技术

随着互联网视频业务的快速发展，在线影片点播逐步进入大众视野，以前必须进入电影院或者购买碟片的电影内容，现在使用手机APP软件就可以直接欣赏观看。为了高效的利用多媒体文件资源，适应移动平台的观看需求，需要将各种编码格式及类型影片转化为压缩效率更高的H.264、AAC等标准，转码系统成为了视频平台的重要组件。

影片媒体文件格式多种多样，其中很重要的一类就是多语言格式的原始影片资源，其典型结构如图1所示，包含1个视频流和n个音频流，n个音频流均为单声道音频，n个音频流按照标签分组，同一种标签的音频流属于同一种语言，同一种标签的不同音频流表示该语言的不同声道。与普通的1个视频流和1个音频流的媒体文件相比，此类型的媒体文件增加了音频流数量，且每个音频流均为单声道。如图1所示，“English”标签包含了两个音频流，分别表示左声道和右声道。目前，针对这种类型的视频，一般先经过采编人员处理，使用编辑软件首先将视频文件处理，合并音频流，分离多语言，生成多个不同语言的视频文件，然后将多个视频送入转码平台，分别转码发布，处理流程如图2所示。

现有的处理方法存在不足之处，一是影片视频数据被转码多次，极大的浪费了转码系统计算能力；二是所有的影片需手动编辑，编辑软件只能线性处理音频，同一个影片需要处理多次，极大的延长了影片发布时间；三是在处理过程中，容易引入人为操作错误，造成转码输出后音频错误的情况。

发明内容

本申请提供一种单声道多音频流媒体文件的转码处理方法，包括步骤：

读取媒体源文件，将所述媒体源文件分离成视频流和音频流；

根据语言标签信息对所述音频流进行分类并建立语言类别列表；

构建声道合并原则，将同一种语言类别的多个单声道音频流进行合并，生成多个语言类别的多声道音频媒体文件；

对视频流进行分辨、转码、并拼接转码后的视频片段，生成视频媒体文件；

将视频媒体文件逐一与一种语言类别的音频媒体文件进行合并，生成该语言类别的转码发布文件。

一种实施例中，根据语言标签信息对音频流进行分类并建议语言类别列表之前，还包括步骤：

获取每个音频流的语言标签信息；

将语言标签信息一致的音频流归属为同一种语言的不同声道，并记录该音频流的流序号。

一种实施例中，根据语言标签信息对音频流进行分类并建立语言类别列表，具体包括步骤：

读取音频流数量，并根据语言标签信息初始化语言类别列表；

读取音频流的语言类别及流序号，判断音频流的语言类别是否存在语言类别列表内，若存在，将音频流的流序号加入语言类别列表内，否则，将音频流的语言类别添加至语言类别列表内，并将流序号添加至对应的语言类别列表内。

一种实施例中，合并原则具体为：

若对明确标示有左右声道的两个单声道音频流进行合并，则合并后，左右声道顺序不变；

若对非明确标示有左右声道的两个单声道音频流进行合并，则合并后，默认为第一个音频流为合并后的左声道，第二个音频流为合并后的右声道。

一种实施例中，将同一种语言类别的多个单声道音频流进行合并，具体为：

对单声道音频流进行解码；

对解码的单声道音频流时行重新采样；

合并重新采样的单声道音频流并转码输出一个多声道音频媒体文件。

依据上述实施例的转码处理方法，由于将生成的视频文件与多个音频文件逐一合并，最终生成多个不同语言的媒体文件，实现了单声道多音频流媒体文件的音频流合并处理，同时也实现了不同语言音频的分离，达到了在转码过程中处理此类型媒体文件的目的；相比于原有方法，新方法不需要采编人员参与，解放采编人员压力，避免引入人为错误，不生成中间媒体文件，直接使用源文件进入转码平台进行转码，且，转码自动识别并合并音频流，视频数据转码一次，降低单个媒体文件转码资源占用，降低媒体文件转码发布处理延时，构建更加高效的媒体文件转码系统。

附图说明

图1为媒体文件格式结构图；

图2为现有的多语言影片音视频处理流程图；

图3为本例的单声道多音频流媒体文件处理流程图；

图4为图3相对应的原理示意图；

图5为多个音频流合并示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

本例提供一种单声道多音频流媒体文件的转码处理方法，其流程图如图3所示，对应的原理图如图4所示，具体包括如下步骤。

S1：读取媒体源文件，将媒体源文件分离成视频流和音频流。

该媒体源文件包含一个视频流和n个音频流。其中n个音频流均为单声道音频，n个音频流按照语言标签信息分组，同一种语言标签信息的音频流属于同一种语言，同一种语言标签信息的不同音频流表示该语言的不同声道。

其中，语言标签信息可以指明该音频流的语言信息，比如英语(English)、中文(Mandarin)等。本例正是利用语言标签信息的这一特性，在进行步骤S2之前，先进行以下操作：

检测媒体源文件，获取每个音频流的相关信息，循环处理每个音频流信息，将语言标签信息一致的音频流归属为同一种语言的不同声道，并记录流序号，使，转码一种语言音频时使用同一种语言标签信息的音频序号数据流。

S2：根据语言标签信息对音频流进行分类并建立语言类别列表。

具体的，读取音频流数量，并根据语言标签信息初始化语言类别列表；

S3：构建声道合并原则，将同一种语言类别的多个单声道音频流进行合并，生成多个语言类别的多声道音频媒体文件。

媒体文件的音频数据在转码过程中可以实现多个音频流合并，具体的，是根据构建声道合并原则进行多个音频流合并，对于六声道和八声道的视频，采用对应的合并原则，其中，针对具有两具音频流的合并原则是：

假设检测出某一语言有两个音频流，其处理过程如图5所示，单声道音频流1和单声道音频流2经过解码后，对解码的音频重新采样，合并重新采样的单声道音频流，转码输出为一个多声道音频流媒体文件。且，在转码处理过程中，多种语言的转码并行处理，最终输出多个不同语言的多声道音频媒体文件。

S4：对视频流进行分辨、转码、并拼接转码后的视频片段，生成视频媒体文件。

本例采用媒体源文件的音视频独立转码，上述步骤S3是针对音频流进行转码生成多声道音频媒体文件，步骤S4是对视频流进行转码，视频流经过转码后，生成仅有视频流的媒体文件。

S5：将视频媒体文件逐一与多个语言类别的音频媒体文件进行合并，生成相对应语言类别的转码发布文件。

本步骤中，将生成的视频文件与多个音频文件逐一合并，最终生成多个不同语言的媒体文件。

通过上述步骤S1-S5实现了单声道多音频流媒体文件的音频流合并处理，同时也实现了不同语言音频的分离，达到了在转码过程中处理此类型媒体文件的目的。相比于原有方法，本例提供的方法不需要采编人员参与，不生成中间媒体文件，直接使用源文件进入转码平台进行转码，转码过程中，视频数据转码一次，降低单个媒体文件转码资源占用，降低媒体文件转码发布处理延时。

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

Claims

1.一种单声道多音频流媒体文件的转码处理方法，其特征在，包括步骤：

读取媒体源文件，将所述媒体源文件分离成一个视频流和n个音频流，n大于等于2；

对所述视频流进行分辨、转码、并拼接转码后的视频片段，生成视频媒体文件；

将所述视频媒体文件逐一与多个语言类别的多声道音频媒体文件进行合并，生成相对应语言类别的转码发布文件。

2.如权利要求1所述的转码处理方法，其特征在于，所述n个音频流按照语言标签信息分组，同一种语言标签信息的音频流属于同一种语言，同一种语言标签信息的不同音频流表示该语言的不同声道。

3.如权利要求2所述的转码处理方法，其特征在于，所述根据语言标签信息对音频流进行分类并建立语言类别列表，具体包括步骤：

读取所述音频流数量，并根据语言标签信息初始化语言类别列表；

读取所述音频流的语言类别及流序号，判断所述音频流的语言类别是否存在所述语言类别列表内，若存在，将所述音频流的流序号加入所述语言类别列表内，否则，将所述音频流的语言类别添加至所述语言类别列表内，并将所述流序号添加至对应的语言类别列表内。

4.如权利要求1所述的转码处理方法，其特征在于，所述合并原则具体为：

5.如权利要求4所述的转码处理方法，其特征在于，所述将同一种语言类别的多个单声道音频流进行合并，具体为：

对单声道音频流进行解码；

对解码的单声道音频流时行重新采样；