CN103796063B - 并行转码 - Google Patents

并行转码 Download PDF

Info

Publication number
CN103796063B
CN103796063B CN201310525247.0A CN201310525247A CN103796063B CN 103796063 B CN103796063 B CN 103796063B CN 201310525247 A CN201310525247 A CN 201310525247A CN 103796063 B CN103796063 B CN 103796063B
Authority
CN
China
Prior art keywords
inflow section
section
transcoding
random access
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310525247.0A
Other languages
English (en)
Other versions
CN103796063A (zh
Inventor
亚历山大·G·麦金尼斯
朱洪涛
詹森·赫里克
布赖恩·舍纳
李军林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Avago Technologies International Sales Pte Ltd
Original Assignee
Avago Technologies Fiber IP Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avago Technologies Fiber IP Singapore Pte Ltd filed Critical Avago Technologies Fiber IP Singapore Pte Ltd
Publication of CN103796063A publication Critical patent/CN103796063A/zh
Application granted granted Critical
Publication of CN103796063B publication Critical patent/CN103796063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及并行转码。公开了旨在并行对媒体文件转码的各种实施方式。可访问媒体文件,所述媒体文件包括表示一系列图片的比特流。识别在所述比特流中的第一随机接入点与在比特流中的第二随机接入点。生成比特流的输入区段,所述输入区段包括起始点,所述起始点为第一随机接入点。选择多个转码器中的一个,以对所述输入区段转码,用于生成相应的输出区段,每个转码器被配置为同时并行进行操作。在存储器内存储所述输出区段。

Description

并行转码
背景技术
媒体项目(例如,电影、电视节目、音乐等)可以各种文件格式数字存储为媒体文件。播放这些媒体文件的媒体装置可被限制为由媒体装置支持的一组文件格式。例如,媒体装置不支持特定的格式,例如,高清晰度、高帧率、各种压缩格式等。为了在这样的装置内成功地播放媒体文件,需要对媒体文件转码。媒体装置可具有有限的存储容量,并且期望将媒体文件的代码转换成具有更小的文件尺寸的格式。通过对媒体文件进行转码,可将媒体文件从不支持的文件格式转换成支持的文件格式,并且可将媒体文件从更大的文件尺寸转换成更小的文件尺寸。
发明内容
根据本发明的一个方面,提供了一种系统,包括:存储器,用于存储媒体文件,所述媒体文件包括一系列图片;转码管理器,被配置为在所述一系列图片中识别一组随机接入点,所述转码管理器被配置为根据所述一组随机接入点将所述媒体文件分成输入区段;多个转码器装置,被配置为并行对所述输入区段转码,以生成相应的输出区段,所述转码管理器进一步被配置为将每个输入区段分配给所述多个转码器装置中的相应的一个;以及存储器,用于存储所述输出区段。
其中,每个输入区段包括开始图片和结束图片,每个输入区段的开始图片为相应的随机接入点。
其中,所述输入区段的第一输入区段包括后续随机接入点。
其中,所述输入区段的所述第一输入区段的所述结束图片为超过所述后续随机接入点的预定数量的图片。
其中,所述输入区段包括第一输入区段和第二输入区段,其中,所述第一输入区段与所述第二输入区段重叠。
其中,所述输出区段被配置为形成一系列连续的输出区段,以便在一系列的输出区段中每个输出区段与在相邻的输出区段不重叠。
其中,每个转码器装置包括编码器、像素处理器以及解码器,其中,所述像素处理器被配置为执行图片尺寸调节、格式变化、交错操作、解交错操作、噪声降低、颜色空间转换或图像增强中的至少一个。
其中,每个转码器装置被配置为向所述转码管理器指示转码进程。
其中,所述转码管理器至少基于所述多个转码器装置中的一个的转码进程,将一个输入区段分配给所述多个转码器装置中的一个。
根据本发明的另一个方面,提供了一种方法,包括;访问媒体文件,所述媒体文件包括表示一系列图片的比特流;识别所述比特流中的第一随机接入点和所述比特流中的第二随机接入点;生成所述比特流的输入区段,所述输入区段包括起始点,所述起始点为所述第一随机接入点,所述输入区段包括所述第二随机接入点;选择多个转码器装置中的一个,以对所述输入区段转码,用于生成相应的输出区段,每个转码器装置被配置为同时并行进行操作;以及在存储器内存储所述输出区段。
其中,所述输入区段进一步包括终点,其中,所述终点为超过所述第二随机接入点的预定数量的图片。
其中,所述输入区段为第一输入区段,其中,所述方法进一步包括生成所述比特流的第二输入区段,其中,所述第二输入区段的起始点为所述第二随机接入点。
其中,所述输入区段为第一输入区段,其中,所述方法进一步包括生成所述比特流的第二输入区段,其中,所述第一输入区段与所述第二输入区段重叠。
其中,所述多个转码器装置中的一个为第一转码器装置,其中,所述输入区段为第一输入区段,其中,所述输出区段为第一输出区段,其中,所述方法进一步包括从所述多个转码器装置中选择第二转码器装置,以对第二输入区段转码,用于生成相应的第二输出区段。
其中,所述第一输出区段与所述第二输出区段不重叠。
根据本发明的另一方面,提供了一种系统,包括:转码管理器,被配置为:从存储器中访问媒体文件,所述媒体文件包括一系列图片;在所述一系列图片中识别一组随机接入点;根据所述一组随机接入点分割所述媒体文件,以生成第一输入区段和第二输入区段;启动第一转码处理,以处理所述第一输入区段;以及启动第二转码处理,以处理所述第二输入区段,所述第一转码处理与所述第二转码处理被同时执行。
其中,所述第一转码处理基于所述第一输入区段生成第一输出区段,其中,所述第二转码处理基于所述第二输入区段生成第二输出区段。
其中,所述第一输入区段包括第一开始图片以及第一结束图片,所述第一开始图片包括所述一组随机接入点中的第一随机接入点,其中,所述第一输入区段包含所述一组随机接入点中的第二随机接入点。
其中,所述第一结束图片为超过所述第二随机接入点的至少一个图片。
其中,所述第二输入区段包括第二开始图片,所述第二开始图片包括第二随机接入点。
其中,所述第一输入区段与所述第二输入区段在显示时间上重叠。
附图说明
参照以下示图,可更好地理解本公开的多个方面。图中的元件不必按比例绘出,而是重点清晰地示出本公开的各原理。而且,在图中,相似的参考数字表示在这几幅图中的相应的部件。
图1为根据本公开的各种实施方式的转码系统的一个实例的示图;
图2为根据各种实施方式在图1的转码系统内的输入媒体文件的一个实例的示图;
图3为根据各种实施方式在图1的转码系统内的输入媒体文件的一个实例的示图;
图4为根据本公开的各种实施方式在图1的转码系统内实现的转码管理器的操作的一个实例的示图;
图5为根据本公开的各种实施方式的图1的转码系统的操作的一个实例的示图;
图6为根据本公开的各种实施方式的图1的转码系统的操作的一个实例的示图;
图7为根据本公开的各种实施方式示出作为图1的部分转码管理器实现的功能的实例的流程图;
图8为根据本公开的各种实施方式示出作为图1的部分转码管理器实现的功能的实例的流程图。
具体实施方式
本公开涉及对媒体文件转码,以生成经转码的媒体文件。媒体项目(例如,电视节目、电影、歌曲、有声读物等)可以各种格式或格式的组合存储为数字文件。例如,根据一个特定的标准,例如,文件格式、帧率、媒体质量或用于存储数字媒体文件的任何其他格式,可将媒体文件编码。以原始格式存储的媒体文件不适合于在特定的媒体装置中的显示(presentation),或者可能太大而不能存储在特定的媒体装置内,或者由于任何原因,期望减小媒体文件的尺寸。因此,需要进行格式转换,以修改媒体文件,以便使其在目标媒体装置中是可显示的或者减小媒体文件的尺寸,使其适合于存储在目标媒体装置内或者传输给目标媒体装置。完全转码可用于将文件从一种格式转换成另一个格式。完全转码包括将媒体文件完全解码为原始格式的原始文件,通过执行多个规定的操作来处理原始文件,并且将原始文件编码为目标文件。或者,可使用无需将媒体文件完全解码的转码。
本公开的各种实施方式旨在并行使用一组转码装置,以对媒体文件转码。可将媒体文件分成多个区段。可至少基于存在于媒体文件内的符号/信号来确定这些区段。可将每个区段分配给可用的转码装置,以生成相应的输出区段。输出区段可按顺序排列并且连接在一起,以形成经转码的媒体文件。而且,本公开的各种实施方式为每个并行转码器解决了管理编码器设置,从而有助于生成在质量上一致的输出文件。
移至图1,该图示出了根据本公开的各种实施方式的转码系统100的一个实例的示图。转码系统100可作为被配置为处理媒体文件的机顶盒(STB)或计算装置的至少一部分来实现。转码系统100包括源存储器112、目的地存储器118、转码管理器123、多个转码器装置134a-n以及多路复用器(mux)143。
源存储器112的非限制性实例为磁带、磁软盘、磁硬盘驱动器、存储卡、固态驱动器、USB闪存驱动器、光盘或随机存取存储器(RAM),所述随机存取存储器(RAM)包括静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM)或磁性随机存取存储器(MRAM)。此外,源存储器112可为只读存储器(ROM)、可编程只读存储器(PROM)、可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)或其他类型的存储装置。
源存储器112被配置为存储输入媒体文件115。输入媒体文件115可表示音频和/或视频程序,例如,电视节目、电影、歌曲、有声读物等。源存储器112可被实现为用于存储广播媒体的STB的一部分。为此,输入媒体文件115可为通过网络传输给STB的程序。
目的地存储器118可包括例如磁带、磁软盘、磁硬盘驱动器、存储卡、固态驱动器、USB闪存盘、光盘或随机存取存储器(RAM),所述随机存取存储器(RAM)包括静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM)或磁性随机存取存储器(MRAM)。此外,目的地存储器118还可为只读存储器(ROM)、可编程只读存储器(PROM)、可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)或其他类型的存储装置。
目的地存储器118被配置为存储输出媒体文件121。输出媒体文件121为输入媒体文件115的转码版本。为此,输出媒体文件121表示与输入媒体文件115相同的实质性内容。输出媒体文件121可表示输入媒体文件115的内容的子集。然而,输出媒体文件121以与输入媒体文件115的格式不同的格式被编码。输出媒体文件121的不同的格式可符合与输入媒体文件115相同的标准,同时具有不同的比特率或文件尺寸。目的地存储器118可被实现在与包括源存储器112的媒体装置分离的媒体装置内。例如,源存储器112可被实现为STB的一部分,而目的地存储器118可为远程媒体装置,例如,被配置为向用户呈现输出媒体文件121的计算装置。媒体装置可为例如膝上型电脑、台式电脑、笔记本、笔记型电脑、超极本、平板电脑、蜂窝电话、个人数字助理(PDA)、STB、数码照相机、携式媒体播放器或被配置为播放媒体文件的任何其他计算装置。或者,目的地存储器118可实现在与包括源存储器112的媒体装置相同的媒体装置内。
转码管理器123被配置为管理输入媒体文件115的转码。在各种实施方式中,转码管理器123被实现为微处理器的至少一部分。转码管理器123可包括一个或多个电路、一个或多个微处理器或其任意组合。在另外一些实施方式中,转码管理器123可包括在一个或多个处理电路内可执行的一个或多个软件模块。转码管理器123可进一步包括计算机可读介质。计算机可读介质可存储指令和/或代码,以使得转码管理器123在转码系统100内管理转码操作。
转码管理器123可检索输入媒体文件115并且使输入媒体文件115准备进行转码。例如,转码管理器123将输入媒体文件115处理为数字比特流,并且将比特流的区段分配给各转码器装置134a-n。例如,转码管理器123可将一个区段作为数据流发送给转码器装置134a-n,而无需指定在数据流中的区段长度或终点。在转码器装置134a-n即将完成转码处理或者已经完成转码处理时,转码器装置134a-n可指示转码管理器123停止馈送输入区段流。或者,转码管理器123可将输入区段作为数据流进行分配,同时指定默认的或标称长度/终点。转码管理器123还被配置为通过管理一个或多个转码器参数来监测每个转码器装置134a-n。
转码管理器123可被配置为启动一个或多个转码器处理,以用来对输入媒体文件115转码。可同时执行每个转码器处理,以并行处理部分输入媒体文件115。转码管理器123可被配置为通过利用一个或多个转码器装置134a-n来启动一个或多个转码处理。而且,转码管理器123可操作多路复用器143,用于使转码器装置134a-n的输出按顺序排列,以生成输出媒体文件121。
多路复用器143被配置为处理每个转码器装置134a-n的输出。多路复用器143还可组装每个输出,以生成输出媒体文件。然后,输出媒体文件121然后被写入目的地存储器118中。在各种实施方式中,多路复用器143通信地耦接至存储缓冲器,以将转码器装置输出存储为一个队列。
转码系统100包括多个转码器装置134a-n。每个转码器装置134a-n被配置为处理部分输入媒体文件115,以实现并行转码。转码器装置134a-n执行一个或多个转码器处理。在这方面,转码器装置134a-n可被配置为并行执行多个转码器处理,以同时对各种输入转码。每个转码器装置134a-n可为视频转码器或音频转码器。在各种实施方式中,每个转码器装置134a-n可被实现为微处理器的至少一部分。每个转码器装置134a-n可包括一个或多个电路、一个或多个微处理器或其任意组合。为此,各转码器装置134a-n可由一个电路和/或微处理器实现或者可由多个电路和/或微处理器实现,以便转码器装置134a-n的功能分布在一个或多个电路和/或一个或多个微处理器上。在另外一些实施方式中,每个转码器装置134a-n可包括在一个或多个处理电路内可执行的一个或多个软件模块。每个转码器装置134a-n可进一步包括计算机可读介质。计算机可读介质可存储使转码器装置134a-n转换部分输入媒体文件115的指令和/或代码。
每个转码器装置134a-n被配置为接收输入媒体文件115的区段,并且生成相应的输出区段。因此,输出区段为输入区段的转码版本。每个转码器装置134a-n包括相应的控制器149、相应的解码器153、相应的处理器156以及相应的编码器158。
用于每个转码器装置134a-n的控制器149在转码器装置134a-n和转码管理器123之间提供接口。例如,控制器149可允许启用或禁用转码器装置134a-n。控制器149可向转码管理器123指示转码器装置134a-n的转码进程(transcoding progress)。控制器149还可保持转码器装置134a-n的工作负荷队列,所述工作负荷队列指示计划由转码器装置134a-n执行的工作量。例如,转码进程可指示转码器是否忙碌。
每个转码器装置134a-n的解码器153被配置为将所接收的输入解码和/或解压缩为原始格式。例如,视频转码器134a-n的解码器153部分可将输入的媒体文件区段转换成原始像素数据。
每个转码器装置134a-n的处理器156被配置为处理解码器153的原始输出。对于视频转码器装置134a-n,处理器156为可执行像素处理功能的像素处理器。像素处理的非限制性实例为图片尺寸调节、交错/解交错、颜色空间转换、噪声降低以及图像增强。像素处理可包括改变格式。例如,格式改变可为高清晰度(HD)转换、标准清晰度(SD)转换、2-信道转换、解交错等。在处理器156接收到经解码的输入媒体文件区段并且处理输入媒体文件区段之后,处理器156将经处理的输入媒体文件区段发送给编码器158。
每个转码器装置134a-n的编码器158被配置为通过将经处理的输入媒体文件区段编码为目标格式来对经处理的输入媒体文件区段进行编码。对于视频转码器134a-n,编码器158根据量化参数(QP)159对每个经处理的输入媒体文件区段进行编码。根据输入区段的复杂程度,编码器158可调节QP159,以实现最佳输出。虽然每个转码器装置134a-n的编码器可动态地调节QP159,但是转码管理器123也可控制每个编码器158的QP159。例如,转码管理器12可将每个QP159初始化为初始值,用于控制每个编码器158的每个QP159的均一性。在各种实施方式中,转码管理器123可使得每个编码器158的QP159值在预定的QP范围内收敛。
接下来,在图2中,示出了根据各种实施方式在图1的转码系统100内的输入媒体文件115的一个实例的示图。图2描述了以可最终根据显示顺序进行排序的一系列图片表示的输入媒体文件115。图片在比特流中的顺序可与图片要被显示的顺序(其是用于特定的视频压缩标准的情况)不同。输入媒体文件115也可以比特流表示。在这方面,一系列比特构成了单个的图片。
输入媒体文件115包括多个图片201a-n、204a-n、207a-n。输入媒体文件115还包括随机接入点(RAP)231a-231c。RAP231a-c的每个RAP231a-c为具有使得能够开始解码的特性的图片。RAP列表231识别在输入媒体文件115的输入比特流内存在的RAP。
在各种实施方式中,从指示在作为被接收的并被存储在输入文件115中的流的流中RAP231a-c的位置的处理中,可获得RAP列表231。在可选的实施方式中,可由处理输入媒体文件115的转码系统100(图1)获得RAP列表231。例如,转码管理器123(图1)可被配置为解析输入媒体文件115的比特流,并且识别一组RAP231a-c。无论如何确定RAP列表231,转码管理器123都可使用RAP列表231来将输入媒体文件115分成几个区段,以有助于并行转码。
在各种实施方式中,RAP231a-c为I图片(内编码图片)。I图片为不需要其他图片以用来解码的完全指定的图片。即,I图片为独立的图片。参照图2,第一组图片201a-n以第一RAP231a开始,第二组图片204a-n以第二RAP231b开始,并且第三组图片207a-n以第三RAP231c开始。RAP可为具有使得能够从该图片开始解码的特性的任何图片。
在各种实施方式中,每组图片201a-n、204a-n、207a-n可包括相应的最后图片201n、204n、207n,其中,相应的最后图片为P图片(预测的图片)或B图片(双向预测的图片)。P图片和B图片为需要其他图片以用来解码的部分指定的图片。
转向图3,该图示出了根据各种实施方式在图1的转码系统内的输入媒体文件115的一个实例的示图。图3描述了以根据显示进行排序的一系列图片表示的输入媒体文件115。输入媒体文件115包括多个RAP231a-f。输入媒体文件还包括第一组图片312a-n、第二组图片315a-n、第三组图片318a-n、第四组图片321a-n和/或随后任何另外的图片组。此外,图3提供了将输入媒体文件115分成多个输入区段333a-c的一个非限制性实例。
转码管理器123(图1)可分析输入媒体文件115并且确定输入媒体文件115的RAP列表231(图2)。基于RAP231a-f的位置,转码管理器123可识别每个输入区段的起始点。每个输入区段333a-c在RAP231a、231d、231f上开始。例如,输入媒体文件115的第一RAP231a可向转码管理器123指示第一输入区段333a的起始点的生成。
转码管理器123可被配置为根据最佳长度生成每个输入区段333a-c。可通过图片数量、时间量、比特数量、由输入区段333a-c包括的RAP的数量等,表示输入区段333a-c的长度。虽然每个输入区段333a-c的长度不必恒等于其他输入区段333a-c,但是每个输入区段333a-c的长度可基本上等于其他输入区段333a-c。
转码管理器123将输入媒体文件115分成输入区段,以实现输入媒体文件115的并行处理。在输入区段333a-c太长时,实现并行处理的益处的启动成本较高。例如,如果将输入媒体文件115分成四个输入区段333c,其中,每个区段的长度基本上为四分之一,那么对于转码处理的第一个四分之一,未实现并行处理的益处。
在输入区段太短时,由于系统开销,并行转码系统的效率会降低。短区段的使用,还可增加输出流中的某种音频/视频假象/异常的可见性或可听性。例如,通过将输入媒体文件115分成短区段,并将短转码的区段连接在一起,连接数量增大,并且这可增大在转码输出中某些参数的不连续值的发生率。
在各种实施方式中,输入区段长度基本上为10秒。根据该目标长度,转码管理器123可发现每个输入区段333a-c的结束图片318b、324b。例如,转码管理器123可识别每个输入区段333a-c的最近的RAP231d、f,其超过各开始图片312a、318a、324a十秒。基于最近的RAP231d、f,转码管理器123可加入超过最近的RAP231d、f的预定长度,以便确定每个输入区段333a-c的结束图片。例如,输入区段A333a的结束图片可包括超过输入区段B333b的开始图片的多个额外图片318a-b,以便提供重叠,用于由处理器156(图1)进行的处理中,下面会更详细地进行描述。
在其他实施方式中,转码器装置134a-n(图1)被配置为在转码器装置134a-n已经完成或者即将完成转码处理时向转码管理器123指示停止馈送输入区段333a-c。此外,转码器装置134a-n可丢弃馈送给转码器装置134a-n的超过结束图片的额外数据。为此,转码器装置134a-n可确定输入区段333a-c的结束图片。
在图3的非限制性实例中,转码管理器123识别第一输入区段333a的开始图片312a。转码管理器123识别显示时间基本上为在开始图片312a之后10秒的后续RAP231d。转码管理器123和/或转码器装置134a-n添加超过后续RAP231d的预定长度,以识别第一输入区段333a的结束图片318b。在这个非限制性实例中,预定长度为4个图片。因此,除了后续RAP231d,第一输入区段333a还包括多个RAP231b、231c
为了识别下一个输入区段333b,转码管理器123将下一个输入区段333b的开始图片设为先前输入区段333a的最终RAP231d。这就造成每个输入区段333a-d之间重叠。重叠长度等于预定的长度。可以图片数量、时间、比特数量等来表示预定的长度。
通过将结束图片318b、324b扩展至预定的长度,分别超过后续RAP231d、f,以产生重叠量,对输入区段333a-d转码的转码器装置134a-n(图1)具有额外的信息,以在输入区段333a-c内为最后几张图片充分地解码。例如,在为目标图片解码时,可需要在比特流中扩展超过目标图片的多个图片。例如,参照图3的非限制性实例,为输入区段B333b的目标图片321n解码,需要至少一部分后续图片324a-b。通过包括这些后续图片324a-c,作为输入区段B333b的一部分,从而确保了目标图片321n被充分地解码。
在各种实施方式中,转码管理器123可至少基于要由转码器装置134a-n执行的处理功能来选择预定的长度。例如,解交错操作需要使用比图像增强操作更大的预定长度。
接下来参照图4,该图示出了根据本公开的各种实施方式在图1的转码系统100内实现的转码管理器123的操作的一个实例。图4提供了将多个输入区段333a-f分配给各解码器处理的转码管理器123的一个非限制性实例。这些解码器处理可同时进行操作,以用于并行对输入区段333a-f转码。例如,转码管理器123可将输入区段333a-f分配给三个转码器装置134a-c内的转码器处理。每个转码器装置134a-c被配置为对所接收的输入区段333a-f转码,并且生成相应的输出区段405a-f。
可按照显示的顺序排列输入区段333a-f。即,播放媒体文件的用户观察根据显示顺序按照时间顺序排列的输入区段333a-f。由于由转码器装置134a-c并行对输入区段333a-f转码,所以可进行转码的排序,从而使得转码器装置134a-c的输出需要重新排序,以保持最初的显示顺序。在这方面,转码顺序可根据显示顺序而变化。
在图4的转码系统100中,每个转码器装置134a-c的可由不同的转码速度表征。例如,第一转码器装置134a可为比第二转码器装置134b固有地更慢的转码器装置。在这种情况下,每个转码器装置134a-c的物理实现方式可影响转码速度,并且可改变每个转码器装置134a-c的转码处理资源。
此外,每个输入区段333a-f可在每个输入区段内的图片数量或在每个输入区段内的图片的复杂程度方面不同。例如,输入区段A333a可包括比输入区段C333c更多的图片。因此,转码输入区段A333a可需要比转码输入区段C333c更多的时间。再如,输入区段A333a可包括由复杂的颜色图案、运动和/或移动表征的一系列图片。输入区段C333c可包括很少或几乎没有运动或移动的一系列单调图片。因此,转码输入区段A333a需要比转码输入区段C333c更多的时间。
在将输入区段333a-f分配给转码器装置134a-c时,转码管理器123可通过分析每个转码器装置134a-c的工作负荷队列来确定分配。在各种实施方式中,每个转码器装置134a-c跟踪计划用于进行转码的输入区段333a-f的数量。每个转码器装置134a-c可保持计数器,以计数在工作队列中计划的输入区段333a-f的数量。在另一个实例中,每个转码器装置134a-c在已经完成对每个输入区段的转码时提供指示。在其他实施方式中,每个转码器装置134a-c量化与转码器装置134a-c的工作负荷相关联的进程状态。例如,每个转码器装置134a-c可提供在工作队列中计划的工作的预计完成时间。转码管理器123可跟踪每个转码器装置134a-c的工作进程并且相应地分配后续输入区段333a-f。
在图4的非限制性实例中,转码管理器123将输入区段A333a发送给第一转码器装置134a,将输入区段B333b发送给第二转码器装置134b,并且将输入区段C333c发送给第三转码器装置134c。此时,每个转码器装置134a-c现在对各个输入区段333a-c转码,以便填充每个转码器装置134a-c的工作队列。而且,每个转码器装置134a-c对各个输入区段333a-c转码,以分别生成相应的输出区段405a-c。
下一个顺序输入区段(输入区段D333d)将由转码管理器123来分配。在各种实施方式中,转码管理器123考虑每个转码器装置134a-c的转码进程。转码管理器123可将输入区段D333d分配给可在最早的时间点开始处理输入区段D333d的转码器装置134a-c。假设第一转码器装置134a和第二转码器装置134b比第三转码器装置134c具有更晚的预计完成时间,那么转码管理器123可将输入区段D333d分配给第三转码器装置134c。
转码管理器123可基于每个转码器装置的进程状态继续分配输入区段333a-f。每个转码器装置134a生成相应的输出区段405a-f。输出区段405a-f可以按照与输入区段333a-f的显示顺序不同的顺序生成。
在各种实施方式中,转码管理器123被配置为允许其他转码系统100(图1)访问一个或多个转码器装置134a-c。例如,第一转码系统100可与另一个转码系统100共享一个或多个转码器装置134a-c。每个转码系统100可被实施为相应的STB的一部分或另一个计算装置。在这方面,STB的网络可被配置为与其他STB共享其转码器装置134a-c。可选地,一个STB可被配置为对多个输入文件或数据流同时执行多个转码操作。转码管理器123可允许或拒绝访问由转码管理器123管理的转码器装置134a-c。同样,转码管理器123可请求使用另一个转码系统100的一个或多个转码器装置134a-c。在这种情况下,一组转码系统100可联网,以促进各个转码器装置134a-c的资源共享。
移至图5,该图示出了根据本公开的各种实施方式的图1的转码系统100的操作的示图。图5提供了按照显示顺序排列的顺序输入区段333a-d和相应的输出区段405a-d的非限制性实例。在各种实施方式中,输出区段405a-d被配置为形成一系列连续的输出区段,从而使得系列输出区段中的每个输出区段405a-d与相邻的输出区段405a-d不重叠。
输入区段333a-d表示输入媒体文件115(图1)的书序重叠的时间范围。因此,每个输入区段333a-d可由显示时间的起始时间与停止时间来表征。即,每个输入区段333a覆盖由输入媒体文件115表示的媒体项目的时间范围或窗口。例如,假设媒体项目为电影,那么输入区段A333a覆盖电影的0秒到10.5秒,并且输入区段B覆盖电影的10.4秒到20.0秒。
每个输入区段333a-d被发送给各个转码器装置134a-n(图1)。接收输入区段333a-d的转码器装置134a-n对所接收的输入区段333a-d转码并且生成相应的输出区段405a-d。每个输出区段405a-d也由具有起始时间和停止时间的显示时间的范围来表征。例如,在上一段落的实例之后,作为输入区段A333a的转码版本的输出区段A405a覆盖转码电影的0秒到10.5秒。作为输入区段B333b的转码版本的输出区段B405b覆盖转码电影的10.5秒到20.2秒。
在图5的非限制性实例中可见,相应的输入区段333a-d的输出区段405a-d为顺序的、连续并且不重叠的部分。例如,输出区段A405a的最后一张图片直接在输出区段B405b的第一张图片之前。在这方面,输出区段405a-d形成可被组装为生成经转码的输出媒体文件121(图1)的一系列连续的区段。
每个输出区段405a-d覆盖相应的输入区段333a-d的相同时间范围或者覆盖相应的输入区段333a-d的时间范围的子集。例如,输出区段A405a的时间范围为0秒到10.5秒,该时间范围与输入区段A333a的时间范围相同。然而,输出区段B405b的时间范围为10.5秒到20.2秒,该时间范围为输入区段B333b的时间范围10.4秒到20.2秒的子集。因此,转码器装置134a-d的处理器156(图1)接收显示时间的特定窗口的经解码的输入区段,并且生成与输入区段的显示时间的窗口子集相关的相应输出区段。这就允许处理器156实现串行转码而同时实际上实现并行转码的优势。
例如,处理器156可执行解交错操作,以生成与显示时间的特定窗口相关的输出区段。为了生成输出区段,解交错操作的输入应与输入窗口相关,该输入窗口足够大,以产生充分的解交错操作,从而生成与显示时间的特定窗口相关的输出区段。在图5的非限制性实例中,输出区段B405b与10.5秒到20.2秒的窗口相关。用于生成输出区段B405的解交错操作可需要与跨过至少10.4秒到20.2秒的范围的窗口相关的输入区段。换言之,为了解交错与10.5秒到20.2秒的范围相关的经解码的图片,解交错操作可需要利用在10.5秒之前的经解码的图片。
在各种实施方式中,输入媒体文件115的第一输入区段333a覆盖与相应的输出区段405a相同的时间范围。在第一输出区段405a之后,后续输出区段与作为相应的输入区段时间范围的子集的各个时间范围相关。
现在转向图6,该图示出了根据本公开的各种实施方式的图1的转码系统100的操作的一个实例。图6提供了使用并行的转码器装置134a-n(图1)来对四个输入区段333a-d转码的一个非限制性实例,其中,每个输入区段333a-d由转码管理器123(图1)分配给各个转码器装置134a-n。
每个输入区段333a-d按照显示顺序沿着y轴排列。首先显示输入区段A333a,输入区段B333b紧接在其后,输入区段C333c紧接在输入区段B333b之后,并且输入区段D333d紧接在输入区段C333c之后。沿着y轴被描述的越低的输入区段333a-d,是越早地被显示的输入区段333a-d。
每个输入区段333a-d也按照转码顺序沿着x轴排列。在x轴上更靠近左边的输入区段333a-d表示该输入区段333a-d在更早的时间被转码。因此,输入区段A333a为首先要转码的输入区段,随后是输入区段D333d,然后是输入区段B333b,随后是输入区段C333c。可由在不同的时间点处理输入区段333a-d的并行转码器装置134a-n造成该交错的转码顺序。可从图6的实例中推断出,指定为对输入区段A333a转码的转码器装置134a-n与指定为对输入区段D333d转码的转码器装置134a-n不同。该推断基于输入区段A333a和输入区段D333d具有重叠的转码时间这一事实以及转码器装置134a-n可一次处理一个输入区段333a-d这一假设。然而,可推断出,指定为对输入区段A333a转码的转码器装置134a-n也可与指定为对输入区段B333b或输入区段C333c转码的转码器装置134a-n相同。这是因为输入区段A333a的转码时间既不与输入区段B333b,也不与输入区段C333c重叠。然而,转码器装置134a-n能够同时处理一个以上的输入区段333a-d。
图6也提供了在相应的转码器装置134a-n内实现的每个编码器158(图1)的QP159a-d的动态调节的一个非限制性实例。例如,通过由负责对输入区段A333a转码的转码器装置134a-n实现的编码处理,可动态地调节与输入区段A333a的编码相关的QP159a。为此,每个输入区段333a-d的编码包括可通过编码过程来调节的相应的QP159a-d。在编码特定的输入区段333a-d时,QP159a-d可被初始化为最初QP502a-d。此外,转码管理器123可引导每个转码处理来通过这种方式处理其各个QP159a-d,即,收敛到预定的QP范围505a-d,下面会进一步详细地进行讨论。
在各种实施方式中,转码管理器123被配置为在转码器装置134a-n处理各系列输入区段333a-d时,管理每个转码器处理的QP159a-d。转码器装置134a-n的编码器158可以在执行编码处理时调节QP159a-d。因此,每个输入区段333a-d与最初QP502a-d和最终的QP相关联,其中,QP由每个编码器处理使用来产生相应的输出区段405a-d。在特定的输入区段333a-d的最终QP与要显示的下一个输入区段333a-d的最初QP502a-d明显不同时,发生脱接的QP转变。脱接的QP转变可在与经转码的输入区域333a-d对应的输出区段405a-d之间造成视觉上的假象。因此,转码管理器123可被配置为影响将被编码的每个输入区段333a-d的QP159a-d,以在一系列顺序输出区段405a-d上生成相对连续的QP159,从而使得从一个输出区段到下一个输出区段的QP159具有较小的差异。
此外,在一个实施方式中,转码管理器123获得完全编码的输入区段333a-d(例如,新生成的输出区段405a-d)的最终QP值,并且使用这个最终QP值来设置要显示的下一个输入区段333a-d的最初QP502a-d。例如,输入区段A333a的最终QP可用于初始化输入区段B333b的最初QP502。在这种情况下,负责处理输入区段A333a的转码器装置134a-n将与输入区段A333a相关的最终QP传送给转码管理器123。然后,转码管理器123可通过设置最初QP502b来控制负责处理输入区段B333b的转码器装置134a-n。
然而,输入区段333b可能与要显示的下一个输入区段333c同时被转码。例如,到输入区段B333b完成转码处理时,输入区段C333c已经开始转码处理。为了解决这种情况,各种实施方式涉及引导QP159b收敛在预定的QP范围505b内。例如,在转码管理器123监测输入区段B333b的编码时,转码管理器123可设置预定的QP范围505b,以指导或者引导QP159b收敛在预定的QP范围505b内。然后,转码管理器123可至少基于输入区段B333b的预定的QP范围505b,通过设置输入区段C333c的最初QP502,来初始化输入区段C333c的QP159c。这可降低输出区段B405b和输出区段C405c之间发生脱接的QP的风险,从而使所生成的输出文件(数据流)产生高视觉质量。
在各种实施方式中,预定的QP范围505a-d可在每个输入区段333a-d的编码期间被动态地确定。例如,在编码处理中,可以使用一个或多个输出区段的QP159a-d来确定特定的输出区段的预定的QP范围505a-d。在可选的实施方式中,对于所有编码器,可固定预定的QP范围505a-d。在这方面,每个编码具有相同的预定的QP范围505a-d。在另一个可选的实施方式中,对于编码输出区段405a-d的所有编码器,预定的QP范围505a-d可基本上相等,并且QP范围505a-d可随着时间变化。
也可以在与更早的显示时间相关联的输入区段333b、c之前,编码与更晚的显示时间相关的输入区段333d。例如,,输入区段D333d在输入区段B333b和C333c的编码之前开始编码处理。本公开的各种实施方式旨在获得目前正在被编码的输出区段405a-d的即时QP159a-d,并且使用该即时QP159a-d来初始化另一个输入区段333a-d的最初QP502a-d。例如,转码管理器123可获得输入区段A目前正在编码时的输入区段A333a的即时QP,并且将即时QP用作输入区段D333d的最初QP502d。因此,转码系统100允许转码管理器123从转码器装置134a-d中读取QP159a-d。
接下来,参照图7,该图示出了根据本公开的各种实施方式示出作为图1的部分转码管理器123实现的功能的实例的流程图。要理解的是,图7的流程图仅仅提供了可用于实现在本文中所描述的转码管理器123的操作的多种不同类型的功能配置的一个实例。作为一种选择,可将图7的流程图视为描述根据一个或多个实施方式在转码管理器123中实现的方法步骤的一个实例。
首先,在参考数字703处,转码管理器123访问输入媒体文件115(图1)。转码管理器123被配置为从源存储器112(图1)中读取输入媒体文件。输入媒体文件115可作为表示一系列图片的比特流而被读取。在参考数字706处,转码管理器123识别随机接入点(RAP)231a-c(图2)。可根据RAP列表231(图2)识别RAP。RAP列表231可为与输入媒体文件115相关联的元数据的一部分。RAP列表231也可由转码管理器123计算。在这种情况下,转码管理器123分析输入媒体文件115并且识别RAP的位置。
在参考数字709处,转码管理器123生成一个或多个输入区段333a-c(图3)。至少基于RAP231a-f(图3)的位置,来生成输入区段333a-c。每个输入区段333a-c可包括起始点和终点。每个输入区段333a-c的起始点可为RAP列表231中的相应的RAP231a-f。而且,每个输入区段333a-c可包括多个RAP231a-f。在各种实施方式中,终点为超过特定的输入区段333a-c的最终RAP231a-f的预定数量的图片。下一个输入区段333a-c可具有前一个输入区段333a-c的最终RAP231a-f的起始点。在这方面,这系列输入区段333a-c为顺序的、连续的以及重叠的输入区段。
在参考数字712处,转码管理器123选择一个或多个转码器装置134a-n(图1),以生成相应的输出区段405a-f(图4)。每个转码器装置134a-n被配置为接收输入区段333a-f(图4),对输入区段333a-n转码,并且生成一个相应的输出区段405a-f(图4)。在各种实施方式中,从转码器装置134a-f的输出中获得的输出区段405a-f可根据显示顺序被排序。当被排序时,输出区段405a-f为不重叠的连续区段。转码管理器123可使用多路复用器143(图1)和/或缓冲存储器来为输出区段405a-f排序。在参考数字715处,转码管理器123在存储器内存储输出区段405a-f。例如,输出区段405a-f可被排序,连接在一起并且作为输出媒体文件121(图1)存储在目的地存储器(图1)内。连接可包括以显示顺序连接每个输出区段405a-f。
接下来参照图8,该图示出了根据本公开的各种实施方式示出作为图1的部分转码管理器123实现的功能的实例的流程图。要理解的是,图8的流程图仅仅提供了可用于实现在本文中所描述的转码管理器123的操作的多种不同类型的功能配置的一个实例。作为一种选择,可将图8的流程图视为描述根据一个或多个实施方式在转码管理器123中实现的方法步骤的一个实例。
首先,在参考数字805处,转码管理器123将输入媒体文件115(图1)分成输入区段333a-c(图3)。可至少基于RAP231a-f(图3)的位置,生成输入区段333a-c。每个输入区段333a-c可包括起始点和终点。每个输入区段333a-c的起始点可为RAP列表231中的相应的RAP231a-f。而且,每个输入区段333a-c可包括多个RAP231a-f。在各种实施方式中,终点为超过特定的输入区段333a-c的最终RAP231a-f的预定数量的图片。下一个输入区段333a-c可具有前一个输入区段333a-c的最终RAP231a-f的起始点。在这方面,这系列输入区段333a-c为顺序的、连续的以及重叠的输入区段。
在各种实施方式中,转码管理器123被配置为将作为包括开始图片的数据流的输入区段提供给转码器装置134a-n(图1)。在这方面,转码管理器123可首先指定标称值,作为在输入区段333a-c中的结束图片,或者不指定结束图片。在该非限制性实例中,在从转码器装置123中接收停止馈送输入区段333a-c的指令时,转码管理器123可停止馈送输入区段流。
在参考数字808处,转码管理器123将第一输入区段333a-c发送给第一转码器,例如,转码器装置134a-n。第一转码器可为被配置为对输入媒体文件115并行同时执行转码器处理的多个转码器中的一个。在各种实施方式中,转码管理器123至少基于每个转码器的现有工作负荷的转码进程,来确定选择第一转码器。在参考数字811处,转码管理器123初始化第一转码器的QP159(图1)。转码管理器123可与转码器的控制器149(图1)接合,以设置转码器的编码器158(图1)的最初QP502a-d(图6)。在各种实施方式中,转码管理器123可将最初QP502a-d设为默认值。
在参考数字814处,转码管理器123指导或者引导第一转码器的QP159进入预定的QP范围505a-d。例如,转码管理器123可使用转码器的控制器149来设置编码器的预定的QP范围505a-d。通过设置预定的QP范围505a-d,编码第一输入区段333a-c的编码器158引导QP159收敛到在预定的QP范围505a-d内的最终QP。预定的QP范围505a-d可为所有转码处理普遍具有的固定范围,或者可由转码管理器123动态地计算。
在参考数字817处,转码管理器123将第二输入区段发送给第二转码器。按照显示顺序,第二输入区段333a-c可紧接在第一输入区段333a-c之后。转码管理器123可至少基于每个转码器的转码进程或即时工作负荷,来确定选择第二转码器。
在参考数字821处,转码管理器123根据第一转码器的预定的QP范围505a-d,来初始化第二转码器的QP159。通过引导与第一输入区段333a-c相关的QP159收敛到预定的QP范围505a-d,转码管理器123可为第二输入区段333a-c设置最初QP502a-d,以与第一输入区段333a-c的预期结束QP159匹配。为此,转码管理器123被配置为减少在输出区段405a-f(图4)的接合处发生的脱接的QPs159的可能性。
图7和8的流程图示出了转码管理器123(图1)的部分的实现的功能与操作。如果实施为软件,描述为方框的每个参考数字可表示包括实现一个或多个指定的逻辑功能的程序指令的代码模块、区段或部分。这些程序指令可实施为包括以编程语言编写的人类可读语句的源代码或者包括可由合适的执行系统(例如,在计算机系统或其他系统中的转码管理器123)识别的数字指令的机器代码的形式。程序指令可存储在存储器内。机器代码可从源代码等中转换。如果以硬件实施,那么每个方框可表示实现指定的逻辑功能的一个电路或多个互连的电路。
虽然图7和8的流程图示出了特定的执行顺序,但是要理解的是,执行顺序可与所描述的顺序不同。例如,可相对于所示出的执行顺序打乱两个或多个方框的执行顺序。而且,可同时或部分同时地执行在图7和8中顺序示出的两个或多个方框。而且,在一些实施方式中,可跳过或省略在图7和8中示出的一个或多个方框。此外,为了增强效用、核算、性能测量或帮助排除故障等目的,可将多个计数器、状态变量、警告信号或消息添加到在本文中所描述的逻辑流程中。要理解的是,所有这样的变化均在本公开的范围内。
而且,在本文中所描述的包括软件或代码(例如,用于执行部分转码管理器123的代码或指令)的任何逻辑或应用程序可以实施在供指令执行系统(例如,在计算机系统或其他系统中的转码管理器123)使用的或者与指令执行系统一起使用的任何永久性计算机可读介质中。在这个意义上,逻辑可包括例如包含可从计算机可读介质中提取并且可由指令执行系统执行的指令和声明的语句。在本公开的上下文中,“计算机可读介质”可为可包含、存储或保持供指令执行系统使用或者与指令执行系统一起使用的在本文中所描述的逻辑或应用程序的任何介质。
计算机可读介质可包括多个物理介质中的任一个,例如,磁性、光学或半导体介质。合适的计算机可读介质的更具体的实例包括但不限于磁带、磁软盘、磁硬盘驱动器、存储卡、固态驱动器、USB闪存驱动器、或光盘。而且,计算机可读介质可为随机存取存储器(RAM),包括例如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM)或磁性随机存取存储器(MRAM)。此外,计算机可读介质还可为只读存储器(ROM)、可编程只读存储器(PROM)、可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)或其他类型的存储装置。
应强调的是,本公开的上述实施方式仅仅为便于清晰地理解本公开的原理而提出的实现方式的可能的实例。在基本上不背离本公开的精神和原理的情况下,可对上述实施方式进行多种变化和修改。所有这种修改和变化旨在包含在本公开的范围内并且受到以下权利要求的保护。

Claims (7)

1.一种并行转码系统,包括:
存储器,用于存储媒体文件,所述媒体文件包括一系列图片;
转码管理器,被配置为在所述一系列图片中识别一组随机接入点,所述转码管理器被配置为根据所述一组随机接入点通过对每个输入区段指定开始图片和结束图片而将所述媒体文件分成多个输入区段,所述转码管理器被配置为,对于每个输入区段:
指定第一随机接入点作为所述开始图片;
至少部分基于距离所述开始图片的目标长度识别第二随机接入点;以及
选择所述第二随机接入点之后预定长度的图片作为结束图片;
多个转码器装置,被配置为并行对所述输入区段转码,以生成相应的输出区段,所述转码管理器进一步被配置为将每个输入区段分配给所述多个转码器装置中的相应一个;以及
存储器,用于存储所述输出区段。
2.根据权利要求1所述的系统,其中,所述输入区段包括第一输入区段和第二输入区段,其中,所述第一输入区段与所述第二输入区段重叠所述预定长度。
3.根据权利要求1所述的系统,其中,所述输出区段被配置为形成一系列连续的输出区段,以便在一系列所述输出区段中,每个输出区段与相邻的输出区段不重叠。
4.根据权利要求1所述的系统,其中,每个转码器装置包括编码器、像素处理器以及解码器,其中,所述像素处理器被配置为执行图片尺寸调节、格式变化、交错操作、解交错操作、噪声降低、颜色空间转换或图像增强中的至少一个。
5.根据权利要求1所述的系统,其中,每个转码器装置被配置为向所述转码管理器指示转码进程。
6.一种并行转码方法,包括:
访问媒体文件,所述媒体文件包括表示一系列图片的比特流;
识别所述比特流中的第一随机接入点;
在所述比特流中,至少部分基于距离所述第一随机接入点的目标距离来识别第二随机接入点;
生成所述比特流的输入区段,生成所述输入区段包括指定所述第一随机接入点作为所述输入区段的起始点并选择所述第二随机接入点之后预定长度的所述输入区段的结束点;
选择多个转码器装置中的一个以对所述输入区段转码,用于生成相应的输出区段,每个转码器装置被配置为同时并行进行操作;以及
在存储器内存储所述输出区段。
7.一种并行转码系统,包括:
转码管理器,被配置为:
从存储器中访问媒体文件,所述媒体文件包括一系列图片;
在所述一系列图片中识别一组随机接入点;
根据所述一组随机接入点通过对每个输入区段指定开始图片和结束图片来分割所述媒体文件,所述转码管理器被配置为
通过以下操作来生成第一输入区段:
指定第一随机接入点作为所述第一输入区段的开始图片;
至少部分基于距离所述开始图片的目标距离来识别第二随机接入点;以及
选择所述第二随机接入点之后预定长度的图片作为所述第一输入区段的结束图片;以及
生成第二输入区段,所述第二输入区段具有第二随机接入点作为所述第二输入区段的开始图片,所述第一输入区段和第二输入区段重叠所述预定长度;
启动第一转码处理,以处理所述第一输入区段;以及
启动第二转码处理,以处理所述第二输入区段,所述第一转码处理与所述第二转码处理被同时执行。
CN201310525247.0A 2012-10-30 2013-10-30 并行转码 Active CN103796063B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/663,651 2012-10-30
US13/663,651 US9307258B2 (en) 2012-10-30 2012-10-30 Parallel transcoding

Publications (2)

Publication Number Publication Date
CN103796063A CN103796063A (zh) 2014-05-14
CN103796063B true CN103796063B (zh) 2017-04-12

Family

ID=50479927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310525247.0A Active CN103796063B (zh) 2012-10-30 2013-10-30 并行转码

Country Status (3)

Country Link
US (1) US9307258B2 (zh)
CN (1) CN103796063B (zh)
DE (1) DE102013221798B4 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9635334B2 (en) * 2012-12-03 2017-04-25 Avago Technologies General Ip (Singapore) Pte. Ltd. Audio and video management for parallel transcoding
US9924164B2 (en) * 2013-01-03 2018-03-20 Disney Enterprises, Inc. Efficient re-transcoding of key-frame-aligned unencrypted assets
FR3011659B1 (fr) * 2013-10-04 2015-10-16 Commissariat Energie Atomique Circuit electronique, notamment apte a l'implementation d'un reseau de neurones, et systeme neuronal
CN104581200B (zh) * 2015-02-06 2018-01-02 网易传媒科技(北京)有限公司 切片转码的方法和设备
US10599609B1 (en) * 2015-03-31 2020-03-24 EMC IP Holding Company LLC Method and system for elastic, distributed transcoding
US10929353B2 (en) 2015-04-29 2021-02-23 Box, Inc. File tree streaming in a virtual file system for cloud-based shared content
US11412272B2 (en) 2016-08-31 2022-08-09 Resi Media Llc System and method for converting adaptive stream to downloadable media
US10511864B2 (en) 2016-08-31 2019-12-17 Living As One, Llc System and method for transcoding media stream
US10523973B2 (en) 2016-09-23 2019-12-31 Apple Inc. Multiple transcode engine systems and methods
US11470131B2 (en) 2017-07-07 2022-10-11 Box, Inc. User device processing of information from a network-accessible collaboration system
US10951906B2 (en) 2018-08-16 2021-03-16 Bombbomb, Inc. Method and system for implementing split and parallelized encoding or transcoding of audio and video content
US11611784B2 (en) * 2019-08-02 2023-03-21 Dao Lab Limited System and method for transferring large video files with reduced turnaround time
CN111918069B (zh) * 2020-07-10 2023-08-15 上海网达软件股份有限公司 实时转码过程中动态编辑图文的方法与系统
US11206415B1 (en) 2020-09-14 2021-12-21 Apple Inc. Selectable transcode engine systems and methods

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493386B1 (en) * 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
CN101999136A (zh) * 2008-04-10 2011-03-30 捷讯研究有限公司 对富媒体服务中的离散内容进行渐进传送和同步的方法和系统
CN102084657A (zh) * 2008-05-30 2011-06-01 日本胜利株式会社 动态图像编码装置、动态图像编码方法、动态图像编码程序、动态图像解码装置、动态图像解码方法、动态图像解码程序、动态图像再编码装置、动态图像再编码方法、动态图像再编码程序
CN102273205A (zh) * 2008-11-04 2011-12-07 先进微装置公司 以gpu加速的软件视频转码器
CN102428484A (zh) * 2009-03-23 2012-04-25 生命力有限公司 使用多个编码格式进行多流视频压缩的系统和方法
CN102550029A (zh) * 2010-07-30 2012-07-04 松下电器产业株式会社 图像解码装置、图像解码方法、图像编码装置以及图像编码方法
CN102625109A (zh) * 2012-03-30 2012-08-01 浙江大学 一种基于多核处理器实现的mpeg-2至h.264的转码方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996026608A2 (en) * 1995-02-22 1996-08-29 Philips Electronics N.V. System for transmitting a plurality of video programs simultaneously through a transmission channel
US7603689B2 (en) * 2003-06-13 2009-10-13 Microsoft Corporation Fast start-up for digital video streams
US8046409B2 (en) * 2003-10-31 2011-10-25 Hewlett-Packard Development Company, L.P. Communications methods, collaboration session communications organizers, collaboration sessions, and articles of manufacture
US8842666B2 (en) * 2005-05-13 2014-09-23 Qualcomm Incorporated Methods and apparatus for packetization of content for transmission over a network
US8208540B2 (en) * 2005-08-05 2012-06-26 Lsi Corporation Video bitstream transcoding method and apparatus
US7881384B2 (en) * 2005-08-05 2011-02-01 Lsi Corporation Method and apparatus for H.264 to MPEG-2 video transcoding
US8155194B2 (en) * 2005-08-05 2012-04-10 Lsi Corporation Method and apparatus for MPEG-2 to H.264 video transcoding
US20070091928A1 (en) * 2005-10-21 2007-04-26 Wee Susie J Serial and parallel processing of data using information about the data and information about a streaming network
US8098735B2 (en) * 2006-12-21 2012-01-17 Lsi Corporation Efficient 8×8 CABAC residual block decode
US20090257508A1 (en) * 2008-04-10 2009-10-15 Gaurav Aggarwal Method and system for enabling video trick modes
JP2009272706A (ja) 2008-04-30 2009-11-19 Toshiba Corp 動画像トランスコード装置およびその方法
US8655156B2 (en) * 2010-03-02 2014-02-18 Cisco Technology, Inc. Auxiliary audio transmission for preserving synchronized playout with paced-down video
US8300667B2 (en) * 2010-03-02 2012-10-30 Cisco Technology, Inc. Buffer expansion and contraction over successive intervals for network devices

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493386B1 (en) * 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
CN101999136A (zh) * 2008-04-10 2011-03-30 捷讯研究有限公司 对富媒体服务中的离散内容进行渐进传送和同步的方法和系统
CN102084657A (zh) * 2008-05-30 2011-06-01 日本胜利株式会社 动态图像编码装置、动态图像编码方法、动态图像编码程序、动态图像解码装置、动态图像解码方法、动态图像解码程序、动态图像再编码装置、动态图像再编码方法、动态图像再编码程序
CN102273205A (zh) * 2008-11-04 2011-12-07 先进微装置公司 以gpu加速的软件视频转码器
CN102428484A (zh) * 2009-03-23 2012-04-25 生命力有限公司 使用多个编码格式进行多流视频压缩的系统和方法
CN102550029A (zh) * 2010-07-30 2012-07-04 松下电器产业株式会社 图像解码装置、图像解码方法、图像编码装置以及图像编码方法
CN102625109A (zh) * 2012-03-30 2012-08-01 浙江大学 一种基于多核处理器实现的mpeg-2至h.264的转码方法

Also Published As

Publication number Publication date
US20140119457A1 (en) 2014-05-01
DE102013221798B4 (de) 2024-06-20
US9307258B2 (en) 2016-04-05
DE102013221798A1 (de) 2014-04-30
CN103796063A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
CN103796063B (zh) 并行转码
CN103609117B (zh) 编码和解码图像的方法及装置
CN108989885B (zh) 视频文件转码系统、分割方法、转码方法及装置
CN103650523B (zh) 发送装置以及发送装置的控制方法
JPWO2020137642A1 (ja) 情報処理装置および情報処理方法
CN103581678B (zh) 通过使用多个解码器信道来改良解码器性能的方法与系统
CN102947866B (zh) 图像处理装置、内容生成辅助装置、图像处理方法、内容生成辅助方法
CN109862357A (zh) 低延迟的云游戏图像编码方法、装置、设备和存储介质
US10607623B2 (en) Methods and apparatus for supporting communication of content streams using efficient memory organization
US20060088279A1 (en) Reproduction apparatus, data processing system, reproduction method, program, and storage medium
CN103299616A (zh) 再生装置及其控制方法、生成装置及其控制方法、记录介质、数据结构、控制程序以及记录了该程序的记录介质
CN101964202A (zh) 一种混合多种编码格式的音频数据文件播放处理方法
CN104956683A (zh) 用于流式传输视频的自适应降噪引擎
CN105959797A (zh) 一种视频解码方法及数字电视
CN1496118A (zh) 视频记录/再现装置及其存储设备的控制方法
CN104521239B (zh) 视频数据文件的同步编码和发送
US10142605B1 (en) Systems and methods for playing a video clip of an encoded video file
CN106463139A (zh) 解码装置、解码方法和程序
US7848610B2 (en) Data processing system, reproduction apparatus, computer, reproduction method, program, and storage medium
US9451231B1 (en) Systems and methods for switching between multiple software video players linked to a single output
US20060088285A1 (en) Reproduction apparatus, data processing system, reproduction method, program, and storage medium
CN112445605A (zh) 一种媒体数据处理方法、装置及媒体服务器
CN101090489B (zh) 信息处理设备和信息处理方法
WO2013181756A1 (en) System and method for generating and disseminating digital video
US7729591B2 (en) Data processing apparatus, reproduction apparatus, data processing system, reproduction method, program, and storage medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1193288

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20170315

Address after: Singapore Singapore

Applicant after: Avago Technologies Fiber IP Singapore Pte. Ltd.

Address before: American California

Applicant before: Zyray Wireless Inc.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20181019

Address after: Singapore Singapore

Patentee after: Annwa high tech Limited by Share Ltd

Address before: Singapore Singapore

Patentee before: Avago Technologies Fiber IP Singapore Pte. Ltd.

TR01 Transfer of patent right
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1193288

Country of ref document: HK