CN102543132A - 音视频模式序列诊断工具的系统和方法 - Google Patents

音视频模式序列诊断工具的系统和方法 Download PDF

Info

Publication number
CN102543132A
CN102543132A CN2011103967499A CN201110396749A CN102543132A CN 102543132 A CN102543132 A CN 102543132A CN 2011103967499 A CN2011103967499 A CN 2011103967499A CN 201110396749 A CN201110396749 A CN 201110396749A CN 102543132 A CN102543132 A CN 102543132A
Authority
CN
China
Prior art keywords
montage
diagnosis
media file
coding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103967499A
Other languages
English (en)
Other versions
CN102543132B (zh
Inventor
塞缪尔·E·科罗纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Disney Enterprises Inc
Original Assignee
Disney Enterprises Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Disney Enterprises Inc filed Critical Disney Enterprises Inc
Publication of CN102543132A publication Critical patent/CN102543132A/zh
Application granted granted Critical
Publication of CN102543132B publication Critical patent/CN102543132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及音视频模式序列诊断工具的系统和方法。提供了用于确认关于媒体文件的正确的编码器处理的系统和方法。所提供的方法包括准备诊断剪辑,将诊断剪辑嵌入媒体文件以创建修改的媒体文件,根据一组编码器设置对修改的媒体文件编码以创建嵌入了编码的诊断剪辑的编码的媒体文件,向用户显示编码的诊断剪辑,以及基于从用户接收的反馈信息评估编码器设置的准确性。用这种方式,用户可以在对媒体文件编码之后快速并准确地诊断编码器设置。用户可以更容易地鉴定出哪些编码导致了哪些问题,并避免在制作过程中的成本较高的回溯开销。

Description

音视频模式序列诊断工具的系统和方法
发明背景
1.发明领域
本发明大体上涉及媒体文件创建。更具体地,本发明涉及验证媒体文件的正确编码。
2.背景技术
现代的媒体制作工作流程逐渐地依赖于数字格式,如闪存介质上的压缩视频数据,而不是过去的模拟格式,如磁带。相比于模拟媒体,数字媒体提供了几个优势,如容易发行和增加了可靠性。然而,向数字媒体制作工作流程的过渡引入了几个新问题,尤其是与格式编码和转码有关的问题。
例如,在制作工作流程内使用的特定的硬件设备或编码步骤可能要求视频数据具有特定的格式。因此,必须对视频数据进行操作,例如通过编码或转码使之成为合适的格式。然而,每一操作增加了在视频数据中引入编码错误的风险。例如,由于硬件、软件、制作环境和其他变量之间的差异,在具体的操作步骤中的编码器设置可能被不当地配置。因此,尽管编码的视频文件可以包括有效的文件结构,但视频内容可能包含导致视频或音频质量劣化的编码错误。此外,在扩展的多步骤工作流程中精确地定位引入错误的编码步骤可能是困难的。
此外,尽管使用标准的手动或自动的质量控制步骤可以快速发现一些编码错误,但对自动检测来说,其他编码错误可能不会即时显现或易于处理。诸如检测不正确的节奏的一些错误,经常要求严密的手动检查和了解具体问题。诸如音频向下混合的其他错误,即使了解问题也可能难以检测。因此,编码错误可能直到制作过程的后期阶段都检测不出来,需要昂贵的和耗时的回溯法来恢复适当的视频和音频质量。
因此,有必要通过提供使用户能够快速和准确地确认媒体内容的正确的视频和音频编码的诊断工具,来克服本领域中的缺陷和不足。
发明概述
提供了关于媒体内容诊断工具的系统和方法,所述系统和方法包括嵌入媒体文件中的在编码之后确认正确的编码器处理的音频和视频模式序列,实质上如联系附图中的至少一个所示出和/或所描述的,如更完整地在权利要求中所提出的。
附图的简要描述
在学习了下面的详细描述和附图之后,本发明的特征和优势对于本领域的那些普通技术人员来说将变得更容易理解,附图中:
图1示出了根据本发明的一种实施方式的关于媒体内容诊断工具的系统,所述系统包括嵌入媒体文件中的在编码之后确认正确的编码处理的音频和视频模式序列;
图2示出了根据本发明的一种实施方式的来自所述诊断工具的单个帧;
图3示出了根据本发明的一种实施方式的来自所述诊断工具的两组帧;
图4示出根据本发明的一种实施方式的描述步骤的流程图,通过流程图,经过培训的用户可以使用诊断工具确认在编码之后的媒体文件的正确的编码器处理。
发明的详细描述
本申请针对关于媒体内容诊断工具的系统和方法,所述系统和方法包括嵌入媒体文件的以在编码之后确认正确的编码器处理的音频和视频模式序列。下面的描述包含与本发明的实现有关的具体信息。本领域的技术人员将意识到,本发明可以用不同于在本申请中具体描述的方式实现。而且,为了使本发明简明,没有讨论本发明中的一些具体细节。本申请中没有描述的具体细节在本领域的普通技术人员的知识范围内。本申请中的附图和随附的详细描述只针对本发明的示例性实施方式。为了保持简洁,使用本发明的原理的本发明的其他实施方式没有在本申请中具体地描述,并且没有通过本发明的附图具体地示出。
图1示出了根据本发明的一种实施方式的包括音频和视频模式序列的关于媒体内容诊断工具的系统。图1中的简图100包括诊断剪辑110、媒体文件120、修改的媒体文件130、媒体编码器140、编码的媒体文件150、显示器160和用户170。诊断剪辑110包括中部剪切提取112、安全区域113、场显示顺序114、节奏检测115、插值116a、插值116b、插值116c、插值116d、音频板117和其他模式118。修改的媒体文件130包括媒体文件120和诊断剪辑110。媒体编码器140包括编码器设置145、诸如微处理器的编码处理器146和用于存储由处理器146执行的指令以及数据存储和恢复的存储器(没有示出)。编码的媒体文件150包括编码的诊断剪辑155和编码的媒体内容156。显示器160包括扬声器165。
诊断剪辑110可以包括10秒的视频序列,所述10秒的视频序列包括一组图形模式和音频轨道,如中部剪切提取112、安全区域113、场显示顺序114、节奏检测115、插值116a-116d、音频板117和其他模式118。诊断剪辑110通过提供即时的视觉和听觉反馈信息可被用作进行编码或转码的媒体文件的诊断工具。
根据本发明的一种实施方式,诊断剪辑110可以是媒体编码系统内的文件对象。然而,在可选的实施方式中,诊断剪辑110的组件可包括独立的过程或方法。因此,取决于所需要的检测特征,中部剪切提取112、安全区域113、场显示顺序114、节奏检测115、插值116a-116d、音频板117和其他模式118的任意组合可作为独立的过程应用到用于诊断测试的任何媒体内容。
中部剪切提取112可帮助暴露关于从16x9的源材料中中部剪切提取不正确的4x3的任何问题。因为16x9的源材料与能在4x3的屏幕上显示的材料相比分辨率较大,4x3的视频可以提取自16x9的材料。中部剪切提取112可帮助确定正确的材料是否被提取。安全区域113可提供类似的功能。某些图像可能必须保持在视频屏幕的安全区域内,所述安全区域可能是4x3中部剪切内的较小区域。安全区域113可帮助确定正确的图像是否仍然在安全区域内。
场显示顺序114可帮助鉴定出不正确的场显示顺序或场优势。媒体文件120可能需要被广播到隔行扫描的输出设备,如老式电视机。隔行扫描设备将视频作为场流接收。与帧(包含每一扫描线的数据)相比,场包含显示器的每隔一行扫描线的数据。场中的一半是上方场,上方场是包含来自开始于顶部的扫描线的奇数行扫描线的数据。下方场包含开始于顶部的第二行扫描线的偶数行扫描线。因而上方场和下方场可以配对为帧,形成完整的一组扫描线。场优势决定帧开始于它的上方场还是下方场。不正确的上方/下方场优势可产生不连续的视频运动。
节奏检测115可帮助检测不正确的节奏。媒体文件中的场的序列必须具有可被适当显示的正确的节奏。例如,源材料可依次包括帧A、B、C和D。如果帧的该序列经历了编码处理,诸如将每一帧增加一倍成为场对,节奏必须保持完整。最终产生的序列应该读为A-A-B-B-C-C-D-D。因此,诸如A-A-B-C-B-C-D-D的序列将是不正确的节奏。
插值116a-116d可帮助检测插值。当邻近的帧图像混合在一起时,发生插值(特别是时间插值)。被插入的图像可包含两个混合图像的元素。插值116a-116d可表明在编码期间是否引入插值。
音频板117可包括可帮助诊断音频问题的几个音频轨道。音频板117可包括24个标准音频通道中的每一个的音频板。每一轨道可具有通报对应于轨道所在的原始通道的轨道编号的声音。例如,当回放通道1时,可听到语音词语“通道1”。轨道也可以是交错的,因此可能从来不会听到轨道与另一轨道同步。编码可以将音频轨道从原始的通道位置重新分配或重新映射到新的通道位置。音频板117可帮助确认音频轨道存在哪个通道上这一困难而容易出错的任务。例如,通道3可被映射到通道7。使用音频板117,当回放通道7时,可听到“通道3”。听到另一轨道编号,没有听到声音或在另一通道上听到“通道3”可以表明音频映射问题。
此外,音频板117也可帮助发现无意的向下混合。在媒体文件120的编码期间,几个轨道可能被意外地发送到同一通道或向下混合。通常,听音频是检测无意的向下混合的一种困难的方式。然而,当音频板117进行向下混合时,可能比较容易发现错误。因为音频板117是交错的,如果几个轨道被向下混合,则可以听到几个异步声音。此外,交错的音频简化了鉴定出向下混合的轨道编号的过程。
其他模式118可包括其他图形模式或音频轨道或现有模式和轨道的变形。诸如附加的信箱划分的其他工具,对于诊断利用默认的模式集合检测不到的问题是必要的。其他模式118还可包括诸如时间戳记或标识符的其他信息。
媒体文件120可包括将由媒体编码器140进行编码或转码的媒体内容。例如,它可包括原始的源材料。可选地,媒体文件120可包括已经被编码和将被再次编码的媒体内容。因为编码可能在它的媒体内容中引入不需要的结果,所以,媒体文件120可能需要验证它的媒体内容。
修改的媒体文件130可包括媒体文件120和诊断剪辑110。诊断剪辑110可放在媒体文件120的头部或尾部(类似于在视频主控制器中使用的节信号和音调信号),以形成修改的媒体文件130。在可选的实施方式中,诊断剪辑110可被用作独立的剪辑。不管使用什么方法,与媒体文件120相同,诊断剪辑110可通过编码器设置145编码。
媒体编码器140可包括能够对修改的媒体文件130执行编码或转码的计算设备。媒体编码器140也可用编码器设置145配置。遗憾的是,不正确的设置可能导致对修改的媒体文件130的不需要的改变。然而,编码器设置145可通过其他输入如由用户170通过计算机界面进入输入,而使用正确的设置正确地重新配置。因而,媒体编码器140可对修改的媒体文件130重新编码。此外,媒体编码器140可还包括编码处理器145。编码处理器145可包括能够根据编码器设置145对修改的媒体文件130执行编码或转码的处理器。在将修改的媒体文件130编码或转码成编码的媒体文件150之后,媒体编码器140可将编码的媒体文件150输出到显示器160。可选地,媒体编码器140还可存储编码的媒体文件150用于将来参考。
编码的媒体文件150可包括媒体编码器140对修改的媒体文件130进行编码的结果。编码的媒体文件150可包括编码的诊断剪辑155和编码的媒体内容156,它们可分别包括诊断剪辑110和媒体文件120的编码的形式。尽管在图1中被描绘为编码的媒体文件150的元素,但在可选的实施方式中,编码的诊断剪辑155和编码的媒体内容156每一个可包括独立的文件。
显示器160可包括能够显示编码的媒体文件150的任何设备。显示器160可包括与媒体编码器140相同的设备,如服务器。可选地,显示器160可以是远程机器,如工作站。显示器160还可包括扬声器165。扬声器165可包括能够输出来自编码的媒体文件150的音频的任何设备。扬声器165可以是显示器160的一部分(如图1所示)或可包括独立的设备,如单独的扬声器。
用户170可包括经过培训来使用诊断剪辑110的人。用户170能够查看编码的诊断剪辑155并能够解释它的图形模式和音频轨道。此外,用户170能够重新配置编码器设置145。
诊断剪辑110可首先由用户170定制。例如,中部剪切提取112、安全区域113、场显示顺序114、节奏检测115、插值116a-116d、音频板117和其他模式118可都改变以满足用户170的需要。然后诊断剪辑110可与媒体文件120绑在一起(或者作为一个文件或者作为分开的文件)以形成修改的媒体文件130。然后修改的媒体文件130可被发送到媒体编码器140以进行编码。
媒体编码器140根据编码器设置145将修改的媒体文件130编码成为编码的媒体文件150。编码器设置145可用特定编码的设置预先配置。在特定的编码之后,用户170然后可以立即在显示器160上观察到和听到编码的媒体文件150。在编码的诊断剪辑155中的不需要的结果可能是常见编码问题的症状,如来自16x9源材料的不正确的4x3中部剪切提取、颠倒的场显示顺序、不正确的视频节奏、插值、不当的音频通道映射或不需要的音频向下混合。通过识别编码的诊断剪辑155中的任何反常的图形模式和音频轨道,用户170可确定编码器设置145中的哪些设置需要调整。
编码的诊断剪辑155还可揭露哪些编码导致出现问题。例如,如果在特定的编码之后,编码的诊断剪辑155产生图形异常,用户170可以知道该特定的编码引起错误。于是用户170可重新配置编码器设置145以纠正由编码的诊断剪辑155揭露的问题。在对修改的媒体文件130重新编码之后,用户170可立即再次观看到编码的诊断剪辑155并基于该反馈信息重新配置编码器设置145。用户170可重复该循环直到编码的诊断剪辑155没有错误。可选地,当存储中间编码时,媒体编码器140可执行修改的媒体文件130上所需要的所有编码工作。用户170稍后可再次查看中间编码以鉴定出具体的有问题的编码。
当编码的诊断剪辑155不再显示图形或音频异常时,编码的媒体内容156也可以是没错的,因为两者都经历了用相同的编码器设置145进行编码。于是随之产生的编码的媒体文件150可准备用于广播或其他处理。
来看图2,图2示出了根据本发明的一种实施方式的来自图1中的诊断剪辑110的单个帧。图2中的简图200包括诊断剪辑帧210。诊断剪辑帧210包括中部剪切提取220、安全区域230、场显示顺序240、节奏检测250、插值260a、插值260b、插值260c和插值260d。
诊断剪辑帧210可表示来自诊断剪辑110的视频序列的一个帧。诊断剪辑帧210可包括横向1920个像素和竖向1080个像素的图像。在图2所描绘的实施方式中,诊断剪辑帧210包括具有16x9黑色背景的帧。在可选的实施方式中,诊断剪辑帧210可包括具有不同背景的帧,如16x9视频图像。诊断剪辑帧210可包括来自中部剪切提取220、安全区域230、场显示顺序240、节奏检测250和插值260a-260d的图形模式,它们都可以改变以满足用户170的需要。根据用户170的需要,诊断剪辑帧210还可包括来自图1的其他模式118。
可对应图1中的中部剪切提取112的中部剪切提取220可包括描绘帧内的一定区域的标记。如图2所示,中部剪切提取220可包括帧内的外层白色矩形框。中部剪切提取220可表示正确提取的4x3图像的有效视频的确切区域。在一种实施方式中,当被显示为1080/23.98PsF信号时,中部剪切提取220的顶行可位于行21上而底行位于行1123上。左侧的边线可位于像素240处而右侧的边线位于像素1679处。用户170可通过观察产生的有效视频来验证中部剪切提取。如果图像不够或超出中部剪切提取220的任何白色边界,图像的大小可能不是正确的。可选地,用户170可以在4x3图像的所有四个边处寻找白色边界。
可对应图1中的安全区域113的安全区域230还可包括在帧内描绘一定区域的标记。如图2所示,安全区域230可包括在外层的白色矩形框或中部剪切提取220内部的白色矩形框。安全区域230可描绘是中部剪切提取220的一部分的区域,如90%。因此,90%的安全区域可描绘由中部剪切提取220表示的区域的90%。于是用户170可以通过查看图像是否保持在安全区域230的白色边界内来验证必须保留在安全区域中的任何图像。用户170还能够确定帧图像的部分(如它的中心)相比于帧图像的剩余部分(如它的边界)是否被不成比例地扩大了。
可对应图1中的场显示顺序114的场显示顺序240可包括循环通过整个诊断剪辑110的序列的视觉提示。在图2所描绘的实施方式中,场显示顺序240包括在白色框背景上的黑色竖棒。场显示顺序240可以小于安全区域230,并被放置在帧中心附近。黑色棒可以在白色框内水平移动。从左侧开始,在每一秒,黑色棒可移向右侧,然后循环回来。黑色棒的不连续或不平稳的运动而不是流畅的运动可表明不正确的场显示顺序。
可对应图1中的节奏检测115的节奏检测250可包括能够显示与帧节奏有关的信息的各种标记。在图2中,节奏检测250包括在屏幕底部附近的字母“A”、“B”、“C”和“D”。每一字母可对应连续的帧,开始于“A帧”并且在D之后返回A。图2中在A下面看到的下划线可表明哪个帧是当前可见的。随着诊断剪辑110的序列前进,白色下划线可从A转移到B到C等等,直到它在D之后循环回A。因而用户170能够通过观察下划线的移动来识别不正确的节奏。此外,用户170可以验证节奏从每一秒的顶部的A帧开始,这可能与正确的节奏本身一样重要。节奏检测250允许用户验证节奏而不考虑使用的显示器硬件或播放器软件。
可分别对应图1中的插值116a-116d的插值260a-260d,每一个包括可帮助用户170检测视频图像内的插值的标记。如图2所示,插值260a-260d每一个可包括在安全区域230的角落处的在竖直方向上的破折号图案。关于每一连续帧,插值260a-260d可从竖直方向到水平方向进行交替。如果插值在编码期间被引入,插入的帧可将交替的方向混合在一起,形成代替单一破折号的十字形状。因而用户170能够通过观察代替水平或竖直的破折号形状的十字形状快速确定插值是否被引入。
来看图3,图3示出了根据本发明的一种实施方式的来自编码的诊断剪辑155的两组帧。图3中的简图300包括帧组310和帧组320。帧组310包括帧311、帧312、帧313、帧314和帧315。帧组320包括帧321、帧322、帧323、帧324和帧325。
帧组310可包括来自编码的诊断剪辑155的五个连续帧的序列。帧组310可包括帧311-315。每一个可对应图2中的诊断剪辑帧210的帧311-315,每一个包括来自编码的诊断剪辑155的视频序列的帧。因此,帧311-315中的每一个可包括与诊断剪辑帧210类似的元素。
同样地,帧组320也可包括来自编码的诊断剪辑155的五个连续帧的序列。帧组320可包括帧321-325。每一个可对应图2中的诊断剪辑帧210的帧321-325,每一个包括来自编码的诊断剪辑155的视频序列的帧。因此,帧311-315中的每一个可包括与诊断剪辑帧210类似的元素。
因为由诊断剪辑110揭露的许多问题可能涉及多个帧,所以用户170可能需要观察几个帧来检测某些问题。例如,检验2:3下拉变换之后的节奏需要观察多个帧。NTSC视频以30或29.97帧每秒(fps)进行广播。然而,源材料可能以24或23.98fps摄制。24fps的内容必须被转换成30fps。帧比率为24/30或4/5,这意味着24fps的每4帧,对30fps来说应该是5帧。2:3下拉变换是将4帧拉伸到5帧的方法。例如,如果24fps内容具有源帧A、B、C和D,那么相应的场通常通过在上方场和下方场对放置相同的帧来制作。节奏是A-A-B-B-C-C-D-D,产生帧AA、BB、CC和DD。为了得到该额外帧,在三个场而不是两个场,每隔一个帧放置。因此,2:3节奏现在将是A-A-B-B-B-C-C-D-D-D,并且五个帧将由AA、BB、BC、CD和DD组成。
在24fps源的2:3下拉变换之后,帧组310和320每一个可表示可能的诊断工具序列。在帧311-315、321-325的每一个中的四个角落的图案每一个可对应图1中的插值116a-116d以及图2中的插值260a-260d;在帧311-315、321-325的每一个中的四个字母和下划线可对应图1中的节奏检测115以及图2中的节奏检测250;并且包含帧311-315、321-325的每一个中的竖直棒的白色框每一个可对应图1中的场显示顺序114以及图2中的场显示顺序240。
帧组310可包括以“全帧”示出的帧311-315,其中一帧的两个场被一起示出。帧311没示出插值的迹象,因为角落标记是完全白色的破折号而不是十字形状,这表明两个场都来自同一源帧。此外,帧311可能是A帧,如A下面的下划线所表明的。因此帧311可能是帧AA。以类似的形式,帧312和315可分别是帧BB和DD。帧313可能示出插值的迹象,因为角落拐角标记是灰色的十字形状而不是白色的破折号,这表示是黑色和白色的混合。在字母B和C下面的灰色下划线暗示来自帧B和C的场的混合,表明帧313可能是帧BC。以类似的形式,帧314可被鉴定为帧CD。帧313和314是抖动帧,因为它们可能由两个不同的源帧混合。由于帧311-315可包括来自上面讨论的2:3节奏的帧AA、BB、BC、CD、DD,帧组310可符合正确的2:3节奏,这包括从A帧开始。最后,竖直的黑色棒在帧序列中从左侧移到右侧,表明正确的场顺序。
帧组320可包括以“场模式”示出的帧321-325,其中每帧只显示了两个场中的一个。在此,帧组320可只显示第二个场,并且因此不存在抖动帧。由于角落的破折号根据帧而进行交替,帧321-325中没有一个示出插值的迹象,这在场模式中可以预料到。下划线表明帧321-325可分别包括帧A、B、C、D及又一个D。在从2:3节奏抽出第一个场之后,场模式中的正确节奏是A-B-C-D-D。因此,帧组320可符合正确的节奏,也从A帧开始。根据帧组310和320,用户170可不必关于节奏、场顺序或插值调整编码器设置145。
来看图4,图4示出根据本发明的一种实施方式的描述步骤的流程图,通过流程图,经过培训的用户可以使用诊断工具来验证编码之后的媒体内容。流程图400之外的某些细节和特征对本领域的普通技术人员来说是显而易见的。例如,在本领域众所周知,一个步骤可包括一个或多个子步骤或可包含专门的设备或材料。尽管流程图400中表明的步骤410到450足够描述本发明的一种实施方式,但本发明的其他实施方式可使用不同于流程图400中示出的那些步骤。
参考图4中的流程图400的步骤410和图1中的简图100,流程图400的步骤410包括为编码准备图1中的诊断剪辑110。诊断剪辑110可用一组默认的图形模式进行预设置。然而,用户170还可能增加或修改图形的或音频的模式。例如,用户170可能希望通过减小安全区域的大小来修改安全区域113,或增加其他模式118。用户170可能知道已经设置了什么图形和音频模式,因此期望来自编码的诊断剪辑155的确定输出。
参考图4中的流程图400的步骤420和图1中的简图100,流程图400的步骤420包括在媒体文件120中嵌入诊断剪辑110以形成修改的媒体文件130。如前所述,诊断剪辑110可在任何编码之前被放置在媒体文件120的头部或尾部。可选地,诊断剪辑110可被用作通过无磁带的工作流程跟随媒体文件120的独立剪辑。诊断剪辑110可经历与媒体文件120相同的编码,来确保用户170对诊断剪辑110的诊断也适用于媒体文件120。
参考图4中的流程图400的步骤430和图1中的简图100,流程图400的步骤430包括媒体编码器140的编码处理器146根据编码器设置145对修改的媒体文件130进行编码以创建编码的媒体文件150。编码的媒体文件150可包括编码的诊断剪辑155和编码的媒体内容156,它们可分别包括诊断剪辑110和媒体文件120的编码形式。编码器设置145可能没有被适当配置来正确地对修改的媒体文件130编码。编码器设置145可需要调整,之后可重新编码修改的媒体文件130。
参考图4中的流程图400的步骤440和图1中的简图100,流程图400的步骤440包括在显示器160上向用户170显示编码的诊断剪辑155。如前所述,显示器160可包括与媒体编码器140不同的设备。用户170还可能需要通过扬声器165听到编码的诊断剪辑155。扬声器165可包括与显示器160不同的设备或可包括相同的设备。显示器160可如实地显示编码的诊断剪辑155,包括从编码产生的任何错误。
参考图4中的流程图400的步骤450、图1中的简图100和图2中的简图200,流程图400的步骤450包括用户170通过查看编码的诊断剪辑155评估编码器设置145的准确性。用户170可查看编码的诊断剪辑155以接收关于不需要的编码效果的即时的视觉和听觉反馈信息。如前所述,诊断剪辑帧210的元素可向用户170提供关于在编码之后可能产生的常见问题的各种指示。例如,用户170可注意到,中部剪切提取220的部分没有出现,这表明与中部剪切提取有关的错误。于是用户170可在编码器设置145中纠正中部剪切提取设置。显示器160可允许用户170调整编码器设置145。可选地,用户170可直接通过媒体编码器140调整编码器设置145。一旦已知的问题得到解决,诊断剪辑110然后可根据调整的编码器设置145重新编码并接着由用户170重新查看以验证所做的纠正。在该实例中,用户170可重做中部剪切提取,然后确认中部剪切提取220正确地出现在屏幕上。
根据本发明的以上描述,显然,可使用各种技术来实现本发明的概念而不偏离它的范围。而且,尽管具体参考某些实施方式描述了本发明,但本领域的普通技术人员将认识到,不偏离本发明的精神和范围可以在形式和细节上进行改变。如此一来,所描述的实施方式在各个方面都被认为是说明性的而不是限制性的。还应该理解,本发明不限于本文描述的特定实施方式,而能够不偏离本发明的范围进行许多重新组合、修改和替换。

Claims (20)

1.一种用于确认关于媒体文件的正确的编码器处理的系统,所述系统包括:
准备好的诊断剪辑;
修改的媒体文件,其通过在所述媒体文件中嵌入所述诊断剪辑来创建;
处理器,其被配置成:
根据一组编码器设置来对所述修改的媒体文件编码,以创建嵌入了编码的诊断剪辑的编码的媒体文件;
向用户显示所述编码的诊断剪辑;以及
基于从用户接收的反馈信息接收调整的编码器设置。
2.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:显示来自所述编码器设置的视频和音频错误。
3.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:表明中部剪切提取的准确性。
4.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:表明安全区域的完整性。
5.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:图示场显示顺序。
6.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:显示视频节奏。
7.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:表明插值的存在。
8.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:鉴定出所有音频通道。
9.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:显示其他视频模式。
10.如权利要求1所述的系统,其中所述诊断剪辑还被配置成:回放其他音频序列。
11.一种用于确认关于媒体文件的正确的编码器处理的方法,所述方法包括:
准备诊断剪辑;
在所述媒体文件中嵌入所述诊断剪辑,以创建修改的媒体文件;
根据一组编码器设置来对所述修改的媒体文件编码,以创建嵌入了编码的诊断剪辑的编码的媒体文件;
向用户显示所述编码的诊断剪辑;以及
基于从用户接收的反馈信息评估所述编码器设置的准确性。
12.如权利要求11所述的方法,其中所述显示还包括:显示来自所述编码器设置的视频和音频错误。
13.如权利要求11所述的方法,其中所述显示还包括:表明中部剪切提取的准确性。
14.如权利要求11所述的方法,其中所述显示还包括:表明安全区域的完整性。
15.如权利要求11所述的方法,其中所述显示还包括:图示场显示顺序。
16.如权利要求11所述的方法,其中所述显示还包括:显示视频节奏。
17.如权利要求11所述的方法,其中所述显示还包括:表明插值的存在。
18.如权利要求11所述的方法,其中所述显示还包括:鉴定出所有音频通道。
19.如权利要求11所述的方法,其中所述显示还包括:显示其他视频模式。
20.如权利要求11所述的方法,其中所述显示还包括:回放其他音频序列。
CN201110396749.9A 2010-12-22 2011-12-02 音视频模式序列诊断工具的系统和方法 Active CN102543132B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/928,990 2010-12-22
US12/928,990 US8755430B2 (en) 2010-12-22 2010-12-22 System and method for audio video pattern sequence diagnostic tool

Publications (2)

Publication Number Publication Date
CN102543132A true CN102543132A (zh) 2012-07-04
CN102543132B CN102543132B (zh) 2016-05-04

Family

ID=45002615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110396749.9A Active CN102543132B (zh) 2010-12-22 2011-12-02 音视频模式序列诊断工具的系统和方法

Country Status (3)

Country Link
US (1) US8755430B2 (zh)
EP (1) EP2469877B1 (zh)
CN (1) CN102543132B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702214A (zh) * 2013-12-10 2014-04-02 乐视网信息技术(北京)股份有限公司 一种视频播放方法和电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120185604A1 (en) * 2011-01-14 2012-07-19 Alexander Shatsky System and method for indicating callee preferences
US9749686B2 (en) 2015-09-21 2017-08-29 Sling Media Pvt Ltd. Video analyzer
US9693063B2 (en) * 2015-09-21 2017-06-27 Sling Media Pvt Ltd. Video analyzer

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243688A (zh) * 2004-06-07 2008-08-13 斯灵媒体公司 个人媒体广播系统
CN101512656A (zh) * 2005-06-30 2009-08-19 微软公司 具有提前渲染队列的gpu时间线
CN101646050A (zh) * 2009-09-09 2010-02-10 中国电信股份有限公司 视频文件的文本注释方法和系统、播放方法和系统
CN101687547A (zh) * 2007-07-05 2010-03-31 空中客车运作有限责任公司 用于传输音频数据的系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4534172B2 (ja) * 2008-04-03 2010-09-01 ソニー株式会社 画像処理装置、画像処理方法、及びプログラム
US8248527B2 (en) * 2009-08-20 2012-08-21 Broadcom Corporation Method and system for video overlay on film detection on progressive video input
US8279344B2 (en) * 2009-12-14 2012-10-02 Qnx Software Systems Limited Synchronization of video presentation by video cadence modification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243688A (zh) * 2004-06-07 2008-08-13 斯灵媒体公司 个人媒体广播系统
CN101512656A (zh) * 2005-06-30 2009-08-19 微软公司 具有提前渲染队列的gpu时间线
CN101687547A (zh) * 2007-07-05 2010-03-31 空中客车运作有限责任公司 用于传输音频数据的系统和方法
CN101646050A (zh) * 2009-09-09 2010-02-10 中国电信股份有限公司 视频文件的文本注释方法和系统、播放方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HQV: "《HD HQV BENCHMARK TESTING & SCORING GUIDE》", 6 June 2007, article "HD HQV BENCHMARK TESTING & SCORING GUIDE", pages: 3 - 12 *
SMPTE: "《Video Index Information Coding for 525- and 625-Line Television Systems》", 31 December 2008, article "Video Index Information Coding for 525- and 625-Line Television Systems" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702214A (zh) * 2013-12-10 2014-04-02 乐视网信息技术(北京)股份有限公司 一种视频播放方法和电子设备

Also Published As

Publication number Publication date
US8755430B2 (en) 2014-06-17
CN102543132B (zh) 2016-05-04
EP2469877A3 (en) 2013-05-29
EP2469877B1 (en) 2016-09-07
US20120163442A1 (en) 2012-06-28
EP2469877A2 (en) 2012-06-27

Similar Documents

Publication Publication Date Title
JP5144802B1 (ja) 表示装置
CN102543132A (zh) 音视频模式序列诊断工具的系统和方法
TWI568239B (zh) 三維視訊廣播之輔助資料
EP1703730A1 (en) Method and apparatus for composing images during video communications
US7190878B2 (en) Editing video data
US20020154220A1 (en) Video streams for closed caption testing and the like
CN107690074A (zh) 视频编码和还原方法、视频播放系统以及相关设备
CN106713963B (zh) 一种对齐视频流的播放进度的方法及装置
CN102244745A (zh) 一种调整电视机图像完整度的方法及装置
JP4637235B2 (ja) 映像連動型制御対象外部機器制御装置
CN112099744A (zh) 图像显示方法、装置及系统
CN105704508A (zh) 一种视频合并方法及装置
CN102316346A (zh) 图像数据发送设备和方法、接收设备和方法及系统
CN207854084U (zh) 一种字幕显示系统
JP2011087088A (ja) 映像信号処理装置及び映像信号処理方法
EP2638698B1 (en) Method for processing a three- dimensional video content and relative apparatus
KR102176474B1 (ko) 영상표시장치, 영상표시장치의 구동방법 및 영상표시방법
CN102769732A (zh) 一种实现视频场的转换方法
CN106658037A (zh) 一种多视频流的视频直播的方法及装置
CN102334340B (zh) 三维影像处理装置及三维影像处理方法
CN102036085B (zh) 发送装置、接收装置、通信系统
KR100817055B1 (ko) 회귀경로를 이용한 영상처리 시스템 장치 및 영상처리 방법
KR20100079877A (ko) 네트워크 기반 자막 생성 방법 및 시스템
JP4393425B2 (ja) 映像機器、映像記録方法および映像再生方法
WO2010131493A1 (ja) 動画像処理装置、動画像処理方法、情報記憶媒体及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant