CN106385628A - 一种分析音视频不同步的装置及方法 - Google Patents
一种分析音视频不同步的装置及方法 Download PDFInfo
- Publication number
- CN106385628A CN106385628A CN201610847193.3A CN201610847193A CN106385628A CN 106385628 A CN106385628 A CN 106385628A CN 201610847193 A CN201610847193 A CN 201610847193A CN 106385628 A CN106385628 A CN 106385628A
- Authority
- CN
- China
- Prior art keywords
- video
- audio
- frame
- source signal
- video source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/4302—Content synchronisation processes, e.g. decoder synchronisation
- H04N21/4307—Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8547—Content authoring involving timestamps for synchronizing content
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种分析音视频不同步的装置及方法,所述装置包括:检测模块,用于检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;判断模块,用于根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;输出模块,用于当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。本发明还公开了相应的分析音视频不同步的方法。本发明可以在发现视频源信号的音频帧和视频帧信号不同步时,精准、实时输出视频源信号各个阶段的音频帧信息和视频帧信息,以便调试人员根据该频帧信息和视频帧信息定位音视频不同步问题的具体原因,进行针对性的校正处理,提升终端的视听效果。
Description
技术领域
本发明涉及领域对媒体播放领域,尤其涉及一种分析音视频不同步的装置及方法。
背景技术
在移动互联网时代,随着智能终端的推广和普及,用户不断追求高品质的音视体验,高码率、高分辨率、多声道、无损音源渐渐成为标配,对多媒体的视频的画面质量要求越来越高。
智能终端的视频播放器开发时通常需要集成测试不同文件类型、编码类型的视频源,相同编码类型不同层级(level)、不同架构(profile)的视频源,以满足用户音视频源的多样性。在集成开发阶段,调试视频测试源时,经常会出现各种问题:如音频滞后图片,音频领先于图片,很难分析、定位引入这些音视频不同步的原因,给音视频开发调试带来较大的困难。
发明内容
本发明的主要目的在于提出一种分析音视频不同步的装置及方法,旨在分析定位智能终端的音视频开发过程中遇到的音视频不同步原因。
为实现上述目的,本发明提供的一种分析音视频不同步的装置,包括:
检测模块,用于检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
判断模块,用于根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
输出模块,用于当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
进一步地,所述装置中,所述视频源信号的音频帧和视频帧不同步,包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
进一步地,所述装置中,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
进一步地,所述装置还包括:
输出控制模块,用于设置标志位;
所述输出模块当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:
根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
进一步地,所述装置中,
所述音频帧信息包括:音频采样率、采样位数、声道数、音频的编解码类型、帧数;
所述视频帧信息包括:图像分辨率、图像的格式类型、帧率、视频的解码时间戳DTS、显示时间戳PTS、编解码类型、编解码架构codec profile、编解码层级codec level、帧数。
相应地,本发明还提供了一种分析音视频不同步的方法,包括:
检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
进一步地,所述方法中,所述视频源信号的音频帧和视频帧不同步,包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
进一步地,所述方法中,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
进一步地,所述方法还包括:
设置标志位;
所述当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
进一步地,所述方法中,
所述音频帧信息包括:音频采样率、采样位数、声道数、音频的编解码类型、帧数;
所述视频帧信息包括:图像分辨率、图像的格式类型、帧率、视频的解码时间戳DTS、显示时间戳PTS、编解码类型、编解码架构codec profile、编解码层级codec level、帧数。
本发明实施例提供的分析音视频不同步的装置及方法,可以在发现视频源信号的音频帧和视频帧信号不同步时,精准、实时输出视频源信号各个阶段的音频帧信息和视频帧信息,以便调试人员根据该频帧信息和视频帧信息定位音视频不同步问题的发生阶段,从而判断发生音视频不同步的具体原因,进行针对性的校正处理,提升终端的视听效果。
附图说明
图1为实现本发明各个实施例的移动终端的硬件结构示意图;
图2为本发明第一实施例的一种分析音视频不同步的装置结构示意图;
图3为本发明第二实施例的一种分析音视频不同步的装置结构示意图;
图4为本发明第三实施例的一种分析音视频不同步的方法流程示意图;
图5为本发明第四实施例的一种分析音视频不同步的方法流程示意图;
图6为本发明的一种示范性实施例的dumpVideoPlayerLog音视频帧信息的系统框图;
图7为本发明示范性实施例的dumpVideoPlayerLog音视频帧信息方法流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“模块”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"模块"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为实现本发明各个实施例的移动终端的硬件结构示意。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、接口单元140、输出单元150、存储器160、控制器170等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块、移动通信模块、无线互联网模块、短程通信模块和位置信息模块中的至少一个。
广播接收模块经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。经由广播接收模块接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机和麦克风。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
接口单元140用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。
输出单元150可以包括显示单元151、音频输出模块152等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
存储器160可以存储由控制器170执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器170通常控制移动终端的总体操作。例如,控制器170执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器170可以包括用于再现(或回放)多媒体数据的多媒体模块180,多媒体模块180可以构造在控制器170内,或者可以构造为与控制器170分离。控制器170可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器170中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器170执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
基于上述移动终端硬件结构以及通信系统,提出本发明的各个实施例。
如图2所示,本发明第一实施例提出一种分析音视频不同步的装置,包括:
检测模块,用于检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
判断模块,用于根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
输出模块,用于当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
针对终端集成开发阶段,调试视频测试源时无法确定音视频不同步的原因问题,本发明实施例提出一种分析音视频不同步的装置,在视频源信号的文件解析(parser)、音频视频文件分拆(demuxer)、音频视频文件解码(decoder)、音频视频数据输出(output)等关键阶段输出(dump)音、视频的音视帧和视频帧信息,以便调试人员判断音视频不同步问题出现在视频源信号的哪个阶段,缩小造成不同步的问题具体范围。
本实施例中,以系统时间为时间基准轴,分析音视帧和视频帧是否同步,例如,可以根据音频帧的时间戳和视频帧的时间戳,判断音频帧对应的时间和视频帧对应的时间是否相差2个或以上的连续视频帧的时长。通常,如果当音频帧对应的时间和视频帧相差对应的时间相差的时长达到2个连续视频帧的时长时,人就会感觉到音视频不同步,可以将2个连续视频帧的时长作为判断音视频不同步的阈值。因此,可以在视频播放器的数据输出端口,检测视频源信号的音频帧时间戳和视频帧时间戳,根据检测到的音频帧时间戳和视频帧的时间戳,就可以判断音频帧和视频帧是否同步。当发现音频帧和视频帧不同步时,可以回溯播放该视频源信号,输出(dump)该视频源信号的文件解析器(parser)、音频视频文件分拆器(demuxer)、音频视频文件解码器(decoder)、音频视频数据输出(output)等关键阶段音视帧和视频帧信息输出。这样,调试人员就可以分析该视频源信号各个阶段的音频帧信息和视频帧信息,确定发生音视频不同步的具体原因,进行针对性的校正处理。
本发明实施例提供的分析音视频不同步的装置,可以在发现视频源信号的音频帧和视频帧信号不同步时,精准、实时输出视频源信号各个阶段的音频帧信息和视频帧信息,以便调试人员根据该频帧信息和视频帧信息定位音视频不同步问题的发生阶段,从而判断发生音视频不同步的具体原因,进行针对性的校正处理,提升终端的视听效果。
可选地,上述装置中,所述视频源信号的音频帧和视频帧不同步包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
其中,音频帧时间戳可以表示音频帧对应的时间(简称音频帧时间),视频帧时间戳可以表示视频帧对应的时间(简称视频帧时间)。
本实施例中,音频帧和视频帧不同步的检测,可以通过以下方式进行:
1、以系统时间作为音视频的参考时间;
2、根据音频帧的时间戳和视频帧的时间戳,记当前检测的音频帧时间为Taudio,视频帧时间为TVideo;
3、如果|Taudio-TVideo|>=2*视频帧的显示时长,则可以判断音频帧和视频帧不同步。
通常,音视频帧对应的时间相差2个或以上连续视频帧的时长时,人就会感觉到音视频不同步,因此,可以以此作为判断音视频不同步的依据。
可选地,上述装置中,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
一般的音视频播放器在播放视频源信号时,该视频源信号通常会依次经过音视频文件的文件解析器(parser)、音频视频文件分拆器(demuxer)、音频视频文件解码器(decoder)、然后进行音频视频数据输出(output)到硬件设备进行播放。音视频不同的原因,可能出现在上述各个阶段的相关音视频文件中,最后表现在音频数据和视频数据的输出不同步而为用户所感知。因此,可以在音频数据和视频数据输出端口检测输出的音频帧时间戳和视频帧时间戳,然后进行比较,只要音频帧和视频帧出现明显不同步,例如音视频帧对应的时间相差2个连续视频帧的时长或更多,就可以判断相关视频源信号的音频帧和视频帧存在不同步问题,可以根据具体情况,输出上述各个阶段的音视频镜像文件,或者根据经验分析,输出相关阶段的音视频镜像文件,以便进行针对性的详细分析,定位导致音频帧和视频帧不同的具体原因,进行针对性的修改校正。
上述输出的音频帧镜像文件的音频帧信息包括但不限于:音频采样率、采样位数、声道数、音频的编解码类型、帧数;输出的视频帧镜像文件的视频帧信息包括但不限于:图像分辨率、图像的格式类型、帧率、视频的解码时间戳(DTS)、显示时间戳(PTS)、编解码类型、编解码架构(codec profile)、编解码层级(codec level)、帧数。
可选地,作为本发明另一实施例,如图3所示,在第一实施例的基础上,本发明提供的装置,还包括:
输出控制模块,用于设置标志位;
所述输出模块当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:
根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
在终端的视频播放器的集成开发阶段调试视频测试源时,可以通过本发明提供的装置,在音频数据和视频数据输出端口检测输出的音频帧时间戳和视频帧时间戳,当根据检测的音频帧时间戳和视频帧时间戳判断音频帧和视频帧出现明显不同步时,可以根据需要,在视频源播放的各个阶段均输出相应的音视频镜像文件(即:dump输出音频帧信息和视频帧信息),便于调试人员进行全面分析判断。而有些时候,音视频出现不同步的问题可能比较明显集中在视频源播放的某个阶段,或某几个阶段,为了节省终端的功耗和避免太多信息的干扰,可以通过设置标志位来要求本发明装置针对性地输出某个阶段或某几个阶段的音频帧信息和视频帧信息的镜像文件。例如,可以设置总开关标志位,当该标志位置位,例如设置为“1”时,表示需要输出上述所有阶段的音频帧信息和视频帧信息;如果该标志为“0”,则表示不输出任何音视频帧的数据;还可以分别设置parser阶段输出标志位、demuxer阶段输出标志位、decoder阶段输出标志位和output阶段输出标志位。例如,可以设置一个8bit的标志位寄存器,当该寄存器设置为10000000时,表示输出所有阶段的音频帧信息和视频帧信息;10000001表示输出parser阶段的音频帧信息和视频帧信息;10000010表示输出demuxer阶段的音频帧信息和视频帧信息;10000100表示输出decoder阶段的音频帧信息和视频帧信息;10001000表示输出output阶段的音频帧信息和视频帧信息;也可以同时输出多个阶段的音频帧信息和视频帧信息,例如,10000011表示输出parser阶段和demuxer阶段的音频帧信息和视频帧信息;10000111表示输出parser、demuxer和decoder阶段的音频帧信息和视频帧信息,以此类推。而最高位为“0”,则表示关闭输出音频帧信息和视频帧信息的功能。当然,也可以采用其他方式设置标志位,只要能够根据需要控制相应的音频帧信息和视频帧信息即可。
较佳地,在输出相关阶段的音频帧信息和视频帧信息前,先清除之前输出的音频帧信息和视频帧信息(历史信息),只显示当前需要的音频帧信息和视频帧信息,供调试人员分析使用。
本发明实施例提供的分析音视频不同步的装置,通过设置视频播放器的帧信息dump输出开关,可以在发现视频源信号的音频帧和视频帧信号不同步时,根据实际需要,精准、实时控制输出视频源信号各个阶段的音频帧信息和视频帧信息,提高调试分析视频源的音视频不同步的效率,进而提升终端的视听效果。
针对本发明的技术问题,本发明第三实施例提供了一种分析音视频不同步的方法,如图4所示,包括:
步骤10:检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
步骤12:根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
步骤14:当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
上述实施例中,可以在视频播放器数据输出端口检测视频源信号的音频帧时间戳和视频帧时间戳,根据音频帧时间戳和视频帧时间戳判断视频源信号的音频帧和视频帧是否同步,如果判断音频帧和视频帧不同步,则输出视频源信号各个阶段的音频帧信息和视频帧信息。
本发明实施例提供的分析音视频不同步的方法,可以在发现视频源信号的音频帧和视频帧信号不同步时,精准、实时输出视频源信号各个阶段的音频帧信息和视频帧信息,以便调试人员根据该频帧信息和视频帧信息定位音视频不同步问题的发生阶段,从而判断发生音视频不同步的具体原因,进行针对性的校正处理,提升终端的视听效果。
较佳地,上述方法中,所述视频源信号的音频帧和视频帧不同步,包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
其中,音频帧时间戳可以表示音频帧对应的时间,视频帧时间戳可以表示视频帧对应的时间。
可选地,上述方法中,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
作为一个较佳的实施例,如图6所示,在图5方法的基础上,在步骤14之前还包括:
步骤13:设置标志位;
此时,步骤14中所述当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:
根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
较佳地,上述方法中,所述音频帧信息包括:音频采样率、采样位数、声道数、音频的编解码类型、帧数;
所述视频帧信息包括:图像分辨率、图像的格式类型、帧率、视频的解码时间戳(DTS)、显示时间戳(PTS)、编解码类型、编解码架构(codec profile)、编解码层级(codeclevel)、帧数。
可选地,在步骤13之后步骤14之前,还可以包括:
清除之前输出的各个阶段的音频帧信息和视频帧信息。
本发明实施例提供的分析音视频不同步的方法,通过设置视频播放器的帧信息dump输出开关,可以在发现视频源信号的音频帧和视频帧信号不同步时,根据实际需要,精准、实时控制输出视频源信号各个阶段的音频帧信息和视频帧信息,提高调试分析视频源的音视频不同步的效率,进而提升终端的视听效果。
下面通过一个示范性实施例,进一步详细说明本发明。如图6所示,以移动终端中常用的Android系统视频播放器为例,可以在音频数据和视频数据的输出端口,采用下述方法检测音频帧和视频帧是否同步:
1)设音视频以系统时间为时间基准轴,即以系统时间作为音视频的参考时间;
2)根据检测的音频帧时间戳和视频帧时间戳,其中,音频帧时间戳可以表示音频帧对应的时间(简称音频帧时间),视频帧时间戳可以表示视频帧对应的时间(简称视频帧时间);记当前检测的音频帧时间为Taudio,视频帧时间为TVideo;
3)当|Taudio-TVideo|>=2*视频帧的显示时长时,判断该视频源信号的音频帧和视频帧不同步。
可以在判断分析音频帧和视频帧不同步时,回溯播放该视频源,根据具体情况,输出音、视频播放的parser、demuxer、decoder、output几个阶段的音频帧信息和视频帧信息。
本示范性实施例中,可以通过以下方式实现:
1.定义类dumpVideoPlayerLog(备注:安卓系统编程语言格式)用于控制音、视频帧信息输出,即音、视频播放的parser、demuxer、decoder、output几个阶段的输出,以及清除已有音视频帧信息数据;
2.定义供parser、demuxer、decoder、output各个模块调用的接口:
1)clearPreVideoPlayerFrameInfo()(备注:安卓系统编程语言格式)清除已有的音视频帧信息;
2)outputVideoPlayerFrameInfo(videoplayer_process_type)(备注:安卓系统编程语言格式)根据类型,控制输出出音、视频播放的parser、demuxer、decoder、output某个阶段的音、视频帧信息。
音、视频帧信息包括但不限于如下字段:
1)音频帧:音频采样率、采样位数、声道数、音频的codec类型、帧数;
2)视频帧:图像分辨率、图像的格式类型、帧率、视频的DTS(解码时间戳)、PTS(显示时间戳)、codec类型、codec profile(编解码框架)、codec level(编解码层级)、帧数;
3.设置dumpVideoPlayerLog(备注:安卓系统编程语言格式)帧数据的开关,控制音、视频帧信息是否输出:
开启输出帧信息数据开关会增加系统的内存和耗电开销,因此在调试时,默认关闭该模块,将开关“dump.videoplayer.enable”(输出视频播放器使能)默认设置为0,在调试、分析音视频不同步原因,才将该变量设置为1,以提供辅助信息。
1)总开关用于控制4个VideoPlayer(视频播放器)帧数据是否输出:
dump.videoplayer.enable(输出视频播放器使能,简称dump标志位):1输出;0不输出;
2)parser阶段的音、视频帧信息输出开关:
dump.videoplayer.parser.enable(输出视频播放器的解析器使能,简称parser标志位):1输出;0不输出;
3)demuxer阶段的音、视频帧信息输出开关:
dump.videoplayer.demuxer.enable(输出视频播放器的分拆器使能,简称demuxer标志位):1输出;0不输出;
4)decoder阶段的音、视频帧信息输出开关:
dump.videoplayer.decoder.enable(输出视频播放器的解码器使能,简称decoder标志位):1输出;0不输出;
5)output阶段的音、视频帧信息输出开关:
dump.videoplayer.output.enable(输出视频播放器的数据输出使能,简称output标志位):1输出;0不输出。
4.生成公用库动态库:
1)配置Android.mk文件,设置LOCAL_MODULE=libdumpvideoplayerlog,引用变量include$((BUILD_SHARED_LIBRARY);
2)根据配置属性,编译生成一个公用的动态库ldumpVideoPlayerLog.so供parser、demuxer、decoder、output各个模块使用。
本示范性实施例的dumpVideoPlayerLog音视频帧信息所处的系统框图,如图6所示:虚线框是增加的输出音频帧和视频帧信息的模块。其中,GPU为图像处理器(Graphicprocessing unit),PCM为脉冲编码调制(Pulse Code Modulation),YUV为图像编码格式。
本示范性实施例的dumpVideoPlayerLog音视频帧信息流程图,如图7所示。
具体实现时,可以在安卓系统中使用动态库libdumpvideoplayerlog.so:
1)在parser、demuxer、decoder、output各个播放模块引用头文件dumpvideoplayerlog.h;
2)在parser、demuxer、decoder、output各个模块Android.mk引用LOCAL_SHARED_LIBRARIES+=libdumpvideoplayerlog;
3)调用流程,先调用clearPreVideoPlayerFrameInfo()清除已有音视频帧数据,然后outputVideoPlayerFrameInfo()输出音视频帧信息数据。
可以在调试过程中,开启dumpVideoPlayerLog的音、视频帧数据开关:
例如,通过adb端口调试dumpVideoPlayerLog的开或关,用于各个阶段的音视频帧信息的输出;
1)adb shell setprop dump.videoplayer.enable 1(备注:安卓系统编程语言格式)开启dump音视频帧信息的总开关(或简称设置dump标志位);
2)adb shell setprop dump.videoplayer.parser.enable 1(备注:安卓系统编程语言格式)开启dump parser音视频帧信息开关(或简称设置parser标志位);
3)adb shell setprop dump.videoplayer.demuxer.enable 1(备注:安卓系统编程语言格式)开启dump demuxer音视频帧信息开关(或简称设置demuxer标志位);
4)adb shell setprop dump.videoplayer.decoder.enable 1(备注:安卓系统编程语言格式)开启dump decoder音视频帧信息开关(或简称设置decoder标志位);
5)adb shell setprop dump.videoplayer.output.enable 1(备注:安卓系统编程语言格式)开启dump output音视频帧信息开关(或简称设置output标志位)。
本示范性实施例中,可以通过dump.videoplayer.enable总开关,控制四个阶段的音频帧信息和视频帧信息的输出。例如,当总开关为“1”时,同时输出四个阶段的音频帧信息和视频帧信息;也可以同时分别设置四个阶段各自的开关,例如dump.videoplayer.parser.enable为“1”,其它为“0”;则当总开关为“1”时,仅输出parser阶段的音频帧和视频帧信息。其它类推。当总开关为“0”时,则关闭所有音频帧和视频帧信息的输出,以节终端的功耗。
本实施例的视频播放器的音视频帧信息dump输出机制,可以方便地移植到新平台,容易开发和维护。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,PDA等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种分析音视频不同步的装置,其特征在于,包括:
检测模块,用于检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
判断模块,用于根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
输出模块,用于当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
2.如权利要求1所述的装置,其特征在于,所述视频源信号的音频帧和视频帧不同步,包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
3.如权利要求1或2所述的装置,其特征在于,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
4.如权利要求1或2所述的装置,其特征在于,还包括:
输出控制模块,用于设置标志位;
所述输出模块当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:
根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
5.如权利要求3所述的装置,其特征在于,
所述音频帧信息包括:音频采样率、采样位数、声道数、音频的编解码类型、帧数;
所述视频帧信息包括:图像分辨率、图像的格式类型、帧率、视频的解码时间戳DTS、显示时间戳PTS、编解码类型、编解码架构codec profile、编解码层级codec level、帧数。
6.一种分析音视频不同步的方法,其特征在于,包括:
检测视频播放器输出的视频源信号的音频帧时间戳和视频帧时间戳;
根据检测结果判断所述视频源信号的音频帧和视频帧是否同步;
当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息。
7.如权利要求6所述的方法,其特征在于,所述视频源信号的音频帧和视频帧不同步,包括:
所述视频源信号的音频帧时间戳和视频帧时间戳相差2个或以上连续视频帧的时长。
8.如权利要求6或7所述的方法,其特征在于,所述视频源信号的各个阶段包括以下一项或多项:
视频源信号的解析阶段、视频源信号的音频视频文件分拆阶段、视频源信号的音频视频文件解码阶段、视频源信号的音频视频数据输出阶段。
9.如权利要求6或7所述的方法,其特征在于,还包括:
设置标志位;
所述当判断所述视频源信号的音频帧和视频帧不同步时,输出所述视频源信号各个阶段的音频帧信息和视频帧信息,包括:根据所述标志位,输出所述视频源信号的与所述标志位相对应的阶段的音频帧信息和视频帧信息。
10.如权利要求8所述的方法,其特征在于,
所述音频帧信息包括:音频采样率、采样位数、声道数、音频的编解码类型、帧数;
所述视频帧信息包括:图像分辨率、图像的格式类型、帧率、视频的解码时间戳DTS、显示时间戳PTS、编解码类型、编解码架构codec profile、编解码层级codec level、帧数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610847193.3A CN106385628A (zh) | 2016-09-23 | 2016-09-23 | 一种分析音视频不同步的装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610847193.3A CN106385628A (zh) | 2016-09-23 | 2016-09-23 | 一种分析音视频不同步的装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106385628A true CN106385628A (zh) | 2017-02-08 |
Family
ID=57935851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610847193.3A Pending CN106385628A (zh) | 2016-09-23 | 2016-09-23 | 一种分析音视频不同步的装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106385628A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107454479A (zh) * | 2017-08-22 | 2017-12-08 | 无锡天脉聚源传媒科技有限公司 | 一种多媒体数据的处理方法及装置 |
CN108989890A (zh) * | 2018-09-03 | 2018-12-11 | 四川长虹电器股份有限公司 | 基于GStreamer框架的音视频错源排查方法 |
CN110324689A (zh) * | 2019-07-08 | 2019-10-11 | 广州酷狗计算机科技有限公司 | 音视频同步播放的方法、装置、终端及存储介质 |
CN110559012A (zh) * | 2019-10-21 | 2019-12-13 | 江苏鹿得医疗电子股份有限公司 | 电子听诊器及其控制方法及医疗设备的控制方法 |
CN112188259A (zh) * | 2020-09-29 | 2021-01-05 | 北京达佳互联信息技术有限公司 | 用于音视频同步测试和校正的方法、装置及电子设备 |
CN112653916A (zh) * | 2019-10-10 | 2021-04-13 | 腾讯科技(深圳)有限公司 | 一种音视频同步优化的方法及设备 |
CN113556595A (zh) * | 2021-06-16 | 2021-10-26 | 珠海全志科技股份有限公司 | 基于Miracast的回放方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100142624A1 (en) * | 2007-08-27 | 2010-06-10 | Fujitsu Limited | Decoder and decoding method |
CN101742548A (zh) * | 2009-12-22 | 2010-06-16 | 武汉虹信通信技术有限责任公司 | 基于h.324m协议的3g视频电话的音视频同步测试装置及方法 |
US20150074729A1 (en) * | 2013-09-12 | 2015-03-12 | Samsung Electronics Co., Ltd. | Apparatus and method for processing audio, method for setting initialization mode, and computer-readable recording medium |
CN104902317A (zh) * | 2015-05-27 | 2015-09-09 | 青岛海信电器股份有限公司 | 音视频同步方法及装置 |
CN105657512A (zh) * | 2016-01-29 | 2016-06-08 | 四川长虹电器股份有限公司 | 一种数字视频音画失步监测方法 |
-
2016
- 2016-09-23 CN CN201610847193.3A patent/CN106385628A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100142624A1 (en) * | 2007-08-27 | 2010-06-10 | Fujitsu Limited | Decoder and decoding method |
CN101742548A (zh) * | 2009-12-22 | 2010-06-16 | 武汉虹信通信技术有限责任公司 | 基于h.324m协议的3g视频电话的音视频同步测试装置及方法 |
US20150074729A1 (en) * | 2013-09-12 | 2015-03-12 | Samsung Electronics Co., Ltd. | Apparatus and method for processing audio, method for setting initialization mode, and computer-readable recording medium |
CN104902317A (zh) * | 2015-05-27 | 2015-09-09 | 青岛海信电器股份有限公司 | 音视频同步方法及装置 |
CN105657512A (zh) * | 2016-01-29 | 2016-06-08 | 四川长虹电器股份有限公司 | 一种数字视频音画失步监测方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107454479A (zh) * | 2017-08-22 | 2017-12-08 | 无锡天脉聚源传媒科技有限公司 | 一种多媒体数据的处理方法及装置 |
CN108989890A (zh) * | 2018-09-03 | 2018-12-11 | 四川长虹电器股份有限公司 | 基于GStreamer框架的音视频错源排查方法 |
CN108989890B (zh) * | 2018-09-03 | 2021-01-26 | 四川长虹电器股份有限公司 | 基于GStreamer框架的音视频错源排查方法 |
CN110324689B (zh) * | 2019-07-08 | 2022-05-17 | 成都酷狗创业孵化器管理有限公司 | 音视频同步播放的方法、装置、终端及存储介质 |
CN110324689A (zh) * | 2019-07-08 | 2019-10-11 | 广州酷狗计算机科技有限公司 | 音视频同步播放的方法、装置、终端及存储介质 |
CN112653916B (zh) * | 2019-10-10 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 一种音视频同步优化的方法及设备 |
CN112653916A (zh) * | 2019-10-10 | 2021-04-13 | 腾讯科技(深圳)有限公司 | 一种音视频同步优化的方法及设备 |
CN110559012A (zh) * | 2019-10-21 | 2019-12-13 | 江苏鹿得医疗电子股份有限公司 | 电子听诊器及其控制方法及医疗设备的控制方法 |
CN110559012B (zh) * | 2019-10-21 | 2022-09-09 | 江苏鹿得医疗电子股份有限公司 | 电子听诊器及其控制方法及医疗设备的控制方法 |
CN112188259B (zh) * | 2020-09-29 | 2022-09-23 | 北京达佳互联信息技术有限公司 | 用于音视频同步测试和校正的方法、装置及电子设备 |
CN112188259A (zh) * | 2020-09-29 | 2021-01-05 | 北京达佳互联信息技术有限公司 | 用于音视频同步测试和校正的方法、装置及电子设备 |
CN113556595A (zh) * | 2021-06-16 | 2021-10-26 | 珠海全志科技股份有限公司 | 基于Miracast的回放方法及装置 |
CN113556595B (zh) * | 2021-06-16 | 2023-06-06 | 珠海全志科技股份有限公司 | 基于Miracast的回放方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106385628A (zh) | 一种分析音视频不同步的装置及方法 | |
CN105549819B (zh) | 后台应用信息的显示方法及装置 | |
US20110320206A1 (en) | Electronic book reader and text to speech converting method | |
US9161238B2 (en) | Mobile device monitoring and testing | |
CN102314671B (zh) | 图形处理单元和信息处理设备 | |
CN105913838B (zh) | 音频管理装置和方法 | |
WO2020098115A1 (zh) | 字幕添加方法、装置、电子设备及计算机可读存储介质 | |
CN103257821A (zh) | 图像显示设备中改变字幕属性的装置和方法 | |
CN106571136A (zh) | 一种语音输出装置和方法 | |
US20240007718A1 (en) | Multimedia browsing method and apparatus, device and mediuim | |
CN109600655A (zh) | 应用客户端中弹幕显示的方法、应用客户端及电子设备 | |
CN112866784A (zh) | 一种大屏局部回显控制方法、控制系统、设备及存储介质 | |
CN104378692A (zh) | 一种处理视频字幕的方法及装置 | |
KR20130082366A (ko) | 전자 기기 및 그것의 미디어 콘텐츠 재생 방법 | |
US20240079002A1 (en) | Minutes of meeting processing method and apparatus, device, and medium | |
CN105744348A (zh) | 利用网页浏览器播放视频的方法、装置及电子设备 | |
CN106471493A (zh) | 用于管理数据的方法和装置 | |
CN106993093A (zh) | 一种图像处理装置及方法 | |
CN109949793A (zh) | 用于输出信息的方法和装置 | |
CN104081444A (zh) | 信息处理装置、信息处理方法和程序 | |
US20200380975A1 (en) | Voice control method and apparatus of electronic device, and storage medium | |
CN109840168B (zh) | 软件恢复方法、装置、终端和介质 | |
CN106782578A (zh) | 一种分布式解码控制器、分布式解码方法及音频终端 | |
CN106686211A (zh) | 一种分屏模式下声音播放的处理方法及终端 | |
CN105912192A (zh) | 一种显示控制方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170208 |