CN107770598B - 一种同步播放的检测方法、移动终端 - Google Patents

一种同步播放的检测方法、移动终端 Download PDF

Info

Publication number
CN107770598B
CN107770598B CN201710948151.3A CN201710948151A CN107770598B CN 107770598 B CN107770598 B CN 107770598B CN 201710948151 A CN201710948151 A CN 201710948151A CN 107770598 B CN107770598 B CN 107770598B
Authority
CN
China
Prior art keywords
sample
video
data
segment
synchronization result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710948151.3A
Other languages
English (en)
Other versions
CN107770598A (zh
Inventor
沈志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201710948151.3A priority Critical patent/CN107770598B/zh
Publication of CN107770598A publication Critical patent/CN107770598A/zh
Application granted granted Critical
Publication of CN107770598B publication Critical patent/CN107770598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例提供了一种同步播放的检测方法、移动终端,该方法包括:当视频数据播放时,从所述视频数据中提取视频片段;检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。本发明实施例能够实现自动判断视频数据与字幕数据是否同步播放,大大减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过汇总各片段同步结果判断视频数据与字幕数据是否同步播放,平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果,从而降低了错误率。

Description

一种同步播放的检测方法、移动终端
技术领域
本发明涉及通信技术领域,尤其涉及一种同步播放的检测方法、移动终端。
背景技术
在生活中,用户经常可以看到诸多类型的视频,很多视频在播放时,会显示字幕,帮助观众更好地理解视频的内容。
由于字幕是后期人工添加上去的,视频与字幕可能出现不同步播放的现象。
目前,主要是依赖人工观看字幕是否与声音同步来判断视频与字幕是否同步播放,人工检测的方式耗费时间、成本较高,而且容易出错。
发明内容
本发明实施例提供一种同步播放的检测方法、移动终端,以解决人工检测视频与字幕是否同步播放的方式耗费时间、成本较高,而且容易出错的问题。
为了解决上述技术问题,本发明是这样实现的:一种同步播放的检测方法,包括:
当视频数据播放时,从所述视频数据中提取视频片段;
检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;
依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。
第一方面,本发明实施例还提供了一种移动终端,包括:
视频片段提取模块,用于当视频数据播放时,从所述视频数据中提取视频片段;
视频片段检测模块,用于检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;
视频数据检测模块,用于依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。
第二方面,本发明实施例还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的同步播放的检测方法的步骤。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至m中任一项所述的同步播放的检测方法的步骤。
在本发明实施例中,通过在视频数据播放时,从视频数据中提取视频片段,以检测与字幕数据是否同步播放,获得片段同步结果,进一步依据片段同步结果检测视频数据与字幕数据是否同步播放,获得视频同步结果,能够实现自动判断视频数据与字幕数据是否同步播放,大大减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过汇总各片段同步结果判断视频数据与字幕数据是否同步播放,平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果,从而降低了错误率。
附图说明
图1为本发明的同步播放的检测方法实施例的流程图。
图2为本发明的同步播放的检测方法另一实施例的流程图。
图3为本发明的同步播放的检测方法又一实施例的流程图。
图4为本发明的移动终端实施例的框图。
图5为实现本发明各个实施例的一种移动终端的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明的同步播放的检测方法实施例的流程图,具体可以包括如下步骤:
步骤101,当视频数据播放时,从所述视频数据中提取视频片段。
在具体实现中,本发明实施例可以应用在移动终端中,例如,手机、平板电脑、个人数字助理、穿戴设备(如眼镜、手表等)等等。
这些移动设备的操作系统可以包括Android(安卓)、IOS、WindowsPhone、Windows等等,通常可以支持可播放视频数据及字幕数据的应用运行,例如,浏览器、视频播放器、即时通讯工具,等等。
当然,本发明实施例也可以应用在个人电脑、智能电视等终端中,这些终端也可以支持可播放视频数据及字幕数据的应用运行,本发明实施例对此不加以限制。
在本发明实施例中,在播放视频数据时,可以自动检测视频数据与字幕数据是否同步播放。
在具体实现中,当视频数据播放时,从视频数据中提取视频片段,该视频片段的数量一般为两个或多个以上(如200个),每个视频片段的长度可以相等(如长度均为1s),也可以不相等,本发明实施例对此不加以限制。
步骤102,检测所述视频片段与字幕数据是否同步播放,获得片段同步结果。
在具体实现中,诸如演讲类、综艺类等以人说话为主的视频数据中,大多数时间均有人在画面中说话,相对应地配置字幕数据。
因此,可以视频片段中提取人说话的特征,例如,从视频数据中提取语音数据、从视频数据的图像帧中提取人物特征(如嘴唇数据、肢体数据等),等等,基于这些人说话的特征可以检测视频片段与字幕数据是否同步播放,从而获得片段同步结果。
步骤103,依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。
由于视频片段的片段同步结果给出的是某一小段时间内场景的片段同步结果,而实际情况下,视频数据是一个由连续和不断变化的场景组成的,如果靠一两次场景的片段同步结果判断视频数据与字幕数据是否同步播放,可能会有误差。
因此,在本发明实施例中,可以汇总各场景的片段同步结果,判断视频数据与字幕数据是否同步播放,从而平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果。
在本发明实施例中,通过在视频数据播放时,从视频数据中提取视频片段,以检测与字幕数据是否同步播放,获得片段同步结果,进一步依据片段同步结果检测视频数据与字幕数据是否同步播放,获得视频同步结果,能够实现自动判断视频数据与字幕数据是否同步播放,大大减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过汇总各片段同步结果判断视频数据与字幕数据是否同步播放,平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果,从而降低了错误率。
参照图2,示出了本发明的同步播放的检测方法另一实施例的流程图,具体可以包括如下步骤:
步骤201,当视频数据播放时,从所述视频数据中提取视频片段。
步骤202,在所述视频片段中识别嘴型数据。
由于人在说话时,口型变化是一个可视化的过程,因此,在本发明实施例中,可以在视频片段中检测嘴型数据,观察人(说话者)的口型变化。
在一个实施方式中,可以在视频片段中进行人脸检测,几在视频片段中识别人脸数据。
当识别出人脸数据时,在人脸数据中检测嘴型数据。
当未识别出人脸数据时,丢弃视频片段,从而降低处理量,提高处理效率。
当然,上述判断嘴型数据的识别方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他嘴型数据的识别方式,例如,通过训练已有图像来得到定位脸部各位置的模板进行匹配、对彩色图像进行颜色空间变换或颜色处理、将包含嘴的区域灰度图像作为特征向量、将整个嘴唇作为一个向量进行主成分分析(PCA),等等,本发明实施例对此不加以限制。另外,除了上述嘴型数据的识别方式外,本领域技术人员还可以根据实际需要采用其它嘴型数据的识别方式,本发明实施例对此也不加以限制。
步骤203,判断所述嘴型数据是否发生变化;若是,则执行步骤204,若否,则执行步骤205。
人在说话时,嘴唇一般会连同进行变化。
以汉语发生为例,汉语具有两种拼读方法,拼读法(前音轻短后音重)和直呼法(先做声母的嘴形再做韵母的音)。每个声母和韵母都有特定的发音,使得用户在发出声母和韵母的读音时嘴型都有所变化,例如,发出声母“b”的读音时,双唇闭合,挡住气流,然后双唇突然打开,让气流爆发出来,声带颤动。
在本发明实施例中,可以通过视频片段中,两帧或两帧以上的图像数据中的嘴型数据进行对比,从而判断嘴型数据是否在该视频片段的播放时间内发生变化。
步骤204,判断是否正在播放所述字幕数据;若是,则执行步骤206,若否,则执行步骤207。
当嘴型数据发生变化时,则可以进一步判断在播放该视频片段时,是否正在播放字幕数据。
如果正在播放字幕数据,即人在说话时同步播放字幕数据,可以确定视频片段与字幕数据同步播放,作为片段同步结果。
如果不是正在播放字幕数据,即人在说话时不同步播放字幕数据,可以确定视频片段与字幕数据不同步播放,作为片段同步结果。
步骤205,判断是否正在播放所述字幕数据;若是,则执行步骤207,若否,则执行步骤206。
当嘴型数据未发生变化时,则可以进一步判断在播放该视频片段时,是否正在播放字幕数据。
如果正在播放字幕数据,即人不在说话时同步播放字幕数据,可以确定视频片段与字幕数据不同步播放,作为片段同步结果。
如果不是正在播放字幕数据,即人不在说话时不同步播放字幕数据,可以确定视频片段与字幕数据同步播放,作为片段同步结果。
步骤206,确定片段同步结果为所述视频片段与所述字幕数据同步播放。
步骤207,确定片段同步结果为所述视频片段与所述字幕数据不同步播放。
在本发明实施例中,通过在视频片段中识别嘴型数据,基于嘴型数据是否发生变化与是否正在播放字幕数据,判断视频片段与字母数据是否同步播放,能够实现自动判断视频片段与字幕数据是否同步播放,减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过人说话的特征判断判断视频片段与字幕数据是否同步播放,检测的准确率高。
步骤208,计算所述视频片段与所述字幕数据同步播放占所述片段同步结果的比例。
步骤209,判断所述比例是否超过预设的比例阈值;若是,则执行步骤210,若否,则执行步骤211。
步骤210,确定视频同步结果为所述视频数据与所述字幕数据同步播放。
步骤211,确定视频同步结果为所述视频数据与所述字幕数据不同步播放。
在本发明实施例中,计算视频片段与字幕数据同步播放(一种片段同步结果)占所有片段同步结果(包括视频片段与字幕数据同步播放、视频片段与字幕数据不同步播放)的比例,即同步比例。
如果该比例超过预设的比例阈值,即视频片段与字幕数据同步播放的占比较高,可以确认视频数据与字幕数据同步播放,作为视频同步结果。
如果该比例未超过预设的比例阈值,即视频片段与字幕数据同步播放的占比较低,可以确认视频数据与字幕数据不同步播放,作为视频同步结果。
参照图3,示出了本发明的同步播放的检测方法又一实施例的流程图,具体可以包括如下步骤:
步骤301,获取同步播放的样本视频数据及样本字幕数据。
在本发明实施例中,可以将已校验同步播放的同步播放的样本视频数据及样本字幕数据作为样本,训练比例阈值。
需要说明的是,样本视频数据及样本字幕数据是相对于训练而言的,其本质依然为视频数据及字幕数据。
步骤302,当所述样本视频数据播放时,从所述样本视频数据中提取样本视频片段。
步骤303,检测所述样本视频片段与所述样本字幕数据是否同步播放,获得样本片段同步结果。
在本发明的一个检测片段同步结果的实施方式中,在样本视频片段中识别样本嘴型数据。
判断样本嘴型数据是否发生变化;
当样本嘴型数据发生变化时,判断是否正在播放样本字幕数据;若是,则确定样本片段同步结果为样本视频片段与样本字幕数据同步播放;若否,则确定样本片段同步结果为样本视频片段与样本字幕数据不同步播放。
当样本嘴型数据未发生变化时,判断是否正在播放样本字幕数据;若是,则确定样本片段同步结果为样本视频片段与样本字幕数据不同步播放;若否,则确定样本片段同步结果为样本视频片段与样本字幕数据同步播放。
在本发明的一个识别样本嘴型数据的实施方式中,在样本视频片段中识别样本人脸数据。
当识别出样本人脸数据时,在样本人脸数据中检测样本嘴型数据;
当未识别出样本人脸数据时,丢弃样本视频片段。
步骤304,计算所述样本视频片段与所述样本字幕数据同步播放占所述样本片段同步结果的样本比例。
在本发明实施例中,由于步骤302-304与步骤101-102以及步骤201-208的应用基本相似,所以描述的比较简单,相关之处参见步骤101-102以及步骤201-208的部分说明即可,本发明实施例在此不加以详述。
需要说明的是,为了提高比例阈值的精确度,在训练比例阈值时,检测样本片段同步结果与检测片段同步结果可以采用相同的检测方式(如基于样本嘴型数据、嘴型数据进行检测),但是,检测样本片段同步结果与检测片段同步结果也可以采用不相同的检测方式,本发明实施例对此不加以限制。
步骤305,依据所述样本比例计算比例阈值。
在具体实现中,可以计算样本比例的平均值,作为比例阈值。
例如,计算了n(n为正整数)各样本视频数据的样本比例,分别为X1,X2,X3,…,Xn,则比例阈值X=(X1+X2+X3+…+Xn)/n。
当然,除了平均值之外,本发明实施例还可以采用其他方式计算比例阈值,例如,以中位数作为比例阈值、剔除异常数据后计算比例阈值,等等,本发明实施例对此不加以限制。
在本发明实施例中,通过在样本视频数据播放时,从样本视频数据中提取样本视频片段,以检测样本视频片段与样本字幕数据是否同步播放,获得样本片段同步结果,依据样本视频片段与样本字幕数据同步播放占样本片段同步结果的样本比例,计算比例阈值,能够实现自动训练比例阈值,由于训练与检测的模式一致,可以提高比例阈值的准确率,从而提高判断视频数据与字幕数据是否同步播放的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的移动终端实施例的框图,图4所示的移动终端400具体可以包括如下模块:
视频片段提取模块401,用于当视频数据播放时,从所述视频数据中提取视频片段;
视频片段检测模块402,用于检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;
视频数据检测模块403,用于依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。
在本发明的一个实施例中,所述视频片段检测模块402包括:
嘴型数据识别子模块,用于在所述视频片段中识别嘴型数据;
嘴型数据判断子模块,用于判断所述嘴型数据是否发生变化;
第一字幕数据判断子模块,用于当所述嘴型数据发生变化时,判断是否正在播放所述字幕数据;若是,调用第一片段同步结果确定子模块,若否,则调用第二片段同步结果确定子模块;
第二字幕数据判断子模块,用于当所述嘴型数据未发生变化时,判断是否正在播放所述字幕数据;若是,调用第二片段同步结果确定子模块,若否,则调用第一片段同步结果确定子模块;
第一片段同步结果确定子模块,用于确定片段同步结果为所述视频片段与所述字幕数据同步播放;
第二片段同步结果确定子模块,用于确定片段同步结果为所述视频片段与所述字幕数据不同步播放。
在本发明的一个实施例中,所述嘴型数据识别子模块包括:
人脸数据识别单元,用于在所述视频片段中识别人脸数据;
嘴型数据检测单元,用于当识别出所述人脸数据时,在所述人脸数据中检测嘴型数据;
视频片段丢弃单元,用于当未识别出所述人脸数据时,丢弃所述视频片段。
在本发明的一个实施例中,所述视频数据检测模块403包括:
比例计算子模块,用于计算所述视频片段与所述字幕数据同步播放占所述片段同步结果的比例;
比例阈值判断子模块,用于判断所述比例是否超过预设的比例阈值;若是,则调用第一视频同步结果确定子模块,若否,则调用第二视频同步结果确定子模块;
第一视频同步结果确定子模块,用于确定视频同步结果为所述视频数据与所述字幕数据同步播放;
第二视频同步结果确定子模块,用于确定视频同步结果为所述视频数据与所述字幕数据不同步播放。
在本发明的一个实施例中,还包括:
样本数据获取模块,用于获取同步播放的样本视频数据及样本字幕数据;
本视频片段提取模块,用于当所述样本视频数据播放时,从所述样本视频数据中提取样本视频片段;
样本视频片段检测模块,用于检测所述样本视频片段与所述样本字幕数据是否同步播放,获得样本片段同步结果;
样本比例计算模块,用于计算所述样本视频片段与所述样本字幕数据同步播放占所述样本片段同步结果的样本比例;
比例阈值计算模块,用于依据所述样本比例计算比例阈值。
在本发明的一个实施例中,所述样本视频片段检测模块包括:
样本嘴型数据识别子模块,用于在所述样本视频片段中识别样本嘴型数据;
样本嘴型数据判断子模块,用于判断所述样本嘴型数据是否发生变化;
第一样本字幕数据判断子模块,用于当所述样本嘴型数据发生变化时,判断是否正在播放所述样本字幕数据;若是,调用第一样本片段同步结果确定子模块,若否,则调用第二样本片段同步结果确定子模块;
第二样本字幕数据判断子模块,用于当所述样本嘴型数据未发生变化时,判断是否正在播放所述样本字幕数据;若是,调用第二样本片段同步结果确定子模块,若否,则调用第一样本片段同步结果确定子模块;
第一样本片段同步结果确定子模块,用于确定样本片段同步结果为所述样本视频片段与所述样本字幕数据同步播放;
第二样本片段同步结果确定子模块,用于确定样本片段同步结果为所述样本视频片段与所述样本字幕数据不同步播放。
在本发明的一个实施例中,所述样本嘴型数据识别子模块包括:
样本人脸数据识别单元,用于在所述样本视频片段中识别样本人脸数据;
样本嘴型数据检测单元,用于当识别出所述样本人脸数据时,在所述样本人脸数据中检测样本嘴型数据;
样本视频片段丢弃单元,用于当未识别出所述样本人脸数据时,丢弃所述样本视频片段。
本发明实施例提供的移动终端能够实现图1至图3的方法实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。
在本发明实施例中,通过在视频数据播放时,从视频数据中提取视频片段,以检测与字幕数据是否同步播放,获得片段同步结果,进一步依据片段同步结果检测视频数据与字幕数据是否同步播放,获得视频同步结果,能够实现自动判断视频数据与字幕数据是否同步播放,大大减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过汇总各片段同步结果判断视频数据与字幕数据是否同步播放,平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果,从而降低了错误率。
图5为实现本发明各个实施例的一种移动终端的硬件结构示意图。
该移动终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于当视频数据播放时,从所述视频数据中提取视频片段;检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果。
在本发明实施例中,通过在视频数据播放时,从视频数据中提取视频片段,以检测与字幕数据是否同步播放,获得片段同步结果,进一步依据片段同步结果检测视频数据与字幕数据是否同步播放,获得视频同步结果,能够实现自动判断视频数据与字幕数据是否同步播放,大大减少了人工检测的操作,减少了时间的耗费,降低了检测的成本,并且,通过汇总各片段同步结果判断视频数据与字幕数据是否同步播放,平滑了片段同步结果的误差,得到一个更为稳定的视频同步结果,从而降低了错误率。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与移动终端500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
移动终端500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在移动终端500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与移动终端500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端500内的一个或多个元件或者可以用于在移动终端500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
移动终端500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端500包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述同步播放的检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述同步播放的检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是c示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (5)

1.一种同步播放的检测方法,其特征在于,包括:
当视频数据播放时,从所述视频数据中提取视频片段,所述视频片段至少为两个;
检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;
依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果;
其中,所述依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果,包括:
计算所述视频片段与所述字幕数据同步播放占所有所述片段同步结果的比例;
判断所述比例是否超过预设的比例阈值;
若是,则确定视频同步结果为所述视频数据与所述字幕数据同步播放;
若否,则确定视频同步结果为所述视频数据与所述字幕数据不同步播放;
在所述得到视频同步结果之后,还包括:
获取同步播放的样本视频数据及样本字幕数据;
当所述样本视频数据播放时,从所述样本视频数据中提取样本视频片段;
检测所述样本视频片段与所述样本字幕数据是否同步播放,获得样本片段同步结果;
计算所述样本视频片段与所述样本字幕数据同步播放占所述样本片段同步结果的样本比例;
依据所述样本比例计算比例阈值;
所述检测所述视频片段与所述字幕数据是否同步播放,获得多个片段同步结果,包括:
在所述视频片段中识别嘴型数据;
判断所述嘴型数据是否发生变化;
当所述嘴型数据发生变化时,判断是否正在播放所述字幕数据;若是,则确定片段同步结果为所述视频片段与所述字幕数据同步播放;若否,则确定片段同步结果为所述视频片段与所述字幕数据不同步播放;
当所述嘴型数据未发生变化时,判断是否正在播放所述字幕数据;若是,则确定片段同步结果为所述视频片段与所述字幕数据不同步播放;若否,则确定片段同步结果为所述视频片段与所述字幕数据同步播放。
2.根据权利要求1所述的方法,其特征在于,所述检测所述样本视频片段与所述样本字幕数据是否同步播放,获得样本片段同步结果,包括:
在所述样本视频片段中识别样本嘴型数据;
判断所述样本嘴型数据是否发生变化;
当所述样本嘴型数据发生变化时,判断是否正在播放所述样本字幕数据;若是,则确定样本片段同步结果为所述样本视频片段与所述样本字幕数据同步播放;若否,则确定样本片段同步结果为所述样本视频片段与所述样本字幕数据不同步播放;
当所述样本嘴型数据未发生变化时,判断是否正在播放所述样本字幕数据;若是,则确定样本片段同步结果为所述样本视频片段与所述样本字幕数据不同步播放;若否,则确定样本片段同步结果为所述样本视频片段与所述样本字幕数据同步播放。
3.一种移动终端,其特征在于,包括:
视频片段提取模块,用于当视频数据播放时,从所述视频数据中提取视频片段,所述视频片段至少两个;
视频片段检测模块,用于检测所述视频片段与字幕数据是否同步播放,获得片段同步结果;
视频数据检测模块,用于依据所述片段同步结果检测所述视频数据与所述字幕数据是否同步播放,得到视频同步结果;
其中,所述视频数据检测模块包括:
比例计算子模块,用于计算所述视频片段与所述字幕数据同步播放占所有所述片段同步结果的比例;
比例阈值判断子模块,用于判断所述比例是否超过预设的比例阈值;若是,则调用第一视频同步结果确定子模块,若否,则调用第二视频同步结果确定子模块;
第一视频同步结果确定子模块,用于确定视频同步结果为所述视频数据与所述字幕数据同步播放;
第二视频同步结果确定子模块,用于确定视频同步结果为所述视频数据与所述字幕数据不同步播放;
所述移动终端还包括:
样本数据获取模块,用于获取同步播放的样本视频数据及样本字幕数据;
本视频片段提取模块,用于当所述样本视频数据播放时,从所述样本视频数据中提取样本视频片段;
样本视频片段检测模块,用于检测所述样本视频片段与所述样本字幕数据是否同步播放,获得样本片段同步结果;
样本比例计算模块,用于计算所述样本视频片段与所述样本字幕数据同步播放占所述样本片段同步结果的样本比例;
比例阈值计算模块,用于依据所述样本比例计算比例阈值;
所述视频片段检测模块包括:
嘴型数据识别子模块,用于在所述视频片段中识别嘴型数据;
嘴型数据判断子模块,用于判断所述嘴型数据是否发生变化;
第一字幕数据判断子模块,用于当所述嘴型数据发生变化时,判断是否正在播放所述字幕数据;若是,调用第一片段同步结果确定子模块,若否,则调用第二片段同步结果确定子模块;
第二字幕数据判断子模块,用于当所述嘴型数据未发生变化时,判断是否正在播放所述字幕数据;若是,调用第二片段同步结果确定子模块,若否,则调用第一片段同步结果确定子模块;
第一片段同步结果确定子模块,用于确定片段同步结果为所述视频片段与所述字幕数据同步播放;
第二片段同步结果确定子模块,用于确定片段同步结果为所述视频片段与所述字幕数据不同步播放。
4.根据权利要求3所述的移动终端,其特征在于,所述样本视频片段检测模块包括:
样本嘴型数据识别子模块,用于在所述样本视频片段中识别样本嘴型数据;
样本嘴型数据判断子模块,用于判断所述样本嘴型数据是否发生变化;
第一样本字幕数据判断子模块,用于当所述样本嘴型数据发生变化时,判断是否正在播放所述样本字幕数据;若是,调用第一样本片段同步结果确定子模块,若否,则调用第二样本片段同步结果确定子模块;
第二样本字幕数据判断子模块,用于当所述样本嘴型数据未发生变化时,判断是否正在播放所述样本字幕数据;若是,调用第二样本片段同步结果确定子模块,若否,则调用第一样本片段同步结果确定子模块;
第一样本片段同步结果确定子模块,用于确定样本片段同步结果为所述样本视频片段与所述样本字幕数据同步播放;
第二样本片段同步结果确定子模块,用于确定样本片段同步结果为所述样本视频片段与所述样本字幕数据不同步播放。
5.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至2中任一项所述的同步播放的检测方法的步骤。
CN201710948151.3A 2017-10-12 2017-10-12 一种同步播放的检测方法、移动终端 Active CN107770598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710948151.3A CN107770598B (zh) 2017-10-12 2017-10-12 一种同步播放的检测方法、移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710948151.3A CN107770598B (zh) 2017-10-12 2017-10-12 一种同步播放的检测方法、移动终端

Publications (2)

Publication Number Publication Date
CN107770598A CN107770598A (zh) 2018-03-06
CN107770598B true CN107770598B (zh) 2020-06-30

Family

ID=61266434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710948151.3A Active CN107770598B (zh) 2017-10-12 2017-10-12 一种同步播放的检测方法、移动终端

Country Status (1)

Country Link
CN (1) CN107770598B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691204B (zh) * 2019-09-09 2021-04-02 苏州臻迪智能科技有限公司 一种音视频处理方法、装置、电子设备及存储介质
CN111988654B (zh) * 2020-08-31 2022-10-18 维沃移动通信有限公司 视频数据对齐方法、装置和电子设备
CN112911276A (zh) * 2021-01-21 2021-06-04 广东九联科技股份有限公司 一种用于检测机顶盒音视频同步的方法
CN113242361B (zh) * 2021-07-13 2021-09-24 腾讯科技(深圳)有限公司 一种视频处理方法、装置以及计算机可读存储介质
CN113490058A (zh) * 2021-08-20 2021-10-08 云知声(上海)智能科技有限公司 一种应用于影视后期的智能字幕匹配系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505397A (zh) * 2009-02-20 2009-08-12 深圳华为通信技术有限公司 一种语音和视频字幕同步呈现的方法及系统
CN105100647A (zh) * 2015-07-31 2015-11-25 深圳市金立通信设备有限公司 一种校正字幕的方法及终端
CN105138953A (zh) * 2015-07-09 2015-12-09 浙江大学 一种基于连续的多实例学习的视频中动作识别的方法
CN106816151A (zh) * 2016-12-19 2017-06-09 广东小天才科技有限公司 一种字幕对准方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9013631B2 (en) * 2011-06-22 2015-04-21 Google Technology Holdings LLC Method and apparatus for processing and displaying multiple captions superimposed on video images
WO2014113071A1 (en) * 2013-01-15 2014-07-24 Viki, Inc. System and method for captioning media
US20150293995A1 (en) * 2014-04-14 2015-10-15 David Mo Chen Systems and Methods for Performing Multi-Modal Video Search
CN105959723B (zh) * 2016-05-16 2018-09-18 浙江大学 一种基于机器视觉和语音信号处理相结合的假唱检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505397A (zh) * 2009-02-20 2009-08-12 深圳华为通信技术有限公司 一种语音和视频字幕同步呈现的方法及系统
CN105138953A (zh) * 2015-07-09 2015-12-09 浙江大学 一种基于连续的多实例学习的视频中动作识别的方法
CN105100647A (zh) * 2015-07-31 2015-11-25 深圳市金立通信设备有限公司 一种校正字幕的方法及终端
CN106816151A (zh) * 2016-12-19 2017-06-09 广东小天才科技有限公司 一种字幕对准方法及装置

Also Published As

Publication number Publication date
CN107770598A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN107770598B (zh) 一种同步播放的检测方法、移动终端
WO2021057267A1 (zh) 图像处理方法及终端设备
CN109857905B (zh) 一种视频编辑方法及终端设备
CN108712603B (zh) 一种图像处理方法及移动终端
CN108009136B (zh) 一种消息修正的方法及移动终端、计算机可读存储介质
CN109874038B (zh) 一种终端的显示方法及终端
CN108600668B (zh) 一种录屏帧率调整方法及移动终端
CN110855893A (zh) 一种视频拍摄的方法及电子设备
CN108074574A (zh) 音频处理方法、装置及移动终端
CN109065060B (zh) 一种语音唤醒方法及终端
CN107886969B (zh) 一种音频播放方法及音频播放装置
CN109819167B (zh) 一种图像处理方法、装置和移动终端
CN108962187B (zh) 屏幕亮度调节方法及移动终端
CN107908705A (zh) 一种信息推送方法、信息推送装置及移动终端
CN109618218B (zh) 一种视频处理方法及移动终端
CN109302528B (zh) 一种拍照方法、移动终端及计算机可读存储介质
CN108763475B (zh) 一种录制方法、录制装置及终端设备
CN110062281B (zh) 一种播放进度调节方法及其终端设备
CN111738100A (zh) 一种基于口型的语音识别方法及终端设备
CN108924413B (zh) 拍摄方法及移动终端
CN107908342B (zh) 一种显示消息的方法及移动终端
CN108632465A (zh) 一种语音输入的方法及移动终端
CN109819331B (zh) 一种视频通话方法、装置、移动终端
CN108038427B (zh) 一种文字识别方法及移动终端
CN108089799B (zh) 一种屏边控件的控制方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant