CN103634605A - 视频画面的处理方法及装置 - Google Patents

视频画面的处理方法及装置 Download PDF

Info

Publication number
CN103634605A
CN103634605A CN201310646783.6A CN201310646783A CN103634605A CN 103634605 A CN103634605 A CN 103634605A CN 201310646783 A CN201310646783 A CN 201310646783A CN 103634605 A CN103634605 A CN 103634605A
Authority
CN
China
Prior art keywords
time point
video
captions
crucial
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310646783.6A
Other languages
English (en)
Other versions
CN103634605B (zh
Inventor
张婧
邵丹丹
徐振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310646783.6A priority Critical patent/CN103634605B/zh
Publication of CN103634605A publication Critical patent/CN103634605A/zh
Priority to PCT/CN2014/089946 priority patent/WO2015081776A1/zh
Priority to KR1020157035232A priority patent/KR101746165B1/ko
Priority to JP2016535328A priority patent/JP6266109B2/ja
Priority to US14/392,326 priority patent/US9973793B2/en
Application granted granted Critical
Publication of CN103634605B publication Critical patent/CN103634605B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6131Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4333Processing operations in response to a pause request
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Databases & Information Systems (AREA)

Abstract

本发明提出一种视频画面的处理方法及装置。其中,视频画面的处理方法包括:获得当前视频的信息;根据当前视频的信息截取当前视频的关键画面,关键画面包括带有完整字幕的视频帧画面;对关键画面进行排序,生成画面库;以及接收播放请求,根据播放请求从画面库中读取对应的关键画面进行播放。本发明实施例,通过获得当前视频的信息,根据当前视频的信息截取当前视频的关键画面,并对关键画面进行排序,生成画面库,以及根据播放请求从画面库中读取对应的关键画面进行播放,在节省流量的同时,保证了在网络卡顿的情况下,用户能够对视频进行预览,以使用户快捷、方便、完整地了解剧情,减少了用户在移动视频卡顿情况时的跳出率,提升了用户体验。

Description

视频画面的处理方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种视频画面的处理方法及装置。
背景技术
随着终端技术的迅速发展,各种功能的应用也越来越多元化,用户越来越倾向于通过在终端上安装不同的应用程序,来辅助进行商务、娱乐、生活等多种活动。
目前,很多用户喜欢在移动终端上观看在线视频,但观看在线视频比较耗费移动流量,平均每看1分钟的手机视频,标清资源耗费流量在4M左右,高清资源耗费流量在20M左右,对于大多数每月仅有百兆流量的用户来说,观看在线视频存在很大壁垒。
另外,受网络速度、视频资源、手机性能等因素的影响,用户在观看移动视频的过程中经常会遇到视频卡顿情况。在发生视频卡顿时,近一半用户会直接跳出页面或退出产品,因而无法满足用户的视频观看需求。
由于网络环境对视频资源的传输速度有很大影响,所以用户只能在安静的、移动网络很好的环境里才可以观看在线视频,而在较差的网络环境诸如地铁上通常无法观看,同时,对于一些碎片时间也不适合进行观看。
由此可见,目前观看在线视频存在以下问题:1、耗费移动流量大;2、视频卡顿情况严重;3、观看场所、时间受限制。
针对第一个问题,目前通过提供流畅转码的格式来解决,针对第二个问题,可以通过减少帧数来解决,最低可以减少到24帧/秒;也可以在接到用户举报后被动更替视频资源或者鼓励用户更换视频节点、跳过卡顿片段;针对第三个问题,目前尚无解决方案。
但是,上述流畅转码和减少帧数的方式,对视频所耗费的流量和卡顿情况虽有改善,但现存问题依旧严重;用户举报或让用户更换节点是被动的方式,只能事后解决卡顿问题。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的第一个目的在于提出一种视频画面的处理方法。该方法通过截取当前视频的关键画面,对关键画面进行排序,生成画面库,并对画面库中的关键画面进行播放,节省了流量,使用户快捷、方便地了解视频内容。
本发明的第二个目的在于提出一种视频画面的处理装置。
为了实现上述目的,本发明第一方面实施例的视频画面的处理方法,包括以下步骤:获得当前视频的信息;根据所述当前视频的信息截取当前视频的关键画面,所述关键画面包括带有完整字幕的视频帧画面;对所述关键画面进行排序,生成画面库;以及接收播放请求,根据所述播放请求从所述画面库中读取对应的关键画面进行播放。
本发明实施例的视频画面的处理方法,通过获得当前视频的信息,根据当前视频的信息截取当前视频的关键画面,并对关键画面进行排序,生成画面库,以及根据播放请求从画面库中读取对应的关键画面进行播放,在节省流量的同时,保证了在网络卡顿的情况下,用户能够快速对视频进行预览,以使用户快捷、方便地了解剧情,减少了用户在遇到移动视频卡顿情况时的跳出率,提升了用户体验。
为了实现上述目的,本发明第二方面实施例的视频画面的处理装置,包括:获得模块、截取模块、生成模块以及播放模块。
本发明实施例的视频画面的处理装置,通过获得当前视频的信息,根据当前视频的信息截取当前视频的关键画面,并对关键画面进行排序,生成画面库,以及根据播放请求从画面库中读取对应的关键画面进行播放,在节省流量的同时,保证了在网络卡顿的情况下,用户能够快速对视频进行预览,以使用户快捷、方便地了解剧情,减少了用户在遇到移动视频卡顿情况时的跳出率,提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的视频画面的处理方法的流程图;
图2是根据本发明一个实施例的视频播放过程的流程图;
图3是根据本发明一个具体实施例的截取当前视频的关键画面的流程图;
图4是根据本发明另一个实施例的对关键字幕时间点序列进行补帧的示意图;
图5是根据本发明一个实施例的视频画面的处理装置的结构示意图;
图6是根据本发明一个具体实施例的视频画面的处理装置的结构示意图;
图7是根据本发明一个具体实施例的视频画面的处理装置的另一个结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
下面结合说明书附图详细说明本发明实施例的视频画面的处理方法及装置。
为了解决目前观看在线视频存在的耗费移动流量大、视频卡顿情况严重以及观看场所、时间受限制的问题,本发明提出一种视频画面的处理方法。
图1是根据本发明一个实施例的视频画面的处理方法的流程图。如图1所示,该视频画面的处理方法包括以下步骤:
S101,获得当前视频的信息。
首先从视频资源库中获得当前视频的信息,该信息可以包括视频源路径、字幕文件路径等。
S102,根据当前视频的信息截取当前视频的关键画面,该关键画面包括带有完整字幕的视频帧画面。
截取当前视频的关键画面可通过以下步骤完成:首先,根据当前视频的信息获得关键字幕时间点序列,在获得关键字幕时间点序列之后,可以对关键字幕时间点序列进行补帧处理,也可以对关键字幕时间点序列中的关键字幕时间点进行偏移校正,最后根据关键字幕时间点序列对应截取当前视频的关键画面。需要说明的是,补帧处理和偏移校正并无严格的执行顺序,即可以先进行补帧后进行偏移校正,也可以先进行偏移校正后进行补帧;另外,上述偏移校正和进行补帧为可选步骤,若进行了补帧处理,则上述关键画面还包括根据间隔时间进行补帧的画面。
S103,对关键画面进行排序,生成画面库。
在本实施例中,对截取的当前视频的关键画面按照视频中的播放顺序进行排序,组成当前视频的连环画模式的画面库。其中,连环画模式,即截取视频的关键剧情画面,组成一系列按播放时间排序的图册,从而满足观看关键剧情的需求。
S104,接收播放请求,根据播放请求从画面库中读取对应的关键画面进行播放。
在本实施例中,视频内容具有连环画模式和正常的视频模式。用户可选择观看视频,也可以通过观看连环画模式的画面库浏览剧情。两种模式可以互相切换。在遇到视频卡顿时,可自动切换为连环画模式。具体地,在视频播放过程中,自动预加载视频或关键画面,当预设加载量低于预设阈值(例如,当预加载量无法支持5s的连续播放),则自动切换至连环画模式,优先保证用户看剧情。同时用户也可手动切换至视频模式继续等待预加载。举例来说,如图2所示,将视频文件分为多个单元,以单元为单位对视频文件进行预加载并播放。具体地,包括以下步骤:
S201,预加载完一个单元后,播放当前单元的视频。
S202,当播放到0.75个单元时,判断是否预加载完下一个单元,如果预加载完毕,则执行步骤203,若未加载完毕,则执行步骤S204。
S203,继续播放下一个单元的视频,操作结束。
S204,切换为连环画模式,并预加载下一个单元的连环画,以使用户及时浏览剧情,然后转向步骤S202,以便当视频预加载完毕后,可以切换回视频模式,并播放对应单元的视频。
本实施例中,在连环画模式下进行播放时,可以通过自动方式进行播放,也可以通过手动方式进行播放。通过自动播放方式时,根据自动播放请求按顺序从画面库中读取对应的关键画面进行播放,并以预定时间间隔例如每3秒1帧的速度按顺序自动播放画面库。这样,可以保证用户顺利阅读字幕,播放速度与用户正常观看视频的播放速度保持一致,使用户获得正常观看视频的体验。可以理解,播放速度可通过用户根据自身需求预先设定。通过手动或自动播放时,可以根据调用请求从画面库中读取对应的关键画面进行播放。例如,当预加载量无法支持5s的连续播放时,会从画面库中读取对应的关键画面进行播放,当播放一段时间后,若预加载量可以支持5s的连续播放时,可以停止从画面库中读取关键画面并恢复正常的视频播放。
采用上述连环画模式,可以节省流量,比如,时长30分钟的一段标清视频所耗流量在100M以上,而连环画模式仅需9M左右,能节省90%的流量。因而,可以保证用户使用极少的流量就可以追剧,从而提升访问频率和用户满意度。
在连环画模式的每帧画面下,还提供支持用户交流互动的功能。用户可针对关键剧情进行互动交流,创造丰富的用户生成内容。并且,视频和图片形式的广告都能以图片形式插入画面库,为用户提供更多的信息。用户还可以利用碎片时间,像看小说、看图片一样,随时随地追剧,而不必受环境、网络的严格限制。
本发明实施例的视频画面的处理方法,通过获得当前视频的信息,根据当前视频的信息截取当前视频的关键画面,并对关键画面进行排序,生成画面库,以及根据播放请求从画面库中读取对应的关键画面进行播放,在节省流量的同时,保证了在网络卡顿的情况下,用户能够快速对视频进行预览,以使用户快捷、方便地了解剧情,减少了用户在遇到移动视频卡顿情况时的跳出率,提升了用户体验。
为了截取当前视频的关键画面,使用户能够对视频进行预览,更加快捷、方便、完整地了解剧情,本实施例提出了截取当前视频的关键画面的方法,如图3所示,该方法可以包括以下步骤:
S301,根据当前视频的信息获得关键字幕时间点序列。
在本实施例中,可以通过网络、语音识别或图像识别等技术获取当前视频中每段语音字幕的开始和结束时间点,在每段语音字幕的结束时间点上截取一帧画面,以保证仅通过截取画面,就可以完整地看完所有字幕。
具体地,可以基于字幕文件获得关键字幕时间点序列,其中,影片字幕一般分为图形类型的字幕文件和文本格式的字幕文件;对于图形类型的字幕文件,可以通过分析其索引文件来获得视频中拥有对白的“字幕时间范围”序列;对于文本格式的字幕文件例如.srt、.ass格式的字幕文件,可以通过现有程序自动分析获取其中的“字幕时间范围”序列;最后根据这个序列中每个“字幕时间范围”成员的中间值或其他值生成“关键字幕时间点”序列,当然上述中间值或其他值的设置均可以保证获得带有完整字幕的视频帧。
除了可以基于字幕文件获得关键字幕时间点序列外,还可以使用语音分析的方式,即基于语音识别区分出人声部分,获得语音字幕的开始和结束时间点,从而获得关键字幕时间点。也可以采用图像识别的方式,即以预定时间为间隔,将视频转换为连续的帧,再以图片识别的形式识别出特定区域带有完整字幕的帧,去重后直接获得最终的图片帧序列,则这些图片帧序列对应的时间即为关键字幕时间点序列。
其中,上述预定时间优选为大于1/24秒,因为这样视频的采样率是24帧/s。
S302,对关键字幕时间点序列进行补帧处理。
该步骤为可选步骤,当两帧画面间隔时间过长,例如超过预定时间5秒时,则每5秒需截取一副“补帧”,这是因为,这段时间内虽没有语音,但可能有动作镜头发生,动作镜头也会影响用户对剧情的理解。因此,1分钟长的视频约截图15次,以保证剧情的连贯性,每张图片大小为20k,对应当前视频的所有图片文件共计300k。
具体地,补帧过程可以为:判断相邻两个关键字幕时间点之间的时间间隔是否大于预定值,若大于,则在相邻两个关键字幕时间点之间获取新增的关键字幕时间点,并将新增的关键字幕时间点插入关键字幕时间点序列中。例如,当相邻两个“关键字幕时间点”相差超过4s时,则在其之间插入一个中间值时间点上的截图,如图4所示,3.484和20.196之间的时间间隔大于4s的4倍,因此,需要在二者之间插入4帧,其中,带有“-tween”标记的帧为插入的帧;20.196和28.887之间的时间间隔大于4s的2倍,因此,需要在二者之间插入2帧,以此类推,以保证至少平均4s内有一个图片,从而可以保证剧情的连贯性。
其中,上述补帧过程用算法实现的结果的示例如下:
Figure BDA0000429757120000061
Figure BDA0000429757120000071
其中,省略号表示后续省略了若干个关键时间点序列对象。
S303,对关键字幕时间点序列中的关键字幕时间点进行偏移校正。
该步骤也为可选步骤,由于字幕文件一般都有误差,所以根据字幕文件获得的“关键字幕时间点”需要通过偏移校验,自动修正,其修正程序可以通过验证首10个“字幕时间范围”的开始时间来确定偏移量参数,该偏移量参数可通过对比由图像识别或语音识别方式获得的开始时间点和字幕文件中字幕的开始时间来自动获得,也可以通过其他方法获得。通过该偏移量参数对“关键字幕时间点”序列进行偏移校正。
需要说明的是,上述步骤S302和S303并无严格的执行顺序,即可以先进行补帧后进行偏移校正,也可以先进行偏移校正后进行补帧。
S304,根据关键字幕时间点序列对应截取当前视频的关键画面。
在本实施例中,可以通过开源免费跨平台的视频和音频流方案FFmpeg(一种音视频处理程序),根据关键字幕时间点序列截取当前视频的关键画面。
在本实施例中,对截取的当前视频的关键画面按照视频中的播放顺序进行排序,组成当前视频的连环画模式的画面库。其中,连环画模式,即截取视频的关键剧情画面,组成一系列按播放时间排序的图册,从而满足观看关键剧情的需求。连环画模式在移动环境下具有突出优势,加载流量小且速度快。时长1分钟的高清视频大小约20M,标清版约4M,而连环画模式下的画面库仅需300k。假定用户的网速为10k/s,则加载高清视频需要等待34分钟,加载标清视频需要等待7分钟,而加载连环画模式下的画面库仅需30秒。
本发明实施例,通过对关键字幕时间点序列进行补帧处理,以及对关键字幕时间点序列中的关键字幕时间点进行偏移校正,使截取的关键画面更加连贯、准确、全面,从而使用户能够快速对视频进行预览,更加快捷、方便、完整地了解剧情,提升了用户体验。
图5是根据本发明一个实施例的视频画面的处理装置的结构示意图。如图5所示,视频画面的处理装置包括:获得模块100、截取模块200、生成模块300以及播放模块400。
获得模块100用于获得当前视频的信息。
在本实施例中,获得模块100从视频资源库中获得当前视频的信息,该信息可以包括视频源路径、字幕文件路径等。
截取模块200用于根据获得模块100获得的当前视频的信息截取当前视频的关键画面,关键画面包括带有完整字幕的视频帧画面。
在本实施例中,截取模块200可根据获得模块100获得的当前视频的信息获得关键字幕时间点序列。在获得关键字幕时间点序列之后,截取模块200可以对关键字幕时间点序列进行补帧处理,也可以对关键字幕时间点序列中的关键字幕时间点进行偏移校正,最后根据关键字幕时间点序列对应截取当前视频的关键画面。需要说明的是,补帧处理和偏移校正并无严格的执行顺序,即可以先进行补帧后进行偏移校正,也可以先进行偏移校正后进行补帧。
生成模块300用于对截取模块200截取到的关键画面进行排序,生成画面库。
在本实施例中,生成模块300对截取的当前视频的关键画面按照视频中的播放顺序进行排序,组成当前视频的连环画模式的画面库。其中,连环画模式,即截取视频的关键剧情画面,组成一系列按播放时间排序的图册,从而满足观看关键剧情的需求。
播放模块400用于接收播放请求,根据播放请求从生成模块生成的画面库中读取对应的关键画面进行播放。
在本实施例中,视频内容具有连环画模式和正常的视频模式。用户可选择观看视频,也可以通过观看连环画模式的画面库浏览剧情。两种模式可以互相切换。在遇到视频卡顿时,可自动切换为连环画模式。具体地,在视频播放过程中,自动预加载视频或关键画面,当预设加载量低于预设阈值(例如:当预加载量无法支持5s的连续播放),则自动切换至连环画模式,优先保证用户看剧情。同时用户也可手动切换至视频模式继续等待预加载。
本实施例中,在连环画模式下进行播放时,可以通过自动方式进行播放,也可以通过手动方式进行播放。通过自动播放方式时,播放模块400根据自动播放请求按顺序从画面库中读取对应的关键画面进行播放,并以每3秒1帧的速度按顺序自动播放画面库。这样,可以保证用户顺利阅读字幕,同时与一般的电视剧视频的播放时间相一致。可以理解,播放速度可通过用户根据自身需求预先设定。通过手动或自动播放时,播放模块400可以根据调用请求从画面库中读取对应的关键画面进行播放。例如,当预加载量无法支持5s的连续播放时,会从画面库中读取对应的关键画面进行播放,当播放一段时间后,若预加载量可以支持5s的连续播放时,可以停止从画面库中读取关键画面并恢复正常的视频播放。
采用上述连环画模式,可以节省流量,比如,时长30分钟的一段标清视频所耗流量在100M以上,而连环画模式仅需9M左右,能节省90%的流量。因而,可以保证用户使用极少的流量就可以追剧,从而提升访问频率和用户满意度。
在连环画模式的每帧画面下,还提供支持用户交流互动的功能。用户可针对关键剧情进行互动交流,创造丰富的用户生成内容。并且,视频和图片形式的广告都能以图片形式插入画面库,为用户提供更多的信息。用户还可以利用碎片时间,像看小说、看图片一样,随时随地追剧,而不必受环境、网络的严格限制。
本发明实施例的视频画面的处理装置,通过获得当前视频的信息,根据当前视频的信息截取当前视频的关键画面,并对关键画面进行排序,生成画面库,以及根据播放请求从画面库中读取对应的关键画面进行播放,在节省流量的同时,保证了在网络卡顿的情况下,用户能够快速对视频进行预览,以使用户快捷、方便地了解剧情,减少了用户在遇到移动视频卡顿情况时的跳出率,提升了用户体验。
图6是根据本发明一个具体实施例的视频画面的处理装置的结构示意图;图7是根据本发明一个具体实施例的视频画面的处理装置的另一个结构示意图。如图6、图7所示,视频画面的处理装置包括:获得模块100、截取模块200、生成模块300以及播放模块400。其中,截取模块200具体包括:时间点序列获得单元210、截取单元220、补帧单元230以及校正单元240。
时间点序列获得单元210用于根据当前视频的信息获得关键字幕时间点序列。
在本实施例中,时间点序列获得单元210可以通过网络、语音识别或图像识别等技术获取当前视频中每段语音字幕的开始和结束时间点,在每段语音字幕的结束时间点上截取一帧画面,以保证仅通过截取画面,就可以完整地看完所有字幕。
具体地,时间点序列获得单元210可以基于字幕文件获得关键字幕时间点序列,其中,影片字幕一般分为图形类型的字幕文件和文本格式的字幕文件;对于图形类型的字幕文件,时间点序列获得单元210可以通过分析其索引文件来获得视频中拥有对白的“字幕时间范围”序列;对于文本格式的字幕文件例如.srt、.ass格式的字幕文件,时间点序列获得单元210可以通过现有程序自动分析获取其中的“字幕时间范围”序列;最后根据这个序列中每个“字幕时间范围”成员的中间值或其他值生成“关键字幕时间点”序列,当然上述中间值或其他值的设置均可以保证获得带有完整字幕的视频帧。
除了可以基于字幕文件获得关键字幕时间点序列外,时间点序列获得单元210还可以使用语音分析的方式,即基于语音识别区分出人声部分,获得语音字幕的开始和结束时间点,从而获得关键字幕时间点。时间点序列获得单元210也可以采用图像识别的方式,即以0.5s为间隔,将视频转换为连续的帧,再以图片识别的形式识别出特定区域带有完整字幕的帧,去重后直接获得最终的图片帧序列,则这些图片帧序列对应的时间即为关键字幕时间点序列。
截取单元220用于根据关键字幕时间点序列对应截取当前视频的关键画面。
补帧单元230用于判断时间点序列获得单元210获得的或校正单元240校正后的关键字幕时间点序列中的相邻两个关键字幕时间点之间的时间间隔是否大于预定值,若大于,则在相邻两个关键字幕时间点之间获取新增的关键字幕时间点,并将新增的关键字幕时间点插入关键字幕时间点序列中。
当两帧画面间隔时间过长,例如超过预定时间5秒时,则每5秒需截取一副“补帧”,这是因为,这段时间内虽没有语音,但可能有动作镜头发生,动作镜头也会影响用户对剧情的理解。因此,1分钟长的视频约截图15次,以保证剧情的连贯性,每张图片大小为20k,对应当前视频的所有图片文件共计300k。
具体地,补帧单元230判断相邻两个关键字幕时间点之间的时间间隔是否大于预定值,若大于,则在相邻两个关键字幕时间点之间获取新增的关键字幕时间点,并将新增的关键字幕时间点插入关键字幕时间点序列中。例如,当相邻两个“关键字幕时间点”相差超过5s时,则在其之间插入一个中间值时间点上的截图,超过6s插入2个截图,依次类推,以保证至少平均4s内有一个图片,从而可以保证剧情的连贯性。
校正单元240用于对时间点序列获得单元210或补帧单元230获得的关键字幕时间点序列中的关键字幕时间点进行偏移校正。
由于字幕文件一般都有误差,所以根据字幕文件获得的“关键字幕时间点”需要通过偏移校验,自动修正,校正单元240可以通过验证首10个“字幕时间范围”的开始时间来确定偏移量参数,该偏移量参数可通过对比由图像识别或语音识别方式获得的开始时间点和字幕文件中字幕的开始时间来自动获得,也可以通过其他方法获得。校正单元240通过该偏移量参数对“关键字幕时间点”序列进行偏移校正。
需要说明的是,补帧单元230进行的补帧处理和校正单元240的偏移校正并无严格的执行顺序,即可以先进行补帧后进行偏移校正,也可以先进行偏移校正后进行补帧。
本发明实施例的视频画面的处理装置,通过对关键字幕时间点序列进行补帧处理,以及对关键字幕时间点序列中的关键字幕时间点进行偏移校正,使截取的关键画面更加连贯、准确,从而用户能够快速对视频进行预览,更加快捷、方便地了解剧情,提升了用户体验。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (12)

1.一种视频画面的处理方法,其特征在于,包括:
获得当前视频的信息;
根据所述当前视频的信息截取当前视频的关键画面,所述关键画面包括带有完整字幕的视频帧画面;
对所述关键画面进行排序,生成画面库;以及
接收播放请求,根据所述播放请求从所述画面库中读取对应的关键画面进行播放。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前视频的信息截取当前视频的关键画面包括:
根据所述当前视频的信息获得关键字幕时间点序列;
根据所述关键字幕时间点序列对应截取当前视频的关键画面。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述当前视频的信息获得关键字幕时间点序列之后,所述根据所述关键字幕时间点序列对应截取当前视频的关键画面之前,该方法还包括:
判断相邻两个关键字幕时间点之间的时间间隔是否大于预定值,若大于,则在所述相邻两个关键字幕时间点之间获取新增的关键字幕时间点,并将所述新增的关键字幕时间点插入所述关键字幕时间点序列中;和/或
对所述关键字幕时间点序列中的关键字幕时间点进行偏移校正。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述当前视频的信息获得关键字幕时间点序列包括:
根据所述当前视频的字幕文件获得字幕时间范围序列,根据字幕时间范围序列生成关键字幕时间点序列;或者
对当前视频进行语音识别,获得字幕时间范围序列,根据字幕时间范围序列生成关键字幕时间点序列;或者
将当前视频转换为视频帧,采用图像识别的方式识别出预定区域带有完整字幕的视频帧序列,对所述视频帧序列进行去重处理,将去重后的视频帧序列对应的时间作为关键字幕时间点序列。
5.根据权利要求1所述的方法,其特征在于,所述接收播放请求,根据所述播放请求从所述画面库中读取对应的关键画面进行播放,包括:
接收自动播放请求,根据所述自动播放请求按顺序从所述画面库中读取对应的关键画面进行播放;或者
接收调用请求,根据所述调用请求从所述画面库中读取对应的关键画面进行播放。
6.根据权利要求5所述的方法,其特征在于,所述根据所述调用请求从所述画面库中读取对应的关键画面进行播放之后,该方法还包括:
接收停止播放请求,根据所述停止播放请求停止从所述画面库中读取关键画面。
7.一种视频画面的处理装置,其特征在于,包括:
获得模块,用于获得当前视频的信息;
截取模块,用于根据所述获得模块获得的所述当前视频的信息截取当前视频的关键画面,所述关键画面包括带有完整字幕的视频帧画面;
生成模块,用于对所述截取模块截取到的所述关键画面进行排序,生成画面库;以及
播放模块,用于接收播放请求,根据所述播放请求从所述生成模块生成的所述画面库中读取对应的关键画面进行播放。
8.根据权利要求7所述的装置,其特征在于,所述截取模块包括:
时间点序列获得单元,用于根据所述当前视频的信息获得关键字幕时间点序列;
截取单元,用于根据所述关键字幕时间点序列对应截取当前视频的关键画面。
9.根据权利要求8所述的装置,其特征在于,所述截取模块还包括位于所述时间点序列获得单元和所述截取单元之间的补帧单元和校正单元,其中:
所述补帧单元,用于判断所述时间点序列获得单元获得的或所述校正单元校正后的关键字幕时间点序列中的相邻两个关键字幕时间点之间的时间间隔是否大于预定值,若大于,则在所述相邻两个关键字幕时间点之间获取新增的关键字幕时间点,并将所述新增的关键字幕时间点插入所述关键字幕时间点序列中;和/或
所述校正单元,用于对所述时间点序列获得单元或所述补帧单元获得的所述关键字幕时间点序列中的关键字幕时间点进行偏移校正。
10.根据权利要求8或9所述的装置,其特征在于,所述时间点序列获得单元,具体用于:
根据所述当前视频的字幕文件获得字幕时间范围序列,根据字幕时间范围序列生成关键字幕时间点序列;或者
对当前视频进行语音识别,获得字幕时间范围序列,根据字幕时间范围序列生成关键字幕时间点序列;或者
将当前视频转换为视频帧,采用图像识别的方式识别出预定区域带有完整字幕的视频帧序列,对所述视频帧序列进行去重处理,将去重后的视频帧序列对应的时间作为关键字幕时间点序列。
11.根据权利要求7所述的装置,其特征在于,所述播放模块,具体用于:
接收自动播放请求,根据所述自动播放请求按顺序从所述画面库中读取对应的关键画面进行播放;或者
接收调用请求,根据所述调用请求从所述画面库中读取对应的关键画面进行播放。
12.根据权利要求11所述的装置,其特征在于,所述播放模块,还用于:
在根据所述调用请求从所述画面库中读取对应的关键画面进行播放之后,接收停止播放请求,根据所述停止播放请求停止从所述画面库中读取关键画面。
CN201310646783.6A 2013-12-04 2013-12-04 视频画面的处理方法及装置 Active CN103634605B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201310646783.6A CN103634605B (zh) 2013-12-04 2013-12-04 视频画面的处理方法及装置
PCT/CN2014/089946 WO2015081776A1 (zh) 2013-12-04 2014-10-30 视频画面的处理方法及装置
KR1020157035232A KR101746165B1 (ko) 2013-12-04 2014-10-30 동영상 화면의 처리 방법 및 장치
JP2016535328A JP6266109B2 (ja) 2013-12-04 2014-10-30 動画画面の処理方法及び装置
US14/392,326 US9973793B2 (en) 2013-12-04 2014-10-30 Method and apparatus for processing video image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310646783.6A CN103634605B (zh) 2013-12-04 2013-12-04 视频画面的处理方法及装置

Publications (2)

Publication Number Publication Date
CN103634605A true CN103634605A (zh) 2014-03-12
CN103634605B CN103634605B (zh) 2017-02-15

Family

ID=50215178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310646783.6A Active CN103634605B (zh) 2013-12-04 2013-12-04 视频画面的处理方法及装置

Country Status (5)

Country Link
US (1) US9973793B2 (zh)
JP (1) JP6266109B2 (zh)
KR (1) KR101746165B1 (zh)
CN (1) CN103634605B (zh)
WO (1) WO2015081776A1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581407A (zh) * 2014-12-31 2015-04-29 北京奇艺世纪科技有限公司 一种视频预览的方法和装置
WO2015081776A1 (zh) * 2013-12-04 2015-06-11 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置
CN105635749A (zh) * 2014-10-31 2016-06-01 广州市动景计算机科技有限公司 产生视频帧集合的方法和设备
CN105635849A (zh) * 2015-12-25 2016-06-01 网易传媒科技(北京)有限公司 多媒体文件播放时的文本显示方法和装置
CN106201713A (zh) * 2016-06-30 2016-12-07 宇龙计算机通信科技(深圳)有限公司 一种卡顿的处理方法及系统
CN106295592A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的识别方法、装置及电子设备
CN106454151A (zh) * 2016-10-18 2017-02-22 珠海市魅族科技有限公司 视频画面拼接方法及装置
CN107484018A (zh) * 2017-07-31 2017-12-15 维沃移动通信有限公司 一种视频截图方法、移动终端
CN108833973A (zh) * 2018-06-28 2018-11-16 腾讯科技(深圳)有限公司 视频特征的提取方法、装置和计算机设备
CN109756767A (zh) * 2017-11-06 2019-05-14 腾讯科技(深圳)有限公司 预览数据播放方法、装置及存储介质
CN109803180A (zh) * 2019-03-08 2019-05-24 腾讯科技(深圳)有限公司 视频预览图生成方法、装置、计算机设备及存储介质
CN109859298A (zh) * 2019-03-05 2019-06-07 腾讯科技(深圳)有限公司 一种图像处理方法及其装置、设备和存储介质
CN109936763A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 视频的处理及发布方法
CN110198467A (zh) * 2018-02-27 2019-09-03 优酷网络技术(北京)有限公司 视频播放方法及装置
CN110784750A (zh) * 2019-08-13 2020-02-11 腾讯科技(深圳)有限公司 视频播放方法、装置及计算机设备
CN112118494A (zh) * 2019-06-20 2020-12-22 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置及存储介质
CN112672090A (zh) * 2020-12-17 2021-04-16 深圳随锐云网科技有限公司 一种云视频会议中优化音视频效果的方法
CN113766149A (zh) * 2020-08-28 2021-12-07 北京沃东天骏信息技术有限公司 字幕拼接图片的拼接方法、装置、电子设备和存储介质
US11223880B2 (en) 2018-08-17 2022-01-11 Tencent Technology (Shenzhen) Company Limited Picture generation method and apparatus, device, and storage medium

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9190110B2 (en) 2009-05-12 2015-11-17 JBF Interlude 2009 LTD System and method for assembling a recorded composition
US11232458B2 (en) 2010-02-17 2022-01-25 JBF Interlude 2009 LTD System and method for data mining within interactive multimedia
US9009619B2 (en) 2012-09-19 2015-04-14 JBF Interlude 2009 Ltd—Israel Progress bar for branched videos
US9257148B2 (en) 2013-03-15 2016-02-09 JBF Interlude 2009 LTD System and method for synchronization of selectably presentable media streams
US10448119B2 (en) 2013-08-30 2019-10-15 JBF Interlude 2009 LTD Methods and systems for unfolding video pre-roll
US9653115B2 (en) 2014-04-10 2017-05-16 JBF Interlude 2009 LTD Systems and methods for creating linear video from branched video
US9792957B2 (en) 2014-10-08 2017-10-17 JBF Interlude 2009 LTD Systems and methods for dynamic video bookmarking
US11412276B2 (en) 2014-10-10 2022-08-09 JBF Interlude 2009 LTD Systems and methods for parallel track transitions
US10582265B2 (en) 2015-04-30 2020-03-03 JBF Interlude 2009 LTD Systems and methods for nonlinear video playback using linear real-time video players
US10460765B2 (en) 2015-08-26 2019-10-29 JBF Interlude 2009 LTD Systems and methods for adaptive and responsive video
US11164548B2 (en) * 2015-12-22 2021-11-02 JBF Interlude 2009 LTD Intelligent buffering of large-scale video
US11128853B2 (en) 2015-12-22 2021-09-21 JBF Interlude 2009 LTD Seamless transitions in large-scale video
US10462202B2 (en) 2016-03-30 2019-10-29 JBF Interlude 2009 LTD Media stream rate synchronization
US11856271B2 (en) 2016-04-12 2023-12-26 JBF Interlude 2009 LTD Symbiotic interactive video
US10218760B2 (en) 2016-06-22 2019-02-26 JBF Interlude 2009 LTD Dynamic summary generation for real-time switchable videos
CN108124164B (zh) * 2016-11-28 2021-10-26 广州方硅信息技术有限公司 一种视频播放的方法、系统、主播端设备及客户端设备
US11050809B2 (en) 2016-12-30 2021-06-29 JBF Interlude 2009 LTD Systems and methods for dynamic weighting of branched video paths
KR101924634B1 (ko) * 2017-06-07 2018-12-04 네이버 주식회사 콘텐츠 제공 서버, 콘텐츠 제공 단말 및 콘텐츠 제공 방법
US10257578B1 (en) 2018-01-05 2019-04-09 JBF Interlude 2009 LTD Dynamic library display for interactive videos
US11601721B2 (en) 2018-06-04 2023-03-07 JBF Interlude 2009 LTD Interactive video dynamic adaptation and user profiling
CN109672932B (zh) * 2018-12-29 2021-09-28 深圳Tcl新技术有限公司 辅助视力障碍者观看视频的方法、系统、设备及存储介质
CN109714644B (zh) * 2019-01-22 2022-02-25 广州虎牙信息科技有限公司 一种视频数据的处理方法、装置、计算机设备和存储介质
US11011183B2 (en) * 2019-03-25 2021-05-18 Cisco Technology, Inc. Extracting knowledge from collaborative support sessions
CN110490101A (zh) * 2019-07-30 2019-11-22 平安科技(深圳)有限公司 一种图片截取方法、装置及计算机存储介质
CN110602546A (zh) * 2019-09-06 2019-12-20 Oppo广东移动通信有限公司 视频生成方法、终端及计算机可读存储介质
US11490047B2 (en) 2019-10-02 2022-11-01 JBF Interlude 2009 LTD Systems and methods for dynamically adjusting video aspect ratios
CN111161392B (zh) * 2019-12-20 2022-12-16 苏宁云计算有限公司 一种视频的生成方法、装置及计算机系统
CN111104913B (zh) * 2019-12-23 2023-03-24 福州大学 一种基于结构及相似度的视频提取ppt方法
US11245961B2 (en) 2020-02-18 2022-02-08 JBF Interlude 2009 LTD System and methods for detecting anomalous activities for interactive videos
US12047637B2 (en) 2020-07-07 2024-07-23 JBF Interlude 2009 LTD Systems and methods for seamless audio and video endpoint transitions
US11625928B1 (en) * 2020-09-01 2023-04-11 Amazon Technologies, Inc. Language agnostic drift correction
US11882337B2 (en) 2021-05-28 2024-01-23 JBF Interlude 2009 LTD Automated platform for generating interactive videos
US11934477B2 (en) 2021-09-24 2024-03-19 JBF Interlude 2009 LTD Video player integration within websites

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070292102A1 (en) * 2006-06-15 2007-12-20 Fujifilm Corporation Image processing method, image processing device, image processing program and image browsing system
CN101770701A (zh) * 2008-12-30 2010-07-07 北京新学堂网络科技有限公司 一种用于外语学习的电影连环画制作方法
CN102685574A (zh) * 2011-03-09 2012-09-19 须泽中 从数字电视节目中自动抽取图像的系统及其应用
CN103020076A (zh) * 2011-09-23 2013-04-03 深圳市快播科技有限公司 一种播放器的视频文件动态预览方法和装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3472659B2 (ja) 1995-02-20 2003-12-02 株式会社日立製作所 映像供給方法および映像供給システム
JPH11313048A (ja) 1998-04-24 1999-11-09 Kokusai Electric Co Ltd マルチメディア通信方法及び通信装置
EP1809028A4 (en) 2004-11-02 2009-10-28 Tv Asahi Data Vision Corp INCRUSTATION FIXED IMAGE CONTENT CREATING DEVICE, INCRUSTATION FIXED IMAGE CONTENT CREATING PROGRAM, AND INCRUSTATION FIXED IMAGE CONTENT CREATION SYSTEM
TWI267303B (en) * 2005-07-11 2006-11-21 Inventec Corp Video browsing system and the method
JP4846674B2 (ja) 2007-08-14 2011-12-28 日本放送協会 静止画抽出装置及び静止画抽出プログラム
JP5173337B2 (ja) 2007-09-18 2013-04-03 Kddi株式会社 要約コンテンツ生成装置およびコンピュータプログラム
JP5246948B2 (ja) 2009-03-27 2013-07-24 Kddi株式会社 字幕ずれ補正装置、再生装置および放送装置
US8281231B2 (en) * 2009-09-11 2012-10-02 Digitalsmiths, Inc. Timeline alignment for closed-caption text using speech recognition transcripts
JP5232744B2 (ja) 2009-09-14 2013-07-10 Kddi株式会社 要約コンテンツを表示する表示装置、方法及びプログラム
US8332530B2 (en) * 2009-12-10 2012-12-11 Hulu Llc User interface including concurrent display of video program, histogram, and transcript
KR101289267B1 (ko) * 2009-12-22 2013-08-07 한국전자통신연구원 방송통신시스템에서 dtv 자막 처리 장치 및 방법
CN101901619B (zh) * 2010-07-16 2012-10-17 复旦大学 一种基于视频内容缩影的增强用户体验的视频播放器
JP5677229B2 (ja) 2011-07-28 2015-02-25 日本放送協会 映像字幕検出装置およびそのプログラム
WO2013043984A1 (en) * 2011-09-23 2013-03-28 Documentation Services Group, Inc. Systems and methods for extracting and processing intelligent structured data from media files
CN102364960B (zh) * 2011-11-04 2015-05-27 播思通讯技术(北京)有限公司 移动数字电视画中画和频道缩略图的播放方法及移动终端
CN103634605B (zh) * 2013-12-04 2017-02-15 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070292102A1 (en) * 2006-06-15 2007-12-20 Fujifilm Corporation Image processing method, image processing device, image processing program and image browsing system
CN101770701A (zh) * 2008-12-30 2010-07-07 北京新学堂网络科技有限公司 一种用于外语学习的电影连环画制作方法
CN102685574A (zh) * 2011-03-09 2012-09-19 须泽中 从数字电视节目中自动抽取图像的系统及其应用
CN103020076A (zh) * 2011-09-23 2013-04-03 深圳市快播科技有限公司 一种播放器的视频文件动态预览方法和装置

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015081776A1 (zh) * 2013-12-04 2015-06-11 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置
US10313712B2 (en) 2014-10-31 2019-06-04 Guangzhou Ucweb Computer Technology Co., Ltd. Method, device, and server for producing video frame set
CN105635749A (zh) * 2014-10-31 2016-06-01 广州市动景计算机科技有限公司 产生视频帧集合的方法和设备
CN105635749B (zh) * 2014-10-31 2017-03-22 广州市动景计算机科技有限公司 产生视频帧集合的方法和设备
CN104581407A (zh) * 2014-12-31 2015-04-29 北京奇艺世纪科技有限公司 一种视频预览的方法和装置
CN105635849B (zh) * 2015-12-25 2018-06-05 网易传媒科技(北京)有限公司 多媒体文件播放时的文本显示方法和装置
CN105635849A (zh) * 2015-12-25 2016-06-01 网易传媒科技(北京)有限公司 多媒体文件播放时的文本显示方法和装置
CN106201713A (zh) * 2016-06-30 2016-12-07 宇龙计算机通信科技(深圳)有限公司 一种卡顿的处理方法及系统
CN106201713B (zh) * 2016-06-30 2019-10-22 宇龙计算机通信科技(深圳)有限公司 一种卡顿的处理方法及系统
WO2018000639A1 (zh) * 2016-06-30 2018-01-04 宇龙计算机通信科技(深圳)有限公司 一种卡顿的处理方法及系统
CN106295592A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的识别方法、装置及电子设备
CN106454151A (zh) * 2016-10-18 2017-02-22 珠海市魅族科技有限公司 视频画面拼接方法及装置
CN107484018A (zh) * 2017-07-31 2017-12-15 维沃移动通信有限公司 一种视频截图方法、移动终端
CN109756767A (zh) * 2017-11-06 2019-05-14 腾讯科技(深圳)有限公司 预览数据播放方法、装置及存储介质
CN109756767B (zh) * 2017-11-06 2021-12-14 腾讯科技(深圳)有限公司 预览数据播放方法、装置及存储介质
CN109936763B (zh) * 2017-12-15 2022-07-01 腾讯科技(深圳)有限公司 视频的处理及发布方法
CN109936763A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 视频的处理及发布方法
CN110198467A (zh) * 2018-02-27 2019-09-03 优酷网络技术(北京)有限公司 视频播放方法及装置
CN108833973A (zh) * 2018-06-28 2018-11-16 腾讯科技(深圳)有限公司 视频特征的提取方法、装置和计算机设备
US11223880B2 (en) 2018-08-17 2022-01-11 Tencent Technology (Shenzhen) Company Limited Picture generation method and apparatus, device, and storage medium
CN109859298A (zh) * 2019-03-05 2019-06-07 腾讯科技(深圳)有限公司 一种图像处理方法及其装置、设备和存储介质
CN109803180B (zh) * 2019-03-08 2022-05-20 腾讯科技(深圳)有限公司 视频预览图生成方法、装置、计算机设备及存储介质
CN109803180A (zh) * 2019-03-08 2019-05-24 腾讯科技(深圳)有限公司 视频预览图生成方法、装置、计算机设备及存储介质
CN112118494A (zh) * 2019-06-20 2020-12-22 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置及存储介质
CN110784750A (zh) * 2019-08-13 2020-02-11 腾讯科技(深圳)有限公司 视频播放方法、装置及计算机设备
CN110784750B (zh) * 2019-08-13 2022-11-11 腾讯科技(深圳)有限公司 视频播放方法、装置及计算机设备
CN113766149A (zh) * 2020-08-28 2021-12-07 北京沃东天骏信息技术有限公司 字幕拼接图片的拼接方法、装置、电子设备和存储介质
CN112672090B (zh) * 2020-12-17 2023-04-18 深圳随锐视听科技有限公司 一种云视频会议中优化音视频效果的方法
CN112672090A (zh) * 2020-12-17 2021-04-16 深圳随锐云网科技有限公司 一种云视频会议中优化音视频效果的方法

Also Published As

Publication number Publication date
WO2015081776A1 (zh) 2015-06-11
CN103634605B (zh) 2017-02-15
US9973793B2 (en) 2018-05-15
JP2016531512A (ja) 2016-10-06
US20160277779A1 (en) 2016-09-22
KR20160010507A (ko) 2016-01-27
JP6266109B2 (ja) 2018-01-24
KR101746165B1 (ko) 2017-06-12

Similar Documents

Publication Publication Date Title
CN103634605A (zh) 视频画面的处理方法及装置
CN104994425B (zh) 一种视频标识方法和装置
EP2362644B1 (en) Recording system
US10659721B2 (en) Method of processing a sequence of coded video frames
EP2991361A1 (en) Method, device, and system for improving channel change speed
US20110214147A1 (en) Method for determining content for a personal channel
US20180270526A1 (en) Dynamic advertisement insertion
CN102077602A (zh) 用于视频流的递送的基于区间的广告插入
CA2764800A1 (en) Insertion of recorded secondary digital video content during playback of primary digital video content
CN113542795A (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
US9374606B2 (en) Synchronization of supplemental digital content
CN103763618A (zh) 一种清晰度切换方法及电子设备
CN109479160B (zh) 用于推荐显示设备的内容的显示设备和方法
US20130188933A1 (en) Method for semantics based trick mode play in video system
US20200296479A1 (en) Media content delivery selection
US20170055045A1 (en) Recovering from discontinuities in time synchronization in audio/video decoder
CN111314734A (zh) 智能电视中的信息推送方法、装置及控制器
CN105959805B (zh) 电视节目的播放方法及播放装置
CN101155279A (zh) 显示设备及其广播信号显示方法
CN108985244B (zh) 一种电视节目类型识别方法及装置
CN105791953A (zh) 播放控制方法和装置
CN112565856A (zh) 显示设备和电视节目的切换方法
CN103248953A (zh) 一种电视广告时间的处理方法、系统及电视节目播放终端
CN110740378A (zh) 一种视频中广告识别方法、系统、装置和存储介质
US20050283793A1 (en) Advertising detection method and related system for detecting advertising according to specific beginning/ending images of advertising sections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant