CN106792212A - 一种视频进度调节方法、装置及电子设备 - Google Patents

一种视频进度调节方法、装置及电子设备 Download PDF

Info

Publication number
CN106792212A
CN106792212A CN201611101471.7A CN201611101471A CN106792212A CN 106792212 A CN106792212 A CN 106792212A CN 201611101471 A CN201611101471 A CN 201611101471A CN 106792212 A CN106792212 A CN 106792212A
Authority
CN
China
Prior art keywords
video
frame
audio
tone color
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611101471.7A
Other languages
English (en)
Inventor
赵雨
李时斌
郭建伟
张永巍
袁斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201611101471.7A priority Critical patent/CN106792212A/zh
Publication of CN106792212A publication Critical patent/CN106792212A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Studio Circuits (AREA)

Abstract

本发明涉及视频播放技术领域,特别是涉及一种视频进度调节方法、装置及电子设备。其中,该视频进度调节方法包括:响应于用户对视频中进度条的进度点进行的调节操作,确定视频中与进度点对应的第一视频帧;根据第一视频帧和第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;将进度点调节至第二视频帧进行播放。终端可以在用户所要调节的进度点周边选择起始语句或起始画面的第二视频帧进行播放,使用户能够欣赏到一段完整的对白或者能够从一个视频场景的起始点开始欣赏该视频场景,从而增强对影片的可读性,提高了用户在观影过程中的整体可读性。

Description

一种视频进度调节方法、装置及电子设备
技术领域
本发明涉及视频播放技术领域,特别是涉及一种视频进度调节方法、装置及电子设备。
背景技术
人们在观看视频时,喜欢以快进或者快退的方式观看视频。例如,当遇到熟悉的视频场景时,人们为了节约观看时间,经常选择以快进的方式跳跃该视频场景。
现有技术能够视频进度进行有效地调节,使播放器选择进度点对应的视频帧进行播放。
发明人在实现本发明的过程中,发现相关技术存在以下问题:现有视频进度调节的方法过于粗糙,有时进度点落在一段视频场景的中间并进行播放,或者有时进度点落在一个完整语句的中间,例如,完整语句“我今天去观看电影,电影院有很多人”,当进度点落在“电影院有很多人”对应的视频帧并进行播放时,用户未能够承上启下地观看视频,从而极大降低用户的体验感。
发明内容
本发明实施例的一个目的旨在提供一种视频进度调节方法、装置及电子设备,其解决现有视频进度调节技术存在进度调节精度不高的技术问题。
为解决上述技术问题,本发明实施例提供以下技术方案:
在第一方面,本发明实施例提供一种视频进度调节方法,所述视频进度调节方法包括:响应于用户对视频中进度条的进度点进行的调节操作,确定所述视频中与所述进度点对应的第一视频帧;根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;将所述进度点调节至所述第二视频帧进行播放。
可选地,所述根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧,包括:从所述视频中提取出所述第一视频帧的临近视频帧;从所述第一视频帧中提取出第一音频及从所述临近视频帧中提取出第二音频;在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧;在检测到所述第一音频的音色匹配所述第二音频的音色,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧,包括:在检测到所述第一音频的音色不匹配所述第二音频的音色时,判断所述第二音频的音调是否匹配语气助词的音调;若所述第二音频的音调匹配语气助词的音调,将所述临近视频帧的下一帧的视频帧确定为所述第二视频帧;若所述第二音频的音调未匹配语气助词的音调,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧,包括:在检测到所述第一音频的音色不匹配所述第二音频的音色时,从所述临近视频帧的第二音频解析出文字内容;判断所述文字内容是否包括符合预设关键词;若所述文字内容包括符合预设关键词,将所述临近视频帧确定为所述第二视频帧;若所述文字内容未包括符合预设关键词,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧,包括:从所述视频提取出所述第一视频帧的临近视频帧;若所述临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景,将所述临近视频帧确定为所述第二视频帧;若所述临近视频帧的画面场景和所述第一视频帧的画面场景属于同一场景,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述另一临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景。
在第三方面,本发明实施例提供一种视频进度调节装置,所述视频进度调节装置包括:响应模块,用于响应于用户对视频中进度条的进度点进行的调节操作,确定所述视频中与所述进度点对应的第一视频帧;获取模块,用于根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;调节模块,用于将所述进度点调节至所述第二视频帧进行播放。
可选地,所述获取模块包括:第一提取单元,用于从所述视频中提取出所述第一视频帧的临近视频帧;第二提取单元,用于从所述第一视频帧中提取出第一音频及从所述临近视频帧中提取出第二音频;第一确定单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧;第三提取单元,用于在检测到所述第一音频的音色匹配所述第二音频的音色,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述第一确定单元还包括:第一判断子单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,判断所述第二音频的音调是否匹配语气助词的音调;第一确定子单元,用于若所述第二音频的音调匹配语气助词的音调,将所述临近视频帧的下一帧的视频帧确定为所述第二视频帧;第一提取子单元,用于若所述第二音频的音调未匹配语气助词的音调,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述第一确定单元还包括:解析子单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,从所述临近视频帧的第二音频解析出文字内容;第二判断子单元,用于判断所述文字内容是否包括符合预设关键词;第二确定子单元,用于若所述文字内容包括符合预设关键词,将所述临近视频帧确定为所述第二视频帧;第二提取子单元,用于若所述文字内容未包括符合预设关键词,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
可选地,所述获取模块包括:第四提取单元,用于从所述视频提取出所述第一视频帧的临近视频帧;第二确定单元,用于若所述临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景,将所述临近视频帧确定为所述第二视频帧;第五提取单元,用于若所述临近视频帧的画面场景和所述第一视频帧的画面场景属于同一场景,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述另一临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景。
在第三方面,本发明实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够用于执行上述的视频进度调节方法。
在本发明各个实施例中,用户在进度条调节进度点,终端视频中与进度点对应的第一视频帧,并且根据第一视频帧和第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧,将进度点调节至第二视频帧进行播放,因此,终端可以在用户所要调节的进度点周边选择起始语句或起始画面的第二视频帧进行播放,使用户能够欣赏到一段完整的对白或者能够从一个视频场景的起始点开始欣赏该视频场景,从而增强对影片的可读性,提高了用户在观影过程中的整体可读性。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明实施例提供一种视频进度调节方法的流程示意图;
图1a是本发明实施例提供一种视频播放页面的示意图;
图2是本发明另一实施例提供一种视频进度调节方法的流程示意图;
图2a是本发明实施例提供另一种视频播放页面的示意图;
图3是本发明又另一实施例提供一种视频进度调节方法的流程示意图;
图4是本发明又另一实施例提供一种视频进度调节方法的流程示意图;
图5是本发明又另一实施例提供一种视频进度调节方法的流程示意图;
图6是本发明实施例提供一种视频进度调节装置的结构示意图;
图7是本发明另一实施例提供一种视频进度调节装置的结构示意图;
图7a是图7的获取模块的一种结构示意图;
图7b是图7a的第一确定单元的结构示意图;
图7c是图7的获取模块的另一种结构示意图;
图8是本发明实施例提供一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例的视频进度调节方法,可以在任何合适类型,具有用户交互装置和运算能力的处理器的用户终端中执行,例如台式计算机、智能手机、平板电脑以及其他用户终端中。
本发明实施例的视频进度调节装置可以作为其中一个软件或者硬件功能单元,独立设置在上述用户终端中,也可以作为整合在处理器中的其中一个功能模块,执行本发明实施例的视频进度调节方法。
图1是本发明实施例提供一种视频进度调节方法的流程示意图。如图1所示,视频进度调节方法包括:
步骤10、响应于用户对视频中进度条的进度点进行的调节操作,确定视频中与进度点对应的第一视频帧;
图1a是本发明实施例提供一种视频播放页面的示意图。如图1a所示,用户在视频播放页面1a1播放视频,其中,该视频播放页面1a1包括进度条10a以及用于调节视频进度的进度点10b。用户可以将位于时间点t0的进度点10b调节到位于时间点t1,从而实现对视频的进度调节。用户在调节进度点时,终端响应于用户对进度条的进度点进行的调节操作,当检测到进度点10b位于时间点t1时,终端查找出位于时间点t1对应的视频帧,并且将查找出的视频帧确定为第一视频帧。
在一些实施例中,视频播放页面可以是在线视频播放页面,亦可以是本地播放器加载本地影片进行播放的本地视频播放页面。
步骤12、根据第一视频帧和第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;
终端根据预设规则,选择第一视频帧的临近视频帧。当终端检测到第一视频帧的临近视频帧的视频内容是起始语句或者起始场景时,便将该临近视频帧作为第二视频帧。其中,设计者可以根据业务需求自行定义选择第一视频帧的临近视频帧的预设规则。例如,请再参阅图1a,时间点t1对应第一视频帧,预设规则可以指示终端选择位于时间点t2的临近视频帧进行解析,其中,该临近视频帧和第一视频帧间隔一帧视频帧。可选地,预设规则还可以指示终端选择位于时间点t3的临近视频帧进行解析,其中,该临近视频帧和第一视频帧间隔两帧视频帧。可选地,预设规则可以指示终端选择位于时间点t5的临近视频帧进行解析,其中,该临近视频帧和第一视频帧间隔四帧视频帧。可选地,预设规则除了指示终端选择位于时间点t1之后的临近视频帧进行解析之外,其还可以指示终端选择位于时间点t1之前的临近视频帧进行解析,如图1a所示,第一预设规则还可以指示终端选择位于时间点t01的临近视频帧进行解析,其中,该临近视频帧和第一视频帧间隔两帧视频帧。
终端将根据预设规则选择到并且与第一视频帧关联的临近视频帧进行解析,当需要解析临近视频帧的音频时,终端从该临近视频帧提取出音频,并且判断该音频是否是起始语句。其中,起始语句用于表征一段完整对话的起始点,例如,一段完整对话“明天这件事情务必处理好,不要影响到后期的进货和商务筹划工作,所以麻烦你们全部员工明天到齐”,视频播放该对话时,需要使用两个视频画面来完成这段对话,例如,第一视频画面的字幕是“明天这件事情务必处理好,不要影响到后期的进货和商务筹划工作”,第二视频画面的字幕是“所以麻烦你们全部员工明天到齐”,在该完整对话中,“明天这件事情务必处理好,不要影响到后期的进货和商务筹划工作”是起始语句。当终端判断到该音频是起始语句,则确定该临近视频帧是第二视频帧。
进一步的,终端还可以解析临近视频帧,判断该临近视频帧的视频场景是否是起始场景。在拍摄和录制视频中,镜头的切换而产生不同的视频场景,在一些实施例中,镜头可以表征为利用摄像机的某一视角拍摄的一系列视频帧。场景可以被表征为可以在行为、地点、背景和/或时间上相关的镜头集合。然而,起始场景可以表征为拍摄在特别位置发生的某一行为的连续镜头集合的起始行为。一个视频可以包括多个视频场景,对于位于时间点t1对应第一视频帧,其对应着视频中的一个视频场景。例如,一个爆炸场景包括烈火燃烧画面、人们慌乱画面、消防车驶入画面及伤员营救画面。其中,“烈火燃烧画面”是爆炸场景的起始场景。
终端在解析视频帧的场景时,可以采用各类视频图像处理方法处理各个视频帧,以确定视频内容是起始场景的第二视频帧。例如,在一些实施例中,可以采用直方图算法分别提取出第一视频帧和临近视频帧的亮度直方图,根据第一视频帧和临近视频帧的亮度直方图之间的相关性确定第一视频帧和临近视频帧是否是同一场景,如果相关性超过既定阈值,则认为是同一场景,否则为不同场景。当确定是同一场景时,终端还要继续解析第一视频帧的另一临近视频帧,以查找出与第一视频帧的场景不同的第二视频帧,或者,终端还可以继续查找出与第一视频帧同属于同一场景并且是该场景的起始点的第二视频帧。在一些实施例中,终端还可以采用其它视频图像处理算法对各个视频帧进行解析,例如,可以采用DCT分量算法,运动矢量算法或者帧差量算法。
步骤14、将进度点调节至第二视频帧进行播放。
当终端确定第二视频帧,便可以将进度点调节至第二视频帧进行播放。
在本实施例中,终端可以在用户所要调节的进度点周边选择起始语句或起始画面的第二视频帧进行播放,使用户能够欣赏到一段完整的对白或者能够从一个视频场景的起始点开始欣赏该视频场景,从而增强对影片的可读性,提高了用户在观影过程中的整体可读性。
在一些实施例中,终端解析各个视频帧以确定视频内容为起始语句的第二视频帧时,可以解析视频帧的音频的音色以确定第二视频帧。可选地,如图2所示,步骤12包括:
步骤1211、从视频中提取出第一视频帧的临近视频帧;
步骤1212、从第一视频帧中提取出第一音频及从临近视频帧中提取出第二音频;
步骤1213、在检测到第一音频的音色不匹配第二音频的音色时,将临近视频帧确定为第二视频帧;
步骤1214、在检测到第一音频的音色匹配第二音频的音色,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
终端按照视频的播放顺序,依次播放视频的各个视频帧。如图2a所示,第一视频帧位于时间点t1的进度点,最接近第一视频帧的视频帧分别位于时间点t2和t3,此处,终端可以提取位于时间点t2的视频帧作为所要解析的第一视频帧的临近视频帧,亦可以提取位于时间点t3的视频帧作为所要解析的第一视频帧的临近视频帧。为了便于描述,此处假设终端选择位于时间点t3的视频帧作为第一视频帧的临近视频帧。
终端从第一视频帧和临近视频帧分别提取出第一音频和第二音频,若检测到第一音频的音色不匹配第二音频的音色,将临近视频帧作为第二视频帧。若未检测到第一音频的音色匹配第二音频的音色,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。例如,第一视频帧对应的音色是A演员,位于时间点t3的临近视频帧对应的音色是B演员,由于A演员和B演员的音色不匹配,终端认为“A演员的对话结束时,即为B演员的对话开始”,因此终端可以初步将位于时间点t3的临近视频帧作为第二视频帧。可选地,当位于时间点t3的临近视频帧对应的音色仍然是A演员时,终端还需要再次确定位于时间点t3之后的时间点t4所对应的另一临近视频帧,并且根据上述判断规则将位于时间点t4所对应的另一临近视频帧和第一视频帧进行判断,在此不赘述。因此,以此类推,直至终端找到第一视频帧的第一音频的音色不匹配临近视频帧的第二音频的音色。
通过判断各个视频帧的音频的音色,从而能够有效地确定起始语句的第二视频帧。
在一些实施例中,由于单一地依赖于音色以判断视频帧之间的起始语句是不可靠的,因此为了进一步判断视频帧之间的起始语句,可选地,如图3所示,步骤1213包括:
步骤12132、在检测到第一音频的音色不匹配第二音频的音色时,判断第二音频的音调是否匹配语气助词的音调;
步骤12134、若第二音频的音调匹配语气助词的音调,将临近视频帧的下一帧的视频帧确定为第二视频帧;
步骤12136、若第二音频的音调未匹配语气助词的音调,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
视频播放过程中,一些语句经常以一些语气助词为结尾,例如,“吗”,“啊”,“哇”,“吧”以及等等,因此,承接这些语句之后的语句经常是下一话题的起始语句。终端在检测到第一音频的音色不匹配第二音频的音色时,判断第二音频的音调是否匹配语气助词的音调,若第二音频的音调匹配语气助词的音调,将临近视频帧的下一帧的视频帧确定为第二视频帧,若第二音频的音调未匹配语气助词的音调,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。上述的提取过程可以参考上述各个实施例,在此不赘述。
通过配合音色和音调综合确定第二视频帧,其能够在不影响用户整体观影的过程,可靠地为用户提供可读性强的进度调节过程。
在一些实施例中,与图3所示的实施例的区别点在于:图4所示的实施例可以采用解析出音频的文字内容方式进一步确定出第二视频帧。可选地,如图4所示,步骤1213还包括:
步骤12131、在检测到第一音频的音色不匹配第二音频的音色时,从临近视频帧的第二音频解析出文字内容;
步骤12133、判断文字内容是否包括符合预设关键词;
步骤12135、若文字内容包括符合预设关键词,将临近视频帧确定为第二视频帧;
步骤12137、若文字内容未包括符合预设关键词,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
视频播放过程中,一些语句经常以以下关键词为开始,例如“我”,“您”,“你”,“今天”,“明天”,“这个”以及等等。于是,终端从第三视频帧的第二音频解析出文字内容,若文字内容包括符合预设关键词时,将临近视频帧作为第二视频帧;若文字内容未包括符合预设关键词时,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。此处的预设关键词是由设计者自行定义,例如,预设关键词可以表示为若出现“我”,“您”,“你”,“今天”,“明天”,“这个”,则指示终端将临近视频帧作为第二视频帧。
通过将音色和文字内容综合判断,其能够在不影响用户整体观影的过程,可靠地为用户提供可读性强的进度调节过程。
在一些实施例中,与图1至图4所示的各个实施例的区别点在于:终端可以分析各个视频帧的画面场景以确定第三视频帧。可选地,如图5所示,步骤12包括:
步骤1221、从视频提取出第一视频帧的临近视频帧;
步骤1222、若临近视频帧的画面场景和第一视频帧的画面场景不属于同一场景,将临近视频帧确定为第二视频帧;
步骤1223、若临近视频帧的画面场景和第一视频帧的画面场景属于同一场景,重新从视频提取出第一视频帧的另一临近视频帧,直至另一临近视频帧的画面场景和第一视频帧的画面场景不属于同一场景。
视频播放过程中,不同画面场景的画面特征是不同的,终端可以采用视频图像处理算法,解析各个视频帧,从而确定各个视频帧的画面场景是否一致,以便确定第二视频帧。具体的,终端根据视频的播放顺序,从视频提取出第一视频帧的临近视频帧,采用直方图算法分别解析出第一视频帧和临近视频帧,根据第一视频帧和临近视频帧的亮度直方图之间的相关性确定第一视频帧和临近视频帧是否是同一场景,如果相关性超过既定阈值,则认为是同一场景,否则为不同场景。当确定是同一场景时,终端还要继续解析第一视频帧的另一临近视频帧,以查找出与第一视频帧的场景不同的第二视频帧,或者,终端还可以继续查找出与第一视频帧同属于同一场景并且是该场景的起始点的第二视频帧。
通过解析视频帧的画面场景,使用户能够从一个视频场景的起始点开始欣赏该视频场景,增强对影片的可读性,提高了用户在观影过程中的整体可读性。
图6是本发明实施例提供一种视频进度调节装置的结构示意图。如图6所示,视频进度调节装置60包括响应模块601、获取模块602及调节模块603。响应模块601用于响应于用户对视频中进度条的进度点进行的调节操作,确定视频中与进度点对应的第一视频帧。获取模块602用于根据第一视频帧和第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧。调节模块603用于将进度点调节至第二视频帧进行播放。
在本实施例中,终端可以在用户所要调节的进度点周边选择起始语句或起始画面的第二视频帧进行播放,使用户能够欣赏到一段完整的对白或者能够从一个视频场景的起始点开始欣赏该视频场景,从而增强对影片的可读性,提高了用户在观影过程中的整体可读性。
图7是本发明另一实施例提供一种视频进度调节装置的结构示意图。如图7所示,视频进度调节装置70包括响应模块701、获取模块702及调节模块703。响应模块701用于响应于用户对视频中进度条的进度点进行的调节操作,确定视频中与进度点对应的第一视频帧。获取模块702用于根据第一视频帧和第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧。调节模块703用于将进度点调节至第二视频帧进行播放。
可选地,如图7a所示,获取模块702包括第一提取单元7021、第二提取单元7022、第一确定单元7023及第三提取单元7024。第一提取单元7021用于从视频中提取出第一视频帧的临近视频帧。第二提取单元7022用于从第一视频帧中提取出第一音频及从临近视频帧中提取出第二音频。第一确定单元7023用于在检测到第一音频的音色不匹配第二音频的音色时,将临近视频帧确定为第二视频帧。第三提取单元7024用于在检测到第一音频的音色匹配第二音频的音色,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
可选地,如图7b所示,第一确定单元7023包括第一判断子单元70231、第一确定子单元70232及第一提取子单元70233。第一判断子单元70231用于在检测到第一音频的音色不匹配第二音频的音色时,判断第二音频的音调是否匹配语气助词的音调。第一确定子单元70232用于若第二音频的音调匹配语气助词的音调,将临近视频帧的下一帧的视频帧确定为第二视频帧。第一提取子单元70233用于若第二音频的音调未匹配语气助词的音调,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
可选地,如图7b所示,第一确定单元7023还包括解析子单元70234、第二判断子单元70235、第二确定子单元70236及第二提取子单元70237。解析子单元70234用于在检测到第一音频的音色不匹配第二音频的音色时,从临近视频帧的第二音频解析出文字内容。第二判断子单元70235用于判断文字内容是否包括符合预设关键词。第二确定子单元70236用于若文字内容包括符合预设关键词,将临近视频帧确定为第二视频帧。第二提取子单元用于若文字内容未包括符合预设关键词,重新从视频提取出第一视频帧的另一临近视频帧,直至第一音频的音色不匹配第二音频的音色。
可选地,如图7c所示,获取模块702包括第四提取单元7025、第二确定单元7026及第五提取单元7027。第四提取单元7025用于从视频提取出第一视频帧的临近视频帧。第二确定单元7026用于若临近视频帧的画面场景和第一视频帧的画面场景不属于同一场景,将临近视频帧确定为第二视频帧。第五提取单元7027用于若临近视频帧的画面场景和第一视频帧的画面场景属于同一场景,重新从视频提取出第一视频帧的另一临近视频帧,直至另一临近视频帧的画面场景和第一视频帧的画面场景不属于同一场景。
在本实施例中,终端可以在用户所要调节的进度点周边选择起始语句或起始画面的第二视频帧进行播放,使用户能够欣赏到一段完整的对白或者能够从一个视频场景的起始点开始欣赏该视频场景,从而增强对影片的可读性,提高了用户在观影过程中的整体可读性。
图8是本发明实施例提供一种电子设备的结构示意图。如图8所示,该电子设备80包括一个或多个处理器801以及存储器802。其中,图8中以一个处理器801为例。
处理器801和存储器802可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器802作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的视频进度调节方法对应的程序指令/模块(例如,附图6和图7所述的各个模块)。处理器801通过运行存储在存储器802中的非易失性软件程序、指令以及模块,从而执行视频进度调节装置的各种功能应用以及数据处理,即实现上述方法实施例视频进度调节方法以及上述装置实施例的各个模块的功能。
存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至处理器801。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述程序指令/模块存储在所述存储器802中,当被所述一个或者多个处理器801执行时,执行上述任意方法实施例中的视频进度调节方法,例如,执行以上描述的图1至图5所示的各个步骤;也可实现附图6和图7所述的各个模块的功能。
本发明实施例的电子设备80以多种形式存在,在执行以上描述的执行以上描述的图1至图5所示的各个步骤;也可实现附图6和图7所述的各个模块的功能时,上述电子设备80包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放视频内容,一般也具备移动上网特性。该类设备包括:视频播放器,掌上游戏机,以及智能玩具和便携式车载导航设备。
(4)其他具有视频播放功能和上网功能的电子设备。
本发明实施例还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图8中的一个处理器801,可使得上述一个或多个处理器可执行上述任意方法实施例中的视频进度调节方法,例如,执行上述任意方法实施例中的视频进度调节方法,例如,执行以上描述的图1至图5所示的各个步骤;也可实现附图6和图7所述的各个模块的功能。
以上所描述的装置或设备实施例仅仅是示意性的,其中所述作为分离部件说明的单元模块可以是或者也可以不是物理上分开的,作为模块单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络模块单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用直至得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (11)

1.一种视频进度调节方法,其特征在于,包括:
响应于用户对视频中进度条的进度点进行的调节操作,确定所述视频中与所述进度点对应的第一视频帧;
根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;
将所述进度点调节至所述第二视频帧进行播放。
2.根据权利要求1所述的视频进度调节方法,其特征在于,所述根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧,包括:
从所述视频中提取出所述第一视频帧的临近视频帧;
从所述第一视频帧中提取出第一音频及从所述临近视频帧中提取出第二音频;
在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧;
在检测到所述第一音频的音色匹配所述第二音频的音色,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
3.根据权利要求2所述的视频进度调节方法,其特征在于,所述在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧,包括:
在检测到所述第一音频的音色不匹配所述第二音频的音色时,判断所述第二音频的音调是否匹配语气助词的音调;
若所述第二音频的音调匹配语气助词的音调,将所述临近视频帧的下一帧的视频帧确定为所述第二视频帧;
若所述第二音频的音调未匹配语气助词的音调,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
4.根据权利要求2所述的视频进度调节方法,其特征在于,所述在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧,包括:
在检测到所述第一音频的音色不匹配所述第二音频的音色时,从所述临近视频帧的第二音频解析出文字内容;
判断所述文字内容是否包括符合预设关键词;
若所述文字内容包括符合预设关键词,将所述临近视频帧确定为所述第二视频帧;
若所述文字内容未包括符合预设关键词,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
5.根据权利要求1所述的视频进度调节方法,其特征在于,所述根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧,包括:
从所述视频提取出所述第一视频帧的临近视频帧;
若所述临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景,将所述临近视频帧确定为所述第二视频帧;
若所述临近视频帧的画面场景和所述第一视频帧的画面场景属于同一场景,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述另一临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景。
6.一种视频进度调节装置,其特征在于,包括:
响应模块,用于响应于用户对视频中进度条的进度点进行的调节操作,确定所述视频中与所述进度点对应的第一视频帧;
获取模块,用于根据所述第一视频帧和所述第一视频帧的临近视频帧,获取视频内容是起始语句或者起始场景的第二视频帧;
调节模块,用于将所述进度点调节至所述第二视频帧进行播放。
7.根据权利要求6所述的视频进度调节装置,其特征在于,所述获取模块包括:
第一提取单元,用于从所述视频中提取出所述第一视频帧的临近视频帧;
第二提取单元,用于从所述第一视频帧中提取出第一音频及从所述临近视频帧中提取出第二音频;
第一确定单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,将所述临近视频帧确定为所述第二视频帧;
第三提取单元,用于在检测到所述第一音频的音色匹配所述第二音频的音色,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
8.根据权利要求7所述的视频进度调节装置,其特征在于,所述第一确定单元还包括:
第一判断子单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,判断所述第二音频的音调是否匹配语气助词的音调;
第一确定子单元,用于若所述第二音频的音调匹配语气助词的音调,将所述临近视频帧的下一帧的视频帧确定为所述第二视频帧;
第一提取子单元,用于若所述第二音频的音调未匹配语气助词的音调,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
9.根据权利要求7所述的视频进度调节装置,其特征在于,所述第一确定单元还包括:
解析子单元,用于在检测到所述第一音频的音色不匹配所述第二音频的音色时,从所述临近视频帧的第二音频解析出文字内容;
第二判断子单元,用于判断所述文字内容是否包括符合预设关键词;
第二确定子单元,用于若所述文字内容包括符合预设关键词,将所述临近视频帧确定为所述第二视频帧;
第二提取子单元,用于若所述文字内容未包括符合预设关键词,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述第一音频的音色不匹配所述第二音频的音色。
10.根据权利要求6所述的视频进度调节装置,其特征在于,所述获取模块包括:
第四提取单元,用于从所述视频提取出所述第一视频帧的临近视频帧;
第二确定单元,用于若所述临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景,将所述临近视频帧确定为所述第二视频帧;
第五提取单元,用于若所述临近视频帧的画面场景和所述第一视频帧的画面场景属于同一场景,重新从所述视频提取出所述第一视频帧的另一临近视频帧,直至所述另一临近视频帧的画面场景和所述第一视频帧的画面场景不属于同一场景。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够用于执行如权利要求1至5任一项所述的视频进度调节方法。
CN201611101471.7A 2016-12-02 2016-12-02 一种视频进度调节方法、装置及电子设备 Pending CN106792212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611101471.7A CN106792212A (zh) 2016-12-02 2016-12-02 一种视频进度调节方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611101471.7A CN106792212A (zh) 2016-12-02 2016-12-02 一种视频进度调节方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN106792212A true CN106792212A (zh) 2017-05-31

Family

ID=58883552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611101471.7A Pending CN106792212A (zh) 2016-12-02 2016-12-02 一种视频进度调节方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN106792212A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107888988A (zh) * 2017-11-17 2018-04-06 广东小天才科技有限公司 一种视频剪辑方法及电子设备
CN109168062A (zh) * 2018-08-28 2019-01-08 北京达佳互联信息技术有限公司 视频播放的展示方法、装置、终端设备及存储介质
CN109905772A (zh) * 2019-03-12 2019-06-18 腾讯科技(深圳)有限公司 视频片段查询方法、装置、计算机设备及存储介质
CN110166845A (zh) * 2019-05-13 2019-08-23 Oppo广东移动通信有限公司 视频播放方法和装置
CN111131883A (zh) * 2019-12-31 2020-05-08 深圳Tcl数字技术有限公司 视频进度调整方法、电视和存储介质
CN112614516A (zh) * 2020-12-10 2021-04-06 广州酷狗计算机科技有限公司 进度条的调节方法、装置、终端及存储介质
CN114710695A (zh) * 2022-04-07 2022-07-05 北京字跳网络技术有限公司 进度调整方法、装置、电子设备、存储介质和程序产品
WO2023273562A1 (zh) * 2021-07-01 2023-01-05 北京百度网讯科技有限公司 视频播放方法及装置、电子设备和介质
CN114710695B (zh) * 2022-04-07 2024-06-11 北京字跳网络技术有限公司 进度调整方法、装置、电子设备、存储介质和程序产品

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107888988A (zh) * 2017-11-17 2018-04-06 广东小天才科技有限公司 一种视频剪辑方法及电子设备
CN109168062A (zh) * 2018-08-28 2019-01-08 北京达佳互联信息技术有限公司 视频播放的展示方法、装置、终端设备及存储介质
CN109905772A (zh) * 2019-03-12 2019-06-18 腾讯科技(深圳)有限公司 视频片段查询方法、装置、计算机设备及存储介质
CN110166845A (zh) * 2019-05-13 2019-08-23 Oppo广东移动通信有限公司 视频播放方法和装置
CN111131883A (zh) * 2019-12-31 2020-05-08 深圳Tcl数字技术有限公司 视频进度调整方法、电视和存储介质
CN111131883B (zh) * 2019-12-31 2022-08-30 深圳Tcl数字技术有限公司 视频进度调整方法、电视和存储介质
CN112614516A (zh) * 2020-12-10 2021-04-06 广州酷狗计算机科技有限公司 进度条的调节方法、装置、终端及存储介质
CN112614516B (zh) * 2020-12-10 2023-12-08 广州酷狗计算机科技有限公司 进度条的调节方法、装置、终端及存储介质
WO2023273562A1 (zh) * 2021-07-01 2023-01-05 北京百度网讯科技有限公司 视频播放方法及装置、电子设备和介质
CN114710695A (zh) * 2022-04-07 2022-07-05 北京字跳网络技术有限公司 进度调整方法、装置、电子设备、存储介质和程序产品
CN114710695B (zh) * 2022-04-07 2024-06-11 北京字跳网络技术有限公司 进度调整方法、装置、电子设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
CN106792212A (zh) 一种视频进度调节方法、装置及电子设备
US10455297B1 (en) Customized video content summary generation and presentation
US8442389B2 (en) Electronic apparatus, reproduction control system, reproduction control method, and program therefor
CN109147784B (zh) 语音交互方法、设备以及存储介质
CN105872588A (zh) 视频中加载广告的方法及装置
US9898850B2 (en) Support and complement device, support and complement method, and recording medium for specifying character motion or animation
CN107155138A (zh) 视频播放跳转方法、设备及计算机可读存储介质
CN108292314B (zh) 信息处理装置、信息处理方法和程序
CN102541259A (zh) 电子设备及其根据脸部表情提供心情服务的方法
CN104618446A (zh) 一种实现多媒体推送的方法和装置
CN106792122A (zh) 视频自动录制方法及装置、终端
CN108012169A (zh) 一种语音交互投屏方法、装置和服务器
WO2017181611A1 (zh) 在特定视频库中搜索视频的方法及其视频终端
US20170164051A1 (en) Video auto-play implementation and electronic equipment
CN110472099B (zh) 互动视频生成方法及装置、存储介质
US20170171621A1 (en) Method and Electronic Device for Information Processing
CN108055592A (zh) 字幕显示方法、装置、移动终端及存储介质
CN110347866B (zh) 信息处理方法、装置、存储介质及电子设备
CN109714639A (zh) 违规处理方法、装置、服务器以及存储介质
CN110677685B (zh) 网络直播显示方法及装置
CN109508427A (zh) 一种信息推荐方法及服务器、语音交互终端
US20230133146A1 (en) Method and apparatus for determining skill field of dialogue text
CN109686370A (zh) 基于语音控制进行斗地主游戏的方法及装置
CN106648530A (zh) 语音控制方法及终端
CN114120969A (zh) 智能终端的语音识别功能测试方法、系统、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531