CN110740373A - 一种音/视频文件的缓冲方法及相关装置 - Google Patents
一种音/视频文件的缓冲方法及相关装置 Download PDFInfo
- Publication number
- CN110740373A CN110740373A CN201810804080.4A CN201810804080A CN110740373A CN 110740373 A CN110740373 A CN 110740373A CN 201810804080 A CN201810804080 A CN 201810804080A CN 110740373 A CN110740373 A CN 110740373A
- Authority
- CN
- China
- Prior art keywords
- audio
- video
- video file
- played
- target audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4331—Caching operations, e.g. of an advertisement for later insertion during playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/41407—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本申请提供了一种目标音/视频文件的缓冲方法及相关装置,所述方法包括:识别出目标音/视频文件处于快进模式;预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;根据所述待播放位置,对所述目标音/视频文件进行缓冲。因此,当用户通过快进模式浏览音/视频文件时,用户想要浏览的音/视频片段已经缓冲好,从而减少了播放卡顿的现象,从而提高了用户体验。另外,由于可以不用再从当前播放位置开始向后缓冲,因此不需要缓冲不需要播放的视频片段,从而解决了资源浪费的问题。
Description
技术领域
本申请涉及计算机领域,尤其是涉及一种音/视频文件的缓冲方法及相关装置。
背景技术
随着手机等终端设备智能化的发展,越来越多的用户通过终端设备的网页插件、音/视频播放器等播放音/视频文件。例如,利用视频播放器在线播放电视剧等。
目前,在播放音/视频文件时,为了避免由于网速较慢、网络不稳定等原因导致出现播放卡顿的现象,通常会从当前播放位置开始,缓冲一段时间的音/视频片段。
然而,当用户想要快速浏览音/视频文件时,会对音/视频文件执行快进操作。因此在播放当前播放位置对应的音/视频片段之后,不会播放缓冲好的音/视频片段,而是会跳转到与当前播放位置间隔一段时间的后续播放位置继续播放。由于该后续播放位置对应的音/视频片段可能并未缓冲,因此仍然可能会出现播放卡顿的现象,从而影响用户体验。
发明内容
本申请解决的技术问题在于提供一种音/视频文件的缓冲方法及相关装置,以实现在快进模式播放音/视频文件时,减少播放卡顿的现象,从而提高用户体验。
为此,本申请解决技术问题的技术方案是:
本发明实施例提供了一种目标音/视频文件的缓冲方法,所述方法包括:
识别出目标音/视频文件处于快进模式;
预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;
根据所述待播放位置,对所述目标音/视频文件进行缓冲。
可选的,所述预测所述目标音/视频文件在快进模式下的待播放位置,包括:
从所述目标音/视频文件中确定一个或多个音/视频片段;
将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
可选的,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
将所述目标音/视频文件划分成主题不同的多个音/视频片段。
可选的,将所述目标音/视频文件划分成主题不同的多个音/视频片段,包括:
将所述目标音/视频文件的特征信息输入至训练好的主题识别模型中;
获得所述主题识别模型输出的多个音/视频片段的播放位置;
其中,所述主题识别模型的训练数据包括多个音/视频文件的特征信息,所述主题识别模型的标记数据包括所述多个音/视频文件的不同主题的音/视频片段的播放位置。
可选的,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
根据音/视频片段的历史播放频率,从所述目标音/视频文件中确定出一个或多个音/视频片段。
可选的,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
将所述目标音/视频文件划分成时长相等的多个音/视频片段。
可选的,从所述目标音/视频文件中确定多个音/视频片段之后,所述方法还包括:
获取所述多个音/视频片段中每个音/视频片段的被播放概率;
根据所述被播放概率,对所述多个音/视频片段进行筛选,获得筛选后的一个或多个音/视频片段;
将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置,包括:将所述筛选后的一个或多个音/视频片段中,每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
可选的,获取所述多个音/视频片段中每个音/视频片段的被播放概率,包括:
将所述多个音/视频片段中每个音/视频片段的特征信息输入至训练好的概率计算模型中;
获得所述概率计算模型输出的多个音/视频片段的被播放概率;
其中,所述概率计算模型的训练数据包括多个音/视频文件中的音/视频片段的特征信息,所述概率计算模型的标记数据包括所述多个音/视频文件中的音/视频片段的历史播放结果。
可选的,识别出目标音/视频文件处于快进模式,包括:
通过以下任一种或多种方式识别出所述目标音/视频文件处于快进模式:检测到用户对所述目标音/视频文件执行的快进操作的次数大于或等于预设次数阈值、检测到所述目标音/视频文件的相关音/视频文件在快进模式下播放、以及检测到用于指示所述目标音/视频文件在快进模式下播放的设置信息。
可选的,根据所述待播放位置,对所述目标音/视频文件进行缓冲,包括:
对所述目标音/视频文件中的多个待播放位置对应的音/视频片段进行缓冲,获得多个缓冲片段;
所述方法还包括:
检测到用户跳转操作、或者当前播放位置对应的音/视频片段播放完成之后;
播放所述目标音/视频文件中的下一个缓冲片段。
本申请实施例提供了一种目标音/视频文件的缓冲装置,所述装置包括:
识别模块,用于识别出目标音/视频文件处于快进模式;
预测模块,用于预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续
缓冲模块,用于根据所述待播放位置,对所述目标音/视频文件进行缓冲。
可选的,所述预测模块包括:
确定子模块,用于从所述目标音/视频文件中确定一个或多个音/视频片段;
提取子模块,用于将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
可选的,所述确定子模块,包括:
划分子模块,用于将所述目标音/视频文件划分成主题不同的多个音/视频片段。
可选的,所述划分子模块,具体用于将所述目标音/视频文件的特征信息输入至训练好的主题识别模型中;获得所述主题识别模型输出的多个音/视频片段的播放位置;
其中,所述主题识别模型的训练数据包括多个音/视频文件的特征信息,所述主题识别模型的标记数据包括所述多个音/视频文件的不同主题的音/视频片段的播放位置。
可选的,所述确定子模块,具体用于根据音/视频片段的历史播放频率,从所述目标音/视频文件中确定出一个或多个音/视频片段。
可选的,所述确定子模块,具体用于将所述目标音/视频文件划分成时长相等的多个音/视频片段。
可选的,还包括:
获取模块,用于获取所述多个音/视频片段中每个音/视频片段的被播放概率;
筛选模块,用于根据所述被播放概率,对所述多个音/视频片段进行筛选,获得筛选后的一个或多个音/视频片段。
可选的,所述获取模块,具体用于将所述多个音/视频片段中每个音/视频片段的特征信息输入至训练好的概率计算模型中;获得所述概率计算模型输出的多个音/视频片段的被播放概率;
其中,所述概率计算模型的训练数据包括多个音/视频文件中的音/视频片段的特征信息,所述概率计算模型的标记数据包括所述多个音/视频文件中的音/视频片段的历史播放结果。
可选的,所述识别模块,具体用于通过以下任一种或多种方式识别出所述目标音/视频文件处于快进模式:检测到用户对所述目标音/视频文件执行的快进操作的次数大于或等于预设次数阈值、检测到所述目标音/视频文件的相关音/视频文件在快进模式下播放、以及检测到用于指示所述目标音/视频文件在快进模式下播放的设置信息。
可选的,所述装置还包括:检测模块和播放模块;
所述缓冲模块具体用于,对所述目标音/视频文件中的多个待播放位置对应的音/视频片段进行缓冲,获得多个缓冲片段;
所述检测模块,用于检测到用户跳转操作、或者当前播放位置对应的音/视频片段播放完成之后;
所述播放模块,用于播放所述目标音/视频文件中的下一个缓冲片段。
本申请实施例提供了一种用于目标音/视频文件的缓冲的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别出目标音/视频文件处于快进模式;
预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;
根据所述待播放位置,对所述目标音/视频文件进行缓冲。
本申请实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行上述任一个目标音/视频文件的缓冲方法。
通过上述技术方案可知,当目标音/视频文件处于快进模式时,不再是从当前播放位置开始向后缓冲。而是预测出目标音/视频文件在快进模式下的待播放位置,也就是在快进模式下用户可能浏览的音/视频片段对应的播放位置,并对该待播放位置对应的音/视频片段进行缓冲。因此,当用户通过快进模式浏览音/视频文件时,用户想要浏览的音/视频片段已经缓冲好,从而减少了播放卡顿的现象,从而提高了用户体验。另外,由于可以不用再从当前播放位置开始向后缓冲,因此不需要缓冲不需要播放的视频片段,从而解决了资源浪费的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种方法实施例的流程示意图;
图2为本申请实施例提供的一种装置实施例的结构示意图;
图3为本申请实施例提供的另一种装置实施例的结构示意图;
图4为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
目前,当通过视频播放器在线播放电视剧时,为了避免由于网速较慢、网络不稳定等原因导致出现播放卡顿的现象,通常会从当前播放位置开始,向后缓冲一段时间的视频片段。例如,用户浏览到第5分钟时,已经缓冲好第5-7分钟的视频片段,并且继续缓冲第7分钟之后的视频片段。
然而,用户想要快速浏览该电视剧时,用户不需要浏览电视剧的全部内容,而是通过进操作,浏览后续的视频片段。因此,在播放当前播放位置对应的视频片段之后,不会播放缓冲好的与该当前播放位置连续的视频片段,而是会跳转到与当前播放位置间隔一段时间的后续播放位置继续播放。例如播放完第5分钟的视频片段后,通过快进操作,跳转到10分钟继续播放。由于该后续播放位置(例如第10分钟以后)可能并未缓冲,因此仍然可能会出现播放卡顿的现象,从而影响用户体验。而且,上述过程中对并不需要播放的视频片段(例如第5-7分钟的视频片段)进行缓冲,从而造成了资源浪费。
本申请解决的技术问题在于提供一种音/视频文件的缓冲方法及相关装置,以实现在快进模式播放音/视频文件时,减少播放卡顿的现象,从而提高用户体验。需要说明的是,在本申请实施例中,“/”表示或者的关系。
请参阅图1,本申请实施例提供了音/视频文件的缓冲方法的一种方法实施例。
本实施例的所述方法包括:
S101:识别出目标音/视频文件处于快进模式。
其中,目标音/视频文件可以是当前播放的音/视频文件,例如,用户点击用户界面上显示的视频播放器的播放按钮之后,播放电视剧《人民的名义》的某一集节目,将该集节目作为目标视频文件。也可以是待播放的音/视频文件,例如,视频播放器正在播放《人民的名义》的某一集节目,可以将即将播放的下一集节目,作为目标视频文件。
其中,快进模式指的是不需要对目标音/视频文件的所有内容进行播放,而是播放其中不连续的内容片段,例如,若目标视频文件处于快进模式,则播放其中不连续的多个视频片段,从而使得用户对该目标视频文件进行快速浏览。
本申请实施例中,可以通过多种方式识别出目标音/视频文件处于快进模式。一种可选的实施方式中,检测到用户对目标音/视频文件执行的快进操作的次数大于或等于预设次数阈值时,则可以判断出该目标音/视频文件处于快进模式。其中,用户可以通过在用户界面上执行滑动操作、或者拖动进度条等方式实现快进操作。另一种可选的实施方式中,检测到目标音/视频文件的相关音/视频文件在快进模式下播放,则也可以判断出目标音/视频文件处于快进模式。例如,检测到同一个电视剧的某一集节目在快进模式下播放,则可以认为该电视剧的下一集节目也处于快进模式。另一种可选的实施方式中,检测到用于指示所述目标音/视频文件在快进模式下播放的设置信息时,则可以判断出该目标音/视频文件处于快进模式。例如,在向用户播放目标音/视频文件时,向用户提示是选择普通模式播放还是快进模式播放,若用户选择快进模式,生成上述设置信息,该设置信息用于指示该目标音/视频文件处于快进模式。
S102:预测所述目标音/视频文件在快进模式下的待播放位置。
在本申请实施例中,目标音/视频文件在快进模式下的待播放位置指的是通过快进模式播放目标音/视频文件时,需要播放的音/视频片段对应的播放位置,即在快进模式下用户可能浏览的音/视频片段对应的播放位置。例如,当前播放位置为电视剧某一集节目的第5分钟,预测出在快进模式下的待播放位置为第10-12分钟,以及第20-22分钟,表示用户可能需要浏览该集节目的第10-12分钟,以及第20-22分钟的视频片段。
其中,由于目标音/视频文件在快进模式下播放,表示该目标音/视频文件并不是连续播放,因此所述待播放位置与所述目标音/视频文件的当前播放位置不连续。例如在上述例子中,待播放位置:第10-12分钟,以及第20-22分钟与当前播放位置:第5分钟并不连续。
S103:根据所述待播放位置,对所述目标音/视频文件进行缓冲。
在本申请实施例中,待播放位置表示在快进模式下用户可能浏览的音/视频片段对应的播放位置;在预测出该待播放位置之后,可以根据该待播放位置,对所述目标音/视频文件进行缓冲,即对目标音/视频文件中该待播放位置对应的音/视频片段进行缓冲。可选的,当S102中识别出多个待播放位置时,S103包括:对所述目标音/视频文件中的多个待播放位置对应的音/视频片段进行缓冲,获得多个缓冲片段。例如,对待播放位置:第10-12分钟,以及第20-22分钟对应的视频片段进行缓冲,获得对应的缓冲片段。
在根据上述待播放位置对所述目标音/视频文件进行缓冲之后,可以向用提示已经缓冲好的音/视频片段的播放位置,例如,向用户提示第10-12分钟,以及第20-22分钟对应的视频片段已经缓冲好。检测到用户在屏幕上的多次连续滑动操作或者拖动进度条的操作,并且进度条拖到某一个缓冲片段对应的播放位置,对该缓冲片段进行播放;或者,检测到用户跳转操作,例如检测到用户的一次简单的滑动操作,跳转到下一个未播放的缓冲片段进行播放;又或者,也可以无需用户操作,在播放完当前播放位置对应的音/视频片段之后,自动跳转到下一个未播放的缓冲片段进行播放。
通过上述技术方案可知,当目标音/视频文件处于快进模式时,不再是从当前播放位置开始向后缓冲。而是预测出目标音/视频文件在快进模式下的待播放位置,也就是在快进模式下用户可能浏览的音/视频片段对应的播放位置,并对该待播放位置对应的音/视频片段进行缓冲。因此,当用户通过快进模式浏览音/视频文件时,用户想要浏览的音/视频片段已经缓冲好,从而减少了播放卡顿的现象,从而提高了用户体验。另外,由于可以不用再从当前播放位置开始向后缓冲,因此不需要缓冲不需要播放的视频片段,从而解决了资源浪费的问题。
下面对本申请实施例中的待播放位置的预测方式进行示例性说明。
本申请实施例中,可以对目标音/视频文件进行划分,因此,从目标音/视频文件中确定一个或多个音/视频片段。从每个音/视频片段中,根据一定的规则从中确定出对应的子片段,例如选取每个音/视频片段前一段的子片段。将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。下面对目标音/视频文件的多种划分方式进行说明。
一种可选的实施例中,可以根据片段时长对目标音/视频文件进行划分。例如,将目标音/视频文件划分成时长相等的多个音/视频片段。以电视剧的某一集节目为例,该集节目的时长为40分钟,可以将该集节目划分成第0-第10分钟、第10-第20分钟、第20-第30分钟以及第30-第40分钟对应的音频片段。可以从每个音/视频片段中再选取前一段的子片段,例如前2分钟的子片段,从而预测出待播放位置包括:该集节目的第0-第2分钟、第10-第12分钟、第20-第22分钟、以及第30-第32分钟。
其中,每个音/视频片段的时长,可以根据该目标音/视频文件的平均快进时间进行确定,也可以根据当前用户的平均快进时间进行确定等等,本申请实施例对此并不加以限定。例如,确定出浏览该目标音/视频文件的用户集合;获取该用户集合中每个用户对该目标音/视频文件执行快进操作的快进时间;对获取的快进时间取平均值,得到该目标音/视频文件的平均快进时间;根据该目标音/视频文件的平均快进时间,选取对应时长的音/视频片段。又例如,为了体现当前用户的个性化,使得划分操作更加贴近当前用户的习惯。确定当前用户浏览过的音/视频文件的文件集合;获取当前用户对该文件集合中的音/视频文件执行快进操作的快进时间;对获取的快进时间取平均值,得到当前用户的平均快进时间;根据当前用户的平均快进时间,选取对应时长的音/视频片段。
一种可选的实施例中,可以根据主题对目标音/视频文件进行划分。例如,将目标音/视频文件划分成主题不同的多个音/视频片段。其中,主题用于反映音/视频文件中的不同场景或者事件,可以根据事件地点、背景以及事件人物等进行确定。例如,电视剧中的某集节目,主题1对应第10-15分钟的视频片段,其中该视频片段中的情节发生在地点A1,人物B1和人物B2正在吃饭;主题2对应第25-33分钟的视频片段,其中该视频片段中的情节发生在地点A2,人物B3正在看电视。可以从每个音/视频片段中再选取前一段的子片段,例如前2分钟的子片段,从而预测出待播放位置包括:该集节目的第10-第12分钟、第25-第27分钟。
其中,某些音/视频文件中已经提前划分好了对应的主题,因此可以直接获取该划分好的主题以及每个主题对应的音/视频片段。
此外,也可以根据机器学习模式对目标音/视频文件进行划分。具体地,将所述目标音/视频文件的特征信息输入至训练好的主题识别模型中,其中,特征信息指的是用于反映目标音/视频文件的特征的信息,可以包括音/视频文件的文件内容,例如视频文件的视频内容等,也可以包括视频文件的字幕、背景音频等,也可以包括音频文件的歌词等等。所述主题识别模型输出多个音/视频片段的播放位置,获得该播放位置并作为上述待播放位置。
其中,所述主题识别模型的训练数据包括多个音/视频文件的特征信息,所述主题识别模型的标记数据包括所述多个音/视频文件的不同主题的音/视频片段的播放位置。其中,训练数据指的是在训练主题识别模型的过程中,向主题识别模型输入的数据;标记数据指的是训练主题识别模型的过程中,主题识别模型输出的数据。也就是说,在训练该主题识别模型时,向该主题识别模型输入多个音/视频文件的数据内容、字幕等特征信息,并且标记该主题识别模型输出的数据包括:该多个音/视频文件中的音/视频片段的播放位置(例如可以包括起始播放位置和终止播放位置),并且还可以标记该标记数据输出的数据进一步包括各个音/视频片段的主题。其中,该主题识别模型可以是传统的机器学习模型,例如LDA等,也可以是基于深度学习的模型,例如循环神经网络(英文:Recurrent NeuralNetworks,简称:RNN)、长短期-记忆(英文:Long Short-Term Memory,简称:LSTM)网络、卷积神经网络(英文:Convolutional Neural Networks,简称:CNN)、以及CNN与RNN的结合等。
一种可选的实施例中,可以根据音/视频片段的历史播放频率,从目标音/视频文件中确定出一个或多个音/视频片段。具体地,可以对目标音/视频文件中的音/视频片段的历史播放频率进行统计,确定出历史播放频率较高的一个或多个音/视频片段,或者历史播放频率大于预设频率阈值的一个或多个音/视频片段。例如,电视剧中的某集节目,历史播放过程中播放频率最高的两个视频片段包括第18-第25分钟、第33-第37分钟对应的视频片段。可以从每个音/视频片段中再选取前一段的子片段,例如前2分钟的子片段,从而预测出待播放位置包括:该集节目的第18-第20分钟、第33-第35分钟。
其中,为了体现用户个性化的需求,可以查询当前用户的相似用户,例如浏览过类似视频文件的用户,获取该相似用户对应该目标音/视频文件的历史播放过程,对该历史播放过程中的播放频率进行统计。
在本申请实施例中,在从目标音/视频文件中确定出多个音/视频片段后,可以根据音/视频片段的被播放概率对确定出的多个音/视频片段进行筛选,因此使得被播放概率较高的音/视频片段,也就是比较有可能被用户浏览的音/视频片段进行缓冲,而不是对所有的音/视频片段都进行缓冲,下面具体说明。
从所述目标音/视频文件中确定多个音/视频片段之后,所述方法还可以包括:
获取所述多个音/视频片段中每个音/视频片段的被播放概率;根据所述被播放概率,对所述多个音/视频片段进行筛选,获得筛选后的一个或多个音/视频片段;将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置,包括:将所述筛选后的一个或多个音/视频片段中,每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
其中,可以通过概率计算模型获得被播放概率。可选的,获取所述多个音/视频片段中每个音/视频片段的被播放概率,包括:将所述多个音/视频片段中每个音/视频片段的特征信息输入至训练好的概率计算模型中;获得所述概率计算模型输出的多个音/视频片段的被播放概率;其中,所述概率计算模型的训练数据包括多个音/视频文件中的音/视频片段的特征信息,所述概率计算模型的标记数据包括所述多个音/视频文件中的音/视频片段的历史播放结果,也就是该音/视频片段是否被播放。
需要补充说明的是,为了体现用户个性化的需求,可以优先筛选出当前用户感兴趣的音/视频片段。具体地,从当前用户的历史观看记录中确定出当前用户历史观看过的音/视频片段;提取当前用户历史观看过的音/视频片段的特征信息,其中该特征信息能够反映当前用户的兴趣特征。例如当前用户感兴趣的视频类型为动作片,当前用户感兴趣的视频主题为飙车主题等等。将上述能够反映当前用户的兴趣特征的特征信息,以及所述多个音/视频片段中每个音/视频片段的特征信息,共同输入至训练好的概率计算模型中。因此,能够获得概率计算模型输出的多个音/视频片段的被播放概率,并且该播放概率能够反映当前用户的兴趣特征。例如,某个音/视频片段与当前用户的兴趣特征匹配度越高,则该音/视频片段的被播放概率越大;反之,某个音/视频片段与当前用户的兴趣特征匹配度越低,则该音/视频片段的被播放概率越小。
其中,所述概率计算模型可以是传统的机器学习模型,例如多类型逻辑回归、随机森林等,也可以是基于深度学习的模型,例如RNN)、LSTM网络、CNN、CNN和RNN的结合等。
例如,训练数据可以包括:
视频1-片段1字幕、主题等特征信息;
视频1-片段2字幕、主题等特征信息;
…
视频x-片段k字幕、主题等特征信息;其中,x大于1,k大于1。
对应的标记数据可以包括:
观看;
快进跳过,未观看
…
快进跳过,未观看
对应上述方法实施例,本申请还提供了相应的装置实施例,下面具体说明。
请参阅图2,本申请提供了目标音/视频文件的缓冲装置的一种装置实施例,包括:识别模块201、预测模块202和缓冲模块203。
识别模块,用于识别出目标音/视频文件处于快进模式;
预测模块,用于预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续
缓冲模块,用于根据所述待播放位置,对所述目标音/视频文件进行缓冲。
可选的,所述预测模块包括:
确定子模块,用于从所述目标音/视频文件中确定一个或多个音/视频片段;
提取子模块,用于将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
可选的,所述确定子模块,包括:
划分子模块,用于将所述目标音/视频文件划分成主题不同的多个音/视频片段。
可选的,所述划分子模块,具体用于将所述目标音/视频文件的特征信息输入至训练好的主题识别模型中;获得所述主题识别模型输出的多个音/视频片段的播放位置;
其中,所述主题识别模型的训练数据包括多个音/视频文件的特征信息,所述主题识别模型的标记数据包括所述多个音/视频文件的不同主题的音/视频片段的播放位置。
可选的,所述确定子模块,具体用于根据音/视频片段的历史播放频率,从所述目标音/视频文件中确定出一个或多个音/视频片段。
可选的,所述确定子模块,具体用于将所述目标音/视频文件划分成时长相等的多个音/视频片段。
可选的,还包括:
获取模块,用于获取所述多个音/视频片段中每个音/视频片段的被播放概率;
筛选模块,用于根据所述被播放概率,对所述多个音/视频片段进行筛选,获得筛选后的一个或多个音/视频片段。
可选的,所述获取模块,具体用于将所述多个音/视频片段中每个音/视频片段的特征信息输入至训练好的概率计算模型中;获得所述概率计算模型输出的多个音/视频片段的被播放概率;
其中,所述概率计算模型的训练数据包括多个音/视频文件中的音/视频片段的特征信息,所述概率计算模型的标记数据包括所述多个音/视频文件中的音/视频片段的历史播放结果。
可选的,所述识别模块,具体用于通过以下任一种或多种方式识别出所述目标音/视频文件处于快进模式:检测到用户对所述目标音/视频文件执行的快进操作的次数大于或等于预设次数阈值、检测到所述目标音/视频文件的相关音/视频文件在快进模式下播放、以及检测到用于指示所述目标音/视频文件在快进模式下播放的设置信息。
可选的,所述装置还包括:检测模块和播放模块;
所述缓冲模块具体用于,对所述目标音/视频文件中的多个待播放位置对应的音/视频片段进行缓冲,获得多个缓冲片段;
所述检测模块,用于检测到用户跳转操作、或者当前播放位置对应的音/视频片段播放完成之后;
所述播放模块,用于播放所述目标音/视频文件中的下一个缓冲片段。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种用于目标音/视频文件的缓冲的装置300的框图。例如,装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理部件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在设备300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当设备300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种目标音/视频文件的缓冲方法,所述方法包括:
识别出目标音/视频文件处于快进模式;
预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;
根据所述待播放位置,对所述目标音/视频文件进行缓冲。
图4是本发明实施例中服务器的结构示意图。该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。
服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,一个或一个以上键盘456,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种目标音/视频文件的缓冲方法,其特征在于,所述方法包括:
识别出目标音/视频文件处于快进模式;
预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;
根据所述待播放位置,对所述目标音/视频文件进行缓冲。
2.根据权利要求1所述的缓冲方法,其特征在于,所述预测所述目标音/视频文件在快进模式下的待播放位置,包括:
从所述目标音/视频文件中确定一个或多个音/视频片段;
将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
3.根据权利要求2所述的缓冲方法,其特征在于,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
将所述目标音/视频文件划分成主题不同的多个音/视频片段。
4.根据权利要求3所述的缓冲方法,其特征在于,将所述目标音/视频文件划分成主题不同的多个音/视频片段,包括:
将所述目标音/视频文件的特征信息输入至训练好的主题识别模型中;
获得所述主题识别模型输出的多个音/视频片段的播放位置;
其中,所述主题识别模型的训练数据包括多个音/视频文件的特征信息,所述主题识别模型的标记数据包括所述多个音/视频文件的不同主题的音/视频片段的播放位置。
5.根据权利要求2所述的缓冲方法,其特征在于,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
根据音/视频片段的历史播放频率,从所述目标音/视频文件中确定出一个或多个音/视频片段。
6.根据权利要求2所述的缓冲方法,其特征在于,从所述目标音/视频文件中确定一个或多个音/视频片段,包括:
将所述目标音/视频文件划分成时长相等的多个音/视频片段。
7.根据权利要求2所述的缓冲方法,其特征在于,从所述目标音/视频文件中确定多个音/视频片段之后,所述方法还包括:
获取所述多个音/视频片段中每个音/视频片段的被播放概率;
根据所述被播放概率,对所述多个音/视频片段进行筛选,获得筛选后的一个或多个音/视频片段;
将每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置,包括:将所述筛选后的一个或多个音/视频片段中,每个音/视频片段中的子片段对应的播放位置,作为预测的所述待播放位置。
8.根据权利要求7所述的缓冲方法,其特征在于,获取所述多个音/视频片段中每个音/视频片段的被播放概率,包括:
将所述多个音/视频片段中每个音/视频片段的特征信息输入至训练好的概率计算模型中;
获得所述概率计算模型输出的多个音/视频片段的被播放概率;
其中,所述概率计算模型的训练数据包括多个音/视频文件中的音/视频片段的特征信息,所述概率计算模型的标记数据包括所述多个音/视频文件中的音/视频片段的历史播放结果。
9.根据权利要求1所述的缓冲方法,其特征在于,识别出目标音/视频文件处于快进模式,包括:
通过以下任一种或多种方式识别出所述目标音/视频文件处于快进模式:检测到用户对所述目标音/视频文件执行的快进操作的次数大于或等于预设次数阈值、检测到所述目标音/视频文件的相关音/视频文件在快进模式下播放、以及检测到用于指示所述目标音/视频文件在快进模式下播放的设置信息。
10.根据权利要求1至9任一项所述的缓冲方法,其特征在于,根据所述待播放位置,对所述目标音/视频文件进行缓冲,包括:
对所述目标音/视频文件中的多个待播放位置对应的音/视频片段进行缓冲,获得多个缓冲片段;
所述方法还包括:
检测到用户跳转操作、或者当前播放位置对应的音/视频片段播放完成之后;
播放所述目标音/视频文件中的下一个缓冲片段。
11.一种目标音/视频文件的缓冲装置,其特征在于,所述装置包括:
识别模块,用于识别出目标音/视频文件处于快进模式;
预测模块,用于预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续
缓冲模块,用于根据所述待播放位置,对所述目标音/视频文件进行缓冲。
12.一种用于目标音/视频文件的缓冲的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别出目标音/视频文件处于快进模式;
预测所述目标音/视频文件在快进模式下的待播放位置;其中,所述待播放位置与所述目标音/视频文件的当前播放位置不连续;
根据所述待播放位置,对所述目标音/视频文件进行缓冲。
13.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至10中一个或多个所述的目标音/视频文件的缓冲方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804080.4A CN110740373B (zh) | 2018-07-20 | 2018-07-20 | 一种音/视频文件的缓冲方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804080.4A CN110740373B (zh) | 2018-07-20 | 2018-07-20 | 一种音/视频文件的缓冲方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110740373A true CN110740373A (zh) | 2020-01-31 |
CN110740373B CN110740373B (zh) | 2022-11-08 |
Family
ID=69234774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810804080.4A Active CN110740373B (zh) | 2018-07-20 | 2018-07-20 | 一种音/视频文件的缓冲方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110740373B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112423127A (zh) * | 2020-11-20 | 2021-02-26 | 上海哔哩哔哩科技有限公司 | 视频加载方法及装置 |
CN112887795A (zh) * | 2021-01-26 | 2021-06-01 | 脸萌有限公司 | 视频播放方法、装置、设备和介质 |
CN114666666A (zh) * | 2020-12-23 | 2022-06-24 | 北京字节跳动网络技术有限公司 | 视频跳转播放方法、装置、终端设备及存储介质 |
US11949928B2 (en) | 2020-11-20 | 2024-04-02 | Shanghai Bilibili Technology Co., Ltd. | Video loading method and device |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101753945A (zh) * | 2009-12-21 | 2010-06-23 | 北京中星微电子有限公司 | 一种节目预览的方法和装置 |
CN105721890A (zh) * | 2016-01-29 | 2016-06-29 | 广东欧珀移动通信有限公司 | 一种流媒体的视频加载方法及装置 |
CN107040826A (zh) * | 2017-05-04 | 2017-08-11 | 珠海市魅族科技有限公司 | 视频加载方法和装置、计算机装置和计算机可读存储介质 |
CN107454475A (zh) * | 2017-07-28 | 2017-12-08 | 珠海市魅族科技有限公司 | 视频播放的控制方法及装置、计算机装置和可读存储介质 |
US20170357854A1 (en) * | 2015-03-24 | 2017-12-14 | Facebook, Inc. | Systems and methods for providing playback of selected video segments |
CN107666623A (zh) * | 2017-03-07 | 2018-02-06 | 腾讯科技(深圳)有限公司 | 播放信息的展示方法和装置 |
-
2018
- 2018-07-20 CN CN201810804080.4A patent/CN110740373B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101753945A (zh) * | 2009-12-21 | 2010-06-23 | 北京中星微电子有限公司 | 一种节目预览的方法和装置 |
US20170357854A1 (en) * | 2015-03-24 | 2017-12-14 | Facebook, Inc. | Systems and methods for providing playback of selected video segments |
CN105721890A (zh) * | 2016-01-29 | 2016-06-29 | 广东欧珀移动通信有限公司 | 一种流媒体的视频加载方法及装置 |
CN107666623A (zh) * | 2017-03-07 | 2018-02-06 | 腾讯科技(深圳)有限公司 | 播放信息的展示方法和装置 |
CN107040826A (zh) * | 2017-05-04 | 2017-08-11 | 珠海市魅族科技有限公司 | 视频加载方法和装置、计算机装置和计算机可读存储介质 |
CN107454475A (zh) * | 2017-07-28 | 2017-12-08 | 珠海市魅族科技有限公司 | 视频播放的控制方法及装置、计算机装置和可读存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112423127A (zh) * | 2020-11-20 | 2021-02-26 | 上海哔哩哔哩科技有限公司 | 视频加载方法及装置 |
US11949928B2 (en) | 2020-11-20 | 2024-04-02 | Shanghai Bilibili Technology Co., Ltd. | Video loading method and device |
CN114666666A (zh) * | 2020-12-23 | 2022-06-24 | 北京字节跳动网络技术有限公司 | 视频跳转播放方法、装置、终端设备及存储介质 |
WO2022134997A1 (zh) * | 2020-12-23 | 2022-06-30 | 北京字节跳动网络技术有限公司 | 视频跳转播放方法、装置、终端设备及存储介质 |
CN114666666B (zh) * | 2020-12-23 | 2023-05-30 | 北京字节跳动网络技术有限公司 | 视频跳转播放方法、装置、终端设备及存储介质 |
CN112887795A (zh) * | 2021-01-26 | 2021-06-01 | 脸萌有限公司 | 视频播放方法、装置、设备和介质 |
CN112887795B (zh) * | 2021-01-26 | 2023-04-21 | 脸萌有限公司 | 视频播放方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110740373B (zh) | 2022-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9786326B2 (en) | Method and device of playing multimedia and medium | |
CN109286850B (zh) | 一种基于弹幕的视频标注方法及终端 | |
CN110740373B (zh) | 一种音/视频文件的缓冲方法及相关装置 | |
CN111783001A (zh) | 页面显示方法、装置、电子设备和存储介质 | |
CN107390997B (zh) | 一种应用程序切换方法及装置 | |
CN112104915B (zh) | 一种视频数据处理方法、装置及存储介质 | |
CN106896991B (zh) | 一种更新信息的方法及装置 | |
CN109245997B (zh) | 语音消息播放方法及装置 | |
US10536752B2 (en) | Acquiring and storing play progress for a multimedia file | |
CN105183513A (zh) | 应用推荐方法和装置 | |
US11329942B2 (en) | Methods, systems, and media for presenting messages related to notifications | |
WO2023061230A1 (zh) | 内容展示方法、装置、设备及存储介质 | |
CN112464031A (zh) | 交互方法、装置、电子设备以及存储介质 | |
CN108874939A (zh) | 一种信息搜索方法及装置 | |
CN107688477B (zh) | 设置项的处理方法和装置、用于设置项处理的装置 | |
CN108062364A (zh) | 信息展示方法及装置 | |
CN109542297B (zh) | 提供操作引导信息的方法、装置及电子设备 | |
CN113901241B (zh) | 页面展示方法、装置、电子设备及存储介质 | |
WO2022252610A1 (zh) | 弹幕下发方法及接收方法 | |
WO2019095810A1 (zh) | 界面展示方法及装置 | |
CN111629270A (zh) | 一种候选项确定方法、装置及机器可读介质 | |
CN113556568A (zh) | 一种云应用程序运行方法、系统、装置与存储介质 | |
CN113868467A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN108268507B (zh) | 一种基于浏览器的处理方法、装置及电子设备 | |
CN108073291B (zh) | 一种输入方法和装置、一种用于输入的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |