CN112423133A - 视频切换方法、装置、计算机可读存储介质和计算机设备 - Google Patents
视频切换方法、装置、计算机可读存储介质和计算机设备 Download PDFInfo
- Publication number
- CN112423133A CN112423133A CN201910782534.7A CN201910782534A CN112423133A CN 112423133 A CN112423133 A CN 112423133A CN 201910782534 A CN201910782534 A CN 201910782534A CN 112423133 A CN112423133 A CN 112423133A
- Authority
- CN
- China
- Prior art keywords
- video
- scene
- data
- monitoring
- target video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种视频切换方法、装置、计算机可读存储介质和计算机设备,方法包括:查找监测时段对应的监测场景类别,获取与监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程,提取采集的场景数据中用户行为特征数据,当用户行为特征数据满足视频切换触发条件时,查找与类别标签匹配、且与监测场景类别关联的目标视频,将当前播放的视频切换为目标视频。使得切换的目标视频与实际场景更为匹配,通过自动识别分析进行实现视频切换处理,实现视频的合理有效推荐。
Description
技术领域
本申请涉及视频播放技术领域,特别是涉及一种视频切换方法、装置、计算机可读存储介质和计算机设备。
背景技术
观看电视视频是儿童日常活动重要的环节,少儿动画片一直都高居播放榜前列,而电视动画片内容对幼儿模仿以及人际交往等都有着重大影响。动画内容往往会引导着儿童进行模仿和学习,播放儿歌时学着唱歌,播放舞蹈学着跳舞,播放吃饭内容也能认真地吃饭。
目前各大视频平台大多都会通过少儿标签给儿童推荐少儿教育相关的动画,比如在频道页、详情页、播放页等上面推荐,从而让少儿教育动画更好地引导儿童,但传统方式往往对于少儿教育动画推荐方式和时机比较固定,无法根据少儿当前正在进行的活动例如吃饭、睡觉以及学习等,对少儿教育动画进行合理有效地推荐。
发明内容
基于此,有必要针对无法合理有效推荐视频的技术问题,提供一种视频切换方法、装置、计算机可读存储介质和计算机设备。
一种视频切换方法,包括:
查找监测时段对应的监测场景类别;
获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
提取采集的场景数据中用户行为特征数据;
当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
将当前播放的视频切换为所述目标视频。
一种视频切换装置,所述装置包括:
监测场景类别查找模块,用于查找监测时段对应的监测场景类别;
采集线程启动模块,用于获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
特征数据提取模块,用于提取采集的场景数据中用户行为特征数据;
目标视频查找模块,用于当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
目标视频切换模块,用于将当前播放的视频切换为所述目标视频。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
查找监测时段对应的监测场景类别;
获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
提取采集的场景数据中用户行为特征数据;
当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
将当前播放的视频切换为所述目标视频。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
查找监测时段对应的监测场景类别;
获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
提取采集的场景数据中用户行为特征数据;
当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
将当前播放的视频切换为所述目标视频。
上述视频切换方法、装置、计算机可读存储介质和计算机设备,基于监测时段确定检测场景及其对应的视频切换触发条件,启动场景数据采集线程,以采集当前的场景数据,在场景数据满足视频切换触发条件的情况下,查找目标视频并进行视频切换,通过播放与当前播放视频类别标签匹配且与监测场景类别关联的目标视频,使得切换的目标视频与当前正在进行的实际场景更为匹配,通过自动识别分析进行实现切换处理,实现视频的合理有效推荐。
附图说明
图1为一个实施例中视频切换方法的应用环境图;
图2为一个实施例中视频切换方法的流程示意图;
图3为一个实施例中切换为目标视频步骤的流程示意图;
图4为一个实施例中视频切换方法的时序图;
图5为另一个实施例中视频切换方法的时序图;
图6为一个实施例中提示弹窗的显示界面示意图;
图7为另一个实施例中视频切换方法的流程示意图;
图8为一个实施例中视频切换装置的结构框图;
图9为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
随着生活习惯的日益变化,通过电视等视频播放设备观看视频已经成为儿童日常活动重要的环节,尤其是少儿动画片,一直都高居播放榜前列,而动画内容对儿童模仿以及人际交往等都有着重大影响。动画内容往往会引导着儿童进行模仿和学习,播放儿歌时学着唱歌,播放舞蹈学着跳舞,播放吃饭内容也能认真地吃饭。对于成年人来说,在适当的时段进行对应的活动,是可以根据对自身行为的主观控制有效实现的。但对于儿童来说,其处于学习模仿的成长阶段,在各时段进行的活动还需要家长的引导辅助实现。在某些时候,当到了吃饭或者睡觉时间点,依旧播放着玩耍动画内容时,儿童往往还会陷入其中,不肯好好吃饭和睡觉。为此,提供了一种视频切换方法。
在一个实施例中,视频切换方法涉及的应用环境如图1所示,应用环境涉及视频播放设备102、处理器104以及场景数据采集设备106,场景数据采集设备106可以设置于视频播放设备102。在当前时间处于监测时段时,处理器104查找监测时段对应的监测场景类别,然后,获取与监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程,进而启动场景数据采集设备106进行场景数据采集并反馈至处理器104,处理器104提取采集的场景数据中用户行为特征数据,当用户行为特征数据满足视频切换触发条件时,查找与类别标签匹配、且与监测场景类别关联的目标视频,并通过视频播放设备102将当前播放的视频切换为目标视频,进行目标视频播放。
在其中一个实施例中,处理器104可以是视频播放设备中的一部分,视频播放设备可以是一种终端,具体可以是台式终端或移动终端,台式终端可以是台式电脑、电视机中的至少一种。移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。在其中另一个实施例中,处理器104还可以存在于一种服务器,服务器通过网络与视频播放设备连接,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种视频切换方法。本实施例主要以该方法应用于上述图1中的处理器来举例说明。参照图2,该视频切换方法具体包括步骤S202至S210。
S202,查找监测时段对应的监测场景类别。
监测时段是指预先设定的需要对视频观看对象进行监测的时间区间。具体来说,监测时段可以根据日常的作息时间进行设定。指定时段中会对应有指定的活动场景。例如在用餐时段中会对应用餐场景,休息时段中会对应睡觉场景,学习时段中会对应学习场景。监测时段可以是一个或多个。其中,同一监测场景类别可以包含一个或多个监测时段,以适应如儿童用餐场景包括早餐、午餐以及晚餐的情况,儿童睡觉场景包括午休以及晚上睡觉等,以及儿童学习场景也可以分为多个时间段来实现。监测场景类别是指在监测时段对应所应该进行的活动场景。例如,设置11:00-13:00为第一监测时段,该监测时段对应的监测场景类别为儿童用餐场景。设置13:00-14:00为第二监测时段,该监测时段对应的监测场景类别为儿童睡觉场景。设置15:00-16:00为第三监测时段,该监测时段对应的监测场景类别为儿童学习场景。设置17:00-19:00为第四监测时段,该监测时段对应的监测场景类别为儿童用餐场景。在实施例中,监测时段可以在初始化过程中通过读取预先设定的配置数据获得。此外,监测时段及其对应的监测场景类别也可以通过响应用户修改操作进行更新,以适应不同儿童的作息规律。在实施例中,根据当前时间点所处的监测时段,以及配置的监测时段与监测场景类别之间的对应关系,可以查找得到当前时间点所对应的监测场景类别。
S204,获取与监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程。
视频切换触发条件是指在当前监测场景类别下,监测到用户的特征行为需要达到的设定要求。不同的监测场景类别对应不同的视频切换触发条件。例如,在儿童用餐场景下,对应的视频切换触发条件为检测到存在有儿童,对应有用餐的场景,且该儿童的行为特征数据的表征结果为儿童拒绝认真用餐。具体来说,检测是否有儿童可以通过儿童声纹识别或是通过人群类别识别分析得到,是否为儿童用餐场景可以通过语义识别中的关键字或是目标物体识别分析得到,儿童行为特征数据可以通过对家长的语音分析或是视频中儿童的行为特征分析得到。当前播放视频是指当前时刻在视频播放设备上播放的视频,类别标签是指视频的一种属性标签。在实施例中,当视频为同系列视频集中的一个视频时,类别标签可以包括视频集名称,例如动画片名称、电视剧名称等,也可以包括所属的视频类型,比如动画片、综艺节目、电视剧等。类别标签还可以是视频类型与视频名称的组合,例如动画片-A,综艺节目-B、电视剧-C等,其中A、B、C分别指代视频名称。在其他实施例中,视频标签还可以包括视频平台标记的各种类别标签,例如,A-少儿动画等。在实施例中,根据当前播放视频的数据来源平台的访问地址,通过访问视频来源平台,获取该视频的类别标签。在另一个实施例中,读取存储于本地的当前播放视频携带的属性数据,获取属性数据中的类别标签。场景数据采集线程用于采集当前的场景数据。在一个实施例中,场景数据采集线程包括语音数据采集线程,通过启动场景数据采集线程可以启动语音数据采集设备进行语音数据采集。在另一个实施例中,场景数据采集线程包括视频数据采集线程,通过启动场景数据采集线程可以启动视频数据采集设备进行语音数据采集。在其他实施例中,场景数据还可以同时包括语音数据和视频数据。
在一个实施例中,启动场景数据采集线程包括:获取监测对象的特征标签,在当前播放视频的类别标签与监测对象的特征标签匹配时,启动场景数据采集线程。
监测对象是指预先设定主观意识较弱,容易沉溺于观看视频的人群类别,具体可以儿童或其他特定的人群类别。监测对象的特征标签包括监测对象感兴趣的视频类型,例如,儿童喜欢观看的视频类型为动画片。在一个实施例中,在当前播放视频为少儿动画,且视频的观看对象为儿童时,判定为当前播放视频的类别标签与监测对象的特征标签匹配,此时,启动场景视频采集视频。
S206,提取采集的场景数据中用户行为特征数据。
在实施例中,场景数据采集线程包括语音数据采集线程。提取采集的场景数据中用户行为特征数据包括:根据语音数据采线程采集的语音数据,进行儿童声纹识别和语义识别处理,得到是否存在所属人群类别为儿童的用户的判定结果以及语义识别结果,得到用户行为特征数据。举例来说,在监测时段对应儿童用餐场景时,采集到一段语音数据,通过儿童声纹识别分析,确定存在一个儿童用户和一个非儿童用户,通过语义识别处理,识别得到的语料包括“宝宝,我们要吃饭了。”“不吃。”“为什么不吃呢?”“我想先看动画片。”等等。通过对识别的语料进行上下文分析,得到的用户行为特征数据包括对场景数据的分析结果,例如:场景数据对应儿童用餐场景,用户行为特征对应为儿童不配合认真用餐。
具体来说,儿童声纹识别可以通过声纹识别模型进行分析得到,声纹识别模型的处理过程一般包括语音信号处理、声纹特征提取、声纹建模、声纹比对以及判别决策。通过采集大量的儿童声纹样本,利用现有的声纹识别模型架构,进行模型训练,得到儿童声纹识别模型。通过将采集得到的语音数据输入训练得到的儿童声纹识别模型进行识别处理,通过语音信号处理、声纹特征提取、声纹比对以及判别决策,可以分析得到该语音数据属于儿童声纹的概率值。
语义分析处理可以是基于语音识别技术以及文本分类技术得到语音分析结果的处理过程。语音识别技术把人所发出的语音中词汇内容转换为计算机可读入的文本,语音识别可以通过使用开源的语音识别模型进行训练得到,或者直接代用第三方语音识别模型进行处理得到转换的文本。在实施例中,在语音转文字处理过程之前,还可以根据用户选择的语音类别参数,采用对应语言类别的语音识别模型进行处理。其中,语音类别参数包括中文、英文等各国语言,在其他实施例中,语言类别参数还包括各种方言,如粤语、闽南语等,不同方言可以通过调用不同的语音识别模型进行分析得到识别文本。同理,文本分类也可以通过分类模型来实现,分类模型可以是基于决策树,朴素贝叶斯,神经网络,支持向量机,线性最小平方拟合,遗传算法,最大熵等算法中的任意一种来实现,在此不做限定。具体可以通过将携带有监测场景类别及其特征标签的文本样本,输入预先选择的分类模型进行训练得到,具体地,不同监测场景类别可以对应不同分类模型,通过按场景匹配对应的分类模型,在语义分析处理过程中,更具有针对性,能减小语义识别模型的数据处理量,提高处理速度。在实施例中,各种模型可以通过现有的模型架构进行训练得到,设置于处理器直接进行分析,得到用户行为特征数据。也可以将采集的数据发送至关联的第三方平台,通过第三方平台反馈的分析结果,得到用户行为特征数据。
在另一个实施例中,场景数据采集线程包括视频数据采集线程。提取采集的场景数据中用户行为特征数据包括:根据视频数据采线程采集的视频数据,进行人群类别识别和行为识别处理。场景数据为视频数据,可以通过人群类别识别处理分析是否存在儿童,通过行为识别处理确定是否存在与预设场景行为数据库匹配的行为动作,得到是否存在所属人群类别为儿童的用户的判定结果以及行为识别结果,得到用户行为特征数据。
具体来说,人群类别分析可以通过人脸识别模型进行分析处理,行为识别可以通过人体行为识别模型进行分析处理。在实施例中,人脸识别是通过采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,具体可以是基于人脸特征点、整幅人脸图像、模板、神经网络等算法来实现,在此不做限定。在模型训练过程中,采用不同年龄阶段的人群类别的人脸图像作为训练样本,得到能准确识别人群类别的人脸识别模型。行为识别分析可以通过包含特征提取、特征融合与特征分类三个过程的传统方法或是基于two-stream(双流)方法,C3D方法(三维卷积核法)以及CNN-LSTM方法(卷积循环神经网络)的深度学习方法来实现。通过行为识别分析,得到用户的行为动作数据,例如儿童是否存在导出跑到、拒绝食用家长喂得食物等行为。在其他实施例中,还可以同时进行语音数据采集和视频数据采集,通过将语音数据分析结果和视频数据分析结果相结合,得到更为精准的用户行为特征数据。例如,可以通过儿童声纹识别是否存在儿童,通过行为识别分析,确定是否存在儿童不配合用餐等。再例如,同时进行儿童人脸识别和儿童声纹识别,当两个识别结果中包含儿童的概率均大于第一设定概率阈值时,判定为存在儿童。但其中一个识别结果中包含儿童的概率小于第二设定概率阈值时,判定为不存在儿童,其中第一设定概率阈值大于第二设定概率阈值,具体的数值大小可以根据实际情况记性设定,在此不作限定。
S208,当用户行为特征数据满足视频切换触发条件时,查找与类别标签匹配、且与监测场景类别关联的目标视频。
视频切换触发条件与监测场景类别相对应。在实施例中,视频切换一般针对儿童不配合家长进行相应动作时,例如,在监测时段为用餐时段时,对应监测场景类别为儿童用餐场景,此时,视频切换触发条件包括:监测到存在儿童身份信息、用餐相关信息以及儿童拒绝用餐行为信息,其中儿童身份信息包括存在儿童图像或儿童声纹,用餐相关信息包括图像中出现餐具或语音中家长提醒儿童用餐等,儿童拒绝用餐行为信息包括儿童语音拒绝用餐、儿童哭闹或是通过图像检测到儿童四处走动。目标视频用于替换当前正在播放视频。与类别标签匹配是指与当前播放的视频处于同一类别,与监测场景类别关联是指视频内容符合检测场景。例如,当前播放的视频为视频集“小猪佩奇”中的第一集,视频内容为捉迷藏游戏,监测场景类别为儿童用餐场景,则查找的对象为视频集“小猪佩奇”中视频内容为用餐的视频。
在实施例中,当儿童声纹识别结果为存在儿童语音,且语义识别结果中存在与预设场景关键字数据库匹配的关键字时,查找与类别标签匹配且与监测场景类别关联的目标视频。
在实施例中,当人群类别识别结果为存在儿童,且行为识别结果中存在与预设场景行为数据库匹配的行为动作时,查找与类别标签匹配且与监测场景类别关联的目标视频。
S210,将当前播放的视频切换为目标视频。
在视频切换过程中,首先,根据目标视频的缓存地址,对查找得到的目标视频进行缓存,并在缓存视频的时长满足预设的时长时,根据缓存地址,读取目标视频,将目标视频渲染至视频播放设备的显示屏,同时,结束当前播放的视频,实现视频的无缓冲切换。
在一个实施例中,如图3所示,将当前播放的视频切换为目标视频的过程包括步骤S302至S304。
S302,获取目标视频的下载地址,并根据下载地址,对目标视频进行缓存处理。
S304,当已缓存的目标视频的视频时长满足预设时长要求时,将当前播放的视频切换为已缓存的目标视频。
目标视频的下载地址可以通过访问预先指定的视频播放平台来获取,也可以通过访问当前播放视频所在的视频播放平台来获取。基于当前播放视频的类别标签和监测场景类别,搜索视频播放平台的资源库,得到目标视频的下载地址,根据预先设定的缓存地址,对目标视频进行缓存处理,当已缓存的目标视频的视频时长满足预设时长要求时,结束当前播放的视频,并播放已缓存的目标视频,其中,设定的视频缓存时长为可以是1分钟或其他时长,在此不作限定。
上述视频切换方法,基于监测时段确定检测场景及其对应的视频切换触发条件,启动场景数据采集线程,以采集当前的场景数据,在场景数据满足视频切换触发条件的情况下,查找目标视频并进行视频切换,通过播放与当前播放视频类别标签匹配且与监测场景类别关联的目标视频,使得切换的目标视频与当前正在进行的实际场景更为匹配,通过自动识别分析进行实现切换处理,实现视频的合理有效推荐。
在一个实施例中,视频切换方法的时序图如图4所示,当用户行为特征数据满足视频切换触发条件时,终止已启动的场景数据采集线程,并查找与当前播放视频类别标签匹配且与监测场景类别关联的目标视频,进行视频切换。
在一个实施例中,视频切换方法的时序图如图5所示,当用户行为特征数据不满足视频切换触发条件时,终止已启动的场景数据采集线程,并在监测时段,根据预设采集频率,重新启动场景数据采集线程。
在一个实施例中,当采集的场景数据中不包括儿童这一监测对象时,判定用户行为特征数据不满足视频切换触发条件。不包括儿童这一监测对象可以是通过对语音数据进行儿童声纹识别得到的识别结果中不包括儿童,也可以是通过对视频数据进行人群类别识别得到的识别结果中不包括儿童。在一个实施例中,当采集的场景数据中不包括用餐相关信息时,判定用户行为特征数据不满足视频切换触发条件。不包括用餐相关信息可以是语音数据中不包含用餐相关的关键词,也可以是视频数据中不包含餐具相关物品。在一个实施例中,当采集的场景数据中不包括儿童拒绝用餐行为信息时,判定用户行为特征数据不满足视频切换触发条件。不包括儿童拒绝用餐行为信息可以是儿童行为为正常用餐。
在一个实施例中,在监测时段内未进行视频切换时,场景数据按照设定的频率进行采集。采集频率可以根据需要进行设定,例如通过后台统一设定或是用户通过设置界面进行个性化设定,具体采集频率可以是1分钟或是其他指定频率,在此不作限定。在一次场景数据采集线程结束后,若当前时间在监测时段内,则按照预设采集频率,重新启动场景数据采集线程。在监测时段内,若检测到用户主动操作进行了视频切换,且切换后的视频的类别标签与监测对象的特征标签不匹配时,终止场景数据采集线程,并重新确定是否启动场景数据采集线程。例如,用户将当前播放视频从少儿动画切换为新闻联播,则终止场景数据采集线程,当用户在监测时段内再次将当前播放视频由新闻联播切换为少儿动画时,重新启动场景数据采集线程。
在一个实施例中,当目标视频播放结束时,获取与监测场景类别相匹配的提示文本,并推送提示文本对应的提示弹窗。
不同的监测场景类别对应不同的提示文本,例如,如图6所示,儿童吃饭场景对应的提示文本的主要内容为提示儿童认真用餐,提示文本如“好好吃完饭,才能继续观看哦!”,儿童学习场景的主要内容为提示儿童认真学习,提示文本如“认真完成学习任务,才能继续观看哦!”,儿童休息场景的主要内容为提示儿童好好睡觉,提示文本如“睡一觉醒来,才能继续观看哦!”,提示弹窗的窗口位置和大小可以通过参数设置进行确定,将对应的提示文本在提示弹窗中进行显示,并推送至视频播放设备。
在一个实施例中,当目标视频播放结束时,获取与监测场景类别相匹配的提示语音,并播放提示语音。
在其中一个实施例中,可以同时推送提示弹窗和提示语音,提示语音的内容可以与提示文本相同。在其中另一个实施例中,可以先推送提示弹窗再播放提示语音。提示弹窗的显示时间可以大于提示语音的播放时间,且提示弹窗中的提示内容可以加注对应的汉语拼音,便于儿童理解。
在一个实施例中,当目标视频播放结束时,启动待机处理流程。
启动待机处理流程,可以关闭视频播放设备,进而使得儿童能够认真进行当前场景中的任务。在其中一个实施例中,可以在提示弹窗的显示时间达到设定显示时长时,启动待机处理流程。在其中另一个实施例中,还可以在提示语音播放结束时,启动待机处理流程。
图7为一个实施例中视频切换方法的流程示意图。应该理解的是,虽然图7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,以儿童在饭点沉迷观看电视上播放的少儿动画时的视屏切换为例,视屏切换方法的处理流程如图7所示,在检测到当前时间为设定的用餐时间段,电视上当前的播放视频为少儿动画时,启动场景数据采集线程,通过场景数据采集设备采集用户语音数据,并将采集的语音数据发送至处理器,处理器通过儿童声纹算法检测是否是儿童在观看少儿动画,如果不是观看对象不包括儿童,则终止场景数据采集线程,处理器通过语音转文字技术将用户语音数据转成文本,检测文本中是否包含家长在叫喊儿童吃饭的用户行为数据,如果不是则终止场景数据采集线程,如果是,则检索与当期播放少儿动画相匹配的少儿用餐相关教育视频,并在对用餐相关教育视频进行缓存处理之后,在电视上自动切换少儿用餐教育视频,播放教育视频后,在电视上弹框提示“好好吃完饭,才能继续观看哦”,并启动待机处理流程,以使视频播放设备自动进入待机状态。
在一个实施例中,如图8所示,提供了一种视频切换装置800,装置包括:
监测场景类别查找模块802,用于查找监测时段对应的监测场景类别。
采集线程启动模块804,用于获取与监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程。
特征数据提取模块806,用于提取采集的场景数据中用户行为特征数据。
目标视频查找模块808,用于当用户行为特征数据满足视频切换触发条件时,查找与类别标签匹配、且与监测场景类别关联的目标视频。
目标视频切换模块810,用于将当前播放的视频切换为目标视频。
上述视频切换装置,基于监测时段确定检测场景及其对应的视频切换触发条件,启动场景数据采集线程,以采集当前的场景数据,在场景数据满足视频切换触发条件的情况下,查找目标视频并进行视频切换,通过播放与当前播放视频类别标签匹配且与监测场景类别关联的目标视频,使得切换的目标视频与当前正在进行的实际场景更为匹配,通过自动识别分析进行实现切换处理,实现视频的合理有效推荐。
在其中一个实施例中,采集线程启动模块804,还用于获取监测对象的特征标签,当当前播放视频的类别标签与监测对象的特征标签匹配时,启动场景数据采集线程。
在其中一个实施例中,采集线程启动模块804,还用于当用户行为特征数据不满足视频切换触发条件时,终止已启动的场景数据采集线程,并在监测时段,根据预设采集频率,重新启动场景数据采集线程。
在其中一个实施例中,场景数据采集线程包括语音数据采集线程。特征数据提取模块806,还用于根据语音数据采线程采集的语音数据,进行儿童声纹识别和语义识别处理,目标视频查找模块808,还用于当儿童声纹识别结果为存在儿童语音,且语义识别结果中存在与预设场景关键字数据库匹配的关键字时,查找与类别标签匹配、且与监测场景类别关联的目标视频。
在其中一个实施例中,场景数据采集线程包括视频数据采集线程。特征数据提取模块806,还用于根据视频数据采线程采集的视频数据,进行人群类别识别和行为识别处理。目标视频查找模块808,还用于当人群类别识别结果为存在儿童,且行为识别结果中存在与预设场景行为数据库匹配的行为动作时,查找与类别标签匹配、且与监测场景类别关联的目标视频。
在其中一个实施例中,视频切换装置800还包括视频缓存模块,用于获取目标视频的下载地址,并根据下载地址,对目标视频进行缓存处理目标视频切换模块,还用于当已缓存的目标视频的视频时长满足预设时长要求时,将当前播放的视频切换为已缓存的目标视频。
在其中一个实施例中,视频切换装置800还包括提示弹窗推送模块,用于当目标视频播放结束时,获取与监测场景类别相匹配的提示文本,并推送提示文本对应的提示弹窗。
在其中一个实施例中,视频切换装置800还包括提示语音播放模块,用于当目标视频播放结束时,获取与监测场景类别相匹配的提示语音,并播放提示语音。
在其中一个实施例中,视频切换装置800还包括待机启动模块,用于当目标视频播放结束时,启动待机处理流程。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的处理器104。如图9所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现视频切换方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行视频切换方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的视频切换装置可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该视频切换装置的各个程序模块,比如,图8所示的监测场景类别查找模块、采集线程启动模块、采集线程启动模块、目标视频查找模块和目标视频切换模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的视频切换方法中的步骤。
例如,图9所示的计算机设备可以通过如图8所示的视频切换装置中的监测场景类别查找模块执行查找监测时段对应的监测场景类别。采集线程启动模块执行获取与监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程。采集线程启动模块执行提取采集的场景数据中用户行为特征数据。目标视频查找模块执行当用户行为特征数据满足视频切换触发条件时,查找与类别标签匹配、且与监测场景类别关联的目标视频。目标视频切换模块执行将当前播放的视频切换为目标视频。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述视频切换方法的步骤。此处视频切换方法的步骤可以是上述各个实施例的视频切换方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述视频切换方法的步骤。此处视频切换方法的步骤可以是上述各个实施例的视频切换方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种视频切换方法,所述方法包括:
查找监测时段对应的监测场景类别;
获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
提取采集的场景数据中用户行为特征数据;
当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
将当前播放的视频切换为所述目标视频。
2.根据权利要求1所述的方法,其特征在于,所述启动场景数据采集线程包括:
获取监测对象的特征标签,当所述当前播放视频的类别标签与所述监测对象的特征标签匹配时,启动场景数据采集线程。
3.根据权利要求1或2所述的方法,其特征在于,所述提取采集的场景数据中用户行为特征数据之后,还包括:
当所述用户行为特征数据不满足所述视频切换触发条件时,终止已启动的所述场景数据采集线程,并在所述监测时段,根据预设采集频率,重新启动所述场景数据采集线程。
4.根据权利要求1所述的方法,其特征在于,所述场景数据采集线程包括语音数据采集线程;所述提取采集的场景数据中用户行为特征数据包括:
根据所述语音数据采线程采集的语音数据,进行儿童声纹识别和语义识别处理;
当儿童声纹识别结果为存在儿童语音,且语义识别结果中存在与预设场景关键字数据库匹配的关键字时,进入,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频的步骤。
5.根据权利要求1所述的方法,其特征在于,所述场景数据采集线程包括视频数据采集线程;所述提取采集的场景数据中用户行为特征数据包括:
根据所述视频数据采线程采集的视频数据,进行人群类别识别和行为识别处理;
当人群类别识别结果为存在儿童,且行为识别结果中存在与预设场景行为数据库匹配的行为动作时,进入,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频的步骤。
6.根据权利要求1所述的方法,其特征在于,所述将当前播放的视频切换为所述目标视频之前,还包括:
获取所述目标视频的下载地址,并根据所述下载地址,对所述目标视频进行缓存处理;
所述将当前播放的视频切换为所述目标视频包括:
当已缓存的目标视频的视频时长满足预设时长要求时,将当前播放的视频切换为已缓存的目标视频。
7.根据权利要求1所述的方法,其特征在于,所述将当前播放的视频切换为所述目标视频之后,还包括以下各项中的任意一项:
当所述目标视频播放结束时,获取与所述监测场景类别相匹配的提示文本,并推送所述提示文本对应的提示弹窗;
当所述目标视频播放结束时,获取与所述监测场景类别相匹配的提示语音,并播放所述提示语音;
当所述目标视频播放结束时,启动待机处理流程。
8.一种视频切换装置,其特征在于,所述装置包括:
监测场景类别查找模块,用于查找监测时段对应的监测场景类别;
采集线程启动模块,用于获取与所述监测场景类别对应的视频切换触发条件以及当前播放视频的类别标签,并启动场景数据采集线程;
特征数据提取模块,用于提取采集的场景数据中用户行为特征数据;
目标视频查找模块,用于当所述用户行为特征数据满足所述视频切换触发条件时,查找与所述类别标签匹配、且与所述监测场景类别关联的目标视频;
目标视频切换模块,用于将当前播放的视频切换为所述目标视频。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782534.7A CN112423133B (zh) | 2019-08-23 | 2019-08-23 | 视频切换方法、装置、计算机可读存储介质和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782534.7A CN112423133B (zh) | 2019-08-23 | 2019-08-23 | 视频切换方法、装置、计算机可读存储介质和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112423133A true CN112423133A (zh) | 2021-02-26 |
CN112423133B CN112423133B (zh) | 2022-07-08 |
Family
ID=74778992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910782534.7A Active CN112423133B (zh) | 2019-08-23 | 2019-08-23 | 视频切换方法、装置、计算机可读存储介质和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112423133B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190404A (zh) * | 2021-04-23 | 2021-07-30 | Oppo广东移动通信有限公司 | 场景识别方法、装置、电子设备和计算机可读存储介质 |
CN113849686A (zh) * | 2021-09-13 | 2021-12-28 | 北京达佳互联信息技术有限公司 | 一种视频数据获取方法、装置、电子设备及存储介质 |
CN114302250A (zh) * | 2021-12-17 | 2022-04-08 | 北京达佳互联信息技术有限公司 | 一种资源处理方法、装置、系统、设备及存储介质 |
CN114979770A (zh) * | 2022-06-28 | 2022-08-30 | 北京爱奇艺科技有限公司 | 视频播放方法、装置、电子设备及存储介质 |
WO2023001152A1 (zh) * | 2021-07-21 | 2023-01-26 | 华为技术有限公司 | 一种推荐视频片段的方法、电子设备及服务器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324729A (zh) * | 2013-06-27 | 2013-09-25 | 北京小米科技有限责任公司 | 一种推荐多媒体资源的方法和装置 |
CN107948754A (zh) * | 2017-11-29 | 2018-04-20 | 成都视达科信息技术有限公司 | 一种视频推荐方法和系统 |
WO2018108080A1 (zh) * | 2016-12-13 | 2018-06-21 | 北京奇虎科技有限公司 | 一种基于声纹搜索的信息推荐方法及装置 |
CN108521606A (zh) * | 2018-04-25 | 2018-09-11 | 上海与德科技有限公司 | 一种观看电视的监控方法、装置、存储介质及智能电视 |
-
2019
- 2019-08-23 CN CN201910782534.7A patent/CN112423133B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324729A (zh) * | 2013-06-27 | 2013-09-25 | 北京小米科技有限责任公司 | 一种推荐多媒体资源的方法和装置 |
WO2018108080A1 (zh) * | 2016-12-13 | 2018-06-21 | 北京奇虎科技有限公司 | 一种基于声纹搜索的信息推荐方法及装置 |
CN107948754A (zh) * | 2017-11-29 | 2018-04-20 | 成都视达科信息技术有限公司 | 一种视频推荐方法和系统 |
CN108521606A (zh) * | 2018-04-25 | 2018-09-11 | 上海与德科技有限公司 | 一种观看电视的监控方法、装置、存储介质及智能电视 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190404A (zh) * | 2021-04-23 | 2021-07-30 | Oppo广东移动通信有限公司 | 场景识别方法、装置、电子设备和计算机可读存储介质 |
WO2023001152A1 (zh) * | 2021-07-21 | 2023-01-26 | 华为技术有限公司 | 一种推荐视频片段的方法、电子设备及服务器 |
CN115695860A (zh) * | 2021-07-21 | 2023-02-03 | 华为技术有限公司 | 一种推荐视频片段的方法、电子设备及服务器 |
CN113849686A (zh) * | 2021-09-13 | 2021-12-28 | 北京达佳互联信息技术有限公司 | 一种视频数据获取方法、装置、电子设备及存储介质 |
CN114302250A (zh) * | 2021-12-17 | 2022-04-08 | 北京达佳互联信息技术有限公司 | 一种资源处理方法、装置、系统、设备及存储介质 |
CN114302250B (zh) * | 2021-12-17 | 2024-06-21 | 北京达佳互联信息技术有限公司 | 一种资源处理方法、装置、系统、设备及存储介质 |
CN114979770A (zh) * | 2022-06-28 | 2022-08-30 | 北京爱奇艺科技有限公司 | 视频播放方法、装置、电子设备及存储介质 |
CN114979770B (zh) * | 2022-06-28 | 2024-02-02 | 北京爱奇艺科技有限公司 | 视频播放方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112423133B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112423133B (zh) | 视频切换方法、装置、计算机可读存储介质和计算机设备 | |
US10468025B2 (en) | Speech interaction method and apparatus | |
US20210020182A1 (en) | Personalization of experiences with digital assistants in communal settings through voice and query processing | |
US9253511B2 (en) | Systems and methods for performing multi-modal video datastream segmentation | |
CN105895087B (zh) | 一种语音识别方法及装置 | |
CN111258435B (zh) | 多媒体资源的评论方法、装置、电子设备及存储介质 | |
CN106098063B (zh) | 一种语音控制方法、终端设备和服务器 | |
US10977448B2 (en) | Determining personality profiles based on online social speech | |
WO2017041372A1 (zh) | 基于人工智能的人机交互方法和系统 | |
US20160014482A1 (en) | Systems and Methods for Generating Video Summary Sequences From One or More Video Segments | |
CN106708905B (zh) | 视频内容搜索方法和装置 | |
US11328159B2 (en) | Automatically detecting contents expressing emotions from a video and enriching an image index | |
CN110035302B (zh) | 信息推荐及模型训练方法和装置、计算设备、存储介质 | |
CN110222256B (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN110929158A (zh) | 一种内容推荐方法、系统及存储介质和终端设备 | |
Sanchez-Cortes et al. | Inferring mood in ubiquitous conversational video | |
CN111586466B (zh) | 一种视频数据处理方法、装置及存储介质 | |
CN112651334A (zh) | 机器人视频交互方法和系统 | |
CN107346182A (zh) | 一种构建用户词库的方法、及用于构建用户词库的装置 | |
CN112230838A (zh) | 一种文章处理方法、装置、设备及计算机可读存储介质 | |
CN109582869A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN110519620A (zh) | 在电视机推荐电视节目的方法以及电视机 | |
CN118132828A (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN110460903A (zh) | 基于语音分析对节目评论的方法、装置和计算机设备 | |
Khan et al. | A framework for creating natural language descriptions of video streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |