CN109299326B

CN109299326B - 视频推荐方法及装置、系统、电子设备以及存储介质

Info

Publication number: CN109299326B
Application number: CN201811291562.0A
Authority: CN
Inventors: 光超; 陈健生
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2021-01-15
Anticipated expiration: 2038-10-31
Also published as: CN109299326A

Abstract

本公开是关于一种视频推荐方法及装置、系统、电子设备以及存储介质，涉及模式识别技术领域，可以应用于将根据用户的观影偏好将相应的视频推荐给用户的场景。该视频推荐方法包括：确定直播视频的目标图像；对所述目标图像中的预设元素进行位置识别，以确定目标图像中的目标区域；在所述目标区域内对目标特征进行识别；并根据所述目标特征推荐所述直播视频。本公开可以在线视频爆发式增长的情况下，根据不同用户的观看偏好，将优质的视频内容推荐给用户，提升用户的观影体验。

Description

视频推荐方法及装置、系统、电子设备以及存储介质

技术领域

本公开涉及模式识别技术领域，具体而言，涉及一种视频推荐方法、视频推荐装置及视频推荐系统、电子设备以及存储介质。

背景技术

近年来，游戏竞技行业逐渐推广发展，越来越多的人开始加入到竞技游戏阵营，为了提高自己的游戏竞技水平，人们开始选择观看金牌玩家的游戏视频。

随着人们日益增长的游戏视频观看需求，游戏直播行业迎来爆发式增长，带来丰富的直播内容，用户通常是进入不同的直播间观看具体视频内容后选择相应的直播视频。

由于不同的主播游戏竞技水平参差不齐，直播偏好不同，用户通过自行筛选不同的直播视频而确定要观看的视频的方式过于复杂，目前又缺少可以自动识别游戏画面特征并自动分类或者筛选优质直播内容并推荐给用户的方法。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种视频推荐方法、视频推荐装置、视频推荐系统、电子设备以及计算机可读存储介质，进而至少在一定程度上克服无法自动识别游戏视频画面特征并自动分类和筛选的问题。

根据本公开的第一方面，提供一种视频推荐方法，包括：确定直播视频的目标图像；对目标图像中的预设元素进行位置识别，以确定目标图像中的目标区域；在目标区域内对目标特征进行识别；并根据目标特征推荐直播视频。

可选的，视频推荐方法还包括：获取将直播视频转码后的转码视频；将转码视频按照预设时间段进行截图，生成目标图像。

可选的，对目标图像中的预设元素进行位置识别包括：将目标图像输入至第一深度学习模型；如果目标图像存在预设元素，则将第一深度学习模型的输出作为目标区域。

可选的，在目标区域内对目标特征进行识别包括：将目标区域输入至第二深度学习模型；确定第二深度学习模型基于目标特征的识别结果。

可选的，视频推荐方法还包括：对目标特征的识别结果进行容错处理，并确定最终识别结果；将所确定的最终识别结果推送到消息队列中。

可选的，对目标特征的识别结果进行容错处理包括：如果在预设时间段内识别结果中的剩余人数未发生变化，则确认对识别结果进行处理；如果当前识别结果中的剩余人数与上次识别结果中的剩余人数不同，则根据剩余人数的变化情况判断是否对识别结果进行处理。

可选的，视频推荐方法还包括：从上传方获取视频流；或从第三方网络获取视频流。

根据本公开的第二方面，提供一种视频播放装置，包括：目标图像确定模块，用于确定直播视频的目标图像；目标区域确定模块，用于对目标图像中的预设元素进行位置识别，以确定目标图像中的目标区域；目标特征识别模块，用于在目标区域内对目标特征进行识别；视频推荐模块，用于根据目标特征推荐直播视频。

可选的，视频推荐装置还包括视频获取模块，用于从上传方获取视频流；或从第三方网络获取视频流。

可选的，目标图像确定模块包括目标图像生成单元，用于获取由直播视频转码后生成的转码视频；将转码视频按照预设时间段进行截图，生成目标图像。

可选的，目标区域确定模块包括目标区域确定单元，用于将目标图像输入至第一深度学习模型；如果目标图像存在预设元素，则将第一深度学习模型的输出作为目标区域。

可选的，目标特征识别模块包括目标特征识别单元，用于将目标区域输入至第二深度学习模型；确定第二深度学习模型基于目标特征的识别结果。

可选的，视频播放装置还包括结果推送模块，用于对目标特征的识别结果进行容错处理，并确定最终识别结果；将所确定的最终识别结果推送到消息队列中。

可选的，结果推送模块包括容错处理单元，用于如果在预设时间段内识别结果中的剩余人数未发生变化，则确认对识别结果进行处理；如果当前识别结果中的剩余人数与上次识别结果中的剩余人数不同，则根据剩余人数的变化情况判断是否对识别结果进行处理。

根据本公开的第三方面，提供一种视频推荐系统，包括：代理服务器，用于接收上传方上传的视频流；转码服务器，用于对从第三方网络获取的视频流以及从代理服务器获取的视频流进行转码；拉流服务器，用于将第三方网络上的视频流传输到转码服务器；识别服务器，用于对目标图像进行目标区域识别和目标特征识别，并确定最终识别结果，将所确定的最终识别结果推送到消息队列中；业务服务器，用于获取消息队列中的最终识别结果，根据最终识别结果推荐直播视频。

根据本公开的第四方面，提供一种电子设备，包括：处理器；以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的视频推荐方法。

根据本公开的第五方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据上述任意一项所述的视频推荐方法。

本公开的示例性实施例中的视频推荐方法，首先，获取到直播视频的目标图像后，基于目标图像对目标图像中的预设元素进行位置识别，以确定出目标图像中的目标区域。其次，在目标区域中进行目标特征识别。再次，根据目标特征推荐直播视频，将直播视频推荐给用户。该视频推荐方法通过识别基于视频画面的目标图像，将目标图像中目标特征的识别结果生成最终识别结果后，向用户推荐直播视频，该视频推荐方法便于从海量视频中选取优质的视频推荐给相应用户。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了根据本公开的示例性实施方式的视频推荐方法的流程图；

图2示意性示出了根据本公开的示例性实施方式的视频推荐方法的网络模型框架图；

图3示意性示出了根据本公开的示例性实施方式的对目标图像中的预设元素进行位置识别的过程图；

图4示意性示出了根据本公开的示例性实施方式的在目标区域进行目标特征识别的过程图；

图5示意性示出了根据本公开的示例性实施方式中决赛圈识别效果的效果图；

图6示意性示出了根据本公开的示例性实施方式中击杀人数排行榜展示效果图；

图7示意性示出了根据本公开的一些示例性实施方式的视频推荐装置的方框图；

图8示意性示出了根据本公开的另一示例性实施方式的视频推荐装置的方框图；

图9示意性示出了根据本公开的一些示例性实施例的目标图像确定模块的方框图；

图10示意性示出了根据本公开的一些示例性实施例的目标区域确定模块的方框图；

图11示意性示出了根据本公开的一些示例性实施例的目标特征识别模块的方框图；

图12示意性示出了根据本公开的再一示例性实施方式的视频推荐装置的方框图；

图13示意性示出了根据本公开的一些示例性实施例的结果推送模块的方框图；

图14示意性示出了根据本公开的示例性实施方式的视频推荐系统的架构图；

图15示意性示出了根据本公开一示例性实施例的电子设备的框图；以及

图16示意性示出了根据本公开一示例性实施例的计算机可读存储介质的示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

随着竞技游戏的快速发展，游戏直播行业迎来爆发式增长，大量主播在直播平台上开播各种游戏，在为用户带来更加丰富的视频内容的同时，也为用户寻找自己感兴趣的视频带来阻碍。目前，缺少一种能够自动识别游戏画面特征并自动分类，将筛选出的优质直播内容推荐给用户的方法。

基于此，在本示例实施例中，首先提供了一种视频推荐方法，可以利用各大视频播放平台的服务器来实现本公开的视频推荐方法；也可以利用终端设备来实现本公开所述的方法，其中，所述终端设备例如可以为手机、电脑、PDA等各种电子设备。参考图1，该视频推荐方法可以包括以下步骤：

S110.确定直播视频的目标图像。

在本公开的一些示例性实施方式中，直播视频的来源可以为视频上传方(即上传方)上传的视频，直播视频可以为游戏直播视频。上传方上传的视频可以包括上传方上传到服务器的视频以及上传方上传到第三方内容分发网络(Content Delivery Network，CDN)网络的视频。因此，可以通过获取上传方上传的视频流以及获取第三方CDN网络上的视频流两种方式来获取直播视频。获取的直播视频的具体内容多种多样，举例而言，直播视频的内容可以是直播不同的游戏，例如可以为《决战平安京》《绝地求生》等不同类型的游戏；直播视频的内容也可以分为经典对战或较为普通对战，经典对战可以为在游戏中表现优异的竞技选手之间进行的对战，普通对战可以为游戏双方为了练习升级段位所开展的对战。

根据本公开的一些示例性实施例，获取将直播视频转码后的转码视频；将转码视频按照预设时间段进行截图，生成目标图像。从上传方或第三方CDN网络获取到直播视频后，可以对直播视频进行转码，生成转码视频。不同主播所上传的视频的视频格式、编码、码率、分辨率等不尽相同，不同观众观看视频时所采用的设备也各有不同。举例而言，一些游戏本身有PC端版本、PAD端版本、手机端版本等，而主播端目前可以包括PC端直播、手机端直播、手机端推送到PC端直播。由于直播运营的需求，直播时会将直播画面嵌套在直播模板中进行播放，目前存在多套直播模板可用于直播。因此获取到直播视频后，可以先对直播视频的原画进行转码，生成不同分辨率的转码视频，以适配不同观众的视频设备，满足不同观众的观看需求。

举例而言，在视频播放时，fps(frames of per secomd)表示视频中每秒的帧数，基于此，预设时间段可以设为一个视频帧变换为另一个视频帧所用的时间。因此，按照此预设时间段对转码视频进行截图后，生成的截图即为转码视频所对应的每一帧，每一帧可以为目标图像，并确定目标图像。另外，预设时间段也可以例如为0.5秒、1秒、2秒等等，举例而言，可以每隔1秒对转码视频画面进行一次截图，将截图时对应的帧作为目标图像。

需要说明的是，对视频截图时，如果预设时间段的时间间隔相对较长，可以预先规定相隔预设时间段将会截取哪一帧。例如，每隔1秒间隔后进行视频画面截图，可以统一设置截取紧随预设时间段结束后的第一帧作为截图，确定为目标图像。在实际应用中，选取哪一帧进行截图并作为目标图像的规则变化均属于本公开所要保护的范围。

生成目标图像后，可以对目标图像进行后续的识别操作，参考图2，对目标图像进行识别并生成识别结果的过程200，其中，210可以是对目标图像进行初步的剪裁，如去掉直播视频的模板，只保留直播画面内容；220可以为对剪裁后的目标图像中的预设元素进行位置识别；230可以为确定预设元素所处的目标区域；240可以为对预设元素所处区域进行目标特征识别；250可以为目标特征识别后的输出结果。

需要说明的是，在对目标图像进行识别的过程中，可以省略对目标图像进行210剪裁的操作，直接进行位置识别，这些对目标图像进行剪裁的变化均属于本公开所要保护的范围。

S120.对所述目标图像中的预设元素进行位置识别，以确定所述目标图像中的目标区域。

在本公开的一些示例性实施方式中，目标图像中的预设元素可以是整个直播过程中直播画面保持不变的标识、文字等，如游戏画面中的“击杀”、“剩余”等界面文字，将这些界面文字作为预设元素，可以先基于目标图像对目标图像中的预设元素进行位置识别，以确定目标图像中的目标区域。

在本公开的一些示例性实施例中，将目标图像输入至第一深度学习模型；如果目标图像存在预设元素，则将第一深度学习模型的输出作为目标图像中的目标区域。如果目标图像中不存在预设元素，则输出可以表示目标图像中不存在预设元素的标识结果，如输出null或false等。如果目标图像中存在预设元素，则输出预设元素所处的位置区域即目标图像中的目标区域，例如可以通过输出预设元素所处位置区域的x坐标、y坐标以及目标区域在目标图像中的宽度比例、高度比例，以确定出目标区域。

参考图3，卷积神经网络(Convolutional Neural Network，CNN)可以为对一幅目标图像进行目标区域识别的目标区域识别CNN网络300。举例而言，首先，目标图像是38×70×3，3可以是它的深度(即R、G、B)，卷积层是一个3×3×3的感受野filter，通过这个filter与目标图像的卷积可以得到一个36×68×3的特征图。其次，采用2×2的filter对36×68×3的特征图进行池化pooling，池化操作可以将操作图缩小，一般可以采用平均值池化和最大值池化的方式对特征图进行池化，平均值池化是获取每一个区域中的平均值，最大值池化是寻找每一个区域中的最大值，对36×68×3的特征图进行池化后生成18×34×20的特征图。接下来，对生成的18×34×20的特征图再进行卷积、池化、卷积、池化、卷积的过程，此过程与上述的卷积、池化过程类似，只是选取的卷积filter和池化filter不同，得到1×5×80的特征图。再次，通过全连接层连接所有的特征，确定出输出结果。

根据本公开的一些示例性实施例，在目标区域识别过程中，计算损失函数采用了最基本的均方误差损失函数：

S130.对所述目标图像中的预设元素进行位置识别，以确定所述目标图像中的目标区域。

在本公开的一些示例性实施方式中，目标区域可以为确定出目标图像中预设元素所处的位置区域，目标特征可以为游戏直播视频中指示游戏进度状态或者指示游戏成就的信息，指示游戏成就的信息可以包括但不限于当前剩余人数的数量、已击杀敌人的数量等。举例而言，目标特征可以为表示“击杀”、“剩余”人数变化对应的具体数字，在确定出的目标区域中进行目标特征的识别。

在本公开的一些示例性实施例中，将目标图像的目标区域输入至第二深度学习模型；确定第二深度学习模型基于目标特征的识别结果。举例而言，参考图4，CNN网络400可以为对预设元素所处的位置区域进行目标特征识别的目标特征识别CNN网络。首先，目标位置区域图像是22×34×3，卷积层是一个3×3×3的感受野(filter)，通过这个filter与目标图像的卷积可以得到一个20×32×20的特征图。其次，采用2×2的filter对20×32×30的特征图进行池化，可以通过池化操作将操作图缩小，此处也可以采用平均值池化和最大值池化的方式对特征图进行池化，对20×32×30的特征图进行池化后生成10×16×20的特征图。接下来，对生成的10×16×20的特征图再进行卷积、池化、卷积的过程，同样，此过程与上述的卷积、池化过程类似，只是选取的卷积filter和池化filter不同，得到2×5×80的特征图。再次，通过全连接层连接所有的特征，确定出目标特征的输出结果。

根据本公开的一些示例性实施例，在目标特征识别的识别过程中，损失函数可以采用交叉熵函数：

loss_ij＝-[y_ij*ln p_ij+(1-y_ij)ln(1-p_ij)] (公式2)

当然，本领域技术人员容易理解的是，位置识别过程以及目标特征识别过程中的损失函数可以根据训练的实际情况进行选取，识别过程采用不同损失函数均属于本公开的保护范围，本示例性实施例中对此不做特殊限定。

S140.根据所述目标特征推荐所述直播视频。

在本公开的一些示例性实施方式中，目标特征可以为击杀人数的数量、主播是否进入决赛圈、是否为游戏副本。用户的兴趣点可以为用户想要观看哪一类别的视频，例如，用户1的兴趣点是观看击杀人数最多的视频，用户2的兴趣点是观看进入决赛圈主播的视频，用户3的兴趣点是观看在游戏副本中主播的视频。因此，可以将用户的兴趣点与目标特征的最终识别结果相结合，将符合用户兴趣点的目标特征所对应的视频推荐给用户。

在另一可选的示例性实施方式中，根据目标特征推荐直播视频包括：根据目标特征确定直播视频在一预设的直播视频排行榜中的位置。即，在视频直播APP或网页中，可以包含一些排行榜，可以根据识别出的目标特征确定该直播视频在排行榜中的位置。

在本公开的一些示例性实施例中，对目标特征的识别结果进行容错处理，并确定最终识别结果；将所确定的最终识别结果推送到消息队列中。在识别过程中，可能会遇到一些问题造成识别结果有所偏差，举例而言，一些视频上传方上传的视频码率较低，视频画面模糊，模糊画质将影响识别效果；对一些转码视频进行截图后，画质损失较严重，特别是例如第一人称射击类游戏FPS(First-person shooting game)等运动较快的画面，损失更为严重；一些直播视频在开播时会加入直播水印，影响识别效果；某些直播游戏会切换出游戏画面，可能造成识别失败；另外，游戏画面中字体的格式不统一，可能存在倾斜和加粗等效果，如0、6、8容易识别错误，1、7容易识别错误。

针对以上问题，对目标特征识别完成后，需要对目标特征识别结果进行容错处理，可以对依据游戏本身的特质对目标特征识别结果进行容错处理。举例而言，以游戏中当前剩余人数为例，大多数游戏的游戏过程中剩余人数是递减的，如“荒野行动”、“绝地求生”游戏中，随着游戏的进行，剩余人数呈现为逐渐递减的趋势。对图像进行两次检测的间隔可以自行设置，例如可以设置两次图像检测的间隔时间为2秒。

因此，在本公开的另外一些示例性实施例中，具体的容错处理可以为：如果在预设时间段内识别结果中的剩余人数未发生变化，则确认对识别结果进行处理。预设时间段可以为提前设定的时间段，如2分钟、3分钟，在预设时间段内剩余人数未发生变化，此时可能发生服务器连接超时的情况，因此，需要再次确认目标特征的识别结果，得到正确的识别结果。举例而言，如果剩余人数为“56”的情况保持了3分钟，此时需要检查服务器的连接状态，并确认目标特征的识别结果。

需要说明的是，设定预设时间段是为了判断在此时间段内目标特征的识别结果是否发生改变，如果识别结果长时间未发生改变，则可能出现网络问题或其它问题。预设时间段的长短变化均属于本公开的保护范围，本示例实施例中对此不做特殊限定。

如果当前识别结果中的剩余人数与上次识别结果中的剩余人数不同，则根据剩余人数的变化情况判断是否对识别结果进行处理。(1)当前检测到的剩余人数大于上次检测到的剩余人数，则需要再次确认识别结果。当前剩余人数的数量大于上次检测到的剩余数量，则说明本次的识别结果可能存在错误，如出现将“1”识别为“7”、将“0”识别为“8”的情况，此时需要再次确认识别结果。(2)当前检测到的剩余人数小于上次检测到的剩余人数，但是数量变化过大，也需要启动二次确认。举例而言，如剩余人数由“80”突然减为“10”，有可能出现将“7”识别为“1”的情况，此时需要再次确认识别结果。

本领域技术人员容易理解的是，进行容错处理时，可以将击杀人数的变化情况作为容错处理的依据。随着游戏的进行，击杀人数可能不变，也可能会增大，但是击杀人数不会减小，容错处理的依据为击杀人数或者其它游戏特征等的变化均属于本公开的保护范围，本示例实施例中对此不作特殊限定。

将加入容错处理的目标特征识别结果生成最终识别结果，并将最终识别结果推送到消息队列中，消息队列例如可以是rabbitMq消息队列，将最终识别结果按照键值对的形式存放，以便从消息队列中获取最终识别结果，并将最终识别结果相对应的视频内容推荐给与用户兴趣点一致的用户。将直播视频推荐给用户的方式可以例如是在平台首页的“标签位”向用户展示筛选出的优质视频，也可以是在每个视频画面中添加醒目的“特征标签”，便于用户通过这些“特征标签”选择自己想要观看的视频。参考图5和图6，图5和图6中示出了依据本视频推荐方法得到的推荐列表结果。

综上所述，首先，该视频推荐方法对获取到的直播视频进行转码后生成转码视频，对转码视频进行定期截图后确定直播视频的目标图像；其次，对目标图像中的预设元素进行位置识别，以确定目标图像中的目标区域；再次，在目标区域内对目标特征进行识别，并可以在识别结果中加入容错处理，生成最终识别结果；根据目标特征的最终识别结果将直播视频推荐给用户。一方面，通过此视频推荐方法，可以将视频帧的识别结果与用户的兴趣点相匹配，将符合用户兴趣点的视频推荐给相应用户，增强了用户的观看体验；另一方面，此视频推荐方法筛选出优质视频后通过特定方式将视频推荐给用户，可以有效地将新用户引流到一些优质视频的直播间，有利于网络视频播放平台的良性发展。

此外，在本示例实施例中，还提供了一种视频推荐装置。参考图7，该视频推荐装置700可以包括：目标图像确定模块710、目标区域确定模块720、目标特征识别模块730以及视频推荐模块740。

具体的，目标图像确定模块710可以用于确定直播视频的目标图像；目标区域确定模块720可以用于对所述目标图像中的预设元素进行位置识别，以确定所述目标图像中的目标区域；目标特征识别模块730可以用于在所述目标区域内对目标特征进行识别；视频推荐模块740可以用于根据所述目标特征推荐所述直播视频。

该视频推荐装置700可以对视频画面进行截图生成目标图像，通过对目标图像进行预设元素位置识别，确定出目标图像中的目标区域后，在目标区域中进行目标特征识别，根据所述目标特征推荐所述直播视频，是一种行之有效的视频推荐装置。

在本公开的另一示例性实施方式中，提供了视频推荐装置800。参考图8，该视频推荐装置相比于视频推荐装置700，除包括目标图像确定模块710、目标区域确定模块720、目标特征识别模块730以及视频推荐模块740外，还可以包括视频获取模块810。

具体的，视频获取模块810可以用于从上传方获取视频流；或从第三方网络获取视频流。

视频获取模块810获取的视频，后续将会基于获取的视频进行截图、识别等处理。

根据本公开的示例性实施例，参考图9，目标图像确定模块710可以包括目标图像生成单元910。

具体的，目标图像生成单元910可以用于获取由直播视频转码后生成的转码视频；将所述转码视频按照预设时间段进行截图，生成所述目标图像。

目标图像生成单元910可以对生成的转码视频进行定期截图生成目标图像。

根据本公开的一些示例性实施例，参考图10，目标区域确定模块720可以包括目标区域确定单元1010。

具体的，目标区域确定单元1010用于将所述目标图像输入至第一深度学习模型；如果所述目标图像存在所述预设元素，则将所述第一深度学习模型的输出作为目标图像中的目标区域。

目标区域确定单元1010可以判断目标图像中是否存在预设元素，若存在预设元素，则以一定的形式返回目标图像中的目标区域。

根据本公开的一些示例性实施例，参考图11，目标特征识别模块730可以包括目标特征识别单元1110。

具体的，目标特征识别单元1110可以用于将所述预设元素所处的位置区域输入至第二深度学习模型；确定所述第二深度学习模型基于所述目标特征的识别结果。

目标特征识别单元1110针对预设元素所处的位置区域进行目标特征识别，可以确定出目标特征的识别结果。

在本公开的又一示例性实施方式中，提供了视频推荐装置1200。参考图12，该视频推荐装置1200相比于视频推荐装置800，除包括目标图像确定模块710、目标区域确定模块720、目标特征识别模块730、视频推荐模块740以及视频获取模块810外，还可以包括结果推送模块1210。

具体的，结果推送模块1210可以用于对所述目标特征的识别结果进行容错处理，并确定最终识别结果；将所确定的最终识别结果推送到消息队列中。

结果推送模块1210将初步识别出的结果进行容错处理后，生成最终识别结果，并将最终识别结果推送到消息队列，便于后续从消息队列中获取最终识别结果。

根据本公开的又一示例性实施例，参考图13，结果推送模块1210可以包括容错处理单元1310。

具体的，容错处理单元1310可以用于如果在预设时间段内识别结果中的剩余人数未发生变化，则确认对识别结果进行处理；如果当前识别结果中的剩余人数与上次识别结果中的剩余人数不同，则根据剩余人数的变化情况判断是否对识别结果进行处理。

容错处理单元1310用于对目标特征的识别结果进行进一步的差错检测处理，以确保识别结果的准确性。

上述中各虚拟视频推荐装置模块的具体细节已经在对应的视频推荐方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了视频推荐装置的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

进一步地，在本公开的示例性实施例中，还提供了一种能够实现上述视频推荐方法的视频推荐系统，参考图14，该视频推荐系统1400可以包括代理服务器1410、转码服务器1420、拉流服务器1430、识别服务器1440、业务服务器1450等。

具体的，代理服务器1410可以用于接收上传方上传的视频流；转码服务器1420可以用于对从第三方网络获取的视频流以及从所述代理服务器获取的视频流进行转码；拉流服务器1430可以用于将所述第三方网络上的视频流传输到转码服务器；识别服务器1440可以用于对目标图像进行目标区域识别和目标特征识别，并确定最终识别结果，将所确定的最终识别结果推送到消息队列中；业务服务器1450可以用于获取所述消息队列中的最终识别结果，根据最终识别结果推荐所述直播视频。

该视频推荐系统1400可以对视频进行定期截图，生成目标图像，对目标图像进行预设元素位置识别，确定位置区域后进行目标特征识别，对识别出的初始结果加入容错处理后生成最终识别结果，如果一用户的兴趣点与最终识别结果相匹配，则将最终识别结果对应的视频推荐给该用户，是一种行之有效的视频推荐系统。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述视频推荐方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

下面参考图15来描述根据本发明的这种实施例的电子设备1500。图15显示的电子设备1500仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图15所示，电子设备1500以通用计算设备的形式表现。电子设备1500的组件可以包括但不限于：上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530、显示单元1540。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元1510执行，使得所述处理单元1510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

存储单元1520可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)1521和/或高速缓存存储单元1522，还可以进一步包括只读存储单元(ROM)1523。

存储单元1520还可以包括具有一组(至少一个)程序模块1525的程序/实用工具1524，这样的程序模块1525包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线1530可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备1500也可以与一个或多个外部设备1570(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备1500交互的设备通信，和/或与使得该电子设备1500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1550进行。并且，电子设备1500还可以通过网络适配器1560与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1560通过总线1530与电子设备1500的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1500使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

参考图16所示，描述了根据本发明的实施例的用于实现上述方法的程序产品1600，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims

1.一种视频推荐方法，其特征在于，包括：

确定直播视频的目标图像；其中，所述直播视频为游戏直播视频；

对所述目标图像中的预设元素进行位置识别，以确定所述目标图像中的目标区域；其中，所述预设元素为所述直播视频的直播画面中保持不变的元素；

在所述目标区域内对目标特征进行识别；其中，所述目标特征为所述游戏直播视频中指示游戏进度状态或者指示游戏成就的信息；

根据所述目标特征推荐所述直播视频。

2.根据权利要求1所述的视频推荐方法，其特征在于，确定直播视频的目标图像包括：

获取将直播视频转码后的转码视频；

将所述转码视频按照预设时间段进行截图，生成所述目标图像。

3.根据权利要求1所述的视频推荐方法，其特征在于，对所述目标图像中的预设元素进行位置识别包括：

将所述目标图像输入至第一深度学习模型；

如果所述目标图像存在所述预设元素，则将所述第一深度学习模型的输出作为所述目标区域。

4.根据权利要求1所述的视频推荐方法，其特征在于，在所述目标区域内对目标特征进行识别包括：

将所述目标区域输入至第二深度学习模型；

确定所述第二深度学习模型基于所述目标特征的识别结果。

5.根据权利要求4所述的视频推荐方法，其特征在于，所述视频推荐方法还包括：

对所述目标特征的识别结果进行容错处理，并确定最终识别结果；

将所确定的最终识别结果推送到消息队列中。

6.根据权利要求5所述的视频推荐方法，其特征在于，对所述目标特征的识别结果进行容错处理包括：

如果在预设时间段内识别结果中的剩余人数未发生变化，则确认对识别结果进行处理；

如果当前识别结果中的剩余人数与上次识别结果中的剩余人数不同，则根据剩余人数的变化情况判断是否对识别结果进行处理。

7.根据权利要求1所述的视频推荐方法，其特征在于，所述直播视频包括：

从上传方获取的视频流；或

从第三方网络获取的视频流。

8.一种直播视频推荐装置，其特征在于，包括：

目标图像确定模块，用于确定直播视频的目标图像；其中，所述直播视频为游戏直播视频；

目标区域确定模块，用于对所述目标图像中的预设元素进行位置识别，以确定所述目标图像中的目标区域；其中，所述预设元素为所述直播视频的直播画面中保持不变的元素；

目标特征识别模块，用于在所述目标区域内对目标特征进行识别；其中，所述目标特征为所述游戏直播视频中指示游戏进度状态或者指示游戏成就的信息；

视频推荐模块，用于根据所述目标特征推荐所述直播视频。

9.一种直播视频推荐系统，其特征在于，包括：

代理服务器，用于接收上传方上传的视频流；

转码服务器，用于对从第三方网络获取的视频流以及从所述代理服务器获取的视频流进行转码；其中，所述视频流为游戏直播视频；

拉流服务器，用于将所述第三方网络上的视频流传输到转码服务器；

识别服务器，用于对目标图像进行目标区域识别和目标特征识别，并确定最终识别结果，将所确定的最终识别结果推送到消息队列中；其中，所述目标区域识别是对所述目标图像中的预设元素进行位置识别，以确定目标图像的目标区域；所述预设元素为所述直播视频的直播画面中保持不变的元素；所述目标特征识别是在所述目标区域内对目标特征进行识别；所述目标特征为所述游戏直播视频中指示游戏进度状态或者指示游戏成就的信息；

业务服务器，用于获取所述消息队列中的最终识别结果，根据最终识别结果推荐所述直播视频。

10.一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据权利要求1至7中任一项所述的视频推荐方法。

11.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1至7中任一项所述的视频推荐方法。