CN114117126A

CN114117126A - 一种视频推荐方法及显示设备

Info

Publication number: CN114117126A
Application number: CN202111458616.XA
Authority: CN
Inventors: 陈将浩
Original assignee: Juhaokan Technology Co Ltd
Current assignee: Juhaokan Technology Co Ltd
Priority date: 2021-12-02
Filing date: 2021-12-02
Publication date: 2022-03-01

Abstract

本发明公开一种视频推荐方法及显示设备，属于推荐系统领域。所述方法包括：在接收到目标用户的短视频推荐请求时，调用推荐模型，所述推荐模型是根据长视频与短视频之间的相似性，利用长视频的先验知识进行迁移和融合后得到的训练模型；控制所述推荐模型进行预测并输出匹配所述目标用户的短视频推荐信息；显示所述短视频推荐信息。本申请通过将长视频领域的先验知识迁移至短视频领域，从而克服短视频推荐的冷启动问题，改善推荐系统性能。

Description

一种视频推荐方法及显示设备

技术领域

本发明涉及推荐系统技术领域，尤其涉及一种视频推荐方法及显示设备。

背景技术

终端中安装的某些应用配置有推荐系统，推荐系统用于根据用户行为、用户信息、库内标的物信息等内容，向用户推荐符合其兴趣偏好的标的物，例如对于视频应用，可以根据用户对视频的行为操作(比如点击、观看、收藏和分享等)，来分析用户可能感兴趣的视频类型，并从库内筛选并推荐与该视频类型相匹配的片源，这样既能满足用户观看相似或相关视频的需求，也能提升平台内资源的推广和运营。

例如在某些应用场景中，应用平台除提供长视频片源外，还支持用户自行上传的短视频资源，从而通过应用平台将短视频资源共享给其他用户。短视频一般是用户剪切的精彩片段，或是用户录制的个性化风格和主题的视频内容，因此短视频逐渐成为应用平台内另一类吸引用户浏览的标的物形式，应用平台的推荐系统也可根据用户偏好为其推荐可能感兴趣的短视频资源。然而对于应用平台内的新注册用户或视频观看行为不活跃的用户，推荐系统无法精准定位其兴趣偏好，而对于用户新发布的短视频，该短视频尚未或较少被用户观看，导致推荐系统无法精准匹配该短视频可能会被哪些用户喜欢，这些就是推荐系统经常会面临的“冷启动”问题。

发明内容

为解决上述背景技术中短视频推荐的冷启动问题，本发明提供一种视频推荐方法及显示设备。

第一方面实施例提供的显示设备，包括：

显示器，用于显示推荐视频；

控制器，用于执行：

在接收到目标用户的短视频推荐请求时，调用推荐模型，所述推荐模型是根据长视频与短视频之间的相似性，利用长视频的先验知识进行迁移和融合后得到的训练模型；

控制所述推荐模型进行预测并输出匹配所述目标用户的短视频推荐信息；

控制所述显示器显示所述短视频推荐信息。

第二方面实施例提供的视频推荐方法，包括：

显示所述短视频推荐信息。

在本申请提供的技术方案中，预先训练一推荐模型，该推荐模型是利用长视频与短时频之间的相似性，例如相似的视频类型、主题等，将各长视频积累的先验知识迁移给与其最相似的短视频，这里所述先验知识可包括与长视频产生关联的用户及其行为，用户行为包括但不限于观看、收藏和分享长视频，假设“电影A”这一长视频被用户甲点击观看过，则进行迁移学习后，认为用户甲可能会对“电影A中演员乙的cut片段”“电影A精彩回顾”、“电影A影评”等相似短视频具有同样的兴趣偏好，然后对迁移后的模型和旧有先验知识模型进行融合，得到最终的推荐模型。

用户可访问应用平台中指定的短视频推荐页面，或者在起播当前视频时，在当前视频播放界面的指定位置处同步显示推荐板块，推荐板块中向用户展示推荐的相关短视频，因此在接收到目标用户的短视频推荐请求时，调用推荐模型进行预测处理，推荐模型最终输出匹配于目标用户兴趣偏好的短视频推荐信息，并在推荐页面或推荐板块中显示短视频推荐信息，使得用户可以从该推荐信息中快速筛选出期望观看的短视频。本申请通过将长视频领域的先验知识迁移至短视频领域，从而克服短视频推荐的冷启动问题，改善推荐系统性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要访问的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据一些实施例的显示设备的使用场景；

图2示出了根据一些实施例的控制装置100的硬件配置框图；

图3示出了根据一些实施例的显示设备200的硬件配置框图；

图4示出了根据一些实施例的显示设备200中软件配置图；

图5示出了根据一些实施例的显示设备200中应用程序的图标控件界面显示图；

图6中示例性示出了推荐页面的显示示意图；

图7中示例性示出了视频播放界面(非全屏模式)显示推荐板块的示意图一；

图8中示例性示出了视频播放界面(非全屏模式)显示推荐板块的示意图二；

图9中示例性示出了视频播放界面(全屏模式)显示推荐板块的示意图；

图10中示例性示出了视频播放界面(非全屏模式)显示推荐板块的示意图二；

图11中示例性示出了推荐模型的训练逻辑图；

图12中示例性示出了一种视频推荐方法的流程图。

具体实施方式

为使本申请的目的和实施方式更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

图1为根据实施例中显示设备的使用场景的示意图。如图1所示，显示设备200还与服务器400进行数据通信，用户可通过智能设备300或控制装置100操作显示设备200。

在一些实施例中，控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式中的至少一种，通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令，来控制显示设备200。

在一些实施例中，智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑，AR/VR设备等中的任意一种。

在一些实施例中，也可以使用智能设备300以控制显示设备200。例如，使用在智能设备上运行的应用程序控制显示设备200。

在一些实施例中，也可以使用智能设备300和显示设备进行数据的通信。

在一些实施例中，显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制，例如，可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制，也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。

在一些实施例中，显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。

在一些实施例中，一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的，服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行，反之亦然。

图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起用用户与显示设备200之间交互中介作用。

在一些实施例中，通信接口130用于和外部通信，包含WIFI芯片，蓝牙模块，NFC 或可替代模块中的至少一种。

在一些实施例中，用户输入/输出接口140包含麦克风，触摸板，传感器，按键或可替代模块中的至少一种。

图3示出了根据示例性实施例中显示设备200的硬件配置框图。

在一些实施例中，显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。

在一些实施例中控制器包括中央处理器，视频处理器，音频处理器，图形处理器，RAM，ROM，用于输入/输出的第一接口至第n接口。

在一些实施例中，显示器260包括用于呈现画面的显示屏组件，以及驱动图像显示的驱动组件，用于接收源自控制器输出的图像信号，进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。

在一些实施例中，显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种，还可以为一种投影装置和投影屏幕。

在一些实施例中，调谐解调器210通过有线或无线接收方式接收广播电视信号，以及从多个无线或有线广播电视信号中解调出音视频信号，如以及EPG数据信号。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如：通信器可以包括Wifi模块，蓝牙模块，有线以太网模块等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。

在一些实施例中，检测器230用于采集外部环境或与外部交互的信号。例如，检测器230包括光接收器，用于采集环境光线强度的传感器；或者，检测器230包括图像采集器，如摄像头，可以用于采集外部环境场景、用户的属性或用户交互手势，再或者，检测器230包括声音采集器，如麦克风等，用于接收外部声音。

在一些实施例中，外部装置接口240可以包括但不限于如下：高清多媒体接口接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器260上显示UI对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。

在一些实施例中控制器包括中央处理器(Central Processing Unit，CPU)，视频处理器，音频处理器，图形处理器(Graphics Processing Unit，GPU)，RAM(Random AccessMemory，RAM)，ROM(Read-Only Memory，ROM)，用于输入/输出的第一接口至第n 接口，通信总线(Bus)等中的至少一种。

CPU处理器。用于执行存储在存储器中操作系统和应用程序指令，以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。CPU处理器，可以包括多个处理器。如，包括一个主处理器以及一个或多个子处理器。

在一些实施例中，图形处理器，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象；还包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器，用于将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中，解复用模块，用于对输入音视频数据流进行解复用处理。视频解码模块，用于对解复用后的视频信号进行处理，包括解码和缩放处理等。图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。帧率转换模块，用于对转换输入视频帧率。显示格式化模块，用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出RGB数据信号。

在一些实施例中，音频处理器，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理中的至少一种，得到可以在扬声器中播放的声音信号。

在一些实施例中，用户可在显示器260上显示的图形用户界面(GUI)输入用户命令，则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，“用户界面”，是应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface，GUI)，是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素，其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素中的至少一种。

在一些实施例中，用户接口280，为可用于接收控制输入的接口(如：显示设备本体上的实体按键，或其他等)。

在一些实施例中，显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构，它们让用户可以管理文件、运行程序并使用系统。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后，再加载Shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

参见图4，在一些实施例中，将系统分为四层，从上至下分别为应用程序(Applications) 层(简称“应用层”)，应用程序框架(Application Framework)层(简称“框架层”)，安卓运行时 (Android runtime)和系统库层(简称“系统运行库层”)，以及内核层。

在一些实施例中，应用程序层中运行有至少一个应用程序，这些应用程序可以是操作系统自带的窗口(Window)程序、系统设置程序或时钟程序等；也可以是第三方开发者所开发的应用程序。在具体实施时，应用程序层中的应用程序包不限于以上举例。

框架层为应用程序层的应用程序提供应用编程接口(application programminginterface，API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心，这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口，可在执行中访问系统中的资源和取得系统的服务。

如图4所示，本申请实施例中应用程序框架层包括管理器(Managers)，内容提供者(Content Provider)等，其中管理器包括以下模块中的至少一个：活动管理器(ActivityManager)用与和系统中正在运行的所有活动进行交互；位置管理器(Location Manager)用于给系统服务或应用提供了系统位置服务的访问；文件包管理器(Package Manager) 用于检索当前安装在设备上的应用程序包相关的各种信息；通知管理器(NotificationManager)用于控制通知消息的显示和清除；窗口管理器(Window Manager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。

在一些实施例中，活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能，比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序，比如获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕，控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。

在一些实施例中，系统运行库层为上层即框架层提供支撑，当框架层被使用时，安卓操作系统会运行系统运行库层中包含的C/C++库以实现框架层要实现的功能。

在一些实施例中，内核层是硬件和软件之间的层。如图4所示，内核层至少包含以下驱动中的至少一种：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB 驱动、HDMI驱动、传感器驱动(如指纹传感器，温度传感器，压力传感器等)、以及电源驱动等。

在一些实施例中，显示设备启动后可以直接进入预置的视频点播程序的界面，视频点播程序的界面可以如图5中所示，至少包括导航栏510和位于导航栏510下方的内容显示区，内容显示区中显示的内容会随导航栏中被选中控件的变化而变化。应用程序层中的程序可以被集成在视频点播程序中通过导航栏的一个控件进行展示，也可以在导航栏中的应用控件被选中后进行进一步显示。

在一些实施例中，显示设备启动后可以直接进入上次选择的信号源的显示界面，或者信号源选择界面，其中信号源可以是预置的视频点播程序，还可以是HDMI接口，直播电视接口等中的至少一种，用户选择不同的信号源后，显示器可以显示从不同信号源获得的内容。

以上实施例介绍了显示设备的硬件/软件架构以及功能实现等内容，对于与该显示设备相同或相似的终端，一种示例性的应用场景中，如图6的示例，应用平台中可以创建专门的推荐页面，例如在视频点播程序的界面中的导航栏510中增设如“推荐”、“猜你喜欢”等类似的控件，例如用户点击图6中的第一推荐控件61，即可进入推荐页面60，推荐页面60中向用户显示由推荐系统进行大数据建模后，预测输出的符合用户兴趣偏好的推荐信息62。

在一种示例性的实现方式中，推荐页面可以按照预设模板进行显示，所述预设模板包括推荐信息的数量、优先级、排版布局等，使推荐页面按照预设的板式展示给用户，用户可通过如翻页、滑动等操作形式来切换推荐信息62。

在一种示例性的实现方式中，可以设置焦点，并且该焦点可跟随用户切换推荐信息的动作而同步移动，从而使用户准确定位当前被选中的目标推荐信息。可选地，具有焦点的推荐信息一般需要作醒目处理，例如将该推荐信息做高亮处理、适度放大该推荐信息等，使焦点与非焦点有较为突出的对比，便于用户分辨。

在一种示例性的实现方式中，以图6中的推荐信息62为示例，每项推荐信息62可包括预览图像、视频信息和播放控件等。其中，预览图像是从视频中任意选取的一帧图像并作缩略处理后的，预览图像可以是预设帧，也可以是在生成推荐信息时从视频中随机摘取的一帧；视频信息包括但不限于视频时长、视频名称、视频内容简介等，以便用户快速了解所推荐的视频的简要信息，并筛选出期望观看的目标视频；播放控件链接于整体的推荐信息62，例如当用户点击在目标推荐信息上任意位置处，或者用户在焦点跳至目标推荐信息上时点击确认键，均可触发播放控件，跳转至目标视频的播放界面，从而起播所述目标视频。

在另一种示例性的应用场景中，用户点击观看视频，当前视频可以全屏模式或非全屏模式播放，图7和图8中视频都是以小窗模式播放，视频播放界面除显示视频画面外，还显示进度条、已播时长/视频时长、同时设置有播放/暂停控件、倍速调节控件、画质清晰度调节控件、下载控件、分享控件、收藏控件、以及窗口调节控件等功能控件，其中窗口调节用于将窗口由小窗切换至全屏，或由全屏切换为小窗。在图7示例的形式中，当前视频在画面左侧播放，画面右侧提供一推荐板块70，推荐板块70中显示推荐系统预测输出的各项推荐信息，例如推荐板块70可以按列展示各项推荐信息，用户通过上下滑动来切换推荐信息；在图8示例的另一形式中，推荐板块70可在视频下方按行展示，用户通过左右滑动来切换推荐信息。该实施例实现用户在观看当前视频时，还能同步浏览应用平台推荐的视频。

在7(b)中视频是以全屏模式播放，参照图9的子图(a)，全屏播放界面中可设置第二推荐控件71，用户触发第二推荐控件71，则UI变换为图9的子图(b)的效果，即可在不退出全屏模式下显现推荐板块70，推荐板块70可以在预设位置处被弹出。可选地，推荐板块70还可以通过指定的操作被隐藏，例如用户再次触发推荐控件，用户双击视频界面、或者推荐板块70显示预设时长后用户未响应等，推荐板块70的显示和隐藏方式不限于本实施例。

在一种示例性的实现方式中，以视频采用非全屏模式播放为例，在不滑动切换推荐信息的形式下，推荐板块70能够显示的推荐信息数量有限，为方便用户快速切换和浏览推荐信息，UI可设置如翻页、换批等类似的切换模式，参照图10的子图(a)，例如推荐板块70中可设置换一批控件72，推荐系统将其预测结果进行排序后，将排序在前N位的短视频信息组成首批推荐信息集，并将首批推荐信息集加载显示于推荐板块70中，其中N为推荐板块70允许单批推荐视频的最大数量；用户若在首批推荐信息集中未浏览到想要观看的视频，则触发换一批控件72，推荐信息会将排序到第N+1位～第2N位的短视频信息组成第二批推荐信息集，之后对推荐板块70进行刷新，UI可变换至如图10的子图(b)所示效果，使推荐板块70显示第二批推荐信息集。图10中是以N等于4为例，则首批推荐信息集显示第1位～第4位的短视频信息，用户触发“换一批”后，推荐板块刷新为显示第5～第8位的短视频信息。

在一种示例性的实现方式中，在显示首批推荐信息集之后，对用户触发换一批控件 72的累积次数进行计数，并记录计数值为M，其中M大于或等于1，则推荐系统在接收到第M次换一批操作指令时，提取出排序在第(M*N+1)位～第(M+1)*N位的短视频信息，组成第M+1批(包括首批在内)的推荐信息集，并对推荐板块70进行刷新，使推荐信息集由原第M批切换至第M+1批。前述图6示例的推荐页面中也可采用通过换一批/翻页等类似操作来快捷切换推荐信息的模式，不再赘述。

以上是在推荐系统输出推荐信息后，终端显示推荐信息的多种实现模式，本申请提供的UI及其操作流程仅仅是示例性的，具体以实际产品的设计和应用为准，并且显示推荐信息的模式不限于本申请的示例。

在一些终端应用场景中，例如应用平台中可以提供长视频片源，例如一些电影、电视剧、综艺、电竞游戏等，还可支持用户自行上传短视频资源，例如用户可以剪辑长视频的精彩片段，或者在终端拍摄或录制的短视频，并借助同一应用平台进行发布并共享给其他用户观看，对于应用平台内的新注册用户或视频观看行为不活跃的用户，推荐系统无法精准定位其兴趣偏好，而对于用户新发布的短视频，该短视频尚未或较少被用户观看，导致推荐系统无法精准匹配该短视频可能会被哪些用户喜欢，这些就是推荐系统经常会面临的“冷启动”问题。又例如，某运营商之前开发并运营某款长视频应用平台，后续打算再开发一款全新的短视频应用平台，这就涉及场景和领域的扩展，新开发的短视频应用平台不可避免地也会遭遇冷启动问题。

目前推荐系统使用的推荐算法中，较多依赖于长期的数据积累，短期或遇到冷启动问题时推荐效果不足，而常规迁移学习算法虽然可能克服冷启动，但却要求训练模型在新旧领域中的特征完全一致，在跨域推荐中具有一定的局限性。对此，本申请提供一种根据长视频和短视频之间的相似性，利用长视频的先验知识进行迁移和融合后训练得到的推荐模型，将该推荐模型应用于终端的推荐系统中，实现利用长视频跨域推荐短视频，从而解决短视频推荐的冷启动问题，迁移后的训练模型更加适应新场景、新领域的要求。

在一种示例性的实现方式中，在推荐系统投入使用之前，预先对推荐模型进行训练，图11示例推荐模型的训练逻辑，主要包括三个方面：

第一方面，根据每个用户的用户特征、对长视频的行为标签以及长视频特征，训练第一排序模型F₁。

在一种示例性的实现方式中，用户特征可从用户注册时填写的个人信息中提取，例如包括用户名/用户ID、所在地、年龄等在视频推荐中所需的用户信息特征。行为记录是用户在对长视频做出兴趣意向行为时生成的，例如用户点击观看长视频、下载、收藏或分享长视频等，其中用户切实观看过长视频的行为相对来说更能表达用户的兴趣偏好，所述行为标签是行为记录中包含的指示性信息，比如指示观看或未观看过某长视频。为实现旧领域向新领域迁移学习，使迁移后的模型更好地适应新领域，计算第一排序模型时所使用的长视频特征采用长短视频的共有特征，而非差异特征，例如共有特征为视频时长、视频标题、视频分类等，差异特征例如长视频有导演、演员等演职员信息，短视频则体现为发布者信息。

第二方面，计算与每个短视频特征相似性最高的目标长视频特征，并将所述目标长视频特征对应的行为标签迁移至所述短视频特征，从而训练出第二排序模型F₂。

在一种示例性的实现方式中，显示设备可以根据长视频的入库和离库状态，来维护一个长视频集

其中i用于表示长视频的序号，n_L为长视频集中包括的视频数量，itemL_i用于表示第i个长视频。

在一种示例性的实现方式中，显示设备可以根据短视频的发布和撤销，来维护一个短视频集

其中j用于表示短视频的序号，n_S为短视频集中包括的视频数量，itemS_j用于表示第j个短视频。

在一种示例性的实现方式中，计算每个itemS_j与长视频集中的各个itemL_i的相似度，并筛选出与itemS_j相似度最高的目标长视频itemL_j0，其中j0表示目标长视频在长视频集中的序号，从而构建长短视频的迁移关联(itemS_j，itemL_j0)，即迁移前为 (u_k,itemL_j0,label_k,j0)，迁移后为(u_k,itemS_j,label_k,j0)，其中(u_k,itemL_j0,label_k,j0)用于表示用户u_k对目标长视频itemL_j0所产生的行为标签label_k,j0，label_k,j0∈{0,1}，当label_k,j0＝0 时表明用户u_k未观看过目标长视频itemL_j0，当label_k,j0＝1时表明用户u_k观看过目标长视频itemL_j0。通过这种方式，将短视频与其最相似的目标长视频建立行为偏好的迁移关联，从而实现对未知领域短视频的推荐预测，并解决短视频推荐的冷启动问题。

第三方面，将第一排序模型F₁和第二排序模型F₂进行加权融合，生成并存储所述推荐模型y。

其中，所述推荐模型y＝w₁*F₁+w₂*F₂，其中，w₁为第一加权系数，表征第一排序模型F₁的权重，w₂为第二加权系数，表征第二排序模型F₂的权重。w₁和w₂可根据实际要求进行参数调整，例如若更偏重迁移后的排序模型，则将w₂相对调大，将w₁相对调小；若更偏重旧有知识，则将w₁相对调大，将w₂相对调小。

在一些实施例中，加权融合后的推荐模型可输出一个综合的推荐得分，推荐得分可用于评估短视频被点击观看的概率和可能性。例如推荐模型y的预测结果示例性地表达为(Score_p，itemS_p)，其中p表示预测结果中待推荐的短视频信息itemS_p的序号，Score_p表示短视频信息itemS_p的推荐得分，一般来说，推荐得分越高，短视频信息被推荐的优先级越高，因此推荐系统可以按照得分高低对预测结果进行排序，并优先显示得分较高的短视频信息，以提升短视频推荐与用户偏好的匹配度。

本申请下文将对图11所示推荐模型的训练逻辑进行更细节性地说明。在一些示例性的实现方式中，假设用户集

其中n表示用户集中包括的用户数量，在实际用户集管理时，应用平台每新注册一个用户，就在用户集中新增该用户信息，长视频集

短视频集

用户对长视频集的行为标签数据表达为 {(u_i,itemL_j,label_i,j)}i＝1,2…n；j＝1,…n_L，label_i,j∈{0,1}，当label_i,j＝0时表明用户u_i未观看过长视频itemL_j，当label_i,j＝1时表明用户u_i观看过长视频itemL_j，即对于迁移学习来说，长视频属于已知的旧领域，积累有先验知识，而短视频则属于未知的新领域。

在一些示例性的实现方式中，对于长视频和短视频，它们具有相同的特征交集，即共有特征，例如长短视频都涉及视频时长、视频标题、视频分类、视频内容简介等信息特征；长短视频还具有差异特征，即非交集特征，例如长视频具有导演、演员等演职员信息，短视频则具有发布者信息、长传时间等。长视频特征集f_L＝V₁∪V₂，短视频特征集 f_S＝V₂∪V₃，其中V₂为长短视频的共有特征，V₁为包含于长视频内的差异特征，V₃为包含于短视频内的差异特征，也即V₂＝f_L∩f_S，V₁＝f_L-f_S，V₃＝f_S-f_L。

在一些示例性的实现方式中，为便于后续模型训练和运算，需要将所有特征进行向量化表示，可选地，对于离散型特征，可使用如one-hot(独热)、multi-hot(多热)等编码形式，编码后其每一维度都可以看做是连续特征；对于稠密型特征，经过归一化处理后拼成一稠密向量，向量化处理方式不限定于此。V₁、V₂和V₃的特征向量表示为：

其中，q、l和m分别为V₁、V₂和V₃特征向量化后的维度，上述向量中任一维度的元素值处于[0,1]。特征向量化之后，计算长短视频之间的相似性，可选地，按照如下公式计算长短视频的余弦相似度：

上述公式中

为长视频集中itemL_i的共有特征向量，此处i＝1,…n_L；

为短视频集中 itemS_j的共有特征向量，j＝1,…n_S，

为

中第t维度的元素值，

为

中第t维度的元素值，t＝1,…l；sim(i,j)为itemL_i与itemS_j的余弦相似度。

根据长视频集合短视频集，需要计算n_L*n_S次余弦相似度，由于实际场景中n_L和n_S可达百万甚至千万量级，运算量较大，为提高运算和训练速率，在一种可选方案中，采用LSH(Locality Sensitivity Hashing，局部敏感哈希)算法，来查找与每个短视频itemS_j相似性最高的目标长视频itemL_j0。LSH的基本思想是在Min Hashing(最小哈希) 所得的signature向量的基础上，将每个向量分为若干段(称之为band)，每个band包含多行，如果两个向量的其中一个或多个band相同，则这两个向量可能相似度较高，相同的 band数越多，其相似度高的可能性就越大，因此LSH可以在各短视频的signature向量的每一个band上分别进行哈希分桶，在任意一个band上被分到同一个桶内的对象就互为候选相似集，这样只需要计算所有候选相似集的余弦相似度，即可找到每个短视频对应的相似长视频集，从相似长视频集中获取与短视频相似度最大的长视频，作为所述目标长视频。LSH能通过分桶模式，将可能相似的对象以较大概率分到同一个桶内，这样每个候选相似集就会相对较小，实现从海量数据中快速检索和匹配出相似数据，能降低运算复杂度。

在匹配出与每个短视频itemS_j相似性最高的目标长视频itemL_j0之后，用户对长视频的行为为(u_k,itemL_j0,label_k,j0)，label_k,j0∈{0,1}，当label_k,j0＝0时表明用户u_k未观看过目标长视频itemL_j0，当label_k,j0＝1时表明用户u_k观看过目标长视频itemL_j0，通过最相似长短视频之间的兴趣迁移，获取短视频itemS_j与用户u_k间的行为交互(u_k,itemS_j,label_k,j0)，这就是各用户在短视频这一新领域中被赋予的行为标签数据，也是后续计算第二排序模型 F₂时所需使用的关键数据。

在一些示例性的实现方式中，根据用户集获取每个用户的用户特征，用户特征包括但不限于用户名/用户ID、所在地、年龄、性别等，并对用户特征进行向量化表示，得到用户特征向量

其中k标识用户序号，k＝1,…n，r为用户特征向量的维度，U_k向量中任一维度的元素值∈[0,1]。短视频特征集f_S＝V₂∪V₃，将短视频特征进行向量化表示为

其中j标识短视频序号，j＝1,…n_S，Vs_j被迁移的行为标签数据为label_k,j，label_k,j∈{0,1}，当label_k,j＝0时指示用户u_k未观看过Vs_j对应的短视频，当label_k,j＝1时指示用户u_k观看过Vs_j对应的短视频。将U_k、Vs_j和label_k,j组合成第二向量U₂，即

将U₂作为训练样本，利用如深度学习、神经网络等算法模型，训练第二排序模型F₂。

在一种可选的方案中，可利用DCN(Deep Cross Network，深度交叉网络)算法，训练CTR(Click-Through-Rate，点击率)预估模型，从而得到第二排序模型F₂。DCN 的底层是Embedding and stacking layer(嵌入和堆叠层)，包括Embed和Stack两项功能，其中Embed功能主要处理离散特征(例如类别型特征)，将离散特征转换成实数值的稠密向量，stack功能用于处理连续型特征，将连续型特征归一化后，再与嵌入层的向量进行堆叠，从而形成原始的输入向量，第二向量U₂即可在DCN的Embedding and stacking layer中生成，并被传输给上层的Cross Network&Deep Network进行运算。

DCN的中间层包括并行的Cross Network&Deep Network，Cross Network是DCN的核心，Cross Network用于高效地应用显式的交叉特征，由于Cross Network的参数比较少，导致其表达能力受限，为了能够学习高阶非线性的组合特征，DCN中引入了并行的 DeepNetwork，Deep Network是一个全连接的前馈神经网络，层数可适当设置。Cross Network&Deep Network的具体训练方式可参照现有技术描述，本申请不再赘述。

DCN的顶层为Combination Layer(拼接层)，用于将Cross Network和DeepNetwork 的输出结果进行拼接，然后经过加权求和后得到logits，然后输入到标准的逻辑回归函数 (例如sigmoid、softmax等)得到归一化后的预测概率p₂(即CTR)∈[0,1]，基于第二向量U₂的输入，以及DCN模型训练，最终得到迁移后的新模型为y₂＝F₂

预测概率p₂表征模型F₂预测的用户点击观看短视频的概率。模型F₂主要侧重迁移后的短视频新场景，该模型以其输出概率为推荐得分提供参考，从而便于最终决策短视频信息的推荐和分发。

在一些示例性的实现方式中，为充分利用旧领域的先验知识，可以将迁移前的模型融合到新领域中，从而为短视频推荐提供另一角度的参考策略。对于迁移前长视频领域的旧模型，长视频特征集f_L＝V₁∪V₂，将长视频特征进行向量化表示为

其中w标识长视频序号，w＝1,…n_L，

对应的行为标签数据为label_k,w，label_k,w∈{0,1}，当label_k,w＝0时指示用户u_k未观看过

对应的长视频，当label_k,w＝1时指示用户u_k观看过

对应的长视频。将U_k、

和label_k,w组合成向量U₀，即

将U₀作为训练样本，利用前述DCN模型进行训练，得到迁移前旧领域的原预测模型为

在一些示例性的实现方式中，由于V₁特征是长视频领域包含的差异特征，短视频领域不包含V₁特征，为使旧领域模型能适应新领域，因此仅使用长短视频的共有特征V₂，并结合用户对长视频的交互行为，来重新训练旧模型，即以第一向量

作为训练样本，输入至DCN模型的中间层进行运算，直至DCN的顶层Combination Layer输出归一化后的预测概率p₁(即CTR)∈[0,1]，基于第一向量U₁的输入，以及DCN模型训练，最终得到迁移前旧领域重新训练的模型为

预测概率p₁表征模型F₁预测的用户点击观看短视频的概率。模型F₁主要侧重迁移前长视频领域的旧有知识，该模型以其输出概率为推荐得分提供另一个方向的参考，从而便于最终决策短视频信息的推荐和分发。

在得到模型F₁和模型F₂之后，将两个模型进行加权融合，生成推荐模型y，即推荐模型y＝w₁*F₁+w₂*F₂，其中w₁为第一加权系数，表征第一排序模型F₁的权重，w₂为第二加权系数，表征第二排序模型F₂的权重。w₁和w₂均可根据实际要求进行参数调整，例如若更偏重迁移后的模型，则将w₂相对调大，将w₁相对调小；若更偏重旧领域知识，则将w₁相对调大，将w₂相对调小。推荐模型生成后，存储于本地内存，在用户请求推荐短视频时，即可调用推荐模型进行预测并返回输出结果。

在一种示例性的实现方式中，前述生成的推荐模型并不是一成不变的，而是可以根据用户和应用平台的动态而进行更新，例如根据输入变量来更新推荐模型中的参数配置，使推荐模型不断进化，使新旧领域知识不断积累和丰富，提升推荐信息与用户偏好的匹配度。

在一种示例性的实现方式中，终端可以监控并记录用户行为动态，这里所述的用户行为包括但不限于：用户注册并登录账号(涉及用户集的更新)、用户对长视频的行为(可能涉及旧领域知识、label数据的变化)、用户对短视频的行为(涉及新领域知识、label数据的变化)，以及，用户对短视频推荐信息的响应状态等，所述响应状态包括点击或未点击推荐信息，所述响应状态可以在一定程度上反映推荐的准确性、推荐信息是否与用户的兴趣偏好相匹配。可选地，通过构建模型的损失函数Loss，来表达预测值与实际值的偏差，通过对模型进行优化和校准，使损失降低，提升推荐模型的预测精度。

在一种示例性的实现方式中，终端还可以监控应用平台动态，例如监控应用平台中长视频的入库和离库状态(涉及到长视频集的更新)、短视频的发布和撤销状态等(涉及到短视频集的更新)，其中长视频和短视频可以是同一应用平台中的不同领域，或者，长视频和短视频分属不同的应用平台，例如某运营商开发了长视频领域对应的应用平台1，之后可以应用平台1的领域知识为参考，开发短视频领域对应的应用平台2，并将旧领域知识迁移及融合到应用平台2，从而在应用平台2中实现短视频推荐。

在一种示例性的实现方式中，终端根据用户行为动态和应用平台动态的变化，对推荐模型实施更新。可选地，根据一定时间内(例如12小时、24小时)用户和应用平台的动态变化累积，对推荐模型进行定期更新。

由以上技术方案可知，本申请利用长短视频间的相似性进行新旧领域间的迁移学习，不仅解决了短视频推荐的冷启动问题，还能克服常规迁移学习中必须保证新旧领域特征一致的局限性，相似性查找具备一定程度的相似召回特性，因此迁移后模型具有一定程度的召回率，将旧领域模型适应性融合到新领域的推荐预测中，有利于提升短视频推荐的匹配度，推荐模型能良好适应新领域，并且推荐模型支持离线训练，因此本申请从多方面改进了推荐系统的性能。

在一种示例性的实现方式中，基于前述视频推荐方式及其涉及的UI内容，以及推荐模型的训练和生成方案，参照图12的示例，本申请还提供一种视频推荐方法，所述视频推荐方法具体由运行于控制器中的推荐系统执行，所述方法包括如下步骤：

步骤S1，在接收到目标用户的短视频推荐请求时，调用推荐模型。

所述推荐模型是根据长视频与短视频之间的相似性，利用长视频的先验知识进行迁移和融合后得到的训练模型，推荐模型的训练及生成方式已在前文作出了详细描述，此处不再赘述。

步骤S2，控制所述推荐模型进行预测并输出匹配所述目标用户的短视频推荐信息。

可选地，推荐模型按照预设的优先级规则，自动对预测结果进行排序，得到所述短视频推荐信息；所述预测结果包括至少一个短视频信息。所述优先级规则例如是按照预测概率排序、按照短视频热度排序、按照短视频发布时间排序等等，所述优先级规则可以根据实际要求进行设置。

可选地，推荐模型自动按照推荐得分对预测结果进行排序，例如采用降序，即推荐得分从高到低进行排序。若采用如翻页、换批等类似方式来切换推荐信息，则根据单批/ 单页能够推荐短视频的预设数量N，以及当前累积触发的换批/翻页操作的次数M，来提取相应序位的N个短视频信息，组成第M+1批/页的短视频推荐信息(包括首批在内)，并刷新推荐页面/推荐板块70的显示批次/页。

步骤S3，控制显示器显示所述短视频推荐信息。短视频推荐信息的显示方式及UI已在前文作出了详细描述，此处不再赘述。

在理解本申请长视频→短视频的迁移学习及融合的推荐模型训练机制下，所采取的模型算法不限于DCN，还可采用其他适用于推荐系统的算法，如FM(FactorizationMachines，因子分解机)模型、Wide&Deep模型、PNN(Product-based Neural Network，基于产品的神经网络)模型、NFM(Neural Factorization Machine，神经因子分解机)模型、AutoInt等，这些模型算法均可参照现有技术。另外，推荐模型中涉及的如相似度、向量化等参数的运算方式也不局限于本申请的示例。

本申请主要侧重视频推荐，即标的物类型为视频，迁移学习中的旧领域为长视频，新领域为短视频。作为应用场景的扩展和延伸，新旧领域也可涉及其他标的物类型，例如标的物类型为音频，迁移学习中旧领域为歌曲，新领域为铃声，也可基于本申请的推荐机制，根据用户听歌行为，为用户推荐符合其兴趣偏好的终端铃声。标的物类型改变不影响推荐系统的训练和预测机制，差异仅仅体现在模型所需的训练样本数据不同。

在一种实施例中，本发明还提供一种计算机存储介质，该计算机存储介质可存储有程序。当计算机存储介质位于显示设备中时，该程序执行时可包括控制器被配置执行的视频推荐方法、推荐模型训练方法所涉及的程序步骤。其中，计算机存储介质可为磁碟、光盘、只读存储记忆体(英文：Read-Only Memory，简称ROM)或随机存储记忆体(英文：RandomAccess Memory，简称RAM)等。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims

1.一种显示设备，其特征在于，包括：

显示器，用于显示推荐视频；

控制器，用于执行：

控制所述显示器显示所述短视频推荐信息。

2.根据权利要求1所述的显示设备，其特征在于，所述控制器还用于执行：

根据每个用户的用户特征、对长视频的行为标签以及长视频特征，训练第一排序模型；其中，所述行为标签用于指示用户是否点击观看所述长视频；

计算与每个短视频特征相似性最高的目标长视频特征，并将所述目标长视频特征对应的行为标签迁移至所述短视频特征，从而训练出第二排序模型；

将所述第一排序模型和所述第二排序模型进行加权融合，生成并存储所述推荐模型。

3.根据权利要求1或2所述的显示设备，其特征在于，所述推荐模型还被配置为：

对所述推荐模型的预测结果进行优先级排序，得到所述短视频推荐信息；所述预测结果包括至少一个短视频信息。

4.根据权利要求1或2所述的显示设备，其特征在于，所述控制器还用于执行：

获取所述推荐模型按照得分降序排序后输出的预测结果，所述预测结果包括至少一个短视频信息；

提取出排序在前N位的短视频信息，组成首批短视频推荐信息；其中，N为预设数量，用于表征推荐页面允许单批推荐短视频的最大数量。

5.根据权利要求4所述的显示设备，其特征在于，所述控制器还用于执行：

在接收到目标用户触发的第M次换一批操作时，提取出排序在第(M*N+1)位～第(M+1)*N位的预测结果，组成第M+1批短视频推荐信息；其中M为用户在所述推荐页面执行所述换一次操作的累积计数；

控制显示器将推荐页面中显示的短视频推荐信息由第M批切换至第M+1批。

6.根据权利要求2所述的显示设备，其特征在于，所述控制器用于按照如下方式训练所述第一排序模型：

从所述长视频特征中提取出与短视频特征的共有特征；

将所述共有特征、所述用户特征和行为标签数据进行向量化处理，并组合成第一向量；

以所述第一向量作为训练样本，利用深度交叉网络算法，训练点击率预估模型，作为所述第一排序模型。

7.根据权利要求2所述的显示设备，其特征在于，所述控制器用于按照如下方式训练所述第二排序模型：

将所述短视频特征、所述用户特征和所述目标长视频特征迁移的行为标签数据进行向量化处理，并组合成第二向量；

以所述第二向量作为训练样本，利用深度交叉网络算法，训练点击率预估模型，作为所述第二排序模型。

8.根据权利要求2所述的显示设备，其特征在于，所述控制器还用于执行：

监控用户注册行为、长视频的入库和离库状态、短视频的发布和撤销状态、用户对所述短视频推荐信息的响应状态、以及用户对库内各长短视频的行为记录，并对所述推荐模型进行更新。

9.一种视频推荐方法，其特征在于，包括：

显示所述短视频推荐信息。

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：