WO2021036344A1

WO2021036344A1 - 摘要生成方法和装置

Info

Publication number: WO2021036344A1
Application number: PCT/CN2020/089724
Authority: WO
Inventors: 肖镜辉; 邢超; 钱莉
Original assignee: 华为技术有限公司
Priority date: 2019-08-28
Filing date: 2020-05-12
Publication date: 2021-03-04
Also published as: CN112445921A; US20220164090A1

Abstract

一种摘要生成方法和装置，涉及人工智能领域。所述方法，包括：获取内容对象（201）；根据N张图片获取N个缩略图（202）；根据文本信息和N个缩略图生成M个候选摘要（203）；获取用户的偏好信息（204）；根据偏好信息从M个候选摘要中选取一个作为内容对象的摘要（205）；将摘要发送给终端设备（206）。所述方法可以提高用户点击该摘要的概率，提升内容对象的投放效果。

Description

摘要生成方法和装置

本申请要求于2019年8月28日提交中国专利局、申请号为201910804482.9、申请名称为“摘要生成方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息流技术，尤其涉及一种摘要生成方法和装置。

背景技术

近年，信息流作为一种新的内容产品形态，成为人们获取信息的主要方式。信息流产品形态是将内容组织到一个列表页中，该列表页的呈现方式通常有三种：无图方式、单图方式和多图方式，其中，无图方式是只展示内容的标题，单图方式是展示内容的标题加一个来自于内容的缩略图，多图方式是展示内容的标题加多个来自于内容的缩略图。相较于只展示标题，缩略图所呈现的信息更加丰富直观，对用户的行为影响更大。此外，在终端设备的图库应用程序中，当用户制作了一个视频或创建了一个相册的时候，也可以选取一张或多张图片制作缩略图作为封面，直观地向用户展示视频或相册的内容。

目前缩略图的选取方式是从内容包含的图片中随机选取图片或者选取特定的图片作为缩略图。但是，这种选取方式得到的缩略图种类单一且不具代表性，并不能助于提升信息的投放效果。

发明内容

本申请提供一种摘要生成方法和装置，以提高用户点击该摘要的概率，提升内容对象的投放效果。

第一方面，本申请提供一种摘要生成方法，包括：

获取内容对象，所述内容对象包括文本信息和N张图片，N为自然数；根据所述N张图片获取N个缩略图；根据所述文本信息和所述N个缩略图生成M个候选摘要，每个所述候选摘要包括所述文本信息和至少一个所述缩略图，M为自然数；获取用户的偏好信息，所述偏好信息是基于所述用户的历史操作信息和/或所述用户的属性信息获取的；根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要；显示所述摘要或将所述摘要发送给终端设备。

本申请根据用户的偏好信息从内容对象中选取缩略图用作摘要的生成，该摘要考虑到了用户的历史操作信息和/或用户的属性信息获取的偏好信息，因此很具有代表性，可以提高用户点击该摘要的概率，提升内容对象的投放效果。

在一种可能的实现方式中，所述历史操作信息包括以下至少一种信息：所述用户点击过的历史内容对象的标题、类别以及作者，每个历史内容对象的点击次数和点击时间，以及每个内容对象的观看时长；所述属性信息包括以下至少一种信息：所述用户的性别、年龄、所在地以及所述用户选择的标签；所述偏好信息包括以下至少一种信息：所述用户偏好的内容对象的类别，所述用户偏好的内容对象的主题以及所述用户偏好的内容对象的归属。

在一种可能的实现方式中，所述文本信息为所述内容对象的标题。

在一种可能的实现方式中，所述根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要，包括：获取所述M个候选摘要的分数，所述分数用于指示对应的所述候选摘要被点击的可能性，所述分数越高表示所述对应的候选摘要被点击的可能性越大；从所述M个候选摘要中选取一个分数最高的候选摘要作为所述摘要。

在一种可能的实现方式中，所述获取所述M个候选摘要的分数，包括：通过神经网络模型对所述M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个所述多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征；通过预先训练得到的打分模型分别对所述M个多模特征打分，获取所述M个多模特征的分数作为对应的M个候选摘要的分数。

在一种可能的实现方式中，所述获取用户的偏好信息之前，还包括：基于历史用户的偏好信息训练得到所述打分模型。

在一种可能的实现方式中，所述获取所述M个候选摘要的分数，包括：基于所述偏好信息采用探索和发现策略获取所述M个候选摘要的分数。

第二方面，本申请提供一种摘要生成装置，包括：

获取模块，用于获取内容对象，所述内容对象包括文本信息和N张图片，N为自然数；处理模块，用于根据所述N张图片获取N个缩略图；根据所述文本信息和所述N个缩略图生成M个候选摘要，每个所述候选摘要包括所述文本信息和至少一个所述缩略图，M为自然数；所述获取模块，还用于获取用户的偏好信息，所述偏好信息是基于所述用户的历史操作信息和/或所述用户的属性信息获取的；所述处理模块，还用于根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要；发送模块，用于显示所述摘要或将所述摘要发送给终端设备。

在一种可能的实现方式中，所述处理模块，具体用于获取所述M个候选摘要的分数，所述分数用于指示对应的所述候选摘要被点击的可能性，所述分数越高表示所述对应的候选摘要被点击的可能性越大；从所述M个候选摘要中选取一个分数最高的候选摘要作为所述摘要。

在一种可能的实现方式中，所述处理模块，具体用于通过神经网络模型对所述M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个所述多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征；通过预先训练得到的打分模型分别对所述M个多模特征打分，获取所述M个多模特征的分数作为对应的M个候选摘要的分数。

在一种可能的实现方式中，所述处理模块，还用于基于历史用户的偏好信息训练得到所述打分模型。

在一种可能的实现方式中，所述处理模块，具体用于基于所述偏好信息采用探索和发现策略获取所述M个候选摘要的分数。

第三方面，本申请提供一种摘要生成装置，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述第一方面中任一项所述的方法。

第四方面，本申请提供一种计算机可读存储介质，包括计算机程序，所述计算机程序在计算机上被执行时，使得所述计算机执行上述第一方面中任一项所述的方法。

附图说明

图1示例性的示出了本申请摘要生成方法的一个应用场景的框图；

图2为本申请摘要生成方法实施例一的流程图；

图3示例性的给出了一种列表页的摘要呈现方式的示意图；

图4示例性的给出了另一种列表页的摘要呈现方式的示意图；

图5示例性的给出了第三种列表页的摘要呈现方式的示意图；

图6为本申请图文分离方法的流程示意图；

图7为本申请摘要生成方法实施例一的流程示意图；

图8为本申请摘要生成方法实施例二的流程示意图；

图9为本申请摘要生成装置实施例的结构示意图；

图10为本申请提供的服务器1000的示意性结构图；

图11为本申请提供的终端设备1100的示意性结构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书实施例和权利要求书及附图中的术语“第一”、“第二”等仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A， B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

以下是本申请涉及到的部分关键术语的描述：

信息流：是一种特定的内容组织方式，特指通过滚动列表的方式来呈现的内容流。

信息流产品：以信息流为主要内容呈现形态的产品，代表性的产品有新闻应用程序(Application，APP)、视频APP、图片APP等。

列表页：信息流产品呈现内容的主要页面，即将所有信息以滚动列表的形式排列在一起，呈现给用户的页面。

列表页中文章展现样式：是指在列表页中，文章标题和缩略图的组合形式，通常有无图、单图和三图三大类样式。在后两类样式中，文章标题和不同缩略图的组合，又决定了该文章的具体展示样式。

多模特征：单纯的文本特征、语音特征、图像特征称为单模态特征，上述单模态特征的两两组合、甚至三种组合，组成了多模特征。

探索与发现策略(Explore and Exploit)：简称“E&E”，是推荐系统的策略之一，旨在基于已有的(但不全的)信息，采取一定策略来取得全局收益最大化。比较著名的解决方法有epsilon-Greedy算法、Thompson sampling算法、UCB(Upper confidence bound)算法和LinUCB算法。

图1示例性的示出了本申请摘要生成方法的一个应用场景的框图，如图1所示，该场景包括服务器和终端设备，其中，服务器可以是信息流产品的供应方的服务器，信息流产品例如可以是视频APP、新闻APP、图片APP等，这些APP的供应方为了向用户提供内容服务，可以部署服务器，该服务器可以作为云端平台，一方面保障APP的正常运行，另一方面可以收集大量用户的个人数据，基于大数据向用户推送个性化的内容对象的摘要(例如在客户端的列表页上要呈现的内容)。终端设备作为客户端供用户使用，用户在终端设备上安装前述APP，即可在终端设备上体验到视频、新闻、图片等内容的获取和观看。

图2为本申请摘要生成方法实施例的流程图，如图2所示，本实施例的方法可以由图1中的服务器执行，也可以由图1中的终端设备执行。示例性的，以下以服务器作为执行主体对本申请的摘要生成方法进行描述。摘要生成方法可以包括：

步骤201、获取内容对象。

内容对象包括文本信息和N张图片，N为自然数。服务器收集了大量的内容对象，该内容对象例如可以是编辑好的新闻，该新闻包括标题、摘要、新闻内容等文本信息，还包括一些体现新闻主题的图片；或者，该内容对象又例如可以电影、电视剧、小视频等视频，该视频包括标题、类别、内容介绍等文本信息，还包括视频中的图像帧。本申请中涉及到的内容对象具有一个共同的特征，即内容对象中除了本文信息外，还包括至少一张图片，例如，新闻中有一张或多张现场照片，视频本身就是由多帧图像组成的图像帧序列。

步骤202、根据N张图片获取N个缩略图。

服务器对内容对象中的每张图片都进行压缩处理，得到缩略图。本申请中缩略图的获取可以采用现有的相关技术实现，对此不作具体限定。

步骤203、根据文本信息和N个缩略图生成M个候选摘要。

每个候选摘要包括文本信息和至少一个缩略图，M为自然数。本申请中服务器从内容对象中提取文本信息(例如标题)，结合上述缩略图生成多个候选摘要。候选摘要的具体形式和终端设备中列表页的摘要呈现方式有关，示例性的，列表页的摘要呈现方式可以包括以下三种：

(1)无图样式

列表页中只有标题，没有缩略图。例如如图3所示。

(2)单图样式

列表页中除了标题，还有一个缩略图，该缩略图是从上述N个缩略图中选取的。例如如图4所示。

(3)三图样式

列表页中除了标题，还有三个缩略图，该三个缩略图是从上述N个缩略图中选取的。例如如图5所示。

由于本申请只考虑摘要中有图片的情况，因此无图样式除外，基于上述(2)和(3)中的列表页的摘要呈现方式，候选摘要也可以分为两类：一类是每个候选摘要包括标题和一个缩略图，该缩略图是从N个缩略图中任意选取一个，总共可以得到N个候选摘要；另一类是每个候选摘要包括标题和三个缩略图，该三个缩略图从N个缩略图中任意选取三个，可以得到

个候选摘要。如图6所示，服务器对内容对象进行图文分离得到文本信息和图片集合，本文信息可以是内容对象的标题，图片集合包括内容对象中的N张图片得到的N个缩略图，根据文本信息和N个缩略图生成M个候选摘要。

需要说明的是，上述示例性的给出了三种列表页的摘要呈现方式，相应的示例性的提供了要获取的候选摘要包括的内容，但是列表页的摘要还可以采用其他的呈现方式，只要可以向用户呈现内容对象的提示，对此是不做具体限定的，相应的，本申请对候选摘要包括的内容也不做具体限定。

步骤204、获取用户的偏好信息。

偏好信息是基于用户的历史操作信息和/或用户的属性信息获取的，其中，历史操作信息包括以下至少一种信息：用户点击过的历史内容对象的标题、类别以及作者，每个历史内容对象的点击次数和点击时间，以及每个历史内容对象的观看时长；属性信息包括以下至少一种信息：用户的性别、年龄、所在地以及用户选择的标签；偏好信息包括以下至少一种信息：用户偏好的内容对象的类别，用户偏好的内容对象的主题以及用户偏好的内容对象的归属。

不同的用户有自己的兴趣爱好，喜欢看的新闻、视频、图片等各有偏好，终端设备获取用户的历史操作信息，例如用户点击过的历史内容对象的标题、类别以及作者，每个历史内容对象的点击次数和点击时间，以及每个内容对象的观看时长等，将其上报给服务器，由服务器分析该用户喜欢看的内容对象的类别，主题以及作者等。通常用户在注册账号时，填写了性别、年龄、所在地(例如籍贯、家庭住址、工作地等)以及表示自己喜好的标签(例如，时尚、电影、旅行、音乐等)等属性信息，服务器可以结合这些属性信息基于大数据的统计，分析总结出用户的多个类别，再得到同类用户的偏好等。

步骤205、根据偏好信息从M个候选摘要中选取一个作为内容对象的摘要。

服务器可以获取M个候选摘要的分数，该分数用于指示对应的候选摘要被点击的可能性，分数越高表示对应的候选摘要被点击的可能性越大，然后从M个候选摘要中选取一个分数最高的候选摘要作为摘要。

本申请中打分的方式可以是服务器通过神经网络模型对M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征。然后通过预先训练得到的打分模型分别对M个多模特征打分，获取M个多模特征的分数作为对应的M个候选摘要的分数。如图7所示，打分模型分为在线和离线两个部分，离线部分是打分模型的训练过程，在线部分是打分模型的应用过程。

打分模型的训练过程包括：首先将内容对象的业务指标转成打分模型的训练准则。例如，内容对象的业务指标是点击率，这样目标问题转化成为一个二分类问题(例如，用户点击或者用户不点击)，训练准则可以设定为交叉熵准则。然后将用户的历史操作信息结合上述训练准则转化为正负训练样本。例如，已经给用户展现过的内容对象中，用户点击的内容对象表示正样本，用户未点击的内容对象表示负样本。最后经由正负样本集合，进行训练得到最终的打分模型。服务器可以采用如下的抽象特征：

(1)有一个可量化的业务指标；

(2)将业务指标转成机器学习的训练准则；

(3)由业务指标决定了样本选择方法，从用户的历史操作信息中选择形成正负样本；

(4)从训练样本中抽取特征；

(5)选择特定的算法作为训练算法，根据训练样本来训练机器学习模型。

打分模型的应用过程包括：

服务器通过神经网络模型对M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，利用离线部分训练好的打分模型，结合用户的属性信息，例如用户的性别、年龄、所在地以及用户选择的标签等，对M个多模特征进行打分，获取M个多模特征的分数作为对应的M个候选摘要的分数，所得M个分数经过摘要选取器，将最高分的候选摘要作为摘要。由于打分模型是根据业务指标训练得到的，所以打分模型打分的高低也反映了该内容对象对业务指标的影响作用。

本申请中打分的方式也可以是基于偏好信息采用探索和发现策略获取M个候选摘要的分数。服务器统计每个候选摘要被用户点击的概率，每种候选摘要被用户实际点击的次数除以该种候选摘要被展示的次数，表示了该种候选摘要受到用户的欢迎程度。实际计算过程中，对于从未给用户展示过的候选摘要、或者展示次数比较少的候选摘要，会以一定的方式加以平滑，通常是在分子和分母上面加上很小的数。E&E的算法的共同特点是，基于候选已有的统计信息，采取一定的候选选择策略，使得在有限的选择次数范围内，所做选择获得的业务指标最大，例如用户点击次数。

服务器通过上述的打分过程得到M个候选摘要的分数，从中选择分数最高的作为内容对象的摘要。

步骤206、将摘要发送给终端设备。

服务器将确定出来的最高分的摘要发送给终端设备，终端设备的列表页上就会显示该摘要，由于该摘要是考虑了用户的历史操作信息和/或用户的属性信息获取的偏好信息得到的，因此大概率情况下该摘要是投其所好的，很具有代表性，那么用户会点击该摘要的概率就会大大提高，进而提升了内容对象的投放效果。

终端设备在执行摘要生成方法时，与上述步骤206的区别在于，终端设备不需要发送摘要，当确定了摘要后直接显示摘要即可。

在一种可能的实现方式中，图8为本申请摘要生成方法实施例二的流程示意图，如图8所示，本实施例的方法可以由终端设备执行，选取缩略图主要是用作终端用户自定义的视频或图片集合的封面。

与上述实施例的相同之处在于，本实施例中同样需要采用上述步骤201-205生成M个多模特征，区别在于生成多模特征之前，终端设备先对视频中的图像帧进行分类，或者对图片集合中的图片进行分类，分类的方法可以采用机器学习中各种聚类算法，例如kmeans算法、层次聚类算法、基于密度的聚类算法等。分类后，终端设备可以从各分类项中选取一张具有代表性的图片用于生成多模特征，该选出的图片可以是随机选取的，也可以是分类项中包括共性特征最多的图片，还可以是根据用户的偏好信息选取的。本实施例中，生成多模特征采用的文本信息是指视频或图片集合的名称，缩略图就是前述选出的图片的缩略图。

本实施例中，用户的偏好信息可以包括但不限于用户对图片类型的关注度，例如用户经常拍摄或观看的图片类型(风景或人物)，用户对特定人群的关注度，例如用户经常拍摄或观看宝宝的照片，终端设备根据用户的偏好信息训练打分模型。再结合基于用户的属性信息，由打分模型对M个多模特征打分，获取M个多模特征的分数作为对应的M个图片的分数。最后在生成封面时，终端设备根据封面所需的图片数量，依次从分数排序中由高到低的选取相应数量的图片，生成最终的封面。

图9为本申请摘要生成装置实施例的结构示意图，如图9所示，本实施例的装置可以应用于图1中的服务器，摘要生成装置可以包括：获取模块901、处理模块902和发送模块903，其中，获取模块901，用于获取内容对象，所述内容对象包括文本信息和N张图片，N为自然数；处理模块902，用于根据所述N张图片获取N个缩略图；根据所述文本信息和所述N个缩略图生成M个候选摘要，每个所述候选摘要包括所述文本信息和至少一个所述缩略图，M为自然数；所述获取模块901，还用于获取用户的偏好信息，所述偏好信息是基于所述用户的历史操作信息和/或所述用户的属性信息获取的；所述处理模块902，还用于根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要；发送模块903，用于显示所述摘要或将所述摘要发送给终端设备。

在一种可能的实现方式中，所述处理模块902，具体用于获取所述M个候选摘要的分数，所述分数用于指示对应的所述候选摘要被点击的可能性，所述分数越高表示所述对应的候选摘要被点击的可能性越大；从所述M个候选摘要中选取一个分数最高的候选摘要作为所述摘要。

在一种可能的实现方式中，所述处理模块902，具体用于通过神经网络模型对所述M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个所述多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征；通过预先训练得到的打分模型分别对所述M个多模特征打分，获取所述M个多模特征的分数作为对应的M个候选摘要的分数。

在一种可能的实现方式中，所述处理模块902，还用于基于历史用户的偏好信息训练得到所述打分模型。

在一种可能的实现方式中，所述处理模块902，具体用于基于所述偏好信息采用探索和发现策略获取所述M个候选摘要的分数。

本实施例的装置，可以用于执行图2所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图10为本申请提供的服务器1000的示意性结构图。如图10所示，服务器1000包括处理器1001和收发器1002。

可选地，服务器1000还包括存储器1003。其中，处理器1001、收发器1002和存储器1003之间可以通过内部连接通路互相通信，传递控制信号和/或数据信号。

其中，存储器1003用于存储计算机程序。处理器1001用于执行存储器1003中存储的计算机程序，从而实现上述装置实施例中摘要生成装置的各功能。

可选地，存储器1003也可以集成在处理器1001中，或者独立于处理器1001。

可选地，服务器1000还可以包括天线1004，用于将收发器1002输出的信号发射出去。或者，收发器1002通过天线接收信号。

可选地，服务器1000还可以包括电源1005，用于给服务器中的各种器件或电路提供电源。

除此之外，为了使得服务器的功能更加完善，服务器1000还可以包括输入单元1006和显示单元1007(也可以认为是输出单元)。

图11为本申请提供的终端设备1100的示意性结构图。如图11所示，终端设备1100包括处理器1101和收发器1102。

可选地，终端设备1100还包括存储器1103。其中，处理器1101、收发器1102和存储器1103之间可以通过内部连接通路互相通信，传递控制信号和/或数据信号。

其中，存储器1103用于存储计算机程序。处理器1101用于执行存储器1103中存储的计算机程序，从而实现上述装置实施例中摘要生成装置的各功能。

可选地，存储器1103也可以集成在处理器1101中，或者独立于处理器1101。

可选地，终端设备1100还可以包括天线1104，用于将收发器1102输出的信号发射出去。或者，收发器1102通过天线接收信号。

可选地，终端设备1100还可以包括电源1105，用于给终端设备中的各种器件或电路提供电源。

除此之外，为了使得终端设备的功能更加完善，终端设备1100还可以包括输入单元1106、显示单元1107(也可以认为是输出单元)、音频电路1108、摄像头1109和传感器1110等中的一个或多个。音频电路还可以包括扬声器11081、麦克风11082等，不再赘述。

除此之外，为了使得终端设备的功能更加完善，终端设备1100还可以包括输入单元1106和显示单元1107(也可以认为是输出单元)。

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被计算机执行时，使得计算机执行上述任一方法实施例中的步骤和/或处理。

在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器(digital signal processor,DSP)、特定应用集成电路(application-specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。本申请实施例公开的方法的步骤可以直接体现为硬件编码处理器执行完成，或者用编码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

上述各实施例中提及的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。应注意，本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种摘要生成方法，其特征在于，包括：

获取内容对象，所述内容对象包括文本信息和N张图片，N为自然数；

根据所述N张图片获取N个缩略图；

根据所述文本信息和所述N个缩略图生成M个候选摘要，每个所述候选摘要包括所述文本信息和至少一个所述缩略图，M为自然数；

获取用户的偏好信息，所述偏好信息是基于所述用户的历史操作信息和/或所述用户的属性信息获取的；

根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要；

显示所述摘要或将所述摘要发送给终端设备。
根据权利要求1所述的方法，其特征在于，所述历史操作信息包括以下至少一种信息：所述用户点击过的历史内容对象的标题、类别以及作者，每个历史内容对象的点击次数和点击时间，以及每个内容对象的观看时长；

所述属性信息包括以下至少一种信息：所述用户的性别、年龄、所在地以及所述用户选择的标签；

所述偏好信息包括以下至少一种信息：所述用户偏好的内容对象的类别，所述用户偏好的内容对象的主题以及所述用户偏好的内容对象的归属。
根据权利要求1或2所述的方法，其特征在于，所述文本信息为所述内容对象的标题。
根据权利要求1-3中任一项所述的方法，其特征在于，所述根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要，包括：

获取所述M个候选摘要的分数，所述分数用于指示对应的所述候选摘要被点击的可能性，所述分数越高表示所述对应的候选摘要被点击的可能性越大；

从所述M个候选摘要中选取一个分数最高的候选摘要作为所述摘要。
根据权利要求4所述的方法，其特征在于，所述获取所述M个候选摘要的分数，包括：

通过神经网络模型对所述M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个所述多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征；

通过预先训练得到的打分模型分别对所述M个多模特征打分，获取所述M个多模特征的分数作为对应的M个候选摘要的分数。
根据权利要求5所述的方法，其特征在于，所述获取用户的偏好信息之前，还包括：

基于历史用户的偏好信息训练得到所述打分模型。
根据权利要求4所述的方法，其特征在于，所述获取所述M个候选摘要的分数，包括：

基于所述偏好信息采用探索和发现策略获取所述M个候选摘要的分数。
一种摘要生成装置，其特征在于，包括：

获取模块，用于获取内容对象，所述内容对象包括文本信息和N张图片，N为自然数；

处理模块，用于根据所述N张图片获取N个缩略图；根据所述文本信息和所述N个缩略图生成M个候选摘要，每个所述候选摘要包括所述文本信息和至少一个所述缩略图，M为自然数；

所述获取模块，还用于获取用户的偏好信息，所述偏好信息是基于所述用户的历史操作信息和/或所述用户的属性信息获取的；

所述处理模块，还用于根据所述偏好信息从所述M个候选摘要中选取一个作为所述内容对象的摘要；

发送模块，用于显示所述摘要或将所述摘要发送给终端设备。
根据权利要求8所述的装置，其特征在于，所述历史操作信息包括以下至少一种信息：所述用户点击过的历史内容对象的标题、类别以及作者，每个历史内容对象的点击次数和点击时间，以及每个内容对象的观看时长；所述属性信息包括以下至少一种信息：所述用户的性别、年龄、所在地以及所述用户选择的标签；所述偏好信息包括以下至少一种信息：所述用户偏好的内容对象的类别，所述用户偏好的内容对象的主题以及所述用户偏好的内容对象的归属。
根据权利要求8或9所述的装置，其特征在于，所述文本信息为所述内容对象的标题。
根据权利要求8-10中任一项所述的装置，其特征在于，所述处理模块，具体用于获取所述M个候选摘要的分数，所述分数用于指示对应的所述候选摘要被点击的可能性，所述分数越高表示所述对应的候选摘要被点击的可能性越大；从所述M个候选摘要中选取一个分数最高的候选摘要作为所述摘要。
根据权利要求11所述的装置，其特征在于，所述处理模块，具体用于通过神经网络模型对所述M个候选摘要中的每一个候选摘要包含的文本信息和缩略图进行特征提取获取M个多模特征，每个所述多模特征包括相应的候选摘要的文本信息的文本特征和缩略图的图像特征；通过预先训练得到的打分模型分别对所述M个多模特征打分，获取所述M个多模特征的分数作为对应的M个候选摘要的分数。
根据权利要求12所述的装置，其特征在于，所述处理模块，还用于基于历史用户的偏好信息训练得到所述打分模型。
根据权利要求11所述的装置，其特征在于，所述处理模块，具体用于基于所述偏好信息采用探索和发现策略获取所述M个候选摘要的分数。
一种摘要生成装置，其特征在于，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括计算机程序，所述计算机程序在计算机上被执行时，使得所述计算机执行权利要求1-7中任一项所述的方法。