CN111680482A

CN111680482A - 一种标题图文生成方法及计算设备

Info

Publication number: CN111680482A
Application number: CN202010377312.XA
Authority: CN
Inventors: 廖卫平; 胡阿沛; 杨卉; 陈泽龙
Original assignee: CHEZHI HULIAN (BEIJING) SCIENCE & TECHNOLOGY CO LTD
Current assignee: CHEZHI HULIAN (BEIJING) SCIENCE & TECHNOLOGY CO LTD
Priority date: 2020-05-07
Filing date: 2020-05-07
Publication date: 2020-09-18
Anticipated expiration: 2040-05-07
Also published as: CN111680482B

Abstract

本发明公开了一种标题图文生成方法，在计算设备中执行，计算设备与数据存储装置连接，数据存储装置中存储有多个标题模板、多个图像及其类别以及用户标签与插槽和图像类别的对应关系，每个标题模板包括至少一个待填充内容的插槽，该方法包括：获取文章内容及其目标用户群的标签；从文章内容中提取出关键词，每个关键词对应于至少一种插槽；从已存储的多个标题模板中筛选出候选模板，候选模板中包括分别与每一个用户标签对应的插槽；从候选模板中选择一个作为目标模板，将相应的关键词填充至目标模板的插槽中，以生成标题文本；从已存储的多个图像中筛选出候选图像，候选图像的类别对应于至少一个用户标签；从候选图像中选择一个作为标题图像。

Description

一种标题图文生成方法及计算设备

技术领域

本发明涉及内容推荐技术领域，尤其涉及一种标题图文生成方法及计算设备。

背景技术

在传统的内容推荐方式中，网站或应用(App)通常在特定区域，例如横幅(banner)区域向用户展示广告、热门文章等内容。用户可以通过点击横幅区域来浏览内容详情，产生转化行为。

随着大数据和机器学习技术的发展，上述传统的内容推荐方式逐渐被信息流的内容推荐方式所取代。在信息流方式中，推荐内容不是在固定区域显示，而是采用与普通内容相似的样式，与普通内容进行排列(例如上下排列)展示。推荐内容从视觉上看来就像普通内容一样。

信息流的内容推荐方式中，最初呈现给用户的推荐内容通常包括标题文本和标题图像两部分，用户点击该推荐内容，可以进入详情页面来查看推荐内容的正文详情。目前，在信息流式的推荐内容中，标题文本、标题图像由工作人员编辑提供，内容固定且数量有限，无法实现定制化的、千人千面的内容推荐。

发明内容

为此，本发明提供一种标题图文生成方法及计算设备，以力图解决或至少缓解上面存在的问题。

根据本发明的第一个方面，提供一种标题图文生成方法，在计算设备中执行，所述计算设备与数据存储装置连接，所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系，其中，每个所述标题模板包括至少一个待填充内容的插槽，所述方法包括：获取文章内容及其目标用户群的标签；从所述文章内容中提取出关键词，每个所述关键词对应于至少一种插槽；从已存储的多个标题模板中筛选出至少一个候选模板，所述候选模板中包括分别与每一个所述标签对应的插槽；从所述至少一个候选模板中选择一个作为目标模板，将相应的关键词填充至所述目标模板的插槽中，以生成标题文本；以及从已存储的多个图像中筛选出至少一个候选图像，所述候选图像的类别对应于至少一个所述标签；从所述至少一个候选图像中选择一个作为标题图像。

可选地，在根据本发明的标题图文生成方法中，数据存储装置中存储的多个标题模板按照以下步骤生成：将点击率大于预设阈值或点击率最大的多个标题作为高点击标题；基于预设的插槽类型对高点击标题进行命名实体识别，确定其中插槽的位置和类型从而生成标题模板。

可选地，在根据本发明的标题图文生成方法中，从所述文章内容中提取出关键词的步骤包括：基于预设的插槽类型对所述文章内容进行命名实体识别，以识别出对应于不同插槽类型的文本内容，并将所述文本内容作为关键词。

可选地，在根据本发明的标题图文生成方法中，从所述至少一个候选模板中选择一个作为目标模板的步骤包括：从所述至少一个候选模板中随机选择一个作为目标模板。

可选地，在根据本发明的标题图文生成方法中，图像的类别按照以下步骤确定：将已标注类别的图像作为训练样本，训练分类模型；采用训练好的分类模型来确定待分类的图像的类别。

可选地，在根据本发明的标题图文生成方法中，数据存储装置中还存储有每个图像的质量得分，所述从所述至少一个候选图像中选择一个作为标题图像的步骤包括：从质量得分最高的多个候选图像中随机选择一个作为标题图像。

可选地，在根据本发明的标题图文生成方法中，图像的质量得分按照以下步骤确定：分别确定图像的色彩丰富度和美感度；将色彩丰富度与美感度的加权求和结果作为图像的质量得分。

可选地，在根据本发明的标题图文生成方法中，图像的色彩丰富度C按照以下公式计算：

C＝δ_rgyb+0.3*μ_rgyb

其中，

rg＝R-G

R、G、B分别为图像的R、G、B颜色通道图，rg、yb分别为第一特征图、第二特征图，δ_rg、μ_rg分别为第一特征图中各像素值的标准差和均值，δ_yb、μ_yb分别为第二特征图中各像素值的标准差和均值。

可选地，在根据本发明的标题图文生成方法中，图像的美感度按照以下步骤确定：将图像输入预设的美感度评估模型，以便所述美感度评估模型输出所述图像的美感度。

可选地，在根据本发明的标题图文生成方法中，还包括步骤：将所述标题图像裁剪至预设尺寸。

可选地，在根据本发明的标题图文生成方法中，还包括步骤：将所述标题文本和所述标题图像发送至目标用户的用户终端，以将所述标题文本和所述标题图像呈现给目标用户。

根据本发明的第二个方面，提供一种计算设备，包括：至少一个处理器；和存储有程序指令的存储器，当所述程序指令被所述处理器读取并执行时，使得所述计算设备执行如上所述的标题图文生成方法。

根据本发明的第三个方面，提供一种存储有程序指令的可读存储介质，当所述程序指令被计算设备读取并执行时，使得所述计算设备执行如上所述的标题图文生成方法。

根据本发明的技术方案，预先生成标题模板库和图像库，每个标题模板包括至少一个待填充内容的插槽，每个图像具有类别属性，并定义用户标签与插槽类型和图像类别的对应关系。

针对某一文章内容和目标用户群，从文章内容中提取出关键词，每个关键词对应于至少一种插槽。根据目标用户群的标签，从标题模板库中筛选出多个标题模板作为候选模板；从图像库中筛选出多个图像作为候选图像。然后，从候选模板中选择一个作为目标模板，将从文章内容提取出的关键词填充至目标模板的插槽中，生成标题文本；并且，从候选图像中选择一个作为标题图像。在本发明中，标题文本、标题图像是根据文章内容和目标用户群自动生成的。并且，标题文本从候选模板中选择生成，标题图像从候选图像中选择生成，每次选择的结果可能不同，从而针对目标用户群中的不同用户，可以对应生成多种标题图文，呈现出千人千面的动态推荐效果，提高标题图文对目标用户的吸引度。

根据一种实施例，图像库中的图像还具有质量得分属性，质量得分越高，图像的视觉效果越好。在从候选图像选择标题图像时，可以将候选图像按照质量得分由高到低进行排序，然后从质量得分较高的多个候选图像中随机选择一个作为标题图像，从而保证标题图像能够向用户呈现良好的视觉效果，提高标题图像对用户的吸引度。

根据一种实施例，在确定标题图像后，对标题图像进行裁剪，使其符合预设尺寸。这样可以使标题图像的尺寸与信息流内容的展示尺寸相匹配，适配不同客户端(例如PC网页端、移动网页端、移动App端等)以及不同应用场景。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了实现上述以及相关目的，本文结合下面的描述和附图来描述某些说明性方面，这些方面指示了可以实践本文所公开的原理的各种方式，并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述，本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开，相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的内容推荐系统100的示意图；

图2示出了根据本发明一个实施例的信息流式的标题图文的示意图；

图3示出了根据本发明一个实施例的计算设备300的示意图；

图4示出了根据本发明一个实施例的图像类别的示意图；

图5示出了根据本发明一个实施例的图像分类结果的示意图；

图6示出了根据本发明一个实施例的图像色彩丰富度的计算结果的示意图；

图7示出了根据本发明一个实施例的美感度评估模型的结构图；

图8示出了根据本发明一个实施例的图像美感度的计算结果的示意图；

图9示出了根据本发明一个实施例的标题图文生成方法900的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

针对现有技术中存在的问题，本发明提供一种标题图文生成方法，根据文章内容和目标用户群自动生成标题图文，实现动态的、定制化的内容推荐，保证标题图文呈现良好的视觉效果，提高对目标用户的吸引度。

图1示出了根据本发明一个实施例的内容推荐系统100的示意图。如图1所示，内容推荐系统100包括计算设备300、数据存储装置110和多个用户终端120。应当指出，图1所示的内容推荐系统100仅是示例性的，虽然其中仅示出了一个计算设备和一个数据存储装置，但是，在具体的实践情况中，内容推荐系统中可以包括不同数量的计算设备和数据存储装置，本发明对内容推荐系统中所包括的计算设备和数据存储装置的数量不做限制。

计算设备300是具有通信和计算能力的设备，其可以实现为服务器、工作站等，也可以实现为桌面计算机、笔记本计算机等配置的个人计算机，在一些情况中，计算设备300还可以实现为手机、平板电脑、智能可穿戴设备等设备。

数据存储装置110可以是关系型数据库例如MySQL、ACCESS等，也可以是非关系型数据库例如NoSQL等；可以是驻留于计算设备300中的本地数据库，也可以作为分布式数据库例如HBase等设置于多个地理位置处，总之，数据存储装置110用于存储数据，本发明对数据存储装置110的具体部署、配置情况不做限制。

用户终端120例如可以是桌面计算机、笔记本计算机等个人配置的计算机，也可以是手机、平板电脑、多媒体播放器、智能可穿戴设备等移动终端，还可以是智能电视、智能门禁、工控设备等物联网(Internet of Things，IoT)设备，但不限于此。

计算设备300与数据存储装置110连接，其可以向数据存储装置110中写入数据，以及获取数据存储装置110中所存储的数据。例如，计算设备300可以直接读取数据存储装置110中的数据(在数据存储装置110为计算设备300的本地数据库时)，也可以通过有线或无线的方式接入互联网，并通过数据接口来获取数据存储装置110中的数据。

用户终端120中通常安装有多个应用，例如购物应用、资讯类应用、即时通信应用、浏览器应用等，但不限于此。用户可以通过浏览器应用来访问网页。计算设备300是用户终端120中安装的某一应用的服务端，或者是某些网页所对应的服务端，其用于向该应用或该网页提供方法及数据调用。例如，用户终端120中安装有应用A，计算设备300是应用A的服务端；或者，用户终端120中安装有浏览器应用，用户可以通过浏览器应用来访问某些网页B，计算设备是网页B的服务端。

在本发明的实施例中，数据存储装置110中存储有多个标题以及多个图像。计算设备300适于对数据存储装置110中的标题和图像进行处理，生成用于进行信息流内容推荐的标题模板库和图像库，并将生成的标题模板库和图像库存储至数据存储装置110。

具体地，计算设备300适于从多个标题中提取出标题模板，每个模板包括至少一个待填充内容的插槽。所提取出的多个标题模板组成标题模板库。计算设备300还适于对图像进行分类，确定每个图像的类别标签和质量得分，多个标记了类别和质量得分的图像组成图像库。计算设备300生成的标题模板库和图像库存储于数据存储装置110中，用于进行信息流内容推荐。

除了标题模板库和图像库之外，数据存储装置110中还存储有用户标签，以及用户标签与插槽类型和图像类别的对应关系。用户标签用于表示用户的特征或用户关注的内容。用户标签可以是用户自行设定的，或者由应用/网页基于用户授权来获取用户的访问行为，并从用户的行为中识别出来的。例如，用户在某个汽车资讯类应用中注册账号时，可以设定自己的收入水平为中高收入，关注的汽车的空间和外观。又例如，应用可以在用户授权的情况下，获取用户在应用中的点击、浏览、收藏等行为，从用户行为中分析其特征和兴趣，提取出用户标签。

下表1示例性的给出了一个用户标签集合。表1中共示出了13个标签，每一个标签表示汽车的某一个特征方面。用户具有某些标签，则表明用户对汽车的这些方面更加关注。

表1

序号	标签	序号	标签
				1	外观	8	舒适性
2	内饰	9	能耗
				3	安全性	10	空间
4	动力	11	信息及多媒体
				5	操控	12	自动驾驶系统
6	通过性	13	口碑
				7	便利性

标题模板库和图像库的生成过程，以及用户标签与插槽类型和图像类别的对应关系将于下文中详述。

基于数据存储装置110中存储的标题模板库、图像库以及用户标签与插槽类型和图像类别的对应关系，计算设备300可以执行本发明的标题图文生成方法900，针对某一篇推荐的文章内容的目标用户群，自动生成该文章内容的标题图文(包括标题文本和标题图像)，生成的标题图文以信息流的方式展示给用户。当用户点击该标题图文时，将跳转至相应的文章内容。

图2示出了根据本发明一个实施例的信息流式的标题图文的示意图。如图2所示，界面200中上下排列有三个信息流内容，如图中的3个矩形区域210～230所示，其中，信息流内容3在当前界面中没有展示完全。每个信息流内容包括标题文本和标题图像，通过点击标题文本或标题图像，可以查看相应信息流内容的文章详情。

如图2所示，三个信息流内容的外部样式大致相同，例如，对应的矩形区域210～230尺寸相同，但矩形区域中的标题文本和标题图像的位置和样式可能存在一些区别。在图2所示的3个信息流内容中，某些信息流内容的标题文本和标题图像可以是计算设备300执行本发明的标题图文生成方法900，根据文章内容的目标用户群的标签而自动生成的，以使标题图文能够呈现良好的视觉效果，提高对用户的吸引度。

本发明的标题模板库、图像库的生成方法，以及基于标题模板库和图像库的标题图文生成方法900在计算设备300中执行。图3示出了根据本发明一个实施例的计算设备300的示意图。需要说明的是，图3所示的计算设备300仅为一个示例，在实践中，用于实施本发明的标题图文生成方法的计算设备可以是任意型号的设备，其硬件配置情况可以与图3所示的计算设备300相同，也可以与图3所示的计算设备300不同。实践中用于实施本发明的标题图文生成方法的计算设备可以对图3所示的计算设备300的硬件组件进行增加或删减，本发明对计算设备的具体硬件配置情况不做限制。

如图3所示，在基本的配置302中，计算设备300典型地包括系统存储器306和一个或者多个处理器304。存储器总线308可以用于在处理器304和系统存储器306之间的通信。

取决于期望的配置，处理器304可以是任何类型的处理，包括但不限于：微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器304可以包括诸如一级高速缓存310和二级高速缓存312之类的一个或者多个级别的高速缓存、处理器核心314和寄存器316。示例的处理器核心314可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器318可以与处理器304一起使用，或者在一些实现中，存储器控制器318可以是处理器304的一个内部部分。

取决于期望的配置，系统存储器306可以是任意类型的存储器，包括但不限于：易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM，磁盘中的数据需要加载至物理内存中才能够被处理器304读取。系统存储器306可以包括操作系统320、一个或者多个应用322以及程序数据324。在一些实施方式中，应用322可以布置为在操作系统上由一个或多个处理器304利用程序数据324执行指令。操作系统320例如可以是Linux、Windows等，其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用322包括用于实现各种用户期望的功能的程序指令，应用322例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等，但不限于此。当应用122被安装到计算设备300中时，可以向操作系统320添加驱动模块。

在计算设备300启动运行时，处理器304会从存储器306中读取操作系统320的程序指令并执行。应用322运行在操作系统320之上，利用操作系统320以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用322时，应用322会加载至存储器306中，处理器304从存储器306中读取并执行应用322的程序指令。

计算设备300还可以包括有助于从各种接口设备(例如，输出设备342、外设接口344和通信设备346)到基本配置302经由总线/接口控制器330的通信的接口总线340。示例的输出设备342包括图形处理单元348和音频处理单元350。它们可以被配置为有助于经由一个或者多个A/V端口352与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口344可以包括串行接口控制器354和并行接口控制器356，它们可以被配置为有助于经由一个或者多个I/O端口358和诸如输入设备(例如，键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备346可以包括网络控制器360，其可以被布置为便于经由一个或者多个通信端口364与一个或者多个其他计算设备362通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

在根据本发明的计算设备300中，应用322包括用于生成标题模板库、图像库的指令，以及用于执行本发明的标题图文生成方法900的指令，这些指令可以指示处理器304执行标题模板库生成方法和图像库生成方法，以及执行本发明的标题图文生成方法900，基于标题模板库和图像库，根据文章内容及其目标用户群的标签自动生成标题文本和标题图像，保证标题图文呈现良好的视觉效果，提高对目标用户的吸引度。

本发明的标题模板库的生成过程如下：

首先，根据文章数据特定定义多种标题插槽。例如，针对汽车资讯类应用的文章内容特点，定义80类插槽，表2示例性地示出了这80种插槽的一部分。

表2

将点击率大于预设阈值或点击率最大的多个标题作为高点击标题，基于上述预设的插槽类型对高点击标题进行命名实体识别，确定其中插槽的位置和类型从而生成标题模板。

点击率即Click-Through-Rate，其计算方法为实际点击次数/展示量。在本发明的实施例中，通过点击率来筛选出比较受用户欢迎的标题，即高点击标题。从高点击标题中提取出标题模板，基于标题模板生成的新的标题文本通常也会对用户具有较强的吸引力。

在本发明的实施例中，可以将点击率大于预设阈值的标题作为高点击标题，也可以将点击率最大的多个(例如一千个、一万个等)标题作为高点击标题。预设阈值可以由本领域技术人员自行设置，本发明对此不做限制。在一个实施例中，可以将预设阈值设置为5％。

在确定了高点击标题后，基于预设的插槽类型对高点击标题进行命名实体识别，确定其中插槽的位置和类型从而生成标题模板。

命名实体识别是一种自然语言处理技术，指的是从文本中识别出具有特定意义的实体。在本发明的实施例中，实体即指的是上文中定义的各种插槽。通过对高点击标题进行命名实体识别，可以确定高点击标题中的属于插槽内容的词，这些词在高点击标题中的位置即为相应插槽的位置。

应当指出，本发明不限制命名实体识别所采用的具体方法。例如，在一些实施例中，可以采用正则表达式、机器学习(例如隐马尔可夫模型、语言模型、最大熵模型、支持向量机、决策树、条件随机场等)等方法来进行命名实体识别。

以下给出4个高点击标题所生成的标题模板的例子，在下述例子中，用大括号{}括起来的部分为插槽：

高点击标题1：最低6.8万！马力197！这款性价比极其有吸引力的紧凑型SUV怎么选？

标题模板1：{money}！{dongli}！这款{pingjia-money}的{car_model}怎么选？

高点击标题2：看完文章你再买丰台·卡罗拉介绍

标题模板2：看完文章你再买{car}介绍

高点击标题3：给你不一样的感觉20万级的SUV推荐

标题模板3：给你不一样的感觉{money-jibie}{car_model}推荐

高点击标题4：这台商务车有点酷2020款奔驰C级

标题模板4：这台{use}车有点酷{kuan}{car}

按照上述步骤，可以生成标题模板库，标题模板库包括多个标题模板，每个模板包括至少一个待填充内容的插槽。生成的标题模板库存储于数据存储装置110中，用于在标题图文生成方法900中自动生成标题文本。

本发明的图像库的生成过程如下：

首先，根据图像特征定义多种图像类别(class)。例如，针对汽车资讯类应用的图像特点，定义35个图像类别，如图4所示。

将已标注类别的图像作为训练样本，训练分类模型。随后，采用训练好的分类模型来确定待分类图像的类别。

需要说明的是，本发明不限制分类模型的具体结构，任意能够实现图像分类的模型结构均在本发明的保护范围之内。

具体地，在训练过程中，可以将已标注类别的图像数据集分为训练集和测试集两部分。例如，将已标注类别的图像中的80％作为训练集，用于训练分类模型；其中的20％作为测试集，用于测试在训练集上训练出来的分类模型的效果。当测试结果达到预设的要求(例如分类准确率达到预设值等)时，分类模型训练完成。

采用训练好的分类模型对数据存储装置110中存储的产品库中的全车系图进行分类，为图像添加分类标签，写入图像库。分类标签在图像库中对应的字段为classID。

图5示出了根据本发明一个实施例的图像分类结果的示意图。图5中示出了8个图像，图像的文件名中示出了图像所属的类别。例如，第一行的第一个图像所属的类别为app_behind-0-level，即车尾正向(参见图4)；第一行的第二个图像所属的类别为app_behind-45，即车位侧向；等等。

根据一种实施例，对每个图像进行质量评分(分值范围例如可以是0～100)，将图像的质量得分结果写入图像库。质量得分在图像库中对应的字段为scoreIQA。

根据一种实施例，图像的质量得分按照以下步骤确定：分别确定图像的色彩丰富度和美感度，将色彩丰富度与美感度的加权求和结果作为图像的质量得分。

图像的色彩丰富度越高，表示图像的颜色越丰富。根据一种实施例，图像的色彩丰富度C按照以下公式计算：

C＝δ_rgyb+0.3*μ_rgyb

其中，

rg＝R-G

在上述公式中，R、G、B分别为图像的R、G、B颜色通道图，rg、yb分别为第一特征图、第二特征图，δ_rg、μ_rg分别为第一特征图中各像素值的标准差和均值，δ_yb、μ_yb分别为第二特征图中各像素值的标准差和均值。

图6示出了根据本发明一个实施例的图像色彩丰富度的计算结果的示意图。图6中示出了6个图像，图像的文件名中示出了图像的色彩丰富度。如图6所示，这6个图像的色彩丰富度分别为14.855700093422765、14.857330262191422、14.860075361798382、64.56655855100613、64.62912836116101和64.92810294736846，即，第一行的三个图像色彩丰富度较低，第二行的三个图像色彩丰富度较高。

根据一种实施例，图像的美感度按照以下步骤确定：将图像输入预设的美感度评估模型，以便美感度评估模型输出图像的美感度。

应当指出，本发明对美感度评估模型的具体结构不做限制，任意能够对图像进行评价并输出其美感度的网络结构均在本发明的保护范围之内。图7示出了根据本发明一个实施例的美感度评估模型的结构图。

如图7所示，美感度评估模型包括依次相连的分类网络、全连接层(FC)和Softmax分类层。其中，分类网络例如可以是采用VGG-16在ImageNet训练集上的预训练网络。Softmax分类层适于输出图像的美感度得分，得分分值例如可以是0～10。将模型输出的分值乘以10，可以将美感度得分转化为百分制(即0～100)。

美感度评估模型例如可以采用公开的训练集AVA dataset来训练，AVA dataset是一个美学质量评估的数据库，大约有255000个图像。每个图像都有大概200人参与1-10的打分，平均分值越高，代表图像质量越好。在本发明的实施例中，将AVA dataset中图像的平均得分作为该图像的美感度标签，并将标注了美感度的图像作为训练样本，训练得出美感度评估模型。

采用训练好的美感度评估模型对数据存储装置110中存储的产品库中的全车系图进行美感度评分，得到各图像的美感度，并将美感度转化为百分制，即转化成0～100之间的数值。

图8示出了根据本发明一个实施例的图像美感度的计算结果的示意图。图8中示出了9个图像，图像的文件名中示出了图像的美感度得分。图像的美感度得分越高，表示其质量越好，视觉效果越好。

在确定了图像的色彩丰富度和美感度后，将色彩丰富度与美感度的加权求和结果作为图像的质量得分。即，图像的质量得分scoreIQA按照以下公式计算：

scoreIQA＝W_cc*colorScore+W_art*artScore

其中，colorScore、artScore分别为图像的色彩丰富度和美感度，W_cc、W_art分别为色彩丰富度和美感度权重。应当指出，权重的具体取值可以由本领域技术人员自行设置，本发明对此不做限制。

在本发明的实施例中，除了生成标题模板、确定各图像的类别和质量得分外，还需要设置用户标签与插槽类型和图像类别的对应关系，并将该对应关系存储至数据存储装置110中。

用户标签与插槽类型的对应关系可以由本领域技术人员自行设置，本发明对此不做限制。一个用户标签可以对应于一个或多个插槽。例如，可以设置用户标签“外观”对应于key-waiguan、key-desc、pingjia等插槽；用户标签“空间”对应于key-kongjian、key-desc、pingjia等插槽；等等。

用户标签与图像类别的对应关系可以由本领域技术人员自行设置，本发明对此不做限制。一个用户标签可以对应于一个或多个图像类型。例如，可以设置用户标签与图像类别的对应关系如下表3所示：

表3

基于数据存储装置110中存储的标题模板、图像及其类别和质量得分、以及用户标签与插槽类型和图像类别的对应关系，计算设备300可以执行本发明的标题图文生成方法900，根据文章内容和目标用户群的标签自动生成标题图文，实现动态的、定制化的内容推荐，保证标题图文呈现良好的视觉效果，提高对目标用户的吸引度。

图9示出了根据本发明一个实施例的标题图文生成方法900的流程图。如图9所示，方法900始于步骤S910。

在步骤S910中，获取文章内容及其目标用户群的标签。

例如，以下是一篇介绍途观L车系的文章内容：

“在中型SUV这个级别市场的大舞台上，22-35万元价位区间品牌交错、车系众多。正因如此，过量的信息让消费者难以消化，也让消费称为一种受罪。今天小编就结合着这个级别市场，给大家推荐一个德系品牌大众。途观L在该级别市场属于第一梯队，凭借着单月31830415人的品牌效应以及这段时间市场的集中发力，关注热度为4234606人，其品牌力具体表现如何呢？我们先从参数配置上做一下了解！有人说，车内是人生的第三空间。对于一天5％的时间都在车内的当代人，车内空间成了选车考量的重点要素，宽裕舒适是极佳之选。小编先从数据上带您了解今天这款车型的空间。在空间上，495-1780L的行李箱容积和5个座位的设计，就能判断出该车在设计之初对于空间用途的考量，加上2791mm的轴距尺寸和4712mm、1839mm、1673mm的车身长宽高，结合看官您自身的条件，相信您一定对这辆车的空间有了自己的判断了吧？对于各位喜欢旅行的朋友来说，对于汽车的通过性一定并不陌生。良好的通过性不仅驾驶起来更加舒适，而且也能够更好应对各种坏路地带。对于通过性，不管是前置四驱的驱动方式，还是麦弗逊式独立悬架与多连杆式独立悬架的配置，甚至承载式车体结构，都让2019款380TSI自动四驱R-Line尊崇旗舰版更多了一丝动感。而紧致的底盘调校，感觉不到虚位的方向盘，都给了驾驶者更多的驾驶自信。最近网络上很流行的一类短视频，就是一个人，眼睛也好看，鼻子也好看，嘴巴也好看，但是放在一起，颜值却变得特别平庸。我觉得这一点在车上同样适用，一辆车是否有颜值一定要把它的“五官”放到一起说。在外观方面，作为中型SUV车型，整车尺寸可达：4712mm、1839mm、1673mm，2791mm的轴距，在保障通过性的前提下，又带来更多空间舒适性。车身颜色上，有玄武黑、桑巴橙、冰岛银、天漠金、极光白、峻岭棕几种颜色可选，内饰包含了酷雅黑、黑色/豪雅棕颜色可选，整体车身线条简洁、比例协调，行驶在路上，还是很吸引眼球的。除此之外，车灯采用LED车灯，照明效果非常不错。徘徊于中型SUV这个级别时长，购车预算在这个价位区间的，在参数配置项做完功课后，不妨在已购车用户发布的产品口碑上看看该车是否符合你的需求，但如果窥探途观L良久，那就赶紧到店试驾吧，多说无益，试驾后才知道适合不适合你！”

途观L车系的目标用户群是关注空间、外观的用户，即目标用户群的标签为空间、外观。

在步骤S920中，从文章内容中提取出关键词，每个关键词对应于至少一种插槽。

根据一种实施例，基于预设的插槽类型对文章内容进行命名实体识别，以识别出对应于不同插槽类型的文本内容，并将这些文本内容作为关键词。例如，基于前述表2中定义的80种插槽，对步骤S910中的文章内容进行识别，识别出中型SUV、22-35万、大众、途观L、495-1780L的行李箱容积、四驱、空间舒适等关键词。

其中，中型SUV对应于car_model插槽，22-35万对应于money-jibie插槽，大众对应于brand插槽，途观L对应于car插槽，495-1780L的行李箱容积对应于key-kongjian插槽，四驱对应于car_xiushi插槽，空间舒适对应于key-desc、pingjia插槽。

在步骤S930中，从已存储的多个标题模板中筛选出至少一个候选模板，候选模板中包括分别与每一个标签对应的插槽。

目标用户群具有至少一个标签，如上文所述，用户标签与插槽类型存在对应关系，在步骤S930所筛选出的每一个候选模板所包括的插槽均应当能够对应目标用户群的所有标签。

例如，目标用户群的标签为空间、外观，空间对应的插槽包括key-kongjian、key-desc、pingjia等，外观对应的插槽包括key-waiguan、key-desc、pingjia等。筛选出的候选模板所包括的插槽应当同时能够匹配空间和外观两个标签，例如，筛选出的候选模板如下：

候选模板1：毫不夸张的说，它将是{money}{pingjia}的{car_model}！

候选模板2：{money-jibie}预算买{car_xiushi}{car_model}，{key-desc}，看了不后悔

候选模板3：{key-waiguan}{key-kongjian}{brand}{kuan}{car}{money}

在候选模板1中，pingjia插槽同时对应于外观和空间两个标签；在候选模板2中，key-desc插槽同时对应于外观和空间两个标签；在候选模板3中，key-waiguan插槽对应于外观标签，key-kongjian插槽对应于空间标签。

在步骤S940中，从至少一个候选模板中选择一个作为目标模板，将相应的关键词填充至目标模板的插槽中，以生成标题文本。

根据一种实施例，从至少一个候选模板中随机选择一个作为目标模板。例如，候选模板为上述候选模板1～候选模板3，从中随机选择一个，例如选择候选模板2作为目标模板。

候选模板2包括money-jibie、car_xiushi、car_model、key-desc四个插槽。在步骤S920中，提取出的对应于money-jibie插槽的关键词为22-35万，对应于car_xiushi插槽的关键词为四驱，对应于car_model插槽的关键词为中型SUV，对应于key-desc插槽的关键词为空间舒适。将各个关键词填充至相应的插槽中，生成标题文本：22-35万预算买四驱中型SUV，空间舒适，看了不后悔。

在步骤S950中，从已存储的多个图像中筛选出至少一个候选图像，候选图像的类别对应于至少一个标签。

目标用户群具有至少一个标签，根据用户标签与图像类别的对应关系，可以从已存储的图像中分别筛选出相应类别的候选图像。例如，目标用户群的标签为外观、空间，参见前述表3，外观对应于车尾侧向、车尾正向、车头正向、车头侧向、车侧面(左或右)、外后视镜、前脸、雾灯、前灯、尾灯10个图像类别，空间对应于车内空间展示、后备箱、中控全景、座椅全景4个类别，相应地，可以从已存储的相应车系(例如途观L)的图像中，筛选出类别标签为上述14种(10+4)的图像。

在步骤S960中，从至少一个候选图像中选择一个作为标题图像。

根据一种实施例，可以从质量得分最高的多个候选图像中随机选择一个作为标题图像。例如，按照质量得分由高到低的顺序对步骤S950中筛选出的候选图像进行排序，然后从质量得分最高的5个候选图像中随机选择一个作为标题图像。

根据一种实施例，在确定标题图像后，将标题图像裁剪至预设尺寸。预设尺寸的值可以由本领域技术人员根据客户端以及应用场景自行设置，本发明对此不做限制。例如，在移动App端的某个信息流内容展示界面中，可以将预设尺寸设置为400*300px(像素)。通过裁剪可以使标题图像的尺寸与信息流内容的展示尺寸相匹配，从而使标题图像适配不同客户端(例如PC网页端、移动网页端、移动App端等)以及不同应用场景。

当生成标题文本和标题图像后，将标题文本和标题图像发送至目标用户群的用户终端，以将标题文本和标题图像呈现给目标用户。呈现效果如前述图2所示。

应当指出，虽然在图9所示的实施例中，步骤S920～S960依次顺序执行，即先生成标题文本，再生成标题图像，但本发明并不限制步骤S920～S960的执行顺序。在一些实施例中，步骤S920～S940与步骤S950～S960可以并行执行，即，标题文本和标题图像并行生成；或者，可以先执行步骤S950～S960，再执行步骤S920～S940，即先生成标题图像，再生成标题文本。

A9、如权利要求7或8所述的方法，其中，图像的美感度按照以下步骤确定：

将图像输入预设的美感度评估模型，以便所述美感度评估模型输出所述图像的美感度。

A10、如权利要求1-9中任一项所述的方法，还包括步骤：

将所述标题图像裁剪至预设尺寸。

A11、如权利要求1-10中任一项所述的方法，还包括步骤：

将所述标题文本和所述标题图像发送至目标用户的用户终端，以将所述标题文本和所述标题图像呈现给目标用户。

这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被所述机器执行时，所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的所述程序代码中的指令，执行本发明的标题图文生成方法。

以示例而非限制的方式，可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中，算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种标题图文生成方法，在计算设备中执行，所述计算设备与数据存储装置连接，所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系，其中，每个所述标题模板包括至少一个待填充内容的插槽，所述方法包括：

获取文章内容及其目标用户群的标签；

从所述文章内容中提取出关键词，每个所述关键词对应于至少一种插槽；

从已存储的多个标题模板中筛选出至少一个候选模板，所述候选模板中包括分别与每一个所述标签对应的插槽；

从所述至少一个候选模板中选择一个作为目标模板，将相应的关键词填充至所述目标模板的插槽中，以生成标题文本；以及

从已存储的多个图像中筛选出至少一个候选图像，所述候选图像的类别对应于至少一个所述标签；

从所述至少一个候选图像中选择一个作为标题图像。

2.如权利要求1所述的方法，其中，数据存储装置中存储的多个标题模板按照以下步骤生成：

将点击率大于预设阈值或点击率最大的多个标题作为高点击标题；

基于预设的插槽类型对高点击标题进行命名实体识别，确定其中插槽的位置和类型从而生成标题模板。

3.如权利要求1或2所述的方法，其中，所述从所述文章内容中提取出关键词的步骤包括：

基于预设的插槽类型对所述文章内容进行命名实体识别，以识别出对应于不同插槽类型的文本内容，并将所述文本内容作为关键词。

4.如权利要求1-3中任一项所述的方法，其中，所述从所述至少一个候选模板中选择一个作为目标模板的步骤包括：

从所述至少一个候选模板中随机选择一个作为目标模板。

5.如权利要求1-4中任一项所述的方法，其中，图像的类别按照以下步骤确定：

将已标注类别的图像作为训练样本，训练分类模型；

采用训练好的分类模型来确定待分类的图像的类别。

6.如权利要求1-5中任一项所述方法，其中，所述数据存储装置中还存储有每个图像的质量得分，所述从所述至少一个候选图像中选择一个作为标题图像的步骤包括：

从质量得分最高的多个候选图像中随机选择一个作为标题图像。

7.如权利要求6所述的方法，其中，图像的质量得分按照以下步骤确定：

分别确定图像的色彩丰富度和美感度；

将色彩丰富度与美感度的加权求和结果作为图像的质量得分。

8.如权利要求7所述的方法，其中，图像的色彩丰富度C按照以下公式计算：

C＝δ_rgyb+0.3*μ_rgyb

其中，

rg＝R-G

9.一种计算设备，包括：

至少一个处理器和存储有程序指令的存储器；

当所述程序指令被所述处理器读取并执行时，使得所述计算设备执行如权利要求1-8中任一项所述的标题图文生成方法。

10.一种存储有程序指令的可读存储介质，当所述程序指令被计算设备读取并执行时，使得所述计算设备执行如权利要求1-8中任一项所述的标题图文生成方法。