WO2021164255A1

WO2021164255A1 - 一种演示文稿生成方法、装置、计算机设备及存储介质

Info

Publication number: WO2021164255A1
Application number: PCT/CN2020/118004
Authority: WO
Inventors: 谢静文; 阮晓雯; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-28
Filing date: 2020-09-27
Publication date: 2021-08-26
Also published as: CN111881307B; CN111881307A

Abstract

本申请公开了一种演示文稿生成方法、装置、计算机设备及存储介质，涉及人工智能，其中方法部分包括：接收用户通过客户端输入的演示文稿的主体关键词；在文本素材库中进行文本素材搜索；将文本素材进行拼接整合；进行文稿风格分析处理；确定演示文稿整体风格信息；将子主题和子主题对应的主题段落输入关键词抽取模型进行相关词提取；将段落关键词输入图片库中进行搜索，生成关键词对应的演示文稿。本申请通过简单的主体关键词，就能进行素材搜索、图片素材搜索、风格推荐、格式排版，节约了前期大量的信息搜索、整合工作的时间，以实现客户端输入的主体关键词后快速自动生成对应的演示文稿，解决了现有技术中演示文稿的生成效率低的问题。

Description

一种演示文稿生成方法、装置、计算机设备及存储介质

本申请要求于2020年7月28日提交中国专利局、申请号为202010737234.X，申请名称为“一种演示文稿生成方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种演示文稿生成方法、装置、计算机设备及存储介质。

背景技术

随着互联网技术的不断发展，演示文稿的制作水平逐步提高，应用领域越来越广，正成为人们工作生活的重要组成部分，并在工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询、教育培训等领域占着举足轻重的地位。演示文稿的应用领域日益广泛，人们对幻灯片的制作需求也越来越多。演示文稿已经成为现代社会工作中必不可少的表现形式，通常汇报类的演示文稿形式较为规整统一，内容也相对固定。

技术问题

目前用户在制作演示文稿时，申请人意识到，需要依靠人工手动利用搜索引擎搜索相关的信息，人工手动从成千上万篇的文献中筛选所需的素材，所需的素材需要包含有大量文字、图片等，接着手动搭建演示文稿框架，再在演示文稿框架上进行素材的填充，最后对排版进行美化，这种手动整理演示文稿素材的方式不仅十分耗时耗力，影响用户体验，也影响了演示文稿的生成效率。

技术解决方案

本申请提供一种演示文稿生成方法、装置、计算机设备及存储介质，以解决演示文稿生成效率低的问题。

一种演示文稿生成方法，包括：接收用户通过客户端输入的演示文稿的主体关键词；利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；将多个所述文本素材进行拼接整合，得到整体文本素材；对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

一种演示文稿生成装置，包括：接收模块，接收用户通过客户端输入的演示文稿的主体关键词；第一搜索模块，利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；拼接整合模块，将多个所述文本素材进行拼接整合，得到整体文本素材；识别拆解模块，对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；分析模块，利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；确定模块，根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；提取模块，将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；第二搜索模块，将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；生成模块，根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：接收用户通过客户端输入的演示文稿的主体关键词；利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；将多个所述文本素材进行拼接整合，得到整体文本素材；对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：接收用户通过客户端输入的演示文稿的主体关键词；利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；将多个所述文本素材进行拼接整合，得到整体文本素材；对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

有益效果

上述演示文稿生成方法、装置、计算机设备及存储介质，所实现的其中一个方案中接收用户通过客户端输入的主体关键词；利用主体关键词在文本素材库中进行文本素材搜索；将文本素材进行拼接整合；利用关键词和所述子主题进行演示文稿风格分析处理；确定演示文稿整体风格信息；将子主题和子主题对应的主题段落输入关键词抽取模型进行相关词提取；将多个相关词输入图片库中进行搜索，生成关键词对应的演示文稿。本申请通过用户输入的简单的主体关键词，就能完成文本素材、图片信息的智能搜索，同时结合主体关键词的类型，给出风格贴切的演示文稿模板推荐，节约了前期大量的信息搜索、整合工作的时间，基于关键词进行素材搜索、图片素材搜索、风格推荐、格式排版，以实现客户端输入的主体关键词后快速自动生成对应的演示文稿，解决了现有技术中演示文稿的生成效率低的问题。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请的技术方案，下面将对本申请的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中演示文稿生成方法的一应用环境示意图；

图2是本申请一实施例中演示文稿生成方法的一流程图；

图3是本申请一实施例中演示文稿生成方法的另一流程图；

图4是本申请一实施例中演示文稿生成方法的另一流程图；

图5是本申请一实施例中演示文稿生成方法的另一流程图；

图6是本申请一实施例中演示文稿生成方法的另一流程图；

图7是本申请一实施例中演示文稿生成方法的另一流程图；

图8是本申请一实施例中演示文稿生成方法的另一流程图；

图9是本申请一实施例中演示文稿生成装置的一原理框图；

图10是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的演示文稿生成方法，可应用在如图1的应用环境中，其中，服务端通过网络与客户端进行通信。

在一实施例中，如图2所示，提供一种演示文稿生成方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S10：接收用户通过客户端输入的演示文稿的主体关键词。

可理解地，在需要生成演示文稿时，客户端可提供接收用户通过输入的主体关键词，服务器可以接收该客户端反馈的主体关键词。其中，主体关键词可以为任意词，例如，针对大段的前沿科技新闻稿时，主体关键词可能为“5G”、“区域链”等。

S20：利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材。

可理解地，文本素材库可以为存储文本素材的素材库，例如利用主体关键词“5G”在文本素材库中进行搜索，得到“5G概念”、“5G发展现状”等相关的文本素材。

S30：将多个所述文本素材进行拼接整合，得到整体文本素材。

可理解地，整体文本素材是指与文本素材相关的文本内容。例如，将前述获取的“5G概念”、“5G发展现状”等相关的文本素材进行拼接整合，得到整体文本素材，也就是说，整体文本素材多个文本素材整合得到的关于5G的文本内容。

S40：对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落。

在一实施例中，所述整体文本素材包括多个自然段落，如图3所示，步骤S40中，也即所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落，具体包括如下步骤：

S41：以每个所述自然段落中的关键词为特征，利用无监督聚类模型对所述整体文本素材进行主题识别，得到N个所述子主题。

该步骤中，需要对整体文本素材进行细分主题识别，示例性地，以每个所述自然段落中的每句中的关键词为特征利用无监督聚类模型进行无监督聚类，该无监督聚类模型可以为K-means聚类，用于对将整体文本素材划分为N个子主题，例如，在“5G”主体关键词下的整体文本素材包括“历史发展”、“现有应用”、“未来趋势”等等的子主题。

S42：根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落。

例如，在“5G”主体关键词下的整体文本素材包括“历史发展”、“现有应用”、“未来趋势”等等的子主题，将“历史发展”、“现有应用”、“未来趋势”等等的子主题作为子主题关键词，利用子主题关键词对整体文本素材进行主题段落识别，识别出“历史发展”对应的主题段落为如下段落1：“1G时代，1986年，在美国芝加哥诞生，第一代移动通讯技术（1st Generation，简称1G）登上舞台等”，“现有应用”对应的主题段落为如下段落2：“现有5G应用在折叠车联网与自动驾驶、折叠外科手术、折叠智能电网等领域”。

最后将每个所述子主题与对应的主题段落以结构化的形式进行关联存储，可理解地，将所述整体文本素材中的每个子主题和对应的主题段落进行关联存储，如子主题“历史发展”对应的段落1的结构化的形式进行关联存储；每个子主题和对应的段落进行关联存储以便于后续生成与子主题相对应的排版模板，再根据该排版模板生成与子主题对应的幻灯片，而整体文本素材划分为N个子主题，每个子主题可以对应有不同的排版模板，进而再根据N个子主题所对应的幻灯片生成演示文稿。

在图3对应的实施例中，利用无监督聚类模型对整体文本素材进行主题识别，可划分出N个子主题，再根据N个子主题进行段落识别，以实现将整体文本素材拆解出不同主题对应的不同主题段落，最后将整体文本素材中的每个子主题和对应的主题段落进行关联存储，以形成较为清晰的文本逻辑框架，本方案针对整体文本素材进行逻辑结构的智能拆分，以保证段落内容分布的合理性，同时，使得后续生成的演示文稿具有较高的可读性。

在一实施例中，如图4所示，在步骤S42中，也即根据N个所述子主题对所述整体文本素材进行主题段落识别，所述识别出每个所述子主题对应的主题段落，具体包括如下步骤：

S421：利用Textrank算法对所述主题段落中的每个所述自然段落进行摘要提取处理，得到多个摘要。

S422：从所述自然段落提取的多个摘要中选取超过预设的重要值的摘要作为所述自然段落的关联句子。

该步骤中，利用包含语义信息的Textrank算法对所述主题段落中的每个所述自然段落进行摘要提取处理，得到多个摘要；可理解地，TextRank算法是基于图模型的一种抽取式摘要方法，TextRank算法利用一篇文档内部的词语间的语义信息便可以抽取该文档的摘要。TextRank算法进行摘要提取处理的原理：通过把自然段落分割成若干组成句子，用句子之间的相似度作为边的权重，通过循环迭代计算句子的TextRank值，选取每个所述自然段落的多个摘要；再所述自然段落提取的多个摘要中选取超过预设的重要值的摘要作为所述自然段落的关联句子。

S423：利用MMR模型对所述关联句子进行筛选，去除语义关联高的冗余句子，得到所述自然段落对应的目标句子。

可理解地，MMR是Maximal Marginal Releuance的缩写，中文为最大边界相关算法或最大边缘相关算法，MMR算法目的是减少排序结果的冗余，同时保证结果的相关性。

目标句子为语义不关联的句子，利用MMR模型对所述关联句子进行筛选，去除步骤S422获取的关联句子中语义关联高的冗余句子，得到目标句子。

S424：对所述子主题的所有所述自然段落对应的目标句子进行整合，得到所述子主题对应的主题段落。

可以理解地，将每个子主题下的所有所述自然段落对应目标句子进行整合，得到所述子主题对应的主题段落，以每个子主题下的主题段落对应的文本素材。

在图4对应的实施例中，针对主题段落中的每一个自然段落，利用包含语义信息的Textrank算法进行摘要提取处理，得到自然段落中重要性高的句子作为摘要，在选取超过预设的重要值的摘要的句子作为关联句子，再利用MMR模型去除语义关联高的冗余句子，得到每个子主题对应的文本素材，以防止文本素材关联性低或者文本素材过多显得冗余的问题，进而提高演示文稿具有较高的可读性。

在一实施例中，如图5所示，在步骤S40之后，也即在利用无监督聚类模型对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落之后，具体还包括如下步骤：

S43：检测所述子主题对应的主题段落中是否包含层级标题。

S44：若所述子主题对应的主题段落中包含层级标题，则对所述各个子主题对应的主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落。

示例性地，利用无监督聚类模型对子主题对应的主题段落材进行主题层级标题识别，以检测子主题对应的主题段落中是否包含层级标题；若述子主题对应的主题段落中包含层级标题，则检测出每个主题段落对应的层级标题，利用子层级标题对主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落；最后，主题段落中的每个层级标题和对应的层级进行关联存储。

进一步地，可以进一步判断层级段落中是否包括次层级标题，若层级段落中包含次层级标题，则对层级段落进行次层级段落拆解，得到次层级段落拆解后的各个次层级标题对应的次层级段落。

在图5对应的实施例中，若所述子主题对应的主题段落中包含层级标题，则对所述各个子主题对应的主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落，以实现将主题段落拆解出不同层级标题对应的不同层级段落，最后将主题段落中的每个层级标题和对应的层级进行关联存储，以形成更完整的整体的逻辑框架；此外，对主题段落进行层级拆解后，得到的层级标题和层级段落，能够生成可读性更高的演示文稿。

S50：利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果，得到风格分析结果。

可理解地，文稿风格分析处理也即文本情感分析(Sentiment Analysis)是指利用自然语言处理和文本挖掘技术，对带有情感色彩的主观性文本进行分析、处理和抽取的过程。可理解地，利用文本情感分析对所述主体关键词和所述子主题进行分析、处理和抽取，提取出所述主体关键词和所述子主题的情感，例如科技、浪漫、严肃等等情感；

该步骤中利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果，得到每个子主题对应的风格分析结果，其中，所述风格分析结果包括但不限于：科技风格、浪漫风格、严肃风格、清新风格、简约风格以及其他风格。这样，可确定每个所述子主题对应的风格分析结果。假如所述主体关键词的情感为科技，子主题的情感为严肃，则得到风格分析结果为科技且严肃风格，假如所述主体关键词的情感为科技，且子主题的情感也为科技，则得到风格分析结果为科技风格。

S60：根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息。

在一实施例中，如图6所示，步骤S60中，也即所述根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息，具体包括如下步骤：

S61：利用所述风格分析结果确定每个子主题对应的模板配色信息和主题段落对应的文本格式信息，其中，文本格式信息包括文本字体信息和文本字号信息。

S62：根据所述模板配色信息、文本字体信息和文本字号信息，确定演示文稿整体风格信息。

可理解地，模板配色信息是指风格模板对应的不同配色信息，利用所述风格分析结果从模板样本数据库查找子主题对应的模板配色信息，例如，风格分析结果为浪漫风格，则确定所述子主题对应的模板配色信息为粉色的浪漫模板；根据子主题查找到子主题到对应的主题段落对应的文本格式信息，详细可参见步骤S40，此处不再累述；利用所述风格分析结果确定子主题对应的主题段落对应的文本格式信息，可理解地，文本字体信息是指文本的字体型号，文本字号信息是指文本的字体大小，例如，风格分析结果为浪漫风格，在烂漫风格下的文本格式信息为五号的文本字号信息，宋体的文本字体信息，进一步地，烂漫风格下的文本配色为浅黄色；最后根据所述模板配色信息、文本字体信息和文本字号信息确定演示文稿整体风格信息。

在图6对应的实施例中，先根据风格分析结果，得到子主题对应的模板配色信息和拆解后的素材对应的文本格式信息，再根据模板配色信息、文本字体信息和文本字号信息，确定演示文稿整体风格信息，以使得后续生成的演示文稿切合度高。

S70：将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词。

可理解地，关键词抽取模型常见的算法有TF-IDF（term frequency-inverse document frequency)）、TextRank（Term Frequency）等，TF-IDF算法是一种用于资讯检索于资讯探勘的常用加权技术。是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数呈正比地增加，但同时也会随着它在语料库中出现的频率呈反比地下降。TextRank是一种基于图排序的算法，通过把文本分割成若干个单元（单词、句子)并建立图模型，利用投票机制对文本中的重要成分进行排序，尽利用单章文档本身的信息即可实现关键词提取、做文摘。将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，针对子主题对应的主题段落提取出与所述主题段落相关的相关词例，如针对大段的前沿科技新闻稿，相关词可能为“5G”、“区块链”、“大数据”等。

S80：将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片。

在一实施例中，如图7所示，步骤S80中，也即所述将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片，具体包括如下步骤：

S81：将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片。

S82：根据演示文稿排版模板对所述段落关键词对应的目标图片的尺寸进行处理以及目标图片的位置进行调整处理，得到调整后的目标图片。

可理解地，图片库中存储的图片均有相关的主题标签，将多个所述段落关键词输入图片库中进行搜索，得到段落关键词对应的目标图片。演示文稿的排版模板是指步骤S60中确定的演示文稿整体风格信息对应的标准的风格模板，不同的风格模板会对图片的大小有一定限制。由于图片库中的图片形状及清晰度都有区别，所以在生成带有图片的演示文稿时，图片库中的目标图片的像素与排版模板要求的图片像素可能会存在差别，因此需要对段落关键词对应的目标图片的尺寸进行处理，例如，搜索到的图片库中的目标图片的像素为400*500，而排版模板要求的图片像素为300*400, 则首先将图片库中的目标图片压缩为300*375，纵向像素剩余的25像素暂时用透明色填充。另外，在生成后的演示文稿中，用户也可以对目标图片的尺寸进行自行调整。

进一步地，由于图片库中的图片形状可能是多种形态的，例如，五角星形、圆形、三角形、多边形等，而排版模板要求的图片形状是固定的正方形，因此需要将段落关键词对应的目标图片进行裁剪处理，得到与排版模板要求的图片形状匹配的裁剪后的目标图片。

可理解地，演示文稿的排版模板包含图片对应的预设展示位置，根据演示文稿的排版模板可以确定出目标图片的位置，假如目标图片的位置存在偏离预设展示位置，则对目标图片的位置进行调整处理，得到调整后的目标图片。

另外，针对每页演示文稿中的显示内容，用户可以进行编辑或修改。例如，调整文本、图片、字体、颜色、文本框，以及添加图片到演示文稿的指定位置。

在图7对应的实施例中，根据演示文稿的模板对所述段落关键词对应的目标图片的尺寸进行处理以及目标图片的位置进行调整处理，以便于后续生成的演示文稿的目标图片不会出现偏大或者偏小、位置超出演示文稿或者位置过偏的问题，以使得后续生成的演示文稿的可读性强且更美观。

S90：根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

在一实施例中，如图8所示，步骤S90中，也即所述根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿，具体包括如下步骤：

S91：提取所述目标图片、演示文稿整体风格信息和主题段落的特征，得到对应的图片特征、文稿风格特征和主题段落特征。

可理解地，用于生成演示文稿的素材可以包括文本、图片、音频和视频中的至少一种，而根据素材类型的不同，素材对应的特征也是不同的，以主题段落为例，则主题段落的特征即主题段落特征指的就是段落中的文本行数、字体以及每行文字的格式等；目标图片的特征即图片特征指的就是图片的格式、类型等特征；风格特征指的是演示文稿对应的整体风格，详细可参见步骤S60，此处不再累述。

S92：将所述图片特征、主题段落特征和风格特征与预先存储的排版模板的排版规则进行匹配，得到每个子主题对应的匹配成功的排版模板。

可理解地，将所述图片特征、主题段落特征和风格特征与预先存储的排版模板的排版规则进行匹配，得到匹配成功的排版规则对应的排版模板；预先存储数据库中存储有演示文稿的不同排版模板以及对应的排版规则，例如一个排版模板的排版规则可以是针对具有三行文字的一页演示文稿而进行排版；或者是针对包含标题和正文的一页演示文稿进行排版，再或者是针对包含图片以及文字的演示文稿，根据图片及文字大小以及占据页面位置的比例进行排版等，不同的排版模板对应的排版规则可以是相同的，也就是说，同一个排版规则，可能对应有多个不同的排版模板；或者，根据排版模板的不同，排版模板的排版规则也可能是不同的，并且数据库中存储的排版模板会根据用户的需求不断更新。

将所述图片特征和主题段落特征与预先存储的排版模板的排版规则进行匹配，得到符合图片特征且符合主题段落特征的预先存储的排版模板的排版规则；可理解地，由于排版模板的排版规则与图片特征和主题段落特征具有对应的关系，所以，针对图片特征和主题段落特征在预先存储的排版模板以及对应的排版规则的数据库中，一个排版规则可能对应了多个不同的排版模板，因此，在进行图片特征和主题段落特征与预先存储的排版模板的排版规则进行匹配时，首先需要提取出数据库中各个排版模板对应的排版规则，再从所提取出来的所有排版规则中选出与图片特征及主题段落特征的特征相匹配的排版规则，进而根据匹配成功的排版规则，从数据库中查询出与其对应的各个排版模板。

例如，主题段落特征中存储3行文字，主题段落对应的子主题表示主题需要主级突出显示，主题题段落特征的第一行文字为 “某公司2018春季新品发布会”，次级突出显示，第二行文字为 “2018.04.09 14:30”，表示时间，可以非突出显示，第三行文字为“北京某大学体育馆”表示地点，也可以非突出显示。根据该主题题段落，可获取到其对应的主题段落特征为一页演示文稿中包含3行文字，其中，子主题主级突出显示，第一行次级突出显示，第二行及第三行为非突出显示，图片特征包括一张正方形图片，则根据该排版规则，可以利用从数据库中提取排版规则与该主题段落特征及图片特征进行匹配，进而可以查询出适用于一页演示文稿中包含子主题、3行文字及一张正方形图片的排版规则与上述主题段落特征及图片特征包匹配成功的排版模板，而符合该排版规则的排版模板可能有多种；因此还需要根据风格特征进一步确定出该排版规则的排版模板，例如风格特征为浪漫，则进一步匹配出风格特征为浪漫的排版模板。

另外，将匹配成功的排版规则对应的排版模板显示给所述用户，用户可以针对所述排版模板的进行预选定操作。

S93：利用每个子主题对应的匹配成功的排版模板，对所述目标图片、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

可理解地，利用匹配成功的排版规则对应的排版模板，对目标图片、子主题以及子主题对应的主题段落进行排版，使得每个子主题、与该子主体对应的主题段落、与该主题段落对应的目标图片，将使用其匹配成功的排版模板进行排版后生成与该子主题对应的幻灯片，进而再根据N个子主题所对应的幻灯片自动生成主体关键词对应的演示文稿。

在图8对应的实施例中，将所述图片特征、文稿风格特征和主题段落特征与预先存储的排版模板的排版规则进行匹配，并利用匹配成功的排版规则对应的排版模板进行排版，进而可以自动生成主体关键词对应的演示文稿，从而实现了更智能、自动化水平更高的演示文稿的生成方式，省时省力，既提升了用户体验，也提升了演示文稿的生成效率。

在图2对应的实施例中，本申请通过用户输入的简单的主体关键词，就能完成文本素材、图片信息的智能搜索，同时结合主体关键词的类型，给出风格贴切的演示文稿模板推荐，节约了前期大量的信息搜索、整合工作的时间，基于主体关键词进行素材搜索、图片素材搜索、风格推荐、格式排版，以实现客户端输入的主体关键词后快速自动生成对应的演示文稿，解决了现有技术中演示文稿的生成效率低的问题。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施过程构成任何限定。

在一实施例中，提供一种演示文稿生成装置，该演示文稿生成装置与上述实施例中演示文稿生成方法一一对应。如图9所示，该演示文稿生成装置包括接收模块10、第一搜索模块20、拼接整合模块30、识别拆解模块40、分析模块50、确定模块60、提取模块70、第二搜索模块80和生成模块90。各功能模块详细说明如下：接收模块10，接收用户通过客户端输入的演示文稿的主体关键词；第一搜索模块20，利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；拼接整合模块30，将多个所述文本素材进行拼接整合，得到整体文本素材；识别拆解模块40，对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；分析模块50，利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；确定模块60，根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；提取模块70，将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；第二搜索模块80，将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；生成模块90，根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

关于演示文稿生成装置的具体限定可以参见上文中对于演示文稿生成方法的限定，在此不再赘述。上述演示文稿生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，如图10所示，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：接收用户通过客户端输入的演示文稿的主体关键词；利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；将多个所述文本素材进行拼接整合，得到整体文本素材；对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

在一个实施例中，提供了一个或多个存储有计算机可读指令的可读存储介质，该可读存储介质上存储有计算机可读指令，本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器实现以下步骤：接收用户通过客户端输入的演示文稿的主体关键词；利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；将多个所述文本素材进行拼接整合，得到整体文本素材；对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种演示文稿生成方法，其中，包括：

接收用户通过客户端输入的演示文稿的主体关键词；

利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；

将多个所述文本素材进行拼接整合，得到整体文本素材；

对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；

利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；

根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；

将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。
如权利要求1所述的演示文稿生成方法，其中，所述整体文本素材包括多个自然段落，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落，包括：

以每个所述自然段落中的关键词为特征，利用无监督聚类模型对所述整体文本素材进行主题识别，得到N个所述子主题；

根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落。
如权利要求2所述的演示文稿生成方法，其中，所述根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落，包括：

利用Textrank算法对所述主题段落中的每个所述自然段落进行摘要提取处理，得到多个摘要；

从所述自然段落提取的多个摘要中选取超过预设的重要值的摘要作为所述自然段落的关联句子；

利用MMR模型对所述关联句子进行筛选，去除语义关联高的冗余句子，得到所述自然段落对应的目标句子；

对所述子主题的所有所述自然段落对应的目标句子进行整合，得到所述子主题对应的主题段落。
如权利要求1所述的演示文稿生成方法，其中，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落之后，还包括：

检测所述子主题对应的主题段落中是否包含层级标题；

若所述子主题对应的主题段落中包含层级标题，则对所述各个子主题对应的主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落。
如权利要求1所述的演示文稿生成方法，其中，所述根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息，包括：

利用所述风格分析结果确定每个所述子主题对应的模板配色信息和主题段落对应的文本格式信息，其中，文本格式信息包括文本字体信息和文本字号信息；

根据所述模板配色信息、文本字体信息和文本字号信息，确定演示文稿整体风格信息。
如权利要求1所述的演示文稿生成方法，其中，所述将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片，包括：

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据演示文稿排版模板对所述段落关键词对应的目标图片的尺寸进行处理以及目标图片的位置进行调整处理，得到调整后的目标图片。
如权利要求1所述的演示文稿生成方法，其中，所述根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿，包括：

提取所述目标图片、演示文稿整体风格信息和主题段落的特征，得到对应的图片特征、文稿风格特征和主题段落特征；

将所述图片特征、主题段落特征和风格特征与预先存储的排版模板的排版规则进行匹配，得到每个子主题对应的匹配成功的排版模板；

利用每个子主题对应的匹配成功的排版模板，对所述目标图片、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。
一种演示文稿生成装置，其中，包括：

接收模块，接收用户通过客户端输入的演示文稿的主体关键词；

第一搜索模块，利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；

拼接整合模块，将多个所述文本素材进行拼接整合，得到整体文本素材；

识别拆解模块，对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；

分析模块，利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；

确定模块，根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；

提取模块，将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；

第二搜索模块，将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

生成模块，根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其中，所述处理器执行所述计算机可读指令时实现如下步骤：

接收用户通过客户端输入的演示文稿的主体关键词；

利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；

将多个所述文本素材进行拼接整合，得到整体文本素材；

对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；

利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；

根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；

将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。
如权利要求9所述的计算机设备，其中，所述整体文本素材包括多个自然段落，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落，包括以下步骤：

以每个所述自然段落中的关键词为特征，利用无监督聚类模型对所述整体文本素材进行主题识别，得到N个所述子主题；

根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落。
如权利要求10所述的计算机设备，其中，所述根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落，包括以下步骤：

利用Textrank算法对所述主题段落中的每个所述自然段落进行摘要提取处理，得到多个摘要；

从所述自然段落提取的多个摘要中选取超过预设的重要值的摘要作为所述自然段落的关联句子；

利用MMR模型对所述关联句子进行筛选，去除语义关联高的冗余句子，得到所述自然段落对应的目标句子；

对所述子主题的所有所述自然段落对应的目标句子进行整合，得到所述子主题对应的主题段落。
如权利要求9所述的计算机设备，其中，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落之后，所述处理器执行所述计算机可读指令时还实现如下步骤：

检测所述子主题对应的主题段落中是否包含层级标题；

若所述子主题对应的主题段落中包含层级标题，则对所述各个子主题对应的主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落。
如权利要求9所述的计算机设备，其中，所述根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息，包括以下步骤：

利用所述风格分析结果确定每个所述子主题对应的模板配色信息和主题段落对应的文本格式信息，其中，文本格式信息包括文本字体信息和文本字号信息；

根据所述模板配色信息、文本字体信息和文本字号信息，确定演示文稿整体风格信息。
如权利要求9所述的计算机设备，其中，所述将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片，包括以下步骤：

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据演示文稿排版模板对所述段落关键词对应的目标图片的尺寸进行处理以及目标图片的位置进行调整处理，得到调整后的目标图片。
一个或多个存储有计算机可读指令的可读存储介质，其中，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

接收用户通过客户端输入的演示文稿的主体关键词；

利用所述主体关键词在文本素材库中进行文本素材搜索，得到多个文本素材；

将多个所述文本素材进行拼接整合，得到整体文本素材；

对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落；

利用所述关键词和所述子主题进行文稿风格分析处理，得到每个子主题对应的风格分析结果；

根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息；

将所述子主题和所述子主题对应的主题段落输入关键词抽取模型进行相关词提取，得到与所述主题段落相关的段落关键词；

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据所述目标图片、演示文稿整体风格信息、子主题以及子主题对应的主题段落进行排版，生成所述主体关键词对应的演示文稿。
如权利要求15所述的可读存储介质，其中，所述整体文本素材包括多个自然段落，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落，包括以下步骤：

以每个所述自然段落中的关键词为特征，利用无监督聚类模型对所述整体文本素材进行主题识别，得到N个所述子主题；

根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落。
如权利要求16所述的可读存储介质，其中，所述根据N个所述子主题对所述整体文本素材进行主题段落识别，识别出每个所述子主题对应的主题段落，包括以下步骤：

利用Textrank算法对所述主题段落中的每个所述自然段落进行摘要提取处理，得到多个摘要；

从所述自然段落提取的多个摘要中选取超过预设的重要值的摘要作为所述自然段落的关联句子；

利用MMR模型对所述关联句子进行筛选，去除语义关联高的冗余句子，得到所述自然段落对应的目标句子；

对所述子主题的所有所述自然段落对应的目标句子进行整合，得到所述子主题对应的主题段落。
如权利要求15所述的可读存储介质，其中，所述对所述整体文本素材进行主题识别和段落拆解，得到至少一个子主题，以及所述子主题对应的主题段落之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

检测所述子主题对应的主题段落中是否包含层级标题；

若所述子主题对应的主题段落中包含层级标题，则对所述各个子主题对应的主题段落进行层级段落拆解，得到层级段落拆解后的各个层级标题对应的层级段落。
如权利要求15所述的可读存储介质，其中，所述根据每个子主题对应的所述风格分析结果，确定演示文稿整体风格信息，包括以下步骤：

利用所述风格分析结果确定每个所述子主题对应的模板配色信息和主题段落对应的文本格式信息，其中，文本格式信息包括文本字体信息和文本字号信息；

根据所述模板配色信息、文本字体信息和文本字号信息，确定演示文稿整体风格信息。
如权利要求15所述的可读存储介质，其中，所述将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片，包括以下步骤：

将多个所述段落关键词输入图片库中进行搜索，得到所述段落关键词对应的目标图片；

根据演示文稿排版模板对所述段落关键词对应的目标图片的尺寸进行处理以及目标图片的位置进行调整处理，得到调整后的目标图片。