CN115795027A - 基于多文档生成演示文稿内容的方法、装置及设备 - Google Patents

基于多文档生成演示文稿内容的方法、装置及设备 Download PDF

Info

Publication number
CN115795027A
CN115795027A CN202211679889.1A CN202211679889A CN115795027A CN 115795027 A CN115795027 A CN 115795027A CN 202211679889 A CN202211679889 A CN 202211679889A CN 115795027 A CN115795027 A CN 115795027A
Authority
CN
China
Prior art keywords
sentences
document
presentation
fusion
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211679889.1A
Other languages
English (en)
Inventor
李亮城
高飞宇
于智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202211679889.1A priority Critical patent/CN115795027A/zh
Publication of CN115795027A publication Critical patent/CN115795027A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种基于多文档生成演示文稿内容的方法、装置及设备。本申请的方法,基于多个素材文档,对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征;根据句子的融合语义表征,筛选出作为演示文稿内容的备选句子;根据备选句子的融合语义表征生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子;根据演示文稿的多个标题信息和及其对应的备选句子,生成演示文稿内容,实现跨文档的内容整合与筛选,可以自动生成演示文稿的标题信息及标题信息下的内容,能基于多文档自动生成高质量的演示文稿内容,提升了基于多文档生成演示文稿内容的效率。

Description

基于多文档生成演示文稿内容的方法、装置及设备
技术领域
本申请涉及计算机技术,尤其涉及一种基于多文档生成演示文稿内容的方法、装置及设备。
背景技术
演示文稿(幻灯片)作为比较流行的结构化文档,通常用来提取和总结相对应文档的要点内容,并通过某种逻辑进行组织。演示文稿被广泛用于精炼文档的各种领域场景中,如学术报告等。制作一份演示文稿需要用户提炼和总结文档内容的关键点,并思考合理的逻辑组织结构,往往非常耗时耗力。利用人工智能(Artificial Intelligence,简称AI)自动生成演示文稿已被广泛研究和应用。
目前的演示文稿生成方案,通常采用基于规则的方法和机器学习方法进行内容提取和演示文稿生成。但已有的演示文稿生成方案只用于解决单文档生成对应的演示文稿,基于给定的标题从单一文档中摘取要点内容。在很多应用场景中,用户需要基于多文档生成演示文稿,与单文档生成演示文稿不同,多文档生成演示文稿需要在内容上考虑多文档中相似描述的冗余过滤和不同观点描述的矛盾解决,在结构上需要考虑一个贯穿多文档下的叙事路线。目前基于单文档生成演示文稿的方案,无法进行跨文档内容优化,无法应用于基于多文档生成演示文稿的场景。
发明内容
本申请提供一种基于多文档生成演示文稿内容的方法、装置及设备,用以解决基于多文档生成演示文稿的问题。
一方面,本申请提供一种基于多文档生成演示文稿内容的方法,包括:
响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子。
另一方面,本申请提供一种基于多文档生成演示文稿内容的装置,包括:
多文档获取单元,用于响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
文本编码单元,用于对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
内容筛选单元,用于根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
标题生成及演示文稿生成单元,用于根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子。
另一方面,本申请提供一种服务器,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现上述的基于多文档生成演示文稿内容的方法。
另一方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述的基于多文档生成演示文稿内容的方法。
另一方面,本申请提供一种基于多文档生成演示文稿内容的方法,包括:
响应于终端设备发送的演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子;
将所述演示文稿的多个标题信息和每一所述标题信息对应的备选句子输出至所述终端设备进行显示。
本申请提供的基于多文档生成演示文稿内容的方法、装置及设备,通过响应于演示文稿内容生成指令,获取用于生成演示文稿的多个素材文档,对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;根据所述备选句子的融合语义表征,生成所述演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子;根据所述演示文稿的多个标题信息和每一所述标题信息对应的备选句子,生成所述演示文稿,能够融合文档内和文档间的句子语义关系,对演示文稿的备选内容进行整合与筛选,并且能够自动生成演示文稿的标题信息,并匹配每一标题信息下的备选内容,实现了基于多文档自动生成高质量的演示文稿,相较于人工总结抽取演示文稿内容,提升了基于多文档生成演示文稿内容的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请所适用的一种示例性的系统架构图;
图2为本申请一示例性实施例提供的基于多文档生成演示文稿的总体流程框架图;
图3为本申请一示例性实施例提供的基于多文档生成演示文稿的方法流程图;
图4为本申请一示例性实施例提供的基于多文档生成演示文稿的详细流程图;
图5为本申请一示例性实施例提供的基于多文档生成演示文稿的一种示例框架图;
图6为本申请实施例提供的基于单文档生成演示文稿的模型训练框架图;
图7为本申请一示例性实施例提供的文档内容筛选模型训练的流程图;
图8为本申请一示例性实施例提供的文档内容筛选模型训练的框架图;
图9为本申请一示例性实施例提供的基于多文档生成演示文稿的方法的应用示意图;
图10为本申请一示例性实施例提供的基于多文档生成演示文稿内容的装置的结构示意图;
图11为本申请一示例实施例提供的服务器的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
首先对本申请所涉及的名词进行解释:
演示文稿:也称为幻灯片(PowerPoint,简称PPT),是一种结构化文档,通常由文字、图片等元素构成,通过简要总结性的叙述展示内容要点。
多文档(Multi-document):多篇文档构成的集合,通常能表达某些相关主题内容。
多模式学习(Multi-mode Learning):利用多种思想、路线和实现方式进行任务的学习方法。
KL散度,又称为KL散度值、Kullback-Leibler散度(Kullback-LeiblerDivergence)或信息散度(Information Divergence),是两个概率分布间差异的非对称性度量。
BERTopic:是一种主题建模技术,利用变换器(Transformers)和TF-ID创建密集簇,使主题易于理解,同时在主题描述中保留重要的单词。TF-IDF(Term Frequency–Inverse Document Frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。
目前,基于单文档(Single-document)生成演示文稿的方案有基于机器学习和基于规则的单文档生成演示文稿。其中,基于机器学习的单文档生成演示文稿的方案,通常将单文档中的文本内容进行编码表征,并通过编码(Encoder)-解码(Decoder)的方式,根据给定的标题或主题,解码摘取或生成相关的要点内容。基于规则的单文档生成演示文稿的方案,根据给定的标题或主题,通常利用传统的文档分析算法,基于词语的语义频率和简单的上下文规则检索提取相关的要点内容。多文档生成演示文稿和单文档不同,它需要在内容上考虑相似描述的冗余过滤和不同观点描述的矛盾解决,在结构上需要考虑一个贯穿多文档下的叙事路线,这往往需要更高层面和跨文档下的要点提取和内容重组。现有的基于单文档生成演示文稿的方案,无法直接用于多文档生成演示文稿,单文档生成演示文稿的数据无法直接用于多文档生成演示文稿的模型训练。
目前对于多文档进行处理的方案中包括:多文档摘要(Multi-documentSummarization)、主题建模(Topic Modeling)、关键词生成(Keywords Generation)等方案。其中,多文档摘方案要通常针对多篇基于相关主题下的文档内容,将多个文档内容的中心思想总结为一句或一小段概述性文本,通常包括抽取式(Extractive)摘要和生成式(Abstractive)摘要两大类方法。但是,多文档摘要的方法无法提取生成演示文稿所需的细节要点描述,以及合理的分页、子标题等结构总结能力,也无法用于多文档生成演示文稿。
主题建模(Topic Modeling)方案通常针对一篇或多篇文档的内容,通过聚类等方法提取若干语义聚簇,并解析得到相应的主题。但是仅仅生成了少量主题而无法提供生成演示文稿所需的具体要点内容描述,也无法用于多文档生成演示文稿。
关键词生成(Keywords Generation)方案通常针对一篇文档内容,提取其中关键和主要描述的若干语义,并生成若干用户能理解的主题关键词。但是仅仅生成了少量关键词而无法提供生成演示文稿所需的具体要点内容描述,也无法用于多文档生成演示文稿。
本申请提供一种基于多文档生成演示文稿内容的方法,响应于演示文稿内容生成指令,通过获取用于生成演示文稿内容的多个素材文档,对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征;根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子。进一步地,根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子,得到演示文稿的内容。本申请的方法,能够融合文档内和文档间的句子语义关系,对演示文稿的备选内容进行筛选与整合,能够自动生成演示文稿的标题信息,并匹配每一标题信息下的备选内容,基于标题信息可以实现演示文稿分标题或分页展示,从而实现演示文稿结构的控制,实现了基于多文档自动生成高质量的演示文稿内容,相较于人工整理演示文稿内容,大大提升了基于多文档生成演示文稿内容的效率。
另外,服务器还可以根据所生成的演示文稿内容,进一步生成演示文稿,并输出演示文稿;或者,服务器还可以输出所生成的演示文稿内容,以向用户提供制作演示文稿的参考内容。
图1为本申请所适用的一种示例性的系统架构图,如图1所示,该系统架构具体可包括服务器以及终端。
其中,服务器具体可为部署在云端的服务器集群,或者部署在本地的计算设备。终端具体可为具有网络通信功能、运算功能以及信息显示功能的硬件设备,其包括但不限于智能手机、平板电脑、台式电脑等。不同用户可以通过各自使用的终端与服务器进行数据交互。
用户可以通过所使用的终端向服务器提交用于生成演示文稿的多文档(包括多个素材文档),并发送演示文稿的生成指令。响应于接收到的演示文稿内容生成指令,服务器获取终端提交的多个素材文档,对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征;根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子;根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子,得到演示文稿内容。服务器还可以根据所生成的演示文稿内容,进一步生成演示文稿,并向终端输出演示文稿。或者,服务器还可以向终端输出所生成的演示文稿内容,以向用户提供制作演示文稿的参考内容。
图2为本申请一示例性实施例提供的基于多文档生成演示文稿的总体流程框架图,服务器存储有用于基于多文档生成演示文稿的模型。如图2所示,基于多文档生成演示文稿的模型包括文档处理模块、标题处理模块和演示文稿生成模块。其中,文档处理模块用于实现对多个素材文档进行文本编码和内容筛选,具体地,文本编码包括对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征。内容筛选包括根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子。标题处理模块用于进行标题生成和标题优化,具体地,根据备选句子的融合语义表征,生成演示文稿的多个标题信息,以及根据多个素材文档的原始文本对标题信息的语义表征进行优化。演示文稿生成模块用于进行文本摘要及标题句子匹配,具体地,根据标题信息的语义表征进行文本摘要,以解码出标题信息,并将标题信息的语义表征与备选句子的融合语义表征进行匹配,确定标题信息与备选句子的对应关系,从而得到演示文稿的标题信息及标题信息对应的备选句子,也即得到演示文稿的文本内容。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图3为本申请一示例性实施例提供的基于多文档生成演示文稿的方法流程图。本实施例的执行主体为上述提及的服务器。如图3所示,本实施例的方法具体步骤如下:
步骤S301、响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档。
在实际应用中,用户可以通过终端向服务器发送演示文稿内容生成指令,并向服务器提交用于生成演示文稿内容的多个素材文档。
示例性地,服务器可以通过终端提供能够向服务器上传用于生成演示文稿内容的多个素材文档的可视化操作页面,该操作页面上提供用于触发向服务器发送演示文稿内容生成指令的操作控件,用户通过终端向服务器上传多个素材文档之后,通过点击该操作控件向服务器发送演示文稿内容生成指令。
本实施例中,多个素材文档是能表达相关主题内容的多篇文档,每个素材文档中包含由一个或者多个句子组成的文本内容。素材文档可以是各种格式的文档,服务器可以从不同格式的素材文档中提取出文本内容,并基于多文档的文本内容生成演示文稿的内容。
步骤S302、对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征。
步骤S303、根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子。
在实际应用中,表达相关主题的多个不同的素材文档中,通常会有相似的描述、或相互矛盾的观点描述,不同的素材文档具有独有的组织结构和描述方式,也即具有独有的贯穿该文档的叙事路线。本实施例中,通过步骤S302对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征,实现对多个素材文档中的语句的语义整合。进一步地,通过步骤S303基于语义整合后句子的融合语义表征,对多个素材文档中的句子进行过滤筛选,得到作为演示文稿内容的备选句子,可以实现跨多文档的内容优化整合,可以避免生成的演示文稿内容包含冗余或矛盾的内容,使得生成的演示文稿内容的整体逻辑正确、合理,且演示文稿内容的连贯性更好。
步骤S304、根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子。
在对多文档进行语义融合及内容筛选,得到备选句子的融合语义表征之后,通过标题处理模块,根据备选句子的融合语义表征,对备选句子进行语义聚类,生成多个标题信息。
进一步地,将备选句子与标题信息进行语义匹配,确定每一标题信息对应的备选句子,每一标题信息对应的备选句子也即是每个标题信息下的演示内容。
本实施例的方法实现基于多文档生成演示文稿内容,可以表示为对于给定的一组文档D={d_1,d_2,…,d_n},其中,n表示用于生成演示文稿内容的文档数量。通过本实施例的方法生成标题信息T={t_1,t_2,…,t_m},以及标题信息对应的演示内容C={c_1,c_2,…,c_m},其中,m为标题信息的数量,c_i为标题信息t_i对应的演示内容,i在区间[1,m]中取值。任一标题信息对应的演示内容可以包括一个或者多个句子。
在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,根据标题信息以及标题信息的分组,可以控制演示文稿的分页,并确定演示文稿中每页包含的标题信息及备选句子,从而进一步可以生成一页或多页的演示文稿。
可选地,在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,服务器可以输出演示文稿的多个标题信息和每一标题信息对应的备选句子,以向用户提供演示文稿内容参考,使得用户可以使用生成的演示文稿内容来制作演示文稿,用户无需人工提炼和总结演示文稿内容,提升了演示文稿内容的生成效率,以及演示文稿的生成效率。
可选地,在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,服务器还可以根据演示文稿的多个标题信息和每一标题信息对应的备选句子,自动生成演示文稿,并输出生成的演示文稿,用户无需人工提炼和总结演示文稿内容、也无需手动制作演示内容,只需对已生成的演示文稿进行简单修改即可,提升了演示文稿内容的生成效率,以及演示文稿的生成效率。
示例性地,在根据演示文稿的多个标题信息和每一标题信息对应的备选句子,自动生成演示文稿时,可以将根据每一标题信息及对应的备选句子,生成一页演示文稿。进一步,还可以根据各组标题信息对应的主题对生成的演示文稿划分章节,从而生成有条理、具有合理结构的演示文稿。本实施例对于根据演示文稿的多个标题信息和每一标题信息对应的备选句子,生成的演示文稿的具体布局方式不做具体限定。
本实施例中,响应于演示文稿内容生成指令,通过获取用于生成演示文稿内容的多个素材文档,对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征;根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子。进一步地,根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子;能够融合文档内和文档间的句子语义关系,对演示文稿的备选内容进行整合与筛选,能够自动生成演示文稿的标题信息,并匹配每一标题信息下的备选内容,得到演示文稿内容,实现了基于多文档自动生成高质量的演示文稿,相较于人工总结抽取演示文稿内容,大大提升了基于多文档生成演示文稿内容的效率。
图4为本申请一示例性实施例提供的基于多文档生成演示文稿的详细流程图,图5为本申请实施例提供的基于多文档生成演示文稿的一种示例框架图,参见图4,基于图5所示的模型框架,基于多文档生成演示文稿的具体步骤如下:
步骤S400、响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档。
在实际应用中,用户可以通过终端向服务器发送演示文稿内容生成指令,并向服务器提交用于生成演示文稿内容的多个素材文档。
示例性地,服务器可以通过终端提供能够向服务器上传用于生成演示文稿内容的多个素材文档的可视化操作页面,该操作页面上提供用于触发向服务器发送演示文稿内容生成指令的操作控件,用户通过终端向服务器上传多个素材文档之后,通过点击该操作控件向服务器发送演示文稿内容生成指令。
本实施例中,多个素材文档是能表达相关主题内容的多篇文档,每个素材文档中包含由一个或者多个句子组成的文本内容。素材文档可以是各种格式的文档,服务器可以从不同格式的素材文档中提取出文本内容,并基于多文档的文本内容生成演示文稿的内容。
在获取到多个素材文档之后,根据多个素材文档的文本内容,通过如下步骤S401-S405,使用训练好的内容筛选模型,实现文档处理模块的功能。
步骤S401、将每一素材文档中的每个句子映射为嵌入向量。
该步骤中,将每一素材文档中的每个句子输入文档内容筛选模型的内容映射模块,通过内容映射模块将每个句子映射为对应的嵌入向量(embedding)。
其中,内容映射模块将每个句子映射为对应的嵌入向量,可以使用现有的任意一种将文本句子映射为嵌入向量(embedding)的方案实现,本实施例此处不做具体限定。例如,可以使用Bert模型、文本相似度(Sentence Transformer)模型等神经网络将输入的句子映射为嵌入向量;或者,通过获取句子中每个词的词向量,根据句子中各个词的词向量生成句子的嵌入向量。
步骤S402、通过文档内融合编码器,对于每个素材文档中的任意的第一句子,将第一句子的嵌入向量与同一素材文档中第二句子的嵌入向量融合,得到第一句子的第一融合表征。
在得到每一素材文档中每一句子的嵌入向量之后,通过文档内容筛选模型的文档内融合编码器,对于同一素材文档中句子的嵌入向量进行文档内的语义融合,以生成每一句子的第一融合表征。
具体地,用第一句子指代任意素材文档中的任意句子,用第二句子指代同一素材文档中除第一句子之外的句子。对于每个素材文档中的任意的第一句子,将第一句子的嵌入向量与同一素材文档中第二句子的嵌入向量融合,得到第一句子的第一融合表征。
示例性地,文档内融合编码器可以使用自注意力(Self-attention)模块实现。
可选地,该步骤中可以将第一句子的嵌入向量与所有第二句子的嵌入向量融合,得到第一句子的第一融合表征;或者,对于任意的第一句子,从同一素材文档中随机选择部分第二句子,将第一句子的嵌入向量与选择的部分第二句子的嵌入向量融合,得到第一句子的第一融合表征。
步骤S403、通过文档间融合编码器,将第一句子的嵌入向量与不同素材文档中的第三句子的嵌入向量融合,得到第一句子的第二融合表征。
在得到每一素材文档中每一句子的嵌入向量之后,通过文档内容筛选模型的文档间融合编码器,对于不同素材文档中句子的嵌入向量进行文档间的语义融合,以生成每一句子的第二融合表征。
具体地,用第一句子指代任意素材文档中的任意句子,用第三句子指代除第一句子所在素材文档外的其他素材文档中的句子。对于每个素材文档中的任意的第一句子,将第一句子的嵌入向量与不同素材文档中第三句子的嵌入向量融合,得到第一句子的第二融合表征。
示例性地,文档间融合编码器可以使用自注意力(Self-attention)模块实现。
可选地,该步骤中可以将第一句子的嵌入向量与所有第三句子的嵌入向量融合,得到第一句子的第二融合表征。或者,对于任意的第一句子,随机选择一个或多个不同的素材文档,将第一句子的嵌入向量与选择的素材文档中的第三句子的嵌入向量融合,得到第一句子的第二融合表征。或者,对于任意的第一句子,从每个不同的素材文档中随机选择部分第三句子,将第一句子的嵌入向量与选择的第三句子的嵌入向量融合,得到第一句子的第二融合表征。
步骤S404、将第一句子的第一融合表征与第二融合表征拼接,得到第一句子的融合语义表征。
在得到每个句子的第一融合表征与第二融合表征之后,通过将第一融合表征与第二融合表征拼接(contact),得到第一句子的融合语义表征。
在实际应用中,表达相关主题的多个不同的素材文档中,通常会有相似的描述、或相互矛盾的观点描述,不同的素材文档具有独有的组织结构和描述方式,也即具有独有的贯穿该文档的叙事路线。本实施例中,通过上述步骤S401-S404,实现对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征,可以实现对多个素材文档中的语句的语义整合。
步骤S405、通过内容筛选网络,根据多个素材文档中句子的融合语义表征计算每个句子作为演示内容的可用性信息。
在对多文档进行语义融合,得到多个素材文档中各个句子的融合语义表征之后,将各个句子的融合语义表征输入内容筛选网络,通过内容筛选网络对每个句子的重要性及关键性进行预测,从而确定每个句子作为演示内容的可用性信息。每个句子作为演示内容的可用性信息表示句子的重要性、关键性、以及作为演示内容的可能性。句子的可用性信息越大表示句子的内容越关键,句子被选为演示内容的可能性越高。句子的可用性信息越小表示句子的内容相对越不关键,句子被选为演示内容的可能性越低。
示例性地,内容筛选网络可以采用多层全连接层实现。
步骤S406、根据每个句子作为演示内容的可用性信息,筛选出可用性信息大于或等于可用性阈值的句子,得到作为演示文稿内容的备选句子。
在确定每个句子作为演示内容的可用性信息,根据预设的可用性阈值,筛选出可用性信息大于或等于可用性阈值的句子,将筛选出的句子作为演示文稿内容的备选句子。
通过上述步骤S405-S406,根据对多个素材文档进行语义整合后各个句子的融合语义表征,对多个素材文档中的句子进行过滤筛选,将筛选出的更为关键和重要的句子,作为演示文稿内容的备选句子,可以实现跨多文档的内容优化整合,可以避免生成的演示文稿内容包含冗余或矛盾的内容,使得生成的演示文稿内容的整体逻辑正确、合理,且演示文稿内容的连贯性更好。
在对多文档进行语义融合及内容筛选,得到备选句子的融合语义表征之后,通过步骤S407-S408,实现根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子。
步骤S407、根据备选句子的融合语义表征,生成多个标题信息。
该步骤中,通过标题处理模块,根据备选句子的融合语义表征,对备选句子进行语义聚类,生成演示文稿的多个标题信息。
可选地,该步骤中可以将备选句子的融合语义表征输入主题建模模型进行主题建模,通过该主题建模模型生成一组或多组标题信息。其中,每一组标题信息对应同一个主题,不同组的标题信息具有不同的主题。
示例性地,主题建模模型可以使用BERTopic模型或现有技术中具有类似功能的模型实现,本实施例此处不做具体限定。
可选地,该步骤中还可以使用关键词生成(Keywords Generation)的方法,提取备选句子中的关键和主要描述的若干语义信息,并生成用户能理解的多个主题关键词,作为演示文稿的标题信息。
可选地,在生成演示文稿的多个标题信息之后,还可以将每一标题信息与多个素材文档包含的词语和短语进行相似度匹配,确定每一标题信息相匹配的词语或短语;根据每一标题信息相匹配的词语或短语更新该标题信息,通过使用素材文档的原始内容对标题信息进行语义优化,使得优化后的标题信息的表达更准确、更通顺、更符合原始素材文档的表达风格。
具体地,根据标题信息的语义表征和多个素材文档包含的词语和短语的语义表征计算相似度,将相似度较高的一个词语或短语作为该标题信息相匹配的词语或短语,并使用该标题信息相匹配的词语或短语替换该标题信息,作为更新后的标题信息,使得优化后的标题信息来源于素材文档中的原始文本。
进一步地,在确定最终的标题信息之后,标题处理模块还用于通过标题编码器将标题信息编码为语义表征,得到每一标题信息的语义表征。标题信息的语义表征用于后续步骤S408中生成演示文稿内容。
示例性地,标题编码器可以使用Bert模型、Sentence Transformer模型等神经网络,将输入的标题信息映射为对应的嵌入向量,作为标题信息的语义表征。
步骤S408、通过指针网络解码器,将标题信息的语义表征和备选句子的融合语义表征进行语义匹配,确定每一标题信息对应的备选句子。
在得到演示文档的多个标题信息,以及作为演示内容的备选句子之后,该步骤中,使用基于指针网络(Pointer Network)的解码器进行演示文稿内容解码,确定每一标题信息对应的备选句子,从而得到演示文稿的标题及各个标题下具体内容。
其中,考虑到缺乏充足的多文档生成演示文稿的成对标注数据,本方案采用预训练好单文档生成演示文稿的模型网络,并移植其基于指针网络(Pointer Network的演示文稿解码器,作为基于多文档确定的备选句子的融合语义特征和标题信息的语义特征,进行演示文稿内容解码所使用的指针网络解码器,来控制多文档生成演示文稿内容的形式风格,最终完成基于多文档的演示文稿内容的生成。
示例性地,利用基于单文档生成演示文稿的大量监督数据训练Encoder-Decoder模式下单文档生成演示文稿的模型,将训练好的单文档生成演示文稿的模型的编码器和解码器移植到本方案中,编码器用于将生成的标题信息编码为语义特征,解码器用于基于多文档确定的备选句子的融合语义特征和标题信息的语义特征,解码生成演示文稿内容,能够控制多文档生成演示文稿内容的形式风格。
示例性地,图6为本申请实施例提供的基于单文档生成演示文稿的模型训练框架图,在实际应用中,可以获取到大量的单一文档对应的演示文稿,将单文档对应的演示文稿作为标签数据,构建包括单文档及对应的演示文稿标签数据的训练集。基于该训练集训练基于单文档生成演示文稿的模型。参见图6,对训练集中的文档的句子映射为句子的嵌入向量,通过内容编码器对句子的嵌入向量进行内容编码,生成句子的语境化的语义表征。对训练集中的演示文稿标签数据,分别对标题(标签)和标题下的句子(标签)映射为标签标题的嵌入向量和标签句子的嵌入向量。根据标签标题的嵌入向量和文档中句子的语义表征,通过演示文稿解码器进行解码,生成演示文稿内容,包括每一标签标题对应的预测句子。将每一标签标题对应的预测句子映射为对应的嵌入向量。将同一标签标题的标签句子的嵌入向量和预测句子的嵌入向量进行内容匹配并计算损失,根据损失更新模型的内容编码器和演示文稿解码器,以获取训练好的基于单文档生成演示文稿的模型。
步骤S409、根据演示文稿的多个标题信息和每一标题信息对应的备选句子,生成演示文稿,并输出生成的演示文稿。
本实施例中,在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,根据标题信息以及标题信息的分组,可以控制演示文稿的分页,并确定演示文稿中每页包含的标题信息及备选句子,从而进一步可以生成一页或多页的演示文稿。
本实施例的一种可选实施方式中,在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,服务器执行步骤S409,根据演示文稿的多个标题信息和每一标题信息对应的备选句子,自动生成演示文稿,并输出生成的演示文稿,用户无需人工提炼和总结演示文稿内容、也无需手动制作演示内容,只需对已生成的演示文稿进行简单修改即可,提升了演示文稿内容的生成效率,以及演示文稿的生成效率。
示例性地,在根据演示文稿的多个标题信息和每一标题信息对应的备选句子,自动生成演示文稿时,可以将根据每一标题信息及对应的备选句子,生成一页演示文稿。进一步,还可以根据各组标题信息对应的主题对生成的演示文稿划分章节,从而生成有条理、具有合理结构的演示文稿。
本实施例中对于根据演示文稿的多个标题信息和每一标题信息对应的备选句子,生成的演示文稿的具体布局方式不做具体限定。
进一步地,对于生成的演示文稿,服务器可以通过前端页面显示所生成的演示文稿;或者,服务器可以根据预设存储路径存储演示文稿,并输出提示信息,提示信息用于指示演示文稿已存储到预设存储路径,或用于提供演示文稿的下载链接信息。
在其他实施例中,在得到演示文稿的多个标题信息,以及每一标题信息对应的备选句子之后,服务器还可以直接输出演示文稿的多个标题信息和每一标题信息对应的备选句子,以向用户提供演示文稿内容参考,使得用户可以使用生成的演示文稿内容来制作演示文稿,用户无需人工提炼和总结演示文稿内容,提升了演示文稿内容的生成效率,以及演示文稿的生成效率。
本实施例中,通过使用训练好的文档内容筛选模型,对多个素材文档中的语句进行文档内和文档间的语义整合,生成每个句子的融合语义表征,基于语义整合后句子的融合语义表征,对多个素材文档中的句子进行过滤筛选,得到作为演示文稿内容的备选句子,可以实现跨多文档的内容优化整合,可以避免生成的演示文稿内容包含冗余或矛盾的内容,使得生成的演示文稿内容的整体逻辑正确、合理,且演示文稿内容的连贯性更好。根据备选句子的融合语义表征,通过主题建模模型,自动生成演示文稿的一个组或多组标题信息,在结构上对演示文稿的标题和分页进行控制。通过移植训练好的演示文稿解码器,对标题信息的语义特征和备选句子的融合语义特征进行解码,得到演示文稿的页面内容,在风格上对生成的演示文稿内容文本化,实现了基于多文档自动生成演示文稿内容的方案,提升了演示文稿内容的生成效率,从而提升了演示文稿的生成/制作效率。
在一可选实施例中,图7为本申请一示例性实施例提供的文档内容筛选模型训练的流程图,图8为本申请一示例性实施例提供的文档内容筛选模型训练的框架图。考虑到实际应用中缺乏基于多文档生成演示文稿的标注数据,针对监督数据不足的问题,本实施例中,可以基于图8所示框架,利用引用网络来获取多文档的文献综述,将文献综述包含的句子标注为作为演示文稿内容的目标句子,在标注数据资源匮乏的情况下,通过这种方式构建带有标注的监督数据,解决监督数据匮乏的问题。
基于图8所示框架,参见图7,对文档内容筛选模型进行训练的具体步骤如下:
步骤S701、获取多文档的训练集,训练集包括多条训练数据,每一训练数据包括多个样本文档,以及多个样本文档对应的文献综述,文献综述包含的句子被标注为作为演示文稿内容的目标句子。
其中,每一训练数据中的多个样本文档是能表达相关主题内容的多篇文档,每个样本文档中包含由一个或者多个句子组成的文本内容。样本文档可以是各种格式的文档,服务器可以从不同格式的样本文档中提取出文本内容,并基于多文档的文本内容生成演示文稿的内容。
该步骤中,获取多个样本文档,并通过如下方式获取每一训练数据中多个样本文档的文献综述:使用引用网络检索同时引用了多个样本文档的文献,将文献中的一个作为多个样本文档对应的文献综述。多个样本文档及对应的文献综述组成一条训练数据。
步骤S702、针对每条训练数据,通过文档内融合编码器和文档间融合编码器,对同一样本文档内的句子进行文档内的语义融合,对不同样本文档的句子进行文档间的语义融合,并生成每个样本文档中每个句子的融合语义表征。
该步骤中,对每一训练数据中多个样本文档,通过文档内融合编码器和文档间融合编码器,对同一样本文档内的句子进行文档内的语义融合,对不同样本文档的句子进行文档间的语义融合,并生成每个样本文档中每个句子的融合语义表征,这一过程的具体实现与上述步骤S401-S404中对多个素材文档进行相应处理的实现方式一致,具体参见上述实施例中的相关内容,本实施例此处不再赘述。
步骤S703、通过内容筛选网络,根据多个样本文档中句子的融合语义表征,从多个样本文档中筛选出作为演示文稿内容的备选句子。
该步骤中,通过内容筛选网络,从多个样本文档中筛选出作为演示文稿内容的备选句子的具体实现方式,与上述步骤S405-S406通过内容筛选网络,从多个素材文档中筛选出作为演示文稿内容的备选句子的实现方式一致,具体参见上述实施例中的相关内容,本实施例此处不再赘述。
步骤S704、根据备选句子和目标句子,优化文档内融合编码器、文档间融合编码器和内容筛选网络。
该步骤中,将多个样本文档对应文献综述中包含目标句子,作为应该被筛选作为演示文稿内容的句子,根据通过文档内容筛选模型从多个样本文档中筛选出的备选句子,以及应该被筛选出的目标句子,计算损失,并根据损失优化文档内容筛选模型的模型参数。文档内容筛选模型中可训练的模型参数包括文档内融合编码器、文档间融合编码器和内容筛选网络的权重参数。
可选地,该步骤中,根据备选句子和目标句子,计算交叉熵损失函数值;根据交叉熵损失函数值,优化文档内融合编码器、文档间融合编码器和内容筛选网络的模型参数。
示例性地,可以根据备选句子的可用性信息和目标句子采用如下公式,来计算交叉熵损失函数值:
Figure BDA0004018505390000131
其中,Lsm表示交叉熵损失函数值。C(si,j)表示第i个样本文档中的第j个句子是否为目标句子,也即是否应该被选择,如果第i个样本文档中的第j个句子包含在对应的文献综述中,也即该句子是目标句子,则C(si,j)=1;否则C(si,j)=0。Score(si,j)表示通过内容筛选网络确定的第i个样本文档中的第j个句子的可用性信息,表示该句子作为演示文稿内容被选择的可能性。
Figure BDA0004018505390000141
表示根据第i个样本文档中的第j个句子的可用性信息确定的该句子是否作为备选句子的预测结果,如果该句子第i个样本文档中的第j个句子被确定为备选句子,则
Figure BDA0004018505390000142
否则
Figure BDA0004018505390000143
可选地,考虑到筛选出的作为演示文稿内的备选句子,应该形成一定的文档级连贯语义而不是简单的句子集合,该步骤中还可以针对文献综述中原始的目标句子和经过模型筛选确定的备选句子,计算目标句子的语义表征和备选句子融合语义表征间的KL散度值,来衡量和约束备选句子和目标句子间的语义距离。
示例性地,该步骤中,根据备选句子和目标句子,计算交叉熵损失函数值,并根据备选句子的融合语义表征和目标句子的语义表征,计算KL散度值;根据交叉熵损失函数值和KL散度值,优化文档内融合编码器、文档间融合编码器和内容筛选网络的模型参数。
具体地,根据交叉熵损失函数值和KL散度值,计算综合损失,根据综合损失优化文档内融合编码器、文档间融合编码器和内容筛选网络的模型参数。
示例性地,可以将交叉熵损失函数值和KL散度值求和,将求和结果作为综合损失;或者,根据交叉熵损失函数值和KL散度值的不同权重系数,对交叉熵损失函数值和KL散度值加权求和,将加权求和结果作为综合损失。
本实施例中,虑到跨文档间语句的关联性,提供了融合文档内和文档间语义的文档内容筛选模型,通过文档内和文档间两种层面的注意力机制对每篇文档中的每个语句进行融合表征,生成每个句子的融合语义表征,在通过全连接层作为内容筛选网络计算每个句子的可用性信息,表示句子作为演示文稿内容的可能性和可用性大小,能够实现跨文档的句子的筛选和整合。另外,由于缺乏筛选句子的标注数据,利用引用网络(CitationNetwork)检索并获取多文档集合对应的文献综述(literal review doc),利用文献综述中包含的语句作为挑选句子的标注,构建自监督学习的训练集,通过自监督学习的方式训练文档内容筛选模型。
本实施例与前述实施例结合,内容上利用多文档的文献综述形成自监督数据集,融合文档内和文档间的句子关系对演示文稿的候选内容进行筛选与整合;结构上通过无监督的基于BERT的主题建模模型对演示文稿的标题和分页进行控制;风格上通过移植预训练好的相似单文档生成演示文稿的模型的演示文稿解码器,对生成的演示文稿内容文本化;在标注数据资源匮乏的情况下,通过多模式学习的方法,从内容、结构和风格三个方面解决了在标注数据匮乏下,无法直接端到端训练得到多文档生成演示文稿内容的问题,实现基于多文档自动生成演示文稿内容,提高演示文稿内容的生成效率。
本申请实施例提供的基于多文档生成演示文稿内容的方法可以在云端来执行,在云端可以部署有若干计算节点(云服务器),每个计算节点中都具有计算、存储等处理资源。在云端,可以组织由多个计算节点来提供某种服务,当然,一个计算节点也可以提供一种或多种服务。云端提供该服务的方式可以是对外提供服务接口,用户调用该服务接口以使用相应的服务。
针对本申请实施例提供的方案,云端可以提供有设定服务(基于多文档生成演示文稿内容的服务)的服务接口,用户通过终端设备调用该服务接口,以向云端发送演示文稿内容生成指令,该指令中包括用于生成演示文稿内容的多个素材文档。云端确定响应该请求的计算节点,利用该计算节点中的处理资源执行如下步骤:
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子;
将所述演示文稿的多个标题信息和每一所述标题信息对应的备选句子输出至所述终端设备进行显示。
上述执行过程可以参考前述其他实施例中的相关说明,在此不赘述。
为便于理解,结合图9来示例性说明。用户可以通过图9中示意的终端设备E1调用基于多文档生成演示文稿内容的服务,以上传用于生成演示文稿内容的多个素材文档。用户调用该服务的服务接口包括软件开发工具包(Software Development Kit,简称SDK)、应用程序接口(Application Programming Interface,简称API)等形式。图9中示意的是API接口的情形。在云端,如图中所示,假设由服务集群E2提供基于多文档生成演示文稿内容的服务,服务集群E2中包括至少一个计算节点。服务集群E2收到该指令后,执行前述实施例中的步骤,以得到演示文稿的多个标题信息和每一所述标题信息对应的备选句子,并反馈给终端设备E1。
终端设备E1基于收到的演示文稿的多个标题信息和每一所述标题信息对应的备选句子在界面中进行展示。并且,可以接收用户的交互操作,并进行相应响应。
图10为本申请一示例性实施例提供的基于多文档生成演示文稿内容的装置的结构示意图。本申请实施例提供的基于多文档生成演示文稿内容的装置可以执行基于多文档生成演示文稿内容的方法实施例提供的处理流程。如图10所示,该基于多文档生成演示文稿内容的装置90包括:多文档获取单元91、文本编码单元92、内容筛选单元93和标题生成及演示文稿生成单元94。
其中,多文档获取单元91用于响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档。
文本编码单元92用于对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征。
内容筛选单元93用于根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子。
标题生成及演示文稿生成单元94用于根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子。
在一可选实施例中,在实现对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个素材文档中每个句子的融合语义表征时,文本编码单元92还用于:
将每一素材文档中的每个句子映射为嵌入向量;通过文档内融合编码器,对于每个素材文档中的任意的第一句子,将第一句子的嵌入向量与同一素材文档中第二句子的嵌入向量融合,得到第一句子的第一融合表征;并通过文档间融合编码器,将第一句子的嵌入向量与不同素材文档中的第三句子的嵌入向量融合,得到第一句子的第二融合表征;将第一句子的第一融合表征与第二融合表征拼接,得到第一句子的融合语义表征。
在一可选实施例中,在实现根据多个素材文档中句子的融合语义表征,从多个素材文档中筛选出作为演示文稿内容的备选句子时,文本编码单元92还用于:
通过内容筛选网络,根据多个素材文档中句子的融合语义表征计算每个句子作为演示内容的可用性信息;根据每个句子作为演示内容的可用性信息,筛选出可用性信息大于或等于可用性阈值的句子,得到作为演示文稿内容的备选句子。
在一可选实施例中,该基于多文档生成演示文稿内容的装置90还包括:
模型训练单元,用于:
获取多文档的训练集,训练集包括多条训练数据,每一训练数据包括多个样本文档,以及多个样本文档对应的文献综述,文献综述包含的句子被标注为作为演示文稿内容的目标句子;针对每条训练数据,通过文档内融合编码器和文档间融合编码器,对同一样本文档内的句子进行文档内的语义融合,对不同样本文档的句子进行文档间的语义融合,并生成每个样本文档中每个句子的融合语义表征;并通过内容筛选网络,根据多个样本文档中句子的融合语义表征,从多个样本文档中筛选出作为演示文稿内容的备选句子;根据备选句子和目标句子,优化文档内融合编码器、文档间融合编码器和内容筛选网络。
在一可选实施例中,在实现根据备选句子和目标句子,优化文档内融合编码器、文档间融合编码器和内容筛选网络时,模型训练单元还用于:
根据备选句子和目标句子,计算交叉熵损失函数值,并根据备选句子的融合语义表征和目标句子的语义表征,计算KL散度值;根据交叉熵损失函数值和KL散度值,优化文档内融合编码器、文档间融合编码器和内容筛选网络的模型参数。
在一可选实施例中,在实现获取多文档的训练集时,模型训练单元还用于:
获取多个样本文档,使用引用网络检索同时引用了多个样本文档的文献;将文献中的一个作为多个样本文档对应的文献综述,多个样本文档及对应的文献综述组成一条训练数据。
在一可选实施例中,在实现根据备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一标题信息对应的备选句子时,标题生成及演示文稿生成单元94包括:
标题处理模块,用于根据备选句子的融合语义表征,生成多个标题信息。
演示文稿生成模块,用于通过指针网络解码器,将标题信息的语义表征和备选句子的融合语义表征进行语义匹配,确定每一标题信息对应的备选句子。
在一可选实施例中,在实现根据备选句子的融合语义表征,生成多个标题信息时,标题处理模块还用于:
将备选句子的融合语义表征输入主题建模模型进行主题建模,生成至少一组标题信息,每一组标题信息对应同一个主题。
在一可选实施例中,在根据备选句子的融合语义表征,生成多个标题信息之后,标题处理模块还用于:
将每一标题信息与多个素材文档包含的词语和短语进行相似度匹配,确定每一标题信息相匹配的词语或短语;根据每一标题信息相匹配的词语或短语更新该标题信息。
在一可选实施例中,演示文稿生成模块还用于:
根据演示文稿的多个标题信息和每一标题信息对应的备选句子,生成演示文稿,并输出生成的演示文稿;或者,输出演示文稿的多个标题信息和每一标题信息对应的备选句子。
本申请实施例提供的装置可以具体用于执行上述任一方法实施例提供的方法,所实现具体功能和所能实现的技术效果此处不再赘述。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。“多个”的含义是两个以上,除非另有明确具体的限定。
图11为本申请一示例实施例提供的服务器的结构示意图。如图11所示,该服务器100包括:处理器1001,以及与处理器1001通信连接的存储器1002,存储器1002存储计算机执行指令。
其中,处理器执行存储器存储的计算机执行指令,以实现上述任一方法实施例所提供的方案,具体功能和所能实现的技术效果此处不再赘述。
示例性地,该服务器可以为云服务器,云服务器的存储器可被配置为存储其它各种数据以支持在云服务器上的操作。该存储器可以是对象存储(Object Storage Service,OSS)。
存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
进一步,该云服务器还包括:防火墙、负载均衡器、通信组件、电源组件等其它组件。其中,通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述任一方法实施例所提供的方案,具体功能和所能实现的技术效果此处不再赘述。
本申请实施例还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一方法实施例所提供的方案,具体功能和所能实现的技术效果此处不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (14)

1.一种基于多文档生成演示文稿内容的方法,其特征在于,包括:
响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子。
2.根据权利要求1所述的方法,其特征在于,所述对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征,包括:
将每一所述素材文档中的每个句子映射为嵌入向量;
通过文档内融合编码器,对于每个素材文档中的任意的第一句子,将所述第一句子的嵌入向量与同一素材文档中第二句子的嵌入向量融合,得到所述第一句子的第一融合表征;并通过文档间融合编码器,将所述第一句子的嵌入向量与不同素材文档中的第三句子的嵌入向量融合,得到所述第一句子的第二融合表征;
将所述第一句子的第一融合表征与第二融合表征拼接,得到所述第一句子的融合语义表征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子,包括:
通过内容筛选网络,根据所述多个素材文档中句子的融合语义表征计算每个句子作为演示内容的可用性信息;
根据每个句子作为演示内容的可用性信息,筛选出可用性信息大于或等于可用性阈值的句子,得到作为演示文稿内容的备选句子。
4.根据权利要求3所述的方法,其特征在于,还包括:
获取多文档的训练集,所述训练集包括多条训练数据,每一训练数据包括多个样本文档,以及所述多个样本文档对应的文献综述,所述文献综述包含的句子被标注为作为演示文稿内容的目标句子;
针对每条训练数据,通过所述文档内融合编码器和文档间融合编码器,对同一样本文档内的句子进行文档内的语义融合,对不同样本文档的句子进行文档间的语义融合,并生成每个所述样本文档中每个句子的融合语义表征;
并通过所述内容筛选网络,根据所述多个样本文档中句子的融合语义表征,从所述多个样本文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子和所述目标句子,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络。
5.根据权利要求4所述的方法,其特征在于,所述根据所述备选句子和所述目标句子,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络,包括:
根据所述备选句子和所述目标句子,计算交叉熵损失函数值,并根据所述备选句子的融合语义表征和所述目标句子的语义表征,计算KL散度值;
根据所述交叉熵损失函数值和所述KL散度值,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络的模型参数。
6.根据权利要求4所述的方法,其特征在于,所述获取多文档的训练集,包括:
获取多个样本文档,使用引用网络检索同时引用了所述多个样本文档的文献;
将所述文献中的一个作为所述多个样本文档对应的文献综述,所述多个样本文档及对应的文献综述组成一条训练数据。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子,包括:
根据所述备选句子的融合语义表征,生成多个标题信息;
通过指针网络解码器,将所述标题信息的语义表征和所述备选句子的融合语义表征进行语义匹配,确定每一所述标题信息对应的备选句子。
8.根据权利要求7所述的方法,其特征在于,所述根据所述备选句子的融合语义表征,生成多个标题信息,包括:
将所述备选句子的融合语义表征输入主题建模模型进行主题建模,生成至少一组标题信息,每一组标题信息对应同一个主题。
9.根据权利要求7所述的方法,其特征在于,所述根据所述备选句子的融合语义表征,生成多个标题信息之后,还包括:
将每一所述标题信息与所述多个素材文档包含的词语和短语进行相似度匹配,确定每一所述标题信息相匹配的词语或短语;
根据每一所述标题信息相匹配的词语或短语更新该标题信息。
10.根据权利要求1-6中任一项所述的方法,其特征在于,还包括:
根据演示文稿的多个标题信息和每一所述标题信息对应的备选句子,生成演示文稿,并输出生成的演示文稿;
或者,
输出演示文稿的多个标题信息和每一所述标题信息对应的备选句子。
11.一种基于多文档生成演示文稿内容的装置,其特征在于,包括:
多文档获取单元,用于响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
文本编码单元,用于对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
内容筛选单元,用于根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
标题生成及演示文稿生成单元,用于根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子。
12.一种服务器,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-10中任一项所述的方法。
14.一种基于多文档生成演示文稿内容的方法,其特征在于,包括:
响应于终端设备发送的演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子;
将所述演示文稿的多个标题信息和每一所述标题信息对应的备选句子输出至所述终端设备进行显示。
CN202211679889.1A 2022-12-26 2022-12-26 基于多文档生成演示文稿内容的方法、装置及设备 Pending CN115795027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211679889.1A CN115795027A (zh) 2022-12-26 2022-12-26 基于多文档生成演示文稿内容的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211679889.1A CN115795027A (zh) 2022-12-26 2022-12-26 基于多文档生成演示文稿内容的方法、装置及设备

Publications (1)

Publication Number Publication Date
CN115795027A true CN115795027A (zh) 2023-03-14

Family

ID=85427865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211679889.1A Pending CN115795027A (zh) 2022-12-26 2022-12-26 基于多文档生成演示文稿内容的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115795027A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579308A (zh) * 2023-07-06 2023-08-11 之江实验室 一种演示文稿生成方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579308A (zh) * 2023-07-06 2023-08-11 之江实验室 一种演示文稿生成方法及装置
CN116579308B (zh) * 2023-07-06 2023-10-10 之江实验室 一种演示文稿生成方法及装置

Similar Documents

Publication Publication Date Title
US11599714B2 (en) Methods and systems for modeling complex taxonomies with natural language understanding
CN111967242B (zh) 一种文本信息的抽取方法、装置及设备
CN112203122A (zh) 基于人工智能的相似视频处理方法、装置及电子设备
CN110852106B (zh) 基于人工智能的命名实体处理方法、装置及电子设备
CN116702737B (zh) 文案生成方法、装置、设备、存储介质及产品
CN115587175A (zh) 人机对话及预训练语言模型训练方法、系统及电子设备
US20180260389A1 (en) Electronic document segmentation and relation discovery between elements for natural language processing
US11669679B2 (en) Text sequence generating method and apparatus, device and medium
CN113011126B (zh) 文本处理方法、装置、电子设备及计算机可读存储介质
CN116340467B (zh) 文本处理方法、装置、电子设备、及计算机可读存储介质
CN115795027A (zh) 基于多文档生成演示文稿内容的方法、装置及设备
CN116881462A (zh) 文本数据处理、文本表示、文本聚类的方法及设备
CN115129976B (zh) 一种资源召回方法、装置、设备及存储介质
US20230376537A1 (en) Multi-chunk relationship extraction and maximization of query answer coherence
US20210117920A1 (en) Patent preparation system
CN115129885A (zh) 实体链指方法、装置、设备及存储介质
CN113656560A (zh) 情感类别的预测方法和装置、存储介质及电子设备
CN114330296A (zh) 新词发现方法、装置、设备以及存储介质
CN117093604B (zh) 检索信息生成方法、装置、电子设备和计算机可读介质
Wang et al. RSRNeT: a novel multi-modal network framework for named entity recognition and relation extraction
CN116226678B (zh) 模型处理方法、装置、设备及存储介质
US12032605B2 (en) Searchable data structure for electronic documents
CN115269851B (zh) 文章分类方法、装置、电子设备、存储介质及程序产品
CN116894089B (zh) 摘要生成方法、装置、设备、存储介质及产品
US20230153335A1 (en) Searchable data structure for electronic documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination