CN109815448B - 幻灯片生成方法及装置 - Google Patents

幻灯片生成方法及装置 Download PDF

Info

Publication number
CN109815448B
CN109815448B CN201910106366.XA CN201910106366A CN109815448B CN 109815448 B CN109815448 B CN 109815448B CN 201910106366 A CN201910106366 A CN 201910106366A CN 109815448 B CN109815448 B CN 109815448B
Authority
CN
China
Prior art keywords
generating
slide
user
design picture
generation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910106366.XA
Other languages
English (en)
Other versions
CN109815448A (zh
Inventor
俞亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin ByteDance Technology Co Ltd
Original Assignee
Tianjin ByteDance Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin ByteDance Technology Co Ltd filed Critical Tianjin ByteDance Technology Co Ltd
Priority to CN201910106366.XA priority Critical patent/CN109815448B/zh
Publication of CN109815448A publication Critical patent/CN109815448A/zh
Application granted granted Critical
Publication of CN109815448B publication Critical patent/CN109815448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开提出了一种幻灯片生成方法及装置,其中,方法包括:获取用户输入的描述内容,并根据描述内容提取文字向量;将文字向量输入到第一生成模型中进行处理,生成设计图片;将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。由此,基于机器学习模型实现了根据用户的描述自动生成幻灯片,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。

Description

幻灯片生成方法及装置
技术领域
本公开涉及机器学习技术领域,尤其涉及一种幻灯片生成方法及装置。
背景技术
幻灯片(也称演示文稿)可以将静态文件制作成动态文件展示,使复杂的问题变得通俗易懂,给人留下更为深刻的印象。目前,演示文稿正成为人们工作生活的重要组成部分,在工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询等领域被广泛使用。随着现代公司的发展,公司内部对幻灯片的制作需求也与日俱增。
相关技术中,方案一可以通过专门的制作人员来制作专业的幻灯片,耗费的时间精力成本较高,制作效率低下。方案二可以根据幻灯片模板生成简单幻灯片,然而生成的幻灯片可能并不符合用户期望,例如模板不符合用户期望时,由于现在的模板非常多样,用户想找到自己预想的模板需要耗费较多时间进行搜索筛选。
发明内容
本公开提供一种幻灯片生成方法及装置,用于解决相关技术中幻灯片制作成本较高效率低下、无法短时间内获取符合用户期望的幻灯片的技术问题。
为此,本公开一方面提出一种幻灯片生成方法,基于机器学习模型实现了根据用户的描述自动生成幻灯片,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。
本公开另一方面提出一种幻灯片生成装置。
本公开另一方面提出一种电子设备。
本公开又一方面提出一种计算机可读存储介质。
本公开第一方面实施例提出了一种幻灯片生成方法,包括:
获取用户输入的描述内容,并根据所述描述内容提取文字向量;
将所述文字向量输入到第一生成模型中进行处理,生成设计图片;
将所述设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据所述XML文件生成幻灯片。
本公开实施例的幻灯片生成方法,通过获取用户输入的描述内容,并根据描述内容提取文字向量,进而,将文字向量输入到第一生成模型中进行处理,生成设计图片。进一步,将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。由此,基于机器学习模型实现了根据用户的描述自动生成幻灯片,解决了相关技术中幻灯片制作成本较高效率低下、无法短时间内获取符合用户期望的幻灯片的问题,无需用户进行搜索,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。
另外,根据本公开上述实施例的幻灯片生成方法还可以具有如下附加技术特征:
可选地,将所述文字向量输入到第一生成模型中进行处理,生成设计图片包括:获取预设的噪声矩阵,并将所述文字向量和所述噪声矩阵输入到所述第一生成模型中进行处理,生成设计图片。
可选地,所述将所述文字向量和所述噪声矩阵输入到第一生成模型中进行处理,生成设计图片包括:将所述文字向量和所述噪声矩阵合并为目标矩阵,对所述目标矩阵进行矩阵变换,生成图片矩阵,根据所述图片矩阵生成设计图片。
可选地,在将所述文字向量输入到第一生成模型中进行处理之前,还包括:收集描述内容语料和对应的设计图片样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第一生成模型。
可选地,在将所述设计图片输入到第二生成模型中进行处理之前,还包括:收集设计图片训练数据与对应的XML文件样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第二生成模型。
可选地,在根据所述XML文件生成幻灯片之前,还包括:获取预设的可替换字段,其中,所述可替换字段为所述XML文件中的字段;确定所述描述内容中与所述可替换字段对应的描述字段;所述根据所述XML文件生成幻灯片,包括:根据所述描述字段替换所述可替换字段,生成修改后的XML文件,并根据所述修改后的XML文件生成幻灯片。
本公开第二方面实施例提出了一种幻灯片生成装置,包括:
获取模块,用于获取用户输入的描述内容,并根据所述描述内容提取文字向量;
第一生成模块,用于将所述文字向量输入到第一生成模型中进行处理,生成设计图片;
第二生成模块,用于将所述设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据所述XML文件生成幻灯片。
本公开实施例的幻灯片生成装置,通过获取描述内容,并根据描述内容提取文字向量,进而,将文字向量输入到第一生成模型中进行处理,获取设计图片。进一步,将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。由此,基于机器学习模型实现了根据用户的描述自动生成幻灯片,解决了相关技术中幻灯片制作成本较高效率低下、无法短时间内获取符合用户期望的幻灯片的问题,无需用户进行搜索,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。
另外,根据本公开上述实施例的幻灯片生成装置还可以具有如下附加技术特征:
可选地,所述第一生成模块具体用于:获取预设的噪声矩阵,并将所述文字向量和所述噪声矩阵输入到所述第一生成模型中进行处理,获取设计图片。
可选地,所述第一生成模块具体用于:将所述文字向量和所述噪声矩阵合并为目标矩阵,对所述目标矩阵进行矩阵变换,生成图片矩阵,根据所述图片矩阵生成设计图片。
可选地,所述的装置还包括:第一训练模块,用于收集描述内容语料和对应的设计图片样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第一生成模型。
可选地,所述的装置还包括:第二训练模块,用于收集设计图片训练数据与对应的XML文件作为训练集;根据所述训练集训练预设模型的参数,生成所述第二生成模型。
可选地,所述的装置还包括:处理模块,用于获取预设的可替换字段,其中,所述可替换字段为所述XML文件中的字段;确定所述描述内容中与所述可替换字段对应的描述字段;
所述第二生成模块具体用于:根据所述描述字段替换所述可替换字段,生成修改后的XML文件,并根据所述修改后的XML文件生成幻灯片。
本公开第三方面实施例提出了一种电子设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的幻灯片生成方法。
本公开第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的幻灯片生成方法。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
图1为本公开实施例所提供的一种幻灯片生成方法的流程示意图;
图2为本公开实施例所提供的另一种幻灯片生成方法的流程示意图;
图3为本公开实施例所提供的一种设计图片的示意图;
图4为本公开实施例所提供的一种第一生成模型训练示意图;
图5为本公开实施例所提供的一种第一生成模型应用示意图;
图6为本公开实施例所提供的另一种幻灯片生成方法的流程示意图;
图7为本公开实施例所提供的一种第二生成模型训练示意图;
图8为本公开实施例所提供的一种第二生成模型应用示意图;
图9为本公开实施例所提供的一种幻灯片生成装置的结构示意图;
图10为本公开实施例所提供的另一种幻灯片生成装置的结构示意图;
图11示出了适于用来实现本公开实施例的电子设备的结构示意图;
图12为图示根据本公开的实施例的计算机可读存储介质的示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的幻灯片生成方法及装置。
图1为本公开实施例所提供的一种幻灯片生成方法的流程示意图,如图1所示,该方法包括:
步骤101,获取用户输入的描述内容,并根据描述内容提取文字向量。
本公开实施例中,在生成幻灯片时,可以先获取对于幻灯片的描述内容。其中,描述内容包括但不限于描述背景样式、描述文字样式、风格、标题、描述等。
作为一种可能的实现方式,可以获取用户按照预设的格式输入的文字形式的描述内容。例如,红色背景,白色粗体文字,商务风格,标题:商务报告,描述:一种竞品分析。再例如,浅绿背景,白色细体文字,文艺风格,标题:一种植物,描述:一个不多见的东西。
作为另一种可能的实现方式,可以获取用户通过选择选项的方式输入的描述内容。例如,用户在描述背景样式选项中选择背景颜色,比如黑色、红色等。
作为另一种可能的实现方式,还可以获取用户语音输入的描述内容。
在本公开的一个实施例中,在获取用户输入的描述内容后,还可以对描述内容进行文字编码,以获取文字向量。例如,可以通过Word2vec(word to vector,用来产生词向量的相关模型)网络获取描述内容的词向量。比如,将风格“文艺”输入到Word2vec网络中,生成对应的词向量。
需要说明的是,上述获取文字向量的实现方式仅为一种示例,此处不作限制。
步骤102,将文字向量输入到第一生成模型中进行处理,生成设计图片。
在本公开的一个实施例中,可以获取描述内容语料与对应的设计图片的训练集,并根据训练集训练预设模型的参数,生成第一生成模型。进而,将文字向量输入到第一生成模型中进行处理,生成设计图片。
其中,第一生成模型包括但不限于GAN网络(Generative Adversarial Network,生成对抗网络)等神经网络模型。
作为一种示例,可以预先收集描述内容语料与对应的设计图片,例如每条描述内容语料可以对应一个设计图片。进而根据描述内容语料提取文字向量,并通过文字向量与对应的设计图片训练预设模型的参数,生成第一生成模型,使第一生成模型输入为文字向量,输出为幻灯片的设计图片。进而,根据文字向量输入到第一生成模型中进行处理,可以获取相应的设计图片。
步骤103,将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。
在本公开的一个实施例中,可以获取设计图片训练数据与对应的XML(eXtensibleMarkup Language,可扩展标记语言)文件的训练集,并根据训练集训练预设模型的参数,生成第二生成模型。进而,将设计图片输入到第二生成模型中进行处理,获取XML文件。
其中,第二生成模型包括但不限于VAEs(Variational auto-encoder,变分自编码器)网络等生成模型。
作为一种示例,可以获取用于训练第一生成模型的设计图片,作为本示例中的设计图片训练数据,以及收集与设计图片训练数据对应的XML格式的幻灯片文件。进而根据设计图片训练数据与对应的XML文件训练预设模型的参数,生成第二生成模型。进而,将第一生成模型输出的设计图片输入到第二生成模型中进行处理,获取相应的XML文件。
可以理解,XML是微软文件格式的直接表示法,也就是说,幻灯片文件其实为XML文件。因此,在获取XML文件之后,可以根据XML文件生成幻灯片,例如将XML文件转换为其他格式的幻灯片文件,从而实现了根据用户的描述生成幻灯片。
综上所述,本公开实施例的幻灯片生成方法,通过获取用户输入的描述内容,并根据描述内容提取文字向量,进而,将文字向量输入到第一生成模型中进行处理,生成设计图片。进一步,将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。由此,基于机器学习模型实现了根据用户的描述自动生成幻灯片,解决了相关技术中幻灯片制作成本较高效率低下、无法短时间内获取符合用户期望的幻灯片的问题,无需用户进行搜索,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。
基于上述实施例,进一步地,在实际应用中,用户在制作幻灯片时,通常希望比较多个不同的幻灯片模板并从中选取。因此,本公开实施例的幻灯片生成方法,还可以通过加入噪声矩阵,使第一生成模型每次根据同一描述内容生成的设计图片不同,从而为用户提供多种选择,下面结合GAN网络进行详细说明。
图2为本公开实施例所提供的另一种幻灯片生成方法的流程示意图,如图2所示,该方法包括:
步骤201,获取用户输入的描述内容,并根据描述内容提取文字向量。
前述实施例中对步骤101的解释说明同样适用于步骤201,此处不再赘述。
步骤202,收集描述内容语料和对应的设计图片样本作为训练集。
作为一种示例,可以准备描述内容库和设计图片库,并将描述内容语料和对应的设计图片分别存储在库中,其中,每条描述内容语料可以对应一个设计图片,可选地,设计图片的形式可以如图3所示。进而,可以将描述内容语料的文字解析为单词,例如风格方面的单词有<活泼>、<文艺>等,并将单词输入Word2vec网络,得到描述内容语料对应的向量M。由此,就获取了向量M与对应的设计图片P的训练集。
步骤203,根据训练集训练GAN网络的参数,生成第一生成模型。
本公开实施例中,GAN网络包括生成网络和鉴别网络。例如,生成网络主要由全连接层组成,鉴别网络为CNN卷积神经网络。
本实施例中,噪声矩阵N可以是由用户定义大小的、矩阵中都是任意数的矩阵。
作为一种示例,根据向量M和一个噪声矩阵N,将M、N合并,作为生成网络的输入,由生成网络输出一张假的图片FP。
进而,训练鉴别网络。将FP、M合并作为负样本、将与向量M对应的设计图片P和M合并作为正样本输入到网络中,并以对数损失(即对数似然损失,Log-likelihood Loss)函数来衡量预测值与输出值的差距,并据此差距对鉴别网络模型进行参数调整,参数调整可以通过反向传播(Backpropagation,缩写为BP,“误差反向传播”的简称)算法调整,该鉴别网络的输出包括真和假。由此可以得到一个准确的网络D(FP,M)->{0,1}。
进一步,训练生成网络。参照图4,以生成网络和鉴别网络为整体,将M、N合并作为整个网络的输入,以鉴别网络的输出为总输出,并以对数损失函数来衡量预测值与输出值的差距,并据此差距对生成网络模型进行参数调整,参数调整通过反向传播算法调整,以鉴别网络输出为真的设计图片为正样本,训练生成网络。从而可以得到一个准确的网络G(N,M)->FP。
可选地,可以通过验证集检测生成网络的准确率,当生成网络的训练的准确率达到预设数值时,停止训练。准确率越高,生成网络生成的图片越真实。
步骤204,获取噪声矩阵,并将文字向量和噪声矩阵输入到第一生成模型中进行处理,生成设计图片。
在本公开的一个实施例中,可以根据训练的网络G(N,M)->FP获取设计图片。例如,参照图5,可以获取噪声矩阵,并将文字向量与噪声矩阵合并,进而输入到网络G(N,M)->FP中,从而得到一个拟真的幻灯片设计图片。并且,由于加入了噪声矩阵,可以使第一生成模型每次根据同一描述内容生成的设计图片不同,从而为用户提供多种选择。
作为一种示例,将文字向量和噪声矩阵合并为目标矩阵,根据GAN网络的全连接层对目标矩阵进行矩阵变换,生成图片矩阵,进而将图片矩阵转换为图片,从而生成设计图片。
本公开实施例的幻灯片生成方法,通过GAN网络实现了根据文字向量生成设计图片的功能,并且,通过加入噪声矩阵,使第一生成模型每次根据同一描述内容生成的设计图片不同,从而为用户提供多种选择,提升了用户体验。
基于上述实施例,进一步地,下面结合VAEs网络对训练第二生成模型进行详细说明。
图6为本公开实施例所提供的另一种幻灯片生成方法的流程示意图,如图6所示,该方法包括:
步骤301,收集设计图片训练数据与对应的XML文件作为训练集。
作为一种示例,可以准备设计图片库和关联的幻灯片库,其中,每个设计图片可以对应一个幻灯片,本示例中的设计图片库与训练第一生成模型的设计图片库可以为同一图库,幻灯片库的幻灯片可以为XML格式。
可选地,可以将XML文件解析为预设的单词token。例如,文本标签可以解析为单词组:<a>、x、y、width、height、content,</a>,其中,<a>代表文本,x,y为该标签在幻灯片坐标系的位置,width,height为该标签的宽和高,content为内容,</a>代表该标签结束。结合文本标签示例,幻灯片XML文件可以解析为<PAD>,<START>,<a>,20,30,20,30,test,</a>,<END>,其中<PAD>表示空白,起到占位符的作用,<START>表示XML文件开始,<END>表示XML文件结束。其中,可以设置与token对应的序列号,比如<a>对应的序列号为1。由此,可以根据设计图片训练数据以及对应的XML文件的token训练第二生成模型。
步骤302,根据训练集训练VAEs网络的参数,生成第二生成模型。
本公开实施例中,VAEs网络可以包括一个CNN(Convolutional Neural Networks,卷积神经网络)和2个RNN(Recurrent Neural Network,循环神经网络)。例如,VAEs网络模型架构图可以如图7所示,其中CNN与RNN网络可以根据需要进行设置。
作为一种示例,参照图7,获取设计图片训练数据的图片矩阵,并将图片矩阵输入CNN网络,输出图片特征i。以及,将对应的XML文件的token输入RNN1网络,输出序列中单词token的特征t,其中,token可以按序列的顺序逐个输入。进而,将i和t合并为rel(i,t),即将i和t连接并放到同一个数据中。进一步,将rel(i,t)输入到RNN2中,可以输出一个预测的token。
由此,以设计图片的图片矩阵输入为I,以对应的XML中的一个token输入为T,并将XML中的下一个token作为验证结果。根据I和T可以输出一个token,并使用交叉熵代价函数(Cross-entropy cost function)衡量预测值与输出值的差距,并据此差距对模型进行参数调整,参数调整通过反向传播算法调整,从而得到h(I,T),使得h(I,T)的输入为图片矩阵和XML文件中一个token,输出为下一个token。例如,输入为图片矩阵和<START>的序列号,输出为<a>的序列号。
步骤303,将设计图片输入到第二生成模型中进行处理,获取XML文件。
在本公开的一个实施例中,可以根据训练的模型h(I,T)获取XML文件。例如,参照
图8,输入设计图片的图片矩阵,并以<START>为首次输入的token,输入到h(I,T)中获取输出值。进而,将该输出值作为第二次输入的T,直至某一次输出的token为<END>时停止,并收集该模型从第一次输入<START>到结束输出<END>的所有token,作为XML文件的token序列,以根据上述token生成XML文件。其中,token可以由系统自动输入。
由此,通过VAEs网络实现了根据设计图片生成幻灯片的功能。
基于上述实施例,在实际应用中,某些描述内容使用神经网络进行处理反而有点大材小用,例如背景样式、字体样式等。因此,为了减少运算量提高处理效率,可以采用直接替换的方式,将XML中的相关字段直接替换成用户描述的字段。
在本公开的一些实施例中,还可以预先设置XML文件的可替换字段,其中,可替换字段为XML文件中的字段,例如与背景样式、字体样式、标题、描述等对应的字段。进而,在根据XML文件生成幻灯片之前,获取预设的可替换字段,并确定描述内容中与可替换字段对应的描述字段。进一步,根据描述字段替换可替换字段,例如,可以将风格相关的描述内容通过神经网络进行处理,将XML中记录字体样式的字段,替换成与用户描述字体样式对应的字段;将背景颜色字段,替换成与用户描述对应的字段;将标题对应的XML的内容,替换成用户描述的标题内容等。以生成修改后的XML文件,并根据修改后的XML文件生成幻灯片。由此,实现了根据选项修改XML文件,减少了运算量,提高了处理效率。
为了实现上述实施例,本公开还提出一种幻灯片生成装置。
图9为本公开实施例所提供的一种幻灯片生成装置的结构示意图,如图9所示,该装置包括:获取模块10,第一生成模块20,第二生成模块30。
其中,获取模块10,用于获取用户输入的描述内容,并根据描述内容提取文字向量。
第一生成模块20,用于将文字向量输入到第一生成模型中进行处理,生成设计图片。
第二生成模块30,用于将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。
在图9的基础上,图10所示的幻灯片生成装置还包括:第一训练模块40,第二训练模块50,处理模块60。
其中,第一训练模块40,用于收集描述内容语料和对应的设计图片样本作为训练集;根据训练集训练预设模型的参数,生成第一生成模型。
第二训练模块50,用于收集设计图片训练数据与对应的XML文件作为训练集;根据训练集训练预设模型的参数,生成第二生成模型。
可选地,第一生成模块20具体用于:获取噪声矩阵,并将文字向量和噪声矩阵输入到
第一生成模型中进行处理,获取设计图片。
进一步地,第一生成模块20具体用于:将文字向量和噪声矩阵合并为目标矩阵,对目标矩阵进行矩阵变换,生成图片矩阵,根据图片矩阵生成设计图片。
可选地,处理模块60,用于获取预设的可替换字段,其中,可替换字段为XML文件中的字段;确定描述内容中与可替换字段对应的描述字段;
第二生成模块30具体用于:根据描述字段替换可替换字段,生成修改后的XML文件,并根据修改后的XML文件生成幻灯片。
需要说明的是,前述实施例对幻灯片生成方法的解释说明同样适用于本实施例的幻灯片生成装置,此处不再赘述。
本公开实施例的幻灯片生成装置,通过获取用户输入的描述内容,并根据描述内容提取文字向量,进而,将文字向量输入到第一生成模型中进行处理,生成设计图片。进一步,将设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据XML文件生成幻灯片。由此,基于机器学习模型实现了根据用户的描述自动生成幻灯片,解决了相关技术中幻灯片制作成本较高效率低下、无法短时间内获取符合用户期望的幻灯片的问题,无需用户进行搜索,满足了短时间内获取符合用户期望的幻灯片的用户需求,提高幻灯片制作效率,降低了时间成本和制作成本。
为了实现上述实施例,本公开还提出一种电子设备。
下面参考图11,其示出了适于用来实现本公开实施例的电子设备800的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
为了实现上述实施例,本公开还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述实施例所述的幻灯片生成方法。
图12为图示根据本公开的实施例的计算机可读存储介质的示意图。如图12所示,根据本公开实施例的计算机可读存储介质300,其上存储有非暂态计算机可读指令310。当该非暂态计算机可读指令310由处理器运行时,执行前述的本公开各实施例的幻灯片生成方法的全部或部分步骤。
为了实现上述实施例,本公开还提出一种计算机程序产品,当该计算机程序产品中的指令由处理器执行时,实现如前述实施例所述的幻灯片生成方法。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种幻灯片生成方法,其特征在于,包括:
获取用户输入的描述内容,并根据所述描述内容提取文字向量;所述描述内容包括描述背景样式、描述文字样式、风格、标题中的至少一项;所述获取用户输入的描述内容包括:获取用户按照预设的格式输入的文字形式的描述内容、获取用户通过选择选项的方式输入的描述内容或者用户语音输入的描述内容;
将所述文字向量输入到第一生成模型中进行处理,生成设计图片,包括:获取预设的噪声矩阵,并将所述文字向量和所述噪声矩阵输入到所述第一生成模型中进行处理,生成设计图片;
将所述设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据所述XML文件生成幻灯片;
在将所述文字向量输入到第一生成模型中进行处理之前,还包括:收集描述内容语料和对应的设计图片样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第一生成模型;
在将所述设计图片输入到第二生成模型中进行处理之前,还包括:收集设计图片训练数据与对应的XML文件样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第二生成模型。
2.如权利要求1所述的幻灯片生成方法,其特征在于,所述将所述文字向量和所述噪声矩阵输入到第一生成模型中进行处理,生成设计图片包括:
将所述文字向量和所述噪声矩阵合并为目标矩阵,对所述目标矩阵进行矩阵变换,生成图片矩阵,根据所述图片矩阵生成设计图片。
3.如权利要求1所述的幻灯片生成方法,其特征在于,在根据所述XML文件生成幻灯片之前,还包括:
获取预设的可替换字段,其中,所述可替换字段为所述XML文件中的字段;
确定所述描述内容中与所述可替换字段对应的描述字段;
所述根据所述XML文件生成幻灯片,包括:
根据所述描述字段替换所述可替换字段,生成修改后的XML文件,并根据所述修改后的XML文件生成幻灯片。
4.一种幻灯片生成装置,其特征在于,包括:
获取模块,用于获取用户输入的描述内容,并根据所述描述内容提取文字向量;所述描述内容包括描述背景样式、描述文字样式、风格、标题中的至少一项;所述获取用户输入的描述内容包括:获取用户按照预设的格式输入的文字形式的描述内容、获取用户通过选择选项的方式输入的描述内容或者用户语音输入的描述内容;
第一生成模块,用于将所述文字向量输入到第一生成模型中进行处理,生成设计图片;
第二生成模块,用于将所述设计图片输入到第二生成模型中进行处理,获取XML可扩展标记语言文件,并根据所述XML文件生成幻灯片;
所述第一生成模块具体用于:获取预设的噪声矩阵,并将所述文字向量和所述噪声矩阵输入到所述第一生成模型中进行处理,生成设计图片;
在将所述文字向量输入到第一生成模型中进行处理之前,还包括:收集描述内容语料和对应的设计图片样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第一生成模型;
在将所述设计图片输入到第二生成模型中进行处理之前,还包括:收集设计图片训练数据与对应的XML文件样本作为训练集;根据所述训练集训练预设模型的参数,生成所述第二生成模型。
5.一种电子设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-3中任一项所述的幻灯片生成方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的幻灯片生成方法。
CN201910106366.XA 2019-02-02 2019-02-02 幻灯片生成方法及装置 Active CN109815448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910106366.XA CN109815448B (zh) 2019-02-02 2019-02-02 幻灯片生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910106366.XA CN109815448B (zh) 2019-02-02 2019-02-02 幻灯片生成方法及装置

Publications (2)

Publication Number Publication Date
CN109815448A CN109815448A (zh) 2019-05-28
CN109815448B true CN109815448B (zh) 2024-02-27

Family

ID=66605147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910106366.XA Active CN109815448B (zh) 2019-02-02 2019-02-02 幻灯片生成方法及装置

Country Status (1)

Country Link
CN (1) CN109815448B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689079B (zh) * 2019-09-30 2023-01-17 联想(北京)有限公司 一种处理方法、处理装置及电子设备
CN112258607B (zh) * 2020-10-23 2023-09-15 泰康保险集团股份有限公司 幻灯片的渲染方法、装置及电子设备
CN112966470A (zh) * 2021-02-23 2021-06-15 北京三快在线科技有限公司 一种文字生成方法、装置、存储介质及电子设备
CN113590858B (zh) * 2021-06-30 2023-10-03 北京百度网讯科技有限公司 目标对象的生成方法、装置、电子设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741004A (zh) * 2004-08-23 2006-03-01 微软公司 关联便携式通信设备中的内容类型的系统和方法
CN101142618A (zh) * 2005-01-22 2008-03-12 贝洱工艺有限公司 颜色选择和协调系统
CN106415542A (zh) * 2014-05-30 2017-02-15 苹果公司 结构化建议
CN107077463A (zh) * 2014-10-02 2017-08-18 微软技术许可有限责任公司 远程监督关系提取器
CN108073680A (zh) * 2016-11-10 2018-05-25 谷歌有限责任公司 生成具有提炼内容的演示幻灯片
CN108460104A (zh) * 2018-02-06 2018-08-28 北京奇虎科技有限公司 一种实现内容定制的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005122078A2 (en) * 2004-06-04 2005-12-22 Sap Ag Consistent set of interfaces derived from a business object model
WO2006038924A2 (en) * 2004-06-18 2006-04-13 Sap Ag Consistent set of interfaces derived from a business object model
US8744937B2 (en) * 2005-02-25 2014-06-03 Sap Ag Consistent set of interfaces derived from a business object model

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741004A (zh) * 2004-08-23 2006-03-01 微软公司 关联便携式通信设备中的内容类型的系统和方法
CN101142618A (zh) * 2005-01-22 2008-03-12 贝洱工艺有限公司 颜色选择和协调系统
CN106415542A (zh) * 2014-05-30 2017-02-15 苹果公司 结构化建议
CN107077463A (zh) * 2014-10-02 2017-08-18 微软技术许可有限责任公司 远程监督关系提取器
CN108073680A (zh) * 2016-11-10 2018-05-25 谷歌有限责任公司 生成具有提炼内容的演示幻灯片
CN108460104A (zh) * 2018-02-06 2018-08-28 北京奇虎科技有限公司 一种实现内容定制的方法和装置

Also Published As

Publication number Publication date
CN109815448A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109815448B (zh) 幻灯片生成方法及装置
CN109769141B (zh) 一种视频生成方法、装置、电子设备及存储介质
CN109947426B (zh) 应用程序的生成方法、装置及电子设备
CN109919244B (zh) 用于生成场景识别模型的方法和装置
CN110213614B (zh) 从视频文件中提取关键帧的方法和装置
CN109961032B (zh) 用于生成分类模型的方法和装置
CN110969012A (zh) 文本纠错方法、装置、存储介质及电子设备
CN107909368B (zh) 支付控制方法及装置、终端及可读存储介质
CN110674349A (zh) 视频poi识别方法、装置及电子设备
CN111738316B (zh) 零样本学习的图像分类方法、装置及电子设备
CN109255035A (zh) 用于构建知识图谱的方法和装置
CN109816023B (zh) 用于生成图片标签模型的方法和装置
CN114021016A (zh) 数据推荐方法、装置、设备和存储介质
CN112884376A (zh) 工单处理方法、装置、电子设备及计算机可读存储介质
CN109816670B (zh) 用于生成图像分割模型的方法和装置
CN112487871A (zh) 笔迹数据处理方法、装置及电子设备
CN109871465B (zh) 一种时间轴计算方法、装置、电子设备及存储介质
CN109683726B (zh) 字符输入方法、装置、电子设备及存储介质
CN108664610B (zh) 用于处理数据的方法和装置
CN113628097A (zh) 图像特效配置方法、图像识别方法、装置及电子设备
CN110689285A (zh) 测试方法、装置、电子设备及计算机可读存储介质
CN113706663B (zh) 图像生成方法、装置、设备及存储介质
EP4207775A1 (en) Method and apparatus for determining object addition mode, electronic device, and medium
CN111754984B (zh) 文本选取的方法、装置、设备和计算机可读介质
CN114239501A (zh) 合同生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant