CN114818639A - 演示文稿生成方法、装置、设备及存储介质 - Google Patents

演示文稿生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114818639A
CN114818639A CN202210439197.3A CN202210439197A CN114818639A CN 114818639 A CN114818639 A CN 114818639A CN 202210439197 A CN202210439197 A CN 202210439197A CN 114818639 A CN114818639 A CN 114818639A
Authority
CN
China
Prior art keywords
target
image
page
text
style
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210439197.3A
Other languages
English (en)
Inventor
李彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202210439197.3A priority Critical patent/CN114818639A/zh
Publication of CN114818639A publication Critical patent/CN114818639A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及人工智能技术,提供了一种演示文稿生成方法、装置、设备及存储介质,该方法包括:获取用户输入的目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示文本关系;根据目标文本信息和预设的图像库,确定目标图像;根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;根据目标文本信息、目标图像和目标模板页面,生成配置信息;根据配置信息和预设的软件开发工具包,生成目标演示文稿,软件开发工具包用于设置目标文本信息和目标图像在目标模板页面内的布局格式。根据本发明实施例提供的方案,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。

Description

演示文稿生成方法、装置、设备及存储介质
技术领域
本发明涉及但不限于人工智能技术领域,尤其涉及一种演示文稿生成方法、装置、设备及存储介质。
背景技术
随着办公软件的普遍推广,演示文稿被广泛应用于社会生活的方方面面,例如,演示文稿被应用于工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询、教育培训等领域。演示文稿的应用领域日益广泛,人们对幻灯片的制作需求也越来越多。演示文稿已经成为现代社会工作中必不可少的表现形式,同一应用场景的演示文稿的风格通常比较相近,但不同用户的具体风格需求会存在差异。
目前,用户为了制作符合风格需求且风格统一的演示文稿,需要花费大量的时间挑选风格合适的素材,然后利用待演示的文本信息和挑选的素材来制作演示文稿的页面,而且还要保证各个页面之间风格统一,制作风格统一的演示文稿的效率低,导致时间成本增加。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种演示文稿生成方法、装置、设备及存储介质,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
第一方面,本发明还提供了一种演示文稿生成方法,包括:获取用户输入的目标页面风格标签、多个目标文本信息和各个所述目标文本信息对应的目标文本关系标签,所述目标文本关系标签用于指示所述目标文本信息的文本关系;根据所述目标文本信息和预设的图像库,确定目标图像;根据所述目标页面风格标签、所述目标文本关系标签和预设的模板库,确定目标模板页面;根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息;根据所述配置信息和预设的软件开发工具包,生成目标演示文稿,其中,所述软件开发工具包用于设置所述目标文本信息和所述目标图像在所述目标模板页面内的布局格式。
在一些实施例中,所述模板库通过如下步骤建立:获取多个演示文稿素材和文本关系标签,其中,每个所述演示文稿素材包括页面素材和文本素材,所述文本关系标签用于指示所述文本素材的文本关系;基于所述文本关系标签,对各个所述页面素材进行分类处理,确定多个类别的模板页面;对所述页面素材进行风格分析,得到页面风格标签;根据所述模板页面和所述页面风格标签,建立所述模板库。
在一些实施例中,所述图像库通过如下步骤建立:获取多个图像素材;对所述图像素材进行风格分析,得到图像风格标签;根据所述图像素材和所述图像风格标签,建立图像库。
在一些实施例中,所述软件开发工具包通过如下步骤创建:对所述演示文稿素材进行属性分类,确定多个属性内容,其中,所述属性内容包括图片属性、图标属性、形状属性、文本属性、表格属性、图表属性和动效属性;创建各个所述属性内容对应的软件开发工具包。
在一些实施例中,所述根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息,包括:基于属性分类,确定所述目标文本信息、所述目标模板页面和所述目标图像对应的目标属性内容;基于所述目标属性内容,根据所述目标文本信息、所述目标模板页面和所述目标图像,生成对应的配置信息。
在一些实施例中,所述根据所述目标文本信息和预设的图像库,确定目标图像,包括:对所述目标文本信息进行分句处理,得到多个文本子分句;分别对每个所述文本子分句进行关键词提取,确定各个文本子分句对应的目标关键词;基于所述目标关键词和所述图像风格标签,从所述图像库的所有图像素材中筛选出目标图像。
在一些实施例中,所述图像素材包括图片素材和图标素材,所述图像库包括图片库和图标库,所述图像风格标签包括图片风格标签和图标风格标签,所述图片风格标签由所述图片素材而确定,所述图标风格标签由所述图标素材而确定,所述图片库由所述图片素材和所述图片风格标签而建立,所述图标库由所述图标素材和所述图标风格标签而建立。
第二方面,本发明还提供了一种演示文稿生成装置,包括:获取单元,用于获取用户输入的目标页面风格标签、目标图像风格标签、多个目标文本信息和各个所述目标文本信息对应的目标文本关系标签,所述目标文本关系标签用于指示所述目标文本信息的文本关系;图像确定单元,用于根据所述目标文本信息和预设的图像库,确定目标图像;页面确定单元,用于根据所述目标页面风格标签、所述目标文本关系标签和预设的模板库,确定目标模板页面;配置生成单元,用于根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息;演示文稿生成单元,用于根据所述配置信息和预设的软件开发工具包,生成目标演示文稿。
第三方面,本发明实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述的演示文稿生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如上第一方面所述的演示文稿生成方法。
本发明实施例包括:获取用户输入的目标页面风格标签、多个目标文本信息和各个所述目标文本信息对应的目标文本关系标签,所述目标文本关系标签用于指示所述目标文本信息的文本关系;根据所述目标文本信息和预设的图像库,确定目标图像;根据所述目标页面风格标签、所述目标文本关系标签和预设的模板库,确定目标模板页面;根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息;根据所述配置信息和预设的软件开发工具包,生成目标演示文稿,其中,所述软件开发工具包用于设置所述目标文本信息和所述目标图像在所述目标模板页面内的布局格式。根据本发明实施例提供的方案,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一个实施例提供的演示文稿生成方法的流程图;
图2是本发明另一个实施例提供的一种建立模板库的流程图;
图3是本发明另一个实施例提供的一种建立图像库的流程图;
图4是本发明另一个实施例提供的一种创建软件开发工具包的流程图;
图5是本发明另一个实施例提供的一种生成配置信息的流程图;
图6是本发明另一个实施例提供的一种确定目标图像的流程图;
图7是本发明另一个实施例提供的演示文稿生成方法的系统框图;
图8是本发明另一个实施例提供的演示文稿生成装置的结构图;
图9是本发明另一个实施例提供的电子设备的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在本发明的描述中,若干个的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
随着办公软件的普遍推广,演示文稿被广泛应用于社会生活的方方面面,例如,演示文稿被应用于工作汇报、企业宣传、产品推介、婚礼庆典、项目竞标、管理咨询、教育培训等领域。演示文稿的应用领域日益广泛,人们对幻灯片的制作需求也越来越多。演示文稿已经成为现代社会工作中必不可少的表现形式,同一应用场景的演示文稿的风格通常比较相近,但不同用户的具体风格需求会存在差异。
目前,用户为了制作符合风格需求且风格统一的演示文稿,需要花费大量的时间挑选风格合适的素材,然后利用待演示的文本信息和挑选的素材来制作演示文稿的页面,而且还要保证各个页面之间风格统一,制作风格统一的演示文稿的效率低,导致时间成本增加。
针对制作风格统一的演示文稿的效率低和时间成本高的问题,本发明提供了一种演示文稿生成方法、装置及存储介质,该方法包括:获取用户输入的目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示目标文本信息的文本关系;根据目标文本信息和预设的图像库,确定目标图像;根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;根据目标文本信息、目标图像和目标模板页面,生成配置信息;根据配置信息和预设的软件开发工具包,生成目标演示文稿,其中,软件开发工具包用于设置目标文本信息和目标图像在目标模板页面内的布局格式。根据本发明实施例提供的方案,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗、智慧城市等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
首先,对本发明中涉及的若干名词进行解析:
软件开发工具包(Software Development Kit,SDK),一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合;
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)是深度学习(deeplearning)的代表算法之一;
应用程序接口(Application Programming Interface,API),是一些预先定义的接口(如函数、HTTP接口),或指软件系统不同组成部分衔接的约定,用来提供应用程序与开发人员基于某软件或硬件得以访问的一组例程,而又无需访问源码,或理解内部工作机制的细节;
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,自然语言处理是一门融语言学、计算机科学、数学于一体的科学,因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别,自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统;
分类,是数据挖掘的一种非常重要的方法,分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型,该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测;
词频-逆文本频率指数算法(Term Frequency–Inverse Document Frequency,TF-IDF),是一种用于信息检索与数据挖掘的常用加权技术;
TextRank算法,是一种基于图的用于关键词抽取和文档摘要的排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它利用一篇文档内部的词语间的共现信息(语义)便可以抽取关键词,它能够从一个给定的文本中抽取出该文本的关键词、关键词组,并使用抽取式的自动文摘方法抽取出该文本的关键句。
下面结合附图,对本发明实施例作进一步阐述。
如图1所示,图1是本发明一个实施例提供的一种演示文稿生成方法的流程图,在该方法中,包括但不限于有以下步骤:
步骤S110,获取用户输入的目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示目标文本信息的文本关系;
步骤S120,根据目标文本信息和预设的图像库,确定目标图像;
步骤S130,根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;
步骤S140,根据目标文本信息、目标图像和目标模板页面,生成配置信息;
步骤S150,根据配置信息和预设的软件开发工具包,生成目标演示文稿,其中,软件开发工具包用于设置目标文本信息和目标图像在目标模板页面内的布局格式。
可以理解的是,演示文稿是指一种由文字、图片、音频等多媒体信息以及其它元素生成的用于内容传播与展示的文件,如幻灯片文档(PowerPoint,PPT)、希沃课件等;通常,演示文稿是由多页幻灯片组成,每页幻灯片相互独立,用户可以在每页幻灯片中插入图片、动画、表格、备注和讲义等内容,使演示文稿的复杂内容变得通俗易懂,给人留下更为深刻的印象,针对演示文稿,还可以添加特效动态显示效果以增加趣味性;为了制作风格统一的演示文稿,通过目标文本信息和图像库,确定与目标文本信息相匹配的目标图像,并通过目标页面风格标签、目标文本关系标签和模板库,确定风格统一的目标模板页面,进而生成配置信息,然后将配置信息和预设的软件开发工具包SDK相结合,自动生成风格统一的目标演示文稿;基于此,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
需要说明的是,目标模板页面相当于幻灯片,制作幻灯片的操作包括但不限于:设置幻灯片的文本、图片、表格的字体、颜色、文本框,添加图片到幻灯片的指定位置,修改幻灯片中表格的样式,添加特效动态显示效果;用户根据目标文本信息和制作需要,通过实施对应的幻灯片制作操作,制作每一页幻灯片,所有幻灯片制作完成后,得到演示文稿;通常来说,针对每页幻灯片通常可预先设定文稿素材的格式、页面布局及页面背景等页面格式;当然,这些页面格式也可以是在添加了显示内容后再进行设置的;同时,用户也可对这些页面格式基于自己的喜好进行修改或调整;但是,用户手动制作幻灯片的效率低,需要耗费大量的时间,通过配置信息和软件开发工具包生成演示文稿,能够提高制作效率,从而降低时间成本。
需要说明的是,目标页面风格标签为预先确定的多个页面风格标签中的一个,目标页面风格标签用于表征目标模板页面的风格特征,页面风格标签所表征的风格特征包括但不限于:商务、简洁、艺术、卡通和浪漫;不同风格特征的模板页面适用的场景不同,用户根据应用场景输入对应的目标页面风格标签;风格特征是指模板页面的页面格式、模板页面的特效动态显示效果和页面色调等;页面色调是指页面背景的配色信息,例如,当风格特征为浪漫,页面背景的配色信息对应为粉色;用户使用符合风格需求的演示文稿,有助于提高演示文稿的展示效果。
需要说明的是,目标文本关系标签用于指示目标文本信息的文本关系,目标文本关系标签通过人工标注而确定,模板页面的页面布局与文本关系对应,文本关系包括如下至少之一:标题页关系,目录页关系,子目录页关系,结语页关系,概念说明关系,并列关系,对比关系,总分关系,排序关系,因果关系,对话关系,时间序列关系,条形图关系,折线图关系,饼形图关系,散点图关系,一般表格关系,冰山图关系,草帽图关系,爬坡图关系,标准普尔家庭资产象限图关系,家庭资产分类关系,水池图关系,阶梯图关系,V字图关系,资产轮动图关系,城池图关系,案例说关系和公司介绍关系;其中,条形图关系,折线图关系,饼形图关系,散点图关系和一般表格关系属于图表类关系;冰山图关系,草帽图关系,爬坡图关系,标准普尔家庭资产象限图关系,家庭资产分类关系,水池图关系,阶梯图关系,V字图关系,资产轮动图关系,城池图关系,案例说关系和公司介绍关系属于特殊构图关系。
在具体实践中,用户通常使用演示文稿母版进行制作,对于存在制作批量的统一风格演示文稿的需求时,需要多个用户分别制作一定量的演示文稿,不同用户使用演示文稿母版制作的演示文稿会存在风格的差异;特别是,对于同一个公司,为了保证公司的形象,要求公司内每个员工制作的演示文稿符合风格统一和页面美观的特性,员工通过输入目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,进而通过配置信息和软件开发工具包,生成目标演示文稿,能够保证每个演示文稿符合风格统一和页面美观的特性,有助于提高公司形象,而且能够提高员工制作演示文稿的效率,降低时间成本。
另外,参照图2,在一实施例中,图1所示实施例中的步骤S130的模板库的建立步骤,包括但不限于有以下步骤:
步骤S210,获取多个演示文稿素材和文本关系标签,其中,每个演示文稿素材包括页面素材和文本素材,文本关系标签用于指示文本素材的文本关系;
步骤S220,基于文本关系标签,对各个页面素材进行分类处理,确定多个类别的模板页面;
步骤S230,对页面素材进行风格分析,得到页面风格标签;
步骤S240,根据模板页面和页面风格标签,建立模板库。
可以理解的是,每个演示文稿素材包含至少一个页面素材和页面素材对应的文本素材,文本关系标签用于指示文本素材的文本关系,文本关系标签通过人工标注而确定,页面素材的页面布局由文本素材的文本关系而确定,不同页面布局的页面素材对应的文本关系标签不同;对页面素材进行分类处理,相当于将相同页面布局的页面素材划分为同一类别的模板页面;通过风格分析,能够确定每个页面素材对应的页面风格标签,通常利用已训练的页面风格分类模型进行风格分析,能够保证风格分析结果的可靠性;在模板库中,每个模板页面都有其对应的页面风格标签,在生成目标演示文稿时方便查找和筛选。
需要说明的是,演示文稿素材是从演示文稿素材库中获取的,并且演示文稿素材属于演示文稿素材库使用量靠前的演示文稿素材,能够保证演示文稿素材的美观性,从而保证生成的目标演示文稿的美观性;演示文稿素材库的获取途径包括但不限于:网站和云盘。
值得注意的是,人工标注文本关系标签的方法,属于本领域技术人员熟知的技术,在此不多作赘述。
在具体实践中,页面风格分类模型通过如下步骤训练:将训练页面和对应的训练页面风格标签作为训练数据,对卷积神经网络进行训练,得到页面风格分类模型。
另外,参照图3,在一实施例中,图2所示实施例中的步骤S120的图像库的建立步骤,包括但不限于有以下步骤:
步骤S310,获取多个图像素材;
步骤S320,对图像素材进行风格分析,得到图像风格标签;
步骤S330,根据图像素材和图像风格标签,建立图像库。
可以理解的是,对图像素材进行风格分析,是指对图像素材进行图像分类,图像分类是指根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读;通过风格分析,能够确定每个图像素材对应的图像风格标签,通常利用已训练的图像风格分类模型进行风格分析,能够保证风格分析结果的可靠性;图像的分类包括但不限于:人物、建筑、车辆、生活用品等,或者分类为摄像和画作,图像风格标签包括但不限于:人物、建筑、车辆、生活用品、摄像和画作。
需要说明的是,图像素材是从图像素材库中获取的,并且演示文稿素材属于图像素材库使用量靠前的图像素材库,能够保证演示文稿素材的美观性,从而保证生成的目标演示文稿的美观性;图像素材库的获取途径包括但不限于:网站和云盘。
在具体实践中,图像风格分类模型通过如下步骤训练:将训练图像和对应的训练图像风格标签作为训练数据,对卷积神经网络进行训练,得到图像风格分类模型;获取图像素材后,对图像素材进行预处理,将图像素材的像素调整至符合预设的图像像素规定范围,例如,演示文稿中图像像素规定范围为小于300*400,对于像素为400*500的图像素材,经过预处理的压缩后,得到像素为300*375的图像素材,图像库由预处理后的图像素材而建立,能够保证图像库中的图像素材能够用于生成目标演示文稿,另外,在生成后的演示文稿中,用户也可以对目标图像的像素进行调整。
另外,参照图4,在一实施例中,图2所示实施例中的步骤S250,还包括但不限于有以下步骤:
步骤S410,对演示文稿素材进行属性分类,确定多个属性内容,其中,属性内容包括:图片属性、图标属性、形状属性、文本属性、表格属性、图表属性和动效属性;
步骤S420,创建各个属性内容对应的软件开发工具包。
可以理解的是,每个演示文稿素材包含至少一个页面素材和页面素材对应的文本素材,各个演示文稿素材的内容按属性进行分类,共有七类属性,分别为图片属性、图标属性、形状属性、文本属性、表格属性、图表属性和动效属性,根据上述七类属性,分别调用并封装不同的底层API,各个API用于生成对应的属性内容,进而生成目标演示文稿的幻灯片,然后基于不同的底层API,创建不同属性类别对应的软件开发工具包,将配置信息和软件开发工具包SDK相结合,实现模板页面的自适应布局,并自动填充文本信息和图像素材,自动编辑模板页面的格式属性。
另外,参照图5,在一实施例中,图1所示实施例中的步骤S120,还包括但不限于有以下步骤:
步骤S510,基于属性分类,确定目标文本信息、目标模板页面和目标图像对应的目标属性内容;
步骤S520,基于目标属性内容,根据目标文本信息、目标模板页面和目标图像,生成对应的配置信息。
可以理解的是,各个演示文稿素材的内容按属性进行分类,共有七类属性,先确定目标文本信息、目标模板页面和目标图像对应的目标属性内容,然后针对各个目标属性内容,由目标文本信息、目标模板页面和目标图像生成对应的配置信息,使得各个配置信息与相应的软件开发工具包匹配,保证目标演示文稿的有效生成。
如图6所示,在一实施例中,图1所示实施例中的步骤S140的文本生成模型训练方法,包括但不限于有以下步骤:
步骤S610,对目标文本信息进行分句处理,得到多个文本子分句;
步骤S620,分别对每个文本子分句进行关键词提取,确定各个文本子分句对应的目标关键词;
步骤S630,基于目标关键词和图像风格标签,从图像库的所有图像素材中筛选出目标图像。
可以理解的是,目标文本信息通常由多个句子组成,对目标文本信息进行中文文本或英文文本的分句处理,可通过标点符号进行分句,得到多个文本子分句;或者按照各个句子的语义信息,通过自然语言模型进行分句,得到多个文本子分句;然后,通过文本关键词抽取模型对各个文本子分句进行关键词提取,进而确定目标关键词;在图像库中,每个图像素材都有对应的图像风格标签,比对目标关键词和所有图像风格标签,将图像风格标签与目标关键词相同的图像素材作为目标图像,例如目标关键词为车辆,将图像风格标签为车辆的图像素材作为目标图像,能够保证目标演示文稿每一页幻灯片的文本与图像是对应的,保证目标演示文稿的质量。
在具体实践中,文本关键词抽取模型所使用的算法包括但不限于:TF-IDF算法和TextRank算法。
在一实施例中,图像素材包括图片素材和图标素材,图像库包括图片库和图标库,图像风格标签包括图片风格标签和图标风格标签,图片风格标签由图片素材而确定,图标风格标签由图标素材而确定,图片库由图片素材和图片风格标签而建立,图标库由图标素材和图标风格标签而建立。
可以理解的是,图片素材是指通过拍摄得到的照片或通过绘画得到画作,图片素材的分类包括但不限于:人物、建筑、车辆、生活用品等,进而确定图片风格标签,并建立图片库;图标素材(Icon)在演示文稿中的可编辑性较高,可改变填充颜色等属性,图标同样按照其指示的内容划分为不同的种类,进而确定图标风格标签,并建立图标库。
另外,参考图7,图7是本发明另一个实施例提供的演示文稿生成方法的系统框图。
可以理解的是,分别建立模板库和图像库,其中,建立模板库的步骤如下:获取多个演示文稿素材,对演示文稿素材进行分析,确定29类的文本关系标签,其中,每个演示文稿素材包括页面素材和文本素材,文本关系标签用于指示文本素材的文本关系,基于文本关系标签,对各个页面素材进行分类处理,确定多个类别的模板页面,对页面素材进行风格分析,得到页面风格标签,根据模板页面和页面风格标签,建立模板库;图像库的步骤如下:获取多个图像素材,对图像素材进行风格分析,得到图像风格标签,根据图像素材和图像风格标签,建立图像库;然后创建软件开发工具包SDK,步骤如下:对演示文稿素材进行属性分类,确定七类属性内容,分别为图片属性、图标属性、形状属性、文本属性、表格属性、图表属性和动效属性,然后调用封装底层API,并创建各个属性内容对应的软件开发工具包;为了制作风格统一的演示文稿,通过目标文本信息和图像库,确定与目标文本信息相匹配的目标图像,并通过目标页面风格标签、目标文本关系标签和模板库,确定风格统一的目标模板页面,进而生成配置信息,然后将配置信息和预设的软件开发工具包相结合,自动生成风格统一的目标演示文稿;基于此,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
值得注意的是,调用封装底层API的处理方法,属于本领域技术人员熟知的技术,在此不多作赘述。
另外,参考图8,本发明还提供了一种演示文稿生成装置800,包括:
获取单元810,用于获取用户输入的目标页面风格标签、目标图像风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示目标文本信息的文本关系;
图像确定单元820,用于根据目标文本信息和预设的图像库,确定目标图像;
页面确定单元830,用于根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;
配置生成单元840,用于根据目标文本信息、目标图像和目标模板页面,生成配置信息;
演示文稿生成单元850,用于根据配置信息和预设的软件开发工具包,生成目标演示文稿。
可以理解的是,该演示文稿生成装置800的具体实施方式与上述演示文稿生成方法的具体实施例基本相同,在此不再赘述;基于此,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
另外,参照图9,本发明的一个实施例还提供了一种电子设备,该电子设备900包括:存储器910、处理器920及存储在存储器910上并可在处理器920上运行的计算机程序。
处理器920和存储器910可以通过总线或者其他方式连接。
实现上述实施例的演示文稿生成方法所需的非暂态软件程序以及指令存储在存储器910中,当被处理器920执行时,执行上述实施例中的演示文稿生成方法,例如,执行以上描述的图1中的方法步骤S110至步骤S150、图2中的方法步骤S210至步骤S240、图3中的方法步骤S310至步骤S330、图4中的方法步骤S410至步骤S420、图5中的方法步骤S510至步骤S520、图6中的方法步骤S610至步骤S630,通过获取用户输入的目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示目标文本信息的文本关系;根据目标文本信息和预设的图像库,确定目标图像;根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;根据目标文本信息、目标图像和目标模板页面,生成配置信息;根据配置信息和预设的软件开发工具包,生成目标演示文稿,其中,软件开发工具包用于设置目标文本信息和目标图像在目标模板页面内的布局格式。基于此,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述电子设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的演示文稿生成方法,例如,执行以上描述的图1中的方法步骤S110至步骤S150、图2中的方法步骤S210至步骤S240、图3中的方法步骤S310至步骤S330、图4中的方法步骤S410至步骤S420、图5中的方法步骤S510至步骤S520、图6中的方法步骤S610至步骤S630,通过获取用户输入的目标页面风格标签、多个目标文本信息和各个目标文本信息对应的目标文本关系标签,目标文本关系标签用于指示目标文本信息的文本关系;根据目标文本信息和预设的图像库,确定目标图像;根据目标页面风格标签、目标文本关系标签和预设的模板库,确定目标模板页面;根据目标文本信息、目标图像和目标模板页面,生成配置信息;根据配置信息和预设的软件开发工具包,生成目标演示文稿,其中,软件开发工具包用于设置目标文本信息和目标图像在目标模板页面内的布局格式。基于此,通过目标文本信息和图像库,确定符合内容相近的图像作为目标图像,并通过目标页面风格标签、目标文本关系标签和预设的模板库,确定风格统一且文本关系相同的模板页面作为目标模板页面,通过目标文本信息、目标图像和目标模板页面生成与软件开发工具包匹配的配置信息,进而生成符合目标页面风格标签所表征风格特征的目标演示文稿,能够提高风格统一的演示文稿的制作效率,从而降低时间成本。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims (10)

1.一种演示文稿生成方法,其特征在于,包括:
获取用户输入的目标页面风格标签、多个目标文本信息和各个所述目标文本信息对应的目标文本关系标签,所述目标文本关系标签用于指示所述目标文本信息的文本关系;
根据所述目标文本信息和预设的图像库,确定目标图像;
根据所述目标页面风格标签、所述目标文本关系标签和预设的模板库,确定目标模板页面;
根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息;
根据所述配置信息和预设的软件开发工具包,生成目标演示文稿,其中,所述软件开发工具包用于设置所述目标文本信息和所述目标图像在所述目标模板页面内的布局格式。
2.根据权利要求1所述的方法,其特征在于,所述模板库通过如下步骤建立:
获取多个演示文稿素材和文本关系标签,其中,每个所述演示文稿素材包括页面素材和文本素材,所述文本关系标签用于指示所述文本素材的文本关系;
基于所述文本关系标签,对各个所述页面素材进行分类处理,确定多个类别的模板页面;
对所述页面素材进行风格分析,得到页面风格标签;
根据所述模板页面和所述页面风格标签,建立所述模板库。
3.根据权利要求1所述的方法,其特征在于,所述图像库通过如下步骤建立:
获取多个图像素材;
对所述图像素材进行风格分析,得到图像风格标签;
根据所述图像素材和所述图像风格标签,建立图像库。
4.根据权利要求2所述的方法,其特征在于,所述软件开发工具包通过如下步骤创建:
对所述演示文稿素材进行属性分类,确定多个属性内容,其中,所述属性内容包括图片属性、图标属性、形状属性、文本属性、表格属性、图表属性和动效属性;
创建各个所述属性内容对应的软件开发工具包。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息,包括:
基于属性分类,确定所述目标文本信息、所述目标模板页面和所述目标图像对应的目标属性内容;
基于所述目标属性内容,根据所述目标文本信息、所述目标模板页面和所述目标图像,生成对应的配置信息。
6.根据权利要求3所述的方法,其特征在于,所述根据所述目标文本信息和预设的图像库,确定目标图像,包括:
对所述目标文本信息进行分句处理,得到多个文本子分句;
分别对每个所述文本子分句进行关键词提取,确定各个文本子分句对应的目标关键词;
基于所述目标关键词和所述图像风格标签,从所述图像库的所有图像素材中筛选出目标图像。
7.根据权利要求3所述的方法,其特征在于,所述图像素材包括图片素材和图标素材,所述图像库包括图片库和图标库,所述图像风格标签包括图片风格标签和图标风格标签,所述图片风格标签由所述图片素材而确定,所述图标风格标签由所述图标素材而确定,所述图片库由所述图片素材和所述图片风格标签而建立,所述图标库由所述图标素材和所述图标风格标签而建立。
8.一种演示文稿生成装置,其特征在于,包括:
获取单元,用于获取用户输入的目标页面风格标签、目标图像风格标签、多个目标文本信息和各个所述目标文本信息对应的目标文本关系标签,所述目标文本关系标签用于指示所述目标文本信息的文本关系;
图像确定单元,用于根据所述目标文本信息和预设的图像库,确定目标图像;
页面确定单元,用于根据所述目标页面风格标签、所述目标文本关系标签和预设的模板库,确定目标模板页面;
配置生成单元,用于根据所述目标文本信息、所述目标图像和所述目标模板页面,生成配置信息;
演示文稿生成单元,用于根据所述配置信息和预设的软件开发工具包,生成目标演示文稿。
9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的演示文稿生成方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1至7中任意一项所述的演示文稿生成方法。
CN202210439197.3A 2022-04-25 2022-04-25 演示文稿生成方法、装置、设备及存储介质 Pending CN114818639A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210439197.3A CN114818639A (zh) 2022-04-25 2022-04-25 演示文稿生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210439197.3A CN114818639A (zh) 2022-04-25 2022-04-25 演示文稿生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114818639A true CN114818639A (zh) 2022-07-29

Family

ID=82506689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210439197.3A Pending CN114818639A (zh) 2022-04-25 2022-04-25 演示文稿生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114818639A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216586A (zh) * 2023-09-12 2023-12-12 北京饼干科技有限公司 演示文稿模版的生成方法、装置、介质及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216586A (zh) * 2023-09-12 2023-12-12 北京饼干科技有限公司 演示文稿模版的生成方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
CN112711937B (zh) 一种模板推荐方法、装置、设备及存储介质
WO2021164255A1 (zh) 一种演示文稿生成方法、装置、计算机设备及存储介质
US20170228459A1 (en) Method and device for mobile searching based on artificial intelligence
CN106845645B (zh) 用于产生语义网络和用于媒体合成的方法及系统
CN112836487B (zh) 一种自动评论方法、装置、计算机设备及存储介质
CN112231563B (zh) 一种内容推荐方法、装置及存储介质
CN104881428B (zh) 一种信息图网页的信息图提取、检索方法和装置
US20220253719A1 (en) Schema augmentation system for exploratory research
CN114969282B (zh) 基于富媒体知识图谱多模态情感分析模型的智能交互方法
US20220301307A1 (en) Video Generation Method and Apparatus, and Promotional Video Generation Method and Apparatus
CN115115049A (zh) 神经网络模型的训练方法、装置、设备、介质及程序产品
CN114818639A (zh) 演示文稿生成方法、装置、设备及存储介质
CN117746143A (zh) 基于aigc的图像描述文本的生成方法及装置、存储介质
Lin et al. Beyond discrete genres: Mapping news items onto a multidimensional framework of genre cues
CN117436414A (zh) 演示文稿生成方法、装置、电子设备和存储介质
Bottoni et al. An analysis and case study of digital annotation
CN112052332A (zh) 检索方法、装置、电子设备及可读存储介质
Rahul et al. Social media sentiment analysis for Malayalam
US11645095B2 (en) Generating and utilizing a digital knowledge graph to provide contextual recommendations in digital content editing applications
CN114218907A (zh) 演示文稿生成方法、装置、电子设备及存储介质
Madan et al. Parsing and summarizing infographics with synthetically trained icon detection
Chatzipanagiotou et al. Automated recognition of geographical named entities in titles of Ukiyo-e prints
CN114547435A (zh) 内容质量的识别方法、装置、设备及可读存储介质
Zúñiga-Morales et al. Impact evaluation of multimodal information on sentiment analysis
Munshi et al. Multimedia information extraction and digital heritage preservation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination