CN117350264A - 一种ppt文件生成方法、装置、设备及存储介质 - Google Patents
一种ppt文件生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117350264A CN117350264A CN202311645411.1A CN202311645411A CN117350264A CN 117350264 A CN117350264 A CN 117350264A CN 202311645411 A CN202311645411 A CN 202311645411A CN 117350264 A CN117350264 A CN 117350264A
- Authority
- CN
- China
- Prior art keywords
- file
- content
- target
- ppt
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000003287 optical effect Effects 0.000 claims description 5
- 230000009193 crawling Effects 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 3
- 101710129069 Serine/threonine-protein phosphatase 5 Proteins 0.000 description 1
- 101710199542 Serine/threonine-protein phosphatase T Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920000470 poly(p-phenylene terephthalate) polymer Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/189—Automatic justification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种PPT文件生成方法、装置、设备及存储介质,涉及税务领域技术领域,包括:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。这样一来,使用自动PPT生成算法,用户输入文档自动生成PPT,提高了效率,降低了人力成本,还确保数据的安全性。
Description
技术领域
本发明涉及税务领域技术领域,特别涉及一种PPT文件生成方法、装置、设备及存储介质。
背景技术
在日常工作中,PPT(PowerPoint,即图形演示文稿)的使用非常广泛,尤其在税务领域经常需要汇报工作,制作PPT非常频繁,然而,制作一份满意的PPT费心耗时的事情。目前,有一些在线网站是可以制作PPT的,但是很多只是通用模板的拼接,成品粗糙,不适合特定领域。也有一些利用大模型+制作PPT网站组合的方案,但这些方案大都是通过一份markdown(一种轻量级标记语言)文档匹配一个简单的模板,直接生成PPT,文本生成内容差,模板样式少,成品质量不佳。大模型(LLM,即Large Language Model)为通用人工智能(AGI,即Artificial General Intelligence)的发展提供了新的方向。通过对海量公开数据,例如互联网和书籍等语料进行大规模自监督训练,大模型获得了强大的语言理解、语言生成和推理等能力。然而,大模型在利用私域数据方面仍面临一些挑战。私域数据指的是由特定企业或个人拥有的数据,通常包含领域特定的知识。将大模型与私域知识结合起来,将会产生巨大的价值。因此,针对税务领域的方案,如何更有效率的自动生成PPT是需要解决的。
发明内容
有鉴于此,本发明的目的在于提供一种PPT文件生成方法、装置、设备及存储介质,能够更有效率的自动生成PPT。其具体方案如下:
第一方面,本申请公开了一种PPT文件生成方法,包括:
获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;
若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;
利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
可选的,所述获取用户端上传的待分析文件之前,还包括:
爬取目标查询问题和目标文档资料进行数据清洗操作以得到待训练数据;
利用预设预训练模型对所述待训练数据进行向量化以得到目标知识库;
通过基于P-Tuning v2的参数微调方法对预设大模型进行参数微调以得到目标大模型。
可选的,若所述待分析文件的内容格式为文本内容时,所述调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件,包括:
调用所述目标知识库和所述目标大模型对所述待分析文件的内容进行处理以得到文件类型为目标模板文件类型的待处理文件。
可选的,若所述待分析文件的内容格式为对齐图内容时,所述调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件,包括:
利用光学字符识别算法对所述待分析文件的内容进行识别以得到各文字内容和对应的文本框信息;
基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片;
基于所述各文字内容和所述目标对齐图模板图片生成符合所述内容格式要求的待处理文件。
可选的,所述基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片,包括:
基于所述文本框信息计算各文字内容的中心点坐标,并基于各中心点坐标确定位于同一文本框内的相关文字;
基于所述相关文字生成新的各文字内容和对应的文本框信息确定目标文字矩阵;
利于预设相似度算法计算所述目标文字矩阵和各对齐图模板图片的模板文字矩阵的相似度值,并基于所述相似度值确定目标对齐图模板图片。
可选的,所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件之前,还包括:
对预先积累的历史PPT模板中的参数信息进行提取生成参数文档文件,并利用目标大模型和所述参数文档文件生成目标VBA代码;
对所述目标VBA代码进行调试以得到VBA模板,并将所述VBA模板存入预设VBA模板库中。
可选的,所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件,包括:
利用预设文档匹配算法对所述待处理文件中的内容进行解析以得到文档标题和文档段落;
基于所述文档标题和所述文档段落从所述预设VBA模板库中确定目标VBA模板,并基于所述目标VBA模板生成目标PPT文件。
第二方面,本申请公开了一种PPT文件生成装置,包括:
内容判断模块,用于获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;
文件转换模块,用于若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;
文件生成模块,用于利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现前述的PPT文件生成方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的PPT文件生成方法。
可见,本申请中,获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。即,通过对用户端上传的待分析文件进行处理,将所述待分析文件转换成符合内容格式要求的待处理文件后,通过预设自动PPT生成算法对所述待处理文件中的内容进行解析生成相应的PPT文件。这样一来,大大降低制作PPT的时间与成本,而且安全高效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种PPT文件生成方法流程图;
图2为本申请公开的一种具体的PPT文件生成方法流程图;
图3为本申请公开的一种具体的PPT文件生成方法流程图;
图4为本申请公开的一种具体的对齐图文件示意图;
图5为本申请公开的一种具体的调整后对齐图文件示意图;
图6为本申请公开的一种具体的PPT文件生成方法流程图;
图7为本申请公开的一种具体的OCR识别结果示意图;
图8为本申请公开的一种PPT文件生成装置结构示意图;
图9为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中有一些在线网站是可以制作PPT的,但是很多只是通用模板的拼接,成品粗糙,不适合特定领域。因此,本申请将具体介绍一种PPT文件生成方法,可以实现在税务领域,自动生成PPT文件的需求。
参见图1所示,本申请实施例公开了一种PPT文件生成方法,包括:
步骤S11:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求。
本实施例中,用户端上传的文件一般来说有三种形式,一种是包含一段文本内容的文件(prompt),第二种是输入一张包含对齐图的图片文件,第二种是输入编辑好的文档,word或者markdown格式。然后通过预设输入检测算法对所述上传的待分析文件的内容格式进行检测,确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求。其中符合目标内容模板的内容格式要求为输入编辑好的文档,word或者markdown格式。
本实施例中,所述获取用户端上传的待分析文件之前,还包括:爬取目标查询问题和目标文档资料进行数据清洗操作以得到待训练数据;利用预设预训练模型对所述待训练数据进行向量化以得到目标知识库;通过基于P-Tuning v2的参数微调方法对预设大模型进行参数微调以得到目标大模型。即,在进行PPT文档生成操作前,需要对生成过程中使用到的模型进行训练准备。首先采用历史积累公司与税务相关的查询问题与对应的文档资料,由于数据质量较高,因此仅需要对数据进行简单清洗操作以得到对应的待训练数据,然后对所述待训练数据中的数据问题句进行了embedding(一种离散型变量)向量化。传统的向量化方法如one-hot(独热编码)、tf-idf(term frequency–inverse documentfrequency,即一种用于信息检索与数据挖掘的常用加权技术)、word2vec(word tovector)等,存在向量稀疏和缺少上下文信息等缺点。因此,本申请选择预训练模型BERT(Bidirectional Encoder Representations from Transformers,即一种语言表示模型)进行向量化,并结合SimCSE(对比学习)模型进行文本相似度比较,以得到目标知识库。这样一来,由于SimCSE是一种高效的对比句向量表征框架,其核心是对比学习,通过将相似数据的距离拉近,将不相似数据的距离拉远,来更好地学习数据的表征。这可以使得后续文本匹配任务能获得更好的效果。本申请中,基于Llama2+ P-Tuning v2的方法,以较低的成本构建税务文档生成大模型。对于微调的数据结构一般包含一个指令,一个输入,一个输出。很多时候都是将指令和输入合并一起的,所以数据其实可以只需要一个输入和一个输出,类似于{“question”: “帮我写一份2023年个人所得税收入分析报告”,“output”: “我们进行了2023年中国个人所得税收入情况的分析。以下是我们的报告:收入来源分析……”}。为了实现税务文档生成这一特定应用场景,本申请选择了Llama2-13B作为预训练模型,并使用基于P-Tuning v2的高效参数微调方法。P-Tuning方法是将Prompt转换为可以学习的Embedding层,并用MLP(Multilayer Perceptron,即多层感知器)+LSTM(Long Short TermMemory,即长短期记忆)的方式来对Prompt Embedding进行一层处理。这样一来,使得模型拥有更多可学习的参数(从P-tuning和Prompt Tuning的0.01%增加到0.1%-3%),同时也足够参数高效。加入到更深层结构中的Prompt能给模型预测带来更直接的影响。
步骤S12:若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件。
本实施例中,所述输入检测算法会对用户的输入进行检测识别,如果用户输入的是文本内容,那就调用微调后的大模型与本地知识库,然后输出文档到下一步;如果用户输入的是对齐图,那就调用对齐图匹配算法,输出对齐图模板的文档到下一步;如果用户输入的是编辑好的文档,那么就直接进行步骤S13。其中,若所述待分析文件的内容格式为文本内容时,所述调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件,包括:调用所述目标知识库和所述目标大模型对所述待分析文件的内容进行处理以得到文件类型为目标模板文件类型的待处理文件。即,通过调用所述目标知识库对所述待分析文件的内容进行文本相似度比较将所述待分析文件的内容转化成为目标模板文件类型的待处理文件、利用所述目标大模型对所述待分析文件的内容进行处理为目标模板文件类型的待处理文件。这样一来,选择基于最新的开源大模型Llama2进行研发,并采用高效的Prompt微调方法P-Tuning v2,以训练适用于税务领域的文档大模型。同时,依托已积累的几千份高质量的税务文档,构建了一个文档知识库。逼近提高了效率,降低了人力成本,还确保了数据的安全性。若所述待分析文件的内容格式为对齐图内容时,可以使用预设对齐图匹配算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件。
步骤S13:利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
本实施例中,如图2所示,所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件之前,还包括:对预先积累的历史PPT模板中的参数信息进行提取生成参数文档文件,并利用目标大模型和所述参数文档文件生成目标VBA代码;对所述目标VBA代码进行调试以得到VBA模板,并将所述VBA模板存入预设VBA模板库中。需要说明的是,所述预设自动PPT生成算法的核心是构建一个PPT的VBA(Visual Basic宏语言)模板库。通过预先积累的PPT模板,提炼PPT模板中的参数信息并生成合适的prompt,同时借助大模型快速生成VBA代码,然后对VBA代码进行调试。调试成功后的VBA代码保存到预设VBA模板库中。比如输入prompt,要求如下: 新增一个文本框并插入一段文本:自动生成PPT,字体颜色:黑色,字号:60,字体加粗,字体:微软雅黑,对齐方式:居中对齐。生成vba代码:
Sub AddTextBoxWithText()
Dim slide As slide
Dim shape As shape
' 在当前活动的幻灯片上添加一个文本框
Set slide = ActivePresentation.Slides(ActiveWindow.View.slide.SlideIndex)
Set shape = slide.Shapes.AddTextbox(msoTextOrientationHorizontal,100, 100, 500, 200)
' 设置文本框的属性
With shape.TextFrame.TextRange
.Text = "自动生成PPT"
.Font.Name = "微软雅黑"
.Font.Size = 60
.Font.Bold = True
.Font.Color.RGB = RGB(0, 0, 0) ' 黑色
.ParagraphFormat.Alignment = ppAlignCenter ' 居中对齐
End With
End Sub
本实施例中,在所述VBA模板库生成之后,所述预设所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件,包括:利用预设文档匹配算法对所述待处理文件中的内容进行解析以得到文档标题和文档段落;基于所述文档标题和所述文档段落从所述预设VBA模板库中确定目标VBA模板,并基于所述目标VBA模板生成目标PPT文件。即在获取到待处理文件后,利用成熟的python包docx和markdown包对word和markdown文档进行解析,然后利用预设文档匹配算法遍历文档中的标题与段落,根据标题与段落的关系与数量自动匹配合适的VBA模板,进而生成完整的PPT文件。
可见,如图3所示,首先获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。即,利用大模型与AutoPPT算法实现了自动生成PPT的系统,大大降低制作PPT的时间与成本,而且安全高效。在生成大模型时,通过Llama2-13B+ P-Tuning v2 微调训练了大模型,不仅使用成本低,而且安全高效。
上述实施例对生成PPT的整个过程进行了详细介绍,本实施例将对所述待分析文件的内容格式为对齐图内容时,可以使用预设对齐图匹配算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件的过程,即将图4转化为图5的过程进行具体介绍。
参见图6所示,本申请实施例公开了一种具体的PPT文件生成方法,包括:
步骤S21:利用光学字符识别算法对待分析文件的内容进行识别以得到各文字内容和对应的文本框信息。
本实施例中,利用光学字符识别算法对待分析文件的内容进行识别以得到各文字内容和对应的文本框信息,即,利用OCR(Optical Character Recognition,即光学字符识别)识别算法,比如paddleocr(基于飞桨的OCR工具库),识别对齐图,然后就可以得到文本框坐标,文字和识别置信度。其中,可以根据所述识别置信度对获取到的文本框坐标,文字进行初步判断,当识别置信度过低,说明识别结果不准确,可以重新进行内容识别操作。
步骤S22:基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片。
本实施例中,在内容识别后,会存在识别结果不准确的情况,如图7所示,方框内的“应用层”三个字,识别出来分成了三个独立的模块,实际应该是在一个文本框里的,所以需要调整算法对结果进行调整。所述基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片,包括:基于所述文本框信息计算各文字内容的中心点坐标,并基于各中心点坐标确定位于同一文本框内的相关文字;基于所述相关文字生成新的各文字内容和对应的文本框信息确定目标文字矩阵;利于预设相似度算法计算所述目标文字矩阵和各对齐图模板图片的模板文字矩阵的相似度值,并基于所述相似度值确定目标对齐图模板图片。即,先计算出每个字的中心点坐标,然后比较偏离的距离,如果小于某个阈值,则认为他们是在同一个文本框内。然后,将图片分成(20x20)个块(block),如果文字的中心坐标在这个block中,则让这个block里的值赋值为1,如果没有文字在block里,这个block就赋值为0,就得到了一个20x20的0-1矩阵。根据所述输入的图片以及所有的模板图片的block矩阵,然后我们就可以利用相似度算法,比如cosine(余弦)距离,计算输入图片与所有模板图片的相似度,输出相似度最高的模板图片作为目标对齐图模板图片。
步骤S23:基于所述各文字内容和所述目标对齐图模板图片生成符合所述内容格式要求的待处理文件。
本实施例中,考虑到后续预设自动PPT生成算法,所以要将OCR识别后的文本内容与对齐图模板中的坐标保存到文档中,以得到符合所述内容格式要求的待处理文件。
可见,本申请中,通过使用预设光学字符识别算法对文档进行识别得到相应的文字和坐标信息后,再对坐标信息进行相应的调整生成对应的矩阵,最后确定目标对齐图模板图片后,生成相应的待处理文件。这样一来,通过算法设置自动生成符合内容格式要求的待处理文件,可以省去人工对文件调整的工作量,降低了人力成本,并且提高了PPT生成的效率。
参考图8所述,本申请实施例还相应公开了一种PPT文件生成装置,包括:
内容判断模块11,用于获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;
文件转换模块12,用于若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;
文件生成模块13,用于利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
可见,通过对用户端上传的待分析文件进行处理,将所述待分析文件转换成符合内容格式要求的待处理文件后,通过预设自动PPT生成算法对所述待处理文件中的内容进行解析生成相应的PPT文件。这样一来,大大降低制作PPT的时间与成本,而且安全高效。
在一些具体的实施例中,所述PPT文件生成装置,还可以包括:
待训练数据获取模块,用于爬取目标查询问题和目标文档资料进行数据清洗操作以得到待训练数据;
数据向量化模块,用于利用预设预训练模型对所述待训练数据进行向量化以得到目标知识库;
模型微调模块,用于通过基于P-Tuning v2的参数微调方法对预设大模型进行参数微调以得到目标大模型。
在一些具体的实施例中,所述文件转换模块12,具体可以包括:
第一内容转换单元,用于调用所述目标知识库和所述目标大模型对所述待分析文件的内容进行处理以得到文件类型为目标模板文件类型的待处理文件。
在一些具体的实施例中,所述文件转换模块12,具体可以包括:
内容识别单元,用于利用光学字符识别算法对所述待分析文件的内容进行识别以得到各文字内容和对应的文本框信息;
目标图片确定子模块,用于基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片;
第二内容转换单元,用于基于所述各文字内容和所述目标对齐图模板图片生成符合所述内容格式要求的待处理文件。
在一些具体的实施例中,所述目标图片确定子模块,具体可以包括:
相关文字确定单元,用于基于所述文本框信息计算各文字内容的中心点坐标,并基于各中心点坐标确定位于同一文本框内的相关文字;
文字矩阵调整单元,用于基于所述相关文字生成新的各文字内容和对应的文本框信息确定目标文字矩阵;
模板图片确定单元,用于利于预设相似度算法计算所述目标文字矩阵和各对齐图模板图片的模板文字矩阵的相似度值,并基于所述相似度值确定目标对齐图模板图片。
在一些具体的实施例中,所述PPT文件生成装置,还可以包括:
VBA代码生成模块,用于对预先积累的历史PPT模板中的参数信息进行提取生成参数文档文件,并利用目标大模型和所述参数文档文件生成目标VBA代码;
VBA代码调试模块,用于对所述目标VBA代码进行调试以得到VBA模板,并将所述VBA模板存入预设VBA模板库中。
在一些具体的实施例中,所述文件生成模块13,具体可以包括:
内容解析单元,用于利用预设文档匹配算法对所述待处理文件中的内容进行解析以得到文档标题和文档段落;
PPT生成单元,用于基于所述文档标题和所述文档段落从所述预设VBA模板库中确定目标VBA模板,并基于所述目标VBA模板生成目标PPT文件。
进一步的,本申请实施例还公开了一种电子设备,图9是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图9为本申请实施例提供的一种电子设备20的结构示意图。该电子设备 20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的PPT文件生成方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的PPT文件生成方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的PPT文件生成方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种PPT文件生成方法,其特征在于,包括:
获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;
若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;
利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
2.根据权利要求1所述的PPT文件生成方法,其特征在于,所述获取用户端上传的待分析文件之前,还包括:
爬取目标查询问题和目标文档资料进行数据清洗操作以得到待训练数据;
利用预设预训练模型对所述待训练数据进行向量化以得到目标知识库;
通过基于P-Tuning v2的参数微调方法对预设大模型进行参数微调以得到目标大模型。
3.根据权利要求2所述的PPT文件生成方法,其特征在于,若所述待分析文件的内容格式为文本内容时,所述调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件,包括:
调用所述目标知识库和所述目标大模型对所述待分析文件的内容进行处理以得到文件类型为目标模板文件类型的待处理文件。
4.根据权利要求1所述的PPT文件生成方法,其特征在于,若所述待分析文件的内容格式为对齐图内容时,所述调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件,包括:
利用光学字符识别算法对所述待分析文件的内容进行识别以得到各文字内容和对应的文本框信息;
基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片;
基于所述各文字内容和所述目标对齐图模板图片生成符合所述内容格式要求的待处理文件。
5.根据权利要求4所述的PPT文件生成方法,其特征在于,所述基于预设坐标调整算法对所述文本框信息进行调整以得到目标文字矩阵,并基于所述目标文字矩阵确定目标对齐图模板图片,包括:
基于所述文本框信息计算各文字内容的中心点坐标,并基于各中心点坐标确定位于同一文本框内的相关文字;
基于所述相关文字生成新的各文字内容和对应的文本框信息确定目标文字矩阵;
利于预设相似度算法计算所述目标文字矩阵和各对齐图模板图片的模板文字矩阵的相似度值,并基于所述相似度值确定目标对齐图模板图片。
6.根据权利要求1至5任一项所述的PPT文件生成方法,其特征在于,所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件之前,还包括:
对预先积累的历史PPT模板中的参数信息进行提取生成参数文档文件,并利用目标大模型和所述参数文档文件生成目标VBA代码;
对所述目标VBA代码进行调试以得到VBA模板,并将所述VBA模板存入预设VBA模板库中。
7.根据权利要求6所述的PPT文件生成方法,其特征在于,所述利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件,包括:
利用预设文档匹配算法对所述待处理文件中的内容进行解析以得到文档标题和文档段落;
基于所述文档标题和所述文档段落从所述预设VBA模板库中确定目标VBA模板,并基于所述目标VBA模板生成目标PPT文件。
8.一种PPT文件生成装置,其特征在于,包括:
内容判断模块,用于获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;
文件转换模块,用于若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;
文件生成模块,用于利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的PPT文件生成方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的PPT文件生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311645411.1A CN117350264B (zh) | 2023-12-04 | 2023-12-04 | 一种ppt文件生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311645411.1A CN117350264B (zh) | 2023-12-04 | 2023-12-04 | 一种ppt文件生成方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117350264A true CN117350264A (zh) | 2024-01-05 |
CN117350264B CN117350264B (zh) | 2024-02-23 |
Family
ID=89359790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311645411.1A Active CN117350264B (zh) | 2023-12-04 | 2023-12-04 | 一种ppt文件生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117350264B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491426A (zh) * | 2016-10-25 | 2017-12-19 | 宝沃汽车(中国)有限公司 | Ppt报告的自动生成方法及系统 |
CN109062874A (zh) * | 2018-06-12 | 2018-12-21 | 平安科技(深圳)有限公司 | 财政数据的获取方法、终端设备及介质 |
CN111241801A (zh) * | 2018-11-29 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 文件生成方法、装置、设备及计算机可读存储介质 |
US20210110527A1 (en) * | 2019-08-30 | 2021-04-15 | Sas Institute Inc. | Techniques for extracting contextually structured data from document images |
WO2021184578A1 (zh) * | 2020-03-17 | 2021-09-23 | 平安科技(深圳)有限公司 | 基于ocr的目标字段识别方法、装置、电子设备及存储介质 |
CN114913537A (zh) * | 2022-04-08 | 2022-08-16 | 河南天眼查科技有限公司 | 一种生成结构化数据的方法及装置 |
CN116595202A (zh) * | 2023-05-09 | 2023-08-15 | 上海交通大学 | 一种基于aigc技术的幻灯片自动生成方法及系统 |
CN116795780A (zh) * | 2023-07-31 | 2023-09-22 | 爱集微咨询(厦门)有限公司 | 文档格式转换方法、装置、存储介质及电子设备 |
CN116861921A (zh) * | 2023-07-10 | 2023-10-10 | 厦门大学 | 基于大语言模型的机器人任务解析方法、装置及可读介质 |
CN117095417A (zh) * | 2023-08-24 | 2023-11-21 | 税友软件集团股份有限公司 | 一种屏摄表单图像文本识别方法、装置、设备及存储介质 |
-
2023
- 2023-12-04 CN CN202311645411.1A patent/CN117350264B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491426A (zh) * | 2016-10-25 | 2017-12-19 | 宝沃汽车(中国)有限公司 | Ppt报告的自动生成方法及系统 |
CN109062874A (zh) * | 2018-06-12 | 2018-12-21 | 平安科技(深圳)有限公司 | 财政数据的获取方法、终端设备及介质 |
CN111241801A (zh) * | 2018-11-29 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 文件生成方法、装置、设备及计算机可读存储介质 |
US20210110527A1 (en) * | 2019-08-30 | 2021-04-15 | Sas Institute Inc. | Techniques for extracting contextually structured data from document images |
WO2021184578A1 (zh) * | 2020-03-17 | 2021-09-23 | 平安科技(深圳)有限公司 | 基于ocr的目标字段识别方法、装置、电子设备及存储介质 |
CN114913537A (zh) * | 2022-04-08 | 2022-08-16 | 河南天眼查科技有限公司 | 一种生成结构化数据的方法及装置 |
CN116595202A (zh) * | 2023-05-09 | 2023-08-15 | 上海交通大学 | 一种基于aigc技术的幻灯片自动生成方法及系统 |
CN116861921A (zh) * | 2023-07-10 | 2023-10-10 | 厦门大学 | 基于大语言模型的机器人任务解析方法、装置及可读介质 |
CN116795780A (zh) * | 2023-07-31 | 2023-09-22 | 爱集微咨询(厦门)有限公司 | 文档格式转换方法、装置、存储介质及电子设备 |
CN117095417A (zh) * | 2023-08-24 | 2023-11-21 | 税友软件集团股份有限公司 | 一种屏摄表单图像文本识别方法、装置、设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
HANGSEO CHOI, ET AL.: "Realtime Detection of Table Objects and Text Areas for OCR Preprocessing", 《WSEAS TRANSACTIONS ON INFORMATION SCIENCE AND APPLICATIONS》, 21 June 2023 (2023-06-21) * |
王秀芝: "用PPT制作企业投资项目审批报告模板的研究", 《硅谷》, 31 January 2015 (2015-01-31) * |
金源 等: "基于ChatGPT的财务分析:框架、应用与效果评估", 《财会月刊》, no. 19, 31 October 2023 (2023-10-31), pages 24 - 30 * |
Also Published As
Publication number | Publication date |
---|---|
CN117350264B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114821622B (zh) | 文本抽取方法、文本抽取模型训练方法、装置及设备 | |
WO2019052261A1 (zh) | 用于问答服务的方法、问答服务系统以及存储介质 | |
CN113268609B (zh) | 基于知识图谱的对话内容推荐方法、装置、设备及介质 | |
CN111753060A (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
US11749255B2 (en) | Voice question and answer method and device, computer readable storage medium and electronic device | |
CN112100332A (zh) | 词嵌入表示学习方法及装置、文本召回方法及装置 | |
CN116991875B (zh) | 一种基于大模型的sql语句生成、别名映射方法及设备 | |
CN115115914B (zh) | 信息识别方法、装置以及计算机可读存储介质 | |
CN117216219A (zh) | 一种思维链推理方法、装置、设备及存储介质 | |
CN115810068A (zh) | 一种图像描述生成方法、装置、存储介质及电子设备 | |
CN116955561A (zh) | 问答方法、装置、电子设备以及存储介质 | |
CN113326367B (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN117634459A (zh) | 目标内容生成及模型训练方法、装置、系统、设备及介质 | |
CN117350264B (zh) | 一种ppt文件生成方法、装置、设备及存储介质 | |
CN117828024A (zh) | 一种插件检索方法、装置、存储介质及设备 | |
CN117292146A (zh) | 一种面向工业场景的构建多模态大语言模型的方法、系统和应用方法 | |
CN117271567A (zh) | 基于大模型的税务文本转换方法、装置、设备及存储介质 | |
CN110197521B (zh) | 基于语义结构表示的视觉文本嵌入方法 | |
CN117093864A (zh) | 文本生成模型训练方法以及装置 | |
CN116308219A (zh) | 一种基于Tranformer的生成式RPA流程推荐方法及系统 | |
CN115905490A (zh) | 人机交互对话方法、装置以及设备 | |
CN114625759A (zh) | 模型训练方法、智能问答方法、设备、介质及程序产品 | |
CN114694098A (zh) | 基于图像识别与知识图谱的电网基建施工风险管控方法 | |
CN117573842B (zh) | 文档检索方法以及自动问答方法 | |
CN115796405B (zh) | 针对优化模型的求解报告生成方法及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |