CN114911753A - 一种演示文档的生成方法、装置、电子设备及存储介质 - Google Patents

一种演示文档的生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114911753A
CN114911753A CN202210523877.3A CN202210523877A CN114911753A CN 114911753 A CN114911753 A CN 114911753A CN 202210523877 A CN202210523877 A CN 202210523877A CN 114911753 A CN114911753 A CN 114911753A
Authority
CN
China
Prior art keywords
document
content
format
target
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210523877.3A
Other languages
English (en)
Inventor
范纪营
李霄寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN202210523877.3A priority Critical patent/CN114911753A/zh
Publication of CN114911753A publication Critical patent/CN114911753A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种演示文档的生成方法、装置、电子设备及存储介质。包括:获取待进行转换操作的目标格式文档;解析目标格式文档,并提取目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;按照格式信息与预设格式信息的匹配度对文档内容划分,得到第一文档内容以及第二文档内容;将第二文档内容转换为语音文件,在预设演示文档中写入第一文档内容以及语音文件,得到目标演示文档。本申请能够自动划分满足预设格式的第一文档内容与不满足预设格式的第二文档内容,并将第一文档内容和第二文档内容写入演示文档,实现演示文档的自动生成。且将第二文档内容以语音文件的形式写入演示文档,避免格式不兼容导致文档转换失败的问题。

Description

一种演示文档的生成方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种演示文档的生成方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对文档转换技术提出了更高的要求。目前所有的开源文档台只能提供传统的文档功能,没有文档对应代码的双向转换或生成代码功能。而且在开源文档平台中,从文档到代码的开发成本较高,无法完全实现自动化创建文档,导致开发人员对开源文档平台中的文档维护成本较高,同时在文档转换过程中容易出现因格式不兼容导致文档转换失败。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种演示文档的生成方法、装置、电子设备及存储介质。
根据本申请实施例的一个方面,提供了一种演示文档的生成方法,包括:
获取待进行转换操作的目标格式文档,其中,所述目标格式文档中包括不同格式的文档内容;
解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;
按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,所述预设格式为演示文档所支持的格式;
将所述第二文档内容转换为语音文件,在所述预设演示文档中写入第一文档内容以及所述语音文件,得到目标演示文档。
进一步的,所述解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息,包括:
利用预设规则识别所述目标格式文档的全部文档内容,得到所述全部文档内容所携带的至少一个格式信息;
从所述全部文档内容中提取每个格式信息对应的文本内容。
进一步的,所述利用预设规则识别所述目标格式文档的全部文档内容,得到所述全部文档内容所携带的至少一个格式信息,包括:
检测所述全部文档内容,提取所述全部文档内容对应的文档特征;
按照所述文档特征对所述全部文档内容进行分类,得到至少一种内容类型的待处理文档内容,其中,所述内容类型包括:文本类型、图像类型、表格类型;
按照所述内容类型对应的识别策略,识别所述待处理文档内容中携带的至少一个格式信息。
进一步的,所述按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,包括:
计算所述格式信息与所述预设格式信息之间的匹配度;
将所述格式信息与所述预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为所述第一文档内容,将所述格式信息与所述预设格式信息的匹配度小于预设匹配度的文档内容确定为所述第二文档内容。
进一步的,所述在所述预设演示文档写入中第一文档内容以及所述语音文件,得到目标演示文档,包括:
将所述第一文档内容写入所述预设演示文档,得到初始演示文档;
确定所述初始演示文档中的分页节点,并按照所述分页节点对所述初始演示文档进行分页,得到分页后的初始演示文档;
从所述全部文档内容中获取所述第二文档内容的相邻文档内容,并确定所述相邻文档内容在所述分页后的初始演示文档中的第一位置信息;
基于所述第一位置信息确定所述语音文件的第二位置信息,并按照所述第二位置信息将所述语音文件写入所述分页后的初始演示文档,得到所述目标演示文档。
进一步的,所述确定所述初始演示文档中的分页节点,包括:
获取所述第一文档内容中满足预设分页格式的第三文档内容;
获取所述第三文档内容在所述第一文档内容中的位置信息,并将所述位置信息确定为所述分页节点。
进一步的,所述方法还包括:
获取所述目标演示文档对应用户需求信息;
在所述用户需求信息中携带所述目标演示文档对应的安全信息的情况下,获取所述安全信息对应的加密数据;
利用所述加密数据对所述目标演示文档进行加密,得到加密后的目标演示文档。
根据本申请实施例的另一个方面,还提供了一种演示文档的生成装置,包括:
获取模块,用于获取待进行转换操作的目标格式文档,其中,所述目标格式文档中包括不同格式的文档内容;
解析模块,用于解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;
划分模块,用于按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,所述预设格式为演示文档所支持的格式;
处理模块,用于将所述第二文档内容转换为语音文件,在所述预设演示文档中写入第一文档内容以及所述语音文件,得到目标演示文档。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的方法通过对格式文档中文档内容进行检测,能够自动划分满足演示文档所支持的预设格式的第一文档内容,与不满足预设格式的第二文档内容,并将第一文档内容和第二文档内容写入演示文档,实现了演示文档的自动生成。且将第二文档内容以语音文件的形式写入演示文档,解决了格式不兼容导致文档转换失败的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种演示文档的生成方法的流程图;
图2为本申请另一实施例提供的一种演示文档的生成方法的流程图;
图3为本申请实施例提供的一种演示文档的生成装置的框图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种演示文档的生成方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为描述方便,后续简称为电子设备。
根据本申请实施例的一方面,提供了一种演示文档的生成方法的方法实施例,图1为本申请实施例提供的一种方法的流程图,如图1所示,该方法包括:
步骤S11,获取待进行转换操作的目标格式文档,其中,目标格式文档中包括不同格式的文档内容。
本申请实施例提供的方法应用于智能终端,智能终端可以是智能手机、笔记本电脑、平板电脑等设备。具体的,智能终端获取待进行转换操作的目标格式文档的过程可以是:请求方设备根据自身的处理需求发送至智能终端。或,用户直接在智能终端直接上传。其中,目标格式文档可以是Word文档,Excle文档等。
在本申请实施例中,目标格式文档中包括的不同格式的文档内容可以是文本、表格以及图片等等。其中,文本和表格包括多个格式,例如:标题格式、正文格式等等,图片包括多个格式,例如:图片效果、轮廓等等。
步骤S12,解析目标格式文档,并提取目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息。
在本申请实施例中,步骤S12,解析目标格式文档,并提取目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息,包括以下步骤A1-A2:
步骤A1,利用预设规则识别目标格式文档的全部文档内容,得到全部文档内容所携带的至少一个格式信息。
在本申请实施例中,步骤A1,利用预设规则识别目标格式文档的全部文档内容,得到全部文档内容所携带的至少一个格式信息,包括以下步骤A101-A103:
步骤A101,检测全部文档内容,提取全部文档内容对应的文档特征。
在本申请实施例中,利用目标识别模型提取目标格式文档的全部文档内容,并提取全部文档内容所包括的文档特征,文档特征可以是,文本特征,图像特征,表格特征,页眉页码特征等等。
需要说明的是,目标识别模型可以采用文档样本进行训练,具体的,获取文档样本以及文档样本对应文档标注信息,文档标注信息用于标注全部文档内容中各个内容对应的文档特征,然后将文档样本以及文档标注信息输入至初始识别模型,以使初始识别模型提取文档内容的文档内容,并学习文档内容与文档特征之间的关系,得到最终的目标识别模型。
步骤A102,按照文档特征对全部文档内容进行分类,得到至少一种内容类型的待处理文档内容,其中,内容类型包括:文本类型、图像类型、表格类型。
在本申请实施例中,在得到全部文档内容的文档特征后,利用目标分类模型基于文档内容与预设内容类型之间的对应关系,输出当前的文档特征对应的内容类型,然后汇总每一个文档类型对应待处理文档内容。
需要说明的是,目标分类模型可以采用内容特征样本进行训练,具体的,获取内容特征样本以及内容特征样本对应类型标注信息,类型标注信息用于标注内容特征样本对应的内容类型,然后将内容特征样本以及类型标注信息输入至初始分类模型,以使初始分类模型内容特征样本与内容类型之间的关系,得到最终的目标分类模型。
步骤A103,按照内容类型对应的识别策略,识别待处理文档内容中携带的至少一个格式信息。
在本申请实施例中,获取预设内容类型与识别策略之间对应关系,并基于该对应关系确定当前的内容类型对应的识别策略,并利用该识别策略识别待处理文档内容中携带的至少一个格式信息。
作为一个示例:当内容类型为文本类型时,对应的识别策略是文本识别策略,利用文本识别策略对文本类型对应的待处理文档内容进行识别,可以是将待处理文档内容与预设格式信息进行匹配,将匹配度最大的预设格式信息作为最终的格式信息,例如:标题字号、字体,以及正文字号、字体等等。
步骤A2,从全部文档内容中提取每个格式信息对应的文本内容。
在本申请实施例中,在确定全部文档内容中的格式信息后,通过提取每个格式信息的文本内容,用于后续在格式信息不满足文档转换条件下,对该格式信息对应的文本内容进行处理。
步骤S13,按照格式信息与预设格式信息的匹配度对文档内容划分,得到第一文档内容以及第二文档内容,预设格式为演示文档所支持的格式。
在本申请实施例中,步骤S13,按照格式信息与预设格式信息的匹配度对文档内容划分,得到第一文档内容以及第二文档内容,包括以下步骤B1-B2:
步骤B1,计算格式信息与预设格式信息之间的匹配度。
步骤B2,将格式信息与预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为第一文档内容,将格式信息与预设格式信息的匹配度小于预设匹配度的文档内容确定为第二文档内容。
在本申请实施例中,首先获取演示文档所支持的预设格式信息,并计算目标格式文档所携带格式信息与预设格式信息之间的匹配度,预设格式信息可以是图像格式、文本格式等等。如果格式信息与预设格式信息的匹配度大于或等于预设匹配度,则确定格式信息与预设格式信息匹配,并将格式信息与预设格式信息匹配的文档内容确定为第一文档内容。相反,如果格式信息与预设格式信息的匹配度小于预设匹配度,则确定格式信息与预设格式信息不匹配,并将格式信息与预设格式信息不匹配的的文档内容确定为第二文档内容。
步骤S14,将第二文档内容转换为语音文件,在预设演示文档中写入第一文档内容以及语音文件,得到目标演示文档。
在本申请实施例中,由于第二文档内容不符合演示文档的转换规则,因此在转换过程中首先将第二文档内容转换为语音文件,再写入演示文档。
在本申请实施例中,步骤S14,在预设演示文档写入中第一文档内容以及语音文件,得到目标演示文档,包括以下步骤C1-C4:
步骤C1,将第一文档内容写入预设演示文档,得到初始演示文档。
在本申请实施例中,首先获取第一文档内容在目标格式文档中的位置信息和/或排列顺序,按照位置信息和/或排列顺序将第一文档内容写入预设岩石文档,得到初始演示文档。
作为一个示例,第一文档内容中包括多个文本段落以及多张图像,首先依据文本段落在目标格式文档中的段落序号或者行号确定对个文本段落的段落排列顺序,以及依据图像在目标格式文档中的位置信息(例如:页码、行号等),然后按照段落排列顺序将文本段落写入预设演示文档,以及按照位置信息将图像写入预设演示文档得到初始演示文档。
步骤C2,确定初始演示文档中的分页节点,并按照分页节点对初始演示文档进行分页,得到分页后的初始演示文档。
在本申请实施例中,确定初始演示文档中的分页节点,包括以下步骤C201-C202:
步骤C201,获取第一文档内容中满足预设分页格式的第三文档内容。
步骤C202,获取第三文档内容在第一文档内容中的位置信息,并将位置信息确定为分页节点。
在本申请实施例中,当第一文档内容中的文本段落由正文格式切换至一级标题格式时,则确定满足预设分页格式,此时将该正文格式对应的文档内容确定第三文档内容,并将第三文档内容在第一文档内容中的位置信息设置为分页节点。
或者,检测第一文档内容中文本段落的行数,在行数大于预设行数时,将文本段落中行数与预设行数相同的文档内容确定为第三文档内容,并将第三文档内容在第一文档内容中的位置信息设置为分页节点。
在本申请实施例中,在确定分页节点后,利用分页节点对初始演示文档进行分页,得到分页后的演示文档。
步骤C3,从全部文档内容中获取第二文档内容的相邻文档内容,并确定相邻文档内容在分页后的初始演示文档中的第一位置信息。
步骤C4,基于第一位置信息确定语音文件的第二位置信息,并按照第二位置信息将语音文件写入分页后的初始演示文档,得到目标演示文档。
在本申请实施例中,在写入第一文档内容后,还需要从全部文档内容中获取第二文档内容的相邻文档内容,由于全部文档内容中只包括第一文档内容和第二文档内容,因此可以确定第二文档内容的相邻文档内容属于第一文档内容,所以可以直接确定相邻文档内容在分页后的初始演示文档中的第一位置信息,并利用第一位置信息确定语音文件的第二位置信息,最后按照第二位置信息将语音文件写入分页后的初始演示文档,得到最终的目标演示文档。
本申请实施例提供的方法通过对格式文档中文档内容进行检测,能够自动划分满足演示文档所支持的预设格式的第一文档内容,与不满足预设格式的第二文档内容,并将第一文档内容和第二文档内容写入演示文档,实现了演示文档的自动生成。且将第二文档内容以语音文件的形式写入演示文档,解决了格式不兼容导致文档转换失败的问题。
图2为本申请实施例提供的一种演示文档的生成方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S21,获取目标演示文档对应用户需求信息。
步骤S22,在用户需求信息中携带目标演示文档对应的安全信息的情况下,获取安全信息对应的加密数据。
步骤S23,利用加密数据对目标演示文档进行加密,得到加密后的目标演示文档。
在本申请实施例中,在得到目标演示文档后,还需要获取目标演示文档对应的用户需求信息,从而依据目标演示文档对应的安全信息,安全信息可以包括:目标演示文档的安全等级或者目标演示文档所属的部门信息。基于安全等级或者部门信息与预设加密数据之间对应关系,确定当前使用的加密数据,利用加密数据对目标演示文档进行加密,得到加密后的目标演示文档,其中,加密过程可以是,利用加密数据中的加密算法或加密密钥对目标演示文档中的文本或图像进行加密。通过在得到目标演示文档后对目标演示文档进行加密能够保证目标演示文档的安全性。
图3为本申请实施例提供的一种演示文档的生成装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图3所示,该装置包括:
获取模块31,用于获取待进行转换操作的目标格式文档,其中,目标格式文档中包括不同格式的文档内容;
解析模块32,用于解析目标格式文档,并提取目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;
划分模块33,用于按照格式信息与预设格式信息的匹配度对文档内容划分,得到第一文档内容以及第二文档内容,预设格式为演示文档所支持的格式;
处理模块34,用于将第二文档内容转换为语音文件,在预设演示文档中写入第一文档内容以及语音文件,得到目标演示文档。
在本申请实施例中,解析模块32,用于利用预设规则识别目标格式文档的全部文档内容,得到全部文档内容所携带的至少一个格式信息;从全部文档内容中提取每个格式信息对应的文本内容。
在本申请实施例中,解析模块32,用于检测全部文档内容,提取全部文档内容对应的文档特征;按照文档特征对全部文档内容进行分类,得到至少一种内容类型的待处理文档内容,其中,内容类型包括:文本类型、图像类型、表格类型;按照内容类型对应的识别策略,识别待处理文档内容中携带的至少一个格式信息。
在本申请实施例中,划分模块33,用于计算格式信息与预设格式信息之间的匹配度;将格式信息与预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为第一文档内容,将格式信息与预设格式信息的匹配度小于预设匹配度的文档内容确定为第二文档内容。
在本申请实施例中,处理模块34,用于将第一文档内容写入预设演示文档,得到初始演示文档;确定初始演示文档中的分页节点,并按照分页节点对初始演示文档进行分页,得到分页后的初始演示文档;从全部文档内容中获取第二文档内容的相邻文档内容,并确定相邻文档内容在分页后的初始演示文档中的第一位置信息;基于第一位置信息确定语音文件的第二位置信息,并按照第二位置信息将语音文件写入分页后的初始演示文档,得到目标演示文档。
在本申请实施例中,处理模块34,用于获取第一文档内容中满足预设分页格式的第三文档内容;获取第三文档内容在第一文档内容中的位置信息,并将位置信息确定为分页节点。
在本申请实施例中,装置还包括:需求处理模块,用于获取目标演示文档对应用户需求信息;在用户需求信息中携带目标演示文档对应的安全信息的情况下,获取安全信息对应的加密数据;利用加密数据对目标演示文档进行加密,得到加密后的目标演示文档。
本申请实施例还提供一种电子设备,如图4所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。
存储器1503,用于存放计算机程序;
处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例的步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的演示文档的生成方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的演示文档的生成方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk)等。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种演示文档的生成方法,其特征在于,包括:
获取待进行转换操作的目标格式文档,其中,所述目标格式文档中包括不同格式的文档内容;
解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;
按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,所述预设格式为演示文档所支持的格式;
将所述第二文档内容转换为语音文件,在所述预设演示文档中写入第一文档内容以及所述语音文件,得到目标演示文档。
2.根据权利要求1所述的方法,其特征在于,所述解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息,包括:
利用预设规则识别所述目标格式文档的全部文档内容,得到所述全部文档内容所携带的至少一个格式信息;
从所述全部文档内容中提取每个格式信息对应的文本内容。
3.根据权利要求2所述的方法,其特征在于,所述利用预设规则识别所述目标格式文档的全部文档内容,得到所述全部文档内容所携带的至少一个格式信息,包括:
检测所述全部文档内容,提取所述全部文档内容对应的文档特征;
按照所述文档特征对所述全部文档内容进行分类,得到至少一种内容类型的待处理文档内容,其中,所述内容类型包括:文本类型、图像类型、表格类型;
按照所述内容类型对应的识别策略,识别所述待处理文档内容中携带的至少一个格式信息。
4.根据权利要求1所述的方法,其特征在于,所述按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,包括:
计算所述格式信息与所述预设格式信息之间的匹配度;
将所述格式信息与所述预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为所述第一文档内容,将所述格式信息与所述预设格式信息的匹配度小于预设匹配度的文档内容确定为所述第二文档内容。
5.根据权利要求2所述的方法,其特征在于,所述在所述预设演示文档写入中第一文档内容以及所述语音文件,得到目标演示文档,包括:
将所述第一文档内容写入所述预设演示文档,得到初始演示文档;
确定所述初始演示文档中的分页节点,并按照所述分页节点对所述初始演示文档进行分页,得到分页后的初始演示文档;
从所述全部文档内容中获取所述第二文档内容的相邻文档内容,并确定所述相邻文档内容在所述分页后的初始演示文档中的第一位置信息;
基于所述第一位置信息确定所述语音文件的第二位置信息,并按照所述第二位置信息将所述语音文件写入所述分页后的初始演示文档,得到所述目标演示文档。
6.根据权利要求5所述的方法,其特征在于,所述确定所述初始演示文档中的分页节点,包括:
获取所述第一文档内容中满足预设分页格式的第三文档内容;
获取所述第三文档内容在所述第一文档内容中的位置信息,并将所述位置信息确定为所述分页节点。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标演示文档对应用户需求信息;
在所述用户需求信息中携带所述目标演示文档对应的安全信息的情况下,获取所述安全信息对应的加密数据;
利用所述加密数据对所述目标演示文档进行加密,得到加密后的目标演示文档。
8.一种演示文档的生成装置,其特征在于,包括:
获取模块,用于获取待进行转换操作的目标格式文档,其中,所述目标格式文档中包括不同格式的文档内容;
解析模块,用于解析所述目标格式文档,并提取所述目标格式文档携带的至少一项文档内容,以及每项文档内容对应的格式信息;
划分模块,用于按照所述格式信息与预设格式信息的匹配度对所述文档内容划分,得到第一文档内容以及第二文档内容,所述预设格式为演示文档所支持的格式;
处理模块,用于将所述第二文档内容转换为语音文件,在所述预设演示文档中写入第一文档内容以及所述语音文件,得到目标演示文档。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法步骤。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法步骤。
CN202210523877.3A 2022-05-14 2022-05-14 一种演示文档的生成方法、装置、电子设备及存储介质 Pending CN114911753A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210523877.3A CN114911753A (zh) 2022-05-14 2022-05-14 一种演示文档的生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210523877.3A CN114911753A (zh) 2022-05-14 2022-05-14 一种演示文档的生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114911753A true CN114911753A (zh) 2022-08-16

Family

ID=82765896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210523877.3A Pending CN114911753A (zh) 2022-05-14 2022-05-14 一种演示文档的生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114911753A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115270737A (zh) * 2022-09-22 2022-11-01 广州市保伦电子有限公司 一种目标对象的格式修改方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115270737A (zh) * 2022-09-22 2022-11-01 广州市保伦电子有限公司 一种目标对象的格式修改方法及装置

Similar Documents

Publication Publication Date Title
EP3869385B1 (en) Method for extracting structural data from image, apparatus and device
CN110457302B (zh) 一种结构化数据智能清洗方法
CN111783471B (zh) 自然语言的语义识别方法、装置、设备及存储介质
WO2022105119A1 (zh) 意图识别模型的训练语料生成方法及其相关设备
CN111859093A (zh) 敏感词处理方法、装置及可读存储介质
CN112559526A (zh) 数据表导出方法、装置、计算机设备及存储介质
CN111159354A (zh) 一种敏感资讯检测方法、装置、设备及系统
CN114357174B (zh) 基于ocr和机器学习的代码分类系统及方法
CN114911753A (zh) 一种演示文档的生成方法、装置、电子设备及存储介质
CN115017441A (zh) 一种资产分类方法、装置及电子设备和存储介质
EP4273737A1 (en) Language labeling method and apparatus, and computer device and storage medium
CN111126058A (zh) 文本信息自动抽取方法、装置、可读存储介质和电子设备
WO2024207762A1 (zh) 一种数据识别方法及相关设备
CN114168715A (zh) 生成目标数据集的方法、装置、设备及存储介质
CN113742485A (zh) 一种处理文本的方法和装置
CN110489740B (zh) 语义解析方法及相关产品
CN106294292B (zh) 章节目录筛选方法及装置
US11482027B2 (en) Automated extraction of performance segments and metadata values associated with the performance segments from contract documents
CN113627129B (zh) 一种文字复制方法、装置、电子设备及可读存储介质
CN111695327B (zh) 一种乱码修复方法、装置、电子设备及可读存储介质
CN110704617B (zh) 新闻文本的分类方法、装置、电子设备和存储介质
KR102063797B1 (ko) 텍스트 자동요약 장치 및 방법
CN113536788A (zh) 信息处理方法、装置、存储介质及设备
CN112784527A (zh) 一种文档合并方法、装置及电子设备
CN111324732A (zh) 模型训练方法、文本处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination