CN115270748B - 文件生成方法、装置、电子设备和存储介质 - Google Patents
文件生成方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115270748B CN115270748B CN202210880398.7A CN202210880398A CN115270748B CN 115270748 B CN115270748 B CN 115270748B CN 202210880398 A CN202210880398 A CN 202210880398A CN 115270748 B CN115270748 B CN 115270748B
- Authority
- CN
- China
- Prior art keywords
- placeholder
- text
- data
- target
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明涉及数据处理技术领域,提供一种文件生成方法、装置、电子设备和存储介质,其中方法包括:获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符‑数据映射关系;基于所述占位符‑数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;其中,所述占位符‑数据映射关系包括文本占位符‑文本数据映射关系和表格占位符‑表格数据映射关系;所述文本占位符‑文本数据映射关系用于表征文本占位符对应的文本数据;所述表格占位符‑表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。本发明可以实现高效、便捷、灵活的文件生成方式。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种文件生成方法、装置、电子设备和存储介质。
背景技术
随着科技的迅速发展,人们对文件的智能化需求越来越高。在人们日常生活工作中,需要生成各种各样的文件。例如,公司需要与多个客户签订文件,基于此,需要制定包括客户定制条款的合同、协议等文件。
目前,文件生成大多依靠人工录入,不仅费时费力,还容易生成错误文件。
发明内容
本发明提供一种文件生成方法、装置、电子设备和存储介质,用以解决现有技术中人工生成文件效率低且易出错的缺陷。
本发明提供一种文件生成方法,包括:
获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;
基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
根据本发明提供的一种文件生成方法,所述基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,包括:
确定所述文本模板中存在属于文本占位符的第一占位符,基于所述文本占位符-文本数据映射关系,将所述第一占位符替换成第一目标文本数据;
确定所述文本模板中存在属于表格占位符的第二占位符,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据。
根据本发明提供的一种文件生成方法,所述基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据,包括:
基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格;
将所述第二占位符替换成所述目标表格对应的目标表格数据;
其中,所述目标表格为动态表格,所述动态表格为多个文件均包括的表格。
根据本发明提供的一种文件生成方法,所述将所述第二占位符替换成所述目标表格对应的目标表格数据,包括:
将所述第二占位符替换成所述目标表格;
确定所述文本模板中的目标表格中存在属于文本占位符的第四占位符,基于所述文本占位符-文本数据映射关系,将所述第四占位符替换成第三目标文本数据,以将所述文本模板中的目标表格替换成目标表格数据。
根据本发明提供的一种文件生成方法,所述表格模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中存在所述动态表格,将所述动态表格从所述样本文件提取至表格模板;
确定所述表格模板的动态表格中的第一动态文本数据,基于文本数据-文本占位符映射关系,将所述第一动态文本数据替换成第一目标占位符,所述第一动态文本数据为动态变化的变量。
根据本发明提供的一种文件生成方法,所述文本模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中的第二动态文本数据,基于文本数据-文本占位符映射关系,将所述第二动态文本数据替换成第二目标占位符,以得到所述文本模板,所述第二动态文本数据为动态变化的变量。
根据本发明提供的一种文件生成方法,所述获取所述待生成文件对应的样本文件,之后还包括:
确定所述样本文件中存在动态表格,将所述动态表格替换成表格占位符,所述动态表格为多个文件均包括的表格。
本发明还提供一种文件生成装置,包括:
获取模块,用于获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;
替换模块,用于基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文件生成方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文件生成方法。
本发明提供的文件生成方法、装置、电子设备和存储介质,获取待生成文件对应的文本模板,并获取待生成文件对应的占位符-数据映射关系;基于占位符-数据映射关系,将文本模板中的占位符替换成目标数据,以得到待生成文件。通过上述方式,通过占位符-数据映射关系,将文本模板中的占位符替换成目标数据,从而得到待生成文件,无需依靠人工录入,自动生成文件,从而提高文件生成的高效性和便捷性,且是基于占位符-数据映射关系替换占位符,提高了文件生成的准确性;同时,占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系,从而可以将文本模板中的文本占位符替换成文本数据,还可以将文本模板中的表格占位符替换成表格数据,进而可以生成包括文本和表格的文件,提高了文本生成的灵活性。综上,本发明可以实现高效、便捷、灵活的文件生成方式。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的文件生成方法的流程示意图之一;
图2为本发明提供的文件生成方法的流程示意图之二;
图3为本发明提供的文件生成装置的结构示意图;
图4为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着科技的迅速发展,人们对文件的智能化需求越来越高。在人们日常生活工作中,需要生成各种各样的文件。例如,公司需要与多个客户签订文件,基于此,需要制定包括客户定制条款的合同、协议等文件。
目前,文件生成大多依靠人工录入,不仅费时费力,还容易生成错误文件。因此,如何高效且准确地生成文件,是目前亟需解决的问题。例如,如何高效且准确地生成各种定制化条款对应的合同文件或协议文件。
针对上述问题,本发明提出以下各实施例。本发明实施例提供的文件生成方法的执行主体可以为服务器、台式电脑、笔记本电脑、智能手机、平板电脑等终端,本发明实施例对此不作具体限定。
图1为本发明提供的文件生成方法的流程示意图之一,如图1所示,该文件生成方法包括:
步骤110,获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系。
此处,待生成文件为待生成的目标文件,该待生成文件可以包括文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等等。
在本发明实施例中,以待生成文件为Word文件为例进行说明,相应地,文本模板、表格模板等也为Word模板。
此处,文本模板中包括至少一个文本占位符,该文本占位符用于获取对应的文本数据。
在一实施例中,该文本模板还可以包括至少一个表格占位符,该表格占位符用于获取对应的表格数据,该表格数据包括表格及其格中的文本数据。在一实施例中,该文本模板还可以包括表格,该表格中可以包括文本占位符。
在一实施例中,该文本模板还可以包括图片占位符,该图片占位符用于获取对应的图片数据。在一实施例中,该文本模板还可以包括图片。
在一实施例中,该文本模板还可以包括文件路径占位符,该文件路径占位符用于获取对应的文件路径数据。在一实施例中,该文本模板还可以包括文件路径。
该文本模板是根据一样本文件生成的,该样本文件对应一种文件类型,基于此,可以基于待生成文件的文件类型,确定对应的文本模板。例如,待生成文件为玉米农作物的销售合同,则对应的文本模板也为玉米农作物的销售合同对应的文本模板。具体地,从多个文本模板中获取待生成文件对应的文本模板。
此处,占位符-数据映射关系用于表征文本模板中各占位符对应的目标数据,以将文本模板中各占位符替换成对应的目标数据。
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
此处,文本占位符-文本数据映射关系用于将文本模板中的文本占位符替换成对应的目标文本数据。具体地,可以将文本模板中独立的文本占位符替换成对应的目标文本数据,也可以将文本模板的表格中的文本占位符替换成对应的目标文本数据。
此处,表格占位符-表格数据映射关系用于将文本模板中的表格占位符替换成对应的目标表格数据。具体地,将文本模板中的表格占位符替换成表格,且该表格中包括文本数据。
在一实施例中,表格占位符-表格数据映射关系可以用于获取表格占位符对应的表格,或者直接用于获取表格占位符对应的表格数据,即直接用于获取包括文本数据的表格。
在一实施例中,该占位符-数据映射关系还可以包括图片占位符-图片数据映射关系,该图片占位符-图片数据映射关系用于表征图片占位符对应的图片数据。该图片占位符-图片数据映射关系用于将文本模板中的图片占位符替换成对应的目标图片数据。
在一实施例中,该占位符-数据映射关系还可以包括文件路径占位符-文件路径数据映射关系,该文件路径占位符-文件路径数据映射关系用于表征文件路径占位符对应的文件路径数据。该文件路径占位符-文件路径数据映射关系用于将文本模板中的文件路径占位符替换成对应的目标文件路径数据。
在一些实施例中,占位符-数据映射关系通过键值对进行表征。例如,通过Map数据结构表征占位符-数据映射关系,即通过Map数据结构存储占位符及其对应的数据,也就是说,将占位符作为键(Key),将对应的数据作为值(Value)。例如,从数据库或其他存储位置将文本占位符对应的真实数据收集到内存中,以存储在Map数据类型变量中。
在一实施例中,在上述步骤110之前,加载文本模板。具体地,根据配置文件加载文本模板。
步骤120,基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件。
具体地,基于文本占位符-文本数据映射关系,将文本模板中的文本占位符替换成第一目标文本数据;基于表格占位符-表格数据映射关系,将文本模板中的表格占位符替换成目标表格数据;基于文本占位符-文本数据映射关系,将文本模板中的第一表格中的第三占位符替换成第二目标文本数据;基于图片占位符-图片数据映射关系,将文本模板中的图片占位符替换成目标图片数据;基于文件路径占位符-文件路径数据映射关系,将文本模板中的文件路径占位符替换成目标文件路径数据。
此处,文本模板包括至少一个占位符,基于占位符-数据映射关系,将文本模板中的所有占位符均进行替换,直至文本模板中不存在占位符,此时,将该替换后的文本模板作为待生成文件。
在一实施例中,占位符可以通过${param}进行表征,其中,变量param表示具体的占位符,例如,${goods}表示商品名的文本占位符。
在一实施例中,通过遍历文本模板的段落、行的方式,找到占位符,然后,再从占位符-数据映射关系中找到占位符对应的目标数据,从而将占位符替换成目标数据。
例如,通过遍历文本模板的段落、行的方式,找到占位符,即找到键(Key),然后,再从占位符-数据映射关系对应的Map中找到Key对应的目标数据(Value),从而将占位符替换成目标数据(Value)。
在一实施例中,在上述步骤120之后,将待生成文件进行关闭,以确保待生成文件的所有数据均保存完毕。
本发明实施例提供的文件生成方法,获取待生成文件对应的文本模板,并获取待生成文件对应的占位符-数据映射关系;基于占位符-数据映射关系,将文本模板中的占位符替换成目标数据,以得到待生成文件。通过上述方式,通过占位符-数据映射关系,将文本模板中的占位符替换成目标数据,从而得到待生成文件,无需依靠人工录入,自动生成文件,从而提高文件生成的高效性和便捷性,且是基于占位符-数据映射关系替换占位符,提高了文件生成的准确性;同时,占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系,从而可以将文本模板中的文本占位符替换成文本数据,还可以将文本模板中的表格占位符替换成表格数据,进而可以生成包括文本和表格的文件,提高了文本生成的灵活性。综上,本发明实施例可以实现高效、便捷、灵活的文件生成方式。
基于上述实施例,图2为本发明提供的文件生成方法的流程示意图之二,如图2所示,上述步骤120中,基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,包括:
步骤121,确定所述文本模板中存在属于文本占位符的第一占位符,基于所述文本占位符-文本数据映射关系,将所述第一占位符替换成第一目标文本数据。
此处,第一占位符为文本占位符,其用于获取对应的文本数据。在确定文本模板中存在属于文本占位符的第一占位符时,文本模板包括至少一个第一占位符。
具体地,基于文本占位符-文本数据映射关系,将文本模板中的所有第一占位符均进行替换,直至文本模板中不存在第一占位符。
在一实施例中,通过遍历文本模板的段落、行的方式,找到第一占位符,然后,再从文本占位符-文本数据映射关系中找到第一占位符对应的目标文本数据,从而将第一占位符替换成目标文本数据。
此处,第一目标文本数据用于在待生成文件中生成文本,该第一目标文本数据可以包括但不限于:文字、字母、数字、符号等等。
步骤122,确定所述文本模板中存在属于表格占位符的第二占位符,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据。
此处,第二占位符为表格占位符,其用于获取对应的表格数据。在确定文本模板中存在属于表格占位符的第二占位符时,文本模板包括至少一个第二占位符。
具体地,基于表格占位符-表格数据映射关系,将文本模板中的所有第二占位符均进行替换,直至文本模板中不存在第二占位符。
在一实施例中,通过遍历文本模板的段落、行的方式,找到第二占位符,然后,再从表格占位符-表格数据映射关系中找到第二占位符对应的目标表格数据,从而将第二占位符替换成目标表格数据。更为具体地,以遍历表格占位符的方式,找到第二占位符。
此处,目标表格数据用于在待生成文件中生成表格,该目标表格数据包括表格及其格中的文本数据,格中的文本数据可以包括但不限于:文字、字母、数字、符号等等。
进一步地,确定所述文本模板中存在第一表格,基于所述文本占位符-文本数据映射关系,将所述第一表格中的第三占位符替换成第二目标文本数据,所述第三占位符属于文本占位符。
此处,第三占位符为文本占位符,且该第三占位符为表格中的文本占位符,其用于获取对应的文本数据,以填充表格内容。在确定文本模板中存在属于文本占位符的第三占位符时,文本模板包括至少一个第三占位符。
具体地,基于文本占位符-文本数据映射关系,将文本模板中的所有第三占位符均进行替换,直至文本模板中不存在第三占位符。
在一实施例中,通过遍历文本模板的段落、行的方式,找到第三占位符,然后,再从文本占位符-文本数据映射关系中找到第三占位符对应的目标文本数据,从而将第三占位符替换成目标文本数据。
此处,第二目标文本数据用于在待生成文件的表格中生成文本,该第二目标文本数据可以包括但不限于:文字、字母、数字、符号等等。
可以理解的是,本发明不仅可以通过替换表格占位符生成对应的表格数据,还可以通过替换表格中的文本占位符,得到对应的表格数据。
进一步地,确定所述文本模板中存在属于图片占位符的第五占位符,基于图片占位符-图片数据映射关系,将文本模板中的第五占位符替换成目标图片数据。
进一步地,确定所述文本模板中存在属于文件路径占位符的第六占位符,基于文件路径占位符-文件路径数据映射关系,将文本模板中的第六占位符替换成目标文件路径数据。
本发明实施例提供的文件生成方法,通过上述方式,可以将文本模板中的文本占位符替换成文本数据,还可以将文本模板中的表格占位符替换成表格数据,进而可以生成包括文本和表格的文件,提高了文本生成的灵活性;同时,生成包括表格的文件有两种方式,一种为替换表格占位符,另一种为替换表格中的文本占位符,从而进一步提高文本生成的灵活性。
基于上述任一实施例,该方法中,上述步骤122中,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据,包括:
基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格;
将所述第二占位符替换成所述目标表格对应的目标表格数据;
其中,所述目标表格为动态表格,所述动态表格为多个文件均包括的表格。
此处,表格模板包括动态表格,其用于放置动态表格,即同一表格可以在不同文件中存在,或者在不同文件有不同的位置,或者在一文件中不确定有多少个,此时,可以将该表格确定为动态表格,并将该动态表格提取至另一个单独的文件,得到表格模板。
此处,获取到目标表格后,仅仅得知目标表格的表格类型和表格在文本模板中的放置位置,目标表格中的内容并不得知。
此处,目标表格对应的目标表格数据包括该目标表格和目标表格的格中的文本数据。
具体地,如何将第二占位符替换成目标表格数据,有如下两种实施例:
在一实施例中,将第二占位符替换成目标表格;确定文本模板中的目标表格中存在属于文本占位符的第四占位符,基于文本占位符-文本数据映射关系,将第四占位符替换成第三目标文本数据,以将文本模板中的目标表格替换成目标表格数据。
此处,先将第二占位符替换成目标表格,再替换目标表格中的文本占位符,从而实现将第二占位符替换成目标表格数据。
在另一实施例中,确定表格模板中的目标表格中存在属于文本占位符的第四占位符,基于文本占位符-文本数据映射关系,将表格模板中的第四占位符替换成第三目标文本数据,以得到目标表格数据;将第二占位符替换成目标表格数据。
此处,先将表格模板中的第四占位符替换成目标文本数据,即先替换目标表格中的文本占位符,以得到目标表格数据,再将第二占位符替换成目标表格数据。
在一实施例中,可以根据实际的表格格式,对目标表格数据进行行合并处理和列合并处理。
在一实施例中,在上述基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格的步骤之前,加载表格模板。具体地,根据配置文件加载表格模板。
本发明实施例提供的文件生成方法,通过上述方式,为表格占位符的替换方式提供支持,从而可以将文本模板中的表格占位符替换成表格数据。
基于上述任一实施例,该方法中,所述将所述第二占位符替换成所述目标表格对应的目标表格数据,包括:
将所述第二占位符替换成所述目标表格;
确定所述文本模板中的目标表格中存在属于文本占位符的第四占位符,基于所述文本占位符-文本数据映射关系,将所述第四占位符替换成第三目标文本数据,以将所述文本模板中的目标表格替换成目标表格数据。
此处,第四占位符为文本占位符,且该第四占位符为表格中的文本占位符,其用于获取对应的文本数据,以填充表格内容。在确定文本模板中的目标表格中存在属于文本占位符的第四占位符时,文本模板中的目标表格包括至少一个第四占位符。
具体地,基于文本占位符-文本数据映射关系,将文本模板中的目标表格中的所有第四占位符均进行替换,直至文本模板中的目标表格中不存在第四占位符。
在一实施例中,通过遍历文本模板中的目标表格的行、列的方式,找到第四占位符,然后,再从文本占位符-文本数据映射关系中找到第四占位符对应的目标文本数据,从而将第四占位符替换成目标文本数据。
此处,第三目标文本数据用于在文本模板中的目标表格的表格中生成文本,该第三目标文本数据可以包括但不限于:文字、字母、数字、符号等等。
本发明实施例提供的文件生成方法,通过上述方式,为表格占位符的替换方式提供支持,从而可以将文本模板中的表格占位符替换成表格数据。
基于上述任一实施例,该方法中,所述表格模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中存在所述动态表格,将所述动态表格从所述样本文件提取至表格模板;
确定所述表格模板的动态表格中的第一动态文本数据,基于文本数据-文本占位符映射关系,将所述第一动态文本数据替换成第一目标占位符,所述第一动态文本数据为动态变化的变量。
此处,样本文件为包括完整数据的文件,该样本文件可以包括文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等等。
此处,动态表格可以在不同文件中存在,或者在不同文件有不同的位置,或者在一文件中不确定有多少个,因此,需要将动态表格提取至表格模板。
需要说明的是,若表格只存在该样本文件中,则可以不用提取至表格模板,直接将表格中的文本数据替换成文本占位符即可。
此处,表格模板用于放置至少一个动态表格,以供后续生成待生成文件时,可以从该表格模板中获取对应的表格及其表格中的文本数据。
此处,第一动态文本数据为动态变化的变量,例如,甲方公司名、乙方公司名、法定代表人、住所、联系电话、身份证号码、邮编、项目名、商品名、药品成分、施用量、防治对象、品种名称、种植密度、作业环节、作业内容、作业次数、单次作业面积等等。
此处,文本数据-文本占位符映射关系用于将第一动态文本数据替换为文本占位符。例如,样本文件中存在“xxx公司”,则“xxx公司”为第一动态文本数据,此时可以将“xxx公司”替换成${firstParty}。
此处,第一目标占位符为文本占位符,其用于表征该第一动态文本数据,以供后续基于第一目标占位符获取对应的文本数据。
在一实施例中,在确定所述表格模板的动态表格中的第一动态文本数据,基于文本数据-文本占位符映射关系,将所述第一动态文本数据替换成第一目标占位符的步骤之前,将动态表格的合并项全部释放,以确保不能有单元格合并的情况。
在一实施例中,在表格模板已确定完毕,重新打开该表格模板,以确保填充的表格都已经在表格模板中。
本发明实施例提供的文件生成方法,通过上述方式,将样本文件中的动态表格提取至表格模板,并将动态表格中的动态文本数据替换成文本占位符,以供后续可以通过表格模板获取对应的表格,并获取表格内的文本数据,进而可以生成包括文本和表格的文件,提高了文本生成的灵活性。
基于上述任一实施例,该方法中,所述文本模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中的第二动态文本数据,基于文本数据-文本占位符映射关系,将所述第二动态文本数据替换成第二目标占位符,以得到所述文本模板,所述第二动态文本数据为动态变化的变量。
此处,样本文件为包括完整数据的文件,该样本文件可以包括文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等等。
此处,第二动态文本数据为动态变化的变量,例如,甲方公司名、乙方公司名、法定代表人、住所、联系电话、身份证号码、邮编、项目名、商品名、药品成分、施用量、防治对象、品种名称、种植密度、作业环节、作业内容、作业次数、单次作业面积等等。
此处,文本数据-文本占位符映射关系用于将第二动态文本数据替换为文本占位符。例如,样本文件中存在“甲方:xxx公司”,则“xxx公司”为第二动态文本数据,此时可以将“xxx公司”替换成${firstParty}。
此处,第二目标占位符为文本占位符,其用于表征该第二动态文本数据,以供后续基于第二目标占位符获取对应的文本数据。
在一实施例中,在文本模板已替换完毕,重新打开该文本模板,以便后续基于文本模板生成文件,即便于后续数据写入。
本发明实施例提供的文件生成方法,通过上述方式,将样本文件中的动态文本数据替换成文本占位符,以供后续可以通过文本占位符获取对应的文本数据,从而可以将文本模板中的文本占位符替换成文本数据,进而可以生成包括文本的文件,提高了文本生成的灵活性。
基于上述任一实施例,该方法中,所述获取所述待生成文件对应的样本文件,之后还包括:
确定所述样本文件中存在动态表格,将所述动态表格替换成表格占位符,所述动态表格为多个文件均包括的表格。
此处,动态表格可以在不同文件中存在,或者在不同文件有不同的位置,或者在一文件中不确定有多少个,因此,需要将动态表格替换成表格占位符。
具体地,基于动态表格-占位符映射关系,将动态表格替换成表格占位符。该动态表格-占位符映射关系是根据真实数据确定的,即基于真实数据分析文本模板中哪个位置用于放置表格占位符,即该表格占位符可以表示文件中某个位置某个特定的表格。
本发明实施例提供的文件生成方法,通过上述方式,将样本文件中的动态表格替换成表格占位符,以使后续可以通过表格占位符获取对应的表格,从而可以将文本模板中的表格占位符替换成表格数据,进而可以生成包括表格的文件,提高了文本生成的灵活性。
下面对本发明提供的文件生成装置进行描述,下文描述的文件生成装置与上文描述的文件生成方法可相互对应参照。
图3为本发明提供的文件生成装置的结构示意图,如图3所示,该文件生成装置,包括:
获取模块310,用于获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;
替换模块320,用于基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
本发明实施例提供的文件生成装置,获取待生成文件对应的文本模板,并获取待生成文件对应的占位符-数据映射关系;基于占位符-数据映射关系,将文本模板中的占位符替换成目标数据,以得到待生成文件。通过上述方式,通过占位符-数据映射关系,将文本模板中的占位符替换成目标数据,从而得到待生成文件,无需依靠人工录入,自动生成文件,从而提高文件生成的高效性和便捷性,且是基于占位符-数据映射关系替换占位符,提高了文件生成的准确性;同时,占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系,从而可以将文本模板中的文本占位符替换成文本数据,还可以将文本模板中的表格占位符替换成表格数据,进而可以生成包括文本和表格的文件,提高了文本生成的灵活性。综上,本发明实施例可以实现高效、便捷、灵活的文件生成方式。
基于上述任一实施例,该替换模块320包括:
第一替换单元,用于确定所述文本模板中存在属于文本占位符的第一占位符,基于所述文本占位符-文本数据映射关系,将所述第一占位符替换成第一目标文本数据;
第二替换单元,用于确定所述文本模板中存在属于表格占位符的第二占位符,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据。
基于上述任一实施例,该第二替换单元还用于:
基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格;
将所述第二占位符替换成所述目标表格对应的目标表格数据;
其中,所述目标表格为动态表格,所述动态表格为多个文件均包括的表格。
基于上述任一实施例,该第二替换单元还用于:
将所述第二占位符替换成所述目标表格;
确定所述文本模板中的目标表格中存在属于文本占位符的第四占位符,基于所述文本占位符-文本数据映射关系,将所述第四占位符替换成第三目标文本数据,以将所述文本模板中的目标表格替换成目标表格数据。
基于上述任一实施例,该装置还包括:
文件获取模块,用于获取所述待生成文件对应的样本文件;
表格提取模块,用于确定所述样本文件中存在所述动态表格,将所述动态表格从所述样本文件提取至表格模板;
数据替换模块,用于确定所述表格模板的动态表格中的第一动态文本数据,基于文本数据-文本占位符映射关系,将所述第一动态文本数据替换成第一目标占位符,所述第一动态文本数据为动态变化的变量。
基于上述任一实施例,该装置还包括:
文件获取模块,用于获取所述待生成文件对应的样本文件;
数据替换模块,还用于确定所述样本文件中的第二动态文本数据,基于文本数据-文本占位符映射关系,将所述第二动态文本数据替换成第二目标占位符,以得到所述文本模板,所述第二动态文本数据为动态变化的变量。
基于上述任一实施例,该装置还包括:
表格替换模块,用于确定所述样本文件中存在动态表格,将所述动态表格替换成表格占位符,所述动态表格为多个文件均包括的表格。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行文件生成方法,该方法包括:获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的文件生成方法,该方法包括:获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的文件生成方法,该方法包括:获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种文件生成方法,其特征在于,包括:
获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;
基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;
所述基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,包括:
确定所述文本模板中存在属于文本占位符的第一占位符,基于所述文本占位符-文本数据映射关系,将所述第一占位符替换成第一目标文本数据;
确定所述文本模板中存在属于表格占位符的第二占位符,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据;
所述基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据,包括:
基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格;
将所述第二占位符替换成所述目标表格对应的目标表格数据;
所述将所述第二占位符替换成所述目标表格对应的目标表格数据,包括:
将所述第二占位符替换成所述目标表格;
确定所述文本模板中的目标表格中存在属于文本占位符的第四占位符,基于所述文本占位符-文本数据映射关系,将所述第四占位符替换成第三目标文本数据,以将所述文本模板中的目标表格替换成目标表格数据;
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据;
所述目标表格为动态表格,所述动态表格为多个文件均包括的表格;
同一所述动态表格在不同文件中存在;和/或,同一所述动态表格在不同文件中位置不同;和/或,同一所述动态表格在不同文件中数量不同。
2.根据权利要求1所述的文件生成方法,其特征在于,所述表格模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中存在所述动态表格,将所述动态表格从所述样本文件提取至表格模板;
确定所述表格模板的动态表格中的第一动态文本数据,基于文本数据-文本占位符映射关系,将所述第一动态文本数据替换成第一目标占位符,所述第一动态文本数据为动态变化的变量。
3.根据权利要求1所述的文件生成方法,其特征在于,所述文本模板基于如下步骤确定:
获取所述待生成文件对应的样本文件;
确定所述样本文件中的第二动态文本数据,基于文本数据-文本占位符映射关系,将所述第二动态文本数据替换成第二目标占位符,以得到所述文本模板,所述第二动态文本数据为动态变化的变量。
4.根据权利要求3所述的文件生成方法,其特征在于,所述获取所述待生成文件对应的样本文件,之后还包括:
确定所述样本文件中存在动态表格,将所述动态表格替换成表格占位符,所述动态表格为多个文件均包括的表格。
5.一种文件生成装置,其特征在于,包括:
获取模块,用于获取待生成文件对应的文本模板,并获取所述待生成文件对应的占位符-数据映射关系;
替换模块,用于基于所述占位符-数据映射关系,将所述文本模板中的占位符替换成目标数据,以得到所述待生成文件;
所述替换模块包括:
第一替换单元,用于确定所述文本模板中存在属于文本占位符的第一占位符,基于所述文本占位符-文本数据映射关系,将所述第一占位符替换成第一目标文本数据;
第二替换单元,用于确定所述文本模板中存在属于表格占位符的第二占位符,基于所述表格占位符-表格数据映射关系,将所述第二占位符替换成目标表格数据;
所述第二替换单元还用于:
基于所述表格占位符-表格数据映射关系,从表格模板中获取所述第二占位符对应的目标表格;
将所述第二占位符替换成所述目标表格;
确定所述文本模板中的目标表格中存在属于文本占位符的第四占位符,基于所述文本占位符-文本数据映射关系,将所述第四占位符替换成第三目标文本数据,以将所述文本模板中的目标表格替换成目标表格数据;
其中,所述占位符-数据映射关系包括文本占位符-文本数据映射关系和表格占位符-表格数据映射关系;
所述文本占位符-文本数据映射关系用于表征文本占位符对应的文本数据;
所述表格占位符-表格数据映射关系用于表征表格占位符对应的表格数据,所述表格数据包括表格及其格中的文本数据;
所述目标表格为动态表格,所述动态表格为多个文件均包括的表格;
同一所述动态表格在不同文件中存在;和/或,同一所述动态表格在不同文件中位置不同;和/或,同一所述动态表格在不同文件中数量不同。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述文件生成方法。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述文件生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210880398.7A CN115270748B (zh) | 2022-07-25 | 2022-07-25 | 文件生成方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210880398.7A CN115270748B (zh) | 2022-07-25 | 2022-07-25 | 文件生成方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115270748A CN115270748A (zh) | 2022-11-01 |
CN115270748B true CN115270748B (zh) | 2023-05-23 |
Family
ID=83768023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210880398.7A Active CN115270748B (zh) | 2022-07-25 | 2022-07-25 | 文件生成方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115270748B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779949A (zh) * | 2021-09-17 | 2021-12-10 | 北京天融信网络安全技术有限公司 | 一种报告生成方法、装置、电子设备、存储介质及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9268761B2 (en) * | 2009-06-05 | 2016-02-23 | Microsoft Technology Licensing, Llc | In-line dynamic text with variable formatting |
CN107590115B (zh) * | 2017-09-13 | 2020-08-11 | 北京勤哲软件技术有限责任公司 | 一种Word报告自动生成方法与装置 |
CN109240625A (zh) * | 2018-08-09 | 2019-01-18 | 深圳市口袋网络科技有限公司 | 一种适用于打印的文档生成方法、装置和计算机存储介质 |
CN110347989A (zh) * | 2019-07-04 | 2019-10-18 | 北京明略软件系统有限公司 | 电子表格的生成方法及装置 |
CN112364617A (zh) * | 2020-10-29 | 2021-02-12 | 北京新锦成科技有限公司 | 文件信息的处理方法、装置、电子设备和存储介质 |
CN113822037B (zh) * | 2021-11-23 | 2022-04-26 | 深圳逻辑汇科技有限公司 | 插入占位符并生成数据映射表的方法、装置、设备及介质 |
-
2022
- 2022-07-25 CN CN202210880398.7A patent/CN115270748B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779949A (zh) * | 2021-09-17 | 2021-12-10 | 北京天融信网络安全技术有限公司 | 一种报告生成方法、装置、电子设备、存储介质及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115270748A (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9495347B2 (en) | Systems and methods for extracting table information from documents | |
CN110457302B (zh) | 一种结构化数据智能清洗方法 | |
CN110751143A (zh) | 一种电子发票信息的提取方法及电子设备 | |
CN108108342B (zh) | 结构化文本的生成方法、检索方法及装置 | |
US20120330662A1 (en) | Input supporting system, method and program | |
CN110263009A (zh) | 日志分类规则的生成方法、装置、设备及可读存储介质 | |
CN110659318A (zh) | 基于大数据的策略推送方法、系统及计算机设备 | |
CN115391439A (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN111143556A (zh) | 软件功能点自动计数方法、装置、介质及电子设备 | |
CN106294480A (zh) | 一种文件格式转换方法、装置及试题导入系统 | |
CN113836038A (zh) | 测试数据构造方法、装置、设备及存储介质 | |
CN112906361A (zh) | 文本数据的标注方法和装置、电子设备和存储介质 | |
CN114528413B (zh) | 众包标注支持的知识图谱更新方法、系统和可读存储介质 | |
CN115270748B (zh) | 文件生成方法、装置、电子设备和存储介质 | |
CN112418875A (zh) | 跨平台税务智能客服语料迁移方法及装置 | |
CN111552527A (zh) | 用户界面内文字翻译方法、装置、系统及存储介质 | |
CN116562247A (zh) | 电子表格内容生成方法、装置和计算机设备 | |
US20200226162A1 (en) | Automated Reporting System | |
CN114861614A (zh) | 用于填充数据的方法及装置、电子设备、介质 | |
CN106909570B (zh) | 一种数据转换方法及装置 | |
CN114116877B (zh) | 一种数据转换的方法、装置、计算机设备和介质 | |
CN116071739A (zh) | 自动生成文本识别模型训练数据的方法及装置、存储介质 | |
CN116737809A (zh) | 衍生变量的生成方法、装置、设备、介质及产品 | |
CN117350831A (zh) | 跨境场景下数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |