CN115391439A - 文档数据导出方法、装置、电子设备和存储介质 - Google Patents

文档数据导出方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115391439A
CN115391439A CN202211021420.9A CN202211021420A CN115391439A CN 115391439 A CN115391439 A CN 115391439A CN 202211021420 A CN202211021420 A CN 202211021420A CN 115391439 A CN115391439 A CN 115391439A
Authority
CN
China
Prior art keywords
data
template
text
document
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211021420.9A
Other languages
English (en)
Other versions
CN115391439B (zh
Inventor
马金良
毕旭东
常庆伟
田阔
蔡永维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sinochem Agriculture Holdings
Original Assignee
Sinochem Agriculture Holdings
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sinochem Agriculture Holdings filed Critical Sinochem Agriculture Holdings
Priority to CN202211021420.9A priority Critical patent/CN115391439B/zh
Publication of CN115391439A publication Critical patent/CN115391439A/zh
Application granted granted Critical
Publication of CN115391439B publication Critical patent/CN115391439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,提供一种文档数据导出方法、装置、电子设备和存储介质,其中方法包括:获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;基于所述目标模板的占位符,确定所述目标文档中的待导出数据;将所述待导出数据从所述目标文档中导出。本发明提供的方法、装置、电子设备和存储介质,可以实现高效、便捷、准确的文档数据导出方式。

Description

文档数据导出方法、装置、电子设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种文档数据导出方法、装置、电子设备和存储介质。
背景技术
随着科技的迅速发展,人们对文档的智能化需求越来越高。在人们日常生活工作中,通常需要在文档中记录各种数据,而文档中的数据需要导出到系统和数据库中,以进行数据留存和后续的数据统计。
目前,文档数据导出大多依靠人工导出,即需要业务人员将文档中对应的数据手动维护到系统中,较为繁琐,不仅费时费力,还容易导出错误数据。
发明内容
本发明提供一种文档数据导出方法、装置、电子设备和存储介质,用以解决现有技术中人工导出数据效率低且易出错的缺陷。
本发明提供一种文档数据导出方法,包括:
获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;
基于所述目标模板的占位符,确定所述目标文档中的待导出数据;
将所述待导出数据从所述目标文档中导出。
根据本发明提供的一种文档数据导出方法,所述确定所述目标文档对应的目标模板,包括:
确定所述目标文档对应的待验证模板;
对所述目标文档与所述待验证模板进行对比验证;
将验证成功的待验证模板确定为所述目标文档对应的目标模板。
根据本发明提供的一种文档数据导出方法,所述待验证模板包括文本模板和/或表格模板;
所述对所述目标文档与所述待验证模板进行对比验证,包括:
在所述待验证模板包括所述文本模板的情况下,对所述目标文档和所述文本模板进行文本格式对比验证,所述文本格式包括段落名、文本占位符数量及文本占位符对应的数据量、段落数量中的至少一种;
在所述待验证模板包括所述表格模板的情况下,对所述目标文档和所述表格模板进行表格格式对比验证,所述表格格式包括行列数量、单元格合并规则、表格占位符数量及表格占位符对应的数据量中的至少一种。
根据本发明提供的一种文档数据导出方法,所述对所述目标文档和所述文本模板进行文本格式对比验证,包括:
确定所述目标文档中各段落的第一段落名,以及所述文本模板中各段落的第二段落名;
在所述各段落的第一段落名和所述各段落的第二段落名相同的情况下,确定所述文本模板中各段落的文本占位符,以及所述文本模板中各段落的文本占位符数量;
基于所述各段落的文本占位符,在所述目标文档中查询对应的数据,并确定查询到的各段落的数据量;
对所述各段落的文本占位符数量和所述各段落的数据量进行对比验证。
根据本发明提供的一种文档数据导出方法,所述目标模板包括文本模板和/或表格模板;
所述基于所述目标模板的占位符,确定所述目标文档中的待导出数据,包括:
在所述目标模板包括所述文本模板的情况下,基于所述文本模板的文本占位符,确定所述目标文档中的待导出数据;
在所述目标模板包括所述表格模板的情况下,基于所述表格模板的表格占位符,确定所述目标文档中的待导出数据。
根据本发明提供的一种文档数据导出方法,所述文本模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的第一动态文本数据,所述第一动态文本数据为动态变化的变量;
将所述第一动态文本数据替换成文本占位符,将替换后的样本文档确定为所述文本模板;
所述表格模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的待替换表格,将所述待替换表格从所述样本文档提取至表格模板;
确定所述表格模板的待替换表格中的第二动态文本数据,将所述第二动态文本数据替换成表格占位符,所述第二动态文本数据为动态变化的变量。
根据本发明提供的一种文档数据导出方法,所述将所述待导出数据从所述目标文档中导出,之后还包括:
确定所述待导出数据的段落名,并将所述待导出数据的段落名与所述待导出数据进行映射处理,得到段落名-数据映射关系;
基于所述段落名-数据映射关系,对所述待导出数据进行存储。
本发明还提供一种文档数据导出装置,包括:
获取模块,用于获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;
确定模块,用于基于所述目标模板的占位符,确定所述目标文档中的待导出数据;
导出模块,用于将所述待导出数据从所述目标文档中导出。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文档数据导出方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文档数据导出方法。
本发明提供的文档数据导出方法、装置、电子设备和存储介质,获取待导出数据的目标文档,并确定目标文档对应的目标模板;基于目标模板的占位符,确定目标文档中的待导出数据;将待导出数据从目标文档中导出。通过确定目标文档对应的目标模板,从而基于目标模板的占位符即可确定目标文档中的待导出数据,无需依靠人工导出,自动导出待导出数据,从而提高文档数据导出的高效性和便捷性,且是基于目标模板的占位符确定待导出数据,提高了文档数据导出的准确性。综上,本发明可以实现高效、便捷、准确的文档数据导出方式。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的文档数据导出方法的流程示意图之一;
图2为本发明提供的文档数据导出方法的流程示意图之二;
图3为本发明提供的文档数据导出装置的结构示意图;
图4为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着科技的迅速发展,人们对文档的智能化需求越来越高。在人们日常生活工作中,通常需要在文档中记录各种数据,而文档中的数据需要导出到系统和数据库中,以进行数据留存和后续的数据统计。
目前,文档数据导出大多依靠人工导出,即需要业务人员将文档中对应的数据手动维护到系统中,较为繁琐,不仅费时费力,还容易导出错误数据。因此,如何高效且准确地导出数据,是目前亟需解决的问题。例如,如何高效且准确地将文档数据从文档中导出到系统数据库中。
针对上述问题,本发明提出以下各实施例。本发明实施例提供的文档数据导出方法的执行主体可以为服务器、台式电脑、笔记本电脑、智能手机、平板电脑等终端,本发明实施例对此不作具体限定。
图1为本发明提供的文档数据导出方法的流程示意图之一,如图1所示,该文档数据导出方法包括:
步骤110,获取待导出数据的目标文档,并确定所述目标文档对应的目标模板。
此处,目标文档可以包括但不限于:文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等数据。
在本发明实施例中,以目标文档为Word文档为例进行说明,相应地,目标模板也以Word模板为例进行说明。
此处,目标模板可以包括但不限于:文本模板、表格模板等。若目标文档中包括文本,且目标文档中的文本需要导出,则目标文档对应有文本模板;若目标文档中包括表格,且表格中的数据需要导出,则目标文档对应有表格模板。
文本模板中包括至少一个文本占位符,该文本占位符用于确定目标文档中对应的待导出数据。可以理解的是,文本模板中还可以包括其它固定数据,该固定数据即无需导出的数据;该固定数据可以包括但不限于:文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等数据。
在一实施例中,该文本模板还可以包括至少一个表格占位符,该表格占位符用于确定目标文档的表格中对应的待导出数据。即该文本模板还可以包括表格,该表格中可以包括表格占位符。
在一实施例中,该文本模板还可以包括图片占位符,该图片占位符用于确定目标文档中对应的图片数据。
在一实施例中,该文本模板还可以包括文件路径占位符,该文件路径占位符用于确定目标文档中对应的文件路径数据。
表格模板中包括至少一个表格和至少一个表格占位符,该表格占位符用于确定目标文档的表格中对应的待导出数据,该表格可以为单元格合并后的表格。可以理解的是,表格模板的表格还可以包括其它固定数据,该固定数据即无需导出的数据;该固定数据可以包括但不限于:文本(如文字、字母、数字、符号等等)、图片、文件路径、链接等数据。
在一实施例中,该表格模板还可以包括图片占位符,该图片占位符用于确定目标文档的表格中对应的图片数据。
在一实施例中,该表格模板还可以包括文件路径占位符,该文件路径占位符用于确定目标文档的表格中对应的文件路径数据。
需要说明的是,目标模板是根据一样本文档生成的,该样本文档对应一种文件类型,基于此,可以基于目标文档的文件类型,确定对应的目标模板。例如,目标文档为结算合同,则对应的目标模板也为结算合同对应的目标模板。因此,需要从多个模板中确定目标文档对应的目标模板;该目标模板可以包括一个或多个模板。
具体地,基于目标文档的文档类型,确定对应的目标模板。更为具体地,基于目标文档的文档名,确定目标文档的文档类型。在一实施例中,基于目标文档的后缀,确定目标文档的文档类型。
在一实施例中,在上述步骤110之前,加载各模板,以供后续从各模板中确定目标模板。具体地,根据配置文件加载各模板。
步骤120,基于所述目标模板的占位符,确定所述目标文档中的待导出数据。
此处,占位符可以通过下划线、空白数据或${param}进行表征,其中,变量param表示具体的占位符,例如,${goods}表示商品名的占位符。
在一实施例中,文本模板的文本占位符通过下划线进行表征;表格模板的表格占位符通过空白数据进行表征,即将表格模板的表格的格内置为空白,即形成空白格。
此处,待导出数据可以包括但不限于:文本数据(如文字、字母、数字、符号等等)、表格数据、图片数据、文件路径数据、链接数据等数据。该待导出数据的数量与目标模板的占位符数量相同。
在一实施例中,基于目标模板的占位符,在目标文档中查询该占位符对应的待导出数据。
在另一实施例中,确定目标文档中带有占位符的目标数据,基于目标模板的占位符,从目标数据中确定出待导出数据。需要说明的是,目标数据有可能全部都是待导出数据,但为了确保文档数据导出的准确性,还需要基于目标模板的占位符,从目标数据中确定出待导出数据。
需要说明的是,目标模板的占位符包括至少一个,应该确定所有占位符对应的待导出数据,直至每个占位符均确定有对应的待导出数据。
在一实施例中,通过遍历目标模板的段落、行的方式,找到占位符。
步骤130,将所述待导出数据从所述目标文档中导出。
进一步地,将导出的数据进行映射处理,得到映射关系,进而基于映射关系,将导出的数据进行存储。其中,导出的数据可以与段落名进行映射,也可以与其他形式的键值进行映射。
在一具体实施例中,基于映射关系,将导出的数据存储于数据库中,以供后续从数据库中获取该导出的数据。
在一实施例中,将导出的数据收集到List数据类型中,以完成映射处理,其中,导出的数据以String(字符串)类型进行存储。进一步地,可以将List映射关系封装进实体类中,以供后续基于实体类,将导出的数据存储至对应的数据库表中。该实体类为数据库保存时用到的封装工具类。
本发明实施例提供的文档数据导出方法,获取待导出数据的目标文档,并确定目标文档对应的目标模板;基于目标模板的占位符,确定目标文档中的待导出数据;将待导出数据从目标文档中导出。通过确定目标文档对应的目标模板,从而基于目标模板的占位符即可确定目标文档中的待导出数据,无需依靠人工导出,自动导出待导出数据,从而提高文档数据导出的高效性和便捷性,且是基于目标模板的占位符确定待导出数据,提高了文档数据导出的准确性。综上,本发明实施例可以实现高效、便捷、准确的文档数据导出方式。
基于上述实施例,图2为本发明提供的文档数据导出方法的流程示意图之二,如图2所示,上述步骤110中,确定所述目标文档对应的目标模板,包括:
步骤111,确定所述目标文档对应的待验证模板。
具体地,基于目标文档的文档类型,确定对应的待验证模板。更为具体地,基于目标文档的文档名,确定目标文档的文档类型。
在一实施例中,基于目标文档的后缀,确定目标文档的文档类型,基于文档类型,确定对应的待验证模板。
此处,待验证模板可以包括一个或多个。待验证模板可以包括但不限于:文本模板、表格模板等。
步骤112,对所述目标文档与所述待验证模板进行对比验证。
考虑到确定的待验证模板可能有误,因此,将目标文档与待验证模板进行对比,以验证待验证模板是否正确,若验证正确即验证成功。
在一实施例中,对目标文档与文本模板进行对比验证。具体地,对目标文档与文本模板进行文本格式对比验证,该文本格式包括段落名、文本占位符数量及文本占位符对应的数据量、段落数量、图片占位符数量及图片占位符对应的图片量、文件路径占位符数量及文件路径占位符对应的文件路径量、表格占位符数量及表格占位符对应的数据量中的至少一种。
在另一实施例中,对目标文档与表格模板进行对比验证。具体地,对目标文档与表格模板进行表格格式对比验证,该表格格式包括行列数量、单元格合并规则、表格占位符数量及表格占位符对应的数据量、图片占位符数量及图片占位符对应的图片量、文件路径占位符数量及文件路径占位符对应的文件路径量中的至少一种。
步骤113,将验证成功的待验证模板确定为所述目标文档对应的目标模板。
具体地,从多个待验证模板中确定验证成功的待验证模板,并将所有验证成功的待验证模板确定为目标模板。验证成功的待验证模板可以包括一个或多个。
本发明实施例提供的文档数据导出方法,通过上述方式,先确定目标文档对应的待验证模板,再将验证成功的待验证模板确定为目标文档对应的目标模板,从而可以确保目标模板为准确的模板,进而确保基于目标模板的占位符确定的待导出数据的准确性,最终进一步提高文档数据导出的准确性。
基于上述任一实施例,该方法中,所述待验证模板包括文本模板和/或表格模板,上述步骤112包括:
在所述待验证模板包括所述文本模板的情况下,对所述目标文档和所述文本模板进行文本格式对比验证,所述文本格式包括段落名、文本占位符数量及文本占位符对应的数据量、段落数量中的至少一种;
在所述待验证模板包括所述表格模板的情况下,对所述目标文档和所述表格模板进行表格格式对比验证,所述表格格式包括行列数量、单元格合并规则、表格占位符数量及表格占位符对应的数据量中的至少一种。
此处,段落名为段落前的标题名,例如文档中的三级标题。若文档中两个标题之间有多个段落,则多个段落共用一个标题,且共用一个标题名(段落名)。可以理解的是,目标文档和文本模板均有段落名。
此处,文本占位符数量为文本模板的文本占位符的数量;文本占位符对应的数据量为基于文本模板的文本占位符,在目标文档中查询到的数据量,或者,为目标文档中文本占位符的数量,即文本占位符对应的数据量。
此处,表格占位符数量为表格模板的表格占位符的数量;表格占位符对应的数据量为基于表格模板的表格占位符,在目标文档中查询到的数据量,或者,为目标文档中表格占位符的数量,即表格占位符对应的数据量。
在一实施例中,确定目标文档中各段落的第一段落名,以及文本模板中各段落的第二段落名,对第一段落名和第二段落名进行对比验证。具体地,根据文本模板的段落名依次进行对比,以验证目标文档和文本模板的段落名是否一致。
在另一实施例中,确定文本模板中各段落的文本占位符,以及文本模板中各段落的文本占位符数量;基于各段落的文本占位符,在目标文档中查询对应的数据,并确定查询到的各段落的数据量;对各段落的文本占位符数量和各段落的数据量进行对比验证。
在另一实施例中,确定文本模板的段落数量,以及目标文档的段落数量;对文本模板的段落数量和目标文档的段落数量进行对比验证。
在另一实施例中,确定文本模板中各段落的文本占位符数量,以及目标文档中各段落的文本占位符数量(即文本占位符对应的数据量);对文本模板中各段落的文本占位符数量和目标文档中各段落的文本占位符数量进行对比验证。
在一实施例中,确定目标文档的表格的行列数量,以及表格模板的表格的行列数量;对目标文档的表格的行列数量和表格模板的表格的行列数量进行对比验证。
在另一实施例中,确定目标文档的表格的单元格合并规则,以及表格模板的表格的单元格合并规则;对目标文档的表格的单元格合并规则和表格模板的表格的单元格合并规则进行对比验证。
在另一实施例中,确定表格模板的表格中的表格占位符,以及表格模板中表格的表格占位符数量;基于表格模板的表格中的表格占位符,在目标文档的表格中查询对应的数据,并确定查询到的数据量;对表格的表格占位符数量和查询到的数据量进行对比验证。
在另一实施例中,确定表格模板中表格的表格占位符数量,以及目标文档中表格的表格占位符数量(即表格占位符对应的数据量);对表格模板中表格的表格占位符数量和目标文档中表格的表格占位符数量进行对比验证。
本发明实施例提供的文档数据导出方法,通过上述方式,对目标文档和文本模板进行文本格式对比验证,以及对目标文档和表格模板进行表格格式对比验证,从而可以确保目标模板为准确的模板,进而确保基于目标模板的占位符确定的待导出数据的准确性,最终进一步提高文档数据导出的准确性。
基于上述任一实施例,该方法中,所述对所述目标文档和所述文本模板进行文本格式对比验证,包括:
确定所述目标文档中各段落的第一段落名,以及所述文本模板中各段落的第二段落名;
在所述各段落的第一段落名和所述各段落的第二段落名相同的情况下,确定所述文本模板中各段落的文本占位符,以及所述文本模板中各段落的文本占位符数量;
基于所述各段落的文本占位符,在所述目标文档中查询对应的数据,并确定查询到的各段落的数据量;
对所述各段落的文本占位符数量和所述各段落的数据量进行对比验证。
此处,第一段落名为各段落前的标题名,例如目标文档中的三级标题。若目标文档中两个标题之间有多个段落,则多个段落共用一个标题,且共用一个标题名(段落名)。
此处,第二段落名为各段落前的标题名,例如文本模板中的三级标题。若文本模板中两个标题之间有多个段落,则多个段落共用一个标题,且共用一个标题名(段落名)。
需要说明的是,各段落的第一段落名和各段落的第二段落名相同指的是目标文档中各段落与文本模板中各段落的段落名均相同。
此处,任一段落的文本占位符数量为该任一段落中文本占位符的数量。任一段落的文本占位符可以包括一个或多个,相应地,基于任一段落的文本占位符,在目标文档中查询对应的段落中的数据,并确定查询到的任一段落的数据量。该任一段落的数据量可以包括1个或多个。
在一实施例中,在确定所述文本模板中各段落的文本占位符,以及所述文本模板中各段落的文本占位符数量的步骤之前,将第一段落名与目标文档中第一段落名对应的段落进行映射处理,得到第一段落名-段落映射关系,并将第二段落名与文本模板中第二段落名对应的段落进行映射处理,得到第二段落名-段落映射关系,以供后续基于第一段落名-段落映射关系和第二段落名-段落映射关系,直接获取文本模板中各段落,以及直接获取目标文档中各段落,从而提高处理速度。该第一段落名-段落映射关系和第二段落名-段落映射关系可以通过Map类型进行表征。
本发明实施例提供的文档数据导出方法,通过上述方式,先对目标文档和文本模板进行段落名对比验证,再对目标文档和文本模板进行文本占位符数量及文本占位符对应的数据量对比验证,从而可以更加有效地确保目标模板为准确的模板,进而进一步确保基于目标模板的占位符确定的待导出数据的准确性,最终进一步提高文档数据导出的准确性。
基于上述任一实施例,该方法中,所述目标模板包括文本模板和/或表格模板,上述步骤120包括:
在所述目标模板包括所述文本模板的情况下,基于所述文本模板的文本占位符,确定所述目标文档中的待导出数据;
在所述目标模板包括所述表格模板的情况下,基于所述表格模板的表格占位符,确定所述目标文档中的待导出数据。
此处,文本占位符可以通过下划线或${param}进行表征,其中,变量param表示具体的占位符,例如,${goods}表示商品名的占位符。
此处,表格占位符可以通过下划线、空白数据或${param}进行表征,其中,变量param表示具体的占位符,例如,${goods}表示商品名的占位符。
在一实施例中,表格模板的表格占位符通过空白数据进行表征,即将表格模板的表格的格内置为空白,即形成空白格。
此处,文本占位符对应的待导出数据可以包括但不限于:文本数据(如文字、字母、数字、符号等等)、图片数据、文件路径数据、链接数据等数据。该待导出数据的数量与文本模板的表格占位符数量相同。
此处,表格占位符对应的待导出数据可以包括但不限于:文本数据(如文字、字母、数字、符号等等)、图片数据、文件路径数据、链接数据等数据。该待导出数据的数量与表格模板的表格占位符数量相同。
在一实施例中,基于文本模板的文本占位符,在目标文档中查询该文本占位符对应的待导出数据。
在另一实施例中,确定目标文档中带有文本占位符的目标数据,基于文本模板的文本占位符,从目标数据中确定出待导出数据。需要说明的是,目标数据有可能全部都是待导出数据,但为了确保文档数据导出的准确性,还需要基于文本模板的文本占位符,从目标数据中确定出待导出数据。
在一实施例中,基于表格模板的表格占位符,在目标文档中查询该表格占位符对应的待导出数据。
在另一实施例中,确定目标文档中带有表格占位符的目标数据,基于表格模板的表格占位符,从目标数据中确定出待导出数据。需要说明的是,目标数据有可能全部都是待导出数据,但为了确保文档数据导出的准确性,还需要基于表格模板的表格占位符,从目标数据中确定出待导出数据。
本发明实施例提供的文档数据导出方法,通过上述方式,基于文本模板的文本占位符即可确定目标文档中的待导出数据,基于表格模板的表格占位符即可确定目标文档中的待导出数据,无需依靠人工导出,自动导出待导出数据,从而提高文档数据导出的高效性和便捷性,且是基于文本模板的文本占位符确定待导出数据,基于表格模板的表格占位符确定待导出数据,提高了文档数据导出的准确性;同时,目标模板包括文本模板和表格模板,进而可以将目标文档中的文本数据和表格中的数据导出,提高了文档数据导出的灵活性。
基于上述任一实施例,该方法中,所述文本模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的第一动态文本数据,所述第一动态文本数据为动态变化的变量;
将所述第一动态文本数据替换成文本占位符,将替换后的样本文档确定为所述文本模板。
此处,样本文档为包括完整数据的文档,该样本文档可以包括文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等等。
此处,第一动态文本数据为动态变化的变量,例如,甲方公司名、乙方公司名、法定代表人、住所、联系电话、身份证号码、邮编、项目名、商品名、药品成分、施用量、防治对象、品种名称、种植密度、作业环节、作业内容、作业次数、单次作业面积等等。
在一实施例中,样本文档中所有的第一动态文本数据均替换成一个相同的文本占位符,例如均替换成下划线。
在另一实施例中,基于文本数据-文本占位符映射关系,将第一动态文本数据替换成文本占位符。文本数据-文本占位符映射关系用于将第一动态文本数据替换为文本占位符。例如,样本文档中存在“甲方:xxx公司”,则“xxx公司”为第一动态文本数据,此时可以将“xxx公司”替换成${firstParty}。
在一实施例中,在样本文档已替换完毕,重新打开该样本文档,得到文本模板,以便后续基于文本模板的文本占位符确定待导出数据。
为便于理解,例如,将样本文档中的段落名固定后,再将段落中的动态文本数据替换为下划线“___”占位符,其中___为变量,下划线的数量由可以根据实际需求进行设定,并确保下划线数量以及位置顺序严格一致等初始化工作。
需要说明的是,提供文本模板之后,可以基于文本模板中的文本占位符填充对应的数据,该填充的数据即后续的待导出数据。在填充完对应的数据后,可以删除对应的文本占位符,也可以保留对应的文本占位符。
在一实施例中,若第一动态文本数据为表格内的文本数据,则将该表格内的第一动态文本数据替换成文本占位符。
该方法中,所述表格模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的待替换表格,将所述待替换表格从所述样本文档提取至表格模板;
确定所述表格模板的待替换表格中的第二动态文本数据,将所述第二动态文本数据替换成表格占位符,所述第二动态文本数据为动态变化的变量。
此处,样本文档为包括完整数据的文档,该样本文档可以包括文本(如文字、字母、数字、符号等等)、表格、图片、文件路径、链接等等。
此处,待替换表格为表格内的文本数据为动态变化的数据。进一步地,待替换表格可以在不同文档中存在,或者在不同文档有不同的位置,或者在一文档中不确定有多少个,因此,需要将待替换表格提取至表格模板;若待替换表格只存在该样本文档中,则可以不用提取至表格模板,直接将表格中的动态文本数据替换成文本占位符即可,此时,将替换后的样本文档确定为文本模板。
此处,表格模板用于放置至少一个待替换表格,以供后续需要导出数据时,可以从该表格模板中确定对应的表格及其表格中的文本占位符。
此处,第二动态文本数据为动态变化的变量,例如,甲方公司名、乙方公司名、法定代表人、住所、联系电话、身份证号码、邮编、项目名、商品名、药品成分、施用量、防治对象、品种名称、种植密度、作业环节、作业内容、作业次数、单次作业面积等等。
在一实施例中,样本文档中所有的第二动态文本数据均替换成一个相同的表格占位符,例如均替换成空白占位符。
在另一实施例中,基于文本数据-表格占位符映射关系,将第二动态文本数据替换成表格占位符。文本数据-表格占位符映射关系用于将第二动态文本数据替换为表格占位符。例如,样本文档的表格中存在“xxx公司”,则“xxx公司”为第二动态文本数据,此时可以将“xxx公司”替换成${firstParty}。
在一实施例中,在表格模板已替换完毕,重新打开该表格模板,以便后续基于表格模板的表格占位符确定待导出数据,且确保填充的表格都已经在表格模板中。
需要说明的是,提供表格模板之后,可以基于表格模板中的表格占位符填充对应的数据,该填充的数据即后续的待导出数据。在填充完对应的数据后,可以删除对应的表格占位符,也可以保留对应的表格占位符。
在一实施例中,在确定所述表格模板的待替换表格中的第二动态文本数据,将所述第二动态文本数据替换成表格占位符的步骤之前,将待替换表格的单元格进行合并,以确保单元格合并规则固定。
本发明实施例提供的文档数据导出方法,通过上述方式,将样本文档中的动态文本数据替换成文本占位符,以供后续可以通过文本占位符确定对应的待导出数据;将样本文档中的待替换表格的动态文本数据替换成表格占位符,以供后续可以通过表格占位符确定对应的待导出数据,从而基于目标模板的占位符即可确定目标文档中的待导出数据,无需依靠人工导出,自动导出待导出数据,从而提高文档数据导出的高效性和便捷性,且是基于目标模板的占位符确定待导出数据,提高了文档数据导出的准确性。
基于上述任一实施例,该方法中,在上述步骤130之后,还包括:
确定所述待导出数据的段落名,并将所述待导出数据的段落名与所述待导出数据进行映射处理,得到段落名-数据映射关系;
基于所述段落名-数据映射关系,对所述待导出数据进行存储。
此处,段落名为段落前的标题名,例如文档中的三级标题。若文档中两个标题之间有多个段落,则多个段落共用一个标题,且共用一个标题名(段落名)。可以理解的是,待导出数据可以分布在多个段落中,有多个对应的段落名,也可以分布在一个段落或多个段落中,有一个对应的段落名。
在一实施例中,将导出的数据收集到List数据类型中,以完成映射处理,其中,导出的数据以String(字符串)类型进行存储。进一步地,可以将List映射关系封装进实体类中,以供后续基于实体类,将导出的数据存储至对应的数据库表中。
在一实施例中,基于段落名-数据映射关系,确定各段落名对应的待导出数据;基于各段落名和各待导出数据,将各待导出数据存储至实体类中,然后,基于实体类,对待导出数据进行存储。更为具体地,基于实体类的类型,确定对应的数据库表,将待导出数据存储至该数据库表。
本发明实施例提供的文档数据导出方法,通过上述方式,将待导出数据的段落名与待导出数据进行映射处理,便于后续将待导出数据进行存储,提高文档数据存储的高效性、便捷性和准确性。
下面对本发明提供的文档数据导出装置进行描述,下文描述的文档数据导出装置与上文描述的文档数据导出方法可相互对应参照。
图3为本发明提供的文档数据导出装置的结构示意图,如图3所示,该文档数据导出装置,包括:
获取模块310,用于获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;
确定模块320,用于基于所述目标模板的占位符,确定所述目标文档中的待导出数据;
导出模块330,用于将所述待导出数据从所述目标文档中导出。
本发明实施例提供的文档数据导出装置,获取待导出数据的目标文档,并确定目标文档对应的目标模板;基于目标模板的占位符,确定目标文档中的待导出数据;将待导出数据从目标文档中导出。通过确定目标文档对应的目标模板,从而基于目标模板的占位符即可确定目标文档中的待导出数据,无需依靠人工导出,自动导出待导出数据,从而提高文档数据导出的高效性和便捷性,且是基于目标模板的占位符确定待导出数据,提高了文档数据导出的准确性。综上,本发明实施例可以实现高效、便捷、准确的文档数据导出方式。
基于上述任一实施例,该获取模块310还包括:
第一模板确定单元,用于确定所述目标文档对应的待验证模板;
模板验证单元,用于对所述目标文档与所述待验证模板进行对比验证;
第二模板确定单元,用于将验证成功的待验证模板确定为所述目标文档对应的目标模板。
基于上述任一实施例,所述待验证模板包括文本模板和/或表格模板;该模板验证单元还用于:
在所述待验证模板包括所述文本模板的情况下,对所述目标文档和所述文本模板进行文本格式对比验证,所述文本格式包括段落名、文本占位符数量及文本占位符对应的数据量、段落数量中的至少一种;
在所述待验证模板包括所述表格模板的情况下,对所述目标文档和所述表格模板进行表格格式对比验证,所述表格格式包括行列数量、单元格合并规则、表格占位符数量及表格占位符对应的数据量中的至少一种。
基于上述任一实施例,该模板验证单元还用于:
确定所述目标文档中各段落的第一段落名,以及所述文本模板中各段落的第二段落名;
在所述各段落的第一段落名和所述各段落的第二段落名相同的情况下,确定所述文本模板中各段落的文本占位符,以及所述文本模板中各段落的文本占位符数量;
基于所述各段落的文本占位符,在所述目标文档中查询对应的数据,并确定查询到的各段落的数据量;
对所述各段落的文本占位符数量和所述各段落的数据量进行对比验证。
基于上述任一实施例,所述目标模板包括文本模板和/或表格模板;该确定模块320包括:
数据确定单元,用于在所述目标模板包括所述文本模板的情况下,基于所述文本模板的文本占位符,确定所述目标文档中的待导出数据;
数据确定单元,还用于在所述目标模板包括所述表格模板的情况下,基于所述表格模板的表格占位符,确定所述目标文档中的待导出数据。
基于上述任一实施例,该装置还包括:
文档确定模块,用于获取所述目标文档对应的样本文档;
数据确定模块,用于确定所述样本文档中的第一动态文本数据,所述第一动态文本数据为动态变化的变量;
数据替换模块,用于将所述第一动态文本数据替换成文本占位符,将替换后的样本文档确定为所述文本模板;
文档确定模块,用于获取所述目标文档对应的样本文档;
表格确定模块,用于确定所述样本文档中的待替换表格,将所述待替换表格从所述样本文档提取至表格模板;
数据替换模块,还用于确定所述表格模板的待替换表格中的第二动态文本数据,将所述第二动态文本数据替换成表格占位符,所述第二动态文本数据为动态变化的变量。
基于上述任一实施例,该装置还包括:
数据映射模块,用于确定所述待导出数据的段落名,并将所述待导出数据的段落名与所述待导出数据进行映射处理,得到段落名-数据映射关系;
数据存储模块,用于基于所述段落名-数据映射关系,对所述待导出数据进行存储。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行文档数据导出方法,该方法包括:获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;基于所述目标模板的占位符,确定所述目标文档中的待导出数据;将所述待导出数据从所述目标文档中导出。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的文档数据导出方法,该方法包括:获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;基于所述目标模板的占位符,确定所述目标文档中的待导出数据;将所述待导出数据从所述目标文档中导出。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的文档数据导出方法,该方法包括:获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;基于所述目标模板的占位符,确定所述目标文档中的待导出数据;将所述待导出数据从所述目标文档中导出。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种文档数据导出方法,其特征在于,包括:
获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;
基于所述目标模板的占位符,确定所述目标文档中的待导出数据;
将所述待导出数据从所述目标文档中导出。
2.根据权利要求1所述的文档数据导出方法,其特征在于,所述确定所述目标文档对应的目标模板,包括:
确定所述目标文档对应的待验证模板;
对所述目标文档与所述待验证模板进行对比验证;
将验证成功的待验证模板确定为所述目标文档对应的目标模板。
3.根据权利要求2所述的文档数据导出方法,其特征在于,所述待验证模板包括文本模板和/或表格模板;
所述对所述目标文档与所述待验证模板进行对比验证,包括:
在所述待验证模板包括所述文本模板的情况下,对所述目标文档和所述文本模板进行文本格式对比验证,所述文本格式包括段落名、文本占位符数量及文本占位符对应的数据量、段落数量中的至少一种;
在所述待验证模板包括所述表格模板的情况下,对所述目标文档和所述表格模板进行表格格式对比验证,所述表格格式包括行列数量、单元格合并规则、表格占位符数量及表格占位符对应的数据量中的至少一种。
4.根据权利要求3所述的文档数据导出方法,其特征在于,所述对所述目标文档和所述文本模板进行文本格式对比验证,包括:
确定所述目标文档中各段落的第一段落名,以及所述文本模板中各段落的第二段落名;
在所述各段落的第一段落名和所述各段落的第二段落名相同的情况下,确定所述文本模板中各段落的文本占位符,以及所述文本模板中各段落的文本占位符数量;
基于所述各段落的文本占位符,在所述目标文档中查询对应的数据,并确定查询到的各段落的数据量;
对所述各段落的文本占位符数量和所述各段落的数据量进行对比验证。
5.根据权利要求1所述的文档数据导出方法,其特征在于,所述目标模板包括文本模板和/或表格模板;
所述基于所述目标模板的占位符,确定所述目标文档中的待导出数据,包括:
在所述目标模板包括所述文本模板的情况下,基于所述文本模板的文本占位符,确定所述目标文档中的待导出数据;
在所述目标模板包括所述表格模板的情况下,基于所述表格模板的表格占位符,确定所述目标文档中的待导出数据。
6.根据权利要求5所述的文档数据导出方法,其特征在于,所述文本模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的第一动态文本数据,所述第一动态文本数据为动态变化的变量;
将所述第一动态文本数据替换成文本占位符,将替换后的样本文档确定为所述文本模板;
所述表格模板基于如下步骤确定:
获取所述目标文档对应的样本文档;
确定所述样本文档中的待替换表格,将所述待替换表格从所述样本文档提取至表格模板;
确定所述表格模板的待替换表格中的第二动态文本数据,将所述第二动态文本数据替换成表格占位符,所述第二动态文本数据为动态变化的变量。
7.根据权利要求1至6中任一项所述的文档数据导出方法,其特征在于,所述将所述待导出数据从所述目标文档中导出,之后还包括:
确定所述待导出数据的段落名,并将所述待导出数据的段落名与所述待导出数据进行映射处理,得到段落名-数据映射关系;
基于所述段落名-数据映射关系,对所述待导出数据进行存储。
8.一种文档数据导出装置,其特征在于,包括:
获取模块,用于获取待导出数据的目标文档,并确定所述目标文档对应的目标模板;
确定模块,用于基于所述目标模板的占位符,确定所述目标文档中的待导出数据;
导出模块,用于将所述待导出数据从所述目标文档中导出。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述文档数据导出方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文档数据导出方法。
CN202211021420.9A 2022-08-24 2022-08-24 文档数据导出方法、装置、电子设备和存储介质 Active CN115391439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211021420.9A CN115391439B (zh) 2022-08-24 2022-08-24 文档数据导出方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211021420.9A CN115391439B (zh) 2022-08-24 2022-08-24 文档数据导出方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN115391439A true CN115391439A (zh) 2022-11-25
CN115391439B CN115391439B (zh) 2023-04-07

Family

ID=84122614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211021420.9A Active CN115391439B (zh) 2022-08-24 2022-08-24 文档数据导出方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115391439B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618841A (zh) * 2022-11-29 2023-01-17 明度智云(浙江)科技有限公司 一种文档导出方法、装置、设备及存储介质
CN117272953A (zh) * 2023-11-15 2023-12-22 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040205622A1 (en) * 2002-07-25 2004-10-14 Xerox Corporation Electronic filing system with scan-placeholders
CN109657215A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 基于模板的文档生成方法、设备、存储介质及装置
CN109933752A (zh) * 2017-12-15 2019-06-25 北京京东尚科信息技术有限公司 一种导出电子文档的方法和装置
CN110019754A (zh) * 2019-01-30 2019-07-16 阿里巴巴集团控股有限公司 一种知识库的建立方法、装置及设备
CN111460017A (zh) * 2020-03-20 2020-07-28 平安国际智慧城市科技股份有限公司 文档数据导入方法、文档数据导出方法、装置和存储介质
CN114065719A (zh) * 2021-11-23 2022-02-18 中国工商银行股份有限公司 文档处理方法及其装置、电子设备、计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040205622A1 (en) * 2002-07-25 2004-10-14 Xerox Corporation Electronic filing system with scan-placeholders
CN109933752A (zh) * 2017-12-15 2019-06-25 北京京东尚科信息技术有限公司 一种导出电子文档的方法和装置
CN109657215A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 基于模板的文档生成方法、设备、存储介质及装置
CN110019754A (zh) * 2019-01-30 2019-07-16 阿里巴巴集团控股有限公司 一种知识库的建立方法、装置及设备
CN111460017A (zh) * 2020-03-20 2020-07-28 平安国际智慧城市科技股份有限公司 文档数据导入方法、文档数据导出方法、装置和存储介质
CN114065719A (zh) * 2021-11-23 2022-02-18 中国工商银行股份有限公司 文档处理方法及其装置、电子设备、计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618841A (zh) * 2022-11-29 2023-01-17 明度智云(浙江)科技有限公司 一种文档导出方法、装置、设备及存储介质
CN117272953A (zh) * 2023-11-15 2023-12-22 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质
CN117272953B (zh) * 2023-11-15 2024-03-12 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质

Also Published As

Publication number Publication date
CN115391439B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN115391439B (zh) 文档数据导出方法、装置、电子设备和存储介质
CN110457302B (zh) 一种结构化数据智能清洗方法
US9495347B2 (en) Systems and methods for extracting table information from documents
CN108334609B (zh) Oracle中实现JSON格式数据存取的方法、装置、设备及存储介质
CN109710933A (zh) 训练语料的获取方法、装置、计算机设备和存储介质
CN112286934A (zh) 数据库表导入方法、装置、设备及介质
CN113836038A (zh) 测试数据构造方法、装置、设备及存储介质
CN116644035B (zh) 文件批量入库方法、装置、设备及存储介质
CN113127621A (zh) 对话模块的推送方法、装置、设备及存储介质
CN114896161A (zh) 基于人工智能的文件构造方法、装置、计算机设备及介质
CN113283231B (zh) 获取签章位的方法、设置系统、签章系统及存储介质
CN113158988B (zh) 财务报表处理方法、装置以及计算机可读存储介质
CN113989817A (zh) 一种自定义票据的识别方法、设备及介质
CN113935289A (zh) 文档在线处理方法及装置
CN111597336B (zh) 训练文本的处理方法、装置、电子设备及可读存储介质
WO2019080419A1 (zh) 标准知识库的构建方法、电子装置及存储介质
CN110851400B (zh) 文本数据的处理方法及装置
CN116562247A (zh) 电子表格内容生成方法、装置和计算机设备
US12001388B2 (en) Information importing method and apparatus
CN115238653A (zh) 一种报告生成方法、装置、设备和介质
CN114968725A (zh) 任务依赖关系校正方法、装置、计算机设备及存储介质
CN111651531B (zh) 数据导入方法、装置、设备及计算机存储介质
CN115270748B (zh) 文件生成方法、装置、电子设备和存储介质
CN110991164B (zh) 法律文书处理方法及装置
CN108572948A (zh) 门牌信息的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant