CN111460017A - 文档数据导入方法、文档数据导出方法、装置和存储介质 - Google Patents

文档数据导入方法、文档数据导出方法、装置和存储介质 Download PDF

Info

Publication number
CN111460017A
CN111460017A CN202010200051.4A CN202010200051A CN111460017A CN 111460017 A CN111460017 A CN 111460017A CN 202010200051 A CN202010200051 A CN 202010200051A CN 111460017 A CN111460017 A CN 111460017A
Authority
CN
China
Prior art keywords
data
document
annotation
imported
object name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010200051.4A
Other languages
English (en)
Inventor
欧钦
廖拓衡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Saiante Technology Service Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010200051.4A priority Critical patent/CN111460017A/zh
Priority to PCT/CN2020/098708 priority patent/WO2021184574A1/zh
Publication of CN111460017A publication Critical patent/CN111460017A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Abstract

本申请涉及一种文档数据导入方法、文档数据导出方法、装置、计算机设备和存储介质。当接收到携带有待导入文档的文档数据导入指令时,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;根据批注数据对文本数据进行处理后,根据批注数据中的对象名称映射到业务系统的对象或结构体中。当接收到文档数据导出指令时,获取对应的导出文档模板,提取批注数据对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置。降低了业务系统的复杂度,提高了业务系统的运行速度。

Description

文档数据导入方法、文档数据导出方法、装置和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种文档数据导入方法、文档数据导出方法、装置、计算机设备和存储介质。
背景技术
业务系统是提供给基础人员使用的系统,是对业务处理过程进行针对性支持的信息系统,能够为某项工作的完成提供有力的工具支撑,而业务系统的文档数据的导入和导出功能是各种业务系统中很常用功能。
而目前的业务系统的文档数据的导入导出,一般只提供单一的导入或导出功能,如:将文档数据对应上传至业务系统中,或从业务系统中导出对应的数据文档。文档的格式和文档中文档数据的格式复杂多变,当出现新的格式时,需要不同格式编写不同的代码,和更改业务系统的代码来满足新格式的文档或文档数据的导入或导出,导致开发工作量大。
发明内容
基于此,有必要针对上述技术问题,提供一种减少开发工作量的文档数据导入方法、文档数据导出方法、装置、计算机设备和存储介质。
一种文档数据导入方法,所述方法包括:
当接收到携带有待导入文档的文档数据导入指令时,对所述待导入文档的文件格式进行分析,确定所述待导入文档的文件格式;
根据待导入文档的文件格式调用对应的解析程序,对所述待导入文档进行解析,获取所述待导入文档中的文本数据及批注数据;
根据所述批注数据对所述文本数据进行处理,获得处理后的数据;
将所述处理后的数据根据所述批注数据导入到业务系统的中。
在其中一个实施例中,所述根据所述批注数据对所述文本数据进行处理,获得处理后的数据的步骤,包括:
当所述批注数据仅为对象名称时,获取所述文本数据中被批注内容作为处理后的数据;
当所述批注数据为对象名称和数据格式转换的转换器名称时,根据所述转换器名称调用对应的转换器,对所述文本数据中被批注内容进行格式转换,获得处理后的数据;
当所述批注数据为对象名称和数据有效性验证代码时,运行所述数据有效性验证代码,对所述文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
在其中一个实施例中,所述将所述处理后的数据根据所述批注数据导入到业务系统的中的步骤,包括:
根据所述批注数据中的对象名称,确定所述对象名称与所述处理后的数据的对应关系;
根据所述对象名称与所述处理后的数据的对应关系,将所述处理后的数据映射到业务系统的对象或结构体中。
在其中一个实施例中,在所述接收到携带有待导入文档的文档数据导入指令的步骤之前,还包括:
获取预导入文档;
调用批注脚本文件对预导入文档进行批注处理,获得所述待导入文档。
一种文档数据导出方法,所述方法包括:
当接收到文档数据导出指令时,根据所述文档数据导出指令获取对应的导出文档模板;
对所述导出文档模板进行解析,提取批注数据;
根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;
根据所述批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。
在其中一个实施例中,所述根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据的步骤,包括:
当所述批注数据仅为对象名称时,根据所述对象名称,获取业务系统中与所述对象名称对应的待导出数据作为处理后的数据;
当所述批注数据为对象名称和数据格式转换的转换器名称时,根据所述转换器名称调用对应的转换器,对业务系统中与所述对象名称对应的待导出数据进行格式转换,获得处理后的数据;
当所述批注数据为对象名称和表达式时,调用表达式引擎解析和执行所述表达式,对业务系统中与所述对象名称对应的待导出数据进行数据处理,获得处理后的数据。
一种文档数据导入装置,所述装置包括:
格式分析模块,用于当接收到携带有待导入文档的文档数据导入指令时,对所述待导入文档的文件格式进行分析,确定所述待导入文档的文件格式;
文档解析模块,用于根据待导入文档的文件格式调用对应的解析程序,对所述待导入文档进行解析,获取所述待导入文档中的文本数据及批注数据;
第一数据处理模块,用于根据所述批注数据对所述文本数据进行处理,获得处理后的数据;
数据导入模块,用于将所述处理后的数据根据所述批注数据导入到业务系统的中。
一种文档数据导出装置,所述装置包括:
模板获取模块,用于当接收到文档数据导出指令时,根据所述文档数据导出指令获取对应的导出文档模板;
模板解析模块,用于对所述导出文档模板进行解析,提取批注数据;
第二数据处理模块,用于根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;
数据导出模块,用于根据所述批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
上述文档数据导入方法、装置、计算机设备和存储介质,通过当接收到携带有待导入文档的文档数据导入指令时,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;批注数据可以对文本数据进行处理,根据批注数据对文本数据进行处理后,根据批注数据中的对象名称映射到业务系统的对象或结构体中。通过待导入文档的批注数据对文本数据进行处理,无需在业务系统开发用于处理文本数据的代码,避免了大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
上述文档数据导出方法、装置、计算机设备和存储介质,通过当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;对导出文档模板进行解析,提取批注数据,批注数据可以对待导出数据进行处理;对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。通过导出文档模板的批注数据对待导出数据进行处理,无需在业务系统开发用于处理待导出数据的代码,避免了大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
附图说明
图1为一个实施例中文档数据导入方法或文档数据导出方法的应用场景图;
图2为一个实施例中文档数据导入方法的流程示意图;
图3为一个实施例中文档数据导出方法的流程示意图;
图4为一个实施例中文档数据导入装置的结构框图;
图5为另一个实施例中文档数据导入装置的结构框图;
图6为一个实施例中文档数据导出装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的文档数据导入方法和文档数据导出方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。当执行文档数据导入方法时,当服务器104接收到终端102发送携带有待导入文档的文档数据导入指令时,对待导入文档的文件格式进行分析,确定待导入文档的文件格式;服务器104根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;根据批注数据对文本数据进行处理,获得处理后的数据;将处理后的数据根据批注数据导入到业务系统的中。
当执行文档数据导出方法时,当服务器104接收到终端102发送的文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;服务器104对导出文档模板进行解析,提取批注数据;根据批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种文档数据导入方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S220,当接收到携带有待导入文档的文档数据导入指令时,对待导入文档的文件格式进行分析,确定待导入文档的文件格式。
其中,待导入文档是记录了需要导入业务系统的图文数据,并对于批注了批注数据的文档,如:需要将记录在文档中的姓名、年龄、手机号、身高、体重等数据导入业务系统,记录了姓名、年龄、手机号、身高、体重等数据的文档则为待导入文档。待导入文档的格式可以是有dox格式、dcox格式、xls格式、pdf格式等等。对待导入文档的文件格式进行分析的方式如通过文件的扩展名来判断。
步骤S240,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据。
其中,根据不同的文件格式,预先编写好对应不同的文件格式的解析程序,如:预先编写好用于解析文件格式为dox格式的解析程序、预先编写好用于解析文件格式为dcox格式的解析程序、预先编写好用于解析文件格式为xls格式的解析程序、预先编写好用于解析文件格式为pdf格式的解析程序等等。文本数据为待导入文档中正文中被批注选中的内容,批注数据为该批注的批注框中的数据。
步骤S260,根据批注数据对文本数据进行处理,获得处理后的数据。
其中,批注数据中可以是对象名称,也可以是对象名称和数据格式转换的转换器名称,还可以是对象名称和数据有效性验证代码等等。
在一个实施例中,根据批注数据对文本数据进行处理,获得处理后的数据的步骤,包括:
当批注数据仅为对象名称时,获取文本数据中被批注内容作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对文本数据中被批注内容进行格式转换,获得处理后的数据;当批注数据为对象名称和数据有效性验证代码时,运行数据有效性验证代码,对文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
其中,对象名称与业务系统中的对象或结构体变量名称相匹配,通过该对象名称可以确定将批注的文本数据填充到业务系统的什么位置。当批注数据为对象名称时,直接可以将批注的文本数据作为处理后的数据,执行步骤S280。如:待导入文档中的文本数据无需任何处理,是可以直接导入业务系统的数据,通过批注的批注数据中的对象名称,确定将文本数据在业务系统中存储的位置,将文本数据导入到业务系统的对应位置即可,可以提高待导入文档的导入效率。
当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对文本数据中被批注内容进行格式转换,获得处理后的数据。转换器名称与转换器一一对应,转换器可以包括用于日期格式转换的转换器、用于数字格式转换的转换器、用于字母大小写转换的转换器等等,如日期格式转换,文本数据中的日期格式是“XXXX年XX月XX日”,而导入业务系统时需要日期格式是“XXXX/XX/XX”,通过调用用于转换日期格式的转换器对文本数据中的日期进行转换,获得导入业务系统时需要日期格式作为处理后的数据。当待导入文档中的文本数据的格式与业务系统的数据存储的格式不同时,业务系统通过批注数据中数据格式转换的转换器名称调用转换器进行格式转换即可,无需大量在业务系统开发如何进行格式转换的代码逻辑,无需开发如何确定用什么转换器进行格式转换等代码逻辑,直接根据转换器名称调用即可。
当批注数据为对象名称和数据有效性验证代码时,运行数据有效性验证代码,对文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据,如:通过运行该代码,对文本数据中的数据进行有效数据的范围和规则进行验证,当不符合相应的范围或规则时,会忽略相关的数据,并进行记录,符合的数据为处理后的数据。可以验证年龄、手机号、IP地址等,也可以自定义验证规则,例如年龄验证,文本数据中的年龄数据的有效范围是18-65岁,则批注数据为“${age,max=65,min=18}”。当待导入文档中的文本数据中存在错误数据、或一些无需导入业务系统的数据时,业务系统通过运行批注数据中数据有效性验证代码即可,可以从待导入文档中的文本数据提取出符合的数据导入,无需大量在业务系统开发和搭建进行数据有效性验证代码,直接运行即可。
步骤S280,将处理后的数据根据批注数据导入到业务系统的中。
其中,如:当前需要录入业务系统的是年龄,则从进行年龄验证后获得的处理后的数据中,获取年龄数据,映射到业务系统的对象或结构体中。
上述文档数据导入方法,通过当接收到携带有待导入文档的文档数据导入指令时,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;批注数据可以对文本数据进行处理,根据批注数据对文本数据进行处理后,根据批注数据中的对象名称映射到业务系统的对象或结构体中。无需更改业务系统中的代码,避免大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
在一个实施例中,将处理后的数据根据批注数据导入到业务系统的中的步骤,包括:根据批注数据中的对象名称,确定对象名称与处理后的数据的对应关系;根据对象名称与处理后的数据的对应关系,将处理后的数据映射到业务系统的对象或结构体中。
其中,对象是业务系统中的某一个成分。结构体是一种数据结构,是C语言中聚合数据类型的一类。批注数据中的对象名称与业务系统中的对象或结构体变量名称相匹配,通过该对象名称可以确定将批注的文本数据填充到业务系统的什么位置,通过确定对象名称与处理后的数据的对应关系,将处理后的数据映射到与对象名称相匹配的业务系统的对象或结构体中。
在一个实施例中,在接收到携带有待导入文档的文档数据导入指令的步骤之前,还包括:获取预导入文档;调用批注脚本文件对预导入文档进行批注处理,获得待导入文档。
其中,预导入文档是记录了需要导入业务系统的图文数据,且没有批注批注数据的文档。通过批注脚本文件对预导入文档进行批注处理,该批注脚本文件用于对预导入文档进行批注,该批注脚本文件根据预导入文档的格式布局编写对应的批注程序,如:Word文档,运行批注脚本文件,找到Word文档对应的段,批注上对应段的批注数据,获得记录了需要导入业务系统的图文数据,且批注有批注数据的待导入文档,通过调用批注脚本文件对预导入文档进行批注处理,可以提高文档数据导入的效率。
在一个实施例中,一种文档数据导入方法,举例进行说明,例子如下:
有一批调研数据需要导入到业务系统中,来源于人工采集后手工录入Word文档的,数据有可能录入有误,文档中的数据有姓名、年龄(最小0岁,最大120岁)、手机号(国内运营商),身高(单位厘米,最低30厘米,最高230厘米,取整数)、体重(单位为公斤,最低1.0公斤,最高200.0公斤)。
通过在该Word文档中选中文档中的数据(即文本数据)进行批注,批注的批注数据为:
Figure BDA0002419042550000081
Figure BDA0002419042550000091
在导入时,会将通过批注数据进行数据有效性验证,获得有效数据作为处理后的数据,映射到新实例出的Person对象,没有通过数据有效性验证的数据将记录下来,并在后续进行提示。
上述文档数据导入方法,通过当接收到携带有待导入文档的文档数据导入指令时,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;批注数据可以对文本数据进行处理,根据批注数据对文本数据进行处理后,根据批注数据中的对象名称映射到业务系统的对象或结构体中。无需更改业务系统中的代码,避免大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。通过调用批注脚本文件对预导入文档进行批注处理,可以提高文档数据导入的效率。
在一个实施例中,如图3所示,提供了一种文档数据导出方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S420,当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板。
其中,导出文档模板是用于接收写入的图文数据的文档,导出文档模板至少一个以上,可以根据文档格式预先设置导出文档模板,如:导出文档模板可以包括:dox格式的导出文档模板、dcox格式的导出文档模板、xls格式的导出文档模板、pdf格式的导出文档模板等等。还可以根据需要导出的数据的数据类型设置导出文档模板,如:某一类数据到导出前需要使用某一个特定的处理后写入导出文档模板,则根据数据类型预先设置导出文档模板等等。文档数据导出指令中携带了待导出数据的相关信息,当接收到文档数据导出指令时,根据文档数据导出指令中待导出数据的相关信息确定导出文档格式,根据导出文档格式确定导出文档模板的获取路径;根据获取路径获取导出文档模板。
文档模板获取路径可以是从磁盘文件获取,也可是用户通过终端上传的文档模板,还可以是远程过程调用获取。根据导出文档模板中被批注选中的位置为写入待导出数据的位置,对应批注的批注数据用于对待导出数据进行处理。
步骤S440,对导出文档模板进行解析,提取批注数据。
其中,批注数据中可以是对象名称,也可以是对象名称和数据格式转换的转换器名称,还可以是对象名称和表达式。对象名称指导出时目标数据结构中变量名称或导出时来源数据结构中变量名称,对象名称可以由代码形成,也可以由预定义规则自动生成。对象名称与待导出数据的对象或结构体变量名称相匹配,表示将待导出数据填充到对应批注位置。例子:比如有一个数据结构中有两个成员变量,分别为name和age,那么可以在模板的批注中可以填写类似于“${name}”和“${age}”,匹配到数据结构中的name和age成员变量。在实际应用中,模板通常是预先编写或生成的,但数据是后续填写的,不一定统一。例如常见的日期时间格式转换,只需要日期,但来源数据中可能会包含时间部分,就需要转换成日期格式。表达式类似于Excel中的公式,可以提供额外的计算、统计、分支判断等功能。比如需要提供某种计算功能,可以提供一个方法名称来表示。例如个税计算功能,输入参数为薪资收入,那么可以在批注中填写${tax,expr=“tax(salary)”},输出时内容就是个税缴纳的金额。
步骤S460,根据批注数据,对业务系统中待导出数据进行处理,获得处理后的数据。
其中,批注数据中可以是对象名称,也可以是对象名称和数据格式转换的转换器名称,还可以是对象名称和表达式。
在一个实施例中,根据批注数据,对业务系统中待导出数据进行处理,获得处理后的数据的步骤,包括:当批注数据仅为对象名称时,根据对象名称,获取业务系统中与对象名称对应的待导出数据作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对业务系统中与对象名称对应的待导出数据进行格式转换,获得处理后的数据;当批注数据为对象名称和表达式时,调用表达式引擎解析和执行表达式,对业务系统中与对象名称对应的待导出数据进行数据处理,获得处理后的数据。
其中,当批注数据为对象名称时,对象名称与待导出数据的对象或结构体变量名称相匹配,表示将待导出数据填充到对应批注位置,根据对象名称,获取业务系统中与对象名称对应的待导出数据作为处理后的数据,直接填充到对应批注位置即可,如:待导出数据无需任何处理,是可以直接写入导出文档模板的,通过批注的批注数据中的对象名称,确定待导出数据应填充的位置,将待导出数据写入导出文档模板对应位置即可,可以提高待导出数据的导出效率。
当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对业务系统中与对象名称对应的待导出数据进行格式转换,获得处理后的数据,转换器名称与转换器一一对应,转换器可以包括用于日期格式转换的转换器、用于数字格式转换的转换器、用于字母大小写转换的转换器等等,如日期格式转换,业务系统的日期格式是“XXXX/XX/XX”,导出文档模板需要的日期格式是“XXXX年XX月XX日”,通过调用用于转换日期格式的转换器对业务系统中的日期进行转换,获得导出文档模板需要的日期格式的数据作为处理后的数据。当待导出数据的格式与导出文档模板的格式不同时,业务系统通过批注数据中数据格式转换的转换器名称调用转换器进行格式转换后,根据对象名称填入导出文档模板即可,无需大量在业务系统开发如何进行格式转换的代码逻辑,无需开发如何确定用什么转换器进行格式转换等代码逻辑,直接根据转换器名称调用即可。
当批注数据为对象名称和表达式时,调用表达式引擎解析和执行表达式,对业务系统中与对象名称对应的待导出数据进行数据处理,获得处理后的数据;实际应用中,为了实现一些公式无法满足的情况,或提供一些外部数据交换功能,会通过表达式引擎对表达式进行解析和执行,表达式可以加载自定义函数,实现更灵活的数据处理功能。如:有一批员工薪酬信息在业务系统中,需要根据员工薪酬信息导出薪资表格,薪资表格中需要有姓名、应发薪资、个税扣除金额、实发薪资,薪资表格的有些数据需要通过员工薪酬信息进行计算获得,则在导出文档模板中批注对应的计算公式,在导出时,基于员工薪酬信息直接执行对应的计算公式获得应发薪资、个税扣除金额、实发薪资等等。无需大量在业务系统开发表达式的代码逻辑,直接根据批注数据中的表达式调用表达式引擎解析和执行表达式即可。
步骤S480,根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置。
其中,根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置,如:比如Excel工作簿中批注填写在工作表的列上,那么处理后的数据填入它下方的单元格或批注中指定起止单元格。
上述文档数据导出方法,通过当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;对导出文档模板进行解析,提取批注数据,批注数据可以对待导出数据进行处理;对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。无需更改业务系统中的代码,避免大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
在一个实施例中,一种文档数据导出方法,举例进行说明,例子如下:
有一批员工薪酬信息在业务系统中,需要导出到表格,表格需要的数据有姓名、应发薪资、个税扣除金额、实发薪资。
导出文档模板中编写如下批注的批注数据为:
Figure BDA0002419042550000121
Figure BDA0002419042550000131
在导出时,经过解析批注数据中的表达式,调用编写的“tax”方法计算个税扣除金额,并计算实发薪资。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种文档数据导入装置,包括:格式分析模块310、文档解析模块320、第一数据处理模块330和数据导入模块340,其中:
格式分析模块310,用于当接收到携带有待导入文档的文档数据导入指令时,对待导入文档的文件格式进行分析,确定待导入文档的文件格式;
文档解析模块320,用于根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;
第一数据处理模块330,用于根据批注数据对文本数据进行处理,获得处理后的数据;
数据导入模块340,用于将处理后的数据根据批注数据导入到业务系统的中。
在一个实施例中,第一数据处理模块330还用于:当批注数据仅为对象名称时,获取文本数据中被批注内容作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对文本数据中被批注内容进行格式转换,获得处理后的数据;当批注数据为对象名称和数据有效性验证代码时,运行数据有效性验证代码,对文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
在一个实施例中,数据导入模块340还用于:根据批注数据中的对象名称,确定对象名称与处理后的数据的对应关系;根据对象名称与处理后的数据的对应关系,将处理后的数据映射到业务系统的对象或结构体中。
在一个实施例中,如图5所示,文档数据导入装置还包括批注处理模块350,用于获取预导入文档;调用批注脚本文件对预导入文档进行批注处理,获得待导入文档。
上述文档数据导入装置,通过当接收到携带有待导入文档的文档数据导入指令时,根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;批注数据可以对文本数据进行处理,根据批注数据对文本数据进行处理后,根据批注数据中的对象名称映射到业务系统的对象或结构体中。无需更改业务系统中的代码,避免大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
在一个实施例中,如图6所示,提供了一种文档数据导出装置,包括:模板获取模块510、模板解析模块520、第二数据处理模块530和数据导出模块540,其中:
模板获取模块510,用于当接收到文档数据导出指令时,根据所述文档数据导出指令获取对应的导出文档模板;
模板解析模块520,用于对所述导出文档模板进行解析,提取批注数据;
第二数据处理模块530,用于根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;
数据导出模块540,用于根据所述批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。
在一个实施例中,第二数据处理模块530还用于:当批注数据仅为对象名称时,根据对象名称,获取业务系统中与对象名称对应的待导出数据作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对业务系统中与对象名称对应的待导出数据进行格式转换,获得处理后的数据;当批注数据为对象名称和表达式时,调用表达式引擎解析和执行表达式,对业务系统中与对象名称对应的待导出数据进行数据处理,获得处理后的数据。
上述文档数据导出装置,通过当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;对导出文档模板进行解析,提取批注数据,批注数据可以对待导出数据进行处理;对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。无需更改业务系统中的代码,避免大量修改系统代码的工作,减少了开发工作量,也降低了业务系统的复杂度,提高了业务系统的运行速度。
关于文档数据导入装置的具体限定可以参见上文中对于文档数据导入方法的限定,在此不再赘述。上述文档数据导入装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
关于文档数据导出装置的具体限定可以参见上文中对于文档数据导出方法的限定,在此不再赘述。上述文档数据导出装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文档数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文档数据导入方法或/和一种文档数据导出方法。
本领域技术人员可以理解,图7示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
当接收到携带有待导入文档的文档数据导入指令时,对待导入文档的文件格式进行分析,确定待导入文档的文件格式;根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;根据注数据对文本数据进行处理,获得处理后的数据;将处理后的数据根据批注数据导入到业务系统的中。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当批注数据仅为对象名称时,获取文本数据中被批注内容作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对文本数据中被批注内容进行格式转换,获得处理后的数据;当批注数据为对象名称和数据有效性验证代码时,运行数据有效性验证代码,对文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据批注数据中的对象名称,确定对象名称与处理后的数据的对应关系;根据对象名称与处理后的数据的对应关系,将处理后的数据映射到业务系统的对象或结构体中。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预导入文档;调用批注脚本文件对预导入文档进行批注处理,获得待导入文档。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
当接收到携带有待导入文档的文档数据导入指令时,对待导入文档的文件格式进行分析,确定待导入文档的文件格式;根据待导入文档的文件格式调用对应的解析程序,对待导入文档进行解析,获取待导入文档中的文本数据及批注数据;根据注数据对文本数据进行处理,获得处理后的数据;将处理后的数据根据批注数据导入到业务系统的中。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当批注数据仅为对象名称时,获取文本数据中被批注内容作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对文本数据中被批注内容进行格式转换,获得处理后的数据;当批注数据为对象名称和数据有效性验证代码时,运行数据有效性验证代码,对文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据批注数据中的对象名称,确定对象名称与处理后的数据的对应关系;根据对象名称与处理后的数据的对应关系,将处理后的数据映射到业务系统的对象或结构体中。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预导入文档;调用批注脚本文件对预导入文档进行批注处理,获得待导入文档。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;对导出文档模板进行解析,提取批注数据;根据批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当批注数据仅为对象名称时,根据对象名称,获取业务系统中与对象名称对应的待导出数据作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对业务系统中与对象名称对应的待导出数据进行格式转换,获得处理后的数据;当批注数据为对象名称和表达式时,调用表达式引擎解析和执行表达式,对业务系统中与对象名称对应的待导出数据进行数据处理,获得处理后的数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
当接收到文档数据导出指令时,根据文档数据导出指令获取对应的导出文档模板;对导出文档模板进行解析,提取批注数据;根据批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;根据批注数据中的对象名称将处理后的数据写入导出文档模板对应的位置。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当批注数据仅为对象名称时,根据对象名称,获取业务系统中与对象名称对应的待导出数据作为处理后的数据;当批注数据为对象名称和数据格式转换的转换器名称时,根据转换器名称调用对应的转换器,对业务系统中与对象名称对应的待导出数据进行格式转换,获得处理后的数据;当批注数据为对象名称和表达式时,调用表达式引擎解析和执行表达式,对业务系统中与对象名称对应的待导出数据进行数据处理,获得处理后的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文档数据导入方法,所述方法包括:
当接收到携带有待导入文档的文档数据导入指令时,对所述待导入文档的文件格式进行分析,确定所述待导入文档的文件格式;
根据待导入文档的文件格式调用对应的解析程序,对所述待导入文档进行解析,获取所述待导入文档中的文本数据及批注数据;
根据所述批注数据对所述文本数据进行处理,获得处理后的数据;
将所述处理后的数据根据所述批注数据导入到业务系统的中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述批注数据对所述文本数据进行处理,获得处理后的数据的步骤,包括:
当所述批注数据仅为对象名称时,获取所述文本数据中被批注内容作为处理后的数据;
当所述批注数据为对象名称和数据格式转换的转换器名称时,根据所述转换器名称调用对应的转换器,对所述文本数据中被批注内容进行格式转换,获得处理后的数据;
当所述批注数据为对象名称和数据有效性验证代码时,运行所述数据有效性验证代码,对所述文本数据中被批注内容进行数据有效性验证,获得有效数据作为处理后的数据。
3.根据权利要求2所述的方法,其特征在于,所述将所述处理后的数据根据所述批注数据导入到业务系统的中的步骤,包括:
根据所述批注数据中的对象名称,确定所述对象名称与所述处理后的数据的对应关系;
根据所述对象名称与所述处理后的数据的对应关系,将所述处理后的数据映射到业务系统的对象或结构体中。
4.根据权利要求1所述的方法,其特征在于,在所述接收到携带有待导入文档的文档数据导入指令的步骤之前,还包括:
获取预导入文档;
调用批注脚本文件对预导入文档进行批注处理,获得所述待导入文档。
5.一种文档数据导出方法,所述方法包括:
当接收到文档数据导出指令时,根据所述文档数据导出指令获取对应的导出文档模板;
对所述导出文档模板进行解析,提取批注数据;
根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;
根据所述批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。
6.根据权利要求5所述的方法,其特征在于,所述根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据的步骤,包括:
当所述批注数据仅为对象名称时,根据所述对象名称,获取业务系统中与所述对象名称对应的待导出数据作为处理后的数据;
当所述批注数据为对象名称和数据格式转换的转换器名称时,根据所述转换器名称调用对应的转换器,对业务系统中与所述对象名称对应的待导出数据进行格式转换,获得处理后的数据;
当所述批注数据为对象名称和表达式时,调用表达式引擎解析和执行所述表达式,对业务系统中与所述对象名称对应的待导出数据进行数据处理,获得处理后的数据。
7.一种文档数据导入装置,其特征在于,所述装置包括:
格式分析模块,用于当接收到携带有待导入文档的文档数据导入指令时,对所述待导入文档的文件格式进行分析,确定所述待导入文档的文件格式;
文档解析模块,用于根据待导入文档的文件格式调用对应的解析程序,对所述待导入文档进行解析,获取所述待导入文档中的文本数据及批注数据;
第一数据处理模块,用于根据所述批注数据对所述文本数据进行处理,获得处理后的数据;
数据导入模块,用于将所述处理后的数据根据所述批注数据导入到业务系统的中。
8.一种文档数据导出装置,其特征在于,所述装置包括:
模板获取模块,用于当接收到文档数据导出指令时,根据所述文档数据导出指令获取对应的导出文档模板;
模板解析模块,用于对所述导出文档模板进行解析,提取批注数据;
第二数据处理模块,用于根据所述批注数据,对业务系统中待导出数据进行处理,获得处理后的数据;
数据导出模块,用于根据所述批注数据中的对象名称将所述处理后的数据写入导出文档模板对应的位置。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010200051.4A 2020-03-20 2020-03-20 文档数据导入方法、文档数据导出方法、装置和存储介质 Pending CN111460017A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010200051.4A CN111460017A (zh) 2020-03-20 2020-03-20 文档数据导入方法、文档数据导出方法、装置和存储介质
PCT/CN2020/098708 WO2021184574A1 (zh) 2020-03-20 2020-06-29 文档数据导入方法、文档数据导出方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010200051.4A CN111460017A (zh) 2020-03-20 2020-03-20 文档数据导入方法、文档数据导出方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN111460017A true CN111460017A (zh) 2020-07-28

Family

ID=71682933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010200051.4A Pending CN111460017A (zh) 2020-03-20 2020-03-20 文档数据导入方法、文档数据导出方法、装置和存储介质

Country Status (2)

Country Link
CN (1) CN111460017A (zh)
WO (1) WO2021184574A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115391439A (zh) * 2022-08-24 2022-11-25 中化现代农业有限公司 文档数据导出方法、装置、电子设备和存储介质
CN115618841A (zh) * 2022-11-29 2023-01-17 明度智云(浙江)科技有限公司 一种文档导出方法、装置、设备及存储介质
CN117272953A (zh) * 2023-11-15 2023-12-22 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659929B (zh) * 2022-10-24 2023-09-15 南京涵韬信息科技有限公司 一种基于多文档的批注互动方法及系统
CN115827310B (zh) * 2023-02-21 2023-05-23 成都天成电科科技有限公司 一种信息校验的方法、装置、存储介质及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9753908B2 (en) * 2007-11-05 2017-09-05 The Neat Company, Inc. Method and system for transferring data from a scanned document into a spreadsheet
CN109783558A (zh) * 2018-12-28 2019-05-21 益萃网络科技(中国)有限公司 Excel数据的导入方法、装置、计算机设备和存储介质
CN110147402A (zh) * 2019-05-22 2019-08-20 北大方正集团有限公司 Excel文件导入方法及设备、导出方法及设备
CN110377563A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 文件处理方法和装置、以及电子设备和可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115391439A (zh) * 2022-08-24 2022-11-25 中化现代农业有限公司 文档数据导出方法、装置、电子设备和存储介质
CN115618841A (zh) * 2022-11-29 2023-01-17 明度智云(浙江)科技有限公司 一种文档导出方法、装置、设备及存储介质
CN117272953A (zh) * 2023-11-15 2023-12-22 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质
CN117272953B (zh) * 2023-11-15 2024-03-12 明度智云(浙江)科技有限公司 一种文档信息自动填充方法、系统和存储介质

Also Published As

Publication number Publication date
WO2021184574A1 (zh) 2021-09-23

Similar Documents

Publication Publication Date Title
CN111460017A (zh) 文档数据导入方法、文档数据导出方法、装置和存储介质
CN109947789B (zh) 一种多数据库的数据处理的方法、装置、计算机设备及存储介质
CN110704521A (zh) 接口数据接入方法及系统
CN103778107A (zh) 一种基于excel快速动态生成表单的方法与平台
CN109766085B (zh) 一种处理枚举类型代码的方法及装置
CN111639473A (zh) 基于java的excel文件解析方法、装置、计算机设备及存储介质
CN113961196A (zh) 一种自动生成代码方法、装置、设备及可读存储介质
US10643022B2 (en) PDF extraction with text-based key
CN112836233A (zh) 一种基于大数据分析的电子政务信息服务系统及方法
CN108959343A (zh) 一种文字修改的方法及装置
KR100762712B1 (ko) 규칙기반의 전자문서 변환방법 및 그 시스템
US20210342183A1 (en) System and method for creating workflow of a task
CN115904482B (zh) 接口文档生成方法、装置、设备及存储介质
US10699329B2 (en) Systems and methods for document to order conversion
CN113626438B (zh) 一种数据表管理的方法、装置、计算机设备及存储介质
CN115758973A (zh) 芯片寄存器设计文件的生成方法及装置、设备、存储介质
CN114528277A (zh) 一种动态配置导入业务数据的方法
CN113986951A (zh) 一种通用etl代码的生成系统及方法
CN111783415A (zh) 模板配置方法以及装置
CN111552779A (zh) 人机对话方法、装置、介质及电子设备
CN112732423A (zh) 流程迁移方法、装置、设备及介质
CN109376191A (zh) 财报数据处理方法、装置、计算机设备和存储介质
CN113485693B (zh) 接口配置方法、装置、设备及存储介质
CN115358190A (zh) 一种工艺文档转换系统、方法、装置及可读存储介质
CN114416088A (zh) 移动工具页面生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20210129

Address after: 518066 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen saiante Technology Service Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination