CN112181519A - 一种数据加工的方法、装置、设备及存储介质 - Google Patents

一种数据加工的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112181519A
CN112181519A CN202011025727.7A CN202011025727A CN112181519A CN 112181519 A CN112181519 A CN 112181519A CN 202011025727 A CN202011025727 A CN 202011025727A CN 112181519 A CN112181519 A CN 112181519A
Authority
CN
China
Prior art keywords
target
data
configuration file
input data
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011025727.7A
Other languages
English (en)
Inventor
李斌
谢鸣晓
游屹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202011025727.7A priority Critical patent/CN112181519A/zh
Publication of CN112181519A publication Critical patent/CN112181519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • G06F9/4451User profiles; Roaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44589Program code verification, e.g. Java bytecode verification, proof-carrying code

Abstract

本发明实施例公开了一种数据加工的方法、装置、设备及存储介质。其中,该方法包括:响应于数据加工指令,获取目标输入数据;根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件;对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求;若符合,则根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据。通过目标配置文件进行数据加工,减少了代码编写过程中的失误,节约人力和时间,通过对目标配置文件进行校验,避免得不到最终结果,减少数据加工的尝试次数,提高数据加工的效率。

Description

一种数据加工的方法、装置、设备及存储介质
技术领域
本发明实施例涉及大数据技术,尤其涉及一种数据加工的方法、装置、设备及存储介质。
背景技术
大数据的应用主要集中在分布式缓存、存储、索引和计算等方面,在银行业务中经常有大规模客户的资产分析、客户行为数据以及产品评价分析等任务,大数据也越来越多的应用到这些数据加工任务中。
现有技术中,工作人员通过分析大量实际系统应用中的数据分析计算任务,编写数据加工流程的代码,每种任务类型对应不同的代码,当参数出现变更时,需要对代码进行更新,使得开发人员学习成本过高,开发难度增大,且代码编写过程中容易出现误差,数据加工的准确性较低,影响数据加工效率。
发明内容
本发明实施例提供一种数据加工的方法、装置、设备及存储介质,以提高数据加工的效率。
第一方面,本发明实施例提供了一种数据加工的方法,该方法包括:
响应于数据加工指令,获取目标输入数据;
根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件;
对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求;
若符合,则根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据。
第二方面,本发明实施例还提供了一种数据加工的装置,该装置包括:
输入数据获取模块,用于响应于数据加工指令,获取目标输入数据;
目标文件确定模块,根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件;
目标文件校验模块,用于对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求;
输出数据获得模块,用于若符合,则根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任意实施例所述的数据加工方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的数据加工方法。
本发明实施例通过获取目标输入数据,确定与目标输入数据关联的目标配置文件,在根据目标配置文件进行数据加工之前,先对目标配置文件进行校验,确定目标配置文件是否符合预设要求,若符合,则进行数据加工处理。解决了现有技术中,通过代码进行数据处理时,代码容易出现错误的问题,减少人力开发成本,通过对配置文件进行校验,避免数据加工流程中出现错误,提高配置文件的正确性,并提高数据加工的效率。
附图说明
图1是本发明实施例一中的一种数据加工方法的流程示意图;
图2是本发明实施例二中的一种数据加工方法的流程示意图;
图3是本发明实施例三中的一种数据加工装置的结构框图;
图4是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一所提供的一种数据加工方法的流程示意图,本实施例可适用于对数据进行加工处理的情况,该方法可以由一种数据加工装置来执行。如图1所示,该方法具体包括如下步骤:
步骤110、响应于数据加工指令,获取目标输入数据。
其中,用户发出数据加工指令,服务器响应于数据加工指令,从发出数据加工指令的系统中获取目标输入数据。目标输入数据可以包括用户唯一标识、日期时间和产品明细等。根据数据加工指令,确定所需的目标输入数据,例如,用户的数据加工指令为盈亏分析,则目标输入数据为与计算盈亏分析关联的用户数据和产品数据等。
本实施例中,可选的,在响应于数据加工指令,获取目标输入数据之前,还包括:根据数据加工指令,确定目标任务类型;根据任务类型与任务ID的关联关系,确定目标任务类型的目标任务ID。
具体的,数据加工指令中可以包括获取目标输入数据的数据源,还可以包括目标任务类型,任务类型可以是计算产品期间收益率、年化收益率和波动率等类型,也可以是分析用户持仓盈亏等。根据数据加工指令,可以确定目标任务类型,不同任务类型关联有唯一的任务ID,根据目标任务类型,可以得到目标任务类型的目标任务ID。在得到目标任务ID后,可以将目标任务ID添加到目标输入数据中。这样设置的有益效果在于,可以明确目标任务类型和目标任务ID,有利于后续根据目标任务ID确定目标配置文件,避免配置文件确认错误,提高数据加工的精确性和效率。
步骤120、根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件。
其中,可以预先设置不同输入数据与配置文件的关联关系,输入数据中可以包括任务ID、数据源编号、数据名称和数据字段等信息,可以将输入数据中的信息与配置文件进行关联。可以将数据源与配置文件进行关联,也可以将输入数据的名称与配置文件进行关联。例如,配置文件中存在配置文件一和配置文件二,将配置文件一与产品收益数额进行关联,当输入数据为产品收益数额时,则采用配置文件一进行加工处理。在确定目标输入数据之后,根据目标输入数据中的信息,确定目标配置文件。
本实施例中,可选的,根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件,包括:根据任务ID与配置文件的关联关系,确定与目标任务ID关联的目标配置文件。
具体的,可以预先构建任务ID与配置文件之间的关联关系,在确定目标输入数据之后,从目标输入数据中获取目标任务ID,根据任务ID与配置文件的关联关系,确定与目标任务ID关联的目标配置文件。这样设置的有益效果在于,根据任务ID查找目标配置文件,可以避免目标配置文件查找错误,提高数据加工效率。
步骤130、对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求。
其中,在确定目标配置文件后,先对目标配置文件进行校验,确定目标配置文件符合预设要求后再进行数据加工。每个配置文件中都含有该配置文件对应的任务类型的数据加工流程,根据数据加工流程可以对数据进行加工处理,例如,可以按照预设公式对数据进行计算,得到最终结果。预设要求为配置文件中的数据加工流程不能出现循环,在每个任务类型的配置文件中,数据加工流程都是有向无环流程,即数据加工流程是非循环的流程。若目标配置文件的目标加工流程中存在循环,则该目标加工流程无法得到最终的输出数据,该目标配置文件不符合预设要求,目标配置文件存在错误;若目标加工流程中不存在循环,则目标配置文件符合预设要求,可以继续进行数据加工。
本实施例中,可选的,对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求,包括:对目标配置文件中的目标加工流程进行解析,得到目标加工流程中每一个步骤的中间输入数据和中间输出数据;根据不同步骤之间中间输入数据和中间输出数据的数据依赖关系,确定目标配置文件是否符合预设要求。
具体的,获取目标配置文件中的目标加工流程,对目标加工流程进行解析,得到目标加工流程中每一个数据加工步骤。确定每一个数据加工步骤所需的中间输入数据的来源和中间输出数据的去向,中间输入数据是目标加工流程中中间步骤的输入数据,包括第一个步骤的输入数据,中间输出数据是目标加工流程中中间步骤的输出数据,包括最后一个步骤的输出数据。确定每两个步骤之间的数据依赖关系,例如,存在三个步骤,分别是步骤一、步骤二和步骤三,确定步骤一和步骤二的数据依赖关系、步骤一和步骤三的数据依赖关系,以及步骤二和步骤三的数据依赖关系。数据依赖关系是指不同步骤之间输入输出数据的关系,若一个步骤的输出数据是另一个步骤的输入数据,则这两步骤之间存在数据依赖关系。根据不同步骤之间的数据依赖关系,可以确定目标配置文件是否符合预设要求。例如,可以通过确定前一步骤的输入数据是否包含后面步骤的输出数据,来确定目标配置文件是否符合预设要求。这样设置的有益效果在于,通过检验目标配置文件,避免数据处理过程中出现错误,节约数据加工的时间,在数据加工之前就可以发现问题,提高数据加工的效率。
本实施例中,可选的,根据不同步骤之间中间输入数据和中间输出数据的数据依赖关系,确定目标配置文件是否符合预设要求,包括:确定目标加工流程中第一步骤的中间输入数据的获取是否依赖于第二步骤的中间输出数据;若不是,则确定目标配置文件符合预设要求。
具体的,判断不同步骤之间中间输入数据和中间输出数据的数据依赖关系,可以是判断一个数据加工步骤的中间输入数据是否来源与其他数据加工步骤的输出数据,也就是确定目标加工流程中第一步骤的中间输入数据的获取是否依赖于第二步骤的中间输出数据。其中,第一步骤在目标加工流程中位于第二步骤之前,各步骤的前后顺序为预先设置,第一步骤与第二步骤可以相连,也可以不相连。若第一步骤的中间输入数据依赖于第二步骤的中间输出数据,则说明在得到第二步骤的中间输出数据之后,存在循环过程到达第一步骤处,目标加工流程出现循环,不符合目标配置文件符合预设要求。若第一步骤的中间输入数据不依赖于第二步骤的中间输出数据,则确定目标配置文件符合预设要求,例如,第一步骤的中间输入数据可以是第一步骤之前任意步骤的中间输出数据,也可以是数据源的目标输入数据。这样设置的有益效果在于,对每个步骤的中间数据进行依赖关系的校验,避免对步骤的遗漏,提高校验的精确性,进而提高数据处理的效率。
本实施例中,可选的,对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求,还包括:根据预设输入数据,运行目标配置文件中的目标加工流程,确定是否得到预设输出数据;若得到预设输出数据,则确定目标配置文件符合预设要求。
具体的,可以预先设置用于校验目标配置文件的预设输入数据,当需要校验目标配置文件时,输入预设输入数据,运行目标加工流程,若目标加工流程为非循环流程,则可以得到最终的预设输出数据。如果得不到预设输出数据,则说明目标加工流程为循环流程,不符合目标配置文件的预设要求。在得到预设输出数据后,可以将输出的预设输出数据与对应的标准输出数据进行比较,标准输出数据是预先计算出来的与预设输入数据对应的正确的输出数据。若输出的预设输出数据与标准输出数据一致,则说明目标配置文件中的计算公式也没有问题,可以得到正确结果。因此,可以通过目标配置文件进行数据加工处理。这样设置的有益效果在于,通过输入预设输入数据,可以直接得到校验结果,不需要检查每个步骤的数据依赖关系,避免步骤检验的遗漏,有效节约时间,提高数据校验的效率和精确性。
步骤140、若符合,则根据目标配置文件对目标输入数据进行加工,得到目标输出数据。
其中,若目标配置文件符合预设要求,则根据目标配置文件,对目标输入数据进行加工处理,按照预设的目标加工流程进行计算,例如,可以对目标输入数据进行加和、求平均或求收益率等计算方式,得到目标输出数据,即得到数据加工的结果。
本实施例中,可选的,在根据目标配置文件对目标输入数据进行加工,得到目标输出数据之后,还包括:根据目标配置文件中的目标输出数据持久化策略,对目标输出数据进行存储。
具体的,配置文件中可以包括数据加工流程,数据加工流程用于对输入数据进行计算,得到输出数据。配置文件中还可以包括输出数据持久化策略,输出数据持久化策略用于对输出数据进行持久化处理。在得到目标输出数据后,获取目标配置文件中的目标输出数据持久化策略,确定目标输出数据的存储方式、存储类型和存储位置等。根据目标输出数据持久化策略,对目标输出数据进行存储。这样设置的有益效果在于,在得到输出数据之后,可以自动进行持久化存储,不需要手动查找存储信息,通过配置文件完成对输出数据的配置,提高数据加工处理的效率,节约人力和时间,减少人为的出错。
本实施例的技术方案,通过获取目标输入数据,确定与目标输入数据关联的目标配置文件,在根据目标配置文件进行数据加工之前,先对目标配置文件进行校验,确定目标配置文件是否符合预设要求,若符合,则进行数据加工处理。解决了现有技术中,通过代码进行数据处理时,代码容易出现错误的问题,减少人力开发成本,通过对配置文件进行校验,避免数据加工流程中出现错误,提高配置文件的正确性,并提高数据加工的效率。
实施例二
图2为本发明实施例二所提供的一种数据加工方法的流程示意图,本实施例以上述实施例为基础进行进一步的优化,该方法可以由一种数据加工装置来执行。如图2所示,该方法具体包括如下步骤:
步骤210、根据不同任务类型的数据加工流程,生成不同任务类型对应的配置文件;其中,配置文件包括数据源配置、自定义函数配置和数据流配置。
其中,可以预先根据不同任务类型的数据加工流程,确定多个配置文件,使配置文件与任务类型相对应。不同任务类型有不同的数据加工流程,数据加工流程是指对输入数据的具体处理过程。工作人员将不同任务类型的数据加工流程加载到服务器中,服务器对数据加工流程进行打包,生成配置文件。配置文件中可以包括数据源配置、自定义函数配置和数据流配置。数据源配置是指对数据加工流程中的数据信息的配置,数据信息至少包括数据类型、数据访问方式和数据存储格式。数据信息可以是输入数据信息、加工过程中的中间数据信息和输出数据信息,例如,根据数据源配置可以确定输入数据的数据类型,也可以确定输出数据的存储位置等。数据源配置中可以表明所需输入数据的字段和格式等,便于在获取到目标输入数据后,对目标输入数据进行选择和提取,得到真正需要的输入数据,并可以对目标输入数据进行格式转换,得到配置文件可以处理的格式类型。目标输入数据可以是HDFS(Hadoop Distributed File System,分布式文件系统)文件、HBase(Hadoopdatabase,开源的非关系型分布式数据库)表或Hive(基于Hadoop的一个数据仓库工具)表等数据,根据数据源配置,可以对多种类异构数据进行提取和转换。配置文件以datasource(数据源)为源节点,数据源配置可以是其中一个data(数据),数据源配置中可以配置数据描述信息、存储类型、数据访问信息、字段名称、字段类型和字段别名等。有效减少工作人员的开发成本,减小开发难度,减少对代码的编写,避免代码错误,提高数据加工效率。
配置文件中的自定义函数配置可以是配置UDF(User-Defined Function,用户自定义函数)和UDAF(User-Defined Aggregation Function,用户自定义聚合函数)等,自定义函数配置存储在JAVA class(类)的路径中,JAVA类的路径配置于配置文件中。也就是说,通过在配置文件中配置JAVA class路径,可以动态加载自定义函数,并利用自定义函数进行数据的加工计算。例如,Hive的UDF的路径可以是org.apache.hadoop.hive.ql.exec.UDF。通过配置自定义函数,增加了数据加工处理的灵活性和易用性,有利于配置文件的扩展和更新。
数据流配置是指数据加工流程的步骤配置,步骤配置至少包括数据读取配置、数据处理配置和数据持久化配置。对数据加工的实际流程进行解析,得到每一个步骤。数据读取配置是指配置数据在读取时的要求,便于确定数据读取的字段内容及数据格式等,数据处理配置是将每一个步骤进行拼接,生成完整的数据加工流程,以便于对读取的数据进行处理,得到输出数据,数据处理配置中可以采用自定义函数对数据进行计算。数据持久化配置是对输出数据的配置,用于对输出数据进行持久化处理,将输出数据存储在指定的位置。通过数据流配置,可以确定数据加工处理的完整流程,不需要工作人员进行编码,抽象了大数据处理的相关流程,具有高度灵活性和扩展性,减少代码错误产生的误差,提高数据加工的精度和效率。
步骤220、响应于数据加工指令,获取目标输入数据。
步骤230、根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件。
步骤240、对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求。
步骤250、若符合,则根据目标配置文件对目标输入数据进行加工,得到目标输出数据。
其中,若目标配置文件校验成功,符合预设要求,则可以利用目标配置文件进行数据加工。
本实施例中,可选的,根据目标配置文件对目标输入数据进行加工,得到目标输出数据,包括:根据目标配置文件中的数据源配置,对目标输入数据进行转换,得到待处理数据;获取目标配置文件中的目标JAVA类的路径;根据目标JAVA类的路径,动态加载目标自定义函数;根据数据流配置,基于目标自定义函数,对待处理数据进行加工,得到目标输出数据。
具体的,在得到目标输入数据之后,目标输入数据的格式可能不能被目标配置文件处理,需要将目标输入数据转换为可以被目标配置文件识别的格式。可以利用目标配置文件中的数据源配置,对目标输入数据进行格式转换,得到待处理数据,例如,待处理数据可以是十六进制或二进制等。根据数据流配置,确定对待处理数据的加工流程,在数据加工过程中,需要用到自定义函数,自定义函数配置在JAVA class的路径中,在配置文件中配置JAVA class的路径,当需要读取自定义函数时,可以动态加载自定义函数。根据目标配置文件中目标JAVA类的路径,可以动态加载目标自定义函数。在得到目标自定义函数后,根据目标配置文件中的数据流配置,对待处理数据进行数据加工,得到目标输出数据。这样设置的有益效果在于,通过数据源配置对输入数据进行格式转换,自定义函数配置加载自定义函数,数据流配置确定数据加工流程,简化了对代码的编写,对数据加工的各步骤进行清晰的划分,避免出现代码混乱或丢失的问题,基于可配置的方式完成数据加工任务的创建和运行,提高数据加工的效率和精确性。
本发明实施例通过配置不同任务类型的配置文件,省去编写代码的过程,获取目标输入数据,确定与目标输入数据关联的目标配置文件,在根据目标配置文件进行数据加工之前,先对目标配置文件进行校验,确定目标配置文件是否符合预设要求,若符合,则进行数据加工处理。解决了现有技术中,通过代码进行数据处理时,代码容易出现错误的问题,减少人力开发成本,通过对配置文件进行校验,避免数据加工流程中出现错误,提高配置文件的正确性,并提高数据加工的效率。
实施例三
图3为本发明实施例三所提供的一种数据加工装置的结构框图,可执行本发明任意实施例所提供的一种数据加工方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置具体包括:
输入数据获取模块301,用于响应于数据加工指令,获取目标输入数据;
目标文件确定模块302,根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件;
目标文件校验模块303,用于对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求;
输出数据获得模块304,用于若符合,则根据目标配置文件对目标输入数据进行加工,得到目标输出数据。
可选的,该装置还包括:
目标类型确定模块,用于在响应于数据加工指令,获取目标输入数据之前,根据数据加工指令,确定目标任务类型;
目标ID确定模块,用于根据任务类型与任务ID的关联关系,确定目标任务类型的目标任务ID。
可选的,目标文件确定模块302,具体用于:
根据任务ID与配置文件的关联关系,确定与目标任务ID关联的目标配置文件。
可选的,目标文件校验模块303,包括:
加工流程解析单元,用于对目标配置文件中的目标加工流程进行解析,得到目标加工流程中每一个步骤的中间输入数据和中间输出数据;
数据关系确定单元,用于根据不同步骤之间中间输入数据和中间输出数据的数据依赖关系,确定目标配置文件是否符合预设要求。
可选的,数据关系确定单元,具体用于:
确定目标加工流程中第一步骤的中间输入数据的获取是否依赖于第二步骤的中间输出数据;
若不是,则确定目标配置文件符合预设要求。
可选的,第一步骤在目标加工流程中位于第二步骤之前。
可选的,目标文件校验模块303,还具体用于:
根据预设输入数据,运行目标配置文件中的目标加工流程,确定是否得到预设输出数据;
若得到预设输出数据,则确定目标配置文件符合预设要求。
可选的,该装置还包括:
数据持久模块,用于在根据目标配置文件对目标输入数据进行加工,得到目标输出数据之后,根据目标配置文件中的目标输出数据持久化策略,对目标输出数据进行存储。
可选的,该装置还包括:
配置文件生成模块,用于在响应于数据加工指令,获取目标输入数据之前,根据不同任务类型的数据加工流程,生成不同任务类型对应的配置文件;其中,配置文件包括数据源配置、自定义函数配置和数据流配置。
可选的,数据源配置是指对数据加工流程中的数据信息的配置;数据信息至少包括数据类型、数据访问方式和数据存储格式。
可选的,自定义函数配置存储在JAVA类的路径中,JAVA类的路径配置于配置文件中。
可选的,数据流配置是指数据加工流程的步骤配置,步骤配置至少包括数据读取配置、数据处理配置和数据持久化配置。
可选的,输出数据获得模块304,具体用于:
根据目标配置文件中的数据源配置,对目标输入数据进行转换,得到待处理数据;
获取目标配置文件中的目标JAVA类的路径;
根据目标JAVA类的路径,动态加载目标自定义函数;
根据数据流配置,基于目标自定义函数,对待处理数据进行加工,得到目标输出数据。
本发明实施例通过获取目标输入数据,确定与目标输入数据关联的目标配置文件,在根据目标配置文件进行数据加工之前,先对目标配置文件进行校验,确定目标配置文件是否符合预设要求,若符合,则进行数据加工处理。解决了现有技术中,通过代码进行数据处理时,代码容易出现错误的问题,减少人力开发成本,通过对配置文件进行校验,避免数据加工流程中出现错误,提高配置文件的正确性,并提高数据加工的效率。
实施例四
图4是本发明实施例四提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备400的框图。图4显示的计算机设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备400以通用计算设备的形式表现。计算机设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元401,系统存储器402,连接不同系统组件(包括系统存储器402和处理单元401)的总线403。
总线403表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器402可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)404和/或高速缓存存储器405。计算机设备400可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统406可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线403相连。存储器402可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块407的程序/实用工具408,可以存储在例如存储器402中,这样的程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备400也可以与一个或多个外部设备409(例如键盘、指向设备、显示器410等)通信,还可与一个或者多个使得用户能与该计算机设备400交互的设备通信,和/或与使得该计算机设备400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口411进行。并且,计算机设备400还可以通过网络适配器412与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器412通过总线403与计算机设备400的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元401通过运行存储在系统存储器402中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种数据加工方法,包括:
响应于数据加工指令,获取目标输入数据;
根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件;
对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求;
若符合,则根据目标配置文件对目标输入数据进行加工,得到目标输出数据。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的一种数据加工方法,包括:
响应于数据加工指令,获取目标输入数据;
根据输入数据与配置文件的关联关系,确定与目标输入数据关联的目标配置文件;
对目标配置文件中的目标加工流程进行校验,确定目标配置文件是否符合预设要求;
若符合,则根据目标配置文件对目标输入数据进行加工,得到目标输出数据。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种数据加工的方法,其特征在于,包括:
响应于数据加工指令,获取目标输入数据;
根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件;
对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求;
若符合,则根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据。
2.根据权利要求1所述的方法,其特征在于,在响应于数据加工指令,获取目标输入数据之前,还包括:
根据所述数据加工指令,确定目标任务类型;
根据任务类型与任务ID的关联关系,确定所述目标任务类型的目标任务ID。
3.根据权利要求2所述的方法,其特征在于,根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件,包括:
根据任务ID与配置文件的关联关系,确定与目标任务ID关联的目标配置文件。
4.根据权利要求1所述的方法,其特征在于,对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求,包括:
对目标配置文件中的目标加工流程进行解析,得到目标加工流程中每一个步骤的中间输入数据和中间输出数据;
根据不同步骤之间所述中间输入数据和所述中间输出数据的数据依赖关系,确定所述目标配置文件是否符合预设要求。
5.根据权利要求4所述的方法,其特征在于,根据不同步骤之间所述中间输入数据和所述中间输出数据的数据依赖关系,确定所述目标配置文件是否符合预设要求,包括:
确定目标加工流程中第一步骤的中间输入数据的获取是否依赖于第二步骤的中间输出数据;
若不是,则确定所述目标配置文件符合预设要求。
6.根据权利要求5所述的方法,其特征在于,所述第一步骤在所述目标加工流程中位于所述第二步骤之前。
7.根据权利要求1所述的方法,其特征在于,对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求,还包括:
根据预设输入数据,运行目标配置文件中的目标加工流程,确定是否得到预设输出数据;
若得到预设输出数据,则确定所述目标配置文件符合预设要求。
8.根据权利要求1所述的方法,其特征在于,在根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据之后,还包括:
根据所述目标配置文件中的目标输出数据持久化策略,对所述目标输出数据进行存储。
9.根据权利要求1所述的方法,其特征在于,在响应于数据加工指令,获取目标输入数据之前,还包括:
根据不同任务类型的数据加工流程,生成不同任务类型对应的配置文件;其中,所述配置文件包括数据源配置、自定义函数配置和数据流配置。
10.根据权利要求9所述的方法,其特征在于,所述数据源配置是指对数据加工流程中的数据信息的配置;所述数据信息至少包括数据类型、数据访问方式和数据存储格式。
11.根据权利要求9所述的方法,其特征在于,所述自定义函数配置存储在JAVA类的路径中,所述JAVA类的路径配置于配置文件中。
12.根据权利要求9所述的方法,其特征在于,所述数据流配置是指数据加工流程的步骤配置,所述步骤配置至少包括数据读取配置、数据处理配置和数据持久化配置。
13.根据权利要求9所述的方法,其特征在于,根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据,包括:
根据目标配置文件中的数据源配置,对目标输入数据进行转换,得到待处理数据;
获取目标配置文件中的目标JAVA类的路径;
根据所述目标JAVA类的路径,动态加载目标自定义函数;
根据数据流配置,基于所述目标自定义函数,对所述待处理数据进行加工,得到所述目标输出数据。
14.一种数据加工的装置,其特征在于,包括:
输入数据获取模块,用于响应于数据加工指令,获取目标输入数据;
目标文件确定模块,根据输入数据与配置文件的关联关系,确定与所述目标输入数据关联的目标配置文件;
目标文件校验模块,用于对所述目标配置文件中的目标加工流程进行校验,确定所述目标配置文件是否符合预设要求;
输出数据获得模块,用于若符合,则根据所述目标配置文件对所述目标输入数据进行加工,得到目标输出数据。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-13中任一所述的数据加工方法。
16.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-13中任一所述的数据加工方法。
CN202011025727.7A 2020-09-25 2020-09-25 一种数据加工的方法、装置、设备及存储介质 Pending CN112181519A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011025727.7A CN112181519A (zh) 2020-09-25 2020-09-25 一种数据加工的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011025727.7A CN112181519A (zh) 2020-09-25 2020-09-25 一种数据加工的方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112181519A true CN112181519A (zh) 2021-01-05

Family

ID=73943987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011025727.7A Pending CN112181519A (zh) 2020-09-25 2020-09-25 一种数据加工的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112181519A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702208A (zh) * 2009-10-28 2010-05-05 金蝶软件(中国)有限公司 一种凭证处理方法和企业资源计划系统
CN107368383A (zh) * 2017-06-29 2017-11-21 汽-大众汽车有限公司 一种汽车控制器配置文件校验方法及设备
CN108897691A (zh) * 2018-06-29 2018-11-27 百度在线网络技术(北京)有限公司 基于接口模拟服务的数据处理方法、装置、服务器和介质
CN109683923A (zh) * 2017-10-18 2019-04-26 中国电力科学研究院 一种配电自动化系统配置文件版本的校核方法及系统
CA3059738A1 (en) * 2018-10-24 2020-04-24 Wenhang Qiu Behaviour data processing method, device, electronic device and computer readable medium
CN111353763A (zh) * 2020-03-30 2020-06-30 中国建设银行股份有限公司 处理数据的方法、装置、服务器及存储介质
WO2020155760A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 一种多数据库的数据处理的方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702208A (zh) * 2009-10-28 2010-05-05 金蝶软件(中国)有限公司 一种凭证处理方法和企业资源计划系统
CN107368383A (zh) * 2017-06-29 2017-11-21 汽-大众汽车有限公司 一种汽车控制器配置文件校验方法及设备
CN109683923A (zh) * 2017-10-18 2019-04-26 中国电力科学研究院 一种配电自动化系统配置文件版本的校核方法及系统
CN108897691A (zh) * 2018-06-29 2018-11-27 百度在线网络技术(北京)有限公司 基于接口模拟服务的数据处理方法、装置、服务器和介质
CA3059738A1 (en) * 2018-10-24 2020-04-24 Wenhang Qiu Behaviour data processing method, device, electronic device and computer readable medium
WO2020155760A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 一种多数据库的数据处理的方法、装置、计算机设备及存储介质
CN111353763A (zh) * 2020-03-30 2020-06-30 中国建设银行股份有限公司 处理数据的方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
US11321122B2 (en) Method, apparatus, device and medium for processing topological relation of tasks
CN110347598B (zh) 一种测试脚本生成方法、装置、服务器及存储介质
US20180074944A1 (en) Test case generator built into data-integration workflow editor
CN110888720A (zh) 任务处理方法、装置、计算机设备及存储介质
CN109165209B (zh) 数据库中对象类型的数据校验方法、装置、设备及介质
CN110941488A (zh) 一种任务处理方法、装置、设备和存储介质
CN110688111A (zh) 业务流程的配置方法、装置、服务器和存储介质
CN110659210A (zh) 一种信息获取方法、装置、电子设备及存储介质
CN110874364B (zh) 一种查询语句处理方法、装置、设备及存储介质
CN113094625B (zh) 页面元素定位方法、装置、电子设备及存储介质
CN114358742A (zh) 一种工作流执行方法、装置、设备及存储介质
CN113360144B (zh) 软件开发的辅助处理方法、设备、存储介质及程序产品
CN110716804A (zh) 无用资源的自动删除方法、装置、存储介质及电子设备
US9064042B2 (en) Instrumenting computer program code by merging template and target code methods
CN110175128B (zh) 一种相似代码案例获取方法、装置、设备和存储介质
CN112039975A (zh) 一种报文字段的处理方法、装置、设备及存储介质
US11182272B2 (en) Application state monitoring
CN114968725A (zh) 任务依赖关系校正方法、装置、计算机设备及存储介质
CN112181519A (zh) 一种数据加工的方法、装置、设备及存储介质
US11392371B2 (en) Identification of a partial code to be refactored within a source code
CN114090514A (zh) 分布式系统的日志检索方法及装置
CN113553826A (zh) 结合rpa和ai的信息录入方法、装置及电子设备
CN113138906A (zh) 一种调用链数据采集方法、装置、设备及存储介质
US20180032929A1 (en) Risk-adaptive agile software development
CN116661758B (zh) 一种优化日志框架配置的方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination