CN114969098A - 一种数据处理方法、装置、电子设备、及计算机存储介质 - Google Patents
一种数据处理方法、装置、电子设备、及计算机存储介质 Download PDFInfo
- Publication number
- CN114969098A CN114969098A CN202210702916.6A CN202210702916A CN114969098A CN 114969098 A CN114969098 A CN 114969098A CN 202210702916 A CN202210702916 A CN 202210702916A CN 114969098 A CN114969098 A CN 114969098A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- queried
- sql
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 109
- 238000012545 processing Methods 0.000 claims abstract description 84
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据处理方法、装置、电子设备、及计算机存储介质,可应用于大数据领域。该方法包括获取用户输入结构化查询语言SQL语句;对SQL语句进行解析,确定待查询数据,以及待查询数据的数据量;对数据量和待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,多进程数是基于分页数确定的。在本发明实施例中,根据SQL语句所要查询的数据量,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、电子设备、及计算机存储介质。
背景技术
目前,可使用数据库Gbase官方工具GBase8a_MPP_Cluster_GStudio选择需要导出的数据,以对数据进行导出操作。当需要导出的数据的数据较多时,通过上述方式容易造成导出处理时间较长,且容易出现导出处理失败,进而造成系统宕机。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法、装置、电子设备、及计算机存储介质,以解决现有技术中出现的处理时间较长,且容易出现导出处理失败的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面示出了一种数据处理方法,所述方法包括:
获取用户输入结构化查询语言SQL语句;
对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量;
对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;
基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
可选的,还包括:
在获取用户输入的待查询数据对应结构化查询语言SQL语句之后,判断所述SQL语句是否符合预设SQL规范;
若符合,执行对所述SQL语句进行解析,确定待查询数据的数据量这一步骤;
若不符合,输出提示信息,提示用户重新输入对应的SQL语句。
可选的,所述对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据,包括:
按照预设分页规则对所述数据量进行计算,得到对应的分页数;
基于所述分页数对所述数据量对应的待查询数据进行划分,得到每一分页所对应的待查询数据。
可选的,所述基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,包括:
基于所述分页数设置对应的多线程数;
基于所述多线程数对每一分页所对应的待查询数据进行分页多进程查询,得到每一分页的查询结果;
针对每一分页,将所述查询结果导出生成固定格式文件。
可选的,还包括:
按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
本发明实施例第二方面示出了一种数据处理装置,所述装置包括:
获取单元,用于获取用户输入结构化查询语言SQL语句;
解析单元,用于对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量;
处理单元,用于对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
可选的,还包括:
判断单元,用于在获取用户输入的待查询数据对应结构化查询语言SQL语句之后,判断所述SQL语句是否符合预设SQL规范;若符合,执行对所述SQL语句进行解析,确定待查询数据的数据量这一步骤;若不符合,输出提示信息,提示用户重新输入对应的SQL语句。
可选的,还包括:
存储单元,用于按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
本发明实施例第三方面示出了一种电子设备,所述电子设备用于运行程序,其中,所述程序运行时执行如本发明实施例第一方面示出的数据处理方法。
本发明实施例第四方面示出的一种计算机存储介质,所述存储介质包括存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本发明实施例第一方面示出的数据处理方法。
基于上述本发明实施例提供的一种数据处理方法、装置、电子设备、及计算机存储介质,所述方法包括:获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。在本发明实施例中,根据SQL语句所要查询的数据量,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例示出的服务端与前端模块的交互示意图;
图2为本发明实施例示出的一种数据处理方法的流程示意图;
图3为本发明实施例示出的另一种数据处理方法的流程示意图;
图4为本发明实施例示出的一种数据处理装置的结构示意图;
图5为本发明实施例示出的另一种数据处理装置的结构示意图;
图6为本发明实施例示出的又一种数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了方便理解,以下对本发明实施例中出现的术语进行解释说明:
Gbase MPP数据库,大规模并行分析(Analytical Massively ParallelProcessing,MPP)数据库是针对分析工作负载进行了优化的数据库:聚合和处理大型数据集。
流式数据处理,数据流就像一个水流似的,不断有数据传来,可以不断的读取直到流末尾。有时有个大文件,在程序里可以一次读点,然后处理,再读些,再处理,这样的效率很高。
DataTransfer Object,DTO)是一种设计模式之间传输数据的软件应用对象。数据传输目标往往是数据访问对象从数据库中检索数据。
RESTFUL是一种网络应用程序的设计风格和开发方式,基于HTTP,可以使用XML格式定义或JSON格式定义。
逗号分隔值(Comma-SeparatedValues,CSV),有时也称为字符分隔值,因为分隔字符也可以不是逗号,其文件以纯文本形式存储表格数据(数字和文本)。
数据库管理员(Database Administrator,DBA),是从事管理和维护数据库管理系统的相关工作人员的统称,属于运维工程师的一个分支,主要负责业务数据库从设计、测试到部署交付的全生命周期管理。
Postman是一个接口测试工具,在做接口测试的时候,Postman相当于一个客户端,它可以模拟用户发起的各类HTTP请求,将请求数据发送至服务端,获取对应的响应结果。
在本发明实施例中,根据SQL语句所要查询的数据量,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过多线程能够加快数据查询及导出的速度,分页数据导出防止出现文件承载数据量太大打不开的问题。
需要说明的是,本发明提供的一种数据处理方法、装置、电子设备、及计算机存储介质,可用于大数据领域上述仅为示例,并不对本发明提供的一种数据处理方法、装置、电子设备、及计算机存储介质的应用领域进行限定。
参见图1,为本发明实施例示出的服务端与前端模块的交互示意图。
服务端10与前端模块20连接。
所述前端模块20的数据可为多个。
前端模块20可供用户使用,以便于技术人员预先根据经验填写预设存放路径及预设SQL规范。
需要说明的是,前端模块20可使用使用postman工具作为前端页面。
服务端10可为后端服务模块。
基于上述示出的架构具体实现数据处理的过程包括:
用户通过前端模块20输入的查询语言SQL语句,以便所述前端模块20将所述SQL语句发送至服务端10。
服务端10获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
基于上述本发明实施例示出的架构,参见图2,为本发明实施例示出的一种数据处理方法的流程示意图,该方法包括:
步骤S201:获取用户输入结构化查询语言SQL语句。
在具体实现步骤S201的过程中,获取用户基于前端模块需要的想要获取的数据所对应的SQL语句。
步骤S202:对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量。
在具体实现步骤S202的过程中,对所述所述SQL语句进行语法解析,以确定所述用户待查询数据,以及需要导出数据的大小,即数据量。
步骤S203:对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据。
需要说明的是,具体实现步骤S203对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据的过程中包括以下步骤:
步骤S11:按照预设分页规则对所述数据量进行计算,得到对应的分页数。
需要说明的是,预设分页规则是技术人员根据经验或实验进行设置的每一分页对应的文件所能存储的数据大小,比如可设置为一个文件能存储10万大小的数据。
在具体实现步骤S11的过程中,将数据量按照预设分页规则进行分页处理,得到可分页的分页数。
步骤S12:基于所述分页数对所述数据量对应的待查询数据进行划分,得到每一分页所对应的待查询数据。
在具体实现步骤S12的过程中,按照上述计算得到的分页数以及每一分页对应的文件所能存储的数据大小,依次对待查询数据进行划分,得到每一分页所对应的待查询数据。
需要说明的是,每一分页对应的文件所能存储的数据大小与预设分页规则中设置的存储大小是一致的。
步骤S204:基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件。
在步骤S204中,所述多进程数是基于所述分页数确定的。
需要说明的是,具体示出步骤S204的过程,具体包括以下步骤:
步骤S21:基于所述分页数设置对应的多线程数。
在具体实现步骤S21的过程中,基于分页数设置多线程开启数,即多线程数。
需要说明的是,多线程数用于指示可并发执行查询数量。
步骤S22:基于所述多线程数对每一分页所对应的待查询数据进行分页多进程查询,得到每一分页的查询结果。
在具体实现步骤S22的过程中,按照所述多线程数并发查询Gbase数据库,以分页多进程的查询每一分页所对应的待查询数据,以得到对应的查询结果,即每一分页的查询结果。
步骤S23:针对每一分页,将所述查询结果导出生成固定格式文件。
在具体实现步骤S23的过程中,对每一分页的查询结果进行流式数据处理,以避免查询出的大批量数据导致的java内存溢出的问题。并将每一分页的查询结果导出生成固定格式文件。
需要说明的是,固定格式文件可为excel文件。
步骤S205:按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
在具体实现步骤S205的过程中,按照预设存放路径将所述每一分页对应的固定格式文件存储至对应的目录下。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
可选的,基于上述本发明实施例示出的数据处理方法,本发明实施例还对应公开了另一数据处理方法,如图3所示,所述方法包括:
步骤S301:获取用户输入结构化查询语言SQL语句。
需要说明的是,步骤S301的具体实现过程与上述步骤S201的具体实现过程相同,可相互参见。
步骤S302:判断所述SQL语句是否符合预设SQL规范,若符合,则执行步骤S303,若不符合,则执行步骤S307。
在具体实现步骤S302的过程中,对所述SQL语句的规范性进行判断,以确定其是否符合预设SQL规范,若符合,则执行步骤S303,若不符合,则执行步骤S307。
需要说明的是,预设SQL规范是技术人员预先根据经验或多次实验进行设置的。
步骤S303:对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量。
步骤S304:对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据。
步骤S305:基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件。
在步骤S305中,所述多进程数是基于所述分页数确定的。
步骤S306:按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
需要说明的是,步骤S303至步骤S306的具体实现过程与上述步骤S202至步骤S205的具体实现过程相同,可相互参见。
步骤S307:输出提示信息,提示用户重新输入对应的SQL语句。
在具体实现步骤S307的过程中,在确定该SQL语句不规范时,需返回相关信息供操作人员查看,以便该操作人员重新输入对应的SQL语句,并返回执行步骤S301。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
基于上述本发明实施例示出的数据处理方法,相应的,本发明实施例还对应公开了一种数据处理装置,如图4所示,为本发明实施例示出的一种数据处理装置的结构示意图,该装置包括:
获取单元401,用于获取用户输入结构化查询语言SQL语句。
解析单元402,用于对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量。
处理单元403,用于对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
需要说明的是,上述本申请实施例公开的数据处理装置中的各个单元具体的原理和执行过程,与上述本申请实施示出的数据处理方法相同,可参见上述本申请实施例公开的数据处理方法中相应的部分,这里不再进行赘述。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
可选的,基于上述本发明实施例示出的数据处理装置,述对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据的处理单元403,具体用于:
按照预设分页规则对所述数据量进行计算,得到对应的分页数;基于所述分页数对所述数据量对应的待查询数据进行划分,得到每一分页所对应的待查询数据。
可选的,基于上述本发明实施例示出的数据处理装置,所述基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件的处理单元403,具体用于:
基于所述分页数设置对应的多线程数;基于所述多线程数对每一分页所对应的待查询数据进行分页多进程查询,得到每一分页的查询结果;针对每一分页,将所述查询结果导出生成固定格式文件。
可选的,基于上述本发明实施例示出的数据处理装置,结合图4,参见图5,为本发明实施例示出的另一数据处理装置的结构示意图,所述装置还进一步设置有判断单元404。
判断单元404,用于在获取用户输入的待查询数据对应结构化查询语言SQL语句之后,判断所述SQL语句是否符合预设SQL规范;若符合,执行对所述SQL语句进行解析,确定待查询数据的数据量这一步骤;若不符合,输出提示信息,提示用户重新输入对应的SQL语句。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;在确定所述SQL语句符合预设SQL规范时,对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
可选的,基于上述本发明实施例示出的数据处理装置,结合图5,参见图6,为本发明实施例示出的另一数据处理装置的结构示意图,所述装置还进一步设置有存储单元405。
存储单元405,用于按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
在本发明实施例中,获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件,进而按照预设存放路径将所述每一分页对应的固定格式文件进行存储。通过上述方式能够减少处理时间,且能够避免导出处理,进而防止系统宕机。
基于上述本公开实施例公开的数据处理装置,上述各个模块可以通过一种由处理器和存储器构成的硬件设备实现。具体为上述各个模块作为程序单元存储于存储器中,由处理器执行存储在存储器中的上述程序单元来实现数据处理。
其中,处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现数据处理。
本公开实施例提供了一种计算机存储介质,存储介质包括存储文本处理程序,其中,程序被处理器执行时实现图2至图3所述的数据处理方法。
本公开实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行图2至图3所述的数据处理方法。
本公开实施例提供了一种电子设备,本公开实施例中的电子设备可以是服务器、PC、PAD、手机等。
该电子设备包括至少一个处理器,以及与处理器连接的至少一个存储器,以及总线。
处理器、存储器通过总线完成相互间的通信。处理器,用于执行存储器中存储的程序。
存储器,用于存储程序,该程序至少用于:获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。
本申请还提供了一种计算机程序产品,当在电子设备上执行时,适于执行初始化有如下方法步骤的程序:获取用户输入结构化查询语言SQL语句;对所述SQL语句进行解析,确定待查询数据,及所述待查询数据的数据量;对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,以开启多线程进行分页数据查询,并在进行流式数据处理后,导出每一分页对应的固定格式文件。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取用户输入结构化查询语言SQL语句;
对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量;
对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;
基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
2.根据权利要求1所述的方法,其特征在于,还包括:
在获取用户输入的待查询数据对应结构化查询语言SQL语句之后,判断所述SQL语句是否符合预设SQL规范;
若符合,执行对所述SQL语句进行解析,确定待查询数据的数据量这一步骤;
若不符合,输出提示信息,提示用户重新输入对应的SQL语句。
3.根据权利要求1所述的方法,其特征在于,所述对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据,包括:
按照预设分页规则对所述数据量进行计算,得到对应的分页数;
基于所述分页数对所述数据量对应的待查询数据进行划分,得到每一分页所对应的待查询数据。
4.根据权利要求1所述的方法,其特征在于,所述基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,包括:
基于所述分页数设置对应的多线程数;
基于所述多线程数对每一分页所对应的待查询数据进行分页多进程查询,得到每一分页的查询结果;
针对每一分页,将所述查询结果导出生成固定格式文件。
5.根据权利要求1所述的方法,其特征在于,还包括:
按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
6.一种数据处理装置,其特征在于,所述装置包括:
获取单元,用于获取用户输入结构化查询语言SQL语句;
解析单元,用于对所述SQL语句进行解析,确定待查询数据,以及所述待查询数据的数据量;
处理单元,用于对所述数据量和所述待查询数据进行处理,确定分页数,以及每一分页所对应的待查询数据;基于多进程数对每一分页所对应的待查询数据进行分页多进程查询,导出每一分页对应的固定格式文件,其中,所述多进程数是基于所述分页数确定的。
7.根据权利要求6所述的装置,其特征在于,还包括:
判断单元,用于在获取用户输入的待查询数据对应结构化查询语言SQL语句之后,判断所述SQL语句是否符合预设SQL规范;若符合,执行对所述SQL语句进行解析,确定待查询数据的数据量这一步骤;若不符合,输出提示信息,提示用户重新输入对应的SQL语句。
8.根据权利要求6所述的装置,其特征在于,还包括:
存储单元,用于按照预设存放路径将所述每一分页对应的固定格式文件进行存储。
9.一种电子设备,其特征在于,所述电子设备用于运行程序,其中,所述程序运行时执行如权利要求1-5中任一所述的数据处理方法。
10.一种计算机存储介质,其特征在于,所述存储介质包括存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-5中任一所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210702916.6A CN114969098A (zh) | 2022-06-21 | 2022-06-21 | 一种数据处理方法、装置、电子设备、及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210702916.6A CN114969098A (zh) | 2022-06-21 | 2022-06-21 | 一种数据处理方法、装置、电子设备、及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114969098A true CN114969098A (zh) | 2022-08-30 |
Family
ID=82965059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210702916.6A Pending CN114969098A (zh) | 2022-06-21 | 2022-06-21 | 一种数据处理方法、装置、电子设备、及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114969098A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609159A (zh) * | 2017-09-26 | 2018-01-19 | 恒生电子股份有限公司 | 用于数据加载的方法、装置及计算机可读介质 |
CN109977137A (zh) * | 2019-02-22 | 2019-07-05 | 视联动力信息技术股份有限公司 | 一种数据查询方法和装置 |
CN111125220A (zh) * | 2019-12-18 | 2020-05-08 | 任子行网络技术股份有限公司 | 信息自定义导出方法及装置 |
CN112069207A (zh) * | 2020-08-27 | 2020-12-11 | 重庆攸亮科技股份有限公司 | 一种多表联合查询效率提升方法 |
CN113656432A (zh) * | 2021-08-16 | 2021-11-16 | 工银科技有限公司 | 数据对比方法及装置 |
CN114398441A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 数据导出方法、装置、计算机设备和存储介质 |
US20220179847A1 (en) * | 2020-12-03 | 2022-06-09 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data pair generating method, apparatus, electronic device and storage medium |
-
2022
- 2022-06-21 CN CN202210702916.6A patent/CN114969098A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609159A (zh) * | 2017-09-26 | 2018-01-19 | 恒生电子股份有限公司 | 用于数据加载的方法、装置及计算机可读介质 |
CN109977137A (zh) * | 2019-02-22 | 2019-07-05 | 视联动力信息技术股份有限公司 | 一种数据查询方法和装置 |
CN111125220A (zh) * | 2019-12-18 | 2020-05-08 | 任子行网络技术股份有限公司 | 信息自定义导出方法及装置 |
CN112069207A (zh) * | 2020-08-27 | 2020-12-11 | 重庆攸亮科技股份有限公司 | 一种多表联合查询效率提升方法 |
US20220179847A1 (en) * | 2020-12-03 | 2022-06-09 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data pair generating method, apparatus, electronic device and storage medium |
CN113656432A (zh) * | 2021-08-16 | 2021-11-16 | 工银科技有限公司 | 数据对比方法及装置 |
CN114398441A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 数据导出方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5298117B2 (ja) | 分散コンピューティングにおけるデータマージング | |
CN108388515B (zh) | 测试数据生成方法、装置、设备以及计算机可读存储介质 | |
CN108984155B (zh) | 数据处理流程设定方法和装置 | |
CN110019116B (zh) | 数据追溯方法、装置、数据处理设备及计算机存储介质 | |
CN106293891B (zh) | 多维投资指标监督方法 | |
CN106951231B (zh) | 一种计算机软件开发方法及装置 | |
CN109408493A (zh) | 一种数据源的迁移方法及系统 | |
CN116595038A (zh) | 一种数据血缘追溯方法、装置、设备及介质 | |
CN113448985A (zh) | 一种api接口生成方法、调用方法、装置及电子设备 | |
CN112583944B (zh) | 一种更新域名证书的处理方法和装置 | |
US9442818B1 (en) | System and method for dynamic data collection | |
CN114372102A (zh) | 数据的分析方法、装置、存储介质及电子设备 | |
CN112579705A (zh) | 元数据采集方法、装置、计算机设备和存储介质 | |
CN112346761B (zh) | 前端资源上线方法、设备、系统及存储介质 | |
CN110825764A (zh) | 一种sql脚本的生成方法、系统、存储介质和处理器 | |
CN110928941B (zh) | 一种数据分片抽取方法及装置 | |
CN112860844A (zh) | 案件线索处理系统、方法、装置和计算机设备 | |
CN106843822B (zh) | 一种执行代码生成方法及设备 | |
CN116703467A (zh) | 用户数据监测方法、系统、电子设备及可读存储介质 | |
CN114969098A (zh) | 一种数据处理方法、装置、电子设备、及计算机存储介质 | |
CN111143329A (zh) | 一种数据处理方法及装置 | |
CN112307050B (zh) | 一种重复关联计算的识别方法、装置及计算机系统 | |
CN111475167B (zh) | 一种基于HQL语句的Shell脚本依赖关系抽取方法 | |
CN114116773A (zh) | 一种结构化查询语言sql文本审核方法及装置 | |
CN114510501A (zh) | 一种对接口数据实时处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |