CN112632163A - 大数据报表导出方法及相关设备 - Google Patents

大数据报表导出方法及相关设备 Download PDF

Info

Publication number
CN112632163A
CN112632163A CN202011509980.XA CN202011509980A CN112632163A CN 112632163 A CN112632163 A CN 112632163A CN 202011509980 A CN202011509980 A CN 202011509980A CN 112632163 A CN112632163 A CN 112632163A
Authority
CN
China
Prior art keywords
sub
data
library
report
libraries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011509980.XA
Other languages
English (en)
Other versions
CN112632163B (zh
Inventor
刘耀晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenzhou Digital Cloud Information Technology Co ltd
Shenzhou Kuntai Xiamen Information Technology Co ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202011509980.XA priority Critical patent/CN112632163B/zh
Priority claimed from CN202011509980.XA external-priority patent/CN112632163B/zh
Publication of CN112632163A publication Critical patent/CN112632163A/zh
Application granted granted Critical
Publication of CN112632163B publication Critical patent/CN112632163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution

Abstract

本发明涉及数据处理,提供一种大数据报表导出方法及相关设备。该方法能够将日志写入初始子库中,执行初始子库中的日志,得到准实时子库,从报表导出请求中确定待导出对象,若待导出对象属于大数据量级,获取时间限值,根据时间限值从准实时子库中确定多个目标子库,根据多个目标子库的子库数量将待导出对象划分为多个数据组,获取每个数据组的起始标识及结束标识,依据起始标识及结束标识从多个目标子库中并行读取数据,得到导出数据,获取预设数据表,并将导出数据写入预设数据表中,得到目标报表。本发明能够在避免内存溢出的前提下,快速导出具有大数据量级的目标报表。此外,本发明还涉及区块链技术,所述目标报表可存储于区块链中。

Description

大数据报表导出方法及相关设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种大数据报表导出方法及相关设备。
背景技术
业内常见的报表系统如JasperReports、BIRT、FineReport、JFreeReport、PentahoReporting、Spagobi等,在数据安全、视觉交互、可视化模板、大屏展示等方面具有强大的功能,但是,这些报表系统在导出大数据量级的报表时,会发生堆内存溢出而造成报表系统无法正常响应。
发明内容
鉴于以上内容,有必要提供一种大数据报表导出方法及相关设备,能够在避免内存溢出的前提下,快速导出具有大数据量级的目标报表。
一方面,本发明提出一种大数据报表导出方法,所述大数据报表导出方法包括:
检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
若所述待导出对象属于大数据量级,则从所述报表导出请求中获取时间限值;
根据所述时间限值从所述准实时子库中确定多个目标子库;
根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
根据本发明优选实施例,所述将所述日志写入与所述预设主库对应的初始子库中包括:
获取所述预设主库的主库标识,并获取数据库映射表;
从所述数据库映射表中获取与所述主库标识对应的子库标识;
根据所述子库标识确定所述初始子库,并确定所述初始子库的初始数量;
根据所述初始数量从预设线程池中调用闲置线程,所述闲置线程的线程数量等于所述初始数量;
利用所述闲置线程将所述日志并行写入所述初始子库。
根据本发明优选实施例,所述执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库包括:
解析所述日志,得到所述日志的数据操作;
在所述初始子库上执行所述数据操作,得到所述准实时子库。
根据本发明优选实施例,所述从所述报表导出请求中确定待导出对象,并检测所述待导出对象是否属于大数据量级包括:
解析所述报表导出请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取用于指示对象的信息作为所述待导出对象;
获取所述待导出对象的数据量;
当所述数据量大于或者等于配置值时,确定所述待导出对象属于所述大数据量级。
根据本发明优选实施例,所述根据所述时间限值从所述准实时子库中确定多个目标子库包括:
将所述数据量除以所述时间限值,得到数据处理速率;
确定所述准实时子库的平均处理速率;
将所述数据处理速率除以所述平均处理速率,得到所述子库数量;
从所述准实时子库中筛选出闲置子库,所述闲置子库是指处于空闲状态的准实时子库;
根据所述子库数量从所述闲置子库中确定所述多个目标子库。
根据本发明优选实施例,所述获取与所述报表导出请求对应的预设数据表包括:
确定所述报表导出请求的触发用户,并确定所述触发用户的触发角色;
获取所述触发角色的识别码,并从配置表中获取与所述识别码对应的表号;
获取与所述表号对应的数据表作为所述预设数据表。
根据本发明优选实施例,所述将所述导出数据写入所述预设数据表中,得到目标报表包括:
确定所述导出数据在所述预设主库中的位置;
根据所述位置依次将所述导出数据写入所述预设数据表中,得到所述目标报表。
另一方面,本发明还提出一种大数据报表导出装置,所述大数据报表导出装置包括:
执行单元,用于检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
判断单元,用于接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
获取单元,用于若所述待导出对象属于所述大数据量级,则从所述报表导出请求中获取时间限值;
确定单元,用于根据所述时间限值从所述准实时子库中确定多个目标子库;
所述获取单元,还用于根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
读取单元,用于依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
写入单元,用于获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述大数据报表导出方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述大数据报表导出方法。
由以上技术方案可以看出,本发明通过将所述日志实时写入所述初始子库中,能够确保所述准实时子库能够达到准实时级别的数据同步,从而确保后续在导出数据时,能够直接从所述准实时子库中导出,从而缓解所述预设主库的压力,在确定出所述报表导出请求中的待导出对象为大数据量级时,根据所述时间限值从所述准实时子库中选取所述多个目标子库,由于所述多个目标子库的子库数量是根据所述时间限值确定的,因此,能够确保在导出时间满足所述时间限值的前提下,控制目标子库的执行,从而避免过多目标子库并行处理进而造成内存溢出,通过与所述报表导出请求对应的预设数据表,能够生成符合用户需求的目标报表。本发明能够在避免内存溢出的前提下,快速导出具有大数据量级的目标报表。
附图说明
图1是本发明大数据报表导出方法的较佳实施例的流程图。
图2是本发明将日志写入初始子库的一实施例的流程图。
图3是本发明确定多个目标子库的一实施例的流程图。
图4是本发明获取预设数据表的一实施例的流程图。
图5是本发明大数据报表导出装置的较佳实施例的功能模块图。
图6是本发明实现大数据报表导出方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明大数据报表导出方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述大数据报表导出方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库。
在本发明的至少一个实施例中,若所述预设主库上有数据发生变化,在所述预设主库上触发生成所述日志。
在本发明的至少一个实施例中,所述预设主库可以指任意数据库,所述初始子库可以指与所述预设主库存在映射关系的所有子库,所述初始子库的数量有多个。
参见图2,图2是本发明将日志写入初始子库的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备将所述日志写入与所述预设主库对应的初始子库中包括:
S100,获取所述预设主库的主库标识,并获取数据库映射表。
所述主库标识用于唯一标识所述预设主库。
所述数据库映射表中存储多个主库的标识与其对应的子库的标识。
S101,从所述数据库映射表中获取与所述主库标识对应的子库标识。
S102,根据所述子库标识确定所述初始子库,并确定所述初始子库的初始数量。
S103,根据所述初始数量从预设线程池中调用闲置线程,所述闲置线程的线程数量等于所述初始数量。
所述预设线程池中存储多个处于空闲状态的线程。
S104,利用所述闲置线程将所述日志并行写入所述初始子库。
通过上述实施方式,能够在检测到所述预设主库上发生数据变化时,将所述日志及时并行写入所述初始子库中,确保所述初始子库与所述预设主库达到准实时级别的数据同步。
在本发明的至少一个实施例中,所述准实时子库是指与所述预设主库存在数据准实时同步的初始子库。所述准实时子库也可以有多个。
在本发明的至少一个实施例中,所述电子设备执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库包括:
解析所述日志,得到所述日志的数据操作;
在所述初始子库上执行所述数据操作,得到所述准实时子库。
由于所述日志上记载了所述预设主库上的数据的变化,因此,通过上述实施方式,能够使所述准实时子库中的数据与所述预设主库的数据保持一致。
S11,接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级。
在本发明的至少一个实施例中,所述报表导出请求可以在用户触发查询操作后生成的请求。
进一步地,所述待导出对象可以是查询对象,例如,所述待导出对象可以是销售A产品的数据。
更进一步地,所述大数据量级是一个相对概念,用于指示数据量庞大。
在本发明的至少一个实施例中,所述电子设备从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级包括:
解析所述报表导出请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取用于指示对象的信息作为所述待导出对象;
获取所述待导出对象的数据量;
若所述数据量大于或者等于配置值,确定所述待导出对象属于所述大数据量级。
其中,所述配置值可以根据所述电子设备的性能设置,例如,所述配置值可以是1000000。
通过上述实施方式,由于无需解析整个所述报表导出请求,因此能够快速从所述数据信息中获取到所述待导出对象,进而通过所述待导出对象的数据量能够快速确定出所述待导出对象是否属于所述大数据量级。
S12,若所述待导出对象属于所述大数据量级,则从所述报表导出请求中获取时间限值。
在本发明的至少一个实施例中,所述时间限值是指触发用户对所述待导出对象的导出时间需求。
在本发明的至少一个实施例中,所述电子设备从所述报表导出请求中获取时间限值包括:
从所述数据信息中获取用于指示时间的信息作为所述时间限值。
通过上述实施方式,由于无需重复解析所述报表导出请求,因此能够快速从所述报表导出请求中获取到所述时间限值。
S13,根据所述时间限值从所述准实时子库中确定多个目标子库。
在本发明的至少一个实施例中,所述多个目标子库是指没有进行任何数据操作的准实时子库,所述多个目标子库的状态是空闲的。
参见图3,图3是本发明确定多个目标子库的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备根据所述时间限值从所述准实时子库中确定多个目标子库包括:
S130,将所述数据量除以所述时间限值,得到数据处理速率。
S131,确定所述准实时子库的平均处理速率。
S132,将所述数据处理速率除以所述平均处理速率,得到所述子库数量。
S133,从所述准实时子库中筛选出闲置子库,所述闲置子库是指处于空闲状态的准实时子库。
S134,根据所述子库数量从所述闲置子库中确定所述多个目标子库。
通过上述实施方式,不仅能够从所述准实时子库中筛选出处于空闲状态的所述多个目标子库,还能够从所述准实时子库中确定出合适的所述子库数量,从而避免过多目标子库并行处理数据而造成内存溢出。
S14,根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识。
在本发明的至少一个实施例中,所述多个数据组的数量与所述子库数量相同。
进一步地,所述起始标识是指每个数据组中起始行的标识,所述结束标识是指每个数据组中结束行的标识。
在本发明的至少一个实施例中,所述电子设备根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组包括:
将所述数据量除以所述子库数量,得到目标数量;
按照所述目标数量对所述待导出对象进行划分,得到所述多个数据组。
例如,所述数据量为1000000,所述子库数量为10,经计算,得到所述目标数量为100000,进而能够得到10个数据组。
通过对所述待导出对象进行划分,能够使每个数据组中数据的数量减少,相对于所述待导出对象而言,导出数据所占用的存储资源和处理资源都会大幅度减少,进而提高导出效率。
在本发明的至少一个实施例中,所述电子设备获取每个数据组的起始标识及结束标识包括:
确定每个数据组的起始行,并确定每个数据组的结束行;
获取所述起始行上的标识作为所述起始标识,并获取所述结束行上的标识作为所述结束标识。
通过上述实施方式,能够快速获取到每个数据组的所述起始标识及所述结束标识。
S15,依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据。
在本发明的至少一个实施例中,所述导出数据是指从所述多个目标子库中读取到的数据。
在本发明的至少一个实施例中,所述电子设备依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据包括:
从所述起始标识依次并行读取所述多个目标子库,直至读取至与所述结束标识对应的数据,得到所述导出数据。
通过上述实施方式,由于从所述多个目标子库中并行读取数据,因此能够快速获取到所述导出数据。
S16,获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
需要强调的是,为进一步保证上述目标报表的私密和安全性,上述目标报表还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述目标报表可以是EXCEL文件格式,也可以是CSV文件格式,本发明对所述目标报表的文件格式不作限制。
参见图4,图4是本发明获取预设数据表的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备获取与所述报表导出请求对应的预设数据表包括:
S160,确定所述报表导出请求的触发用户,并确定所述触发用户的触发角色。
所述触发用户可以是负责数据导出的用户,所述触发角色可以是指所述触发用户的职务。
S161,获取所述触发角色的识别码,并从配置表中获取与所述识别码对应的表号。
所述识别码用于指示所述触发角色。
所述配置表中存储识别码与表号的映射关系。
由于不同角色的用户所需的数据表的形式有所不同,因此,通过所述识别码能够准确确定出所述触发角色所需的数据表。
S162,获取与所述表号对应的数据表作为所述预设数据表。
通过上述实施方式,能够获取到符合用户需求的所述预设数据表,进而能够生成符合用户需求的所述目标报表。
在本发明的至少一个实施例中,所述电子设备将所述导出数据写入所述预设数据表中,得到目标报表包括:
确定所述导出数据在所述预设主库中的位置;
根据所述位置依次将所述导出数据写入所述预设数据表中,得到所述目标报表。
通过上述实施方式,能够确保生成的所述目标报表中的数据顺序与所述预设主库中的数据顺序相同。
由以上技术方案可以看出,本发明通过将所述日志实时写入所述初始子库中,能够确保所述准实时子库能够达到准实时级别的数据同步,从而确保后续在导出数据时,能够直接从所述准实时子库中导出,从而缓解所述预设主库的压力,在确定出所述报表导出请求中的待导出对象为大数据量级时,根据所述时间限值从所述准实时子库中选取所述多个目标子库,由于所述多个目标子库的子库数量是根据所述时间限值确定的,因此,能够确保在导出时间满足所述时间限值的前提下,控制目标子库的执行,从而避免过多目标子库并行处理进而造成内存溢出,通过与所述报表导出请求对应的预设数据表,能够生成符合用户需求的目标报表。本发明能够在避免内存溢出的前提下,快速导出具有大数据量级的目标报表。
如图5所示,是本发明大数据报表导出装置的较佳实施例的功能模块图。所述大数据报表导出装置11包括写入单元110、执行单元111、判断单元112、获取单元113、确定单元114及读取单元115。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
执行单元111检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库。
在本发明的至少一个实施例中,若检测到所述预设主库上有数据发生变化,在所述预设主库上触发生成所述日志。
在本发明的至少一个实施例中,所述预设主库可以指任意数据库,所述初始子库可以指与所述预设主库存在映射关系的所有子库,所述初始子库的数量有多个。
在本发明的至少一个实施例中,所述执行单元111将所述日志写入与所述预设主库对应的初始子库中包括:
获取所述预设主库的主库标识,并获取数据库映射表。
所述主库标识用于唯一标识所述预设主库。
所述数据库映射表中存储多个主库的标识与其对应的子库的标识。
从所述数据库映射表中获取与所述主库标识对应的子库标识。
根据所述子库标识确定所述初始子库,并确定所述初始子库的初始数量。
根据所述初始数量从预设线程池中调用闲置线程,所述闲置线程的线程数量等于所述初始数量。
所述预设线程池中存储多个处于空闲状态的线程。
利用所述闲置线程将所述日志并行写入所述初始子库。
通过上述实施方式,能够在检测到所述预设主库上发生数据变化时,将所述日志及时并行写入所述初始子库中,确保所述初始子库与所述预设主库达到准实时级别的数据同步。
在本发明的至少一个实施例中,所述准实时子库是指与所述预设主库存在数据准实时同步的初始子库。所述准实时子库也可以有多个。
在本发明的至少一个实施例中,所述执行单元111执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库包括:
解析所述日志,得到所述日志的数据操作;
在所述初始子库上执行所述数据操作,得到所述准实时子库。
由于所述日志上记载了所述预设主库上的数据的变化,因此,通过上述实施方式,能够使所述准实时子库中的数据与所述预设主库的数据保持一致。
判断单元112接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级。
在本发明的至少一个实施例中,所述报表导出请求可以在用户触发查询操作后生成的请求。
进一步地,所述待导出对象可以是查询对象,例如,所述待导出对象可以是销售A产品的数据。
更进一步地,所述大数据量级是一个相对概念,用于指示数据量庞大。
在本发明的至少一个实施例中,所述判断单元112从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级包括:
解析所述报表导出请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取用于指示对象的信息作为所述待导出对象;
获取所述待导出对象的数据量;
若所述数据量大于或者等于配置值,确定所述待导出对象属于所述大数据量级。
其中,所述配置值可以根据电子设备的性能设置,例如,所述配置值可以是1000000。
通过上述实施方式,由于无需解析整个所述报表导出请求,因此能够快速从所述数据信息中获取到所述待导出对象,进而通过所述待导出对象的数据量能够快速确定出所述待导出对象是否属于所述大数据量级。
若所述待导出对象属于所述大数据量级,获取单元113则从所述报表导出请求中获取时间限值。
在本发明的至少一个实施例中,所述时间限值是指触发用户对所述待导出对象的导出时间需求。
在本发明的至少一个实施例中,所述获取单元113从所述报表导出请求中获取时间限值包括:
从所述数据信息中获取用于指示时间的信息作为所述时间限值。
通过上述实施方式,由于无需重复解析所述报表导出请求,因此能够快速从所述报表导出请求中获取到所述时间限值。
确定单元114根据所述时间限值从所述准实时子库中确定多个目标子库。
在本发明的至少一个实施例中,所述多个目标子库是指没有进行任何数据操作的准实时子库,所述多个目标子库的状态是空闲的。
在本发明的至少一个实施例中,所述确定单元114根据所述时间限值从所述准实时子库中确定多个目标子库包括:
将所述数据量除以所述时间限值,得到数据处理速率。
确定所述准实时子库的平均处理速率。
将所述数据处理速率除以所述平均处理速率,得到所述子库数量。
从所述准实时子库中筛选出闲置子库,所述闲置子库是指处于空闲状态的准实时子库。
所述确定单元114根据所述子库数量从所述闲置子库中确定所述多个目标子库。
通过上述实施方式,不仅能够从所述准实时子库中筛选出处于空闲状态的所述多个目标子库,还能够从所述准实时子库中确定出合适的所述子库数量,从而避免过多目标子库并行处理数据而造成内存溢出。
所述获取单元113根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识。
在本发明的至少一个实施例中,所述多个数据组的数量与所述子库数量相同。
进一步地,所述起始标识是指每个数据组中起始行的标识,所述结束标识是指每个数据组中结束行的标识。
在本发明的至少一个实施例中,所述获取单元113根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组包括:
将所述数据量除以所述子库数量,得到目标数量;
按照所述目标数量对所述待导出对象进行划分,得到所述多个数据组。
例如,所述数据量为1000000,所述子库数量为10,经计算,得到所述目标数量为100000,进而能够得到10个数据组。
通过对所述待导出对象进行划分,能够使每个数据组中数据的数量减少,相对于所述待导出对象而言,导出数据所占用的存储资源和处理资源都会大幅度减少,进而提高导出效率。
在本发明的至少一个实施例中,所述获取单元113获取每个数据组的起始标识及结束标识包括:
确定每个数据组的起始行,并确定每个数据组的结束行;
获取所述起始行上的标识作为所述起始标识,并获取所述结束行上的标识作为所述结束标识。
通过上述实施方式,能够快速获取到每个数据组的所述起始标识及所述结束标识。
读取单元115依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据。
在本发明的至少一个实施例中,所述导出数据是指从所述多个目标子库中读取到的数据。
在本发明的至少一个实施例中,所述读取单元115依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据包括:
从所述起始标识依次并行读取所述多个目标子库,直至读取至与所述结束标识对应的数据,得到所述导出数据。
通过上述实施方式,由于从所述多个目标子库中并行读取数据,因此能够快速获取到所述导出数据。
写入单元110获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
需要强调的是,为进一步保证上述目标报表的私密和安全性,上述目标报表还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述目标报表可以是EXCEL文件格式,也可以是CSV文件格式,本发明对所述目标报表的文件格式不作限制。
在本发明的至少一个实施例中,所述写入单元110获取与所述报表导出请求对应的预设数据表包括:
确定所述报表导出请求的触发用户,并确定所述触发用户的触发角色。
所述触发用户可以是负责数据导出的用户,所述触发角色可以是指所述触发用户的职务。
获取所述触发角色的识别码,并从配置表中获取与所述识别码对应的表号。
所述识别码用于指示所述触发角色。
所述配置表中存储识别码与表号的映射关系。
由于不同角色的用户所需的数据表的形式有所不同,因此,通过所述识别码能够准确确定出所述触发角色所需的数据表。
获取与所述表号对应的数据表作为所述预设数据表。
通过上述实施方式,能够获取到符合用户需求的所述预设数据表,进而能够生成符合用户需求的所述目标报表。
在本发明的至少一个实施例中,所述写入单元110将所述导出数据写入所述预设数据表中,得到目标报表包括:
确定所述导出数据在所述预设主库中的位置;
根据所述位置依次将所述导出数据写入所述预设数据表中,得到所述目标报表。
通过上述实施方式,能够确保生成的所述目标报表中的数据顺序与所述预设主库中的数据顺序相同。
由以上技术方案可以看出,本发明通过将所述日志实时写入所述初始子库中,能够确保所述准实时子库能够达到准实时级别的数据同步,从而确保后续在导出数据时,能够直接从所述准实时子库中导出,从而缓解所述预设主库的压力,在确定出所述报表导出请求中的待导出对象为大数据量级时,根据所述时间限值从所述准实时子库中选取所述多个目标子库,由于所述多个目标子库的子库数量是根据所述时间限值确定的,因此,能够确保在导出时间满足所述时间限值的前提下,控制目标子库的执行,从而避免过多目标子库并行处理进而造成内存溢出,通过与所述报表导出请求对应的预设数据表,能够生成符合用户需求的目标报表。本发明能够在避免内存溢出的前提下,快速导出具有大数据量级的目标报表。
如图6所示,是本发明实现大数据报表导出方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如大数据报表导出程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成写入单元110、执行单元111、判断单元112、获取单元113、确定单元114及读取单元115。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种大数据报表导出方法,所述处理器13可执行所述计算机可读指令从而实现:
检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
若所述待导出对象属于大数据量级,则从所述报表导出请求中获取时间限值;
根据所述时间限值从所述准实时子库中确定多个目标子库;
根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
若所述待导出对象属于大数据量级,则从所述报表导出请求中获取时间限值;
根据所述时间限值从所述准实时子库中确定多个目标子库;
根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种大数据报表导出方法,其特征在于,所述大数据报表导出方法包括:
检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
若所述待导出对象属于大数据量级,则从所述报表导出请求中获取时间限值;
根据所述时间限值从所述准实时子库中确定多个目标子库;
根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
2.如权利要求1所述的大数据报表导出方法,其特征在于,所述将所述日志写入与所述预设主库对应的初始子库中包括:
获取所述预设主库的主库标识,并获取数据库映射表;
从所述数据库映射表中获取与所述主库标识对应的子库标识;
根据所述子库标识确定所述初始子库,并确定所述初始子库的初始数量;
根据所述初始数量从预设线程池中调用闲置线程,所述闲置线程的线程数量等于所述初始数量;
利用所述闲置线程将所述日志并行写入所述初始子库。
3.如权利要求1所述的大数据报表导出方法,其特征在于,所述执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库包括:
解析所述日志,得到所述日志的数据操作;
在所述初始子库上执行所述数据操作,得到所述准实时子库。
4.如权利要求1所述的大数据报表导出方法,其特征在于,所述从所述报表导出请求中确定待导出对象,并检测所述待导出对象是否属于大数据量级包括:
解析所述报表导出请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取用于指示对象的信息作为所述待导出对象;
获取所述待导出对象的数据量;
当所述数据量大于或者等于配置值时,确定所述待导出对象属于所述大数据量级。
5.如权利要求4所述的大数据报表导出方法,其特征在于,所述根据所述时间限值从所述准实时子库中确定多个目标子库包括:
将所述数据量除以所述时间限值,得到数据处理速率;
确定所述准实时子库的平均处理速率;
将所述数据处理速率除以所述平均处理速率,得到所述子库数量;
从所述准实时子库中筛选出闲置子库,所述闲置子库是指处于空闲状态的准实时子库;
根据所述子库数量从所述闲置子库中确定所述多个目标子库。
6.如权利要求1所述的大数据报表导出方法,其特征在于,所述获取与所述报表导出请求对应的预设数据表包括:
确定所述报表导出请求的触发用户,并确定所述触发用户的触发角色;
获取所述触发角色的识别码,并从配置表中获取与所述识别码对应的表号;
获取与所述表号对应的数据表作为所述预设数据表。
7.如权利要求1所述的大数据报表导出方法,其特征在于,所述将所述导出数据写入所述预设数据表中,得到目标报表包括:
确定所述导出数据在所述预设主库中的位置;
根据所述位置依次将所述导出数据写入所述预设数据表中,得到所述目标报表。
8.一种大数据报表导出装置,其特征在于,所述大数据报表导出装置包括:
执行单元,用于检测预设主库中是否有日志生成,若是,则将生成的所述日志写入与所述预设主库对应的初始子库中,执行所述初始子库中的所述日志,得到与所述初始子库对应的准实时子库;
判断单元,用于接收报表导出请求,从所述报表导出请求中确定待导出对象,并判断所述待导出对象是否属于大数据量级;
获取单元,用于若所述待导出对象属于所述大数据量级,则从所述报表导出请求中获取时间限值;
确定单元,用于根据所述时间限值从所述准实时子库中确定多个目标子库;
所述获取单元,还用于根据所述多个目标子库的子库数量将所述待导出对象划分为多个数据组,并获取每个数据组的起始标识及结束标识;
读取单元,用于依据所述起始标识及所述结束标识从所述多个目标子库中并行读取数据,得到导出数据;
写入单元,用于获取与所述报表导出请求对应的预设数据表,并将所述导出数据写入所述预设数据表中,得到目标报表。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的大数据报表导出方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的大数据报表导出方法。
CN202011509980.XA 2020-12-18 大数据报表导出方法及相关设备 Active CN112632163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011509980.XA CN112632163B (zh) 2020-12-18 大数据报表导出方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011509980.XA CN112632163B (zh) 2020-12-18 大数据报表导出方法及相关设备

Publications (2)

Publication Number Publication Date
CN112632163A true CN112632163A (zh) 2021-04-09
CN112632163B CN112632163B (zh) 2024-05-17

Family

ID=

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722388A (zh) * 2021-08-24 2021-11-30 咪咕音乐有限公司 数据导出方法、设备、存储介质及装置
CN117085336A (zh) * 2023-07-21 2023-11-21 广州盈风网络科技有限公司 游戏运营数据导出方法、装置、设备及存储介质
CN117085336B (zh) * 2023-07-21 2024-05-17 广州盈风网络科技有限公司 游戏运营数据导出方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090228485A1 (en) * 2008-03-07 2009-09-10 Microsoft Corporation Navigation across datasets from multiple data sources based on a common reference dimension
CN108121507A (zh) * 2017-12-06 2018-06-05 北京奇艺世纪科技有限公司 一种数据处理方法、装置以及电子设备
CN109977153A (zh) * 2017-12-27 2019-07-05 航天信息股份有限公司 一种表格大数据导出方法
CN111428458A (zh) * 2020-03-03 2020-07-17 中国平安人寿保险股份有限公司 通用报表生成方法、装置及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090228485A1 (en) * 2008-03-07 2009-09-10 Microsoft Corporation Navigation across datasets from multiple data sources based on a common reference dimension
CN108121507A (zh) * 2017-12-06 2018-06-05 北京奇艺世纪科技有限公司 一种数据处理方法、装置以及电子设备
CN109977153A (zh) * 2017-12-27 2019-07-05 航天信息股份有限公司 一种表格大数据导出方法
CN111428458A (zh) * 2020-03-03 2020-07-17 中国平安人寿保险股份有限公司 通用报表生成方法、装置及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722388A (zh) * 2021-08-24 2021-11-30 咪咕音乐有限公司 数据导出方法、设备、存储介质及装置
CN117085336A (zh) * 2023-07-21 2023-11-21 广州盈风网络科技有限公司 游戏运营数据导出方法、装置、设备及存储介质
CN117085336B (zh) * 2023-07-21 2024-05-17 广州盈风网络科技有限公司 游戏运营数据导出方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111881210B (zh) 数据同步方法、装置、内网服务器及介质
CN111797351A (zh) 页面数据管理方法、装置、电子设备及介质
CN109445691B (zh) 一种提高ftl算法开发和验证效率的方法及装置
CN110825731A (zh) 数据存储方法、装置、电子设备及存储介质
CN112506486A (zh) 搜索系统建立方法、装置、电子设备及可读存储介质
CN112416583A (zh) 高频请求处理方法、装置、电子设备及存储介质
CN112835528A (zh) 脏页刷新方法和装置、电子设备和存储介质
CN115470156A (zh) 基于rdma的内存使用方法、系统、电子设备和存储介质
CN112819305A (zh) 业务指标分析方法、装置、设备及存储介质
CN112947911A (zh) 接口脚本生成方法、装置、设备及存储介质
CN112527280A (zh) 界面展示方法、装置、服务器及可读存储介质
CN116089535A (zh) 数据同步方法、装置、设备及存储介质
CN112632163B (zh) 大数据报表导出方法及相关设备
CN112632163A (zh) 大数据报表导出方法及相关设备
CN111522827A (zh) 一种数据更新方法、装置和电子设备
CN112817742B (zh) 数据迁移方法、装置、设备及存储介质
CN112632098A (zh) 结构化查询语句动态生成方法及相关设备
CN115794621A (zh) 代码覆盖测试方法、装置、设备及存储介质
CN114238296A (zh) 产品指标数据展示方法、装置、设备及存储介质
CN114942749A (zh) 审批系统开发方法、装置、设备及存储介质
CN112434237A (zh) 页面加载方法、装置、电子设备及存储介质
CN114329095A (zh) 系统逻辑图生成方法、装置、设备及存储介质
CN113254455A (zh) 数据库的动态配置方法、装置、计算机设备及存储介质
CN113886263A (zh) 系统测试方法、装置、设备及存储介质
CN113535087A (zh) 数据迁移过程中的数据处理方法、服务器及存储系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240422

Address after: Room 301, 3rd floor, 9 shangdijiu street, Haidian District, Beijing

Applicant after: Beijing Shenzhou Digital Cloud Information Technology Co.,Ltd.

Country or region after: China

Applicant after: Shenzhou Kuntai (Xiamen) Information Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: PING AN PUHUI ENTERPRISE MANAGEMENT Co.,Ltd.

Country or region before: China

GR01 Patent grant