CN109933769A - 一种基于Excel的报表数据快速解析方法 - Google Patents
一种基于Excel的报表数据快速解析方法 Download PDFInfo
- Publication number
- CN109933769A CN109933769A CN201910208356.7A CN201910208356A CN109933769A CN 109933769 A CN109933769 A CN 109933769A CN 201910208356 A CN201910208356 A CN 201910208356A CN 109933769 A CN109933769 A CN 109933769A
- Authority
- CN
- China
- Prior art keywords
- data
- excel
- report
- format
- data item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000008676 import Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 4
- 230000003993 interaction Effects 0.000 abstract description 2
- 238000013523 data management Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明特别涉及一种基于Excel的报表数据快速解析方法。该基于Excel的报表数据快速解析方法,为了实现后续的正确解析,首先定义需要解析Excel工作簿的格式标准;然后对Excel工作簿中不同Sheet工作表中的格式进行快速提取,获取标准化数据;最后基于获取的标准化数据,快速解析存储到需要中间类中,方便快速存储到数据库。该基于Excel的报表数据快速解析方法,可以快速读取Excel工作簿的报表相关格式并按照一定规则快读解析,提取需要的报表数据,存储到相关类中;进而实现了报表快速从外部Excel工作簿中读取格式和数据,实现了报表格式的快速创建和数据的快速读入,增强了报表和外部数据的交互,增强了用户体验。
Description
技术领域
本发明涉及数据分析技术领域,特别涉及一种基于Excel的报表数据快速解析方法。
背景技术
数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。实现数据有效管理的关键是数据组织。
随着计算机技术的发展,数据管理经历了人工管理、文件系统、数据库系统三个发展阶段。
在数据库系统中所建立的数据结构,更充分地描述了数据间的内在联系,便于数据修改、更新与扩充,同时保证了数据的独立性、可靠性、安全性与完整性,减少了数据冗余,故提高了数据共享程度及数据管理效率。利用数据优化,可以为公司节约成本,获得更大的收入。
在传统方式中,表格格式或数据是基于报表系统操作。一张报表的创建需要涉及多个功能配合,并且格式上很多信息不能直观体现。用户若是新建、更新系统报表必须熟悉报表系统,同时受限于网络或者其他因素。而且报表格式复杂,比较耗时的步骤保存时可能出现数据部分丢失的情况,从而导致整个操作失效。
在这种情况下,在无网络环境下实现操作报表格式和数据,快速导入报表系统成为必不可少的功能。基于此,如何快速导入成为关注的重点。本发明提出了一种基于Excel的报表数据快速解析方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于Excel的报表数据快速解析方法。
本发明是通过如下技术方案实现的:
一种基于Excel的报表数据快速解析方法,其特征在于,包括以下步骤:
(A)为了实现后续的正确解析,定义需要解析Excel工作簿的格式标准;
(B)对Excel工作簿中不同Sheet工作表中的格式进行快速提取,获取标准化数据;
(C)基于获取的标准化数据,快速解析存储到需要中间类中,方便快速存储到数据库。
所述步骤(A)中,Excel工作簿的格式标准可以从系统中导入或者由用户创建,基本格式是在同一个Excel工作簿中含有多个Sheet工作表;必须存在的Sheet工作表为报表格式的工作表,如果在导入报表格式的同时需要形成报表系统中独有的数据项信息,则需要增加数据项的工作表;所述增加数据项的工作表基于表格格式工作表形成,需要增加对应数据项单元格的数据项编号。
所述数据项单元格的编号唯一,若在sheet工作表中存在重复,读取格式时会按照规则自动完善数据项编号。
导入数据时,基于表样和数据项新增一个以表样为模板的sheet工作表,在该sheet工作表对应的数据项位置填写数据;如果需要新增公式或者其他信息,同样新增一个以表样为模板的sheet工作表,在对应的数据项的位置填写需要的信息。
所述步骤(A)中,Excel工作簿的格式标准包括定义报表格式样式,基于格式样式的数据项信息,基于数据项信息的数据信息,基于数据项信息的公式信息和基于数据项信息的指标信息五个方面。
所述数据项信息是报表中的独有含义,是能够填写数据的单元格中公式,指标或数据信息的基础。
所述数据项信息包含数据项编号,数据项名称,数据项的行次列次,数据类型,是否千分位,是否小数位数,是否百分号,是否科学计数法和是否存储帮助。
所述步骤(B)中,当Excel工作簿的格式符合既定标准时,使用SpreadsheetGear.dll中的方法提取当前工作簿的多个Sheet工作表。
使用多线程方式同步提取多个Sheet工作表中的数据,然后根据Sheet工作表的含义,把提取的工作表数据存储到对应的类中,等待当前工作表的所有数据提取完成后,对数据进行整合。
本发明的有益效果是:该基于Excel的报表数据快速解析方法,可以快速读取Excel工作簿的报表相关格式并按照一定规则快读解析,提取需要的报表数据,存储到相关类中;进而实现了报表快速从外部Excel工作簿中读取格式和数据,实现了报表格式的快速创建和数据的快速读入,增强了报表和外部数据的交互,增强了用户体验。
附图说明
附图1为本发明基于Excel的报表数据快速解析方法示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
该基于Excel的报表数据快速解析方法,根据报表格式产生一个Excel工作簿模板,可在这个模板上修改格式或者数据,这个模板可在无网络情况下调整。调整完成使用报表系统的格式导入或数据导入可对应导入格式和数据,实际避免无网络无法操作报表系统,也可实际避免或减少由于数据丢失带来的不便,增加报表系统的使用场景,提高用户体验。
具体包括以下步骤:
(A)为了实现后续的正确解析,定义需要解析Excel工作簿的格式标准;
(B)对Excel工作簿中不同Sheet工作表中的格式进行快速提取,获取标准化数据;
(C)基于获取的标准化数据,快速解析存储到需要中间类中,方便快速存储到数据库。
为使用报表数据的快速导入,Excel的格式需要尽可能的贴近标准格式。所述步骤(A)中,Excel工作簿的格式标准可以从系统中导入或者由用户创建,基本格式是在同一个Excel工作簿中含有多个Sheet工作表;必须存在的Sheet工作表为报表格式的工作表,该工作表包含表格的样式(行数列数、每一行的行高列、单元格字体居中方式、单元格是否合并、底色变化等)。
如果在导入报表格式的同时需要形成报表系统中独有的数据项信息,则需要增加数据项的工作表;所述增加数据项的工作表基于表格格式工作表形成,需要增加对应数据项单元格的数据项编号。
所述数据项单元格的编号唯一,若在sheet工作表中存在重复,读取格式时会按照规则自动完善数据项编号。
导入数据时,基于表样和数据项新增一个以表样为模板的sheet工作表,在该sheet工作表对应的数据项位置填写数据;如果需要新增公式或者其他信息,同样新增一个以表样为模板的sheet工作表,在对应的数据项的位置填写需要的信息。
所述步骤(A)中,Excel工作簿的格式标准包括定义报表格式样式,基于格式样式的数据项信息,基于数据项信息的数据信息,基于数据项信息的公式信息和基于数据项信息的指标信息五个方面。
所述数据项信息是报表中的独有含义,是能够填写数据的单元格中公式,指标或数据信息的基础。
所述数据项信息包含数据项编号,数据项名称,数据项的行次列次,数据类型,是否千分位,是否小数位数,是否百分号,是否科学计数法和是否存储帮助。
具体校验表格是否符合标准格式的代码如下:
所述步骤(B)中,当Excel工作簿的格式符合既定标准时,使用SpreadsheetGear.dll中的方法提取当前工作簿的多个Sheet工作表。
使用多线程方式同步提取多个Sheet工作表中的数据,然后根据Sheet工作表的含义,把提取的工作表数据存储到对应的类中,等待当前工作表的所有数据提取完成后,对数据进行整合。
部分处理通过Excel解析数据的核心代码如下:
所述步骤(C)中,读取整合后的数据,使用批量操作的方式同时存储数据到数据库,保证格式和数据的快速写入。
下面以把一个Excel中已经创建好的“资产负债表”格式导入到报表系统中未实施例进行说明。
1.检查Excel格式是否正确
经验证查看,发现报表格式存在表样工作表,同时存在编号、名称、格式等工作表,表明这是一个导入格式的工作簿。
2.使用报表系统中格式导入功能
创建一个初始化表,报表编号为YB01,初始化表无任何格式信息,打开初始化表,选择Excel导入功能,选中已经完善格式的工作簿,点击确定。
3.系统解析工作簿
点击确定后系统解析判断这个工作簿符合需要解析的最低要求(只存在表样),开始解析,此时使用SpreadsheetGear.dll中的方法读取每一个工作表,并为每一个工作表创建一个对应的类。使用多线程同时读取每个工作表中的数据,读取完成后进行组合到一个完整类中。
4.保存到数据库
点击界面保存按钮,完整类将快速保存到数据库中并反馈是否保存成功。
Claims (9)
1.一种基于Excel的报表数据快速解析方法,其特征在于,包括以下步骤:
(A)为了实现后续的正确解析,定义需要解析Excel工作簿的格式标准;
(B)对Excel工作簿中不同Sheet工作表中的格式进行快速提取,获取标准化数据;
(C)基于获取的标准化数据,快速解析存储到需要中间类中,方便快速存储到数据库。
2.根据权利要求1所述的基于Excel的报表数据快速解析方法,其特征在于:所述步骤(A)中,Excel工作簿的格式标准可以从系统中导入或者由用户创建,基本格式是在同一个Excel工作簿中含有多个Sheet工作表;必须存在的Sheet工作表为报表格式的工作表,如果在导入报表格式的同时需要形成报表系统中独有的数据项信息,则需要增加数据项的工作表;所述增加数据项的工作表基于表格格式工作表形成,需要增加对应数据项单元格的数据项编号。
3.根据权利要求2所述的基于Excel的报表数据快速解析方法,其特征在于:所述数据项单元格的编号唯一,若在sheet工作表中存在重复,读取格式时会按照规则自动完善数据项编号。
4.根据权利要求2或3所述的基于Excel的报表数据快速解析方法,其特征在于:导入数据时,基于表样和数据项新增一个以表样为模板的sheet工作表,在该sheet工作表对应的数据项位置填写数据;如果需要新增公式或者其他信息,同样新增一个以表样为模板的sheet工作表,在对应的数据项的位置填写需要的信息。
5.根据权利要求4所述的基于Excel的报表数据快速解析方法,其特征在于:所述步骤(A)中,Excel工作簿的格式标准包括定义报表格式样式,基于格式样式的数据项信息,基于数据项信息的数据信息,基于数据项信息的公式信息和基于数据项信息的指标信息五个方面。
6.根据权利要求5所述的基于Excel的报表数据快速解析方法,其特征在于:所述数据项信息是报表中的独有含义,是能够填写数据的单元格中公式,指标或数据信息的基础。
7.根据权利要求6所述的基于Excel的报表数据快速解析方法,其特征在于:所述数据项信息包含数据项编号,数据项名称,数据项的行次列次,数据类型,是否千分位,是否小数位数,是否百分号,是否科学计数法和是否存储帮助。
8.根据权利要求1所述的基于Excel的报表数据快速解析方法,其特征在于:所述步骤(B)中,当Excel工作簿的格式符合既定标准时,使用SpreadsheetGear.dll中的方法提取当前工作簿的多个Sheet工作表。
9.根据权利要求8所述的基于Excel的报表数据快速解析方法,其特征在于:使用多线程方式同步提取多个Sheet工作表中的数据,然后根据Sheet工作表的含义,把提取的工作表数据存储到对应的类中,等待当前工作表的所有数据提取完成后,对数据进行整合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910208356.7A CN109933769A (zh) | 2019-03-19 | 2019-03-19 | 一种基于Excel的报表数据快速解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910208356.7A CN109933769A (zh) | 2019-03-19 | 2019-03-19 | 一种基于Excel的报表数据快速解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109933769A true CN109933769A (zh) | 2019-06-25 |
Family
ID=66987663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910208356.7A Pending CN109933769A (zh) | 2019-03-19 | 2019-03-19 | 一种基于Excel的报表数据快速解析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933769A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898351A (zh) * | 2020-08-03 | 2020-11-06 | 上海嗨酷强供应链信息技术有限公司 | 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质 |
CN112256919A (zh) * | 2020-10-30 | 2021-01-22 | 南京哈勃信息科技有限公司 | 一种基于xlsx解析和浏览器多线程技术的xlsx解析系统及方法 |
CN112988870A (zh) * | 2021-03-19 | 2021-06-18 | 浪潮云信息技术股份公司 | 一种读取excel文件的实现方法及工具 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060224395A1 (en) * | 2003-05-16 | 2006-10-05 | Isao Miyadai | Program for generating user-compatible business application data, recording medium containing the program, and user-compatible business application |
CN101122899A (zh) * | 2007-09-18 | 2008-02-13 | 杭州华三通信技术有限公司 | 报表的生成方法和设备 |
CN103646049A (zh) * | 2013-11-26 | 2014-03-19 | 中国银行股份有限公司 | 自动生成数据报表的方法及系统 |
-
2019
- 2019-03-19 CN CN201910208356.7A patent/CN109933769A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060224395A1 (en) * | 2003-05-16 | 2006-10-05 | Isao Miyadai | Program for generating user-compatible business application data, recording medium containing the program, and user-compatible business application |
CN101122899A (zh) * | 2007-09-18 | 2008-02-13 | 杭州华三通信技术有限公司 | 报表的生成方法和设备 |
CN103646049A (zh) * | 2013-11-26 | 2014-03-19 | 中国银行股份有限公司 | 自动生成数据报表的方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898351A (zh) * | 2020-08-03 | 2020-11-06 | 上海嗨酷强供应链信息技术有限公司 | 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质 |
CN112256919A (zh) * | 2020-10-30 | 2021-01-22 | 南京哈勃信息科技有限公司 | 一种基于xlsx解析和浏览器多线程技术的xlsx解析系统及方法 |
CN112988870A (zh) * | 2021-03-19 | 2021-06-18 | 浪潮云信息技术股份公司 | 一种读取excel文件的实现方法及工具 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9495347B2 (en) | Systems and methods for extracting table information from documents | |
CN1858786B (zh) | 一种电子文档格式化批注系统与方法 | |
CN109933769A (zh) | 一种基于Excel的报表数据快速解析方法 | |
US20170236130A1 (en) | Emulating Manual System of Filing Using Electronic Document and Electronic File | |
CN101996131A (zh) | 基于xml封装关键字的gui自动测试方法及自动测试平台 | |
CN108694214A (zh) | 数据报表的生成方法、生成装置、可读介质及电子设备 | |
CN111309313A (zh) | 一种快速生成html以及存储表单数据的方法 | |
CN110543303A (zh) | 一种可视化业务平台 | |
AU2015331030A1 (en) | System generator module for electronic document and electronic file | |
CN108280056A (zh) | 一种Excel文件解析方法 | |
CN108256716B (zh) | 基于表来配置/执行流程和/或原子流程的方法和设备 | |
CN112861489A (zh) | 一种对word文档进行处理的方法和装置 | |
CN112035355A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN103399848A (zh) | 发动机试验数据标准化特定格式导入处理方法 | |
US10643022B2 (en) | PDF extraction with text-based key | |
CN107562808B (zh) | 一种异构双链自动化数据的验证方法 | |
CN109739923A (zh) | 一种数据导入的方法和系统 | |
CN113033177B (zh) | 一种电子病历数据的解析方法及装置 | |
CN112434491A (zh) | Html表格解析为json解析系统及其解析方法 | |
CN114115831A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN114861614A (zh) | 用于填充数据的方法及装置、电子设备、介质 | |
CN115579096A (zh) | 一种针对药物警戒e2b r3标准报告的自动生成与解析验证方法、系统及存储介质 | |
US8380690B2 (en) | Automating form transcription | |
CN111611242A (zh) | 一种实现Excel数据向数据库导入的方法 | |
CN107807911B (zh) | 矢量数据编辑方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |