CN112988870A - 一种读取excel文件的实现方法及工具 - Google Patents

一种读取excel文件的实现方法及工具 Download PDF

Info

Publication number
CN112988870A
CN112988870A CN202110295247.0A CN202110295247A CN112988870A CN 112988870 A CN112988870 A CN 112988870A CN 202110295247 A CN202110295247 A CN 202110295247A CN 112988870 A CN112988870 A CN 112988870A
Authority
CN
China
Prior art keywords
data
reading
excel file
sheet page
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110295247.0A
Other languages
English (en)
Inventor
张宏磊
郭子良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202110295247.0A priority Critical patent/CN112988870A/zh
Publication of CN112988870A publication Critical patent/CN112988870A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种读取excel文件的实现方法,涉及文件读取技术领域,其内容包括:获取excel文件;获取excel文件中要读取的sheet页;按行读取sheet页面中不同格式的数据,并转换为集合数据;转换过程中,判断sheet页面中是否包含合并单元格,若是,则根据补充规则来补充集合数据的空缺位置,若否,则直接输出集合数据;基于所读取sheet页包含的数据,对输出的集合数据进行校验,并在校验结果不一致时,返回告警信息。本发明还公开一种读取excel文件的实现工具,该工具通过获取模块、读取转换模块、判断模块、规则模块、校验告警模块实现前述方法,以保证excel文件原有格式的复制式读取,且不需要人工处理数据格式,极大的减少了工作量。

Description

一种读取excel文件的实现方法及工具
技术领域
本发明涉及文件读取技术领域,具体的说是一种读取excel文件的实现方法及工具。
背景技术
随着时代的发展,生产过程中沉淀的数据量愈发庞大。当需要将一个系统的数据切换到另一个新的系统时,所需要切换的数据量也必然是十分庞大的。在人为整理数据的过程中,excel无疑是一个好的工具,它展示直观,便于传输,还有诸多公式可用于整理数据的过程中,可以极大的提高生产的效率。但是,通常人们为了数据展示的更加直观,会对数据进行一定的处理,进而导致在读取excel文件包所含数据的过程中,导致读取数据错误。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种读取excel文件的实现方法及工具,以在正确读取excel文件所包含数据的前提下,还能提高读取效率。
首先,本发明公开一种读取excel文件的实现方法,解决上述技术问题采用的技术方案如下:
一种读取excel文件的实现方法,其实现过程包括:
获取excel文件;
获取excel文件中要读取的sheet页;
按行读取sheet页面中不同格式的数据,并转换为集合数据;
转换过程中,判断sheet页面中是否包含合并单元格:
若是,则根据补充规则来补充集合数据的空缺位置,随后输出集合数据,
若否,则直接输出集合数据;
基于所读取sheet页包含的数据,对输出的集合数据进行校验,并在校验结果不一致时,返回告警信息。
可选的,所涉及sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
可选的,所涉及补充规则具体为:
根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置。
可选的,返回的告警信息内容为:在第几行第几列数据格式错误。
优选的,采用MultirtFile方法获取excel文件。
其次,本发明公开一种读取excel文件的实现工具,解决上述技术问题采用的技术方案如下:
一种读取excel文件的实现工具,其结构包括:
获取模块,用于获取excel文件,并获取excel文件中要读取的sheet页;
读取转换模块,用于按行读取sheet页面中不同格式的数据,并转换为集合数据;
判断模块,用于判断sheet页面中是否包含合并单元格,若是,则通过规则模块补充集合数据的空缺位置,若否,则直接输出集合数据;
规则模块,用于根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置;
校验告警模块,基于所读取sheet页包含的数据,校验输出的集合数据,并在校验结果不一致时,返回告警信息。
可选的,所涉及sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
可选的,返回的告警信息内容为:在第几行第几列数据格式错误。
可选的,所涉及获取模块采用MultirtFile方法获取excel文件。
本发明的一种读取excel文件的实现方法及工具,与现有技术相比具有的有益效果是:
(1)本发明可以读取excel文件不同格式的数据,极大的照顾到了excel的使用者的操作习惯,保证了原有格式的复制式读取;
(2)本发明可以保证excel文件存在合并单元格的情况下能够顺利完成数据读取,且不需要人工处理数据格式,极大的减少了工作量;
(3)本发明还可以对读取获得的集合数据进行校验,避免读取错误,同时,在校验结果不一致时返回告警信息,便于更正。
附图说明
附图1是本发明实施例一的流程示意图;
附图2是本发明实施例二的模块连接图。
附图中各标号信息表示:
1、获取模块,2、读取转换模块,3、判断模块,
4、规则模块,5、校验告警模块。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
结合附图1,本实施例提出一种读取excel文件的实现方法,其实现过程包括:
采用MultirtFile方法获取excel文件;
获取excel文件中要读取的sheet页;
按行读取sheet页面中不同格式的数据,并转换为集合数据;
转换过程中,判断sheet页面中是否包含合并单元格:
若是,则根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置,随后输出集合数据,
若否,则直接输出集合数据;
基于所读取sheet页包含的数据,对输出的集合数据进行校验,并在校验结果不一致时,返回告警信息,如告警信息的内容为:在第几行第几列数据格式错误。
本实施例中,sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
实施例二:
结合附图2,本实施例提出一种读取excel文件的实现工具,其结构包括:获取模块1、读取转换模块2、判断模块3、规则模块4、校验告警模块5。
获取模块1一方面采用MultirtFile方法获取excel文件,另一方面获取excel文件中要读取的sheet页。
读取转换模块2按行读取sheet页面中不同格式的数据,并转换为集合数据。
判断模块3判断sheet页面中是否包含合并单元格:
若是,则通过规则模块4补充集合数据的空缺位置,
若否,则直接输出集合数据。
规则模块4,用于根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置。
校验告警模块5,基于所读取sheet页包含的数据,校验输出的集合数据,并在校验结果不一致时,返回告警信息:在第几行第几列数据格式错误。
本实施例中,sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
综上可知,采用本发明的一种读取excel文件的实现方法及工具,可以读取excel文件不同格式的数据,极大的照顾到了excel的使用者的操作习惯,保证了原有格式的复制式读取,还可以保证excel文件存在合并单元格的情况下能够顺利完成数据读取,且不需要人工处理数据格式,极大的减少了工作量,还可以对读取获得的集合数据进行校验,避免读取错误,同时,在校验结果不一致时返回告警信息,便于更正。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (9)

1.一种读取excel文件的实现方法,其特征在于,其实现过程包括:
获取excel文件;
获取excel文件中要读取的sheet页;
按行读取sheet页面中不同格式的数据,并转换为集合数据;
转换过程中,判断sheet页面中是否包含合并单元格,若是,则根据补充规则来补充集合数据的空缺位置,若否,则直接输出集合数据;
基于所读取sheet页包含的数据,对输出的集合数据进行校验,并在校验结果不一致时,返回告警信息。
2.根据权利要求1所述的一种读取excel文件的实现方法,其特征在于,所述sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
3.根据权利要求1所述的一种读取excel文件的实现方法,其特征在于,所述补充规则具体为:
根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置。
4.根据权利要求1所述的一种读取excel文件的实现方法,其特征在于,返回的告警信息内容为:在第几行第几列数据格式错误。
5.根据权利要求1所述的一种读取excel文件的实现方法,其特征在于,采用MultirtFile方法获取excel文件。
6.一种读取excel文件的实现工具,其特征在于,其结构包括:
获取模块,用于获取excel文件,并获取excel文件中要读取的sheet页;
读取转换模块,用于按行读取sheet页面中不同格式的数据,并转换为集合数据;
判断模块,用于判断sheet页面中是否包含合并单元格,若是,则通过规则模块补充集合数据的空缺位置,若否,则直接输出集合数据;
规则模块,用于根据合并单元格对应的多个单元格,用合并单元格的数据填充集合数据的空缺位置;
校验告警模块,基于所读取sheet页包含的数据,校验输出的集合数据,并在校验结果不一致时,返回告警信息。
7.根据权利要求6所述的一种读取excel文件的实现工具,其特征在于,所述sheet页面中的数据包括数值、货币、会计专用、日期、时间、百分比、分数、科学技术、文本、特殊、自定义多种格式。
8.根据权利要求6所述的一种读取excel文件的实现工具,其特征在于,返回的告警信息内容为:在第几行第几列数据格式错误。
9.根据权利要求6所述的一种读取excel文件的实现工具,其特征在于,获取模块采用MultirtFile方法获取excel文件。
CN202110295247.0A 2021-03-19 2021-03-19 一种读取excel文件的实现方法及工具 Pending CN112988870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110295247.0A CN112988870A (zh) 2021-03-19 2021-03-19 一种读取excel文件的实现方法及工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110295247.0A CN112988870A (zh) 2021-03-19 2021-03-19 一种读取excel文件的实现方法及工具

Publications (1)

Publication Number Publication Date
CN112988870A true CN112988870A (zh) 2021-06-18

Family

ID=76333367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110295247.0A Pending CN112988870A (zh) 2021-03-19 2021-03-19 一种读取excel文件的实现方法及工具

Country Status (1)

Country Link
CN (1) CN112988870A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868171A (zh) * 2015-01-21 2016-08-17 中国移动(深圳)有限公司 一种Excel文件的校验方法及装置
JP2018036972A (ja) * 2016-09-01 2018-03-08 ポップコーンサー コー リミテッド ファイルフォーマット変換装置及びその変換方法
CN109933769A (zh) * 2019-03-19 2019-06-25 浪潮通用软件有限公司 一种基于Excel的报表数据快速解析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868171A (zh) * 2015-01-21 2016-08-17 中国移动(深圳)有限公司 一种Excel文件的校验方法及装置
JP2018036972A (ja) * 2016-09-01 2018-03-08 ポップコーンサー コー リミテッド ファイルフォーマット変換装置及びその変換方法
CN109933769A (zh) * 2019-03-19 2019-06-25 浪潮通用软件有限公司 一种基于Excel的报表数据快速解析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
小新人L: "Excel表格读取的工具类的编写--读取表格内容包括合并单元格", 《CSDN博客》 *
我惠依旧: "Excel合并单元格读取", 《CSDN博客》 *
陌上青花』: "Excel单元格校验", 《CSDN博客》 *

Similar Documents

Publication Publication Date Title
CN107229750B (zh) 表格数据处理方法、装置、存储介质和处理器
US20130174024A1 (en) Method and device for converting document format
CN110659527B (zh) 电子表单中的表格检测
CN108039193A (zh) 一种自动生成体检报告的方法及装置
CN103336805A (zh) 一种基于图形化映射关系的定制报表自动生成方法及装置
CN101859303A (zh) 元数据管理方法及管理系统
CN111400387A (zh) 导入导出数据的转换方法、装置、终端设备及存储介质
CN111797630A (zh) 一种面向pdf格式论文的生物医学实体识别方法
US20100238195A1 (en) Systems and Methods for Reviewing Digital Pen Data
CN113434674A (zh) 数据解析方法、装置、电子设备及可读存储介质
CN112114787A (zh) 报表生成方法、装置及存储介质
CN103136453B (zh) 文档操作题的自动组卷方法和自动阅卷方法
CN101976394A (zh) 数据采集和统计系统及方法
CN110209605A (zh) Pcie总线网卡的寄存器读写方法和计算设备
CN112988870A (zh) 一种读取excel文件的实现方法及工具
CN111611242A (zh) 一种实现Excel数据向数据库导入的方法
WO2024001308A1 (zh) 基于模板的红外热像分析报告的批量生成方法及装置
CN102467490B (zh) 一种字体数据的处理方法及装置
CN109543316B (zh) 提取版图不同模块连接关系的方法
CN110991150A (zh) 一种数据格式转换方法、装置及报账系统
US20230297774A1 (en) Demand conformity analysis method and system, and electronic device and storage medium
CN115700580A (zh) 基于指标体系的数据填报方法、系统、设备和存储介质
CN111897778A (zh) 一种计算机文件合并方法、装置及系统
CN201514633U (zh) 图样文档标准审查装置
CN100403318C (zh) 简化图形组件的系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210618

RJ01 Rejection of invention patent application after publication