CN109977383A - 一种基于Excel的表单信息提取方法 - Google Patents
一种基于Excel的表单信息提取方法 Download PDFInfo
- Publication number
- CN109977383A CN109977383A CN201910176867.5A CN201910176867A CN109977383A CN 109977383 A CN109977383 A CN 109977383A CN 201910176867 A CN201910176867 A CN 201910176867A CN 109977383 A CN109977383 A CN 109977383A
- Authority
- CN
- China
- Prior art keywords
- excel
- list
- cell
- information
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000007689 inspection Methods 0.000 claims abstract description 54
- 239000003550 marker Substances 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Factory Administration (AREA)
Abstract
本发明涉及信息化领域,具体说是一种基于Excel的表单信息提取方法,其包括在数据库中建立两个数据库表,编制Excel表格形成表单模板,将所述表单模板中的单元格进行标识,形成单元格标识Excel模板;服务器对所述单元格标识Excel模板进行解析,形成表单信息提取规则;用户填写表单提交至服务器,服务器根据所述表单信息提取规则提取该表单中的表单头信息和质检项信息数据存入对应的所述数据库表中。本发明在企业信息系统开发和运维中,表单的定制开发过程不需要软件编码知识,不需要了解数据库,只要对Excel有一定的了解,为表单编制Excel表单模板和提取数据所需的单元格标识Excel模板,便可为系统定制开发表单,降低了表单定制人员的信息技术基础要求。
Description
技术领域
本发明涉及信息化领域,特别涉及一种基于Excel的表单信息提取方法。
背景技术
在企业信息化系统建设中,往往涉及很多业务表单的输入、流转和处理。为了使信息化系统尽可能符合企业实际运行情况,不改变企业现有业务处理习惯,减小信息化建设过程的人为阻力,一般需要根据企业需求对业务表单进行定制,有针对性地开发出符合企业原有业务表单样式的定制表单。
目前,表单定制最普通的方法就是采用程序硬编码实现。这种实现方式在表单开发完成后格式已经固定,难以扩展,而且编码工作量大。也有通过开发表单设计器来定制开发表单,但这类设计器的局限性大,无法完成对复杂表单的设计,并且无法直观的展示表单,给表单的填写带来了一定的困难。Excel作为一种表单设计工具,在企业建立信息化系统之前已被广泛应用。已经有很多企业在信息化系统建设中,采用Excel进行表单定制,用户根据自身用途,使用Excel规划设计表格,并把保存的Excel文件导入到应用程序,转换为HTML表单保存到系统中。这种方法对于使用者要求低,面向的不仅仅是开发人员本身,甚至是不懂系统的软件最终用户只要能够熟练的使用EXCEL也能参与表单的定制和开发过程。基于EXCEL来设计,还能够有效利用企业现有的表单,更具有灵活性和代表性。
在当今大数据时代,企业信息化系统不只是要实现业务数据的采集与存储,更重要的是要实现业务数据的分析,帮助企业发现业务中存在的问题,提高企业管理效率。采用Excel定制表单,虽然能很好地完成表单数据的输入和显示,但如果不知道数据的含义,将无法对采集的数据进行有效分析。
发明内容
针对上述技术问题,本发明提供一种基于Excel的表单信息提取方法,该方法采用Excel定制表单,并通过一套符号体系对Excel单元格的数据内容进行标识,使信息化系统能够理解Excel单元格中的数据含义,通过建立信息提取规则,将Excel表格中的数据提取并存储到预先设计好的数据库表中,以便系统对表单数据进行分析。
本发明解决上述技术问题所采用的技术方案为:一种基于Excel的表单信息提取方法,其包括以下步骤:
S1,在数据库中建立两个数据库表,分别用于存储质检表单头信息和需要进行分析的质检项信息;
S2,根据需要填写的质检信息编制Excel表格形成表单模板,并将表单模板存入所述数据库;
S3,将所述表单模板中的单元格分为质检表单头信息单元格和质检项信息单元格两类,采用一套标识符号对这两类单元格进行标识,并将标识符号填入对应的单元格,形成单元格标识Excel模板,并提交服务器;
S4,所述服务器对所述单元格标识Excel模板进行解析,形成表单信息提取规则,并存入数据库;
S5,用户需填写表单时,先从数据库中读取表单模板并在客户端展示出来,用户根据表单模板填好表单,然后将该表单提交至服务器,服务器根据所述表单信息提取规则提取该表单中的表单头信息和质检项信息数据存入对应的所述数据库表中。
作为优选,步骤S1中所述质检表单头信息数据库表包括表单类型、表单名称、产品型号、工号、序号、图号、工作者、检验员、检验日期;质检项信息数据库表包括检验项目、图样要求、上下偏差、实测值、测量工具编号。
作为优选,所述表单模板为企业现在有的Excel质检表单或根据企业现有的纸质质检表单样式制作的电子版Excel质检表单。
作为优选,在步骤S3的所述表单模板单元格中,利用Excel的功能对表单模板中单元格的数据类型、数据格式、关联性数据的快捷录入进行设置,并对表单中不需要用户填写的单元格设置保护。
作为优选,步骤S3中单元格的标识符号是用容器标识封装起来的一个字符串。
作为优选,步骤S4中,服务器读取单元格标识Excel模板,并根据单元格中的标识符号确定表单中包含的检验项目和这些检验项目对应的测量值所在单元格位置,对每个检验项目记录一个检验项目和值所在单元格位置的数据对,形成一张检验信息提取规则表,并写入数据库。
从以上技术方案可知,本发明在企业信息系统开发和运维中,表单的定制开发过程不需要软件编码知识,不需要了解数据库,只要对Excel有一定的了解,为表单编制Excel表单模板和提取数据所需的单元格标识Excel模板,便可为系统定制开发表单,降低了表单定制人员的信息技术基础要求。同时,采用Excel设计的表单更接近企业现有的表单样式,方便了操作人员的填写。
且通过本发明方法,系统采用统一的表单数据提取方法,对不同的表单只要编制出提取数据所需的单元格标识Excel模板,通过建立提取规则来提取表单中的数据,方便后续进行数据分析。并且,如果填写的表单需要变更,也无需额外编码变更数据提取方法,只需变更表单对应的单元格标识Excel模板,便可对变更后的表单数据进行提取,使表单更易维护;同时在整个表单变更过程中,不需要变更现有的数据库结构,保证了正在运行的系统的连续性。
具体实施方式
下面结合实施例详细介绍本发明,在此本发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
本发明提供了一种基于Excel的表单信息提取方法,其包括以下步骤:
步骤S1,在数据库中建立两个数据库表,分别用于存储质检表单头信息和需要进行分析的质检项信息;其中质检表单头信息数据库表包括表单类型、表单名称、产品型号、工号、序号、图号、工作者、检验员、检验日期等属性;质检项信息数据库表包括检验项目、图样要求、上下偏差、实测值、测量工具编号等属性。
步骤S2,以企业现在有的Excel质检表单或根据企业现有的纸质质检表单样式制作的电子版Excel质检表单为表单模板(表1所示),并存入数据库;在表单模板单元格中,可利用Excel本身的功能特点,对表单模板中单元格的数据类型、数据格式、关联性数据的快捷录入进行设置,并对表单中不需要用户填写的单元格设置保护,以保证用户在填写表单数据时,只能对数据填写区域进行填写。
步骤S3,将表单模板中的单元格分为质检表单头信息单元格和质检项信息单元格两类,采用一套符标识符号体系对这两类单元格进行标识,并将标识符号填入单元格,形成单元格标识Excel模板(表2所示即为表1对应的单元格标识Excel模板),并提交服务器。
步骤S4,服务器后台程序读取单元格标识Excel模板,并根据单元格中的标识符号,确定该表单中包含的检验项目和这些检验项目对应的测量值所在单元格位置,对每个检验项目,记录一个检验项目和值所在单元格位置的数据对,形成一张检验信息提取规则表,并写入数据库。
步骤S5,用户填写检验表单时,下载对应的表单模板到客户端,并通过DEVSpreadsheetControl控件展示表单,供用户填写检验数据。填写完检验数据提交表单时,系统通过DEV SpreadsheetControl控件把填写表单生成Excel文件并上传服务器;后台程序将接收到的表单文件存储在服务器上,并根据表单模板对应的信息提取规则提取表单中的表单头信息和质检项信息数据存入对应的数据库表中。
表1:
表2:
上述步骤S3中单元格标识符号是用容器标识封装起来的一个字符串。容器标识是一对特殊字符,不会在表单模板的单元格内容中出现,保证解析程序可以区分标识符号与单元格内容。封装起来的一个字符串用来表示单元格内容的类别和位置。配置单元格标识Excel模板,包括配置质检表单头信息单元格和质检项信息单元格,具体配置如下:
本发明实施方法中的单元格特殊标识示例如下:
标识 | 标识说明 | 标识示例 |
容器标识 | 单元格标识符号,必须用容器标识将规则包起来 | 【】 |
检验项目标识 | 定义检验表单中检验项目名称,填在检验项目前面,规则后面的文字将会被当作检验项目名称,存入检验项目标识表 | & |
数据类型标识 | 定义填入数据的数据类型,例如数值、日期、字符串等 | 数值(I)、字符串(S)、日期(D) |
本发明包括以上标识,但不限于上面所述标识,可在容器标示符中无限添加标识。
本发明实施方式的单元格标识示例如下:
本发明包括以上单元格标识,但不限于上面所述单元格标识,可在容器标示符中无限添加标识,组成其他单元格标识用来提取单元格中的数据。
Claims (6)
1.一种基于Excel的表单信息提取方法,其特征包括以下步骤:
S1,在数据库中建立两个数据库表,分别用于存储质检表单头信息和需要进行分析的质检项信息;
S2,根据需要填写的质检信息编制Excel表格形成表单模板,并将表单模板存入所述数据库;
S3,将所述表单模板中的单元格分为质检表单头信息单元格和质检项信息单元格两类,采用一套标识符号对这两类单元格进行标识,并将标识符号填入对应的单元格,形成单元格标识Excel模板,并提交服务器;
S4,所述服务器对所述单元格标识Excel模板进行解析,形成表单信息提取规则,并存入数据库;
S5,用户需填写表单时,先从数据库中读取表单模板并在客户端展示出来,用户根据表单模板填好表单,然后将该表单提交至服务器,服务器根据所述表单信息提取规则提取该表单中的表单头信息和质检项信息数据存入对应的所述数据库表中。
2.根据权利要求1所述基于Excel的表单信息提取方法,其特征在于:步骤S1中所述质检表单头信息数据库表包括表单类型、表单名称、产品型号、工号、序号、图号、工作者、检验员、检验日期;质检项信息数据库表包括检验项目、图样要求、上下偏差、实测值、测量工具编号。
3.根据权利要求1所述基于Excel的表单信息提取方法,其特征在于:所述表单模板为企业现在有的Excel质检表单或根据企业现有的纸质质检表单样式制作的电子版Excel质检表单。
4.根据权利要求1或2或3所述基于Excel的表单信息提取方法,其特征在于:在步骤S3的所述表单模板单元格中,利用Excel的功能对表单模板中单元格的数据类型、数据格式、关联性数据的快捷录入进行设置,并对表单中不需要用户填写的单元格设置保护。
5.根据权利要求1所述基于Excel的表单信息提取方法,其特征在于:步骤S3中单元格的标识符号是用容器标识封装起来的一个字符串。
6.根据权利要求1所述基于Excel的表单信息提取方法,其特征在于:步骤S4中,服务器读取单元格标识Excel模板,并根据单元格中的标识符号确定表单中包含的检验项目和这些检验项目对应的测量值所在单元格位置,对每个检验项目记录一个检验项目和值所在单元格位置的数据对,形成一张检验信息提取规则表,并写入数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910176867.5A CN109977383A (zh) | 2019-03-11 | 2019-03-11 | 一种基于Excel的表单信息提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910176867.5A CN109977383A (zh) | 2019-03-11 | 2019-03-11 | 一种基于Excel的表单信息提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977383A true CN109977383A (zh) | 2019-07-05 |
Family
ID=67078304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910176867.5A Pending CN109977383A (zh) | 2019-03-11 | 2019-03-11 | 一种基于Excel的表单信息提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977383A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110888874A (zh) * | 2019-10-31 | 2020-03-17 | 苏州浪潮智能科技有限公司 | 一种通过Excel创建表单的装置、方法及存储介质 |
CN112001146A (zh) * | 2020-08-21 | 2020-11-27 | 苏州浪潮智能科技有限公司 | 一种pcb板叠层设计方法 |
CN112131495A (zh) * | 2020-09-11 | 2020-12-25 | 重庆誉存大数据科技有限公司 | 基于决策流结果的网页显示方法、装置、设备及存储介质 |
CN112528615A (zh) * | 2020-12-23 | 2021-03-19 | 安徽航天信息有限公司 | 税务系统中纳税申报表生成方法、装置及计算机设备 |
CN113435175A (zh) * | 2021-06-17 | 2021-09-24 | 长沙通诺信息科技有限责任公司 | 审查批件的生成方法、装置、终端设备及存储介质 |
CN116364264A (zh) * | 2023-06-01 | 2023-06-30 | 福建自贸试验区厦门片区Manteia数据科技有限公司 | 设备检测方法、装置、电子设备及计算机可读存储介质 |
CN118069656A (zh) * | 2024-04-17 | 2024-05-24 | 浪潮通用软件有限公司 | 一种纸质质检表格的数据结构化存储方法、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050015379A1 (en) * | 2001-08-09 | 2005-01-20 | Jean-Jacques Aureglia | System and method in a spreadsheet for exporting-importing the content of input cells from a scalable template instance to another |
CN103778107A (zh) * | 2012-10-25 | 2014-05-07 | 上海宝信软件股份有限公司 | 一种基于excel快速动态生成表单的方法与平台 |
CN103886023A (zh) * | 2014-02-24 | 2014-06-25 | 国家电网公司 | Excel数据表的存储、提取方法及系统 |
CN103914438A (zh) * | 2012-12-30 | 2014-07-09 | 航天信息股份有限公司 | 基于模版与标记实现的Excel显示与导出方法及系统 |
CN103970736A (zh) * | 2013-01-25 | 2014-08-06 | 苏州精易会信息技术有限公司 | 一种将Excel表格转换成数据库表的方法 |
CN105138504A (zh) * | 2015-09-07 | 2015-12-09 | 北京恒华伟业科技股份有限公司 | 一种报表生成方法及报表引擎 |
CN107248065A (zh) * | 2017-06-08 | 2017-10-13 | 中国建设银行股份有限公司 | 线上报表管理方法、系统、装置及存储介质 |
CN108280056A (zh) * | 2017-12-26 | 2018-07-13 | 北京市天元网络技术股份有限公司 | 一种Excel文件解析方法 |
-
2019
- 2019-03-11 CN CN201910176867.5A patent/CN109977383A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050015379A1 (en) * | 2001-08-09 | 2005-01-20 | Jean-Jacques Aureglia | System and method in a spreadsheet for exporting-importing the content of input cells from a scalable template instance to another |
CN103778107A (zh) * | 2012-10-25 | 2014-05-07 | 上海宝信软件股份有限公司 | 一种基于excel快速动态生成表单的方法与平台 |
CN103914438A (zh) * | 2012-12-30 | 2014-07-09 | 航天信息股份有限公司 | 基于模版与标记实现的Excel显示与导出方法及系统 |
CN103970736A (zh) * | 2013-01-25 | 2014-08-06 | 苏州精易会信息技术有限公司 | 一种将Excel表格转换成数据库表的方法 |
CN103886023A (zh) * | 2014-02-24 | 2014-06-25 | 国家电网公司 | Excel数据表的存储、提取方法及系统 |
CN105138504A (zh) * | 2015-09-07 | 2015-12-09 | 北京恒华伟业科技股份有限公司 | 一种报表生成方法及报表引擎 |
CN107248065A (zh) * | 2017-06-08 | 2017-10-13 | 中国建设银行股份有限公司 | 线上报表管理方法、系统、装置及存储介质 |
CN108280056A (zh) * | 2017-12-26 | 2018-07-13 | 北京市天元网络技术股份有限公司 | 一种Excel文件解析方法 |
Non-Patent Citations (2)
Title |
---|
付玥: "半结构化数据语义分析与映射方法研究", 《中国优秀硕士论文全文数据库信息科技辑》, 16 November 2012 (2012-11-16), pages 3 - 2 * |
张永涛: "基于Excel控件和SQL Server的自定义报表系统", 《电信技术》, 31 December 2010 (2010-12-31), pages 19 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110888874A (zh) * | 2019-10-31 | 2020-03-17 | 苏州浪潮智能科技有限公司 | 一种通过Excel创建表单的装置、方法及存储介质 |
CN110888874B (zh) * | 2019-10-31 | 2022-07-08 | 苏州浪潮智能科技有限公司 | 一种通过Excel创建表单的装置、方法及存储介质 |
CN112001146A (zh) * | 2020-08-21 | 2020-11-27 | 苏州浪潮智能科技有限公司 | 一种pcb板叠层设计方法 |
CN112001146B (zh) * | 2020-08-21 | 2023-01-10 | 苏州浪潮智能科技有限公司 | 一种pcb板叠层设计方法 |
CN112131495A (zh) * | 2020-09-11 | 2020-12-25 | 重庆誉存大数据科技有限公司 | 基于决策流结果的网页显示方法、装置、设备及存储介质 |
CN112131495B (zh) * | 2020-09-11 | 2023-05-12 | 重庆誉存大数据科技有限公司 | 基于决策流结果的网页显示方法、装置、设备及存储介质 |
CN112528615A (zh) * | 2020-12-23 | 2021-03-19 | 安徽航天信息有限公司 | 税务系统中纳税申报表生成方法、装置及计算机设备 |
CN113435175A (zh) * | 2021-06-17 | 2021-09-24 | 长沙通诺信息科技有限责任公司 | 审查批件的生成方法、装置、终端设备及存储介质 |
CN116364264A (zh) * | 2023-06-01 | 2023-06-30 | 福建自贸试验区厦门片区Manteia数据科技有限公司 | 设备检测方法、装置、电子设备及计算机可读存储介质 |
CN116364264B (zh) * | 2023-06-01 | 2024-01-16 | 福建自贸试验区厦门片区Manteia数据科技有限公司 | 设备检测方法、装置、电子设备及计算机可读存储介质 |
CN118069656A (zh) * | 2024-04-17 | 2024-05-24 | 浪潮通用软件有限公司 | 一种纸质质检表格的数据结构化存储方法、设备及介质 |
CN118069656B (zh) * | 2024-04-17 | 2024-06-21 | 浪潮通用软件有限公司 | 一种纸质质检表格的数据结构化存储方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977383A (zh) | 一种基于Excel的表单信息提取方法 | |
CN109948134B (zh) | 一种报告自动生成方法、系统及电子设备和存储介质 | |
US10067931B2 (en) | Analysis of documents using rules | |
US9690788B2 (en) | File type recognition analysis method and system | |
CN110263009A (zh) | 日志分类规则的生成方法、装置、设备及可读存储介质 | |
CN103473056B (zh) | 一种遥测配置文件自动生成方法 | |
CN106469140A (zh) | 一种报表生成系统及其方法 | |
CN112836018A (zh) | 应急预案的处理方法及装置 | |
CN111522741A (zh) | 接口测试代码生成方法、装置、电子设备及可读存储介质 | |
CN109597892A (zh) | 一种数据库中数据的分类方法、装置、设备及存储介质 | |
CN113190220A (zh) | Json文件差异化对比方法及装置 | |
CN107908843B (zh) | 基于图签信息提取的管理系统 | |
CN111753536B (zh) | 一种专利申请文本的自动撰写方法和装置 | |
CN103399848A (zh) | 发动机试验数据标准化特定格式导入处理方法 | |
CN117709317A (zh) | 报表文件的处理方法、装置及电子设备 | |
CN113420080A (zh) | 一种毒理学实验数据管理系统 | |
CN113095044A (zh) | 一种文件转换方法、装置及设备 | |
CN113590655A (zh) | 标的物参数信息抽取方法、装置、存储介质及电子设备 | |
CN115510834A (zh) | 一种实验室数据数字化管理系统和方法 | |
US7437714B1 (en) | Category partitioning markup language and tools | |
CN115579096A (zh) | 一种针对药物警戒e2b r3标准报告的自动生成与解析验证方法、系统及存储介质 | |
CN114118098A (zh) | 基于要素抽取的合同评审方法、设备及存储介质 | |
CN113254612A (zh) | 知识问答处理方法、装置、设备及存储介质 | |
CN112507677A (zh) | 一种电子表单录入及展示的方法和装置 | |
CN117973566B (zh) | 训练数据处理方法、装置及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |