CN109492196B - 一种Excel表格数据提取的系统和方法 - Google Patents

一种Excel表格数据提取的系统和方法 Download PDF

Info

Publication number
CN109492196B
CN109492196B CN201811087418.5A CN201811087418A CN109492196B CN 109492196 B CN109492196 B CN 109492196B CN 201811087418 A CN201811087418 A CN 201811087418A CN 109492196 B CN109492196 B CN 109492196B
Authority
CN
China
Prior art keywords
cell
field
excel
cells
excel file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811087418.5A
Other languages
English (en)
Other versions
CN109492196A (zh
Inventor
胡森
罗红波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Putaocheng Information Technology Co ltd
Original Assignee
Xi'an Putaocheng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Putaocheng Information Technology Co ltd filed Critical Xi'an Putaocheng Information Technology Co ltd
Priority to CN201811087418.5A priority Critical patent/CN109492196B/zh
Publication of CN109492196A publication Critical patent/CN109492196A/zh
Application granted granted Critical
Publication of CN109492196B publication Critical patent/CN109492196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种Excel表格数据提取方法,首先加载Excel文件到活字格,然后确定所要生成数据库字段或者表的Excel文件中单元格的范围;确定所要生成数据库字段或者表的Excel文件中单元格的位置;其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;针对确定的单元格不同的范围获取单元格内容;最后,将获取的单元格内容作为字段或者表放入数据库中,本发明还公开了一种Excel表格数据提取的系统,本发明把Excel文件里面的表单信息直接转换成数据库的表或者字段,成为应用平台所需的信息,减少人力成本。

Description

一种Excel表格数据提取的系统和方法
技术领域
本发明属于Excel文件技术领域,具体涉及一种Excel表格数据提取方法,本发明还涉及Excel表格数据提取的系统。
背景技术
Excel作为一种办公工具,在企业中非常普及,很多企业期望通过快速开发平台把Excel中的信息直接转换成为应用平台所需的信息,减少人力成本。我们通过对大量Excel文件的分析,总结出Excel表单的通用规律,尽可能以符合人类思维的方式,把Excel中由人类所能理解的信息,转换为机器所能执行的信息。
活字格是西安葡萄城自主研发的Web应用生成平台,提供可视化设计器,让开发人员和业务用户快速构建Web应用程序,满足企业的个性化管理需求,并随需而变。用户可以灵活拖动各个图形化控件,构建业务流程、逻辑和数据模型等,实现企业信息系统所需的各项功能。
同时,活字格提供丰富的开发接口和强大的插件机制,使用者可不断扩展活字格的应用生成能力,最终使用者将通过浏览器随时随地的访问你的应用,不需要安装任何客户端,只要你拥有一台电脑或一个平板,即可在线进行数据操作。同时支持多人在线操作数据,真正实现了团队协作。在浏览器方面,活字格支持IE11,Edge,Chrome等现代浏览器。
所以,将Excel中的信息与活字格强大的功能相结合,便能解决将Excel单元格中信息转化为数据库的表或者字段的问题。
发明内容
本发明的目的是提供一种Excel表格数据提取方法,把Excel文件里面的表单信息直接转换成数据库的表或者字段,成为应用平台所需的信息,减少人力成本。
本发明的另一目的是提供一种Excel表格数据提取的系统。
本发明所采用的第一技术方案是,一种Excel表格数据提取方法,具体按照以下步骤实施:
步骤1、加载Excel文件到活字格,提供能够将Excel文件加载到活字格的加载单元;
步骤2、确定所要生成数据库字段或者表的Excel文件中单元格的范围;
确定所要生成数据库字段或者表的Excel文件中单元格的位置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
针对确定的单元格不同的范围获取单元格内容;
步骤3、基于步骤2获取的单元格内容,进而将该内容作为字段或者表放入数据库中,即创建数据库的字段或者表。
本发明第一技术方案的特点还在于,
步骤1具体如下:
将一个Excel文件加载到活字格的智能识别引擎容器中,所述Excel文件包含xls格式和xlsx格式,智能识别引擎容器能够兼容Excel文件不同格式;
智能识别引擎容器执行对Excel文件操作有关的所有命令。
步骤2针对确定的单元格不同的范围,具体操作如下:
第一种:对于Excel文件中的一个单元格:
如果此单元格的上下左右4个边框都被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
如果此单元格仅仅下边框被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
第二种:对于Excel中一片连续的单元格:
如果此片区域的所有单元格的上下左右四个边框都被设置,并且上侧第一行有文本,则设定此片区域将被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本;
如果此片区域被设置了Excel套用表格格式,则直接被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本。
步骤2中对于单元格的上下左右4个边框都被设置,并且单元格值为空情况下:
如果此单元格左侧相邻单元格有文字,上侧相邻单元格没有文字,则此单元格被识别为一个字段,并且字段名称为左侧单元格的文本;
如果此单元格左侧相邻单元格没有文字,上侧相邻单元格有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧相邻单元格有文字,上侧相邻单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,左侧单元格文本优先级高于上侧单元格文本;
如果此单元格左侧相邻单元格有文字,上侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本;
如果此单元格上侧相邻单元格有文字,左侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧有文字,上侧相同距离处的单元格也有文字,但都相距较远,则此单元格被识别为一个字段,并且字段名称为左侧与上侧单元格的文本组合,以下划线相连。
步骤3具体如下:
基于步骤2的识别结果,在数据库中创建相对应的表和字段:如果一个Excel的工作簿上既包含识别的独立的字段,也包含识别的独立的表格,将在数据库中创建具有主从关系的父子表。
本发明所采用的第二技术方案是,一种Excel表格数据提取方法,包括:
提供用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
提供智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
提供用于针对确定的单元格不同的范围获取单元格内容的装置;
提供用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
提供用于设定Excel单元格优先级的装置;
提供用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
提供用于判断单元格边框是否被设置的装置;
提供用于判断单元格边框中被设置的边框数量的装置;
提供用于判断被设置边框的单元格值是否为空的装置;
提供用于创建具有主从关系的父子表的装置。
本发明所采用的第三技术方案是,一种Excel表格数据提取的系统,包括:
用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
用于智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
用于针对确定的单元格不同的范围获取单元格内容的装置;
用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
用于设定Excel单元格优先级的装置;
用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
用于判断单元格边框是否被设置的装置;
用于判断单元格边框中被设置的边框数量的装置;
用于判断被设置边框的单元格值是否为空的装置;
用于创建具有主从关系的父子表的装置。
本发明的有益效果是,一种Excel表格数据提取方法,根据单元格的特征,将其识别为一张表,或者一个字段,然后转化为数据库里的表或者字段,为机器所能执行。
附图说明
图1是本发明一种Excel表格数据提取方法实施例中当单元格左侧相邻单元格有文字,上侧相邻单元格没有文字时识别结果图;
图2是本发明一种Excel表格数据提取方法实施例中当单元格左侧相邻单元格没有文字,上侧相邻单元格有文字时识别结果图;
图3是本发明一种Excel表格数据提取方法实施例中当单元格左侧相邻单元格有文字,上侧相邻单元格也有文字时识别结果图;
图4是本发明一种Excel表格数据提取方法实施例中当单元格左侧相邻单元格有文字,上侧较远单元格也有文字时识别结果图;
图5是本发明一种Excel表格数据提取方法实施例中单元格上侧相邻单元格有文字,左侧较远单元格也有文字时识别结果图;
图6是本发明一种Excel表格数据提取方法实施例中当单元格左侧有文字,上侧相同距离处的单元格也有文字,但都相距较远时识别结果图;
图7是本发明一种Excel表格数据提取方法实施例中当针对Excel中一片连续的单元格时识别结果图;
图8是本发明一种Excel表格数据提取方法实施例中在数据库中创建相对应的表和字段时识别结果图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种Excel表格数据提取方法,具体按照以下步骤实施:
步骤1、加载Excel文件到活字格,提供能够将Excel文件加载到活字格的加载单元,具体如下:
将一个Excel文件加载到活字格的智能识别引擎容器中,所述Excel文件包含xls格式和xlsx格式,智能识别引擎容器能够兼容Excel文件不同格式;
智能识别引擎容器执行对Excel文件操作有关的所有命令;
步骤2、确定所要生成数据库字段或者表的Excel文件中单元格的范围;
确定所要生成数据库字段或者表的Excel文件中单元格的位置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
针对确定的单元格不同的范围获取单元格内容,具体操作如下:
第一种:对于Excel文件中的一个单元格:
如果此单元格的上下左右4个边框都被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
如果此单元格仅仅下边框被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
第二种:对于Excel中一片连续的单元格:
如果此片区域的所有单元格的上下左右四个边框都被设置,并且上侧第一行有文本,则设定此片区域将被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本;
如果此片区域被设置了Excel套用表格格式,则直接被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本;
其中,对于单元格的上下左右4个边框都被设置,并且单元格值为空情况下:
如果此单元格左侧相邻单元格有文字,上侧相邻单元格没有文字,则此单元格被识别为一个字段,并且字段名称为左侧单元格的文本;
如果此单元格左侧相邻单元格没有文字,上侧相邻单元格有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧相邻单元格有文字,上侧相邻单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,左侧单元格文本优先级高于上侧单元格文本;
如果此单元格左侧相邻单元格有文字,上侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本;
如果此单元格上侧相邻单元格有文字,左侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧有文字,上侧相同距离处的单元格也有文字,但都相距较远,则此单元格被识别为一个字段,并且字段名称为左侧与上侧单元格的文本组合,以下划线相连;
步骤3、基于步骤2获取的单元格内容,进而将该内容作为字段或者表放入数据库中,即创建数据库的字段或者表,具体如下:
基于步骤2的识别结果,在数据库中创建相对应的表和字段:如果一个Excel的工作簿上既包含识别的独立的字段,也包含识别的独立的表格,将在数据库中创建具有主从关系的父子表。
本发明Excel表格数据提取方法,包括:
提供用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
提供智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
提供用于针对确定的单元格不同的范围获取单元格内容的装置;
提供用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
提供用于设定Excel单元格优先级的装置;
提供用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
提供用于判断单元格边框是否被设置的装置;
提供用于判断单元格边框中被设置的边框数量的装置;
提供用于判断被设置边框的单元格值是否为空的装置;
提供用于创建具有主从关系的父子表的装置。
本发明一种Excel表格数据提取的系统,包括:
用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
用于智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
用于针对确定的单元格不同的范围获取单元格内容的装置;
用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
用于设定Excel单元格优先级的装置;
用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
用于判断单元格边框是否被设置的装置;
用于判断单元格边框中被设置的边框数量的装置;
用于判断被设置边框的单元格值是否为空的装置;
用于创建具有主从关系的父子表的装置。
实施例
一种Excel表格数据提取方法,具体按照以下步骤实施:
步骤1、加载Excel文件到活字格,提供能够将Excel文件加载到活字格的加载单元,具体如下:
将一个Excel文件加载到活字格的智能识别引擎容器中,所述Excel文件包含xls格式和xlsx格式,智能识别引擎容器能够兼容Excel文件不同格式;
智能识别引擎容器执行对Excel文件操作有关的所有命令;
步骤2、确定所要生成数据库字段或者表的Excel文件中单元格的范围;
确定所要生成数据库字段或者表的Excel文件中单元格的位置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个连续的单元格;
针对确定的单元格不同的范围获取单元格内容,具体操作如下:
对于单元格的上下左右4个边框都被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断,具体为:
如果此单元格左侧相邻单元格有文字,上侧相邻单元格没有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,如图1所示,字段被识别为【姓名】;
如果此单元格左侧相邻单元格没有文字,上侧相邻单元格有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本,如图2所示,字段被识别为【姓名】;
如果此单元格左侧相邻单元格有文字,上侧相邻单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,左侧单元格文本优先级高于上侧单元格文本,如图3所示,字段被识别为【姓名】;
如果此单元格左侧相邻单元格有文字,上侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,如图4所示,字段被识别为【姓名】;
如果此单元格上侧相邻单元格有文字,左侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本,如图5所示,字段被识别为【性别】;
如果此单元格左侧有文字,上侧相同距离处的单元格也有文字,但都相距较远,则此单元格被识别为一个字段,并且字段名称为左侧与上侧单元格的文本组合,以下划线相连,如图6所示,字段名称为【姓名_性别】;
对于Excel中一片连续的单元格,如果此片区域的所有单元格的上下左右四个边框都被设置,并且上侧第一行有文本,则设定此片区域将被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本,如图7所示,将被识别为一张表,并4个字段【姓名】【年龄】【性别】【居住地】;
步骤3中,基于步骤2获取的单元格内容,进而将该内容作为字段或者表放入数据库中,即创建数据库的字段或者表,具体如下:
基于步骤2的识别结果,在数据库中创建相对应的表和字段:如果一个Excel的工作簿上既包含识别的独立的字段,也包含识别的独立的表格,将在数据库中创建具有主从关系的父子表。

Claims (7)

1.一种Excel表格数据提取方法,其特征在于,具体包括以下步骤实施:
步骤1、加载Excel文件到活字格,提供能够将Excel文件加载到活字格的加载单元;
步骤2、确定所要生成数据库字段或者表的Excel文件中单元格的范围;
确定所要生成数据库字段或者表的Excel文件中单元格的位置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
针对确定的单元格不同的范围获取单元格内容;
步骤3、基于步骤2获取的单元格内容,进而将该内容作为字段或者表放入数据库中,即创建数据库的字段或者表。
2.根据权利要求1所述的一种Excel表格数据提取方法,其特征在于,所述步骤1具体如下:
将一个Excel文件加载到活字格的智能识别引擎容器中,所述Excel文件包含xls格式和xlsx格式,智能识别引擎容器能够兼容Excel文件不同格式;
智能识别引擎容器执行对Excel文件操作有关的所有命令。
3.根据权利要求1所述的一种Excel表格数据提取方法,其特征在于,所述步骤2针对确定的单元格不同的范围,具体操作如下:
第一种:对于Excel文件中的一个单元格:
如果此单元格的上下左右4个边框都被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
如果此单元格仅仅下边框被设置,并且单元格值为空,则设定左侧文本优先级高于上侧,较近单元格文本优先级高于较远单元格文本,此处距离的远近是以单元格数量为单位判断;
第二种:对于Excel中一片连续的单元格:
如果此片区域的所有单元格的上下左右四个边框都被设置,并且上侧第一行有文本,则设定此片区域将被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本;
如果此片区域被设置了Excel套用表格格式,则直接被识别为一张表,每一列将被识别为一个字段,字段名称为上侧第一行文本。
4.根据权利要求3所述的一种Excel表格数据提取方法,其特征在于,所述步骤2中对于单元格的上下左右4个边框都被设置,并且单元格值为空情况下:
如果此单元格左侧相邻单元格有文字,上侧相邻单元格没有文字,则此单元格被识别为一个字段,并且字段名称为左侧单元格的文本;
如果此单元格左侧相邻单元格没有文字,上侧相邻单元格有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧相邻单元格有文字,上侧相邻单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本,左侧单元格文本优先级高于上侧单元格文本;
如果此单元格左侧相邻单元格有文字,上侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为左侧相邻单元格的文本;
如果此单元格上侧相邻单元格有文字,左侧较远单元格也有文字,则此单元格被识别为一个字段,并且字段名称为上侧相邻单元格的文本;
如果此单元格左侧有文字,上侧相同距离处的单元格也有文字,但都相距较远,则此单元格被识别为一个字段,并且字段名称为左侧与上侧单元格的文本组合,以下划线相连。
5.根据权利要求1所述的一种Excel表格数据提取方法,其特征在于,所述步骤3具体如下:
基于步骤2的识别结果,在数据库中创建相对应的表和字段:如果一个Excel的工作簿上既包含识别的独立的字段,也包含识别的独立的表格,将在数据库中创建具有主从关系的父子表。
6.一种Excel表格数据提取方法,其特征在于,包括:
提供用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
提供智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
提供用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
提供用于针对确定的单元格不同的范围获取单元格内容的装置;
提供用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
提供用于设定Excel单元格优先级的装置;
提供用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
提供用于判断单元格边框是否被设置的装置;
提供用于判断单元格边框中被设置的边框数量的装置;
提供用于判断被设置边框的单元格值是否为空的装置;
提供用于创建具有主从关系的父子表的装置。
7.一种将Excel表格数据提取的系统,其特征在于,包括:
用于将Excel文件加载到活字格的加载单元,所述加载单元包括用于以下动作的功能:将Excel文件加载到活字格的智能识别引擎容器中,并且智能识别引擎容器具有兼容Excel文件不同格式的功能;
用于智能识别引擎容器执行对Excel文件操作有关的所有命令的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的范围的装置;
用于确定所要生成数据库字段或者表的Excel文件中单元格的位置的装置;
其中,所确定的单元格范围包括所述Excel文件中的一个或多个单元格;
用于针对确定的单元格不同的范围获取单元格内容的装置;
用于将该获取的单元格内容作为字段或者表放入数据库中,即创建数据库的字段或者表的装置;
用于设定Excel单元格优先级的装置;
用于判断Excel文件中边框被设定的操作单元格与Excel文件中其他单元格之间距离的装置,该距离的远近是以单元格数量为单位判断;
用于判断单元格边框是否被设置的装置;
用于判断单元格边框中被设置的边框数量的装置;
用于判断被设置边框的单元格值是否为空的装置;
用于创建具有主从关系的父子表的装置。
CN201811087418.5A 2018-09-18 2018-09-18 一种Excel表格数据提取的系统和方法 Active CN109492196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811087418.5A CN109492196B (zh) 2018-09-18 2018-09-18 一种Excel表格数据提取的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811087418.5A CN109492196B (zh) 2018-09-18 2018-09-18 一种Excel表格数据提取的系统和方法

Publications (2)

Publication Number Publication Date
CN109492196A CN109492196A (zh) 2019-03-19
CN109492196B true CN109492196B (zh) 2022-11-25

Family

ID=65690470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811087418.5A Active CN109492196B (zh) 2018-09-18 2018-09-18 一种Excel表格数据提取的系统和方法

Country Status (1)

Country Link
CN (1) CN109492196B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738224B (zh) * 2020-07-28 2020-12-08 浙江明度智控科技有限公司 一种针对药品文档内容的智能分析方法、系统和存储介质
CN112100993A (zh) * 2020-09-21 2020-12-18 珠海格力电器股份有限公司 表单构建方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024039A (zh) * 2010-12-01 2011-04-20 北京神州泰岳软件股份有限公司 基于eoms系统的表单生成方法
CN103853806A (zh) * 2013-09-26 2014-06-11 深圳海联讯科技股份有限公司 一种表格转换方法及装置
CN103970736A (zh) * 2013-01-25 2014-08-06 苏州精易会信息技术有限公司 一种将Excel表格转换成数据库表的方法
CN106933835A (zh) * 2015-12-29 2017-07-07 航天信息软件技术有限公司 一种兼容性解析Excel文件的数据导入方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024039A (zh) * 2010-12-01 2011-04-20 北京神州泰岳软件股份有限公司 基于eoms系统的表单生成方法
CN103970736A (zh) * 2013-01-25 2014-08-06 苏州精易会信息技术有限公司 一种将Excel表格转换成数据库表的方法
CN103853806A (zh) * 2013-09-26 2014-06-11 深圳海联讯科技股份有限公司 一种表格转换方法及装置
CN106933835A (zh) * 2015-12-29 2017-07-07 航天信息软件技术有限公司 一种兼容性解析Excel文件的数据导入方法及系统

Also Published As

Publication number Publication date
CN109492196A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
US8213719B2 (en) Editing 2D structures using natural input
US7770107B2 (en) Methods and systems for extracting and processing translatable and transformable data from XSL files
US20160070688A1 (en) Displaying annotations of a document by augmenting the document
US20190227773A1 (en) Programming in a precise syntax using natural language
CN103279455B (zh) 电子表格的样式处理方法和装置
US20130174024A1 (en) Method and device for converting document format
US20160275067A1 (en) Domain-based generation of communications media content layout
CN114330233A (zh) 通过文件底版实现电子表单内容与文件相互关联的方法
CN109492196B (zh) 一种Excel表格数据提取的系统和方法
CN106469140A (zh) 一种报表生成系统及其方法
CN103827857A (zh) 个人化内容递送系统和方法
US11887011B2 (en) Schema augmentation system for exploratory research
CN108763176A (zh) 一种文档处理方法及装置
US20150248382A1 (en) Apparatus and method for converting an electronic form
CN106202013B (zh) 一种网页版excel的实现方法
CN110413979A (zh) 基于图像识别技术的行业表格数字化处理方法
CN104090920A (zh) 一种实现数字内容跨终端出版的系统
CN106446116A (zh) 应用于规则引擎中的业务规则参数交互方法及装置
US20130007598A1 (en) Techniques for applying cultural settings to documents during localization
CN111401027B (zh) 版式模板文件升级方法和装置
CN109086260B (zh) 食品数据处理方法及装置
CN115599367A (zh) 能源大数据的采集、整理及建立可视化平台的方法
Palekar et al. Deep web data extraction using web-programming-language-independent approach
CN114860867A (zh) 训练文档信息抽取模型、文档信息抽取的方法和装置
CN109885743B (zh) 一种网页数据信息提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant