CN102314514A - 一种表格数据结构化的作用域方法 - Google Patents

一种表格数据结构化的作用域方法 Download PDF

Info

Publication number
CN102314514A
CN102314514A CN201110279581A CN201110279581A CN102314514A CN 102314514 A CN102314514 A CN 102314514A CN 201110279581 A CN201110279581 A CN 201110279581A CN 201110279581 A CN201110279581 A CN 201110279581A CN 102314514 A CN102314514 A CN 102314514A
Authority
CN
China
Prior art keywords
configuration file
action scope
database
infosystem
form document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110279581A
Other languages
English (en)
Other versions
CN102314514B (zh
Inventor
刘昱
阎光荣
赵罡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN 201110279581 priority Critical patent/CN102314514B/zh
Publication of CN102314514A publication Critical patent/CN102314514A/zh
Application granted granted Critical
Publication of CN102314514B publication Critical patent/CN102314514B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种表格数据结构化的作用域方法,属于信息技术领域技术领域,包括第一步:将信息系统中已定义的表格文件列出,供用户进行选择;第二步;创建配置文件;第三步:定义表格单元格同数据库字段间的映射关系;第四步:对于处于表格文件中的单元格,指定其作用域关键字;第五步,保存配置文件信息。发明提出一种表格数据结构化的作用域方法,使用表格文件同数据库的映射关系文件及对象记录的作用域指定方法,可以很好的解决管理信息系统中以表格软件做为数据录入工具时,信息的提取入库,多个数据对象及其之间逻辑关系的处理等问题,增强了系统实施过程中的灵活性与便利性,有效的缩短系统的实施周期。

Description

一种表格数据结构化的作用域方法
技术领域
本发明属于信息技术领域技术领域,具体涉及一种表格数据结构化的作用域方法。
背景技术
在一些管理信息系统中,因为用户的使用习惯及直观表达等原因,经常会使用一些表格工具软件(如EXCEL)做为数据的录入工具,或是在一些客户端工具中以表格的方式(如二维设计图纸中的明细表)写入信息。而对于这部分录入的信息,由于后台管理信息系统的需要,通常需要以结构化数据的方式存入到数据库中,以便于实现信息系统中数据管理及上下游数据传递的需要。
对于一些结构相对比较简单的表格录入信息,可以在系统中直接利用数据库绑定的方式或是在程序中直接固定表格列同数据库属性的映射关系的方式,实现表格数据的结构化存入数据库。但在实际应用中,这些方法都会有一些难以回避的问题:
1、实现方式难于通用化:
在一些较为复杂的管理信息系统中,动辄有几十上百种的表格需要录入,这些表格的格式、需要录入的信息各不相同,同理,对应于数据库中的库表及字段也各不相同。很难用一种通用的数据库绑定方式将其与数据库关联;而对于将数据库的映射关系在程序中固定的方式,一遇到表格格式的变化或种类的增加,都需要开发人员去修改程序。极大的增加了开发人员的工作量及系统应用的难度及周期,同样不是一种理想的实现方式。
2、无法处理复杂的数据结构:
在一些较为复杂的数据表格中,表格结构往往是二维甚至三维的形式,会涉及到多个类、多个对象、多个字段信息的相互组合,这些信息间又会存在严格的数据逻辑关系。仅仅通过简单字段绑定很难将这些信息准确的生成相应的数据库记录,写入到对应的库表及字段,并建立记录间的关联关系。所以必须有一种对表格中的信息及关联加以抽象分析,并准确描述的数据映射方式,才能实现对复杂表格数据的结构化存入。
发明内容
针对现有技术中存在的问题,本发明提出一种表格数据结构化的作用域方法。本发明通过配置文件的形式保存文件表格数据同数据库表及字段间的映射关系,还解决在表格中多条记录及记录间还有复杂关联关系的表格数据的数据关系定义,并通过解析定义的表格同数据库间的映射关系文件将表格数据结构化的存入数据库中。
本发明提出一种表格数据结构化的作用域方法,包括以下几个步骤:
第一步:将信息系统中已定义的表格文件列出,供用户进行选择:
用户点击进入信息系统后,信息系统将已经定义了配置文件的表格文件列出,供用户进行选择,用户可以选择一个已存在配置文件的表格文件进行修改,也可以再添加一份新的表格文件进行配置;
第二步:当用户点击选择一份表格文件后,信息系统首先判断是否已存在该表格文件的配置文件,如不存在,则信息系统自动创建一份该表格文件的配置文件,在用户选择为表格文件创建一份新的配置文件时,信息系统会自动创建一份配置文件,配置文件名称与表格文件的名称相同;
第三步:定义表格单元格同数据库字段间的映射关系:
信息系统通过用户交互的方式,指定表格文件中单元格与数据库字段之间的映射关系,获得定义表格单元格同数据库字段间的映射关系的配置文件;
第四步:对于处于表格文件中的单元格,指定其作用域关键字:
将第三步中得到的定义表格单元格同数据库字段间的映射关系的配置文件通过用户交互的方式指定表格中的作用域关键字,并将此作用域关键字记录在该配置文件中,获得指定作用域关键字的配置文件;
表格文件上的一行或多行内容会对应需要存储表格数据的数据库中一条或多条对象记录,而数据库中的一条对象记录会在表格中对应一个相应的作用域,表格在此作用域中的数据均属于该对象记录的信息或是其子对象的信息,当指定了对象记录中的作用域关键字后,当关键字发生变化后,对象记录的作用域发生了变化,信息系统便认定当前表格中对象记录发生变化,则在内存中新增一条对象记录以及开始新的作用域;反之,则还处于相同的作用域内;
第五步,保存配置文件信息:
将第四步得到的指定作用域关键字的配置文件在数据库中进行保存。
本发明的优点在于:
(1)本发明提出一种表格数据结构化的作用域方法,使用表格文件同数据库的映射关系文件及对象记录的作用域指定方法,可以很好的解决管理信息系统中以表格软件做为数据录入工具时,信息的提取入库,多个数据对象及其之间逻辑关系的处理等问题,增强了系统实施过程中的灵活性与便利性,有效的缩短系统的实施周期。
(2)本发明提出一种表格数据结构化的作用域方法,可以灵活的处理表格数据间复杂的逻辑组合关系,支持表格中不同的数据对象拆分以及对象间复杂组合关系的处理。
(3)本发明提出一种表格数据结构化的作用域方法,对于表格数据的扩充及修改,可以不用修改源代码,直接通过表格数据结构化的作用域方法的配置功能就可以实现表格与数据库数据映射关系的变更。
附图说明
图1:本发明提出的一种表格数据结构化的作用域方法的流程图;
图2:本发明中配置文件的格式图;
图3:本发明中获得定义表格单元格同数据库字段间的映射关系的配置文件的格式图;
图4:本发明中获得指定作用域关键字的配置文件的格式图;
图5:本发明中表格文件示例图。
具体实施方式
下面将结合附图对本发明作进一步的详细说明。
本发明提出一种表格数据结构化的作用域方法,如图1所示,包括以下几个步骤:
第一步:将信息系统中已定义的表格文件列出,供用户进行选择。
所述的表格文件包括EXLCEL、WORD等通用格式的表格,也包括DWG、CXP等专用格式表格,这些表格的共同特点是它们的表格结构如列名称、行号等可以通用开放的接口读取,而表格中的单元格与数据库字段的映射关系,以及单元格之间的组合逻辑关系则是由其专用的配置文件进行记录的,且配置文件的定义与管理通过其专用的信息系统进行支撑。在用户点击进入信息系统后,信息系统会将已经定义了配置文件的表格文件列出,供用户进行选择,用户可以选择一个已存在配置文件的表格文件进行修改,也可以再添加一份新的表格文件进行配置。
第二步:当用户点击选择一份表格文件后,信息系统首先判断是否已存在该表格文件的配置文件,如不存在,则信息系统自动创建一份该表格文件的配置文件。配置文件的格式如下图2所示,在用户选择为表格文件创建一份新的配置文件时,信息系统会自动创建一份XML格式的配置文件,文件名称与表格文件的名称相同,仅配置文件的后缀名变更为XML。
第三步:定义表格单元格同数据库字段间的映射关系。
本发明所要解决的是表格文件中包含的数据信息如何被合理的保存到数据库中的问题,众所周知,数据库中的数据是以表、记录与字段的形式存储的。所以一张表格文件中的数据可能会对应数据库中的一张或多张表,一张表格文件的单元格中的信息也可能会对应数据库表中一个或多个字段。信息系统通过用户交互的方式,指定表格文件中单元格(在EXCEL等通用格式表格或CXP等专用格式表格中,每个单元格都具有一个唯一的标识)与数据库字段之间的映射关系,获得定义表格单元格同数据库字段间的映射关系的配置文件。所述的映射关系的定义为典型的映射关系定义,是一种用户交互操作的方法,用户选择了一个表格文件中的单元格,同时指定了数据库表中的特定字段,在点击确认按钮后,信息系统便会将这种映射关系记录在配置文件中。如图3所示的配置文件,定义了表格中列名称为“图纸编号”的单元格与数据库“Tool Planning”表中“CN_CODE”字段的映射关系。
第四步:对于处于表格文件中的单元格,指定其作用域关键字。
表格是一种常见的行列的组合方式,在表格中多行数据可能会从属于数据库中的一条记录对象。将第三步中得到的定义表格单元格同数据库字段间的映射关系的配置文件通过用户交互的方式指定表格中的作用域关键字,并将此作用域关键字记录在该配置文件中,获得指定作用域关键字的配置文件。
所述的作用域关键字的含义为:表格文件上的一行或多行内容,往往会对应需要存储表格数据的数据库中一条或多条对象记录,而数据库中的一条对象记录会在表格中对应一个相应的作用域,表格在此作用域中的数据均属于该对象记录的信息或是其子对象的信息。当指定了对象记录中的作用域关键字后,当关键字发生变化后,可以认为对象记录的作用域发生了变化;反之,则认为还处于相同的作用域内。
由于在表格文件的单元格中,对象记录间存在嵌套的关系(在表格中会包含多个数据库对象记录,某些对象记录可能是另外对象的子对象记录或孙子对象记录,我们称之为对象记录间的嵌套关系),所以对于一个对象记录下层的子对象记录,除了需要指定其本身的作用域关键字外,还需要指定其上层对象的作用域关键字。其上层对象记录的作用域关键字发生了变化,也就代表其本身的作用域关键字发生了变化,信息系统便认定当前表格中对象记录发生变化,则在内存中新增一条对象记录以及开始新的作用域。
如图4所示一段配置文件,对表格中对象记录的拆分方法是“按单元格名称拆分”(即以某个单元格名称作为作用域关键字),而这个作用域关键字名称是“工序号”。获取配置文件中保存的作用域关键字,在处理表格数据时,可以根据作用域关键字判断表格中数据库对象记录的作用域。
如图5所示,配置文件中已经指定了表格中的作用域关键字是“工序号”,因此在工序号发生变化时,信息系统判断表格中的作用域发生的变化。图5的1、2行属于一个作用域,3、4行属于另外一个作用域。通过作用域关键字的方法,以及表格中单元格与数据库字段的映射关系,可将表格数据对应的保存到数据库中的不同记录、不同字段中。
第五步,保存配置文件信息。
将第四步得到的指定作用域关键字的配置文件在数据库中进行保存。

Claims (1)

1.一种表格数据结构化的作用域方法,其特征在于:包括以下几个步骤:
第一步:将信息系统中已定义的表格文件列出,供用户进行选择:
用户点击进入信息系统后,信息系统将已经定义了配置文件的表格文件列出,供用户进行选择,用户可以选择一个已存在配置文件的表格文件进行修改,也可以再添加一份新的表格文件进行配置;
第二步:当用户点击选择一份表格文件后,信息系统首先判断是否已存在该表格文件的配置文件,如不存在,则信息系统自动创建一份该表格文件的配置文件,在用户选择为表格文件创建一份新的配置文件时,信息系统会自动创建一份配置文件,配置文件名称与表格文件的名称相同;
第三步:定义表格单元格同数据库字段间的映射关系:
信息系统通过用户交互的方式,指定表格文件中单元格与数据库字段之间的映射关系,获得定义表格单元格同数据库字段间的映射关系的配置文件;
第四步:对于处于表格文件中的单元格,指定其作用域关键字:
将第三步中得到的定义表格单元格同数据库字段间的映射关系的配置文件通过用户交互的方式指定表格中的作用域关键字,并将此作用域关键字记录在该配置文件中,获得指定作用域关键字的配置文件;
表格文件上的一行或多行内容会对应需要存储表格数据的数据库中一条或多条对象记录,而数据库中的一条对象记录会在表格中对应一个相应的作用域,表格在此作用域中的数据均属于该对象记录的信息或是其子对象的信息,当指定了对象记录中的作用域关键字后,当关键字发生变化后,对象记录的作用域发生了变化,信息系统便认定当前表格中对象记录发生变化,则在内存中新增一条对象记录以及开始新的作用域;反之,则还处于相同的作用域内;
第五步,保存配置文件信息:
将第四步得到的指定作用域关键字的配置文件在数据库中进行保存。
CN 201110279581 2011-09-20 2011-09-20 一种表格数据结构化的作用域方法 Expired - Fee Related CN102314514B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110279581 CN102314514B (zh) 2011-09-20 2011-09-20 一种表格数据结构化的作用域方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110279581 CN102314514B (zh) 2011-09-20 2011-09-20 一种表格数据结构化的作用域方法

Publications (2)

Publication Number Publication Date
CN102314514A true CN102314514A (zh) 2012-01-11
CN102314514B CN102314514B (zh) 2013-01-09

Family

ID=45427679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110279581 Expired - Fee Related CN102314514B (zh) 2011-09-20 2011-09-20 一种表格数据结构化的作用域方法

Country Status (1)

Country Link
CN (1) CN102314514B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760171A (zh) * 2012-06-18 2012-10-31 广东南方数码科技有限公司 基于cad图形实体的图形与数据关联的处理方法及装置
CN107622080A (zh) * 2017-07-28 2018-01-23 阿里巴巴集团控股有限公司 一种数据处理方法及设备
CN109308131A (zh) * 2018-08-24 2019-02-05 无锡加简软件开发有限公司 一种开槽机输入方法
CN115840539A (zh) * 2023-01-31 2023-03-24 天津南大通用数据技术股份有限公司 数据处理方法、装置、电子设备及存储介质
CN117648912A (zh) * 2024-01-29 2024-03-05 中国电建集团西北勘测设计研究院有限公司 一种识别多格式电子表格源数据的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0700000A2 (en) * 1994-08-30 1996-03-06 International Business Machines Corporation System and method combining a global object identifier with a local object address in a single object pointer
WO2000020996A1 (en) * 1998-10-05 2000-04-13 Digital Archaeology Corporation Data exploration system and method
CN101221564A (zh) * 2007-08-03 2008-07-16 哈尔滨工程大学 一种通用的自主数据采集方法
CN101253500A (zh) * 2005-08-31 2008-08-27 国际商业机器公司 用于管理i/o的方法
CN102024183A (zh) * 2009-09-11 2011-04-20 上海宝信软件股份有限公司 企业信息管理系统
CN102163188A (zh) * 2011-04-07 2011-08-24 北京数码大方科技有限公司 应用系统中excel报表的生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0700000A2 (en) * 1994-08-30 1996-03-06 International Business Machines Corporation System and method combining a global object identifier with a local object address in a single object pointer
WO2000020996A1 (en) * 1998-10-05 2000-04-13 Digital Archaeology Corporation Data exploration system and method
CN101253500A (zh) * 2005-08-31 2008-08-27 国际商业机器公司 用于管理i/o的方法
CN101221564A (zh) * 2007-08-03 2008-07-16 哈尔滨工程大学 一种通用的自主数据采集方法
CN102024183A (zh) * 2009-09-11 2011-04-20 上海宝信软件股份有限公司 企业信息管理系统
CN102163188A (zh) * 2011-04-07 2011-08-24 北京数码大方科技有限公司 应用系统中excel报表的生成方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760171A (zh) * 2012-06-18 2012-10-31 广东南方数码科技有限公司 基于cad图形实体的图形与数据关联的处理方法及装置
CN107622080A (zh) * 2017-07-28 2018-01-23 阿里巴巴集团控股有限公司 一种数据处理方法及设备
CN107622080B (zh) * 2017-07-28 2020-10-30 创新先进技术有限公司 一种数据处理方法及设备
CN109308131A (zh) * 2018-08-24 2019-02-05 无锡加简软件开发有限公司 一种开槽机输入方法
CN115840539A (zh) * 2023-01-31 2023-03-24 天津南大通用数据技术股份有限公司 数据处理方法、装置、电子设备及存储介质
CN115840539B (zh) * 2023-01-31 2023-05-16 天津南大通用数据技术股份有限公司 数据处理方法、装置、电子设备及存储介质
CN117648912A (zh) * 2024-01-29 2024-03-05 中国电建集团西北勘测设计研究院有限公司 一种识别多格式电子表格源数据的方法
CN117648912B (zh) * 2024-01-29 2024-05-03 中国电建集团西北勘测设计研究院有限公司 一种识别多格式电子表格源数据的方法

Also Published As

Publication number Publication date
CN102314514B (zh) 2013-01-09

Similar Documents

Publication Publication Date Title
CN110674228B (zh) 数据仓库模型构建和数据查询方法、装置及设备
US11468103B2 (en) Relational modeler and renderer for non-relational data
Holzschuher et al. Querying a graph database–language selection and performance considerations
CN105630864A (zh) 存储行标识符值的字典的强制排序
Chavan et al. Survey paper on big data
CN111324610A (zh) 一种数据同步的方法及装置
CN102999537A (zh) 一种数据迁移系统和方法
WO2019032193A1 (en) REPRESENTATIONS OF SERIALIZABLE AND SERIALIZED INTERACTIONS
CN103890709A (zh) 基于缓存的键值数据库映射和复制
US20120158453A1 (en) Workflow processing system for supporting multi-tenant, and method thereof
WO2019032194A1 (en) CREATING, MANAGING AND TRANSFERRING SETS OF REPRESENTATIONS OF INTERACTIONS
CN102314514B (zh) 一种表格数据结构化的作用域方法
US11200201B2 (en) Metadata storage method, device and server
CN103123651B (zh) 一种查看多个同类文件的方法、装置和移动设备
Kelly et al. NSF workshop on task-based information search systems
CN103559247A (zh) 一种数据业务处理方法及装置
CN114238085A (zh) 接口测试方法、装置、计算机设备、存储介质
CN102521383A (zh) 一种分布式系统中的海量文件存储和访问方法
CN102955808A (zh) 一种数据获取方法和分布式文件系统
Song et al. Users' attitude and strategies in information management with multiple computers
CN110851515A (zh) 一种基于Spark分布式环境下的大数据ETL模型执行方法及介质
Reniers et al. Schema design support for semi-structured data: Finding the sweet spot between NF and De-NF
TW201941124A (zh) 樣本回放資料存取方法及裝置
CN112115115B (zh) 基于数据仓库的文件移动方法、设备和存储介质
Dhanda Big data storage and analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130109

Termination date: 20130920