CN104484321B - 一种二维表格定义的方法及系统 - Google Patents

一种二维表格定义的方法及系统 Download PDF

Info

Publication number
CN104484321B
CN104484321B CN201510003009.2A CN201510003009A CN104484321B CN 104484321 B CN104484321 B CN 104484321B CN 201510003009 A CN201510003009 A CN 201510003009A CN 104484321 B CN104484321 B CN 104484321B
Authority
CN
China
Prior art keywords
cell
dimensional table
target
value
gauge outfit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510003009.2A
Other languages
English (en)
Other versions
CN104484321A (zh
Inventor
蒋思茂
於杰
杨国勇
范磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SERVYOU SOFTWARE GROUP Co Ltd
Original Assignee
SERVYOU SOFTWARE GROUP Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SERVYOU SOFTWARE GROUP Co Ltd filed Critical SERVYOU SOFTWARE GROUP Co Ltd
Priority to CN201510003009.2A priority Critical patent/CN104484321B/zh
Publication of CN104484321A publication Critical patent/CN104484321A/zh
Application granted granted Critical
Publication of CN104484321B publication Critical patent/CN104484321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种二维表格定义的方法,包括:确定目标二维表格;并进行解析,获取其对象;按照预设顺序从对象中获取每个单元格的对象;将每个单元格的对象与多个预设的值单元格识别规则依次比较,当单元格的对象满足多个预设的值单元格识别规则中的一个时,将单元格作为候选值单元格;将每个候选值单元格与多个预设的表头单元格定位规则依次比较,当候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定候选值单元格为值单元格;将表头单元格按业务含义进行编码,作为值单元格的业务属性;将具有业务属性的值单元格组合后得到目标二维表格定义文件。能够简单、有效的进行二维表格的识别和定义。

Description

一种二维表格定义的方法及系统
技术领域
本申请涉及二维表格领域,特别涉及一种二维表格定义的方法及系统。
背景技术
随着技术的发展,人们对二维表格定义的要求越来越高。
现有的对二维表格进行定义的方法中,针对临时的、易变的结构化数据交换的场景,开发成本较高,需要编制脚本时易用性不好。
因此,如何简单、有效的进行二维表格的定义是本领域技术人员目前需要解决的技术问题。
发明内容
本申请所要解决的技术问题是提供一种二维表格定义的方法及系统,解决了现有技术中开发成本较高,需要编制脚本时易用性不好的问题。
其具体方案如下:
一种二维表格定义的方法,该方法包括:
确定目标二维表格;
对所述目标二维表格进行解析,获取所述目标二维表格的对象;
按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象;
将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格;
将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格;
将表头单元格按业务含义进行编码,作为所述值单元格的业务属性;
将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件。
上述的方法,优选的,
所述按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象为:
按照从左至右、从上到下的顺序从所述目标二维表格对象中获取每个单元格的对象。
上述的方法,优选的,
在对所述目标二维表格进行解析之前,还包括:
对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
一种二维表格定义的系统,该系统包括:
确定单元,用于确定目标二维表格;
解析单元,用于对所述目标二维表格进行解析,获取所述目标二维表格的对象;
获取单元,用于按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象;
第一比较单元,用于将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格;
第二比较单元,用于将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格;
编码单元,用于将表头单元格按业务含义进行编码,作为所述值单元格的业务属性;
组合单元,用于将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件。
上述的系统,优选的,还包括:
定义单元,用于对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
本申请提供的一种二维表格定义的方法,包括:确定目标二维表格;对所述目标二维表格进行解析,获取所述目标二维表格的对象;按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象;将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格;将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格;将表头单元格按业务含义进行编码,作为所述值单元格的业务属性;将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件。通过对所述目标二维表格值单元格的识别,并对识别后的值单元格进行表头单元格定位,将表头单元格按照业务含义进行编码,作为所述定位后的值单元格的业务属性,能够简单、有效的进行二维表格的识别和定义。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请的一种二维表格定义的方法实施例的流程图;
图2为本申请的一种二维表格定义的系统实施例的结构示意图。
具体实施方式
本发明的核心是提供一种二维表格定义的方法及系统,解决了现有技术中开发成本较高,需要编制脚本时易用性不好的问题。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,示出了本申请一种二维表格定义的方法实施例的流程图,可以包括以下步骤:
步骤S101:确定目标二维表格。
选择需要进行二维表格定义的二维表格,将所述选择的二维表格作为目标二维表格,后续对所述目标二维表格进行定义操作。
步骤S102:对所述目标二维表格进行解析,获取所述目标二维表格的对象。
本申请中,通过表格定义提取服务输入二维表格对象。
所述表格定义提取服务,作为从表格中提取表格定义文件的主服务,要求传入excel或华表文件对象,并输出表格定义xml文件。
步骤S103:按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象。
本申请中,表格解析服务按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象为:按照从左至右、从上到下的顺序从所述目标二维表格对象中获取每个单元格的对象。
步骤S104:将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格。
将所述获取的每个单元格的对象作为入参调用值单元格识别器,所述值单元格识别器将逐个调用值单元格规则的识别方法,只要有一个满足,则输出候选值单元格;所述值单元格识别器返回候选值单元格列表,所述候选值单元格列表中包含了所述目标二维表格中所有满足条件的候选值单元格。
所述值单元格识别器,负责识别表格中哪些单元格是值单元格。
所述值单元格识别规则,负责对值单元格的特征进行定义,值单元格识别器根据一系列可不断增加的值单元格识别规则来识别哪些是值单元格。
所述候选值单元格,通过值单元格识别器找到的单元格,但由于此时还未执行表头单元格的定位方法,所以还确定是不是一个真正的拥有表头单元格的值单元格。
步骤S105:将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格。
所述表格解析服务在获取由值单元格返回的一组候选值单元格后,将候选值单元格作为入参调用表头单元格定位器。
所述表头单元格定位器接收候选值单元格,逐个调用表头单元格定位规则的定位方法,只要有一个满足,则确认该候选值单元格为值单元格,并将表头单元格按业务含义编码后,作为值单元格的业务属性返回。如果未找到表头单元格,则表示此候选值单元格为非值单元格,不纳入后续的定义文件中。
所述表头单元格定位器,负责为值单元格查找对应的表头单元格。
所述表头单元格定位规则,负责对表头单元格的定位路径和特征进行定义,表头单元格定位器根据一系列的可不断增加的表头单元格定位规则来为值单元格找到表头单元格。
步骤S106:将表头单元格按业务含义进行编码,作为所述值单元格的业务属性。
所述值单元格通过headFieldId属性指定表头单元格,建立表头单元格和值单元格之间解释和被解释的关系。
所述表头单元格包括表头单元格编码、名称和数据类型等。
步骤S107:将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件。
经过对所有候选值单元格的表头单元格定位后,获取到一组具有业务含义编码属性的值单元格;将数据单元格组合后输出表单定义对象。
所述表格定义提取服务在获取由表格解析服务返回的表格定义对象后,将之输出为表格定义文件。
所述表格定义文件分为三部分,表格定义描述信息、值单元格部分和表头单元格部分。描述信息描述表格定义的创建人、创建时间、用途等。值单元格部分汇总了识别出来的所有值单元格。表头单元格部分汇总了识别出来的所有表头单元格。
本申请提供的一种二维表格定义的方法,通过对所述目标二维表格值单元格的识别,并对识别后的值单元格进行表头单元格定位,将表头单元格按照业务含义进行编码,作为所述定位后的值单元格的业务属性,能够简单、有效的进行二维表格的识别和定义。
本申请中,在对所述目标二维表格进行解析之前,还包括:
对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
所述二维表格的单元格分为值单元格和表头单元格。值单元格用来填报数据或展示数据之用;表头单元格用来解释值单元格的业务含义。
所述值单元格分为普通值单元格和正交值单元格。正交值单元格是指该值单元格的业务含义需要由上侧和左侧的表头单元格来解释。普通值单元格,相对于正交值单元格,只需上侧或左侧的一个表头单元格来解释其业务含义。正交值单元格,区别于普通值单元格,拥有两个表头单元格属性值。
本申请中,当所述目标二维表格定义文件定义完成后,可以利用所述目标二维表格定义文件进行数据采集、统计、查询和显示使用。
当确定好目标excel时,打开所述目标excel,得到所述目标excel对应的二维表格定义文件,用户可以对所述目标excel进行插入行或列的操作,当用户进行插入操作时,用户通过所述目标excel中目标单元格的原坐标值知道所述目标单元格变化后的表头单元格,根据表头单元格的ID在所述二维表格定义文件中对应的定义,在保存数据的数据库中获取与所述ID相对应的数据,可以对这些数据进行采集、统计、查询和显示操作。
应用本发明中的方法,就能从华表或excel定义的表格中提取表格定义文件,用于描述值单元格与表头单元格的关系,这就意味着通过华表或excel采集的数据,可以按表头单元格进行查询、统计和显示。
从表格定义者的角度来看,应用本发明,用户定义表格的过程就是在华表或excel中定义表格的过程,对于熟悉这些表格工具用户而言,表格定义毫无门槛。
从开发者的角度来看,结合本发明开发的结构化数据交换系统,无需为任何一张新表格的数据交换进行编程,也就是可以通过免编程就能满足新表格的数据交换和使用需求。
与上述本申请一种二维表格定义的方法实施例所提供的方法相对应,参见图2,本申请还提供了一种二维表格定义的系统实施例,在本实施例中,该系统包括:
确定单元201,用于确定目标二维表格。
解析单元202,用于对所述目标二维表格进行解析,获取所述目标二维表格的对象。
获取单元203,用于按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象。
第一比较单元204,用于将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格。
第二比较单元205,用于将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格。
编码单元206,用于将表头单元格按业务含义进行编码,作为所述值单元格的业务属性。
组合单元207,用于将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件。
本申请中,还包括:
定义单元,用于对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
综上所述,本申请提供的一种二维表格定义的方法及系统,可以简单、有效的进行二维表的定义。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本申请所提供的一种二维表格定义的方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (5)

1.一种二维表格定义的方法,其特征在于,该方法包括:
确定目标二维表格;
对所述目标二维表格进行解析,获取所述目标二维表格的对象;
按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象;
将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格;
将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格;
将表头单元格按业务含义进行编码,作为所述值单元格的业务属性;
将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件;所述目标二维表格定义文件包括表格定义描述信息、值单元格和表头单元格。
2.根据权利要求1所述的方法,其特征在于,所述按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象为:
按照从左至右、从上到下的顺序从所述目标二维表格对象中获取每个单元格的对象。
3.根据权利要求1所述的方法,其特征在于,在对所述目标二维表格进行解析之前,还包括:
对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
4.一种二维表格定义的系统,其特征在于,该系统包括:
确定单元,用于确定目标二维表格;
解析单元,用于对所述目标二维表格进行解析,获取所述目标二维表格的对象;
获取单元,用于按照预设的顺序从所述目标二维表格对象中获取每个单元格的对象;
第一比较单元,用于将所述每个单元格的对象与多个预设的值单元格识别规则依次比较,当所述单元格的对象满足所述多个预设的值单元格识别规则中的一个时,将所述单元格作为候选值单元格;
第二比较单元,用于将每个所述候选值单元格与多个预设的表头单元格定位规则依次比较,当所述候选值单元格满足所述多个预设的表头单元格定位规则中的一个时,则确定所述候选值单元格为值单元格;
编码单元,用于将表头单元格按业务含义进行编码,作为所述值单元格的业务属性;
组合单元,用于将所有具有业务属性的值单元格组合后得到所述目标二维表格定义文件;所述目标二维表格定义文件包括表格定义描述信息、值单元格和表头单元格。
5.根据权利要求4所述的系统,其特征在于,还包括:
定义单元,用于对所述目标二维表格进行定义,将所述目标二维表格的单元格分为值单元格和表头单元格。
CN201510003009.2A 2015-01-04 2015-01-04 一种二维表格定义的方法及系统 Active CN104484321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510003009.2A CN104484321B (zh) 2015-01-04 2015-01-04 一种二维表格定义的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510003009.2A CN104484321B (zh) 2015-01-04 2015-01-04 一种二维表格定义的方法及系统

Publications (2)

Publication Number Publication Date
CN104484321A CN104484321A (zh) 2015-04-01
CN104484321B true CN104484321B (zh) 2018-09-07

Family

ID=52758863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510003009.2A Active CN104484321B (zh) 2015-01-04 2015-01-04 一种二维表格定义的方法及系统

Country Status (1)

Country Link
CN (1) CN104484321B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765079B (zh) * 2018-07-27 2022-09-20 国信优易数据股份有限公司 一种表格信息的搜索方法及装置
CN110377604B (zh) * 2019-07-23 2022-06-24 北京小米移动软件有限公司 一种提取表格信息的方法、装置及介质
CN114547285B (zh) * 2022-03-03 2023-03-24 创新奇智(浙江)科技有限公司 表格数据含义推断方法、装置、计算机设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089261B2 (en) * 2002-07-25 2006-08-08 International Business Machines Corporation Programmable use of data extracted from common presentation files
CN101556606B (zh) * 2009-05-20 2010-12-01 同方知网(北京)技术有限公司 一种基于Web数值表格抽取的数据挖掘方法
CN103198069A (zh) * 2012-01-06 2013-07-10 株式会社理光 抽取关系型表格的方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Excel到XML数据自动转换组件的研究与应用;白仲贵;《中国优秀硕士学位论文全文数据库 信息科技辑》;20090115;正文第16页 *
From Tables to Frames;Aleksander Pivk et al.;《The Semantic Web-ISWC 2004》;20041231;第3298卷;第167页第2段第17-20行,第169页第4段,表2 *
基于XML的文档处理技术的研究与实现;吴治宗;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20060915;正文第28页第3.2.2节-第29页第3.2.3节,表3.2.1,图3.10 *

Also Published As

Publication number Publication date
CN104484321A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN103853842B (zh) 一种自动问答方法和系统
CN106649464B (zh) 一种中文地址树的构建方法及装置
CN104598557B (zh) 数据栅格化、用户行为分析的方法和装置
CN104504077B (zh) 网页访问数据的统计方法和装置
CN104484321B (zh) 一种二维表格定义的方法及系统
CN110019754A (zh) 一种知识库的建立方法、装置及设备
CN106649363A (zh) 数据查询方法及装置
CN106909566A (zh) 一种数据建模方法及设备
CN110209760A (zh) 历审案件关联的方法和装置、电子设备、计算机可读介质
CN109615172A (zh) 一种处理考核数据的方法及终端
CN104731809A (zh) 对象的属性信息的处理方法及装置
CN111190829B (zh) 一种路口测试模型数据自动构建方法和装置
CN111581390A (zh) 一种知识图谱的构建方法、装置以及电子设备
CN116302640A (zh) 异常分析方法、装置、计算机设备及计算机可读存储介质
CN112950086B (zh) 民航企事业单位绩效考核指标体系的动态构建方法及系统
KR100751276B1 (ko) 데이터 간 상관 정도를 파악할 수 있는 특허 맵 제공시스템및 그 방법
CN105373473B (zh) 基于原始信令解码的cdr准确性测试方法及测试系统
CN113592529B (zh) 债券产品的潜在客户推荐方法和装置
CN113139102B (zh) 数据处理方法、装置、非易失性存储介质及处理器
EP1569145A1 (en) System and apparatus for managing information on chemical substances used in products
CN106708873A (zh) 数据整合方法和装置
CN111339373B (zh) 一种图谱特征的提取方法、系统、计算机设备和存储介质
CN110502675B (zh) 基于数据分析的语音拨叫用户分类方法及相关设备
CN110427558B (zh) 资源处理事件的推送方法及装置
CN107066602A (zh) 一种新闻信息推送方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant