CN103631966B - 一种可配置的解析多值匹配字段的方法 - Google Patents

一种可配置的解析多值匹配字段的方法 Download PDF

Info

Publication number
CN103631966B
CN103631966B CN201310701544.6A CN201310701544A CN103631966B CN 103631966 B CN103631966 B CN 103631966B CN 201310701544 A CN201310701544 A CN 201310701544A CN 103631966 B CN103631966 B CN 103631966B
Authority
CN
China
Prior art keywords
field
association
data
item
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310701544.6A
Other languages
English (en)
Other versions
CN103631966A (zh
Inventor
韩红强
王朋展
李泉泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonyou Network Technology Co Ltd
Original Assignee
Yonyou Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonyou Network Technology Co Ltd filed Critical Yonyou Network Technology Co Ltd
Priority to CN201310701544.6A priority Critical patent/CN103631966B/zh
Publication of CN103631966A publication Critical patent/CN103631966A/zh
Application granted granted Critical
Publication of CN103631966B publication Critical patent/CN103631966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种可配置的解析多值匹配字段的方法,可以灵活地设置字段关联规则,根据设置的关联规则,在导入数据时自动进行校验,校验输入的数据是否存在错误,如果存在错误,将进行提示,从而准确地导入用户想要的数据。本发明可应用于ERP产品中的导入工具,适用于导入某些存在多值匹配情况的特殊字段。通过设置特定规则,使得多值匹配字段可以在导入时能够确定唯一值,以保证导入数据的准确性。

Description

一种可配置的解析多值匹配字段的方法
技术领域
本发明涉及一种解析多值匹配字段的算法,特别涉及一种可配置的解析多值匹配字段的方法。
背景技术
现有技术中,在使用导入工具导入数据时,所导入的数据中往往存在与多值相匹配的字段,影响数据导入的效率。
现有解决方案中,通过添加特定的限制条件,使得所导入的数据与参照字段之间唯一匹配。但是这种解决方式灵活性差,如果字段之间的依赖规则发生变化或者用户希望能够自定义一些依赖规则,这种解决方案就无法应对了。
发明内容
为克服上述现有技术的不足,本发明提供了一种可配置的解析多值匹配字段的方法,
步骤301,开始;
步骤302,设置选定字段名的关联匹配项;
步骤303,选定字段名与所选择的关联参照项之间的关联关系以键值对的形式保存;
步骤304,将所保存的选定字段名与所选择的关联参照项之间的关联关系写入到导出的格式文件中;
步骤305,获取导入数据;
步骤306,导入所获取导入数据的格式文件;
步骤307,将格式文件的数据转换成数据对象;
步骤308,读取格式文件中保存的关联关系;
步骤309,对各字段名进行匹配解析;
步骤310,判断是否得到匹配;
如果在步骤310,判断的结果为得到了匹配;
在步骤312中判断匹配为仅得到一个值,则继续步骤314,当前字段匹配成功;
步骤315,判断是否匹配到最后一个字段;如果判断结果为否,则返回步骤309;
如果步骤315的判断结果为是,则执行步骤316,根据组装后的数据对象,进行数据的导入;
步骤317,结束。
优选地,如果在步骤310判断结果为未得到匹配,则在步骤311,提示匹配失败,并调整字段的数据或关联关系,并返回到步骤305。
优选地,如果在步骤312中判断的结果为得到的匹配值不唯一,则进行到步骤313,提示匹配值不唯一,调整字段的数据或关联关系,并返回到步骤305。
优选地,在导入数据时使用Excel模板进行导入。
优选地,针对每一字段名,事先设置可供选择的关联参照项;设置时根据选定字段名以及相应的可供选择的关联参照项进行选择。
优选地,在步骤308,读取格式文件中保存的关联关系后,进一步根据字段名之间关联关系的深度进行排序。
优选地,所述字段名之间关联关系为依赖关系,所述排序为升序排序。
优选地,在步骤309,进一步按照升序对各字段名进行匹配解析。
使用本发明的有益效果在于:本发明可应用于ERP产品中的导入工具,适用于导入某些存在多值匹配情况的特殊字段。通过设置特定规则,使得多值匹配字段可以在导入时能够确定唯一值,以保证导入数据的准确性。
附图说明
图1示出了根据本发明的一个实施例的数据导入示意图;
图2示出了根据本发明的一个实施例的数据依赖次数示意图;
图3示出了根据本发明的一个实施例的关联参照项解析流程图;
图4示出了根据本发明的一个实施例的关联数据匹配结果提示示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种可配置的解析多值匹配字段的方法其具体实施方式、特征及其功效,详细说明如后。在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
参照类型是ERP软件中的一种数据类型,该类型在客户端界面以编码或名称形式展示,但在数据库中以主键值存储。关联参照,是与该参照类型字段有上下级或限制关系的另一个参照类型字段。在本发明的一个具体实施方式中,解析参照类型的字段时,对于参照类型的字段设置关联参照规则;在解析参照类型的字段时,根据已设置的关联参照规则进行参照数据的解析。
图1示出了根据本发明的一个实施例的数据导入示意图。如图1所示,为方便设置关联参照规则,针对每一个参照类型的字段,可事先设置可供选择的关联参照。“员工信息功能维护”功能节点下的“工作记录”中,对于每一个员工号都对应有多个字段名。为了便于数据导入,对于每个字段名必须设置关联参照项。以特定员工号下的“异动原因”字段名为例,通过分析可知,可供选择的关联参照项可以为“人员任职ID”、“开始日期”、“员工号”、“创建时间”、“创建人”、“分布式”、“免职方式”、“结束日期”、“结束”、“主职”、“任职方式”以及“最新记录”等属性。对于特定员工号下的“异动原因”字段名可能的关联参照项只能为“人员任职ID”、“开始日期”、“员工号”、“创建时间”、“创建人”、“分布式”、“免职方式”、“结束日期”、“结束”、“主职”、“任职方式”以及“最新记录”中的一种。因此,对于每个字段名可以预先设置可供关联参照项。在利用导入工具进行导入操作时,可以如图1右下方图示,在选定对于异动原因字段名进行关联参照项设置时,提示可能的所有关联参照项的属性名称供选择。导入数据时,可以根据提示直接选定。显示关联参照项的属性名称时,当受限于页面布局时,可以提供翻页工具或者滚动条以显示其余关联参照项的属性名称。
在本发明的一个具体实施方式中,例如“岗位”字段名的关联参照项可以设置为“部门”,“部门”字段名的关联参照项可设置为“组织”。为了方便提示可能的所有关联参照项的属性名称供选择,可以借助导出模板提供关联参照项的提示列。导出模板时,将设置的关联参照项信息将会以Map的形式保存在Excel模板中,在导入数据时将关联参照项信息读取到HashMap中。
在本发明的一个具体实施方式中,使用导入工具进行数据导入时,关联参照项的属性名称字段在例如excel的导入工具中大都是以编码或名称的形式存在,而在数据库是以主键(Primary Key,PK)的形式存在。因此,在利用导入工具导入数据时还需要进行解析。在解析关联参照项字段时,必须得到该关联参照项字段的关联参照真实值,作为查询条件的一部分。
例如,以“公司A”为例,导入工具中有关“部门”字段的输的信息为“信息部”,且所设置的关联参照字段为“组织”。在对“部门”字段进行解析时,提取“公司A”的PK值作为解析“信息部”的条件,从而在“公司A”下能唯一匹配到一个部门,即“信息部”。为了保证关联参照项字段已经解析过,例如确保在解析“信息部”时已经将“公司A”解析成相应PK值,在本发明的一个具体实施方式中,可以提取关联参照字段的依赖次数,并将提取出的依赖次数进行排序,按照排序从低到高进行解析,从而保证在解析“部门”字段时它所依赖的字段的关联参照字段都已经解析完毕。
如图2所示,在代码中的处理就是根据每个参照列的依赖次数进行从小到大排序,然后对排好序的列依次解析。图中,HR1为一个人力资源组织,BU1,BU2为HR1下的两个部门,Dept1,Dept2,Dept3分别为BU1,BU2下的三个岗位。若关联参照设定为:岗位→部门→组织→集团,则“集团”字段的依赖次数为0,“组织”字段的依赖次数为1,“部门”字段的依赖次数为2,“岗位”字段的依赖次数为3。因此依赖次数按照升序的排列顺序为:集团→组织→部门→岗位。在导入与人员相关的信息时,信息中包含该人员的所属“集团”、所属“组织”、所属“部门”以及所在“岗位”等四个字段。在进行数据导入时,按照之前排列的依赖次数升序的顺序,优先解析所属“集团”字段的主键值,进而解析它的下级字段—“组织”预设的关联参照项,以此类推,直到所有的关联参照项字段解析完成。在字段解析的过程中,对于没有匹配到结果或匹配结果不只一个的情况时,都会反馈结果中增加一个当前解析字段的错误信息,待所有字段解析完成后,结果中的错误信息将会显示在用户界面上,指导用户对格式文件中的数据进行修改。只有匹配值唯一的字段才算解析成功。
图3示出了根据本发明的一个实施例的关联参照的处理流程图。步骤301,开始;步骤302,设置选定字段名的关联匹配项;为方便设置关联参照规则,针对每一字段名,可以事先设置可供选择的关联参照项;设置时可以根据选定字段名以及相应的可供选择的关联参照项进行选择;步骤303,选定字段名与所选择的关联参照项之间的关联关系以键值对的形式进行保存。例如将上述实施例中的集团、组织、部门、岗位。将以岗位→部门,部门→组织,组织→集团的形式,(箭头左参照字段,作为键,右边为关联参照字段,作为值)进行存储到,优选地,可以存储到HashMap中,HashMap是基于哈希表的Map接口的实现;步骤304,将所保存的选定字段名,例如在HashMap中所保存的选定字段名与所选择的关联参照之间的关联关系写入到导出的格式文件中;格式文件,是在设置好关联参照后,由系统导出的一个Excel文件,文件中包含需要导入数据的格式以及一些配置信息;步骤305,获取导入数据;步骤306,导入所获取导入数据的文件;此处的文件,是用户在上述格式文件上,填写需要导入的数据信息,所生成的导入文件;步骤307,将格式文件的数据转换成数据对象,例如将人员的一些属性,例如身份证号、姓名、家庭地址等信息,整合转换成为人员的数据对象;步骤308,读取格式文件中保存的关联关系,根据字段名之间关联关系的深度,即依赖关系进行升序排序;步骤309,按照升序对各字段名进行匹配解析;步骤310,判断是否得到匹配;如果未得到匹配,则在步骤311,提示匹配失败,并调整字段的数据或关联关系;例如导入某公司的人员信息时,提示某个人员的岗位字段匹配失败。这种情况说明导入文件中,所填写此人的部门下,不存在所填写的岗位。应检查所填写岗位的编码、名称是否正确,或者检查此人的部门字段是否填写正确。调整之后再作导入;并返回到步骤305;如果在步骤310,判断的结果为得到了匹配,则在步骤312中进一步判断匹配是否仅得到一个值,如果判断结果为得到的匹配值不唯一,则进行到步骤313,提示匹配值不唯一,调整字段的数据或关联关系;例如导入某公司的人员信息时,提示某个人员的岗位字段匹配到的值不唯一。这种情况说明,根据导入文件中所填写此人的岗位编码、名称,匹配到了不唯一的值,这是由于岗位字段的上级字段设置错误。应检查岗位的上级字段部门,或部门的上级字段组织,或组织的上级字段集团,找到错误的字段,做出调整之后再作导入,并返回到步骤305;在步骤312中判断匹配为仅得到一个值,则继续步骤314,当前字段匹配成功;步骤315,判断是否匹配到最后一个字段;如果判断结果为否,则返回步骤309;如果步骤315的判断结果为是,则执行步骤316,根据组装后的数据对象,进行数据的导入;步骤317,结束。
图4示出了根据本发明的一个实施例的关联数据匹配结果提示示意图。图中人员CY00004的部门字段填写有误,在匹配此字段时,在组织“中国联通(总部)”下,无法匹配到“行政部”,导致数据匹配不成功。
通过本发明,不仅解决了在数据导入时,无法正确解析多值匹配字段的问题。还可以方便用户,使其能自定义关联规则,设置自己想要的字段前置关系,以导入正确的数据。
以上说明对本发明而言只是说明性的,而非限制性的,本领域普通技术人员理解,在不脱离权利要求所限定的精神和范围的情况下,可做出许多修改、变化或等效,但都将落入本发明的保护范围之内。

Claims (3)

1.一种可配置的解析多值匹配字段的方法,其特征在于:
步骤301,开始;
步骤302,设置选定字段名的关联参照项,为方便设置关联参照规则,针对每一字段名,事先设置可供选择的关联参照项;
步骤303,选定字段名与所选择的关联参照项之间的关联关系以键值对的形式保存;
步骤304,将所保存的选定字段名与所选择的关联参照项之间的关联关系写入到导出的格式文件中;
步骤305,用户在步骤304格式文件上,填写需要导入的数据信息,生成导入文件;
步骤307,将导入文件的数据转换成数据对象;
步骤308,读取导入文件中保存的关联关系;在步骤308,读取导入文件中保存的关联关系后,进一步根据字段名之间关联关系的深度进行升序排序;
步骤309,对升序排序后的字段按顺序进行匹配解析;
步骤310,判断是否得到匹配;
如果在步骤310,判断的结果为得到了匹配,则执行步骤312;
在步骤312中判断匹配是否仅得到一个值,如果是,则说明匹配成功,执行步骤314,在步骤314中,继续匹配下一个字段,并执行步骤315;
步骤315,判断是否匹配到最后一个字段;如果判断结果为否,则返回步骤309;
如果步骤315的判断结果为是,则执行步骤316,根据组装后的数据对象,进行数据的导入,执行步骤317;
步骤317,结束;
如果在步骤310判断结果为未得到匹配,则在步骤311,提示匹配失败,并调整字段的数据或关联关系,并返回到步骤305;
如果在步骤312中判断的结果为得到的匹配值不唯一,则进行到步骤313,提示匹配值不唯一,调整字段的数据或关联关系,并返回到步骤305。
2.如权利要求1的方法,其特征在于:
在导入数据时使用Excel模板进行导入。
3.如权利要求2的方法,其特征在于:
针对每一字段名,事先设置可供选择的关联参照项;设置时根据选定字段名以及相应的可供选择的关联参照项进行选择。
CN201310701544.6A 2013-12-18 2013-12-18 一种可配置的解析多值匹配字段的方法 Active CN103631966B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310701544.6A CN103631966B (zh) 2013-12-18 2013-12-18 一种可配置的解析多值匹配字段的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310701544.6A CN103631966B (zh) 2013-12-18 2013-12-18 一种可配置的解析多值匹配字段的方法

Publications (2)

Publication Number Publication Date
CN103631966A CN103631966A (zh) 2014-03-12
CN103631966B true CN103631966B (zh) 2017-10-10

Family

ID=50213007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310701544.6A Active CN103631966B (zh) 2013-12-18 2013-12-18 一种可配置的解析多值匹配字段的方法

Country Status (1)

Country Link
CN (1) CN103631966B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038161B (zh) * 2015-07-13 2021-03-26 阿里巴巴集团控股有限公司 一种用于过滤数据的设备及方法
CN105447114A (zh) * 2015-11-13 2016-03-30 中科曙光信息技术无锡有限公司 表单中字段的显示方法和装置
CN106802898B (zh) * 2015-11-26 2020-09-04 北大方正集团有限公司 数据录入方法及装置
CN105938486A (zh) * 2016-04-14 2016-09-14 中国银行股份有限公司 一种关联字段的检查方法及装置
CN107305615B (zh) * 2016-04-25 2019-12-17 深信服科技股份有限公司 数据表识别方法和系统
CN107436872A (zh) * 2016-05-25 2017-12-05 阿里巴巴集团控股有限公司 一种异构数据的处理方法及装置
CN107247767B (zh) * 2017-06-05 2020-08-04 浪潮通用软件有限公司 一种通过格式化数据文件导入数据库的方法及装置
CN108600107B (zh) * 2017-11-07 2021-06-01 北京交通大学 一种可自定义内容字段的流匹配方法
CN108595597A (zh) * 2018-04-19 2018-09-28 平安科技(深圳)有限公司 数据导入方法、装置、计算机设备和存储介质
CN113642308B (zh) * 2021-08-30 2022-07-22 重庆允成互联网科技有限公司 基于数据可变的数据导入方法、系统、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7444515B2 (en) * 2003-08-14 2008-10-28 Washington University Method and apparatus for detecting predefined signatures in packet payload using Bloom filters
WO2011011916A1 (zh) * 2009-07-29 2011-02-03 华为技术有限公司 正则表达式匹配方法和系统及查找装置
CN102103710B (zh) * 2009-12-21 2013-08-07 中国移动通信集团公司 Erp系统接入控制方法及平台
CN102609483B (zh) * 2012-01-19 2014-07-16 北京思特奇信息技术股份有限公司 一种基于配置方式的Excel通用导入方法
CN102945160A (zh) * 2012-10-24 2013-02-27 浪潮集团山东通用软件有限公司 一种不依赖于规则配置的导入excel数据的通用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于对象关系的通用数据导入算法";丁鑫 等;《计算机工程》;20080630;第34卷(第11期);第58页第1段-第60页第2栏最后1段 *

Also Published As

Publication number Publication date
CN103631966A (zh) 2014-03-12

Similar Documents

Publication Publication Date Title
CN103631966B (zh) 一种可配置的解析多值匹配字段的方法
CN106980637B (zh) Sql审核方法和装置
CN104486075B (zh) 一种智能变电站icd模型文件数字签名的验证方法
CN106547729B (zh) 一种数据报表的动态生成方法及系统
WO2016060547A1 (en) Emulating manual system of filing using electronic document and electronic file
CN104036187B (zh) 计算机病毒类型确定方法及其系统
CN109102844A (zh) 一种临床试验源数据自动校验方法
CN113836038B (zh) 测试数据构造方法、装置、设备及存储介质
CN106649500A (zh) 数据核对方法及系统
CN113495902A (zh) 数据处理方法及数据标准管理系统
CN106372044A (zh) 一种基于报表生成类型化维度xbrl报告的方法
WO2016060552A1 (en) System generator module for electronic document and electronic file
CN102971703B (zh) 数据库搜索的加强查询
CN103440232A (zh) 一种科技论文标准化自动检测编辑方法
CN109062872A (zh) 一种对不同格式报关文件进行统一处理的算法
CN110837998A (zh) 一种合同审核方法、装置、设备以及介质
CN112802607B (zh) 一种医疗数据治理系统
WO2016060550A1 (en) Electronic processing system for electronic document and electronic file
WO2014040488A1 (zh) 一种规划数据一致性保证的方法和装置
CN109933769A (zh) 一种基于Excel的报表数据快速解析方法
CN107103528A (zh) 一种财务进出账单反馈系统
CN110347709A (zh) 一种规则引擎的构建方法及系统
CN105573972B (zh) 报表校验公式的生成方法及装置
CN105335459A (zh) 基于xbrl智能报告平台的合并报表数据抽取方法
CN109324963B (zh) 自动测试收益结果的方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park

Applicant after: Yonyou Network Technology Co., Ltd.

Address before: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park

Applicant before: UFIDA Software Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant