CN117236327A - 一种用于服务治理平台的自动映射方法和装置 - Google Patents
一种用于服务治理平台的自动映射方法和装置 Download PDFInfo
- Publication number
- CN117236327A CN117236327A CN202311339893.8A CN202311339893A CN117236327A CN 117236327 A CN117236327 A CN 117236327A CN 202311339893 A CN202311339893 A CN 202311339893A CN 117236327 A CN117236327 A CN 117236327A
- Authority
- CN
- China
- Prior art keywords
- interface
- mapping
- serviced
- field
- fields
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 227
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 47
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 11
- 238000005067 remediation Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 6
- 230000009191 jumping Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种用于服务治理平台的自动映射方法,包括:根据待服务接口的版本,确定是否查找待服务接口的字段的映射记录;当确定查找时,逐级从待服务接口所属系统、总系统查找待服务接口的字段的映射记录;若在所述系统、所述总系统中均未查找到所述待服务接口的字段的映射记录时,从所述服务治理平台的数据字段中查找所述待服务接口的字段的映射记录;若在所述服务治理平台的数据字段中未查找所述待服务接口的字段的映射记录时,通过双向最大匹配法对所述待服务接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;将所述字段中文名的分词结果与数据字典进行匹配,输出所述待服务接口的字段的映射值。
Description
技术领域
本发明涉及数据处理技术领域,尤指一种用于服务治理平台的自动映射方法和装置。
背景技术
随着信息技术的发展,银行内部系统越来越复杂,系统之间的接口也越来越多,而且这些接口的命名规范和字段定义也各不相同,给系统集成和维护带来了很大的困难。为了解决这一问题,银行需要一种服务治理平台,将所有系统的所提供的服务都注册到这个平台上,通过自动映射算法将不标准的服务映射成标准规范的服务,提供给外围系统调用。
目前,国内一些银行已经建立了服务治理平台,但是在治理方面,仍存在不少问题。服务治理平台在以往的使用过程中,均采用手工治理的模式,服务治理人员在工作过程中需要手工从数据字典中匹配原有标准字段,或新增标准字段,维护一系列相关文档,且企业服务总线开发人员需要开发大量重复性的配置文件,整体效率低,工作量大且数据有效性差。同时治理需求、开发任务的管理、任务及服务的数据需要依赖手工阶段性统计,不利于服务治理在全行进行推广,手工操作也容易出现错漏。
发明内容
本发明为了提高服务定义质量、提升服务开发效率、减少生产事件、提高服务治理的影响力和降低服务管理成本,对服务治理平台手动映射过程进行了优化改进。
本发明是通过以下技术实现的:
在一些实施例中,本发明提供一种用于服务治理平台的自动映射方法,包括:
根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录;
当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录;
若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录;
若在所述服务治理平台的数据字典中未查找所述待服务治理接口的字段的映射记录时,通过双向最大匹配法对所述待服务治理接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;
将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
在一些实施方式中,所述当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录,包括:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录,包括:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值,包括:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录,包括:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
在一些实施方式中,本发明提供一种用于服务治理平台的自动映射装置,包括:
确定模块,用于根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录;
查找模块,用于当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录;
所述查找模块,还用于若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录;
分词模块,用于若在所述服务治理平台的数据字典中未查找所述待服务治理接口的字段的映射记录时,通过双向最大匹配法对所述待服务治理接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;
匹配模块,用于将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
在一些实施方式中,所述查找模块,还用于:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述查找模块,还用于:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述匹配模块,还用于:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
在一些实施方式中,所述确定模块,还用于:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
本发明提供的一种高精度用于服务治理平台的自动映射方法和装置至少具有以下有益效果:
1.本发明的自动映射算法能够直接将需求方提供的接口字段按照服务治理规范重新生成一套符合服务治理标准的新字段,还能将修订的接口字段映射关系维持不变,从而提高服务的可维护性和接口治理维护效率。
2.本发明的自动映射算法能够自动将接口原始字段按照服务治理规范重新生成一套符合服务治理标准的新字段,自动规避错误映射,并判断人工操作的重复映射和错误映射,平台中用户可直接导出最新版的文档,信息资源共享,流程线上化,从而减少人工错误。
3.本发明中的该算法可以运行在服务治理平台上,实现自动映射功能。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明中一种用于服务治理平台的自动映射方法的一个实施例的示意图;
图2是本发明中一种用于服务治理平台的自动映射方法的另一个实施例的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
数据字典(Data Dictionary),数据字典是一个集中的、结构化的文档或数据库,用于定义和描述系统中使用的数据元素。它包含了系统中涉及的数据项、数据属性、数据类型、数据长度、数据关系等详细信息,为数据库设计提供了一致的数据定义和描述。
数据字典通常包括以下信息:数据项(Data ltem):定义系统中使用的数据元素,如字段名、属性名。数据类型(Data Type):描述数据项的类型,如整数、字符串、日期等。数据长度(Data Length):定义数据项的长度限制。数据格式(Data Format):描述数据项的格式要求,如日期格式、货币格式等。数据约束(Data Constraint):定义数据项的约束条件,如唯一性约束、非空约束等。
数据字典提供了一个统一的数据定义和说明,帮助设计人员和开发人员理解和使用系统中的数据元素,并确保数据的一致性和准确性。
在本发明的一个实施例中,如图1所示,本发明提供一种用于服务治理平台的自动映射方法,包括:
S100根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录。
具体的,首先要根据待服务治理接口的版本,对此待服务治理接口的类型进行判断,判断此待服务治理接口是新增接口还是修订接口,并且还进一步判断了待服务治理接口的字段是否存在新增部分。
示例性的,判断版本号(例如:1.0.0为新增接口,其他为修订)。
在本实施例中,对修订接口的字段是否存在新增进行了判断,即对接口的类型以及字段是否原有都进行了判断。
示例性的,若是修订接口则可以让原有字段沿用上一版本的映射。针对修订接口中新增的字段或新接口的字段,算法则判断该字段是否已经在其他接口中存在映射关系。S200当确定查找所述待服务治理接口的字段的映射记录时,优先从所述待服务治理接口所属系统查找所述待服务治理接口的字段的映射记录,若无映射记录,则于总系统中查找所述待服务治理接口的字段的映射记录。
其中,一个接口归属于一个系统。所属系统是指待服务治理接口所处的本系统,总系统是指银行的服务治理平台包括的所有系统。
服务注册绑定提供方系统,一个服务只会归属一个提供方系统,功能是同一类型,因此同一个系统的接口服务类型、字段较为类似。因此在本实施例中,先从所述待服务治理接口所属系统进行查询,如果在所述待服务治理接口所属系统未查询到,再从总系统中进行查询。
在本实施例中,通过这种逐级查询的方法能够节省查询的时间,提供查询的效率,并且能够实现全面完善的查询。
S300若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录。
其中,初始化时有一个数据字典,包含约4000字段,在治理过程自动映射后会向该数据字典持续新增标准字段。
S400若在所述服务治理平台的数据字典中未查找所述待服务接口的字段的映射记录时,通过双向最大匹配法对所述待服务接口的字段中文名进行分词处理,输出所述字段中文名的分词结果。
在本实施例中,算法首先判断接口版本,是新增接口还是修订接口,若是修订接口则原有字段沿用上一版本;针对修订接口中新增的字段或新接口字段:算法则判断该字段是否已经在其他接口中存在映射关系,若存在则沿用已存在的映射关系作为该接字段的映射值;若不存在将在数据字典中查找是否存在该字段,若存在则映射数据字典中的值;若不存在,则将字段做分词处理,采用双向最大匹配法,得出最后分词结果。分词算法是文本挖掘的基础。基于词表做分词,使用正向最大匹配法(FMM)对输入的一个文本序列从左至右,用算法切分出当前位置上长度最大的词。
首先计算得到词库中最长词语的长度,从字符串第一个位置开始,选择一个最大长度的词长片段,如果该字符串的长度不足最大词长,则选择该全部字符串;判断选择出的字符串长度是否在词库中,若在,则将此词分离出来,若不在,则从右边开始,逐一减少一个字符,直到这个片段存在在词库中结束,或者只剩下最后一个字结束;字符串变为上一步截取分词后剩下的部分序列,直到序列完全被分割;逆向最大匹配法(BMM)则与之相反,文本序列从右至左筛选。
大部分情况下,正向和逆向最大匹配法分词的结果是一样的,但是银行系统越来越复杂,接口也越来越多,涉及到的名词复杂而繁多,所以为了自动生成算法的准确性,本发明选择采取双向最大匹配法。
双向最大匹配法就是将正向和逆向最大匹配法进行比较得出最后分词结果。匹配过程中,如果正反向分析结果词数不同,则取分析数较少的词;如果是在分词结果词数相同的情况下,分词结果相同,就说明没有歧义,可返回任意一个,否则返回单字较少的词。根据分词处理后的字段分词在数据字典中进行匹配,全部分词匹配成功则生成新的字段值存入数据字典中,使用该字段作为映射后的字段,针对接口中的预留字段,算法映射为备用字段,下标根据预留字段个数依次递增。
S500将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
在本实施例中,通过提供的自动化映射方法,可以自动化的匹配并沿用已存在的映射关系作为该接字段的映射值。
在本发明的一个实施例中,所述当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录,包括:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录,包括:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值,包括:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
在本实施例中,数据字典中会有一个英文词库,其中包含大量的中文词语和与之对应的英文和英文缩写,还有一个待分词的中文字符串。
在本发明的一个实施例中,所述根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录,包括:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
在本发明的一个实施例中,本发明提供一种用于服务治理平台的自动映射装置,包括:
确定模块,用于根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录;
查找模块,用于当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录;
所述查找模块,还用于若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录;
分词模块,用于若在所述服务治理平台的数据字典中未查找所述待服务治理接口的字段的映射记录时,通过双向最大匹配法对所述待服务治理接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;
匹配模块,用于将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述查找模块,还用于:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述查找模块,还用于:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述匹配模块,还用于:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
在本发明的一个实施例中,所述确定模块,还用于:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
在本实施例中,若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,沿用所述待服务治理接口上一版本的原始字段;若所述待服务治理接口的版本不为修订接口,则查找所述待服务治理接口的字段的映射记录。
在本申请的一个实施例中,提供一种用于服务治理平台的自动映射方法,具体包括:
自动映射是将接口原始字段按照服务治理规范自动重新生成一套符合治理规范标准的新字段,服务治理人员不用再在数据字典中逐个寻找可匹配的字段,提高了治理人员的工作效率。
服务注册绑定提供方系统,一个服务只会归属一个提供方系统,可以有多个消费方系统调用。一个提供方系统所负责的领域和业务功能是同一类型,因此同一个提供方系统的服务类型、字段较为类似。如图2所示的流程图:
步骤101:算法首先根据接口的版本判断接口是否是修订的接口,若是修订接口则跳转到步骤201,否则要跳转到步骤202。
步骤201:判断接口为修订接口,则让原有字段沿用上一版本的映射。
步骤202:判断接口为新增接口或修订接口的新增字段,若是该接口所属系统的接口中存在新字段的映射记录则跳转到步骤301,否则要跳转到步骤302。
步骤301:若是该接口所属系统的接口中存在待服务治理接口的字段的映射记录,则直接沿用已存在的映射关系作为该接字段的映射值。步骤302:若不存在新字段的映射记录则将在全行的映射关系表中查找是否存在该字段的映射,如果存在则跳转到步骤401,否则要跳转到步骤402。
步骤401:在全行的映射关系表中查找到该字段的映射,沿用映射关系表中已存在的映射关系作为该接字段的映射值。
步骤402:在全行的映射关系表中没有查找到该字段的映射,则在数据字段中查询是否有与该字段中文含义相同的字段,如果有相同字段,则跳转到步骤501,否则要跳转到步骤502。
步骤501:在数据字段中查询没有与该字段中文含义相同的字段,数据字段中查询是否有与该字段英文名称相同的字段,如有存在则跳转到步骤601,否则要跳转到步骤602。
步骤502:在数据字段中查询有与该字段中文含义相同的字段,使用该数据字典值作为字段的映射值。
步骤601:数据字段中查询没有与该字段英文名称相同的字段,将字段中文名运用双向最大匹配法进行分词处理,跳转到步骤701。
步骤602:数据字段中查询有与该字段英文名称相同的字段,使用该数据字典值作为字段的映射值。
步骤701:将分词的结果与数据字典的英文词库进行匹配。
步骤801:根据匹配的值拼接新元数据的中文名称和英文名称,生成新的数据字典元数据,将该元数据作为字段的映射值,自动生成的新映射值则会高亮提醒。
针对接口中的预留字段,算法映射为备用字段,下标根据预留字段个数依次递增。
本发明中的该算法运行在服务治理平台上,实现自动映射功能。在实现过程中,需要使用一些自然语言处理技术和数据挖掘技术,例如分词、词性标注、命名实体识别、关键词提取等。本发明具有较高的实用价值和经济效益,可以广泛应用于银行等领域。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的程序模块完成,即将所述装置的内部结构划分成不同的程序单元或模块,以完成以上描述的全部或者部分功能。实施例中的各程序模块可以集成在一个处理单元中,也可是各个单元单独存在,也可以两个或两个以上单元集成在一个处理单元中,上述集成的单元采用软件程序单元的形式实现。另外,各程序模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述或记载的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以计算机软件来实现。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种用于服务治理平台的自动映射方法,其特征在于,包括:
根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录;
当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录;
若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录;
若在所述服务治理平台的数据字典中未查找所述待服务治理接口的字段的映射记录时,通过双向最大匹配法对所述待服务治理接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;
将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
2.根据权利要求1所述的用于服务治理平台的自动映射方法,其特征在于,所述当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录,包括:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
3.根据权利要求1所述的用于服务治理平台的自动映射方法,其特征在于,所述若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录,包括:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
4.根据权利要求3所述的用于服务治理平台的自动映射方法,其特征在于,所述将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值,包括:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
5.根据权利要求1所述的用于服务治理平台的自动映射方法,其特征在于,所述根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录,包括:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
6.一种用于服务治理平台的自动映射装置,其特征在于,包括:
确定模块,用于根据服务治理平台的待服务治理接口的版本,确定是否查找所述待服务治理接口的字段的映射记录;
查找模块,用于当确定查找所述待服务治理接口的字段的映射记录时,逐级从所述待服务治理接口所属系统、总系统查找所述待服务治理接口的字段的映射记录;
所述查找模块,还用于若在所述系统、所述总系统中均未查找到所述待服务治理接口的字段的映射记录时,从所述服务治理平台的数据字典中查找所述待服务治理接口的字段的映射记录;
分词模块,用于若在所述服务治理平台的数据字典中未查找所述待服务治理接口的字段的映射记录时,通过双向最大匹配法对所述待服务治理接口的字段中文名进行分词处理,输出所述字段中文名的分词结果;
匹配模块,用于将所述字段中文名的分词结果与所述服务治理平台的数据字典进行匹配,输出所述待服务治理接口的字段的映射值。
7.根据权利要求6所述的用于服务治理平台的自动映射装置,其特征在于,所述查找模块,还用于:
从所述待服务治理接口所属系统的接口中查找是否存在所述待服务治理接口的字段的映射记录;
若所述待服务治理接口所属系统的接口中存在所述待服务治理接口的字段的映射记录,则沿用所属系统的接口中的字段的映射记录;
若所属系统的接口中不存在所述待服务治理接口的字段的映射记录,则在所述待服务治理接口所属总系统的映射关系表中查找是否存在所述待服务治理接口的字段的映射记录;
若所属总系统的映射关系表中存在所述待服务治理接口的字段的映射记录,则沿用所属总系统的映射关系表中的映射值作为所述待服务治理接口的字段的映射值。
8.根据权利要求6所述的用于服务治理平台的自动映射装置,其特征在于,所述查找模块,还用于:
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段中文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值;
若在所述服务治理平台的数据字典中未查找到与所述待服务治理接口的字段中文名称相同的字段时,则在所述数据字段中查找是否与所述待服务治理接口的字段英文名称相同的字段;
若在所述服务治理平台的数据字典中查找到与所述待服务治理接口的字段英文名称相同的字段时,则将所述字段的数据字典值作为所述待服务治理接口的字段的映射值。
9.根据权利要求8所述的用于服务治理平台的自动映射装置,其特征在于,所述匹配模块,还用于:
将所述字段中文名的分词结果与所述数据字典的英文词库进行匹配,并根据匹配值拼接所述数据字典的元数据,所述数据字典的元数据作为所述待服务治理接口的字段的映射值。
10.根据权利要求6所述的用于服务治理平台的自动映射装置,其特征在于,所述确定模块,还用于:
若所述待服务治理接口的版本为修订接口,则不查找所述待服务治理接口的字段的映射记录,否则查找所述待服务治理接口的字段的映射记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311339893.8A CN117236327A (zh) | 2023-10-17 | 2023-10-17 | 一种用于服务治理平台的自动映射方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311339893.8A CN117236327A (zh) | 2023-10-17 | 2023-10-17 | 一种用于服务治理平台的自动映射方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117236327A true CN117236327A (zh) | 2023-12-15 |
Family
ID=89091176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311339893.8A Pending CN117236327A (zh) | 2023-10-17 | 2023-10-17 | 一种用于服务治理平台的自动映射方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117236327A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574103A (zh) * | 2015-12-11 | 2016-05-11 | 浙江大学 | 基于分词编码自动构建医学术语映射关系的方法以及系统 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN114880318A (zh) * | 2022-06-09 | 2022-08-09 | 杭州比智科技有限公司 | 一种基于数据标准实现自动化数据治理的方法及系统 |
CN115599840A (zh) * | 2022-10-17 | 2023-01-13 | 中电科大数据研究院有限公司(Cn) | 一种复杂业务数据治理方法和系统 |
CN116483810A (zh) * | 2022-07-29 | 2023-07-25 | 四创电子股份有限公司 | 一种基于公安大数据处理技术指南的数据治理方法 |
-
2023
- 2023-10-17 CN CN202311339893.8A patent/CN117236327A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574103A (zh) * | 2015-12-11 | 2016-05-11 | 浙江大学 | 基于分词编码自动构建医学术语映射关系的方法以及系统 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN114880318A (zh) * | 2022-06-09 | 2022-08-09 | 杭州比智科技有限公司 | 一种基于数据标准实现自动化数据治理的方法及系统 |
CN116483810A (zh) * | 2022-07-29 | 2023-07-25 | 四创电子股份有限公司 | 一种基于公安大数据处理技术指南的数据治理方法 |
CN115599840A (zh) * | 2022-10-17 | 2023-01-13 | 中电科大数据研究院有限公司(Cn) | 一种复杂业务数据治理方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7921367B2 (en) | Application generator for data transformation applications | |
US20060235771A1 (en) | System and method for managing item interchange and identification in an extended enterprise | |
CN101398858B (zh) | 一种基于本体学习的Web服务语义提取方法 | |
CN101231651A (zh) | 计算计算机网络上电子文档的重要性的计算机装置和方法 | |
US20200210441A1 (en) | System and method of database creation through form design | |
US9053207B2 (en) | Adaptive query expression builder for an on-demand data service | |
CN113626223A (zh) | 一种接口调用方法和装置 | |
CN113190687A (zh) | 知识图谱的确定方法、装置、计算机设备及存储介质 | |
EP3079083A1 (en) | Providing app store search results | |
US8290950B2 (en) | Identifying locale-specific data based on a total ordering of supported locales | |
CN115470191A (zh) | 数据库更新系统、方法及相应计算机设备和存储介质 | |
CN110109981B (zh) | 工作队列的信息展示方法、装置、计算机设备和存储介质 | |
CN113407565B (zh) | 跨库数据查询方法、装置和设备 | |
CN111191153A (zh) | 一种信息技术咨询服务展示装置 | |
US9207917B2 (en) | Application generator for data transformation applications | |
CN116303641B (zh) | 一种支持多数据源可视化配置的实验室报告管理方法 | |
US7010539B1 (en) | System and method for schema method | |
CN111984745A (zh) | 数据库字段动态扩展方法、装置、设备及存储介质 | |
CN117149804A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN117076491A (zh) | 一种数据处理方法、存储介质与设备 | |
CN117236327A (zh) | 一种用于服务治理平台的自动映射方法和装置 | |
CN116955393A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN115048456A (zh) | 用户标签的生成方法、装置、计算机设备及可读存储介质 | |
CN115794857A (zh) | 查询请求的处理方法及装置 | |
CN111930955A (zh) | 一种作者命名消歧的方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |