CN110674363B - 接口服务之间的相似匹配方法、装置及电子设备 - Google Patents

接口服务之间的相似匹配方法、装置及电子设备 Download PDF

Info

Publication number
CN110674363B
CN110674363B CN201910816934.5A CN201910816934A CN110674363B CN 110674363 B CN110674363 B CN 110674363B CN 201910816934 A CN201910816934 A CN 201910816934A CN 110674363 B CN110674363 B CN 110674363B
Authority
CN
China
Prior art keywords
service
interface service
interface
related data
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910816934.5A
Other languages
English (en)
Other versions
CN110674363A (zh
Inventor
李智耀
邵利铎
鹿慧
何栋
何激
张鹏飞
尚凌瑞
刘进涛
安保柱
张帆
涂彦
兰天
吴国华
裴旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peoples Insurance Company of China
Original Assignee
Peoples Insurance Company of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peoples Insurance Company of China filed Critical Peoples Insurance Company of China
Priority to CN201910816934.5A priority Critical patent/CN110674363B/zh
Publication of CN110674363A publication Critical patent/CN110674363A/zh
Application granted granted Critical
Publication of CN110674363B publication Critical patent/CN110674363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种接口服务之间的相似匹配方法、装置及电子设备,用于解决现有的人工识别重复的接口服务的方法效率和准确率都较低的问题。所述方法包括:将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;获取第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息;基于第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息,确定第一接口服务和第二接口服务中的关键字段在对应的板块中的权重;基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,确定第一接口服务和所述第二接口服务之间的相似度。

Description

接口服务之间的相似匹配方法、装置及电子设备
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种接口服务之间的相似匹配方法、装置及电子设备。
背景技术
在企业的IT架构规划中,通过服务治理体系构建出合理的中台服务通常是企业的战略目标之一。而在服务治理体系中,如何能够尽可能地降低服务接口的重复性建设也是其中一个重要问题。
目前,解决这个问题的方式往往是依靠经验丰富的专业人士对技术和业务的深入理解,即通过人工的方式识别出服务治理体系中出现的重复建设的接口服务。然而,当接口服务的种类越来越复杂且接口服务的数量越来越多时,则需要耗费大量的人力资源来识别出重复的接口服务,且识别效率和准确率也较低。因此,如何提高识别重复接口服务的效率和准确率,仍然需要提供进一步的解决方案。
发明内容
本发明实施例提供一种接口服务之间的相似匹配方法、装置及电子设备,用于解决现有的人工识别重复的接口服务的方法效率和准确率都较低的问题。
本发明实施例采用下述技术方案:
第一方面,提供了一种接口服务之间的相似匹配方法,包括:
基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
第二方面,提供了一种接口服务之间的相似匹配装置,包括:
编码单元,用于基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
获取单元,用于基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
权重确定单元,用于基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
相似匹配单元,用于基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
第三方面,提供了一种电子设备,包括:
存储器,存储有计算机程序指令;
处理器,当所述计算机程序指令被所述处理器执行时实现如第一方面所述的接口服务之间的相似匹配方法。
第四方面,提供了一种计算机可读存储介质,
所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如第一方面所述的接口服务之间的相似匹配方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本说明书实施例在确定接口服务之间的相似度时,能够对有相似匹配需求的接口服务中的多个类别的服务相关数据进行标准化编码,并提取出标准化编码后的多个类别的服务相关数据对应的多个板块,以及接口服务中的关键字段的索引信息,再基于这多个板块和接口服务中的关键字段的索引信息,确定接口服务中的关键字段在对应的板块中的权重,最后基于接口服务中的关键字段在对应的板块中的权重确定接口服务之间的相似度。通过将接口服务中的服务相关数据进行标准化编码,并依次确定出用于确定接口服务之间的相似度的参数,从而将接口服务之间的相似度的确定过程转化为机器可执行的多个步骤,提高接口服务之间的相似匹配效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书的一个实施例提供的一种接口服务之间的相似匹配方法的实现流程示意图;
图2为本说明书的一个实施例提供的接口服务之间的相似匹配方法中确定接口服务中的关键字段的索引信息的流程示意图;
图3为本说明书的一个实施例提供的接口服务之间的相似匹配方法中的计算接口服务之间的相似度的流程示意图;
图4为本说明书的一个实施例提供的一种接口服务之间的相似匹配装置的结构示意图;
图5为本说明书的另一个实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决现有的人工识别重复的接口服务的方法效率和准确率都较低的问题,本说明书实施例提供一种接口服务之间的相似匹配方法。本说明书实施例提供的方法的执行主体可以但不限于个人电脑、服务器等能够被配置为执行本发明实施例提供的该方法装置中的至少一种。
为便于描述,下文以该方法的执行主体为能够执行该方法的服务器为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为服务器只是一种示例性的说明,并不应理解为对该方法的限定。
具体地,本说明书一个或多个实施例提供的一种接口服务之间的相似匹配方法的实现流程示意图如图1所示,包括:
步骤110,基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
可选地,为避免影响第一接口服务和第二接口服务之间的相似度的准确度,本说明书实施例中的接口服务之间在确定相似度之前,应对其服务相关数据的完整性进行校验。其中,多个类别的服务相关数据包括下述至少一类服务相关数据包括:
中文服务名称;
英文服务代码;
服务含义;
使用场景;
服务发送报文定义;
服务返回报文定义。
其中,服务发送报文定义和服务返回报文定义中的报文定义部分包含实体对象或者字段,实体对象也可以包含实体对象或者字段,每一个字段的定义都包含字段英文代码和字段中文描述这两部分。
在确定第一接口服务和第二接口服务的服务相关数据中均包含中文服务名称、英文服务代码、服务含义和使用场景、服务发送报文定义、服务返回报文定义,这几个类别的服务相关数据之后,再对第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码。
应理解,为便于区分各个接口服务,可对每个接口服务设置全局唯一的编码,具体地,基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码,包括:
基于预设的标准化编码规则,分别对第一接口服务和第二接口服务设置唯一的接口编码;
基于第一接口服务的接口编码以及预设的标准化编码规则,对第一接口服务中的多个类别的服务相关数据进行标准化编码;
基于第二接口服务的接口编码以及预设的标准化编码规则,对第二接口服务中的多个类别的服务相关数据进行标准化编码。
例如:第一接口服务的编码可设置为A001,第二接口服务的编码可设置为A002。各接口服务包含的模块可约定如下编码规则:每一模块都可以包含两个全局属性:即所属接口服务的编码和字段类型。
例如:中文服务名称B001(所属接口服务的编码:A001,字段类型:中文服务名称)、英文服务代码B002(所属接口服务的编码:A001,字段类型:英文服务代码)、服务含义B003(所属接口服务的编码:A001,字段类型:服务含义)和使用场景B004(所属接口服务的编码:A001,字段类型:使用场景)、服务发送报文定义B005(所属接口服务的编码:A001,字段类型:服务发送报文)以及服务返回报文定义B006(所属接口服务的编码:A001,字段类型:服务返回报文定义)。
服务发送报文定义和服务返回报文定义中还可以包含如下三个属性:上级编码、层次编码和同级顺序码。例如:新增动物接口服务的发送报文中包含动物(animal)实体,动物实体中包含兔子(rabbit)实体,兔子实体中包含耳朵(ear)、眼睛(eye)和腿(leg)等字段。
逐层编码后,可以有类似如下编码:animal-动物编码B005C001(所属接口编码:A001,上级编码:空,层次编码:1,同级顺序码:1),animal编码B05C001X,动物编码B005C001Y;rabbit-兔子编码B005C002(所属接口编码:A001,上级编码:B005C001,层次编码:2,同级顺序码:1),rabbit编码B005C002X,兔子编码B005C002Y;ear-耳朵编码B005C003(所属接口编码:A001,上级编码:B005C002,层次编码:3,同级顺序码:1);eye-眼睛(所属接口编码:A001,上级编码:B005C002,层次编码:3,同级顺序码:2)。
步骤120,基于标准化编码后的第一接口服务和第二接口服务中的多个类别的服务相关数据,获取第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息;
其中,一个板块对应于一个类别的服务相关数据,关键字段的索引信息用于表征关键字段的来源信息。
可选地,为了更准确地确定第一接口服务和第二接口服务之间的相似度,本说明书实施例还可对标准化编码后的多个类别的服务相关数据进行分词处理。具体地,基于标准化编码后的第一接口服务和第二接口服务中的多个类别的服务相关数据,获取第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息,包括:
对标准化编码后的第一接口服务和第二接口服务中的多个类别的服务相关数据,进行分词处理;
基于分词处理后的第一接口服务和第二接口服务中的多个类别的服务相关数据,获取第一接口服务和第二接口服务的多个板块;
基于分词处理后的第一接口服务和第二接口服务中的多个类别的服务相关数据、以及标准化编码后的第一接口服务和第二接口服务中的多个类别的服务相关数据,确定第一接口服务和第二接口服务中的关键字段的索引信息。
可选地,基于上述服务相关数据的类别,该多个板块包括下述至少一种:
中文服务名称分词前板块;
中文服务名称分词后板块;
英文服务代码分词前板块;
英文服务代码分词后板块;
服务含义分词前板块;
服务含义分词后板块;
使用场景分词前板块;
使用场景分词后板块;
服务发送报文定义分词前板块;
服务发送报文定义分词后板块;
服务返回报文定义分词前板块;
服务返回报文定义分词后板块。
应理解,服务相关数据中通常会包括中文字段和英文字段,那么对服务相关数据进行分词处理,具体可采用中文和英文分词算法对服务相关数据进行分词处理。
其中,采用中文分词算法对服务中文名称、服务含义和使用场景、字段中文描述等包含中文的部分进行分词处理。本说明书实施例不限定具体采用的分词算法,比如可以采用SCWS、FudanNLP等开源的分词引擎。
采用英文分词算法对英文服务代码、字段英文代码等包含英文的内容进行分词处理。需要说明的是,由于大多数的英文代码都使用驼峰命名格式,因此根据驼峰格式进行解析初步分词之后,再根据分词算法进行处理往往会有更好的分词效果。
应理解,在对服务相关数据进行分词处理之后,为便于确定服务相关数据分词前后的关联关系,以便基于分词前后的服务相关数据确定接口服务之间的相似度,本说明书实施例还可记录分词前和分词后的对应关系。比如:MaximumPayment编码B005C012X,最大支付金额的编码B005C012Y,中英文分词后结果包含两个属性:拆分前编码、词位置信息。
比如分词后的编码如下所示:Maximum(所属接口编码:A001,拆分前编码:B005C012X,词位置信息:1)Payment(所属接口编码:A001,拆分前编码:B005C012X,词位置信息:2)最大(所属接口编码:A001,拆分前编码:B005C012Y,词位置信息:1)支付金额(所属接口编码:A001,拆分前编码:B005C012Y,词位置信息:1)。
基于该分词前后的服务相关数据,可确定关键字段Payment的索引信息包括:(所属服务接口编码:A001,字段类型:服务返回报文定义,编码:B005C012X)、(所属服务接口编码:A001,字段类型:分词结果,编码:B005C014Y)和(所属服务接口编码:A003,字段类型:服务返回报文定义,编码:B005C014X)。基于该索引信息可确定关键字段Payment在服务接口A001中出现了两次,在服务接口A003中出现了一次。
下面以图2所示的确定接口服务中的关键字段的索引信息的流程示意图,对第一接口服务和第二接口服务中的关键字段的索引信息的确定过程进行详细介绍,如图2所示,包括:
S21,获取并录入有相似匹配需求的接口服务(即第一接口服务和第二接口服务)的多个类别的服务相关数据;
应理解,在获取并录入有相似匹配需求的接口服务的多个类别的服务相关数据时,为避免影响第一接口服务和第二接口服务之间的相似度的计算准确度,可以对这两个接口服务的多个类别的服务相关数据进行完整性校验。具体可以校验这两个接口服务的多个类别的服务相关数据是否完整地包含有中文服务名称、英文服务代码、服务含义和使用场景、服务发送报文定义、服务返回报文定义,这几个类别的服务相关数据。
S22,基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
S23,在进行标准化编码之后,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行分词处理;
S24,记录第一接口服务和第二接口服务中的多个类别的服务相关数据的分词结果;
S25,获取分词后的第一接口服务和第二接口服务中多个类别的服务相关数据的关键字段的索引信息;
S26,存储第一接口服务和第二接口服务中多个类别的服务相关数据的关键字段的索引信息。
步骤130,基于第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息,确定第一接口服务和第二接口服务中的关键字段在对应的板块中的权重;
可选地,为了准确确定第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,基于第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息,确定第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,包括:
基于第一接口服务和第二接口服务的多个板块、以及第一接口服务和第二接口服务中的关键字段的索引信息,确定第一接口服务和第二接口服务中的关键字段在对应的板块中的词频(Term Frequency,TF)和逆向文件频率(Inverse Document Frequency,IDF);
基于第一接口服务和第二接口服务中的关键字段在对应的板块中的TF和IDF,确定第一接口服务和第二接口服务中的关键字段在对应的板块中的权重(Term Frequency-Inverse Document Frequency,TF-IDF)。
其中,第一接口服务和第二接口服务中的关键字段在对应的板块中的TF为关键字段在对应的板块出现的次数除以该板块的关键字段的总数量。比如,服务接口编码:A001中的关键字段animal-动物,在该板块中出现了两次,但是该板块关键字段共有100个。则此关键字段animal-动物的TF(x)值是2/100=0.02。
第一接口服务和第二接口服务中的关键字段在对应的板块中的IDF是一个词语普遍重要性的度量,可通过公式
Figure BDA0002186592650000101
来确定,其中,N代表索引信息库中服务接口的总数,而N(x)代表索引信息库中包含索引词项(即关键字段)x的服务接口的总数。比如:索引词项animal-动物,在9个服务接口中出现,总共有99个接口服务,则可以得到IDF(x)的值为2。
第一接口服务和第二接口服务中的关键字段在对应的板块中的TF-IDF,可用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。该TF-IDF具体可通过公式TF-IDF(x)=TF(x)*IDF(x)来确定。
步骤140,基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,确定第一接口服务和第二接口服务之间的相似度。
可选地,基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,确定第一接口服务和第二接口服务之间的相似度,包括:
基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,确定第一接口服务和第二接口服务对应的板块之间的余弦相似度;
基于第一接口服务和第二接口服务对应的板块之间的余弦相似度,确定第一接口服务和第二接口服务之间的相似度。
其中,基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重,确定第一接口服务和第二接口服务对应的板块之间的余弦相似度,具体可通过公式
Figure BDA0002186592650000111
来确定,其中,Ai表示索引词项i在接口服务A中的TF-IDF值。Bi表示索引词项i在接口服务B中的TF-IDF值。
基于第一接口服务和第二接口服务对应的板块之间的余弦相似度,确定第一接口服务和第二接口服务之间的相似度,具体可以通过公式
Figure BDA0002186592650000112
Figure BDA0002186592650000113
其中,Pi代表第一接口服务与第二接口服务的板块i的余弦相似度,Xi代表第一接口服务与第二接口服务的的板块i的权重值。
下面以图3所示的相似度的计算过程示意图,对第一接口服务和第二接口服务之间的相似度的确定过程进行详细介绍,如图3所示,包括:
S31,调用存储的第一接口服务和第二接口服务的关键字段的索引信息;
S32,基于第一接口服务和第二接口服务的关键字段的索引信息,获取第一接口服务和第二接口服务的多个板块;
S33,计算第一接口服务和第二接口服务中的关键字段在对应的板块中的权重TF-IDF;
S34,基于第一接口服务和第二接口服务中的关键字段在对应的板块中的权重TF-IDF,计算第一接口服务和第二接口服务对应的板块之间的余弦相似度;
S35,确定第一接口服务和第二接口服务中是否还有未计算余弦相似度的板块,若是则执行S36,若否则执行S32;
S36,基于第一接口服务和第二接口服务对应的板块之间的余弦相似度,确定第一接口服务和第二接口服务之间的相似度;
S37,返回相似度计算结果。
本说明书实施例在确定接口服务之间的相似度时,能够对有相似匹配需求的接口服务中的多个类别的服务相关数据进行标准化编码,并提取出标准化编码后的多个类别的服务相关数据对应的多个板块,以及接口服务中的关键字段的索引信息,再基于这多个板块和接口服务中的关键字段的索引信息,确定接口服务中的关键字段在对应的板块中的权重,最后基于接口服务中的关键字段在对应的板块中的权重确定接口服务之间的相似度。通过将接口服务中的服务相关数据进行标准化编码,并依次确定出用于确定接口服务之间的相似度的参数,从而将接口服务之间的相似度的确定过程转化为机器可执行的多个步骤,提高接口服务之间的相似匹配效率。
图4是本说明书的一个实施例提供的一种接口服务之间的相似匹配装置400的结构示意图。在一种软件实施方式中,该接口服务之间的相似匹配装置400可包括编码单元401、获取单元402、权重确定单元403和相似匹配单元404,其中:
编码单元401,用于基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
获取单元402,用于基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
权重确定单元403,用于基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
相似匹配单元404,用于基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
可选地,在一种实施方式中,所述相似匹配单元404用于:
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务对应的板块之间的余弦相似度;
基于所述第一接口服务和所述第二接口服务对应的板块之间的余弦相似度,确定所述第一接口服务和所述第二接口服务之间的相似度。
可选地,在一种实施方式中,所述权重确定单元403用于:
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的词频TF和逆向文件频率IDF;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的词频TF和逆向文件频率IDF,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重TF-IDF。
可选地,在一种实施方式中,所述编码单元401用于:
基于所述预设的标准化编码规则,分别对所述第一接口服务和所述第二接口服务设置唯一的接口编码;
基于所述第一接口服务的接口编码以及所述预设的标准化编码规则,对所述第一接口服务中的多个类别的服务相关数据进行标准化编码;
基于所述第二接口服务的接口编码以及所述预设的标准化编码规则,对所述第二接口服务中的多个类别的服务相关数据进行标准化编码。
可选地,在一种实施方式中,所述获取单元402用于:
对标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,进行分词处理;
基于分词处理后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块;
基于分词处理后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据、以及标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,确定所述第一接口服务和所述第二接口服务中的关键字段的索引信息。
可选地,在一种实施方式中,所述处理器201用于:
从所述预设的宽带的网络质量的等级中,确定与所述目标宽带的网络质量的等级相对应的目标等级;
从所述映射关系表中确定与所述目标等级相对应的目标可承载内容;
将所述目标可承载内容确定为与所述目标宽带的网络质量的等级相对应的可承载内容。
可选地,在一种实施方式中,所述多个类别的服务相关数据包括下述至少一类服务相关数据:
中文服务名称;
英文服务代码;
服务含义;
使用场景;
服务发送报文定义;
服务返回报文定义。
可选地,在一种实施方式中,所述多个板块包括下述至少一种:
中文服务名称分词前板块;
中文服务名称分词后板块;
英文服务代码分词前板块;
英文服务代码分词后板块;
服务含义分词前板块;
服务含义分词后板块;
使用场景分词前板块;
使用场景分词后板块;
服务发送报文定义分词前板块;
服务发送报文定义分词后板块;
服务返回报文定义分词前板块;
服务返回报文定义分词后板块。
接口服务之间的相似匹配装置400能够实现图1~图3的方法实施例的方法,具体可参考图1~图3所示实施例的接口服务之间的相似匹配方法,不再赘述。
图5是本说明书的一个实施例提供的电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成接口服务之间的相似匹配装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
本说明书实施例在确定接口服务之间的相似度时,能够对有相似匹配需求的接口服务中的多个类别的服务相关数据进行标准化编码,并提取出标准化编码后的多个类别的服务相关数据对应的多个板块,以及接口服务中的关键字段的索引信息,再基于这多个板块和接口服务中的关键字段的索引信息,确定接口服务中的关键字段在对应的板块中的权重,最后基于接口服务中的关键字段在对应的板块中的权重确定接口服务之间的相似度。通过将接口服务中的服务相关数据进行标准化编码,并依次确定出用于确定接口服务之间的相似度的参数,从而将接口服务之间的相似度的确定过程转化为机器可执行的多个步骤,提高接口服务之间的相似匹配效率。
上述如本说明书图1~图3所示实施例揭示的接口服务之间的相似匹配方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1~图3的接口服务之间的相似匹配方法,本说明书在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1~图3所示实施例的方法,并具体用于执行以下操作:
基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (10)

1.一种接口服务之间的相似匹配方法,其特征在于,包括:
基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
2.如权利要求1所述的方法,其特征在于,基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度,包括:
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务对应的板块之间的余弦相似度;
基于所述第一接口服务和所述第二接口服务对应的板块之间的余弦相似度,确定所述第一接口服务和所述第二接口服务之间的相似度。
3.如权利要求1所述的方法,其特征在于,基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,包括:
基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的词频TF和逆向文件频率IDF;
基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的词频TF和逆向文件频率IDF,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重TF-IDF。
4.如权利要求1所述的方法,其特征在于,基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码,包括:
基于所述预设的标准化编码规则,分别对所述第一接口服务和所述第二接口服务设置唯一的接口编码;
基于所述第一接口服务的接口编码以及所述预设的标准化编码规则,对所述第一接口服务中的多个类别的服务相关数据进行标准化编码;
基于所述第二接口服务的接口编码以及所述预设的标准化编码规则,对所述第二接口服务中的多个类别的服务相关数据进行标准化编码。
5.如权利要求4所述的方法,其特征在于,基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,包括:
对标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,进行分词处理;
基于分词处理后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块;
基于分词处理后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据、以及标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,确定所述第一接口服务和所述第二接口服务中的关键字段的索引信息。
6.如权利要求1所述的方法,其特征在于,所述多个类别的服务相关数据包括下述至少一类服务相关数据:
中文服务名称;
英文服务代码;
服务含义;
使用场景;
服务发送报文定义;
服务返回报文定义。
7.如权利要求5所述的方法,其特征在于,所述多个板块包括下述至少一种:
中文服务名称分词前板块;
中文服务名称分词后板块;
英文服务代码分词前板块;
英文服务代码分词后板块;
服务含义分词前板块;
服务含义分词后板块;
使用场景分词前板块;
使用场景分词后板块;
服务发送报文定义分词前板块;
服务发送报文定义分词后板块;
服务返回报文定义分词前板块;
服务返回报文定义分词后板块。
8.一种接口服务之间的相似匹配装置,其特征在于,包括:
编码单元,用于基于预设的标准化编码规则,将第一接口服务和第二接口服务中的多个类别的服务相关数据进行标准化编码;
获取单元,用于基于标准化编码后的所述第一接口服务和所述第二接口服务中的多个类别的服务相关数据,获取所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息;一个板块对应于一个类别的服务相关数据,所述关键字段的索引信息用于表征所述关键字段的来源信息;
权重确定单元,用于基于所述第一接口服务和所述第二接口服务的多个板块、以及所述第一接口服务和所述第二接口服务中的关键字段的索引信息,确定所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重;
相似匹配单元,用于基于所述第一接口服务和所述第二接口服务中的关键字段在对应的板块中的权重,确定所述第一接口服务和所述第二接口服务之间的相似度。
9.一种电子设备,其特征在于,包括:
存储器,存储有计算机程序指令;
处理器,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的接口服务之间的相似匹配方法。
10.一种计算机可读存储介质,其特征在于,
所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-7任一项所述的接口服务之间的相似匹配方法。
CN201910816934.5A 2019-08-30 2019-08-30 接口服务之间的相似匹配方法、装置及电子设备 Active CN110674363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910816934.5A CN110674363B (zh) 2019-08-30 2019-08-30 接口服务之间的相似匹配方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910816934.5A CN110674363B (zh) 2019-08-30 2019-08-30 接口服务之间的相似匹配方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110674363A CN110674363A (zh) 2020-01-10
CN110674363B true CN110674363B (zh) 2022-04-22

Family

ID=69076061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910816934.5A Active CN110674363B (zh) 2019-08-30 2019-08-30 接口服务之间的相似匹配方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110674363B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622396A (zh) * 2011-11-30 2012-08-01 浙江大学 一种基于标签的web服务聚类方法
CN103678548A (zh) * 2013-12-04 2014-03-26 清华大学 基于组合模式的失效服务替代推荐方法
CN108287916A (zh) * 2018-02-11 2018-07-17 北京方正阿帕比技术有限公司 一种资源推荐方法
CN109284490A (zh) * 2018-09-13 2019-01-29 武汉斗鱼网络科技有限公司 一种文本相似度计算方法、装置、电子设备及存储介质
CN109670022A (zh) * 2018-12-13 2019-04-23 南京航空航天大学 一种基于语义相似度的Java应用程序接口使用模式推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402912B (zh) * 2016-05-19 2019-12-31 北京京东尚科信息技术有限公司 解析语义的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622396A (zh) * 2011-11-30 2012-08-01 浙江大学 一种基于标签的web服务聚类方法
CN103678548A (zh) * 2013-12-04 2014-03-26 清华大学 基于组合模式的失效服务替代推荐方法
CN108287916A (zh) * 2018-02-11 2018-07-17 北京方正阿帕比技术有限公司 一种资源推荐方法
CN109284490A (zh) * 2018-09-13 2019-01-29 武汉斗鱼网络科技有限公司 一种文本相似度计算方法、装置、电子设备及存储介质
CN109670022A (zh) * 2018-12-13 2019-04-23 南京航空航天大学 一种基于语义相似度的Java应用程序接口使用模式推荐方法

Also Published As

Publication number Publication date
CN110674363A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN111352902A (zh) 日志处理方法、装置、终端设备及存储介质
CN113535817B (zh) 特征宽表生成及业务处理模型的训练方法和装置
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN111324370B (zh) 用于对待上线小程序进行风险处理的方法及装置
CN112035676B (zh) 用户操作行为知识图谱构建方法及装置
CN111709327B (zh) 基于ocr识别的模糊匹配方法和装置
CN110704423B (zh) 激励信息获取方法、装置及存储介质、电子设备
CN110674363B (zh) 接口服务之间的相似匹配方法、装置及电子设备
CN109598478B (zh) 一种风测结果描述文案的生成方法、装置及电子设备
CN114625407A (zh) 一种ab实验的实现方法、系统、设备及存储介质
CN108959381B (zh) 数据的管理方法及装置和电子设备
CN109063967B (zh) 一种风控场景特征张量的处理方法、装置及电子设备
CN107369093B (zh) 一种业务确定方法和装置
CN111275071A (zh) 预测模型训练、预测方法、装置及电子设备
CN110866085A (zh) 数据反馈方法与装置
CN108021464B (zh) 一种应用程序响应数据的兜底处理的方法以及装置
CN116204515A (zh) 一种基于数据质量定义的数据质量量化计算方法及装置
CN115080552A (zh) 数据质量评价方法、装置、设备和计算机可读存储介质
CN110955760A (zh) 判决结果的评价方法和相关装置
CN110018844B (zh) 决策触发方案的管理方法、装置和电子设备
CN113901046A (zh) 虚拟维度表构建方法及装置
CN111858619A (zh) 一种数据自流转的方法、装置和电子设备
CN111311372A (zh) 一种用户识别方法和装置
CN112947844A (zh) 一种数据存储方法、装置、电子设备及介质
CN110765118B (zh) 一种数据的修订方法、修订装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant