CN109359188A

CN109359188A - 一种组件编排方法和系统

Info

Publication number: CN109359188A
Application number: CN201811161698.XA
Authority: CN
Inventors: 周国梁; 易榜宇; 赵鹏
Original assignee: Beijing Number Gather Xin Yun Information Technology Co Ltd
Current assignee: Beijing Number Gather Xin Yun Information Technology Co Ltd
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2019-02-19
Anticipated expiration: 2038-09-30
Also published as: WO2020063669A1; CN109359188B

Abstract

本发明公开了一种组件编排方法，所述方法包括：构建组件信息集合；基于收到的组件查询信息，利用所述组件信息集合生成与所述组件查询信息相应的组件列表。在避免花费用户大量的时间和精力的同时，确保了筛选得到较佳的组件，提高了组件编排的效率和成功率。

Description

一种组件编排方法和系统

技术领域

本发明涉及计算机软件技术领域，尤其涉及一种组件编排方法及系统。

背景技术

在典型的基于可重用组件封装的集成编排系统中，系统通常提供具有不同功能的组件组成的组件库来快速编排组合，以连接不同应用系统，并且也提供各种数据组件对业务流程中的数据进行加工处理。这些可重用的组件随着时间的积累可能达到几百个，用户需要根据业务逻辑使用各种不同的组件进行组合编排来开发自己的业务流程，一个流程可能涉及到几十个甚至上百个组件的使用。用户从几百个组件中挑选合适的组件的工作十分繁琐，阻碍了使用可重用的组件来快速开发的设计初衷。

另外，组件库中的组件过多，每个组件的配置使用方法都需要积累很多实战经验。因此，在组件流程编排设计的过程中，用户需要大量时间来浏览并思考某一个组件是否适用于当前的上下文场景。

因此，需要一种能够实现组件的快速选择和组件流程的快速编排的方法和系统。

发明内容

为了解决现有技术中组件选择以及组件流程编排工作繁琐、耗时较大的问题，提出了一种组件编排方法和系统。

根据本发明专利申请的一个方面，提供了一种组件编排方法，所述方法包括：

构建组件信息集合；

基于收到的组件查询信息，利用所述组件信息集合生成与所述组件查询信息相应的组件列表。

其中，所述方法还包括：

当检测到需要选择关联组件时，获取待被关联的前置组件，基于所述前置组件，利用所述组件信息集合生成相应于所述前置组件的后置组件列表。

其中，构建组件信息集合包括：

基于各组件的历史使用数据构建所述组件信息集合，所述组件信息集合包括组件关键字数据、组件使用频率数据、组件关联数据。

其中，利用所述组件信息集合生成与所述组件查询信息相应的组件列表包括：

基于所述组件查询信息，利用所述组件关键字数据和所述组件使用频率数据计算各组件的匹配得分，并选择所述匹配得分高的前L个组件生成与所述组件查询信息相应的组件列表，L为大于等于1的正整数。

其中，利用所述组件关键字数据和所述组件使用频率数据计算各组件的匹配得分包括：

获取所述查询信息包括的j个关键字t₁,t₂,…,t_j，j为大于等于1的正整数；

通过下述公式计算各组件的匹配得分：

其中，d表示计算所述匹配得分的组件，tf(t_iind)表示关键字t_i在组件d的组件关键字数据中出现频率的平方根，idf(t_i)表示关键字t_i在组件d的组件关键字数据中的逆文本频率指数，fq(d)表示组件d在流程库中的出现频率，norm(d)表示关键字归一化因子，

并且其中，numDocs表示所述流程库中总的组件个数，docFreq表示一组件的组件关键字数据中包括关键字t_i的组件个数，

numTerms表示组件d的组件关键字数据中包括的所有关键字的个数。

其中，利用所述组件信息集合生成相应于所述前置组件的后置组件列表包括：

基于所述组件关联数据，在所述组件信息集合中选择所述前置组件后出现概率高的前N个组件，N为大于等于1的正整数；

获取所述前N个组件在所述前置组件后出现概率，基于所述出现概率分别计算所述前N个组件的推荐得分，并选择所述推荐得分高的前M个组件生成相应于所述前置组件的后置组件列表，M为大于等于1的正整数。

其中，通过下述方式计算所述前N个组件的推荐得分：

推荐得分＝freq(p,s)，

其中，freq(p,s)表示所述前置组件为p时，所述后置组件为s的概率的平方根。

根据本发明的另一方面，还提供了一种组件编排系统，所述系统包括：

索引模块，用于构建组件信息集合；

查询模块，用于基于收到的组件查询信息，利用所述组件信息集合生成与所述组件查询信息相应的组件列表。

其中，所述系统还包括：

推荐模块，用于当检测到需要选择关联组件时，获取待被关联的前置组件，基于所述前置组件，利用所述组件信息集合生成相应于所述前置组件的后置组件列表。

其中，所述索引模块还用于：

其中，所述查询模块还用于：

其中，所述查询模块还用于通过下述步骤计算各组件的匹配得分：

通过下述公式计算各组件的匹配得分：

i的取值范围为1,2，…j；

并且其中numDocs表示所述流程库中总的组件个数，docFreq表示一组件的组件关键字数据中包括关键字t_i的组件个数，

其中，所述推荐模块还用于：

其中，所述推荐模块还用于通过下述方式计算所述前N个组件的推荐得分：

推荐得分＝freq(p,s)，

现有组件编排方法并不能根据历史的组件使用频率统计数据来对返回结果进行更优的排序，也不能在用户没有提供关键字的时候提供智能的组件推荐。

本发明专利申请提出的组件编排方法和系统，与现有技术相比具有以下有益效果：

(1)通过组件的历史数据生成组件信息集合，这样在基于组件查询信息查询组件以及推荐后置组件时，可以借助于组件使用历史，包括使用频率、关联信息等，对待选择的组件进行智能的优化的推荐。

(2)科学地利用用户查询时输入的查询信息，通过对查询信息中的关键字进行拆分得到基本关键字，利用组件的关键字数据，并通过多次实验得到的计算公式计算组件的匹配得分，从而通过智能的方式得到满足用户查询要求的较佳组件。

(3)当捕获用户需要选择关联组件(后置组件)的操作时，自动通过推荐算法推荐后置组件，而无需用户提供关键字，极大地简化了用户操作。

(4)当用户没有提供关键字时，根据前置组件的信息和组件关联数据来推荐后置组件给用户，这种利用前置组件和组件关联数据进行推荐的方法更加科学，为用户提供了后置组件的最佳筛选方案。

本发明专利申请的方法的系统，通过智能的查询和推荐算法，在避免花费用户大量的时间和精力的同时，确保了筛选得到较佳的组件，提高了组件编排的效率和成功率。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明的组件编排方法的流程图；

图2是根据本发明的组件编排方法的一个具体实施例的流程图；

图3是根据本发明的组件编排系统的模块图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在目前的组件编排系统中，用户从几百个组件中挑选合适的组件的工作十分繁琐。另外，组件库中的组件过多，每个组件的配置使用方法都需要积累很多实战经验。因此，在组件流程编排设计的过程中，用户需要大量时间来浏览并思考某一个组件是否适用于当前的上下文场景。上述情况阻碍了使用可重用的组件来快速开发的设计初衷。

本发明专利申请提供了一种组件编排方法，该方法可以使得用户在流程设计时更快捷流畅地使用组件库中提供的组件进行组件编排操作。

本发明专利申请的组件编排方法如图1所示，包括：

步骤101，构建组件信息集合；

步骤102，基于收到的组件查询信息，利用所述组件信息集合生成与所述组件查询信息相应的组件列表。

在很多情况下，需要根据前置组件选择后置组件，因此上述方法还包括：

步骤103，当检测到需要选择关联组件时，获取待被关联的前置组件，基于所述前置组件，利用所述组件信息集合生成相应于所述前置组件的后置组件列表。

现有技术中，通常需要用户输入关键字来对后置组件进行筛选，而用户输入关键字时，如果输入的关键字不恰当，例如对后置组件的功能或作用概括不当，则会导致对后置组件的选择不正确，从而影响编排的组件流程的功能实现，严重时可能导致组件编排失败。

在步骤103中，组件编排系统检测到用户需要选择关联组件(后置组件)时，不需要用户输入关键字，而是利用前置组件的信息以及根据历史数据生成的组件信息集合，来筛选适当的后置组件，从而减少了用户的工作量，并降低了选择不恰当关键字而导致后置组件选择错误的风险。

本发明专利申请中，构建组件信息集合包括：基于各组件的历史使用数据构建所述组件信息集合，所述组件信息集合包括组件关键字数据、组件使用频率数据、组件关联数据。这里的历史数据为实际应用过程中设计的编排流程的结构化数据，包过流程的个数，每个流程中的组件类型，组件和组件之间的连接信息等。并且这里的历史数据可以是包括之前设计的编排流程的所有数据，也可以是从上述所有数据中选择的部分数据。

组件关键字数据也可以称为组件元数据，是组件开发人员在开发某个组件时在该组件上定义的一些描述性的关键字，这些关键字可以是对组件功能作用的描述，也可以是对组件特征的描述，比如：”数据输入”、”数据输出”、”数据转换”、”Kafka”、“Hadoop”、”数据库”、”SQL”、”数据加密”等等。跟该组件有关的关键字都可以作为元数据，类别不限。一个组件的关键字数据中可以包括与该组件相关的一个或多个关键字。

组件使用频率数据是组件流程开发过程中积累的组件的使用频率。比如某API构建组件HandleHttpRequest为高频使用组件，在一次随机取样的100个流程中被使用了30次，因此该组件的使用频率为30/100＝0.3。

组件关联数据是流程中一组件和其他组件连接时产生的统计数据。比如在一次随机取样的100个流程中，对应不同前置组件时，之后使用数据转换组件RecordMapper的概率如表1所示：

表1

前置组件	后续连接RecordMapper概率
		HandleHttpRequest	0.21
InvokeHttp	0.19
		QueryDatabaseTable	0.12
GetFile	0.08

在构建组件信息集合时，从组件库中通过提取关键字来得到组件关键字数据，从流程库中通过提取组件使用频率信息来得到组件使用频率数据以及通过提取组件连接信息来得到组件关联数据。将这些数据进行索引之后保存在服务器端的数据库中，可以供后续查询模块进行匹配组件查询以及推荐模块进行推荐组件排名计算。

本发明专利申请中，步骤102中，利用所述组件信息集合生成与所述组件查询信息相应的组件列表包括：

在用户设计编排流程时，往往需要快速定位某一个组件，本发明提供一个基于浏览器的界面来提供组件查询信息的输入，这里的组件查询信息即关键字。当用户在输入框输入关键字时，后台将根据用户输入的关键字对组件关键字数据进行检索，计算组件库中各组件的匹配得分，选取匹配得分较高的组件组成组件列表，并将该组件列表通过前台界面呈现给用户，以供用户进行选择。

具体地，利用所述组件关键字数据和所述组件使用频率数据计算各组件的匹配得分包括：

获取所述查询信息包括的j个关键字t₁,t₂,...,t_j，j为大于等于1的正整数；

通过下述公式计算各组件的匹配得分：

计算匹配得分的具体实施例如下：

(1)对用户输入的查询信息进行分析并将查询信息分拆为一个或多个关键字。这里的关键字分拆可以是现有技术中基于分隔符如空格，标点符号分拆等。

(2)选定组件库中的一组件，针对分拆出的每个关键字，计算下述各项，并将各项结果求积：

tf(t_iind)表示关键字t_i在组件d的组件关键字数据中出现频率的平方根，组件关键字数据中匹配到的关键字t_i越多，则匹配得分越高，具体地，tf(t_iind)的计算方法如下：如组件A的组件关键字数据拆分后总共包含4个关键字：数据、输入、大数据、数据，则当t_i为“数据”时，其在组件A的组件关键字数据中出现的频率为2/4＝0.5，当t_i为“输入”时，其在组件A的组件关键字数据中出现的频率为1/4＝0.25，当t_i为“大数据”时，其在组件A的组件关键字数据中出现的频率为1/4＝0.25；

idf(t_i)²表示关键字t_i在组件d的组件关键字数据中的逆文本频率指数，其中，numDocs表示所述流程库中总的组件个数，docFreq表示一组件的组件关键字数据中包括关键字t_i的组件个数(例如，组件关键字数据中包括t_i的组件共有8个，则docFreq取值为8)，组件关键字数据中出现关键字t_i的组件数越少，则匹配得分越高；

fq(d)表示组件d在流程库中的出现频率，这里的流程库可以是整体的流程库，也可以是流程库的子集(即整体流程库中一部分流程组成的集合)，因此组件d在流程库中使用的越频繁，匹配得分越高，具体地，fq(d)可以通过下述方法计算：fq(d)为流程库中所选择数量的流程中组件d出现的次数除以该所选择数量，例如，在100个流程中，A组件出现了30次，则组件A的出现频率fq(d)＝30/100＝0.3；

norm(d)表示关键字归一化因子，numTerms表示组件d的组件关键字数据中包括的所有关键字的个数，因此组件关键字数据中包括的关键字个数越少，则匹配得分越高。

(3)将针对每个关键字计算的各项乘积求和，得到一组件相应于该查询信息的匹配得分。

(4)重复上述步骤(1)-(3)，分别计算组件库中各组件的匹配得分。

通过上述步骤计算得到组件库中各组件针对用户输入的查询信息的匹配得分后，选取匹配得分较高的组件组成组件列表，并将该组件列表通过前台界面呈现给用户，以供用户从组件列表中进行选择。

本发明专利申请中，步骤103中，利用所述组件信息集合生成相应于所述前置组件的后置组件列表包括：

这里的出现概率可以基于流程库进行统计，比如流程库里A组件出现了100次，在A出现的100次中，B在A后面出现了50次，则组件A后出现组件B的概率为0.5。即计算出现概率时，用流程库中一前置组件后出现一后置组件的次数除以出现该前置组件的次数。

经验不足的用户在设计组件编排流程的过程中，有时可能不能确定哪个组件可以适用于当前场景的下一步处理，即如何选择后置组件。为了解决这个问题，在本发明专利申请中，提供了一种后置组件的智能推荐方法，其可以在用户在基于浏览器的界面上的操作来实现。当前的组件提供拖拽功能来创建到下一个组件的连接，用户从当前组件拖拽一个连接到空白区域时，系统能够自动捕获到用户的该操作，并将当前组件(即前置组件)的信息发送给后台进行后置组件的推荐计算。系统的推荐算法会基于前置组件的信息和组件信息集合中的组件关联数据计算各可能的后置组件的推荐得分，并选择推荐得分较高的组件生成后置组件列表，将列表返回给前台界面并呈现给用户。用户从后置组件列表中选择合适的后置组件。本发明专利申请的这一后置组件推荐功能能够帮助经验不足的用户快速选择后置组件，避免在选择后置组件时花费大量的时间和精力。同时，可以通过更加科学和智能的方式，选择更合适的后置组件。

具体地，通过下述方式计算所述前N个组件的推荐得分：

推荐得分＝freq(p,s)，

其中，freq(p,s)表示所述前置组件为p时，所述后置组件为s的出现概率的平方根。因此，一后置组件出现的概率越高，其推荐得分越高。需要说明的是，这里对出现概率做平方根计算，是为了让取值差异更加平均。

下面详细说明根据本发明专利申请的具体实施例，假设所涉及的组件库中包括100个组件。如图2所示，该实施例包括：

步骤201，索引模块根据组件库以及流程库中的数据，包括历史使用数据，提取组件关键字数据、使用频率数据、组件关联数据，生成组件信息集合。

步骤202，接收到用户输入的组件查询信息后，对查询信息进行分析，将查询信息拆分为关键字t₁,t₂。

步骤203，对组件库中的每个组件采用下述公式计算组件的匹配得分：

并选出匹配得分较高的前10个组件生成组件列表，通过用户界面显示给用户，供用户选择。

步骤204，捕获到用户拖拽一个连接到一个组件后时，基于当前组件(即前置组件)的信息以及之前提取的组件关联数据，选择该前置组件后出现概率较高的20个组件。

步骤205，计算该20个组件的推荐得分，推荐得分＝freq(p,s)，选择推荐得分较高的10个组件生成后置组件列表，通过用户界面显示给用户，供用户选择。

本发明提供的组件编排方法的以根据实际情况的需要进行不同的方式的组合。例如，在实际的编排过程中，如果一个流程只有一个组件，则不需要选择后置组件，因此就不需要上述步骤103及其具体实施方法，并且在构建组件信息集合时也不需要包括组件关联数据了。

本发明专利申请还提供了一种组件编排系统，如图3所示，所述系统包括：

索引模块301，用于构建组件信息集合；

查询模块302，用于基于收到的组件查询信息，利用所述组件信息集合生成与所述组件查询信息相应的组件列表。

其中，所述系统还包括：

推荐模块303，用于当检测到需要选择关联组件时，获取待被关联的前置组件，基于所述前置组件，利用所述组件信息集合生成相应于所述前置组件的后置组件列表。

其中，所述索引模块还用于：

其中，所述查询模块还用于：

通过下述公式计算各组件的匹配得分：

其中，所述推荐模块还用于：

推荐得分＝freq(p,s)，

上面描述的内容可以单独地或者以各种方式组合起来实施，而这些变型方式都在本发明的保护范围之内。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案而非限制，仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的权利要求范围当中。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

Claims

1.一种组件编排方法，其特征在于，所述方法包括：

构建组件信息集合；

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

3.如权利要求2所述的方法，其特征在于，构建组件信息集合包括：

4.如权利要求3所述的方法，其特征在于，利用所述组件信息集合生成与所述组件查询信息相应的组件列表包括：

5.如权利要求4所述的方法，其特征在于，利用所述组件关键字数据和所述组件使用频率数据计算各组件的匹配得分包括：

通过下述公式计算各组件的匹配得分：

其中，d表示计算所述匹配得分的组件，tf(t_iind)表示关键字t_i在组件d的组件关键字数据中出现频率的平方根，idf(t_i)表示关键字t_i在组件d的组件关键字数据中的逆文本频率指数，f_q(d)表示组件d在流程库中的出现频率，norm(d)表示关键字归一化因子，

6.如权利要求3所述的方法，其特征在于，利用所述组件信息集合生成相应于所述前置组件的后置组件列表包括：

7.如权利要求6所述的方法，其特征在于，通过下述方式计算所述前N个组件的推荐得分：

推荐得分＝freq(p,s)，

8.一种组件编排系统，其特征在于，所述系统包括：

索引模块，用于构建组件信息集合；

9.如权利要求8所述的系统，其特征在于，所述系统还包括：

10.如权利要求9所述的系统，其特征在于，所述索引模块还用于：

11.如权利要求10所述的系统，其特征在于，所述查询模块还用于：

12.如权利要求11所述的系统，其特征在于，所述查询模块还用于通过下述步骤计算各组件的匹配得分：

通过下述公式计算各组件的匹配得分：

13.如权利要求10所述的系统，其特征在于，所述推荐模块还用于：

14.如权利要求13所述的系统，其特征在于，所述推荐模块还用于通过下述方式计算所述前N个组件的推荐得分：

推荐得分＝freq(p,s)，