CN105389358A

CN105389358A - 基于关联规则的Web服务推荐方法

Info

Publication number: CN105389358A
Application number: CN201510740989.4A
Authority: CN
Inventors: 姜波; 潘伟丰; 谢波; 王家乐; 余海飞; 汪家磊
Original assignee: Zhejiang Gongshang University
Current assignee: Zhejiang Gongshang University
Priority date: 2015-11-04
Filing date: 2015-11-04
Publication date: 2016-03-09

Abstract

本发明公开了一种基于关联规则的Web服务推荐方法。现有的Web服务推荐方法虽然引入关联规则提高了Web服务组合的执行效率和服务质量，但是只能产生强关联服务的推荐，对于一部分不常见但高关联能力的服务则由于使用率低被忽略了。本发明对关联规则挖掘进行了改进，即对关联规则的支持度进行修改。改进后的关联规则推荐方法保证服务组合内在的每个原子服务间的关联强度不会因服务组合的长度增大而降低，相较于常规的推荐方法在稳定性和准确度上均有提高。本发明分析服务组合的历史数据，发掘单个Web服务之间所隐含的内在联系从而发现用户的潜在需求，系统选择最佳服务组合推荐给用户。本发明给用户提供方便高效的服务推荐方法，具有广阔的应用前景。

Description

基于关联规则的Web服务推荐方法

技术领域

本发明涉及Web服务组合的服务推荐计算技术领域，特别是涉及一种基于关联规则的Web服务推荐方法。

背景技术

Web服务推荐系统一方面帮助用户找到对用户有用的Web服务，一方面帮助服务的提供者将Web服务展现给对它感兴趣的用户面前。推荐的这些服务必须满足用户的功能性和非功能性的需求。一个高效的推荐算法，往往能够帮助开发者缩短开发周期、节约开发以及管理所需要的成本，同时保证软件开发的效率和质量。现有的Web服务推荐方法大多基于Web服务本身或者用户之间的相似度进行相应的推荐，比如基于项目的协同过滤推荐和基于用户的协同过滤推荐。这些方法基本都是从推荐普通商品的角度出发的，由于Web服务的特异性和用户群体的多样性，普通的推荐方法往往效果一般。随着用户使用Web服务的时间的变长，利用日益庞大的用户历史使用记录来为用户推荐逐渐成为Web推荐的更好选择。

很多服务推荐算法通过比较服务之间的相似特性，从而为用户推荐功能上相似的服务。但是有时候用户并不知道自己需要什么具体的服务，因为用户并没有给出具体明确的需求，在这种情况下通过相似特性的方式就很难做出推荐。单个Web服务通常功能单一，不能满足多样的需求，因此要进行服务组合。利用数据挖掘技术，发掘单个Web服务之间所隐含的内在联系就可以发现用户的潜在需求，从而产生Web推荐。所以从服务组合的角度，通过分析所有服务组合的历史数据，我们可以给用户推荐其他原子服务来帮助用户完善自己的组合服务的功能或者提高组合服务的性能。

目前有学者提出了面向Web服务组合推荐的关联规则研究，将关联规则应用在Web服务组合推荐中。虽然引入关联规则提高了Web服务组合的执行效率和服务质量并产生了推荐，但是该方法只能产生少部分强关联服务的推荐，对于少部分不常见但高关联能力的服务则由于使用率不高被忽略了。

为了给用户提供方便高效的服务推荐方法，本发明提出改进的关联规则推荐方法。对服务进行关联规则推荐，从而从宏观上构造和优化服务组合，以保证推荐结果的准确性。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于关联规则的Web服务推荐方法。

本发明的目的是通过以下技术方案来实现的：一种基于关联规则的Web服务推荐方法，包括以下步骤：

(1)预处理工作流数据，解析工作流，从工作流中提取原子服务信息，构造服务组合的历史记录，其中原子服务总数为n，每个原子服务就使用编号1-n表示，比如第一个原子服务编号为1，第二个原子服务编号为2，……，第n个原子服务编号为n；

(2)组建服务组合：将步骤1提取的原子服务重新随机组合，将产生的服务组合保存在

二维数组userCombList中，userCombList[]的长度代表总共有多少个服务组合，重新组合后的规则总数N＝2ⁿ-1；

(3)搜索最长组合，即从二维数组userCombList中搜索最佳的服务组合，具体包括以下子步骤：

(3.1)令变量len＝n,n是原子服务个数；

(3.2)如果len>0，执行步骤3.3；否则执行步骤3.7；

(3.3)令变量i＝0；

(3.4)如果i<userCombList[len]数组的长度，执行步骤3.5；否则执行步骤3.6；

(3.5)如果userCombList[len]数组的长度等于len,同时userCombList[len][i]服务组合符合关联规则，则把该组合保存在二维数组result中，然后令i＝i+1,执行步骤3.4；否则,直接令i＝i+1,执行步骤3.4；

(3.6)如果二维数组result中存在长度为len的关联规则，则找到最佳服务组合，保存在二维数组finalresult中,执行步骤3.7；否则，len＝len-1，执行步骤3.2；

(3.7)结束循环；

(4)计算推荐度：从二维数组finalresult中提取关联规则，计算每个服务在这个规则下的置信度，放在一维数组rec中，rec的大小是n(原子服务个数)，rec的第k个元素就是第k个原子服务的置信度；把置信度作为推荐度，置信度越大，推荐排名越靠前；

(5)排序服务检索结果：根据已有的用户历史记录采用修正后的支持度公式计算每个推荐目标的推荐预测值即数组rec；将数组rec按照推荐度的值降序排列，从而得到个性化推荐结果。

进一步地，所述步骤2中，所述服务组合为将功能简单的服务组件按照相关的逻辑和时序关系进行动态地交互，以此协作完成一个大任务以满足用户的复杂多样的业务需求。

进一步地，所述步骤4中，每个推荐目标的置信度的计算具体为：

A)计算支持度，支持度揭示所有事务中A与B同时出现的概率；如果支持度越大，关联规则越常见；使用修正后的支持度公式计算支持度Support(A->B)：

S u p p o r t (A - > B) = \frac{\underset{X &Element; D}{Σ} f_{s} (| X |, | A \cup B |) I_{x}}{I D}

其中，X代表整个复合服务数据集中的任意一组复合服务，D代表整个复合服务数据集。ID代表数据集所有复合服务的数量。

I_{x} = \{\begin{matrix} 1 (A \cup B &Subset; X) \\ 0 (A \cup B &NotElement; X) \end{matrix}

修正函数f_s代表该AB元素在当前组合中所占的比例，函数如下：

f_{s} = \frac{| A \cup B |}{| X |}

B)计算置信度，置信度Confidence(A->B)＝Support(A->B)/Support(A)＝P(A|B)；置信度揭示了A出现时，B出现的概率；Support(A->B)就是A与B同时出现的概率，即支持度。这里的置信度就是推荐目标的推荐度。

本发明与同类技术相比，具有的有益的效果是：现有的Web服务推荐方法虽然引入关联规则提高了Web服务组合的执行效率和服务质量并产生了推荐，但是只能产生强关联服务的推荐，对于一部分不常见但高关联能力的服务则由于使用率低被忽略了。针对这类不足，本发明对关联规则挖掘进行了改进，即对关联规则的支持度进行修改。改进后的关联规则推荐方法保证服务组合内在的每个原子服务间的关联强度不会因服务组合的长度增大而降低，相较于常规的推荐方法在稳定性和准确度上均有提高。本发明分析服务组合的历史数据，发掘单个Web服务之间所隐含的内在联系从而发现用户的潜在需求，系统选择最佳服务组合推荐给用户。本发明方法可以找到复合服务内在的原子服务之间存在着的关联性，从而更好满足用户服务组合的需求，给用户提供方便高效的服务推荐方法，具有广阔的应用前景。

附图说明

图1是本发明的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细说明。

如图1所示，本发明基于关联规则的Web服务推荐方法，包括以下步骤：

步骤1，预处理工作流数据，解析工作流，从工作流中提取大量原子服务信息，构造服务组合的历史记录。假设有如下训练集，工作流1包含A，B，C三个原子服务，工作流2包含A,B，C，D，E，F三个原子服务。所以总共提取了6个原子服务。

步骤2，组建服务组合：步骤1提取的原子服务重新随机组合，将产生的服务组合保存在二维数组userCombList中，重新组合后的规则总数N＝2ⁿ-1。把每个原子服务编号，第一个原子服务的编号为1，第二个的编号为2，……，最后一个原子服务编号为6。将这六个原子服务重新组合，比如，其中一个组合为“1；2；3；”。这里服务组合的总数是2⁶-1即63个服务组合，把这63个组合放在userCombList[][]。

步骤3，搜索最长组合：即从二维数组userCombList中搜索最佳的服务组合，具体包括以下子步骤:

(3.1)令变量len＝n,n是原子服务个数；

(3.2)如果len>0，执行步骤3.3；否则执行步骤3.7；

(3.3)令变量i＝0；

(3.7)结束循环；

步骤4，从二维数组finalresult中提取关联规则，计算每个服务在这个规则下的置信度，放在一维数组rec中，把置信度作为推荐度，置信度越大，推荐排名越靠前；比如：删除原子服务C，那么我们会得到最佳服务组合是A；B；D；E；F；C的推荐度等于C的置信度，C的支持度＝1/2＝0.5，最佳组合的支持度是1/2＝0.5，那么C的推荐度(置信度)等于0.5/0.5＝1，是我们首要推荐目标。把目标C和它的推荐度放在rec数组中。

步骤5，排序服务检索结果：遍历所有rec数组，根据推荐目标的推荐度以降次排序，按顺序取前3个产生推荐列表，将最终推荐结果呈现给用户。

Claims

1.一种基于关联规则的Web服务推荐方法，其特征在于，包括以下步骤：

(1)预处理工作流数据，解析工作流，从工作流中提取原子服务信息，构造服务组合的历史记录，其中原子服务总数为n，每个原子服务使用编号1-n表示(第一个原子服务编号为1，第二个原子服务编号为2，……，第n个原子服务编号为n)；

(3.1)令变量len＝n,n是原子服务个数；

(3.2)如果len>0，执行步骤3.3；否则执行步骤3.7；

(3.3)令变量i＝0；

(3.7)结束循环；

(4)计算推荐度：从二维数组finalresult中提取关联规则，计算每个服务在这个规则下的置信度，并把计算结果放在一维数组rec中，rec的大小是n(原子服务个数)，rec的第k个元素就是第k个原子服务的置信度；把置信度作为推荐度，置信度越大，推荐排名越靠前；

2.根据权利要求1所述一种基于关联规则的Web服务推荐方法，其特征在于，所述步骤2中，所述服务组合的定义为将功能简单的服务组件按照相关的逻辑和时序关系进行动态地交互，以此协作完成一个大任务以满足用户的复杂多样的业务需求。

3.根据权利要求1所述一种基于关联规则的Web服务推荐方法，其特征在于，所述步骤4中，每个推荐目标的置信度的计算具体为：

S u p p o r t (A - > B) = \frac{\underset{X &Element; D}{Σ} f_{s} (| X |, | A \cup B |) I_{x}}{I_{D}}

其中，X代表整个复合服务数据集中的任意一组复合服务，D代表整个复合服务数据集。I_D代表数据集所有复合服务的数量。

I_{x} = \{\begin{matrix} 1 (A \cup B &Subset; X) \\ 0 (A \cup B &NotElement; X) \end{matrix}

f_{s} = \frac{| A \cup B |}{| X |}