CN105389358A - 基于关联规则的Web服务推荐方法 - Google Patents
基于关联规则的Web服务推荐方法 Download PDFInfo
- Publication number
- CN105389358A CN105389358A CN201510740989.4A CN201510740989A CN105389358A CN 105389358 A CN105389358 A CN 105389358A CN 201510740989 A CN201510740989 A CN 201510740989A CN 105389358 A CN105389358 A CN 105389358A
- Authority
- CN
- China
- Prior art keywords
- service
- degree
- recommendation
- confidence
- support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于关联规则的Web服务推荐方法。现有的Web服务推荐方法虽然引入关联规则提高了Web服务组合的执行效率和服务质量,但是只能产生强关联服务的推荐,对于一部分不常见但高关联能力的服务则由于使用率低被忽略了。本发明对关联规则挖掘进行了改进,即对关联规则的支持度进行修改。改进后的关联规则推荐方法保证服务组合内在的每个原子服务间的关联强度不会因服务组合的长度增大而降低,相较于常规的推荐方法在稳定性和准确度上均有提高。本发明分析服务组合的历史数据,发掘单个Web服务之间所隐含的内在联系从而发现用户的潜在需求,系统选择最佳服务组合推荐给用户。本发明给用户提供方便高效的服务推荐方法,具有广阔的应用前景。
Description
技术领域
本发明涉及Web服务组合的服务推荐计算技术领域,特别是涉及一种基于关联规则的Web服务推荐方法。
背景技术
Web服务推荐系统一方面帮助用户找到对用户有用的Web服务,一方面帮助服务的提供者将Web服务展现给对它感兴趣的用户面前。推荐的这些服务必须满足用户的功能性和非功能性的需求。一个高效的推荐算法,往往能够帮助开发者缩短开发周期、节约开发以及管理所需要的成本,同时保证软件开发的效率和质量。现有的Web服务推荐方法大多基于Web服务本身或者用户之间的相似度进行相应的推荐,比如基于项目的协同过滤推荐和基于用户的协同过滤推荐。这些方法基本都是从推荐普通商品的角度出发的,由于Web服务的特异性和用户群体的多样性,普通的推荐方法往往效果一般。随着用户使用Web服务的时间的变长,利用日益庞大的用户历史使用记录来为用户推荐逐渐成为Web推荐的更好选择。
很多服务推荐算法通过比较服务之间的相似特性,从而为用户推荐功能上相似的服务。但是有时候用户并不知道自己需要什么具体的服务,因为用户并没有给出具体明确的需求,在这种情况下通过相似特性的方式就很难做出推荐。单个Web服务通常功能单一,不能满足多样的需求,因此要进行服务组合。利用数据挖掘技术,发掘单个Web服务之间所隐含的内在联系就可以发现用户的潜在需求,从而产生Web推荐。所以从服务组合的角度,通过分析所有服务组合的历史数据,我们可以给用户推荐其他原子服务来帮助用户完善自己的组合服务的功能或者提高组合服务的性能。
目前有学者提出了面向Web服务组合推荐的关联规则研究,将关联规则应用在Web服务组合推荐中。虽然引入关联规则提高了Web服务组合的执行效率和服务质量并产生了推荐,但是该方法只能产生少部分强关联服务的推荐,对于少部分不常见但高关联能力的服务则由于使用率不高被忽略了。
为了给用户提供方便高效的服务推荐方法,本发明提出改进的关联规则推荐方法。对服务进行关联规则推荐,从而从宏观上构造和优化服务组合,以保证推荐结果的准确性。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于关联规则的Web服务推荐方法。
本发明的目的是通过以下技术方案来实现的:一种基于关联规则的Web服务推荐方法,包括以下步骤:
(1)预处理工作流数据,解析工作流,从工作流中提取原子服务信息,构造服务组合的历史记录,其中原子服务总数为n,每个原子服务就使用编号1-n表示,比如第一个原子服务编号为1,第二个原子服务编号为2,……,第n个原子服务编号为n;
(2)组建服务组合:将步骤1提取的原子服务重新随机组合,将产生的服务组合保存在
二维数组userCombList中,userCombList[]的长度代表总共有多少个服务组合,重新组合后的规则总数N=2n-1;
(3)搜索最长组合,即从二维数组userCombList中搜索最佳的服务组合,具体包括以下子步骤:
(3.1)令变量len=n,n是原子服务个数;
(3.2)如果len>0,执行步骤3.3;否则执行步骤3.7;
(3.3)令变量i=0;
(3.4)如果i<userCombList[len]数组的长度,执行步骤3.5;否则执行步骤3.6;
(3.5)如果userCombList[len]数组的长度等于len,同时userCombList[len][i]服务组合符合关联规则,则把该组合保存在二维数组result中,然后令i=i+1,执行步骤3.4;否则,直接令i=i+1,执行步骤3.4;
(3.6)如果二维数组result中存在长度为len的关联规则,则找到最佳服务组合,保存在二维数组finalresult中,执行步骤3.7;否则,len=len-1,执行步骤3.2;
(3.7)结束循环;
(4)计算推荐度:从二维数组finalresult中提取关联规则,计算每个服务在这个规则下的置信度,放在一维数组rec中,rec的大小是n(原子服务个数),rec的第k个元素就是第k个原子服务的置信度;把置信度作为推荐度,置信度越大,推荐排名越靠前;
(5)排序服务检索结果:根据已有的用户历史记录采用修正后的支持度公式计算每个推荐目标的推荐预测值即数组rec;将数组rec按照推荐度的值降序排列,从而得到个性化推荐结果。
进一步地,所述步骤2中,所述服务组合为将功能简单的服务组件按照相关的逻辑和时序关系进行动态地交互,以此协作完成一个大任务以满足用户的复杂多样的业务需求。
进一步地,所述步骤4中,每个推荐目标的置信度的计算具体为:
A)计算支持度,支持度揭示所有事务中A与B同时出现的概率;如果支持度越大,关联规则越常见;使用修正后的支持度公式计算支持度Support(A->B):
其中,X代表整个复合服务数据集中的任意一组复合服务,D代表整个复合服务数据集。ID代表数据集所有复合服务的数量。
修正函数fs代表该AB元素在当前组合中所占的比例,函数如下:
B)计算置信度,置信度Confidence(A->B)=Support(A->B)/Support(A)=P(A|B);置信度揭示了A出现时,B出现的概率;Support(A->B)就是A与B同时出现的概率,即支持度。这里的置信度就是推荐目标的推荐度。
本发明与同类技术相比,具有的有益的效果是:现有的Web服务推荐方法虽然引入关联规则提高了Web服务组合的执行效率和服务质量并产生了推荐,但是只能产生强关联服务的推荐,对于一部分不常见但高关联能力的服务则由于使用率低被忽略了。针对这类不足,本发明对关联规则挖掘进行了改进,即对关联规则的支持度进行修改。改进后的关联规则推荐方法保证服务组合内在的每个原子服务间的关联强度不会因服务组合的长度增大而降低,相较于常规的推荐方法在稳定性和准确度上均有提高。本发明分析服务组合的历史数据,发掘单个Web服务之间所隐含的内在联系从而发现用户的潜在需求,系统选择最佳服务组合推荐给用户。本发明方法可以找到复合服务内在的原子服务之间存在着的关联性,从而更好满足用户服务组合的需求,给用户提供方便高效的服务推荐方法,具有广阔的应用前景。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
如图1所示,本发明基于关联规则的Web服务推荐方法,包括以下步骤:
步骤1,预处理工作流数据,解析工作流,从工作流中提取大量原子服务信息,构造服务组合的历史记录。假设有如下训练集,工作流1包含A,B,C三个原子服务,工作流2包含A,B,C,D,E,F三个原子服务。所以总共提取了6个原子服务。
步骤2,组建服务组合:步骤1提取的原子服务重新随机组合,将产生的服务组合保存在二维数组userCombList中,重新组合后的规则总数N=2n-1。把每个原子服务编号,第一个原子服务的编号为1,第二个的编号为2,……,最后一个原子服务编号为6。将这六个原子服务重新组合,比如,其中一个组合为“1;2;3;”。这里服务组合的总数是26-1即63个服务组合,把这63个组合放在userCombList[][]。
步骤3,搜索最长组合:即从二维数组userCombList中搜索最佳的服务组合,具体包括以下子步骤:
(3.1)令变量len=n,n是原子服务个数;
(3.2)如果len>0,执行步骤3.3;否则执行步骤3.7;
(3.3)令变量i=0;
(3.4)如果i<userCombList[len]数组的长度,执行步骤3.5;否则执行步骤3.6;
(3.5)如果userCombList[len]数组的长度等于len,同时userCombList[len][i]服务组合符合关联规则,则把该组合保存在二维数组result中,然后令i=i+1,执行步骤3.4;否则,直接令i=i+1,执行步骤3.4;
(3.6)如果二维数组result中存在长度为len的关联规则,则找到最佳服务组合,保存在二维数组finalresult中,执行步骤3.7;否则,len=len-1,执行步骤3.2;
(3.7)结束循环;
步骤4,从二维数组finalresult中提取关联规则,计算每个服务在这个规则下的置信度,放在一维数组rec中,把置信度作为推荐度,置信度越大,推荐排名越靠前;比如:删除原子服务C,那么我们会得到最佳服务组合是A;B;D;E;F;C的推荐度等于C的置信度,C的支持度=1/2=0.5,最佳组合的支持度是1/2=0.5,那么C的推荐度(置信度)等于0.5/0.5=1,是我们首要推荐目标。把目标C和它的推荐度放在rec数组中。
步骤5,排序服务检索结果:遍历所有rec数组,根据推荐目标的推荐度以降次排序,按顺序取前3个产生推荐列表,将最终推荐结果呈现给用户。
Claims (3)
1.一种基于关联规则的Web服务推荐方法,其特征在于,包括以下步骤:
(1)预处理工作流数据,解析工作流,从工作流中提取原子服务信息,构造服务组合的历史记录,其中原子服务总数为n,每个原子服务使用编号1-n表示(第一个原子服务编号为1,第二个原子服务编号为2,……,第n个原子服务编号为n);
(2)组建服务组合:将步骤1提取的原子服务重新随机组合,将产生的服务组合保存在
二维数组userCombList中,userCombList[]的长度代表总共有多少个服务组合,重新组合后的规则总数N=2n-1;
(3)搜索最长组合,即从二维数组userCombList中搜索最佳的服务组合,具体包括以下子步骤:
(3.1)令变量len=n,n是原子服务个数;
(3.2)如果len>0,执行步骤3.3;否则执行步骤3.7;
(3.3)令变量i=0;
(3.4)如果i<userCombList[len]数组的长度,执行步骤3.5;否则执行步骤3.6;
(3.5)如果userCombList[len]数组的长度等于len,同时userCombList[len][i]服务组合符合关联规则,则把该组合保存在二维数组result中,然后令i=i+1,执行步骤3.4;否则,直接令i=i+1,执行步骤3.4;
(3.6)如果二维数组result中存在长度为len的关联规则,则找到最佳服务组合,保存在二维数组finalresult中,执行步骤3.7;否则,len=len-1,执行步骤3.2;
(3.7)结束循环;
(4)计算推荐度:从二维数组finalresult中提取关联规则,计算每个服务在这个规则下的置信度,并把计算结果放在一维数组rec中,rec的大小是n(原子服务个数),rec的第k个元素就是第k个原子服务的置信度;把置信度作为推荐度,置信度越大,推荐排名越靠前;
(5)排序服务检索结果:根据已有的用户历史记录采用修正后的支持度公式计算每个推荐目标的推荐预测值即数组rec;将数组rec按照推荐度的值降序排列,从而得到个性化推荐结果。
2.根据权利要求1所述一种基于关联规则的Web服务推荐方法,其特征在于,所述步骤2中,所述服务组合的定义为将功能简单的服务组件按照相关的逻辑和时序关系进行动态地交互,以此协作完成一个大任务以满足用户的复杂多样的业务需求。
3.根据权利要求1所述一种基于关联规则的Web服务推荐方法,其特征在于,所述步骤4中,每个推荐目标的置信度的计算具体为:
A)计算支持度,支持度揭示所有事务中A与B同时出现的概率;如果支持度越大,关联规则越常见;使用修正后的支持度公式计算支持度Support(A->B):
其中,X代表整个复合服务数据集中的任意一组复合服务,D代表整个复合服务数据集。ID代表数据集所有复合服务的数量。
修正函数fs代表该AB元素在当前组合中所占的比例,函数如下:
B)计算置信度,置信度Confidence(A->B)=Support(A->B)/Support(A)=P(A|B);置信度揭示了A出现时,B出现的概率;Support(A->B)就是A与B同时出现的概率,即支持度。这里的置信度就是推荐目标的推荐度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510740989.4A CN105389358A (zh) | 2015-11-04 | 2015-11-04 | 基于关联规则的Web服务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510740989.4A CN105389358A (zh) | 2015-11-04 | 2015-11-04 | 基于关联规则的Web服务推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105389358A true CN105389358A (zh) | 2016-03-09 |
Family
ID=55421648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510740989.4A Pending CN105389358A (zh) | 2015-11-04 | 2015-11-04 | 基于关联规则的Web服务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105389358A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354844A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于文本挖掘的服务组合包推荐系统及方法 |
WO2018001237A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Co., Ltd. | Data mining interest generator |
CN110069607A (zh) * | 2017-12-14 | 2019-07-30 | 株式会社日立制作所 | 用于客户服务的方法、装置、电子设备、计算机可读存储介质 |
CN110162694A (zh) * | 2019-04-02 | 2019-08-23 | 莫毓昌 | 一种基于成对关联规则的推荐系统和方法 |
CN110633417A (zh) * | 2019-09-12 | 2019-12-31 | 齐鲁工业大学 | 一种基于服务质量的web服务推荐的方法及系统 |
CN110852863A (zh) * | 2019-11-15 | 2020-02-28 | 安徽海汇金融投资集团有限公司 | 一种基于关联分析的应收账款流转推荐方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521283A (zh) * | 2011-11-28 | 2012-06-27 | 浙江大学 | 一种基于贝叶斯原理的服务组合推荐方法及系统 |
CN103544623A (zh) * | 2013-11-06 | 2014-01-29 | 武汉大学 | 一种基于用户偏好特征建模的Web 服务推荐方法 |
-
2015
- 2015-11-04 CN CN201510740989.4A patent/CN105389358A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521283A (zh) * | 2011-11-28 | 2012-06-27 | 浙江大学 | 一种基于贝叶斯原理的服务组合推荐方法及系统 |
CN103544623A (zh) * | 2013-11-06 | 2014-01-29 | 武汉大学 | 一种基于用户偏好特征建模的Web 服务推荐方法 |
Non-Patent Citations (1)
Title |
---|
《中国优秀硕士学位论文全文数据库》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018001237A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Co., Ltd. | Data mining interest generator |
CN106354844A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于文本挖掘的服务组合包推荐系统及方法 |
CN106354844B (zh) * | 2016-08-31 | 2020-08-04 | 上海交通大学 | 基于文本挖掘的服务组合包推荐系统及方法 |
CN110069607A (zh) * | 2017-12-14 | 2019-07-30 | 株式会社日立制作所 | 用于客户服务的方法、装置、电子设备、计算机可读存储介质 |
CN110069607B (zh) * | 2017-12-14 | 2024-03-05 | 株式会社日立制作所 | 用于客户服务的方法、装置、电子设备、计算机可读存储介质 |
CN110162694A (zh) * | 2019-04-02 | 2019-08-23 | 莫毓昌 | 一种基于成对关联规则的推荐系统和方法 |
CN110633417A (zh) * | 2019-09-12 | 2019-12-31 | 齐鲁工业大学 | 一种基于服务质量的web服务推荐的方法及系统 |
CN110852863A (zh) * | 2019-11-15 | 2020-02-28 | 安徽海汇金融投资集团有限公司 | 一种基于关联分析的应收账款流转推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105389358A (zh) | 基于关联规则的Web服务推荐方法 | |
CN104899273B (zh) | 一种基于话题和相对熵的网页个性化推荐方法 | |
CN106339383B (zh) | 一种搜索排序方法及系统 | |
CN104572449A (zh) | 一种基于用例库的自动化测试方法 | |
US20120317087A1 (en) | Location-Aware Search Ranking | |
CN102004774A (zh) | 基于统一概率模型的个性化用户标签建模与推荐方法 | |
CN1963816A (zh) | 一种搜索引擎性能评价的自动化处理方法 | |
CN104933624A (zh) | 复杂网络的社团发现方法及社团重要节点发现方法 | |
CN105095433A (zh) | 实体推荐方法及装置 | |
CN104298778A (zh) | 一种基于关联规则树的轧钢产品质量的预测方法及系统 | |
CN103020212A (zh) | 一种基于用户查询日志实时发现热点视频的方法和装置 | |
CN104008203A (zh) | 一种融入本体情境的用户兴趣挖掘方法 | |
CN102567326A (zh) | 一种信息搜索、及信息搜索排序装置和方法 | |
CN105184371A (zh) | 一种基于流程驱动和粗糙集的领域知识推送方法 | |
Gong et al. | Grouping target paths for evolutionary generation of test data in parallel | |
CN104636403A (zh) | 处理查询请求的方法及装置 | |
CN104156431A (zh) | 一种基于实体图社团结构的rdf关键词查询方法 | |
CN104834709A (zh) | 一种基于负载均衡的并行余弦模式挖掘方法 | |
Li | Research on Evaluation Method of Physical Education Teaching Quality in Colleges and Universities Based on Decision Tree Algorithm | |
CN104572445A (zh) | 用于检测Web服务组合中BPEL流程数据竞争的方法 | |
CN106021423A (zh) | 基于群组划分的元搜索引擎个性化结果推荐方法 | |
CN103577899A (zh) | 一种基于可靠性预测与QoS相结合的服务组合方法 | |
CN103942232A (zh) | 用于挖掘意图的方法和设备 | |
Nguyen et al. | Detecting correlated columns in relational databases with mixed data types | |
Iqbal et al. | TKFIM: Top-K frequent itemset mining technique based on equivalence classes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160309 |
|
RJ01 | Rejection of invention patent application after publication |