CN104461558B - 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 - Google Patents
一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 Download PDFInfo
- Publication number
- CN104461558B CN104461558B CN201410804898.8A CN201410804898A CN104461558B CN 104461558 B CN104461558 B CN 104461558B CN 201410804898 A CN201410804898 A CN 201410804898A CN 104461558 B CN104461558 B CN 104461558B
- Authority
- CN
- China
- Prior art keywords
- developer
- change request
- sound code
- software
- code file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000004048 modification Effects 0.000 title claims abstract description 16
- 238000012986 modification Methods 0.000 title claims abstract description 15
- 238000012508 change request Methods 0.000 claims abstract description 34
- 238000011161 development Methods 0.000 claims description 9
- 238000011524 similarity measure Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000000205 computational method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101100533311 Rattus norvegicus Set gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,帮助软件管理人员找出最适合修改某一特定变化请求的开发人员,同时结合该开发人员开发的历史任务记录,推荐出开发人员熟悉的与变化请求相关的一些辅助信息。
Description
技术领域
本发明涉及软件维护推荐领域,尤其是一种基于协相关主题模型的面向软件修改的个性化任务推荐方法。
背景技术
由于软件工程的复杂性,在软件开发与维护过程中软件漏洞会经常出现;此外,用户在使用软件的过程中,也会根据实际情况提出新的变更请求或升级请求。因此,软件变更请求常常被错误报告人员或用户提出来,需要开发人员不断的进行维护。给定一个变更请求,软件项目经理必须将变更请求分配给开发人员实现修改。为了提高软件维护的效率和准确性,相关源代码定位和最适合实现变更请求的开发人员的推荐任务急需要解决。
为了完成这个任务目前研究领域中出现了很多方面的推荐技术,这些技术主要都在研究如何更准确的推荐出合适的开发人员。这些技术最基本方法原理是:曾经实现过相关的维护任务的开发人员可以更快更好的实现现在的变更请求。基于这一思想,一些最适合的开发人员和一些相关的源码文件被推荐出来。但是,这些推荐方法在推荐相关参考文件时并没有考虑到开发人员的开发习惯和开发经验,因此这些被推荐出来的文件对所有的开发人员都是一样的。如果开发人员不熟悉这些推荐出的源码文件,反而会花费更多的时间理解这些推荐出的文件。在实际的软件开发和维护过程中,每一个开发人员都有不同的开发习惯和开发经验,而且有时候最适合完成任务的开发人员并没有时间或者早已经不在项目组内,但此时变更请求又急需要解决。此时,其他的开发人员应该被推荐出来,并且一些实现请求的辅助信息应该提供出来,这样就可以更有效的实现变更请求。因此,不仅要推荐出合适的开发人员,一些具有个性化请求任务的辅助信息也需要推荐出来。
协方差主题模型Collaborative Topic Model,即CTM,将协方差分析和主题模型相结合。该模型不仅可以找出相关开发人员个性化任务,还可以把一个新任务推荐给有类似开发经验的开发人员。用CTM主要是把相关文件分配给每一个相关开发人员,然后利用开发人员的相关文件与变化请求计算相似度寻找出最适合实现请求的开发人员。
发明内容
本发明提供一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,帮助软件管理人员找出最适合修改某一特定变化请求的开发人员,同时结合该开发人员开发的历史任务记录,推荐出开发人员熟悉的与变化请求相关的一些辅助信息。
一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据相关的历史提交信息和变更请求中的单词重复度识别相关的提交信息;
(3)得出所有与变更请求相关的提交信息后,在相关提交信息中提取相关的开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,相关源码文件作为开发人员的部分个性化文件;
(4)将步骤(3)中得到的所有<开发者,相关源码文件>对应列表作为CTM模型的输入数据进行协相关计算,得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件;
(5)将步骤(3)和步骤(4)中两部分相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
本发明的有益效果为:准确的推荐出了合适的开发人员,而且结合了该开发人员的开发历史任务找出了与变化请求相关的一些源码文件供开发人员参考,实现了个性化推荐功能,更有效提高了开发人员维护软件的效率与准确率。利用CTM模型技术,不仅准确化、丰富化开发人员的个性化文件,而且对于一些新的开发请求,原系统并没有此方面的开发人员,可以找到实现过类似任务的开发人员供软件管理人员参考。对于一些最合适的开发人员没有时间修改软件或者已不在项目组内的情况,本方法也可以根据其他开发人员的个性化文件找出其他最适合修改任务的开发人员。
附图说明
图1是本发明的方法流程图。
图2是本发明的CTM图模型。
具体实施方式
如图1所示,一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;例如:对变更请求“Selecting text by mouse sets X primary selection”预处理后的结果为:“select pack choose text mouse rat set primary elementary major central mainselection choose choice pick”。
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据提交信息和变更请求中的单词重复度识别相关的提交信息。首先对步骤(1)中预处理后的所有单词进行编号,然后用编号表示提交信息和变更请求中的单词,再用余弦函数对所有提交信息和变更请求进行相似度计算,最后找出与变更请求相关的提交信息。余弦函数的计算方法为:
其中公式中的向量表示变更请求和提交信息的单词向量。
(3)求出所有与变更请求相关的提交信息后,在相关提交信息中提取开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,此步骤中的相关文件作为开发人员的部分个性化文件。
(4)将步骤(3)的所有<开发者,相关源码文件>对应列表作为CTM模型(CTM模型图如图2)的输入数据进行协相关计算。得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件。首先对系统中所有源码文件进行编号,并且将步骤(3)的结果<开发者,相关源码文件>以编号形式给出,作为CTM模型的输入数据进行协相关计算。经过协相关计算后开发人员的相关文件信息会因为与其他开发人员开发经验类似而使得个性化文件增多。
(5)结合步骤(3)和步骤(4)中两部分相关源码文件,并且将这些相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源码文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
如图2所示,为CTM模型的原理图。假设有k个主题β=β1,k,CTM的生成过程如下:
(1)给每一个作者i,求出作者潜在向量Ui~N(0;λ-1IK);
(2)对每一个文件j,求出主题比例Θj~Dirichlet(α);求出文件潜在偏移变量εj~N(0;λ-1IK),并且设置文件潜在向量为vj=εj+Θj;对每一个单词给主题赋值Zjn~Mult(Θ),求出每一个单词Wjn~Mult(βZjn);
(3)对于每一个作者-文件键值对,求出rating值rij~N(uT i vj,c-1 ij),其中cij是一个精度因子,如果rij=1,cij=a;rij=0,cij=b;a和b是两个调节参数,满足a>b>0。
尽管本发明就优选实施方式进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改。
Claims (2)
1.一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,其特征在于,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据相关的历史提交信息和变更请求中的单词重复度识别相关的历史提交信息;
(3)得出所有与变更请求相关的提交信息后,在相关提交信息中提取相关的开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,相关源码文件作为开发人员的部分个性化文件;
(4)将步骤(3)中得到的所有<开发者,相关源码文件>对应列表作为CTM模型的输入数据进行协相关计算,得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件;
(5)将步骤(3)和步骤(4)中两部分相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
2.如权利要求1所述的方法,其特征在于,余弦函数的计算方法为:
其中公式中的向量表示变更请求和提交信息的单词向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410804898.8A CN104461558B (zh) | 2014-12-22 | 2014-12-22 | 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410804898.8A CN104461558B (zh) | 2014-12-22 | 2014-12-22 | 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104461558A CN104461558A (zh) | 2015-03-25 |
CN104461558B true CN104461558B (zh) | 2017-06-23 |
Family
ID=52907669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410804898.8A Active CN104461558B (zh) | 2014-12-22 | 2014-12-22 | 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104461558B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446734A (zh) * | 2015-10-14 | 2016-03-30 | 扬州大学 | 一种基于软件开发历史开发人员网络关系构建方法 |
CN105426514B (zh) * | 2015-11-30 | 2019-03-01 | 扬州大学 | 个性化的移动应用app推荐方法 |
CN105511869A (zh) * | 2015-12-01 | 2016-04-20 | 福建工程学院 | 一种基于用户反馈的需求跟踪系统及方法 |
CN105786999A (zh) * | 2016-02-17 | 2016-07-20 | 扬州大学 | 一种基于复杂网络关系的软件开发人员可视化推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617190A (zh) * | 2013-11-06 | 2014-03-05 | 福建工程学院 | 一种上下文感知的动态需求跟踪方法 |
CN103729473A (zh) * | 2014-01-22 | 2014-04-16 | 扬州大学 | 一种基于lda主题模型的相关软件历史数据提取方法 |
CN103744932A (zh) * | 2013-12-30 | 2014-04-23 | 华为技术有限公司 | 一种页面处理方法及装置 |
CN102831060B (zh) * | 2012-08-24 | 2015-07-08 | 东南大学 | 一种基于修改影响分析的部件软件回归测试用例更新方法 |
-
2014
- 2014-12-22 CN CN201410804898.8A patent/CN104461558B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831060B (zh) * | 2012-08-24 | 2015-07-08 | 东南大学 | 一种基于修改影响分析的部件软件回归测试用例更新方法 |
CN103617190A (zh) * | 2013-11-06 | 2014-03-05 | 福建工程学院 | 一种上下文感知的动态需求跟踪方法 |
CN103744932A (zh) * | 2013-12-30 | 2014-04-23 | 华为技术有限公司 | 一种页面处理方法及装置 |
CN103729473A (zh) * | 2014-01-22 | 2014-04-16 | 扬州大学 | 一种基于lda主题模型的相关软件历史数据提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104461558A (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11809824B1 (en) | Computing numeric representations of words in a high-dimensional space | |
US10430255B2 (en) | Application program interface mashup generation | |
CN103164463B (zh) | 推荐标签的方法和装置 | |
Grainger et al. | Solr in action | |
US11169786B2 (en) | Generating and using joint representations of source code | |
US8504490B2 (en) | Web-scale entity relationship extraction that extracts pattern(s) based on an extracted tuple | |
US10607142B2 (en) | Responding to user input based on confidence scores assigned to relationship entries in a knowledge graph | |
CN104461558B (zh) | 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 | |
JP7502283B2 (ja) | 人工知能/機械学習を用いたicsフローのオートコンプリートのためのシステムおよび方法 | |
Fujinaga et al. | Introduction to SIMSSA (single interface for music score searching and analysis) | |
US10572881B2 (en) | Applying entity search techniques to expedite entitlement resolution in support services | |
JP6237378B2 (ja) | 候補キュレーションアイテムをランキングする方法及びシステム | |
Zheng et al. | Integrating context similarity with sparse linear recommendation model | |
Akperov et al. | Using soft computing methods for the functional benchmarking of an intelligent workplace in an educational establishment | |
Valverde-Rebaza et al. | Job Recommendation Based on Job Seeker Skills: An Empirical Study. | |
Shah et al. | Literature study on multi-document text summarization techniques | |
Dubuisson Duplessis et al. | Utterance retrieval based on recurrent surface text patterns | |
Fukui et al. | Predictive algorithm for converting linear strings to general mathematical formulae | |
Zhang et al. | Unit of work supporting generative scientific workflow recommendation | |
Platanios et al. | Value-agnostic conversational semantic parsing | |
US11734602B2 (en) | Methods and systems for automated feature generation utilizing formula semantification | |
KR102341563B1 (ko) | 매개 텍스트 자료 토픽을 이용한 전문 텍스트 자료 추출 방법 | |
Munyaradzi et al. | A system for high quality crowdsourced indigenous language transcription | |
Chen et al. | Service composition recommendation method based on recurrent neural network and Naive Bayes | |
Hsu et al. | Similarity search over personal process description graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231116 Address after: Room C218-1, Building 2, No. 217, Kaifa West Road, High-tech Industrial Development Zone, Yangzhou City, Jiangsu Province, 225000 Patentee after: Yangzhou Jingyun Ecological Technology Co.,Ltd. Address before: 225009 No. 88, South University Road, Jiangsu, Yangzhou Patentee before: YANGZHOU University |