CN104461558B - 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 - Google Patents

一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 Download PDF

Info

Publication number
CN104461558B
CN104461558B CN201410804898.8A CN201410804898A CN104461558B CN 104461558 B CN104461558 B CN 104461558B CN 201410804898 A CN201410804898 A CN 201410804898A CN 104461558 B CN104461558 B CN 104461558B
Authority
CN
China
Prior art keywords
developer
change request
sound code
software
code file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410804898.8A
Other languages
English (en)
Other versions
CN104461558A (zh
Inventor
孙小兵
杨辉
李斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou Jingyun Ecological Technology Co.,Ltd.
Original Assignee
Yangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou University filed Critical Yangzhou University
Priority to CN201410804898.8A priority Critical patent/CN104461558B/zh
Publication of CN104461558A publication Critical patent/CN104461558A/zh
Application granted granted Critical
Publication of CN104461558B publication Critical patent/CN104461558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,帮助软件管理人员找出最适合修改某一特定变化请求的开发人员,同时结合该开发人员开发的历史任务记录,推荐出开发人员熟悉的与变化请求相关的一些辅助信息。

Description

一种基于协相关主题模型的面向软件修改的个性化任务推荐 方法
技术领域
本发明涉及软件维护推荐领域,尤其是一种基于协相关主题模型的面向软件修改的个性化任务推荐方法。
背景技术
由于软件工程的复杂性,在软件开发与维护过程中软件漏洞会经常出现;此外,用户在使用软件的过程中,也会根据实际情况提出新的变更请求或升级请求。因此,软件变更请求常常被错误报告人员或用户提出来,需要开发人员不断的进行维护。给定一个变更请求,软件项目经理必须将变更请求分配给开发人员实现修改。为了提高软件维护的效率和准确性,相关源代码定位和最适合实现变更请求的开发人员的推荐任务急需要解决。
为了完成这个任务目前研究领域中出现了很多方面的推荐技术,这些技术主要都在研究如何更准确的推荐出合适的开发人员。这些技术最基本方法原理是:曾经实现过相关的维护任务的开发人员可以更快更好的实现现在的变更请求。基于这一思想,一些最适合的开发人员和一些相关的源码文件被推荐出来。但是,这些推荐方法在推荐相关参考文件时并没有考虑到开发人员的开发习惯和开发经验,因此这些被推荐出来的文件对所有的开发人员都是一样的。如果开发人员不熟悉这些推荐出的源码文件,反而会花费更多的时间理解这些推荐出的文件。在实际的软件开发和维护过程中,每一个开发人员都有不同的开发习惯和开发经验,而且有时候最适合完成任务的开发人员并没有时间或者早已经不在项目组内,但此时变更请求又急需要解决。此时,其他的开发人员应该被推荐出来,并且一些实现请求的辅助信息应该提供出来,这样就可以更有效的实现变更请求。因此,不仅要推荐出合适的开发人员,一些具有个性化请求任务的辅助信息也需要推荐出来。
协方差主题模型Collaborative Topic Model,即CTM,将协方差分析和主题模型相结合。该模型不仅可以找出相关开发人员个性化任务,还可以把一个新任务推荐给有类似开发经验的开发人员。用CTM主要是把相关文件分配给每一个相关开发人员,然后利用开发人员的相关文件与变化请求计算相似度寻找出最适合实现请求的开发人员。
发明内容
本发明提供一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,帮助软件管理人员找出最适合修改某一特定变化请求的开发人员,同时结合该开发人员开发的历史任务记录,推荐出开发人员熟悉的与变化请求相关的一些辅助信息。
一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据相关的历史提交信息和变更请求中的单词重复度识别相关的提交信息;
(3)得出所有与变更请求相关的提交信息后,在相关提交信息中提取相关的开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,相关源码文件作为开发人员的部分个性化文件;
(4)将步骤(3)中得到的所有<开发者,相关源码文件>对应列表作为CTM模型的输入数据进行协相关计算,得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件;
(5)将步骤(3)和步骤(4)中两部分相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
本发明的有益效果为:准确的推荐出了合适的开发人员,而且结合了该开发人员的开发历史任务找出了与变化请求相关的一些源码文件供开发人员参考,实现了个性化推荐功能,更有效提高了开发人员维护软件的效率与准确率。利用CTM模型技术,不仅准确化、丰富化开发人员的个性化文件,而且对于一些新的开发请求,原系统并没有此方面的开发人员,可以找到实现过类似任务的开发人员供软件管理人员参考。对于一些最合适的开发人员没有时间修改软件或者已不在项目组内的情况,本方法也可以根据其他开发人员的个性化文件找出其他最适合修改任务的开发人员。
附图说明
图1是本发明的方法流程图。
图2是本发明的CTM图模型。
具体实施方式
如图1所示,一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;例如:对变更请求“Selecting text by mouse sets X primary selection”预处理后的结果为:“select pack choose text mouse rat set primary elementary major central mainselection choose choice pick”。
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据提交信息和变更请求中的单词重复度识别相关的提交信息。首先对步骤(1)中预处理后的所有单词进行编号,然后用编号表示提交信息和变更请求中的单词,再用余弦函数对所有提交信息和变更请求进行相似度计算,最后找出与变更请求相关的提交信息。余弦函数的计算方法为:
其中公式中的向量表示变更请求和提交信息的单词向量。
(3)求出所有与变更请求相关的提交信息后,在相关提交信息中提取开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,此步骤中的相关文件作为开发人员的部分个性化文件。
(4)将步骤(3)的所有<开发者,相关源码文件>对应列表作为CTM模型(CTM模型图如图2)的输入数据进行协相关计算。得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件。首先对系统中所有源码文件进行编号,并且将步骤(3)的结果<开发者,相关源码文件>以编号形式给出,作为CTM模型的输入数据进行协相关计算。经过协相关计算后开发人员的相关文件信息会因为与其他开发人员开发经验类似而使得个性化文件增多。
(5)结合步骤(3)和步骤(4)中两部分相关源码文件,并且将这些相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源码文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
如图2所示,为CTM模型的原理图。假设有k个主题β=β1,k,CTM的生成过程如下:
(1)给每一个作者i,求出作者潜在向量Ui~N(0;λ-1IK);
(2)对每一个文件j,求出主题比例Θj~Dirichlet(α);求出文件潜在偏移变量εj~N(0;λ-1IK),并且设置文件潜在向量为vj=εjj;对每一个单词给主题赋值Zjn~Mult(Θ),求出每一个单词Wjn~Mult(βZjn);
(3)对于每一个作者-文件键值对,求出rating值rij~N(uT i vj,c-1 ij),其中cij是一个精度因子,如果rij=1,cij=a;rij=0,cij=b;a和b是两个调节参数,满足a>b>0。
尽管本发明就优选实施方式进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改。

Claims (2)

1.一种基于协相关主题模型的面向软件修改的个性化任务推荐方法,其特征在于,包括如下步骤:
(1)对系统报告人员的软件变更请求和历史修改库中所有的历史提交信息进行预处理,包括词条划分、词根处理、动名词同义词近义词查询、扩充词汇量过程;
(2)用余弦函数对所有预处理后的历史提交信息和变更请求进行相似度计算,根据相关的历史提交信息和变更请求中的单词重复度识别相关的历史提交信息;
(3)得出所有与变更请求相关的提交信息后,在相关提交信息中提取相关的开发人员,并且提取出每个开发人员修改过的相关源码文件形成一个<开发者,相关源码文件>对应列表,相关源码文件作为开发人员的部分个性化文件;
(4)将步骤(3)中得到的所有<开发者,相关源码文件>对应列表作为CTM模型的输入数据进行协相关计算,得到具体的实现变更请求的相关开发人员和这些开发人员另一部分相关源码文件;
(5)将步骤(3)和步骤(4)中两部分相关源码文件与变更请求进行相似度计算,根据相关源文件的相似度找出最适合实现变更请求的开发人员,并将相关源文件作为个性化推荐文件推荐给该开发人员,对开发人员修改给出建议。
2.如权利要求1所述的方法,其特征在于,余弦函数的计算方法为:
其中公式中的向量表示变更请求和提交信息的单词向量。
CN201410804898.8A 2014-12-22 2014-12-22 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法 Active CN104461558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410804898.8A CN104461558B (zh) 2014-12-22 2014-12-22 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410804898.8A CN104461558B (zh) 2014-12-22 2014-12-22 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法

Publications (2)

Publication Number Publication Date
CN104461558A CN104461558A (zh) 2015-03-25
CN104461558B true CN104461558B (zh) 2017-06-23

Family

ID=52907669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410804898.8A Active CN104461558B (zh) 2014-12-22 2014-12-22 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法

Country Status (1)

Country Link
CN (1) CN104461558B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446734A (zh) * 2015-10-14 2016-03-30 扬州大学 一种基于软件开发历史开发人员网络关系构建方法
CN105426514B (zh) * 2015-11-30 2019-03-01 扬州大学 个性化的移动应用app推荐方法
CN105511869A (zh) * 2015-12-01 2016-04-20 福建工程学院 一种基于用户反馈的需求跟踪系统及方法
CN105786999A (zh) * 2016-02-17 2016-07-20 扬州大学 一种基于复杂网络关系的软件开发人员可视化推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617190A (zh) * 2013-11-06 2014-03-05 福建工程学院 一种上下文感知的动态需求跟踪方法
CN103729473A (zh) * 2014-01-22 2014-04-16 扬州大学 一种基于lda主题模型的相关软件历史数据提取方法
CN103744932A (zh) * 2013-12-30 2014-04-23 华为技术有限公司 一种页面处理方法及装置
CN102831060B (zh) * 2012-08-24 2015-07-08 东南大学 一种基于修改影响分析的部件软件回归测试用例更新方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831060B (zh) * 2012-08-24 2015-07-08 东南大学 一种基于修改影响分析的部件软件回归测试用例更新方法
CN103617190A (zh) * 2013-11-06 2014-03-05 福建工程学院 一种上下文感知的动态需求跟踪方法
CN103744932A (zh) * 2013-12-30 2014-04-23 华为技术有限公司 一种页面处理方法及装置
CN103729473A (zh) * 2014-01-22 2014-04-16 扬州大学 一种基于lda主题模型的相关软件历史数据提取方法

Also Published As

Publication number Publication date
CN104461558A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
US11809824B1 (en) Computing numeric representations of words in a high-dimensional space
US10430255B2 (en) Application program interface mashup generation
CN103164463B (zh) 推荐标签的方法和装置
Grainger et al. Solr in action
US11169786B2 (en) Generating and using joint representations of source code
US8504490B2 (en) Web-scale entity relationship extraction that extracts pattern(s) based on an extracted tuple
US10607142B2 (en) Responding to user input based on confidence scores assigned to relationship entries in a knowledge graph
CN104461558B (zh) 一种基于协相关主题模型的面向软件修改的个性化任务推荐方法
JP7502283B2 (ja) 人工知能/機械学習を用いたicsフローのオートコンプリートのためのシステムおよび方法
Fujinaga et al. Introduction to SIMSSA (single interface for music score searching and analysis)
US10572881B2 (en) Applying entity search techniques to expedite entitlement resolution in support services
JP6237378B2 (ja) 候補キュレーションアイテムをランキングする方法及びシステム
Zheng et al. Integrating context similarity with sparse linear recommendation model
Akperov et al. Using soft computing methods for the functional benchmarking of an intelligent workplace in an educational establishment
Valverde-Rebaza et al. Job Recommendation Based on Job Seeker Skills: An Empirical Study.
Shah et al. Literature study on multi-document text summarization techniques
Dubuisson Duplessis et al. Utterance retrieval based on recurrent surface text patterns
Fukui et al. Predictive algorithm for converting linear strings to general mathematical formulae
Zhang et al. Unit of work supporting generative scientific workflow recommendation
Platanios et al. Value-agnostic conversational semantic parsing
US11734602B2 (en) Methods and systems for automated feature generation utilizing formula semantification
KR102341563B1 (ko) 매개 텍스트 자료 토픽을 이용한 전문 텍스트 자료 추출 방법
Munyaradzi et al. A system for high quality crowdsourced indigenous language transcription
Chen et al. Service composition recommendation method based on recurrent neural network and Naive Bayes
Hsu et al. Similarity search over personal process description graph

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231116

Address after: Room C218-1, Building 2, No. 217, Kaifa West Road, High-tech Industrial Development Zone, Yangzhou City, Jiangsu Province, 225000

Patentee after: Yangzhou Jingyun Ecological Technology Co.,Ltd.

Address before: 225009 No. 88, South University Road, Jiangsu, Yangzhou

Patentee before: YANGZHOU University