CN113011689A - 软件开发工作量的评估方法、装置及计算设备 - Google Patents

软件开发工作量的评估方法、装置及计算设备 Download PDF

Info

Publication number
CN113011689A
CN113011689A CN201911318105.0A CN201911318105A CN113011689A CN 113011689 A CN113011689 A CN 113011689A CN 201911318105 A CN201911318105 A CN 201911318105A CN 113011689 A CN113011689 A CN 113011689A
Authority
CN
China
Prior art keywords
semantic
information
function point
current
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911318105.0A
Other languages
English (en)
Other versions
CN113011689B (zh
Inventor
史远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Liaoning Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Liaoning Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Liaoning Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911318105.0A priority Critical patent/CN113011689B/zh
Publication of CN113011689A publication Critical patent/CN113011689A/zh
Application granted granted Critical
Publication of CN113011689B publication Critical patent/CN113011689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及软件开发技术领域,公开了一种软件开发工作量的评估方法、装置及计算设备。其中,该方法包括:获取历史项目信息;根据历史项目信息确定历史功能点信息;将历史功能点信息输入语义提取模型,获取语义提取模型输出的历史功能点语义信息;获取当前项目信息;根据当前项目信息确定当前功能点信息;将当前功能点信息输入语义提取模型,获取语义提取模型输出的当前功能点语义信息;将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度;根据语义相似度,进行当前项目的工作量评估。通过上述方式,本发明实施例能够提高评估的准确率。

Description

软件开发工作量的评估方法、装置及计算设备
技术领域
本发明实施例涉及软件开发技术领域,具体涉及一种软件开发工作量的评估方法、装置及计算设备。
背景技术
目前,集约化、精确化成本评估成为各行业普遍关注的重点,而应用软件投资占比越来越高,重要性也日益显现,但应用软件投资结构、投资评估模式仍显粗放,缺乏科学指导,也缺少标准化、可量化、可评估的应用软件开发工作量衡量方法。
现在常用的软件开发工作量的评估方法主要有:基于代码行(SLOC)的工作量估算、德尔菲法、基于WBS的工作量估算等,这些方法都不可避免存在人为因素造成的误差,准确率不高。
发明内容
鉴于上述问题,本发明实施例提供了一种软件开发工作量的评估方法、装置及计算设备,能够提高评估的准确率。
根据本发明实施例的一个方面,提供了一种软件开发工作量的评估方法,所述方法包括:获取历史项目信息;根据所述历史项目信息,确定历史功能点信息;将所述历史功能点信息输入语义提取模型,并获取所述语义提取模型输出的所述历史功能点语义信息;获取当前项目信息;根据所述当前项目信息,确定当前功能点信息;将所述当前功能点信息输入所述语义提取模型,并获取所述语义提取模型输出的所述当前功能点语义信息;将所述历史功能点语义信息和所述当前功能点语义信息输入语义相似度比对模型,并获取所述语义相似度比对模型输出的所述历史功能点语义信息与所述当前功能点语义信息的语义相似度;根据所述语义相似度,进行所述当前项目的工作量评估。
在一种可选的方式中,所述方法还包括:获取样本功能点信息;通过将所述样本功能点信息进行分词,获取训练词典;根据所述训练词典,对词频-逆文本频率模型进行训练;获取训练后的词频-逆文本频率模型,作为所述语义提取模型。
在一种可选的方式中,所述方法还包括:将所述样本功能点信息输入所述语义提取模型,获取语义训练文本集;根据所述语义训练文集,对长短期记忆网络模型进行训练;获取训练后的所述长短期记忆网络模型,作为所述语义相似度比对模型。
在一种可选的方式中,所述根据所述语义训练文集,对长短期记忆网络模型进行训练,进一步包括:根据所述语义训练文集,对由单层长短期记忆网络和全连接层网络组成的所述长短期记忆网络模型进行训练。
在一种可选的方式中,所述根据所述语义相似度,进行所述当前项目的工作量评估,进一步包括:若所述语义相似度大于预设相似度阈值,则在进行所述当前项目的工作量评估时排除所述当前功能点;若语义相似度小于或者等于预设相似度阈值,则在进行所述当前项目的工作量评估时不排除所述当前功能点。
在一种可选的方式中,所述根据所述语义相似度,进行所述当前项目的工作量评估,进一步包括:确定与所述语义相似度对应的评估系数;根据所述评估系数,计算所述当前功能点的工作量。
根据本发明实施例的另一方面,提供了一种软件开发工作量的评估装置,所述装置包括:第一项目信息获取模块,用于获取历史项目信息;第一功能点确定模块,用于根据所述历史项目信息,确定历史功能点信息;第一语义提取模块,用于将所述历史功能点信息输入语义提取模型,并获取所述语义提取模型输出的所述历史功能点语义信息;第二项目信息获取模块,用于获取当前项目信息;第二功能点确定模块,用于根据所述当前项目信息,确定当前功能点信息;第二语义提取模块,用于将所述当前功能点信息输入所述语义提取模型,并获取所述语义提取模型输出的所述当前功能点语义信息;相似度确定模块,用于将所述历史功能点语义信息和所述当前功能点语义信息输入语义相似度比对模型,并获取所述语义相似度比对模型输出的所述历史功能点语义信息与所述当前功能点语义信息的语义相似度;工作量评估模块,用于根据所述语义相似度,进行所述当前项目的工作量评估。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器和通信接口,所述处理器、所述存储器和所述通信接口相互通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的软件开发工作量的评估方法的操作。
根据本发明实施例的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上所述的软件开发工作量的评估方法。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明其中一实施例提供的软件开发工作量的评估方法的流程图;
图2示出了本发明另一实施例提供的软件开发工作量的评估方法的流程图;
图3示出了长短期记忆网络的结构示意图;
图4示出了本发明实施例提供的训练语义相似度比对模型的流程图;
图5示出了本发明实施例提供的软件开发工作量的评估装置的结构示意图;
图6示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
目前常用的软件开发工作量的评估方法主要有:基于代码行(SLOC)的工作量估算、德尔菲法、基于WBS的工作量估算等,这些方法都不可避免存在人为因素造成的误差,并且,仅采集待评估软件开发的数据而未与历史数据进行对比分析,无法对工作量进行准确估算,因此评估的准确率不高。
基于此,本发明实施例提供一种软件开发工作量的评估方法、装置及计算设备,通过将当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
具体地,下面结合附图,对本发明实施例作进一步阐述。
其中,应当理解的是,本发明提供的下述实施例之间,只要不冲突,均可相互结合以形成新的实施方式。
图1示出了本发明其中一实施例提供的软件开发工作量的评估方法的流程图。该方法应用于计算设备中。如图1所示,该方法包括以下步骤:
步骤110、获取历史项目信息。
其中,历史项目信息是指已经完成的项目的信息。获取历史项目信息,具体可以为:从项目数据库中获取过去预设时间内的历史项目需求说明书和/或功能点清单,从而获取历史项目信息。
需要说明的是,需求说明书中记载了用户需求,用户需求是指用户为实现业务需求而提出的基于实际情况的具体目标,例如,要查看库存中的零件数量,或者计算工资总额等。功能点清单记载了功能需求,功能需求是指去解决这些具体的用户需求产生的解决方案,即对用户需求做具体的分析后提出的具体实施方法。通过对需求说明书的分析,可以得到各个需求对应的功能点信息。一个需求可以包括多个功能点。
步骤120、根据历史项目信息,确定历史功能点信息。
其中,在基于功能点分析方法的工作量评估方法中,用于计算工作量的基本计数项可以按照一定的功能对待开发软件的功能点进行划分,则基本技术项(即功能点的类别)可以包括外部输入数(External Input,EI)、外部输出数(External Qutput,EO)、外部查询数(External Query,EQ)、内部逻辑文件(Internal Logical File,ILF)、外部接口文件(External Interface File,EIF)等。
在步骤120中,根据历史项目信息,确定历史功能点信息,具体可以为:根据历史项目信息中的历史项目需求说明书,获取各个历史需求对应的历史功能点,从而确定历史功能点信息。
需要说明的是,本实施例中的功能点信息可以为功能点的文字描述信息。当然,在另一些实施例中,功能点信息还可以为功能点的程序信息等等。
步骤130、将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息。
其中,语义信息是指若干文字中蕴含的意思。历史功能点语义信息是指历史功能点的文字描述信息中所表达的意思。语义提取模型为用于提取文字中的语义信息的模型。语义提取模型输出的可以为关键字信息,也可以为词向量信息。
步骤140、获取当前项目信息。
其中,当前项目信息是指需要进行软件开发工作量评估的项目的信息,当前项目信息可以包括项目的需求信息、功能点信息等等。历史项目与当前项目可以为同一开发者的项目。其中,同一开发者可以为同一开发公司或同一开发技术工程组。例如,历史项目为开发者A在2017年开发的a1项目,当前项目为开发者A需要在2019年开发的a2项目。历史项目信息可以包括项目的需求信息、功能点信息以及各个功能点对应预估工作量以及实际工作量等等。
其中,获取当前项目信息,具体可以为:获取当前项目的需求说明书和/或功能点清单,从而获取当前项目信息等。
需要说明的是,获取历史项目信息和获取当前项目信息可以同时进行,也可以分别进行,可以根据实际使用情况进行设置。
步骤150、根据当前项目信息,确定当前功能点信息。
在步骤150中,根据当前项目信息,确定当前功能点信息,具体可以为:从当前项目信息中获取当前项目需求说明书,获取各个当前需求对应的当前功能点,从而确定当前功能点信息。
需要说明的是,确定历史功能点信息和确定当前功能点信息可以同时进行,也可以分别进行,可以根据实际使用情况进行设置。
步骤160、将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息。
其中,当前功能点语义信息是指当前功能点的文字描述信息中所表达的意思。
需要说明的是,提取历史功能点语义信息和当前功能点语义信息的步骤可以同时进行,也可以分别进行,可以根据实际使用情况进行设置。
步骤170、将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度。
不同的文字组合可能表达同一意思,也可能表达不同的意思,而相同的文字可能由于不同的排列顺序表达不同的意思。因此,需要分析历史功能点语义信息与当前功能点语义信息的语义相似度。其中,语义相似度是指历史功能点语义信息所表达的意思与当前功能点语义信息所表达的意思的相似程度。语义相似度比对模型为能够用于比对两种或两种以上语义信息的模型,从而通过将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,获得历史功能点语义信息与当前功能点语义信息的语义相似度。其中,语义相似度比对模型输出的语义相似度可以为百分比数值。
步骤150、根据语义相似度,进行当前项目的工作量评估。
具体地,步骤150可以包括:
步骤151、若语义相似度大于预设相似度阈值,则在进行当前项目的工作量评估时排除当前功能点;
步骤152、若语义相似度小于或者等于预设相似度阈值,则在进行当前项目的工作量评估时不排除当前功能点。
其中,预设相似度阈值是预先设置的相似度的阈值,可以根据实际使用情况进行选择,预设相似度阈值越大,则对语义相似的要求越严格。当语义相似度大于预设相似度阈值,则认为该当前功能点与历史功能点相同,则在进行工作量评估时排除当前功能点,即不将当前功能点的工作量算入当前项目的工作量中;当语义相似度小于或者等于预设相似度阈值,则认为该当前功能点与历史功能点不相同,则在进行工作量评估时不排除当前功能点,即讲当前功能点的工作量算入当前项目的工作量中。例如,假设预设相似度阈值为80%,若计算得到历史功能点a1的语义信息与当前功能点b2的语义信息的语义相似度为90%,则认为历史功能点a1与当前功能点b2的实现完全相同,开发人员可将直接将历史功能点a1的程序信息直接用作当前功能点b2的程序信息,则在进行当前项目的工作量评估时排除当前功能点b2,而计算剩余其他功能点的工作量。
步骤150还可以包括:步骤153、根据开发反馈信息,调整预设相似度阈值。其中,开发反馈信息为从开发人员收集得到的对于历史功能点与当前功能点的评判是否正确的信息。当预设相似度阈值设置过高时,可能会出现历史功能点语义信息与当前功能点语义信息的语义相似度大于预设相似度阈值,但历史功能点与当前功能点实际上为不同功能点的情况,则需要根据开发反馈信息,调整预设相似度阈值(例如把预设相似度阈值降低),从而使得工作量的评估更加合理。
在一些其他实施方式中,步骤150还可以包括:
步骤154、确定与语义相似度对应的评估系数;
步骤155、根据评估系数,计算当前功能点的工作量。
在步骤154中,可以预先设置语义相似度与评估系数的对应关系,则根据实际的语义相似度,获取对应的评估系数。确定评估系数后,在计算当前功能点的工作量时乘以评估系数,得到当前功能点的最终工作量,并根据当前功能点的最终工作量计算当前项目的工作量。例如,预设先设定语义相似度为0至10%对应的评估系数为0.1,语义相似度为10%至20%对应的评估系数为0.2…语义相似度为80%至90%对应的评估系数为0.9,若确定历史功能点a1与当前功能点b2的语义相似度为81%,则在计算当前功能点b2的工作量时,先根据功能点分析方法计算得到当前功能点b2的工作量为c,c*0.9为当前功能点b2的最终工作量,则计算当前项目的工作量时,以c*0.9作为当前功能点b2的工作量。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
图2示出了本发明另一实施例提供的软件开发工作量的评估方法的流程图。该方法应用于计算设备中。与上述实施例的区别在于,如图2所示,该方法还包括以下步骤:
步骤211、获取样本功能点信息。
其中,样本功能点信息是指用于作为训练样本的项目的功能点信息,可以包括训练样本项目的需求信息、功能点信息以及各个功能点对应语义信息。其中,训练样本项目的各个功能点对应语义信息可以通过专家经验得到。
步骤212、通过将样本功能点信息进行分词,获取训练词典。
其中,可以通过分词技术实现样本功能点信息的分词,从而获取包含样本功能点信息的若干词语的训练词典。
步骤213、根据训练词典,对词频-逆文本频率模型进行训练。
通过训练词典和训练样本项目的各个功能点对应语义信息对词频-逆文本频率模型进行训练,以确定词频-逆文本频率模型中的参数,得到训练后的词频-逆文本频率模型。
其中,词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)模型能够评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。
其中,TF表示关键词w在文本Di中出现的频率,则有:
Figure BDA0002326409220000091
其中,count(w)为关键词w的出现次数,|Di|为文本Di中所有词的数量。
其中,IDF反映关键词的普遍程度。当一个词越普遍(即有大量文档包含这个词)时,IDF值越低;反之,则IDF值越高。则有:
Figure BDA0002326409220000092
其中,N为所有文本的总数,I(w,Di)I表示文本Di是否包含关键词(若包含则为1,若不包含则为0)。若词w在所有文本中均未出现,则IDF中的字母为0,因此,需要对IDF做平滑,有:
Figure BDA0002326409220000093
则关键词w在文本Di的TF-IDF值为:
Figure BDA0002326409220000094
当一个词在文本中频率越高并且新鲜度高(即普遍度低)其TF-IDF值越高。通过使用TF-IDF模型,能够兼顾词频与新鲜度,过滤一些常见词,保留能提供更多信息的重要词,从而得到更加具特征的语义信息。
步骤214、获取训练后的词频-逆文本频率模型,作为语义提取模型。
将训练后的词频-逆文本频率模型,作为语义提取模型,以运用语义提取模型进行步骤130中历史功能点语义信息的提取以及步骤160中当前功能点语义信息的提取。
步骤215、将样本功能点信息输入语义提取模型,获取语义训练文本集。
其中,语义训练文本集为将样本功能点信息输入语义提取模型得到的语义信息。当然,在一些其他实施例中,语义训练文本集还可以为训练样本项目的记录的各个功能点对应语义信息。
可选地,该方法还包括:通过词向量模型对语义训练文本集进行向量化处理。自然语言处理(NLP)相关任务中,要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,因为机器不是人,机器只认数学符号。向量是人把自然界的东西抽象出来交给机器处理的东西,基本上可以说向量是人对机器输入的主要方式。词向量就是用来将语言中的词进行数学化的一种方式,顾名思义,词向量就是把一个词表示成一个向量。生成词向量的方法从一开始基于统计学的方法(共现矩阵、SVD分解)到基于不同结构的神经网络的语言模型方法。词向量模型可以为word2vec模型。word2vec模型是将词表征为实数值向量的一种高效的算法模型,其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为K维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似。word2vec模型输出的词向量可以被用来做很多自然语言处理相关的工作,比如聚类、找同义词、词性分析等等。如果换个思路,把词当做特征,那么word2vec模型就可以把特征映射到K维向量空间,可以为文本数据寻求更加深层次的特征表示。word2vec模型能够通过词的上下文得到词的向量化表示,包括两种方法:CBOW(通过附近词预测中心词)、Skip-gram(通过中心词预测附近的词)。
其中,CBOW方法是通过目标词的上下文的词预测目标词。具体的做法是:设定词向量的维度d,对所有的词随机初始化为一个d维的向量,然后要对上下文所有的词向量编码得到一个隐藏层的向量,通过这个隐藏层的向量预测目标词。Skip-gram方法跟CBOW的原理相似,它的输入是目标词,先是将目标词映射为一个隐藏层向量,根据这个向量预测目标词上下文两个词。
步骤216、根据语义训练文集,对长短期记忆网络模型进行训练。
其中,长短期记忆网络(Long Short-Term Memory,LSTM)模型是一种特殊的RNN模型,能够学习长期依赖信息。
在标准的RNN模型中,重复的模块只有一个非常简单的结构,例如一个tanh层。如图3所示,LSTM模型同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。LSTM的关键就是细胞状态,水平线在图上方贯穿运行。细胞状态类似于传送带。直接在整个链上运行,只有一些少量的线性交互。信息在上面流传保持不变会很容易。LSTM有通过精心设计的称作为“门”的结构来去除或者增加信息到细胞状态的能力。门是一种让信息选择式通过的方法。他们包含一个sigmoid神经网络层和一个pointwise乘法操作。sigmoid层输出0到1之间的数值,描述每个部分有多少量可以通过。0代表“不许任何量通过”,1就指“允许任意量通过”!
其中,LSTM模型中的第一步是决定从细胞状态中丢弃什么信息。这个决定通过一个称为忘记门层完成。该门会读取ht-1和xt,输出一个在0到1之间的数值给每个在细胞状态Ct-1中的数字。1表示“完全保留”,0表示“完全舍弃”。则有:
Figure BDA0002326409220000111
在语义比对中,基于已经看到的预测下一个词,在这个问题中,细胞状态可能包含当前主语的类别,因此正确的代词可以被选择出来。当看到新的代词,希望忘记旧的代词。
LSTM模型中的下一步是确定什么样的新信息被存放在细胞状态中。这里包含两个部分:第一,sigmoid层称“输入门层”决定什么值我们将要更新。然后,一个tanh层创建一个新的候选值向量,
Figure BDA0002326409220000112
会被加入到状态中。则有:
it=σ(Wi[ht-1,xt]+bi)
Figure BDA0002326409220000113
在语义比对中,希望增加新的代词的类别到细胞状态中,来替代旧的需要忘记的代词。
将旧状态与ft相乘,丢弃掉确定需要丢弃的信息。接着加上
Figure BDA0002326409220000121
这就是新的候选值,根据决定更新每个状态的程度进行变化。则有:
Figure BDA0002326409220000122
在语义比对中,这就是实际根据前面确定的目标,丢弃旧代词的类别信息并添加新的信息的地方。
最终,需要确定输出什么值。这个输出将会基于细胞状态,但是也是一个过滤后的版本。首先,运行一个sigmoid层来确定细胞状态的哪个部分将输出出去。接着,把细胞状态通过tanh进行处理(得到一个在-1到1之间的值)并将它和sigmoid门的输出相乘,最终我仅仅会输出确定输出的那部分。则有:
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
在语义比对中,因为它就看到了一个代词,可能需要输出与一个动词相关的信息。例如,可能输出是否代词是单数还是负数,这样如果是动词的话,则动词需要进行的词形变化。
可选地,长短期记忆网络模型除了报包括单层LSTM,还可以包括全连接层网络。全连接层网络用于进行分类和输出。则步骤216具体可以为:根据所述语义训练文集,对由单层长短期记忆网络和全连接层网络组成的长短期记忆网络模型进行训练。
步骤217、获取训练后的长短期记忆网络模型,作为语义相似度比对模型。
在实际应用中,步骤211至步骤217的实施过程可以如图4所示。
本发明实施例通过对语义提取模型和语义相似度比对模型进行训练,从而通过语义提取模型和语义相似度比对模型进行语义提取和语义分析,基于功能点将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
图5示出了本发明实施例提供的软件开发工作量的评估装置的结构示意图。如图5所示,该装置300包括:第一项目信息获取模块310、第一功能点确定模块320、第一语义提取模块330、第二项目信息获取模块340、第二功能点确定模块350、第二语义提取模块360、相似度确定模块370和工作量评估模块380。
其中,项目信息获取模块310用于获取历史项目信息;功能点确定模块320用于根据所述历史项目信息,确定历史功能点信息;第一语义提取模块330用于将所述历史功能点信息输入语义提取模型,并获取所述语义提取模型输出的所述历史功能点语义信息;第二项目信息获取模块340用于获取当前项目信息;第二功能点确定模块350用于根据所述当前项目信息,确定当前功能点信息;第二语义提取模块360用于将所述当前功能点信息输入所述语义提取模型,并获取所述语义提取模型输出的所述当前功能点语义信息;相似度确定模块370用于将所述历史功能点语义信息和所述当前功能点语义信息输入语义相似度比对模型,并获取所述语义相似度比对模型输出的所述历史功能点语义信息与所述当前功能点语义信息的语义相似度;工作量评估模块380用于根据所述语义相似度,进行所述当前项目工作量评估。
在一种可选的方式中,该装置300还包括:样本获取模块、分词模块、第一训练模块、第一模型获取模块。样本获取模块用于获取样本功能点信息;分词模块用于通过将样本功能点信息进行分词,获取训练词典;第一训练模块用于根据所述训练词典,对词频-逆文本频率模型进行训练;第一模型获取模块用于获取训练后的词频-逆文本频率模型,作为所述语义提取模型。
在一种可选的方式中,该装置300还包括:语义训练文本获取模块、第二训练模块和第二模型获取模块。语义训练文本获取模块用于将所述样本功能点信息输入所述语义提取模型,获取语义训练文本集;第二训练模块用于根据所述语义训练文集,对长短期记忆网络模型进行训练;第二模型获取模块用于获取训练后的所述长短期记忆网络模型,作为所述语义相似度比对模型。
在一种可选的方式中,第二训练模块用于:根据所述语义训练文集,对由单层长短期记忆网络和全连接层网络组成的所述长短期记忆网络模型进行训练。
在一种可选的方式中,工作量评估模块380具体用于:若所述语义相似度大于预设相似度阈值,则在进行所述当前项目的工作量评估时排除所述当前功能点;若语义相似度小于或者等于预设相似度阈值,则在进行工作量评估时不排除所述当前功能点。
在一种可选的方式中,工作量评估模块380具体用于:确定与所述语义相似度对应的评估系数;根据所述评估系数,计算所述当前功能点的工作量。
需要说明的是,本发明实施例提供的软件开发工作量的评估装置是能够执行上述软件开发工作量的评估方法的装置,则上述软件开发工作量的评估方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
本发明实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述任意方法实施例中的软件开发工作量的评估方法。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意方法实施例中的软件开发工作量的评估方法。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
图6示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图6所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述任意方法实施例中的软件开发工作量的评估方法。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
本发明实施例通过获取历史项目信息和当前项目信息,根据历史项目信息和当前项目信息,分别确定历史功能点信息和当前功能点信息,将历史功能点信息输入语义提取模型,并获取语义提取模型输出的历史功能点语义信息,将当前功能点信息输入语义提取模型,并获取语义提取模型输出的当前功能点语义信息,将历史功能点语义信息和当前功能点语义信息输入语义相似度比对模型,并获取语义相似度比对模型输出的历史功能点语义信息与当前功能点语义信息的语义相似度,根据语义相似度,进行当前项目的工作量评估,通过将同一开发者的当前软件开发项目与历史软件开发项目进行对比,以对当前软件开发项目工作量进行准确估算,从而提高评估的准确率。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (8)

1.一种软件开发工作量的评估方法,其特征在于,所述方法包括:
获取历史项目信息;
根据所述历史项目信息,确定历史功能点信息;
将所述历史功能点信息输入语义提取模型,并获取所述语义提取模型输出的所述历史功能点语义信息;
获取当前项目信息;
根据所述当前项目信息,确定当前功能点信息;
将所述当前功能点信息输入所述语义提取模型,并获取所述语义提取模型输出的所述当前功能点语义信息;
将所述历史功能点语义信息和所述当前功能点语义信息输入语义相似度比对模型,并获取所述语义相似度比对模型输出的所述历史功能点语义信息与所述当前功能点语义信息的语义相似度;
根据所述语义相似度,进行所述当前项目的工作量评估。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语义相似度,进行所述当前项目的工作量评估,进一步包括:
若所述语义相似度大于预设相似度阈值,则在进行所述当前项目的工作量评估时排除所述当前功能点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语义相似度,进行所述当前项目的工作量评估,进一步包括:
确定与所述语义相似度对应的评估系数;
根据所述评估系数,计算所述当前功能点的工作量。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
获取样本功能点信息;
通过将所述样本功能点信息进行分词,获取训练词典;
根据所述训练词典,对词频-逆文本频率模型进行训练;
获取训练后的词频-逆文本频率模型,作为所述语义提取模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述样本功能点信息输入所述语义提取模型,获取语义训练文本集;
根据所述语义训练文集,对长短期记忆网络模型进行训练;
获取训练后的长短期记忆网络模型,作为所述语义相似度比对模型。
6.一种软件开发工作量的评估装置,其特征在于,所述装置包括:
第一项目信息获取模块,用于获取历史项目信息;
第一功能点确定模块,用于根据所述历史项目信息,确定历史功能点信息;
第一语义提取模块,用于将所述历史功能点信息输入语义提取模型,并获取所述语义提取模型输出的所述历史功能点语义信息;
第二项目信息获取模块,用于获取当前项目信息;
第二功能点确定模块,用于根据所述当前项目信息,确定当前功能点信息;
第二语义提取模块,用于将所述当前功能点信息输入所述语义提取模型,并获取所述语义提取模型输出的所述当前功能点语义信息;
相似度确定模块,用于将所述历史功能点语义信息和所述当前功能点语义信息输入语义相似度比对模型,并获取所述语义相似度比对模型输出的所述历史功能点语义信息与所述当前功能点语义信息的语义相似度;
工作量评估模块,用于根据所述语义相似度,进行所述当前项目的工作量评估。
7.一种计算设备,其特征在于,包括:处理器、存储器和通信接口,所述处理器、所述存储器和所述通信接口之间相互通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-5中任意一项所述的软件开发工作量的评估方法的操作。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-5中任意一项所述的软件开发工作量的评估方法。
CN201911318105.0A 2019-12-19 2019-12-19 软件开发工作量的评估方法、装置及计算设备 Active CN113011689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911318105.0A CN113011689B (zh) 2019-12-19 2019-12-19 软件开发工作量的评估方法、装置及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911318105.0A CN113011689B (zh) 2019-12-19 2019-12-19 软件开发工作量的评估方法、装置及计算设备

Publications (2)

Publication Number Publication Date
CN113011689A true CN113011689A (zh) 2021-06-22
CN113011689B CN113011689B (zh) 2024-05-07

Family

ID=76381600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911318105.0A Active CN113011689B (zh) 2019-12-19 2019-12-19 软件开发工作量的评估方法、装置及计算设备

Country Status (1)

Country Link
CN (1) CN113011689B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116795330A (zh) * 2023-08-25 2023-09-22 深圳市兴意腾科技电子有限公司 基于软件开发包的编译计算机存储软件开发方法及系统
CN117892279A (zh) * 2024-03-14 2024-04-16 成都信息工程大学 一种用于软件开发的计算机系统加密方法
CN117892279B (zh) * 2024-03-14 2024-05-14 成都信息工程大学 一种用于软件开发的计算机系统加密方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1987453A1 (en) * 2006-02-08 2008-11-05 Telenor ASA Document similarity scoring and ranking method, device and computer program product
CN102214180A (zh) * 2010-04-12 2011-10-12 无锡科利德斯科技有限公司 检索方法及其建立文本语义提取模型的方法
CN103186711A (zh) * 2012-10-08 2013-07-03 同济大学 基于非正交坐标系下软件成本评估方法
CN105590152A (zh) * 2014-10-24 2016-05-18 中国移动通信集团上海有限公司 一种软件工作量的评估方法及系统
CN105989730A (zh) * 2015-02-03 2016-10-05 中国移动通信集团辽宁有限公司 一种轨迹数据处理方法、服务器及系统
CN106649778A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN108629355A (zh) * 2017-03-21 2018-10-09 北京京东尚科信息技术有限公司 用于生成工作量信息的方法和装置
EP3392780A2 (en) * 2017-04-19 2018-10-24 Tata Consultancy Services Limited Systems and methods for classification of software defect reports
CN108874667A (zh) * 2018-05-31 2018-11-23 中国联合网络通信集团有限公司 软件后评价方法及装置
CN109286862A (zh) * 2018-07-31 2019-01-29 咪咕音乐有限公司 信息处理方法及装置、电子设备及存储介质
CN109375948A (zh) * 2018-09-27 2019-02-22 华东师范大学 一种智能功能点识别的软件计价方法
CN109635275A (zh) * 2018-11-06 2019-04-16 交控科技股份有限公司 文献内容检索与识别方法及装置
CN109783817A (zh) * 2019-01-15 2019-05-21 浙江大学城市学院 一种基于深度强化学习的文本语义相似计算模型
CN109918491A (zh) * 2019-03-12 2019-06-21 焦点科技股份有限公司 一种基于知识库自学习的智能客服问句匹配方法
CN110162468A (zh) * 2019-04-26 2019-08-23 腾讯科技(深圳)有限公司 一种测试方法、装置以及计算机可读存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1987453A1 (en) * 2006-02-08 2008-11-05 Telenor ASA Document similarity scoring and ranking method, device and computer program product
CN102214180A (zh) * 2010-04-12 2011-10-12 无锡科利德斯科技有限公司 检索方法及其建立文本语义提取模型的方法
CN103186711A (zh) * 2012-10-08 2013-07-03 同济大学 基于非正交坐标系下软件成本评估方法
CN105590152A (zh) * 2014-10-24 2016-05-18 中国移动通信集团上海有限公司 一种软件工作量的评估方法及系统
CN105989730A (zh) * 2015-02-03 2016-10-05 中国移动通信集团辽宁有限公司 一种轨迹数据处理方法、服务器及系统
CN106649778A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN108629355A (zh) * 2017-03-21 2018-10-09 北京京东尚科信息技术有限公司 用于生成工作量信息的方法和装置
EP3392780A2 (en) * 2017-04-19 2018-10-24 Tata Consultancy Services Limited Systems and methods for classification of software defect reports
CN108874667A (zh) * 2018-05-31 2018-11-23 中国联合网络通信集团有限公司 软件后评价方法及装置
CN109286862A (zh) * 2018-07-31 2019-01-29 咪咕音乐有限公司 信息处理方法及装置、电子设备及存储介质
CN109375948A (zh) * 2018-09-27 2019-02-22 华东师范大学 一种智能功能点识别的软件计价方法
CN109635275A (zh) * 2018-11-06 2019-04-16 交控科技股份有限公司 文献内容检索与识别方法及装置
CN109783817A (zh) * 2019-01-15 2019-05-21 浙江大学城市学院 一种基于深度强化学习的文本语义相似计算模型
CN109918491A (zh) * 2019-03-12 2019-06-21 焦点科技股份有限公司 一种基于知识库自学习的智能客服问句匹配方法
CN110162468A (zh) * 2019-04-26 2019-08-23 腾讯科技(深圳)有限公司 一种测试方法、装置以及计算机可读存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FATMA A.MIHANY: "An Automated System for Measuring Similarity between Software Requirements", PROCEEDINGS OF THE 2ND AFRICA AND MIDDLE EAST CONFERENCE ON SOFTWARE ENGINEERING, 28 May 2012 (2012-05-28), pages 46 - 51 *
丰景春: "基于案例推理的软件项目工作量估算模型研究", 项目管理技术, vol. 10, no. 7, 10 July 2012 (2012-07-10), pages 44 - 50 *
方礼远等: "基于类比方法的软件成本估算工具的分析与设计", 《科技信息(学术研究)》, no. 2008, pages 206 - 207 *
甘秋云: "基于TF-IDF向量空间模型文本相似度算法的分析", 《池州学院学报》, vol. 32, no. 3, pages 41 - 43 *
童燊嗣: "基于需求文档语义分析的早期软件工作量估算", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2019, pages 138 - 175 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116795330A (zh) * 2023-08-25 2023-09-22 深圳市兴意腾科技电子有限公司 基于软件开发包的编译计算机存储软件开发方法及系统
CN116795330B (zh) * 2023-08-25 2023-11-24 深圳市兴意腾科技电子有限公司 基于软件开发包的编译计算机存储软件开发方法及系统
CN117892279A (zh) * 2024-03-14 2024-04-16 成都信息工程大学 一种用于软件开发的计算机系统加密方法
CN117892279B (zh) * 2024-03-14 2024-05-14 成都信息工程大学 一种用于软件开发的计算机系统加密方法

Also Published As

Publication number Publication date
CN113011689B (zh) 2024-05-07

Similar Documents

Publication Publication Date Title
Swathi et al. An optimal deep learning-based LSTM for stock price prediction using twitter sentiment analysis
Rodrigues et al. Sequence labeling with multiple annotators
US20180203848A1 (en) Author personality trait recognition from short texts with a deep compositional learning approach
Berger Large scale multi-label text classification with semantic word vectors
CN108733675B (zh) 基于大量样本数据的情感评价方法及装置
Khalil et al. Niletmrg at semeval-2016 task 5: Deep convolutional neural networks for aspect category and sentiment extraction
CN113392209A (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
Shrivastava et al. Enhancing aggression detection using GPT-2 based data balancing technique
Bortnikova et al. Queries classification using machine learning for implementation in intelligent manufacturing
Padmaja et al. Twitter sentiment analysis using adaptive neuro-fuzzy inference system with genetic algorithm
CN113011689B (zh) 软件开发工作量的评估方法、装置及计算设备
Chen et al. Using latent Dirichlet allocation to improve text classification performance of support vector machine
Alsawareah et al. Classification of arabic software requirements using machine learning techniques
CN116644148A (zh) 关键词识别方法、装置、电子设备及存储介质
Kostkina et al. Document categorization based on usage of features reduction with synonyms clustering in weak semantic map
Mankolli et al. A hybrid machine learning method for text analysis to determine job titles similarity
Kavitha et al. A review on machine learning techniques for text classification
Liu et al. Learning conditional random fields with latent sparse features for acronym expansion finding
CN113377910A (zh) 情感评价方法、装置、电子设备和存储介质
Rabby et al. Establishing a formal benchmarking process for sentiment analysis for the bangla language
Baddur et al. A novel approach for sentiment analysis using deep recurrent networks and sequence modeling
Kuznietsova et al. Business Intelligence Techniques for Missing Data Imputations
Rosander et al. Email Classification with Machine Learning and Word Embeddings for Improved Customer Support
Agrawal et al. Cosine siamese models for stance detection
Hawladar et al. Amazon product reviews sentiment analysis using supervised learning algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant