CN115113919A - 基于BERT模型和Web技术的软件规模度量智能信息化系统 - Google Patents
基于BERT模型和Web技术的软件规模度量智能信息化系统 Download PDFInfo
- Publication number
- CN115113919A CN115113919A CN202211044086.9A CN202211044086A CN115113919A CN 115113919 A CN115113919 A CN 115113919A CN 202211044086 A CN202211044086 A CN 202211044086A CN 115113919 A CN115113919 A CN 115113919A
- Authority
- CN
- China
- Prior art keywords
- scale measurement
- software
- software scale
- data
- measurement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/73—Program documentation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Library & Information Science (AREA)
- Stored Programmes (AREA)
Abstract
本发明公开了基于BERT模型和Web技术的软件规模度量智能信息化系统,包括软件规模度量智能系统、软件规模度量文本数据处理系统和软件规模度量信息系统;软件规模度量智能系统使用BERT深度学习模型对需要进行软件度量的需求文档进行识别、划分和分类,提取文档中的功能计数项和技术点;软件规模度量文本数据处理系统用于对需求文档的进行文档处理,并为软件规模度量智能系统提供BERT模型所需的训练数据和软件规模度量信息系统所需的文档数据;软件规模度量信息系统对软件规模度量智能系统的识别结果和系统中产生的中间数据、录入数据等数据进行管理。本发明节约人工成本,更好的贴合国家标准进行优化,保持产品稳定性和可用性。
Description
技术领域
本发明涉及软件量化管理技术领域,尤其涉及基于BERT模型和Web技术的软件规模度量智能信息化系统。
背景技术
软件规模度量是软件量化管理的重要部分,随之技术和业务的不断前进,软件应用领域逐步扩大。在软件开发管理中,软件规模度量是将具体业务抽象成软件开发中的具体功能的首要任务,准确的度量是不仅可以为软件造价提供指导,更是保证项目成功的关键。
合理规范地认识软件价值,给出软件规模度量的实施路径已成为现阶段软件行业发展亟需解决的关键问题。在以往的软件开发中,面对复杂繁琐的业务需求,需要先整理具体的需求文档。技术人员或者产品经理,依据需求文档整理出需要开发的具体功能点,这些功能点作为软件度量的主要依据,量化为可以适用于度量标准的参数。在以往的流程,人工智能可以很好地帮助我们完成这些步骤,并解决人为因素导致的不确定性,更好更快更准确的进行软件规模度量。
发明内容
本发明的目的在于克服现有技术的不足,为了解决面对繁冗复杂的软件开发需求文档,要完全依照国家标准进行规范的软件规模度量,实属不易,难免遗漏问题,提供基于BERT模型和Web技术的软件规模度量智能信息化系统,使用NLP技术处理软件规模度量过程中涉及的大量文本信息,并依据国家标准,得到输出结果,效果总体较好。
本发明的目的是通过以下技术方案来实现的:
基于BERT模型和Web技术的软件规模度量智能信息化系统,包括软件规模度量智能系统、软件规模度量文本数据处理系统和软件规模度量信息系统;
所述软件规模度量智能系统基于NLP技术,对需要进行软件度量的需求文档进行识别、划分和分类,提取文档中的功能计数项和技术点;
所述软件规模度量文本数据处理系统用于在软件规模度量场景下,对需求文档的进行文档处理,并为软件规模度量智能系统提供BERT模型所需的训练数据和软件规模度量信息系统所需的文档数据;
所述软件规模度量信息系统对软件规模度量智能系统的识别结果和系统中产生的中间数据、录入数据等数据进行管理。
所述软件规模度量信息系统包括计数项信息化模块、参数因子信息化模块和度量结果信息化模块;
计数项信息化模块用于管理一个软件度量工程的全部计数项,对计数项进行增删和改查操作;
参数因子信息化模块用于管理软件度量中的调整因子,并加入费用的设置和调整;
度量结果信息化模块根据计数项和调整因子,计算出软件在各个过程中的造价信息。
所述软件规模度量文本数据处理系统的工作流程具体包括以下步骤:
S101:对原始的需求文档进行文本提取、切割、填充和特征提取处理,得到一系列语句文本的序列数据,同时对整体文本数据做去重、集合处理;
S102:对步骤S101数据进行人工标记处理,对每一条语句文本进行第一级标签化处理,标签数据来自于步骤S101对整体文本的处理;
S103:对步骤S101数据进行多级标签处理,最后将得到的数据进行存储。
所述第一级标签为功能系统级标签,包括软件度量的内部逻辑文件级别标签和外部接口文件级别标签。
所述多级标签包括软件度量的外部输入、外部输出、外部查询级别标签。
所述软件规模度量智能系统的工作流程具体包括以下步骤:
S201:读取软件规模度量文本数据处理系统处理后的语料数据和标签数据;
S202:对S201中读取的数据做进一步数据处理和分割;
S203:步骤S202数据处理之后可以得到系统功能训练数据集、功能计数点训练数据集,并生成测试数据集以备测试模式效果;
S204:使用BERT自然语言处理模型对步骤S203生成的训练数据集进行训练;
S205:由S204进行模型训练得到系统功能系统识别模型和功能技术点识别模型;
S206:使用步骤S203中生成的测试数据集对步骤S205训练得到的模型进行效果测试;
S207:保存训练模型,并将相关数据存入软件规模度量信息系统。
所述软件规模度量信息系统的工作流程具体包括以下步骤:
S301:将软件规模度量智能系统中功能系统识别和功能计数点识别的结果录入到计数项信息化模块,计数项信息化模块对软件规模度量智能系统的识别结果或人工输入的结果进行管理;
S302:参数因子信息化模块对软件规模度量涉及的参数因子进行管理;
S303:度量结果信息化模块计算并管理软件规模度量每个过程的造价信息。
本发明的有益效果:
本发明采用 NLP 技术中先进的训练模型(BERT Transformer),结合软件规模度量的业务场景,可以极大地节约人工成本,更好的贴合国家标准进行优化,并在应用过程中不断进行模型训练,保持产品稳定性和可用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明的总体架构图;
图2是本发明的软件规模度量文本数据处理系统流程图;
图3是本发明的软件规模度量智能系统流程图;
图4是本发明的软件规模度量信息系统流程图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当人认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1-图4所示,本发明公开一种基于BERT模型和Web技术的软件规模度量智能信息化系统,包括软件规模度量智能系统、软件规模度量文本数据处理系统和软件规模度量信息系统;
软件规模度量智能系统主要基于NLP技术,对需要进行软件度量的需求文档进行识别、划分和分类,提取文档中的功能计数项和技术点等。
软件规模度量文本数据处理系统主要负责在软件规模度量场景下,对需求文档的处理。包括但不限于特征工程、语句分割、标签提取、字符统计等,该系统既可以视为软件规模度量计数项信息化的产物,也为软件规模度量智能系统提供自然语言处理模型训练和分类的原始数据。
软件规模度量信息系统,是对软件规模度量标准的信息化,分为计数项信息化、参数因子信息化、度量结果信息化三个主要功能模块。
软件规模度量计数项信息化模块,主要管理一个软件度量工程的全部计数项,可以对计数项进行增删改查等操作。
软件规模度量参数因子信息化模块,主要管理软件度量中的调整因子,并加入费用的设置和调整。
软件规模度量结果信息化模块,根据计数项和调整因子,计算出该软件在各个过程中的造价信息。
软件规模度量主要依据需求文档进行度量,需求文档本身是文本数据,但是这些文本数据并不能直接使用,需要进行一些结构化处理,并依据BERT自然语言处理模型进行预处理。
我们的数据处理工作主要分为三层处理:
第一层对原始的需求文档进行文本提取、切割、填充和特征提取等处理,得到一系列语句文本的序列数据,同时也会对整体文本数据做去重、集合等处理。
第二层对第一层数据进行人工标记处理,对每一条语句文本进行第一级标签化处理,标签数据来自于第一层对整体文本的处理。第一级标签主要是功能系统级的标签,可以对应为软件度量的ILF和EIF级别标签。ILF:内部逻辑文件(Internal Logical File);EIF:外部接口文件(External Interface File)。
第三层也是对第一层数据进行多级标签处理,可以对应为软件度量的IE、EO、EQ级别标签。EI:外部输入(External Input);EO:外部输出(External Input);EQ:外部查询(External Query)。
最后讲得到的数据进行存储。
软件规模度量智能系统使用BERT自然语言处理模型对上一级生成的数据进行训练,训练得到功能系统识别模型和功能技术点识别模型。
软件规模度量信息系统主要对各个功能模块产生的数据进行控制、存储和展示。
首先由软件规模度量智能系统使用BERT模型对需求文档进行功能系统识别和功能计数点识别,将识别的结果录入到计数项信息化模块。
计数项信息化模块对智能系统的识别结果或人工输入的结果进行管理:
参数因子信息化模块对软件规模度量涉及的参数因子进行管理:
度量结果信息化模块可以计算并管理软件规模度量每个过程的造价信息。
本专利采用 NLP 技术中先进的训练模型(BERT Transformer),结合软件规模度量的业务场景,可以极大地节约人工成本,更好的贴合国家标准进行优化,并在应用过程中不断进行模型训练,保持产品稳定性和可用性。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (7)
1.基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,包括软件规模度量智能系统、软件规模度量文本数据处理系统和软件规模度量信息系统;
所述软件规模度量智能系统基于NLP技术,对需要进行软件度量的需求文档进行识别、划分和分类,提取文档中的功能计数项和技术点;
所述软件规模度量文本数据处理系统用于在软件规模度量场景下,对需求文档的进行文档处理,并为软件规模度量智能系统提供BERT模型所需的训练数据和软件规模度量信息系统所需的文档数据;
所述软件规模度量信息系统对软件规模度量智能系统的识别结果和系统中产生的中间数据、录入数据数据进行管理。
2.根据权利要求1所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述软件规模度量信息系统包括计数项信息化模块、参数因子信息化模块和度量结果信息化模块;
计数项信息化模块用于管理一个软件度量工程的全部计数项,对计数项进行增删和改查操作;
参数因子信息化模块用于管理软件度量中的调整因子,并加入费用的设置和调整;
度量结果信息化模块根据计数项和调整因子,计算出软件在各个过程中的造价信息。
3.根据权利要求1所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述软件规模度量文本数据处理系统的工作流程具体包括以下步骤:
S101:对原始的需求文档进行文本提取、切割、填充和特征提取处理,得到一系列语句文本的序列数据,同时对整体文本数据做去重、集合处理;
S102:对步骤S101数据进行人工标记处理,对每一条语句文本进行第一级标签化处理,标签数据来自于步骤S101对整体文本的处理;
S103:对步骤S101数据进行多级标签处理,最后将得到的数据进行存储。
4.根据权利要求3所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述第一级标签为功能系统级标签,包括软件度量的内部逻辑文件级别标签和外部接口文件级别标签。
5.根据权利要求3所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述多级标签包括软件度量的外部输入级别标签、外部输出级别标签、外部查询级别标签。
6.根据权利要求1所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述软件规模度量智能系统的工作流程具体包括以下步骤:
S201:读取软件规模度量文本数据处理系统处理后的语料数据和标签数据;
S202:对S201中读取的数据做进一步数据处理和分割;
S203:步骤S202数据处理之后可以得到系统功能训练数据集、功能计数点训练数据集,并生成测试数据集以备测试模式效果;
S204:使用BERT自然语言处理模型对步骤S203生成的训练数据集进行训练;
S205:由步骤S204进行模型训练得到系统功能系统识别模型和功能技术点识别模型;
S206:使用步骤S203中生成的测试数据集对步骤S205训练得到的模型进行效果测试;
S207:保存训练模型,并将相关数据存入软件规模度量信息系统。
7.根据权利要求1所述的基于BERT模型和Web技术的软件规模度量智能信息化系统,其特征在于,所述软件规模度量信息系统的工作流程具体包括以下步骤:
S301:将软件规模度量智能系统中功能系统识别和功能计数点识别的结果录入到计数项信息化模块,计数项信息化模块对软件规模度量智能系统的识别结果或人工输入的结果进行管理;
S302:参数因子信息化模块对软件规模度量涉及的参数因子进行管理;
S303:度量结果信息化模块计算并管理软件规模度量每个过程的造价信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211044086.9A CN115113919B (zh) | 2022-08-30 | 2022-08-30 | 基于BERT模型和Web技术的软件规模度量智能信息化系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211044086.9A CN115113919B (zh) | 2022-08-30 | 2022-08-30 | 基于BERT模型和Web技术的软件规模度量智能信息化系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115113919A true CN115113919A (zh) | 2022-09-27 |
CN115113919B CN115113919B (zh) | 2023-04-25 |
Family
ID=83336105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211044086.9A Active CN115113919B (zh) | 2022-08-30 | 2022-08-30 | 基于BERT模型和Web技术的软件规模度量智能信息化系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115113919B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117493568A (zh) * | 2023-11-09 | 2024-02-02 | 中安启成科技有限公司 | 一种端到端软件功能点提取与识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271201A (zh) * | 2018-09-27 | 2019-01-25 | 华东师范大学 | 一种智能功能点识别的软件计价系统 |
CN111274817A (zh) * | 2020-01-16 | 2020-06-12 | 北京航空航天大学 | 一种基于自然语言处理技术的智能化软件成本度量方法 |
CN112181490A (zh) * | 2020-09-22 | 2021-01-05 | 中国建设银行股份有限公司 | 功能点评估法中功能类别的识别方法、装置、设备及介质 |
CN112817561A (zh) * | 2021-02-02 | 2021-05-18 | 山东省计算中心(国家超级计算济南中心) | 软件需求文档的事务类功能点结构化抽取方法及系统 |
CN113127060A (zh) * | 2021-04-09 | 2021-07-16 | 中通服软件科技有限公司 | 一种基于自然语言预训练模型(bert)的软件功能点识别方法 |
EP3945431A1 (en) * | 2020-07-28 | 2022-02-02 | Sap Se | Bridge from natural language processing engine to database engine |
US11340898B1 (en) * | 2021-03-10 | 2022-05-24 | Hcl Technologies Limited | System and method for automating software development life cycle |
CN114706559A (zh) * | 2022-03-29 | 2022-07-05 | 山东省计算中心(国家超级计算济南中心) | 一种基于需求识别的软件规模度量方法 |
-
2022
- 2022-08-30 CN CN202211044086.9A patent/CN115113919B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271201A (zh) * | 2018-09-27 | 2019-01-25 | 华东师范大学 | 一种智能功能点识别的软件计价系统 |
CN111274817A (zh) * | 2020-01-16 | 2020-06-12 | 北京航空航天大学 | 一种基于自然语言处理技术的智能化软件成本度量方法 |
EP3945431A1 (en) * | 2020-07-28 | 2022-02-02 | Sap Se | Bridge from natural language processing engine to database engine |
CN112181490A (zh) * | 2020-09-22 | 2021-01-05 | 中国建设银行股份有限公司 | 功能点评估法中功能类别的识别方法、装置、设备及介质 |
CN112817561A (zh) * | 2021-02-02 | 2021-05-18 | 山东省计算中心(国家超级计算济南中心) | 软件需求文档的事务类功能点结构化抽取方法及系统 |
US11340898B1 (en) * | 2021-03-10 | 2022-05-24 | Hcl Technologies Limited | System and method for automating software development life cycle |
CN113127060A (zh) * | 2021-04-09 | 2021-07-16 | 中通服软件科技有限公司 | 一种基于自然语言预训练模型(bert)的软件功能点识别方法 |
CN114706559A (zh) * | 2022-03-29 | 2022-07-05 | 山东省计算中心(国家超级计算济南中心) | 一种基于需求识别的软件规模度量方法 |
Non-Patent Citations (4)
Title |
---|
CUAUHTÉMOC LÓPEZ-MARTÍN: "Predictive accuracy comparison between neural networks and statistical regression for development effort of software projects" * |
刘会娟: "HK公司X软件开发项目成本估算改进研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
李嘉: "基于功能点规模度量的软件成本估算模型研究及其应用" * |
陈文实: "基于主题特征的多标签文本分类方法研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117493568A (zh) * | 2023-11-09 | 2024-02-02 | 中安启成科技有限公司 | 一种端到端软件功能点提取与识别方法 |
CN117493568B (zh) * | 2023-11-09 | 2024-04-19 | 中安启成科技有限公司 | 一种端到端软件功能点提取与识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115113919B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825882B (zh) | 一种基于知识图谱的信息系统管理方法 | |
CN108984683B (zh) | 结构化数据的提取方法、系统、设备及存储介质 | |
CN112184525B (zh) | 通过自然语义分析实现智能匹配推荐的系统及方法 | |
CN111259873B (zh) | 一种表格数据提取方法及装置 | |
CN112597312A (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN113505242A (zh) | 一种知识图谱自动嵌入的方法及系统 | |
CN109933783A (zh) | 一种不良资产经营领域的合同要素化方法 | |
CN111428480A (zh) | 简历识别方法、装置、设备及存储介质 | |
CN112989827A (zh) | 一种基于多源异构特征的文本数据集质量评估方法 | |
CN112466277A (zh) | 韵律模型训练方法、装置、电子设备及存储介质 | |
CN115113919A (zh) | 基于BERT模型和Web技术的软件规模度量智能信息化系统 | |
CN113742498B (zh) | 一种知识图谱的构建更新方法 | |
CN111178080A (zh) | 一种基于结构化信息的命名实体识别方法及系统 | |
CN116975313B (zh) | 一种基于电力物资语料的语义标签生成方法和装置 | |
CN113935880A (zh) | 政策推荐方法、装置、设备及存储介质 | |
CN115248890A (zh) | 用户兴趣画像的生成方法、装置、电子设备以及存储介质 | |
CN112528642A (zh) | 一种隐式篇章关系自动识别方法及系统 | |
CN115759078A (zh) | 文本信息的处理方法、系统、设备及存储介质 | |
CN110413795A (zh) | 一种数据驱动的专业知识图谱构建方法 | |
CN115587190A (zh) | 一种电力领域知识图谱的构建方法、装置及电子设备 | |
CN115204179A (zh) | 基于电网公共数据模型的实体关系预测的方法及装置 | |
CN112488593B (zh) | 一种用于招标的辅助评标系统及方法 | |
CN114996494A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116882416B (zh) | 一种招标文件的信息识别方法及系统 | |
CN116128364B (zh) | 一种文本撰写质量监控方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |