CN117891447A - 一种企业管理软件开发方法、装置、设备及介质 - Google Patents

一种企业管理软件开发方法、装置、设备及介质 Download PDF

Info

Publication number
CN117891447A
CN117891447A CN202410292995.7A CN202410292995A CN117891447A CN 117891447 A CN117891447 A CN 117891447A CN 202410292995 A CN202410292995 A CN 202410292995A CN 117891447 A CN117891447 A CN 117891447A
Authority
CN
China
Prior art keywords
model
natural language
management software
information
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410292995.7A
Other languages
English (en)
Inventor
王克飞
徐超
应春红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puhuizhizao Technology Co ltd
Original Assignee
Puhuizhizao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Puhuizhizao Technology Co ltd filed Critical Puhuizhizao Technology Co ltd
Priority to CN202410292995.7A priority Critical patent/CN117891447A/zh
Publication of CN117891447A publication Critical patent/CN117891447A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/33Intelligent editors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/10Requirements analysis; Specification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Stored Programmes (AREA)

Abstract

本申请涉及一种企业管理软件开发方法、装置、设备及介质。该方法包括:获取待开发企业管理软件的结构化文档;利用大规模的训练数据集,对预设大模型进行训练;将待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到结构化文档中用户需求信息、数据模型描述信息、功能描述信息、权限描述信息、界面描述信息和关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于目标关键信息生成目标代码;根据预设技术标准与目标企业的技术规范对目标代码进行优化和/或根据用户定制要求定制化调整目标代码。本申请能实现软件开发的智能化和高效化,从而大大减少了开发人员的工作量和时间成本。

Description

一种企业管理软件开发方法、装置、设备及介质
技术领域
本申请涉及软件开发技术领域,尤其涉及一种企业管理软件开发方法、装置、设备及介质。
背景技术
随着计算机技术的发展,生产资料领域越来越多地需要软件开发技术,各种企业管理软件(SAAS软件)层出不穷。然而,随着企业管理场景的不断增加和复杂化,目前的企业管理软件开发的功能简单,不能完成企业复杂业务应用场景的实现,用户体验差,且软件开发周期长、成本高,需求分析、设计、编码、测试等等阶段均需要大量的人力工作。
发明内容
基于上述技术问题,本申请旨在提供一种企业管理软件开发方法、装置、设备及介质,以至少解决上述问题之一。
本申请第一方面提供了一种企业管理软件开发方法,所述方法包括:
获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;
利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;
将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;
根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
在本申请的一些实施例中,所述预设大模型包括大规模自然语言处理模型和大规模自然语言生成模型;利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码,包括:
利用大规模的训练数据集,对所述大规模自然语言处理模型和所述大规模自然语言生成模型进行训练,其中,训练过程包括通过所述大规模自然语言处理模型对输入所述大规模自然语言处理模型的数据的理解和从所述输入大规模自然语言处理模型的数据中提取关键信息,并通过所述大规模自然语言生成模型根据所述关键信息生成训练代码。
在本申请的一些实施例中,所述大规模的训练数据集包括第一自然语言文本数据、标注数据、第二自然语言文本数据和代码数据,其中,所述第二自然语言文本数据包括所述关键信息。
在本申请的一些实施例中,利用大规模的训练数据集,对所述大规模自然语言处理模型进行训练,包括:
使用所述第一自然语言文本数据和所述标注数据对所述自然语言处理模型进行训练;
其中,将所述第一自然语言文本数据作为所述自然语言处理模型的输入,将所述标注数据作为第一监督信号,训练所述自然语言处理模型从所述第一自然语言文本数据中提取关键信息的能力,并根据所述标注数据进行调整和优化。
在本申请的一些实施例中,所述利用大规模的训练数据集,对所述大规模自然语言生成模型进行训练,包括:
使用所述第二自然语言文本数据和所述代码数据对所述自然语言生成模型进行训练;
其中,将所述第二自然语言文本数据作为所述大规模自然语言生成模型的输入,将所述代码数据作为第二监督信号,训练所述自然语言生成模型根据所述第二自然语言文本生成相应的代码,并根据所述代码数据进行调整和优化。
在本申请的一些实施例中,所述根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码,包括:
获取预设技术标准与目标企业的技术规范;
根据所述预设技术标准与目标企业的技术规范对所述目标代码进行优化,得到优化后的代码;
和/或,获取用户定制要求,根据所述用户定制要求对所述目标代码进行调整,得到调整后的代码。
在本申请的一些实施例中,所述根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码之后,还包括:
将优化后和/或调整后的目标代码采用预设部署工具部署到所述目标企业的环境中;
对部署后的目标代码进行测试。
本申请第二方面提供了一种企业管理软件开发装置,所述装置包括:
获取模块,用于获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;
训练模块,用于利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;
生成模块,用于将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;
优化模块,用于根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
本申请第三方面提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行本申请各实施例中所述的企业管理软件开发方法。
本申请第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请各实施例中所述的企业管理软件开发方法。
本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
本申请各实施例中的所述企业管理软件开发方法能够利用大规模的训练数据集和预设大模型,从结构化文档中提取关键信息并生成符合产品需求的业务代码,基于预设大模型生成的目标代码能够更准确地满足用户需求,减少人为错误和误解,提高开发效率和质量,从而实现软件开发方法的智能化和高效化。不仅如此,该方法能够大大减少开发人员的工作量和时间成本,加快产品上线的速度,进而提高产品的竞争力和用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过阅读下文优选实施方式的详细描述,各种其它的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本申请一示例性实施例中一种企业管理软件开发方法步骤示意图;
图2是本申请一示例性实施例中一种利用大规模的训练数据集对大规模自然语言生成模型进行训练时的步骤示意图;
图3是本申请一示例性实施例中一种企业管理软件开发装置结构示意图;
图4是本申请一示例性实施例所提供的一种电子设备的结构示意图。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
具体实施方式
随着计算机技术的不断进步,各个领域对软件开发技术的需求越来越大。特别是在生产资料领域,企业管理软件的需求日益增加。
然而,现有的企业管理软件功能单一,无法满足复杂的业务场景,用户体验不佳,且开发周期长、成本高。需求分析、设计、编码和测试等环节都需要大量人力投入。
因此,在本申请的一些实施例中,提供了一种企业管理软件开发方法,所述方法包括:获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
本申请提供的所述企业管理软件开发方法能够自动化生成符合产品需求的业务代码,提高开发效率和质量,从而实现软件开发方法的智能化和高效化。不仅如此,该方法能够大大减少开发人员的工作量和时间成本,加快产品上线的速度,进而提高产品的竞争力和用户体验。
下面结合附图给出几个实施例对本申请做进一步的详细说明,可以理解的是,此处所描绘的实施例只用于解释相关本申请,而不是对本申请的限定。另外还需说明的是,为了便于描述,附图中只是与有关发明相关的部分。
实施例1
本实施例提供了一种企业管理软件开发方法,如图1所示,所述方法包括以下步骤。
S1、获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息。
具体地,首先需要收集用户需求信息,这可能包括用户对软件功能、界面、权限等方面的期望和要求。其次,需要获得待开发企业管理软件的功能描述信息,即确定软件需要实现的功能模块及其具体描述。同时,获取待开发企业管理软件的权限描述信息,即确定不同用户角色对各个功能的访问权限。还需要获取软件的界面描述信息,即设计软件的用户界面,包括布局、元素、交互等方面的描述。最后,收集待开发企业管理软件各功能之间的关联信息,即确定各功能之间的依赖关系、交互关系等。
结构化文档是按照一定的组织结构和规范,将信息以清晰、有序的方式呈现的文档形式,其目的是为了方便信息的管理、查找和理解。例如,用户需求信息给出用户登录和员工信息管理两个场景;功能描述信息给出两个功能,一个是用户认证,一个是员工信息管理;权限描述信息给出管理员权限和普通用户权限两个权限;界面描述信息给出包含用户名、密码输入框和登录按钮的登录界面,及提供员工信息列表和相应的操作按钮的员工信息管理界面。这只是举了一个对应于简单的企业管理软件的结构化文档。结构化文档中的数据模型描述信息非常重要,因为其描述了系统中所涉及的数据实体、它们之间的关系以及数据的属性。例如待开发企业管理软件的数据模型描述信息包括常见的一些实体及其属性,如员工、项目、任务、客户、合同和日志等,以及它们之间的关联关系,可以用于管理企业的人员、项目、任务、客户和合同等信息;具体包括员工信息表、项目信息表、任务信息表、客户信息表、合同信息表、日志信息表等等。可见,数据模型描述信息有助于待开发企业管理软件的设计和实施数据库。
需要说明的是,确定企业管理软件各功能之间的依赖关系和交互关系通常需要进行需求分析和系统设计。这涉及到对不同功能模块的功能需求、数据流动以及用户交互行为的理解和规划。例如:用户管理功能依赖于权限管理功能,因为在用户管理中,需要设置不同用户的权限,而这些权限信息可能是由权限管理功能提供的;报表生成功能依赖于数据分析功能,因为在生成报表的过程中,可能需要对数据进行分析和处理,这就需要依赖于数据分析功能提供的数据处理功能;审批流程与通知系统具有交互关系,因为在企业管理软件中,若存在审批流程,当某个审批任务完成时,需要通知相关人员,这就需要审批流程模块与通知系统模块进行交互,实现及时的通知功能。
因此,在确定这些依赖关系和交互关系时,需要综合考虑用户需求、系统功能和数据流动,以确保软件能够实现用户期望的功能,并且各功能之间能够协调配合,以提升待开发企业管理软件对应系统的整体效率和用户体验。可以理解,结构化文档能够实现更清晰地了解项目需求和功能,有助于准确定义开发任务以及更好地追踪项目进展。
S2、利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码。
具体地,涉及将收集到的结构化文档作为训练数据,输入到预设的大模型中进行训练。训练过程包括对输入数据的理解和从中提取关键信息,这可能涉及自然语言处理、文本分析等技术。然后根据提取的关键信息生成训练代码,这可能涉及到代码生成技术或者模板匹配等方法。需要说明的是,提取的“关键信息”是一种抽象概括性词语,落实到实际场景中,就是具体的、细致化描述的用户需求信息、数据模型描述信息、功能描述信息、权限描述信息、界面描述信息及功能之间的关联信息。
在一种具体的实现方式中,预设大模型包括大规模自然语言处理模型和大规模自然语言生成模型;利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入预设大模型的数据的理解和从输入预设大模型的数据中提取关键信息,并根据关键信息生成训练代码,包括:利用大规模的训练数据集,对大规模自然语言处理模型和大规模自然语言生成模型进行训练,其中,训练过程包括通过大规模自然语言处理模型对输入大规模自然语言处理模型的数据的理解和从输入大规模自然语言处理模型的数据中提取关键信息,并通过大规模自然语言生成模型根据关键信息生成训练代码。
设计大规模自然语言处理模型的架构时,可以选择循环神经网络(RNN)、长短期记忆网络(LSTM)、Transformer等,这些模型都可以设计用于处理序列数据,自然语言通常以序列形式出现,例如句子或文档中的单词或字符,可以有效地捕获文本中的上下文信息和序列关系,从而更好地理解语言的语义和语法结构。设计大规模自然语言生成模型的架构时,需要考虑编程语言的语法规则、变量、函数、控制结构等特定的语言结构。因此,对于生成计算机语言代码,更适合的模型是基于编码器-解码器结构的模型。例如大规模自然语言生成模型可以是基于注意力机制的变体或特定于语言的模型,还可以使用GPT(GenerativePre-trained Transformer)模型,它是一个基于 Transformer 结构的通用语言生成模型。架构好的模型可以通过学习编程语言的语法规则和约束来生成符合规范的代码。
具体进行训练时,针对大规模自然语言处理模型,训练时采用的训练数据集是大量的企业管理软件结构化文档,其中包括:用户需求信息、数据模型描述信息、功能描述信息、权限描述信息、界面描述信息及功能之间的关联信息。这些结构化文档可以是来自实际企业管理软件项目的需求文档、设计文档、用户手册等,还需要整理相关公司内部的技术标准、技术架构、技术规范以及已用组件能力的相关信息,这些数据需要进行标注和整理,以进行模型训练使用。通过训练模型,可以从这些文档中提取关键信息,帮助开发团队更好地理解用户需求,设计软件架构,以及确保功能之间的协调和一致性。
具体进行训练时,针对大规模自然语言生成模型,训练时采用的训练数据集可以使用包含编程任务描述和相应代码的数据集,以及包含各种编程语言结构的示例。例如:可以使用包含任务描述和相应代码的多语言数据集,如在给定任务下的编程任务和相应的代码解决方案。这样的训练数据有助于生成模型学习生成符合语法规则和任务需求的代码。
在一种具体的实现方式中,大规模的训练数据集包括第一自然语言文本数据、标注数据、第二自然语言文本数据和代码数据,其中,第二自然语言文本数据包括上述关键信息。在利用大规模的训练数据集,对大规模自然语言处理模型进行训练时,参考图2,使用第一自然语言文本数据和标注数据对自然语言处理模型进行训练;其中,将第一自然语言文本数据作为自然语言处理模型的输入,将标注数据作为第一监督信号,训练自然语言处理模型从第一自然语言文本数据中提取关键信息的能力,并根据标注数据进行调整和优化。
假设第一自然语言文本数据中说明了用户对企业管理软件的基本需求,如自动化采购流程、管理库存、跟踪销售订单等信息。大规模自然语言处理模型学习并提取到的是细致化业务描述信息如采购自动化程度、库存管理功能、销售流程管理等。数据模型描述信息定义了将要使用的数据结构如包括采购订单、入库单、销售订单的数据模型,大规模自然语言处理模型学习并提取到的是详细的数据模型结构如订单编号、产品详情、数量、价格、时间戳等字段及其类型。第一自然语言文本数据中的功能描述信息列出了需要实现的功能,大规模自然语言处理模型学习并提取到的是具体功能需求,如订单管理、库存查询、销售分析等。同样地,权限描述信息说明了不同用户或角色在使用SAAS软件时的权限限制,如采购经理可以创建和修改采购订单,而库存管理员只能查看库存信息,则大规模自然语言处理模型学习并提取到用户角色和权限设定如角色定义、角色对应的操作权限等。界面描述信息描述了SAAS软件用户界面的布局、风格和用户交互要求,包括界面元素、颜色方案、导航结构等,则大规模自然语言处理模型学习并提取到界面UI元素布局、风格要求、交互流程等。功能之间的关联信息,说明了软件中各个功能模块之间的相互关系和数据流,如采购订单如何转换成库存记录,销售订单如何影响库存等,而大规模自然语言处理模型学习并提取到模块间数据流和逻辑关系,如订单创建后库存更新、销售记录生成等细致化描述信息。
在另一种具体的实现方式中,对大规模自然语言处理模型进行训练时,利用大规模的训练数据集,对大规模自然语言生成模型进行训练时,如图2所示,使用第二自然语言文本数据和代码数据对自然语言生成模型进行训练;其中,将第二自然语言文本数据作为大规模自然语言生成模型的输入,将代码数据作为第二监督信号,训练自然语言生成模型根据第二自然语言文本生成相应的代码,并根据代码数据进行调整和优化。代码数据包括与企业管理软件相关的高质量数据集,包括但不限于数据库设计、后端逻辑、前端界面设计、权限控制和API设计等代码示例。这些代码示例能直接反映结构化文档中的关键信息,如采购订单的处理逻辑、库存管理功能、用户界面的交互设计等。
需要说明的是,第一自然语言文本数据和第二自然语言文本都属于未标注数据,考虑到预设大模型容纳数据的海量性特点,标注数据的数据量可以远小于未标注数据,标注数据可以作为预设大模型训练的起点,帮助预设大模型建立基本的理解和生成能力。标注数据中所包含的知识可以通过迁移学习的方式传递给预设大模型,这些知识可以帮助模型更好地理解和生成代码。
对大规模自然语言处理模型和大规模自然语言生成模型进行训练时,采用损失函数的公式为:
L=max(0,d(A,P)-d(A,N)+margin)
其中,L表示损失函数的值,A表示当前样本,P表示与A相关或接近的样本,N表示与A不相关或不接近的样本,d(A,P)表示A与P之间的距离,d(A,N)表示A与N之间的距离,margin是一个超参数,表示预设的边界值,用于控制P与N之间的最小距离差异。
具体实施时,把P作为正样本,把N作为负样本,正样本能精确反映用户需求、数据模型、功能需求等方面的细节。例如,对于一个描述采购订单处理功能的文档,正样本可以是创建采购订单的流程,准确提取的流程步骤和关键字段如“选择供应商”、“产品数量”、“价格”,而负样本是那些与当前任务无关或错误理解的信息,例如一些关于公司历史或者文化的描述,这些信息虽然重要,但与创建采购订单的功能无关,与任务无关的信息提取如“公司成立年份”、“企业文化”。需要确保正负样本覆盖尽可能多的场景和文档类型,以提高大规模自然语言处理模型的泛化能力,并动态调整margin,根据大规模自然语言处理模型在验证集上的表现调整边界值,以优化性能。设计有效的距离度量方法,以准确评估模型提取的信息与真实关键信息之间的相似度或差异,可以更有效地从结构化文档中提取关键信息,同时避免提取无关紧要或错误的信息,从而在自动化SAAS软件开发过程中提高准确性和效率。采用上述的损失函数,持续调整大规模自然语言处理模型的参数以最小化损失。
针对大规模自然语言生成模型,正样本可以是与上述自然语言描述相匹配的代码示例,如数据库操作(如SQL查询用于创建或更新订单记录)、后端逻辑(比如用Python编写的采购订单处理逻辑)、前端界面元素(例如HTML/CSS/JavaScript代码片段用于显示订单表单)等。这些代码示例包括但不限于:数据库设计代码即基于数据模型描述信息创建所需的数据库表和关系;后端逻辑代码即实现功能描述信息中定义的各项功能,如订单处理、库存管理等;前端界面代码即根据界面描述信息设计用户界面,提供用户交互;权限控制代码,根据权限描述信息实现用户认证和授权逻辑;API或服务间通信代码,实现功能之间的关联信息指定的数据流和逻辑关系。采用上述的损失函数,调整大规模自然语言生成模型的参数以最小化损失,从而优化自然语言生成模型生成代码的能力。另外,在迭代训练的过程中,难免进行代码合并和代码补全的过程,以实现代码实现的完整度和精准度。如此,基于训练好的大规模自然语言处理模型输出的关键信息,大规模自然语言生成模型便能够高效地生成满足需求的软件代码,两个大模型紧密合作,能加速开发过程,提高SAAS软件开发的质量和准确性。
S3、将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码。
具体地,从结构化文档到关键信息是一个信息提取的过程,采用S2中训练好的大规模自然语言处理模型从文档中识别和提取出关键的信息元素。这些信息通常包括用户需求、数据模型、功能描述、权限描述、界面描述和关联信息等。这些信息提取后,可以用于系统设计、开发和实现。而从关键信息到目标代码则是将提取的关键信息转化为实际的编程代码的过程,采用S2中训练好的大规模自然语言生成模型,根据提取的信息编写出能够实现系统功能的代码。这些代码可以是任何编程语言的代码,通常根据具体的系统需求和技术栈来选择合适的编程语言和框架。
S4、根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
在一种具体的实现方式中,获取预设技术标准与目标企业的技术规范;根据所述预设技术标准与目标企业的技术规范对所述目标代码进行优化,得到优化后的代码;和/或,获取用户定制要求,根据所述用户定制要求对所述目标代码进行调整,得到调整后的代码。获取预设技术标准与目标企业的技术规范时,这一步可以收集涉及到行业标准、编码规范、安全要求等。同时,需要获取目标企业的技术规范,包括技术栈、架构偏好、性能需求等。根据已获取的技术标准和企业规范,对目标代码进行优化时,可以提高代码性能、减少资源占用、优化算法等。优化的具体方式取决于目标代码的特点和所处的环境,可能涉及到代码重构、性能调优、资源管理等方面。若用户有定制需求,根据对目标代码进行调整。这些定制要求可能包括特定功能的添加、界面的定制、配置选项的调整等。调整后的代码应当满足用户的特定需求,同时保持与优化后的代码的一致性和高效性。
作为可变换的实现方式,在根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码之后,还包括:将优化后和/或调整后的目标代码采用预设部署工具部署到所述目标企业的环境中;对部署后的目标代码进行测试。
具体进行部署时,可能涉及到自动化部署工具、容器化技术、持续集成/持续部署(CI/CD)等等。部署过程需要考虑目标环境的特点和限制,确保部署的顺利进行,并且不影响现有系统的正常运行。在部署完成后,对部署的代码进行测试。这包括功能测试、性能测试、安全测试等等,测试的目的是验证部署的代码是否符合预期,能够满足用户需求,并且在生产环境中稳定可靠地运行。
因此通过上述实施方式中的技术过程,可以实现根据技术标准和企业需求对代码进行优化和定制,并将其成功部署和测试在目标环境中。
实施例2
本实施例提供了一种企业管理软件开发装置,如图3所示,所述装置包括获取模块401、训练模块402、生成模块403和优化模块404。
获取模块401,用于获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息。
训练模块402,用于利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码。
生成模块403,用于将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码。
优化模块404,用于根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
上述企业管理软件开发装置能够利用大规模的训练数据集和预设大模型,从结构化文档中提取关键信息并生成符合产品需求的业务代码,基于预设大模型生成的目标代码能够更准确地满足用户需求,减少人为错误和误解,提高开发效率和质量,从而实现软件开发方法的智能化和高效化。不仅如此,该方法能够大大减少开发人员的工作量和时间成本,加快产品上线的速度,进而提高产品的竞争力和用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
实施例3
本实施例提供了一种电子设备,如图4所示,所述电子设备2包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行如本申请各实施例中任一种企业管理软件开发方法。所述方法包括:获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其它网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述企业管理软件开发方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成所述企业管理软件开发方法的步骤。
本申请例还提供一种与前述实施方式所提供的企业管理软件开发方法对应的计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的企业管理软件开发方法。不仅如此,所述计算机可读存储介质的例子还可以包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其它类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其它光学、磁性存储介质,在此不再一一赘述。
另外,本申请实施方式还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述各实施例中任一种企业管理软件开发方法。
本领域那些技术人员可以理解,本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器( DSP )来实现根据本申请实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种企业管理软件开发方法,其特征在于,所述方法包括:
获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;
利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;
将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;
根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
2.根据权利要求1所述的企业管理软件开发方法,其特征在于,所述预设大模型包括大规模自然语言处理模型和大规模自然语言生成模型;利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码,包括:
利用大规模的训练数据集,对所述大规模自然语言处理模型和所述大规模自然语言生成模型进行训练,其中,训练过程包括通过所述大规模自然语言处理模型对输入所述大规模自然语言处理模型的数据的理解和从所述输入大规模自然语言处理模型的数据中提取关键信息,并通过所述大规模自然语言生成模型根据所述关键信息生成训练代码。
3.根据权利要求2所述的企业管理软件开发方法,其特征在于,所述大规模的训练数据集包括第一自然语言文本数据、标注数据、第二自然语言文本数据和代码数据,其中,所述第二自然语言文本数据包括所述关键信息。
4.根据权利要求3所述的企业管理软件开发方法,其特征在于,利用大规模的训练数据集,对所述大规模自然语言处理模型进行训练,包括:
使用所述第一自然语言文本数据和所述标注数据对所述自然语言处理模型进行训练;
其中,将所述第一自然语言文本数据作为所述自然语言处理模型的输入,将所述标注数据作为第一监督信号,训练所述自然语言处理模型从所述第一自然语言文本数据中提取关键信息的能力,并根据所述标注数据进行调整和优化。
5.根据权利要求3所述的企业管理软件开发方法,其特征在于,所述利用大规模的训练数据集,对所述大规模自然语言生成模型进行训练,包括:
使用所述第二自然语言文本数据和所述代码数据对所述自然语言生成模型进行训练;
其中,将所述第二自然语言文本数据作为所述大规模自然语言生成模型的输入,将所述代码数据作为第二监督信号,训练所述自然语言生成模型根据所述第二自然语言文本生成相应的代码,并根据所述代码数据进行调整和优化。
6.根据权利要求1所述的企业管理软件开发方法,其特征在于,所述根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码,包括:
获取预设技术标准与目标企业的技术规范;
根据所述预设技术标准与目标企业的技术规范对所述目标代码进行优化,得到优化后的代码;
和/或,获取用户定制要求,根据所述用户定制要求对所述目标代码进行调整,得到调整后的代码。
7.根据权利要求1所述的企业管理软件开发方法,其特征在于,所述根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码之后,还包括:
将优化后和/或调整后的目标代码采用预设部署工具部署到所述目标企业的环境中;
对部署后的目标代码进行测试。
8.一种企业管理软件开发装置,其特征在于,所述装置包括:
获取模块,用于获取待开发企业管理软件的结构化文档,其中,所述结构化文档包括用户需求信息、待开发企业管理软件的数据模型描述信息、待开发企业管理软件的功能描述信息、待开发企业管理软件的权限描述信息、待开发企业管理软件的界面描述信息,及待开发企业管理软件各功能之间的关联信息;
训练模块,用于利用大规模的训练数据集,对预设大模型进行训练,其中,训练过程包括对输入所述预设大模型的数据的理解和从所述输入所述预设大模型的数据中提取关键信息,并根据所述关键信息生成训练代码;
生成模块,用于将所述待开发企业管理软件的结构化文档输入训练好的预设大模型,通过训练好的预设大模型得到所述用户需求信息、所述数据模型描述信息、所述功能描述信息、所述权限描述信息、所述界面描述信息和所述关联信息的关键信息,作为目标关键信息,并通过训练好的预设大模型基于所述目标关键信息生成目标代码;
优化模块,用于根据预设技术标准与目标企业的技术规范对所述目标代码进行优化和/或根据用户定制要求定制化调整所述目标代码。
9.一种电子设备,包括存储器和处理器,其特征在于,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行如权利要求1-7任一所述的企业管理软件开发方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7任一所述的企业管理软件开发方法。
CN202410292995.7A 2024-03-14 2024-03-14 一种企业管理软件开发方法、装置、设备及介质 Pending CN117891447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410292995.7A CN117891447A (zh) 2024-03-14 2024-03-14 一种企业管理软件开发方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410292995.7A CN117891447A (zh) 2024-03-14 2024-03-14 一种企业管理软件开发方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117891447A true CN117891447A (zh) 2024-04-16

Family

ID=90644499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410292995.7A Pending CN117891447A (zh) 2024-03-14 2024-03-14 一种企业管理软件开发方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117891447A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118113257A (zh) * 2024-04-29 2024-05-31 新华三技术有限公司 一种软件功能目标分析方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010777A (zh) * 2021-03-05 2021-06-22 腾讯科技(深圳)有限公司 数据推送方法、装置、设备及存储介质
WO2022142116A1 (zh) * 2020-12-28 2022-07-07 平安科技(深圳)有限公司 文档处理方法、装置、电子设备及存储介质
US20220255803A1 (en) * 2019-11-05 2022-08-11 Huawei Technologies Co., Ltd. NS Instantiation Method and NFVO
CN117008960A (zh) * 2023-07-03 2023-11-07 深圳派氪司科技有限公司 Api文档生成方法、装置、存储介质及芯片
CN117008923A (zh) * 2023-09-28 2023-11-07 北京智源人工智能研究院 基于ai大模型的代码生成和编译部署方法、平台和设备
CN117492703A (zh) * 2023-10-25 2024-02-02 山东浪潮爱购云链信息科技有限公司 一种基于人工智能的软件开发方法、设备及介质
CN117492736A (zh) * 2023-10-31 2024-02-02 慧之安信息技术股份有限公司 一种基于大模型的低代码平台构建方法和系统
CN117648093A (zh) * 2023-12-28 2024-03-05 中电鸿信信息科技有限公司 基于大模型和自定制需求模板的rpa流程自动化生成方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220255803A1 (en) * 2019-11-05 2022-08-11 Huawei Technologies Co., Ltd. NS Instantiation Method and NFVO
WO2022142116A1 (zh) * 2020-12-28 2022-07-07 平安科技(深圳)有限公司 文档处理方法、装置、电子设备及存储介质
CN113010777A (zh) * 2021-03-05 2021-06-22 腾讯科技(深圳)有限公司 数据推送方法、装置、设备及存储介质
CN117008960A (zh) * 2023-07-03 2023-11-07 深圳派氪司科技有限公司 Api文档生成方法、装置、存储介质及芯片
CN117008923A (zh) * 2023-09-28 2023-11-07 北京智源人工智能研究院 基于ai大模型的代码生成和编译部署方法、平台和设备
CN117492703A (zh) * 2023-10-25 2024-02-02 山东浪潮爱购云链信息科技有限公司 一种基于人工智能的软件开发方法、设备及介质
CN117492736A (zh) * 2023-10-31 2024-02-02 慧之安信息技术股份有限公司 一种基于大模型的低代码平台构建方法和系统
CN117648093A (zh) * 2023-12-28 2024-03-05 中电鸿信信息科技有限公司 基于大模型和自定制需求模板的rpa流程自动化生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118113257A (zh) * 2024-04-29 2024-05-31 新华三技术有限公司 一种软件功能目标分析方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11887010B2 (en) Data classification for data lake catalog
US20200151276A1 (en) Cognitive automation tool
CN117891447A (zh) 一种企业管理软件开发方法、装置、设备及介质
US20230393832A1 (en) Automated translation of computer languages to extract and deploy computer systems and software
CN115547466A (zh) 基于大数据的医疗机构登记评审系统及其方法
Huang et al. Code review knowledge perception: Fusing multi-features for salient-class location
Renggli et al. Ease. ml/ci and ease. ml/meter in action: Towards data management for statistical generalization
CN115952298A (zh) 供应商履约风险分析方法及相关设备
Nikiforova Open data quality
US10489728B1 (en) Generating and publishing a problem ticket
Avdeenko et al. Intelligent support of requirements management in agile environment
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
US20100305986A1 (en) Using Service Exposure Criteria
Mohanan et al. Natural Language Processing Approach for UML Class Model Generation from Software Requirement Specifications via SBVR.
US20220405235A1 (en) System and method for reference dataset management
CN112381509A (zh) 重大新药创制国家科技重大专项课题管理系统
Kholkar et al. From Natural-language Regulations to Enterprise Data using Knowledge Representation and Model Transformations.
Zhong et al. Burner: Recipe automatic generation for HPC container based on domain knowledge graph
US20240265196A1 (en) Corpus quality processing for a specified task
CN116383883B (zh) 一种基于大数据的数据管理权限处理方法及系统
US20240126759A1 (en) Converting an api into a graph api
US20240296292A1 (en) Generating an ai conversation model using api test data
JP6985322B2 (ja) 文書作成支援装置、文書作成支援方法及びプログラム
Lenka et al. Automated Testing Tool: QTP
Demchenko Feasibility Study of a Portal to Provide Knowledge about Supersymmetry to Experts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination