CN116862401A - 一种基于大数据平台的软件开发系统 - Google Patents

一种基于大数据平台的软件开发系统 Download PDF

Info

Publication number
CN116862401A
CN116862401A CN202310673152.7A CN202310673152A CN116862401A CN 116862401 A CN116862401 A CN 116862401A CN 202310673152 A CN202310673152 A CN 202310673152A CN 116862401 A CN116862401 A CN 116862401A
Authority
CN
China
Prior art keywords
module
unit
software development
program
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310673152.7A
Other languages
English (en)
Inventor
郎红丽
张驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhide Guangxun Technology Co ltd
Original Assignee
Beijing Zhide Guangxun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhide Guangxun Technology Co ltd filed Critical Beijing Zhide Guangxun Technology Co ltd
Priority to CN202310673152.7A priority Critical patent/CN116862401A/zh
Publication of CN116862401A publication Critical patent/CN116862401A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/10Requirements analysis; Specification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Stored Programmes (AREA)

Abstract

本发明涉及软件开发技术领域,具体涉及一种基于大数据平台的软件开发系统,通过数据收集模块对网络上公开的各种程序的源代码进行收集,从而得到代码的数据库,然后通过存储模块方便的对源代码按照类别进行存储,启动需求分析模块对客户的软件开发需求进行分析,以得到标准的目标程序文档,从而采用调用模块以调用匹配的源代码数据进行组合构建,从而很方便的得到初级程序,之后采用修订模块对初级程序进行修订,使得程序更加完成,并通过测试模块测试通过后,通过发布模块进行程序发布,使得采用本发明更加方便快速地生成满足基本需求的初级程序,然后再进一步修订以得到更加完整的程序,使得加快软件开发速度,减少企业的开发成本。

Description

一种基于大数据平台的软件开发系统
技术领域
本发明涉及软件开发技术领域,尤其涉及一种基于大数据平台的软件开发系统。
背景技术
代码开发是互联网、计算机技术的基础。一套完善的开发流程以及工具是代码开发的重要保障。随着互联网云计算、大数据、人工智能/互联网技术发展和业务模式革新,产品的开发迭代速度和质量要求越来越高。现有技术中,开发环境需要自己搭建维护硬件及软件工具,这样增加了开发成本,不利于小微企业使用。
发明内容
本发明的目的在于提供一种基于大数据平台的软件开发系统,旨在可以利用数据库更加方便地生成软件,提高开发效率,降低企业成本。
为实现上述目的,本发明提供了一种基于大数据平台的软件开发系统,包括数据收集模块、存储模块、用户认证模块、需求分析模块、调用模块、修订模块、测试模块和发布模块,所述数据收集模块、所述存储模块、所述用户认证模块、所述需求分析模块、所述调用模块、所述修订模块、所述测试模块和所述发布模块依次连接;
所述数据收集模块,用于采用爬虫技术在网络上获取各种程序的源代码;
所述存储模块,用于对源代码按照类别进行存储;
所述用户认证模块,用于基于用户认证对开发的数据库进行分级;
所述需求分析模块,用于获取客户的软件开发需求并进行分析,得到目标程序文档;
所述调用模块,用于基于关键词组和目标程序文档匹配源代码数据,并进行组合构建得到初级程序;
所述修订模块,用于基于目标程序文档对初级程序进行修订,得到修订程序;
所述测试模块,用于对修订程序进行测试;
所述发布模块,用于当测试通过后进行发布。
其中,所述数据收集模块包括数据库检索单元、爬取单元和筛除单元,所述数据库检索单元用于检索符合要求的源代码数据库,所述爬取单元,用于采用爬虫技术获取对应的源代码数据,所述筛除单元,用于对源代码数据中的无效数据进行筛除。
其中,所述存储模块包括深度学习单元、分类单元和存储单元,所述深度学习单元、所述分类单元和所述存储单元依次连接,所述深度学习单元,用于基于标注的代码注释形成分类模型;所述分类单元,用于基于分类模型对源代码进行分类;所述存储单元,用于对分类后的源代码按照类别进行存储。
其中,所述存储模块还包括关键词生成单元,所述关键词生成单元,用于基于源代码的注释生成对应的关键词组。
其中,所述存储模块还包括关联单元,用于将同一关键词下的各源代码建立关联关系。
其中,所述目标程序文档包括:程序块功能需求、程序块排序数据、程序块从属关系。
其中,所述用户认证模块包括功能模块访问控制单元和用户设置单元,所述功能模块访问控制单元,用于对功能模块进行权限设置,所述用户设置单元,用于基于所述权限设置对用户进行分级。
其中,所述需求分析模块包括需求获取单元、解析单元和文档生成单元,所述需求获取单元,用于获取预定格式的用户需求文档;所述解析单元,用于获取软件开发的功能需求、各功能需求的排列规律信息,以及各功能需求之间的关联信息;所述文档生成单元,用于得到目标程序文档。
本发明的一种基于大数据平台的软件开发系统,通过所述数据收集模块可以对网络上公开的各种程序的源代码进行收集,从而可以得到代码的数据库,以便于在其中查询对应的软件功能模块,然后通过所述存储模块可以方便的对源代码按照类别进行存储,其中类别是按照软件的用途进行分类的,便于后续进行检索和查询,为了可以针对客户的需求以定制化相应的功能,以减小其使用成本,本申请还设置有所述用户认证模块,可以基于用户认证对开发的数据库进行分级,在完成这些准备工作后,启动所述需求分析模块对客户的软件开发需求进行分析,以得到标准的目标程序文档,该目标程序文档中包含序块功能需求、程序块排序数据、程序块从属关系,从而可以采用所述调用模块以调用匹配的源代码数据进行组合构建,从而可以很方便的得到初级程序,之后可以采用修订模块对初级程序进行修订,使得程序更加完成,并通过所述测试模块测试通过后,通过所述发布模块进行程序发布,使得采用本发明可以更加方便快速地生成满足基本需求的初级程序,然后再进一步修订以得到更加完整的程序,使得可以加快软件开发速度,减少企业的开发成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的第一实施例的一种基于大数据平台的软件开发系统的结构图。
图2是本发明的第二实施例的数据收集模块的结构图。
图3是本发明的第二实施例的存储模块的结构图。
图4是本发明的第二实施例的用户认证模块的结构图。
图5是本发明的第二实施例的需求分析模块的结构图。
图6是本发明的第二实施例的调用模块的结构图。
图7是本发明的第三实施例的修订模块的结构图。
图8是本发明的第三实施例的测试模块的结构图。
数据收集模块101、存储模块102、用户认证模块103、需求分析模块104、调用模块105、修订模块106、测试模块107、发布模块108、数据库检索单元201、爬取单元202、筛除单元203、深度学习单元204、分类单元205、存储单元206、关键词生成单元207、关联单元208、功能模块访问控制单元209、用户设置单元210、需求获取单元211、解析单元212、文档生成单元213、匹配单元214、排列单元215、适配单元216、建议单元301、选择单元302、替换单元303、修订单元304、自测单元305、内测单元306。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
第一实施例
请参阅图1,图1是本发明的第一实施例的一种基于大数据平台的软件开发系统的结构图。本发明提供一种基于大数据平台的软件开发系统,包括数据收集模块101、存储模块102、用户认证模块103、需求分析模块104、调用模块105、修订模块106、测试模块107和发布模块108,所述数据收集模块101、所述存储模块102、所述用户认证模块103、所述需求分析模块104、所述调用模块105、所述修订模块106、所述测试模块107和所述发布模块108依次连接;所述数据收集模块101,用于采用爬虫技术在网络上获取各种程序的源代码;所述存储模块102,用于对源代码按照类别进行存储;所述用户认证模块103,用于基于用户认证对开发的数据库进行分级;所述需求分析模块104,用于获取客户的软件开发需求并进行分析,得到目标程序文档;所述调用模块105,用于基于关键词组和目标程序文档匹配源代码数据,并进行组合构建得到初级程序;所述修订模块106,用于基于目标程序文档对初级程序进行修订,得到修订程序;所述测试模块107,用于对修订程序进行测试;所述发布模块108,用于当测试通过后进行发布。
在本实施方式中,通过所述数据收集模块101可以对网络上公开的各种程序的源代码进行收集,从而可以得到代码的数据库,以便于在其中查询对应的软件功能模块,然后通过所述存储模块102可以方便的对源代码按照类别进行存储,其中类别是按照软件的用途进行分类的,便于后续进行检索和查询,为了可以针对客户的需求以定制化相应的功能,以减小其使用成本,本申请还设置有所述用户认证模块103,可以基于用户认证对开发的数据库进行分级,在完成这些准备工作后,启动所述需求分析模块104对客户的软件开发需求进行分析,以得到标准的目标程序文档,该目标程序文档中包含序块功能需求、程序块排序数据、程序块从属关系,从而可以采用所述调用模块105以调用匹配的源代码数据进行组合构建,从而可以很方便的得到初级程序,之后可以采用修订模块106对初级程序进行修订,使得程序更加完成,并通过所述测试模块107测试通过后,通过所述发布模块108进行程序发布,使得采用本发明可以更加方便快速地生成满足基本需求的初级程序,然后再进一步修订以得到更加完整的程序,使得可以加快软件开发速度,减少企业的开发成本。
第二实施例
请参阅图2~图6,图2是本发明的第二实施例的数据收集模块的结构图。图3是本发明的第二实施例的存储模块的结构图。图4是本发明的第二实施例的用户认证模块的结构图。图5是本发明的第二实施例的需求分析模块的结构图。图6是本发明的第二实施例的调用模块的结构图。在第一实施例的基础上,本发明还提供一种基于大数据平台的软件开发系统,所述数据收集模块101包括数据库检索单元201、爬取单元202和筛除单元203,所述数据库检索单元201用于检索符合要求的源代码数据库,所述爬取单元202,用于采用爬虫技术获取对应的源代码数据,所述筛除单元203,用于对源代码数据中的无效数据进行筛除。通过所述数据库检测单元,可以在网络上检索满足要求的数据库,避免采集过多无效数据或者不满足格式的数据,然后通过所述爬取单元202以得到对应的数据,之后通过筛除单元203对数据进行过滤,使得采用的数据更加有效。
在本实施方式中,所述存储模块102包括深度学习单元204、分类单元205和存储单元206,所述深度学习单元204、所述分类单元205和所述存储单元206依次连接,所述深度学习单元204,用于基于标注的代码注释形成分类模型;所述分类单元205,用于基于分类模型对源代码进行分类;所述存储单元206,用于对分类后的源代码按照类别进行存储。为了提高代码的可读性,一般在代码写好后会批注注释,通过注释可以帮助理解本段代码的作用,因此可以采用标注的代码注释进行深度模型训练,以得到分类模型,以对源代码进行分类。
所述存储模块102还包括关键词生成单元207,所述关键词生成单元207,用于基于源代码的注释生成对应的关键词组。通过所述关键词组可以更加快速地对源代码进行匹配。
进一步的,所述存储模块102还包括关联单元208,用于将同一关键词下的各源代码建立关联关系。通过所述关联单元208可以将作用相同或者类似的进行关联,从而可以便于推荐和调用,以提高程序的运行效率。
然后,所述用户认证模块103包括功能模块访问控制单元209和用户设置单元210,所述功能模块访问控制单元209,用于对功能模块进行权限设置,所述用户设置单元210,用于基于所述权限设置对用户进行分级。通过根据用户的需求设置不用访问权限的用户账号,从而可以节省用户的使用成本,提高开发效率。
所述需求分析模块104包括需求获取单元211、解析单元212和文档生成单元213,所述需求获取单元211,用于获取预定格式的用户需求文档;所述解析单元212,用于获取软件开发的功能需求、各功能需求的排列规律信息,以及各功能需求之间的关联信息;所述文档生成单元213,用于得到目标程序文档。为了提高本发明运行的速率,约定在客户提供软件开发需求时,需要按照预定格式提交用户需求文档,这样便于检索对应的关键信息,然后通过所述解析单元212结合大数据和同类型软件的架构,给出功能需求、各功能需求的排列规律信息,以及各功能需求之间的关联信息,最后将得到的数据采用文档生成单元213得到目标程序文档。
最后,所述调用模块105包括匹配单元214、排列单元215和适配单元216,所述匹配单元214,用于基于目标程序文档中的功能需求获取对应的源代码数据;所述排列单元215,用于基于排序数据将源代码数据进行组合;所述适配单元216,用于将源代码的各个接口参数进行适配。采用此种方式可以提高软件的适配性,降低软件在运行时出错的概率。
第三实施例
请参阅图7~图8,图7是本发明的第三实施例的修订模块的结构图。图8是本发明的第三实施例的测试模块的结构图。在第二实施例的基础上,本发明还提供一种基于大数据平台的软件开发系统,所述修订模块106包括建议单元301、选择单元302、替换单元303和修订单元304,所述建议单元301、所述选择单元302、所述替换单元303和所述修订单元304依次连接,所述建议单元301,用于基于所述关联关系生成多个推荐代码,所述选择单元302,用于在多个所述推荐代码中进行选择,所述替换单元303,用于将选择的代码和原代码进行替换,所述修订单元304,用于对代码进行修饰。
所述测试模块107包括自测单元305和内测单元306,所述自测单元305,用于程序进行自运行验证,所述内测单元306,用于通过自运行验证后将修订程序发送给测试人员使用,并返回测试数据。从而可以使得测试更加方便有效,提高软件测试效率。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (8)

1.一种基于大数据平台的软件开发系统,其特征在于,
包括数据收集模块、存储模块、用户认证模块、需求分析模块、调用模块、修订模块、测试模块和发布模块,所述数据收集模块、所述存储模块、所述用户认证模块、所述需求分析模块、所述调用模块、所述修订模块、所述测试模块和所述发布模块依次连接;
所述数据收集模块,用于采用爬虫技术在网络上获取各种程序的源代码;
所述存储模块,用于对源代码按照类别进行存储;
所述用户认证模块,用于基于用户认证对开发的数据库进行分级;
所述需求分析模块,用于获取客户的软件开发需求并进行分析,得到目标程序文档;
所述调用模块,用于基于关键词组和目标程序文档匹配源代码数据,并进行组合构建得到初级程序;
所述修订模块,用于基于目标程序文档对初级程序进行修订,得到修订程序;
所述测试模块,用于对修订程序进行测试;
所述发布模块,用于当测试通过后进行发布。
2.如权利要求1所述的一种基于大数据平台的软件开发系统,其特征在于,
所述数据收集模块包括数据库检索单元、爬取单元和筛除单元,所述数据库检索单元用于检索符合要求的源代码数据库,所述爬取单元,用于采用爬虫技术获取对应的源代码数据,所述筛除单元,用于对源代码数据中的无效数据进行筛除。
3.如权利要求2所述的一种基于大数据平台的软件开发系统,其特征在于,
所述存储模块包括深度学习单元、分类单元和存储单元,所述深度学习单元、所述分类单元和所述存储单元依次连接,所述深度学习单元,用于基于标注的代码注释形成分类模型;所述分类单元,用于基于分类模型对源代码进行分类;所述存储单元,用于对分类后的源代码按照类别进行存储。
4.如权利要求3所述的一种基于大数据平台的软件开发系统,其特征在于,
所述存储模块还包括关键词生成单元,所述关键词生成单元,用于基于源代码的注释生成对应的关键词组。
5.如权利要求4所述的一种基于大数据平台的软件开发系统,其特征在于,
所述存储模块还包括关联单元,用于将同一关键词下的各源代码建立关联关系。
6.如权利要求5所述的一种基于大数据平台的软件开发系统,其特征在于,
所述目标程序文档包括:程序块功能需求、程序块排序数据、程序块从属关系。
7.如权利要求6所述的一种基于大数据平台的软件开发系统,其特征在于,
所述用户认证模块包括功能模块访问控制单元和用户设置单元,所述功能模块访问控制单元,用于对功能模块进行权限设置,所述用户设置单元,用于基于所述权限设置对用户进行分级。
8.如权利要求7所述的一种基于大数据平台的软件开发系统,其特征在于,
所述需求分析模块包括需求获取单元、解析单元和文档生成单元,所述需求获取单元,用于获取预定格式的用户需求文档;所述解析单元,用于获取软件开发的功能需求、各功能需求的排列规律信息,以及各功能需求之间的关联信息;所述文档生成单元,用于得到目标程序文档。
CN202310673152.7A 2023-06-07 2023-06-07 一种基于大数据平台的软件开发系统 Pending CN116862401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310673152.7A CN116862401A (zh) 2023-06-07 2023-06-07 一种基于大数据平台的软件开发系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310673152.7A CN116862401A (zh) 2023-06-07 2023-06-07 一种基于大数据平台的软件开发系统

Publications (1)

Publication Number Publication Date
CN116862401A true CN116862401A (zh) 2023-10-10

Family

ID=88222437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310673152.7A Pending CN116862401A (zh) 2023-06-07 2023-06-07 一种基于大数据平台的软件开发系统

Country Status (1)

Country Link
CN (1) CN116862401A (zh)

Similar Documents

Publication Publication Date Title
US20210173817A1 (en) Method and system for large scale data curation
Trappey et al. Development of a patent document classification and search platform using a back-propagation network
US20110231372A1 (en) Adaptive Archive Data Management
EP3671526B1 (en) Dependency graph based natural language processing
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
Vysotska et al. Method of similar textual content selection based on thematic information retrieval
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN114119058A (zh) 用户画像模型的构建方法、设备及存储介质
Vanderlei et al. A cooperative classification mechanism for search and retrieval software components
Van Dang Specification Case Studies in RAISE
Stollberg et al. H-Techsight—A next generation knowledge management platform
US11698811B1 (en) Machine learning-based systems and methods for predicting a digital activity and automatically executing digital activity-accelerating actions
CN116974554A (zh) 代码数据处理方法、装置、计算机设备和存储介质
CN116894495A (zh) 用注释增强机器学习管道的方法、计算机可读介质和系统
CN116862401A (zh) 一种基于大数据平台的软件开发系统
CN113190582B (zh) 一种数据实时交互式挖掘流建模分析系统
Rattan et al. Detecting high level similarities in source code and beyond
Miksatko et al. What’s in a cluster? automatically detecting interesting interactions in student e-discussions
Rauber et al. Repeatability and Re-usability in Scientific Processes: Process Context, Data Identification and Verification.
CN110717263A (zh) 一种作战模型管理系统
Manjula et al. An novel approach to extract the content retrieval with the image perception using collaborative community oriented sifting (CCOS)
CN114153993B (zh) 一种用于智能问答的知识图谱自动化构建方法及系统
LU504881B1 (en) Intelligent collection method and system for engineering archives based on enabling thinking
CN115203057B (zh) 低代码测试自动化方法、装置、设备及存储介质
CN114416323A (zh) 任务创建方法、装置、计算机设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination