CN116595543A - 一种基于互联网平台用软件开发应用数据的处理系统 - Google Patents
一种基于互联网平台用软件开发应用数据的处理系统 Download PDFInfo
- Publication number
- CN116595543A CN116595543A CN202310868329.9A CN202310868329A CN116595543A CN 116595543 A CN116595543 A CN 116595543A CN 202310868329 A CN202310868329 A CN 202310868329A CN 116595543 A CN116595543 A CN 116595543A
- Authority
- CN
- China
- Prior art keywords
- module
- data
- application data
- software
- optimization scheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 27
- 238000005457 optimization Methods 0.000 claims abstract description 88
- 238000000034 method Methods 0.000 claims abstract description 64
- 230000008569 process Effects 0.000 claims abstract description 50
- 238000007405 data analysis Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 33
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000013500 data storage Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 11
- 238000012360 testing method Methods 0.000 abstract description 6
- 230000006855 networking Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 12
- 230000008439 repair process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
- G06F21/577—Assessing vulnerabilities and evaluating computer system security
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2337—Non-hierarchical techniques using fuzzy logic, i.e. fuzzy clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于互联网平台用软件开发应用数据的处理系统,包括应用数据采集模块、应用数据运行模块、云端服务器、运行数据分析模块及应用数据优化模块,应用数据采集模块、应用数据运行模块、云端服务器、运行数据分析模块及应用数据优化模块依次连接,且应用数据优化模块还与云端服务器连接。本发明不仅可以实现软件开发过程中应用数据的采集及联网测试,而且还可以对软件的各项运行数据进行检测与分析,并能够有效地解决传统推荐算法中优化方案评分不能随时间变化的问题,从而使得本发明能够根据时间的变化而推荐最优的优化方案,进而可以更好的满足于软件开发的需求。
Description
技术领域
本发明涉及数据处理技术领域,具体来说,涉及一种基于互联网平台用软件开发应用数据的处理系统。
背景技术
计算机软件开发是根据用户要求建造出软件系统或者系统中的软件部分的过程;软件开发是一项包括需求捕捉、需求分析、设计、实现和测试的系统工程;软件一般是用某种程序设计语言来实现的;通常采用软件开发工具可以进行开发;软件分为系统软件和应用软件,并不只是包括可以在计算机上运行的程序,与这些程序相关的文件一般也被认为是软件的一部分;软件设计思路和方法的一般过程,包括设计软件的功能和实现的算法和方法、软件的总体结构设计和模块设计、编程和调试、程序联调和测试,然后进行编写再提交程序。
在对软件开发的时候,需要与互联网联网测试,从而检测软件运行的稳定性和精确性,例如通常被实施为软件解决方案的防火墙之类的已知的安全技术仍然可以被绕过从而形成了安全风险,数据处理系统的功能被链接到至少一部分可以接入公网的通讯网络上并且因此可以接入其他通过这些系统耦接的系统,因此不能保证数据的安全,从而设计基于互联网平台用软件开发应用数据的处理系统用来解决上述问题。
发明内容
针对相关技术中的问题,本发明提出一种基于互联网平台用软件开发应用数据的处理系统,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
一种基于互联网平台用软件开发应用数据的处理系统,该处理系统包括应用数据采集模块、应用数据运行模块、云端服务器、运行数据分析模块及应用数据优化模块,应用数据采集模块、应用数据运行模块、云端服务器、运行数据分析模块及应用数据优化模块依次连接,且应用数据优化模块还与云端服务器连接;
其中,应用数据采集模块用于采集软件开发过程中的应用数据;
应用数据运行模块用于根据采集的应用数据运行软件程序;
云端服务器用于系统中数据的传输及存储;
运行数据分析模块用于对软件程序运行的运行数据进行分析,并将程序运行过程中的问题数据及时发送至应用数据优化模块;
应用数据优化模块用于利用改进型推荐算法为程序运行过程中的问题数据推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理;
应用数据优化模块包括依次连接的程序运行问题数据接收模块、优化方案推荐模块及问题数据修复模块;
程序运行问题数据接收模块用于接收对比分析结果显示模块发送的程序运行过程中的问题数据;
优化方案推荐模块用于利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案;
问题数据修复模块用于利用推荐的优化方案对程序运行过程中的问题数据进行修复处理。
进一步的,应用数据采集模块包括用户注册登陆模块、用户登陆验证模块及应用数据输入模块;
其中,用户注册登陆模块用于软件用户账号的登陆、注销及注册;
用户登陆验证模块用于对软件用户账号的登陆进行验证;
应用数据输入模块用于输入软件的运行数据。
进一步的,应用数据运行模块包括相互连接的应用数据接收模块及程序运行模块;
其中,应用数据接收模块用于接收输入的运行数据;
程序运行模块用于软件程序的运行。
进一步的,云端服务器包括通讯模块及数据存储模块;
其中,通讯模块用于系统中各模块之间的数据传输;
数据存储模块用于利用分级存储技术对系统中的数据进行存储。
进一步的,数据存储模块包括依次连接的数据分类模块、数据分级模块、分级存储模块及可视化监控模块;
其中,数据分类模块用于根据不同数据的类型进行分类处理;
数据分级模块用于根据动态数据热度表对分类后的数据进行分级;
分级存储模块用于对分级后的数据进行分级存储;
可视化监控模块用于定时查询数据库中数据的占用空间及剩余空间。
进一步的,运行数据分析模块包括运行性能数据获取模块、标准性能数据获取模块、运行数据对比分析模块及对比分析结果显示模块;
其中,运行性能数据获取模块用于程序运行过程中运行性能数据的获取;
标准性能数据获取模块用于获取数据库中预设的程序运行过程中的标准性能数据;
运行数据对比分析模块用于将获取的运行性能数据与标准性能数据进行比对分析;
对比分析结果显示模块用于显示运行数据的比对分析结果,并将程序运行过程中的问题数据及时发送至应用数据优化模块。
进一步的,优化方案推荐模块在利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案时包括以下步骤:
基于数据库中的历史数据建立软件开发过程中的问题与推荐方案的评分矩阵;
通过预先构造的基于时间的指数遗忘函数对评分矩阵进行不同程度的衰减处理,得到基于评分时间衰减的权值评分矩阵;
根据权值评分矩阵,利用FCM算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵;
利用余弦度相似算法计算目标问题与最优聚类中心的相似度,并选择相似度值靠前的若干聚类组成候选邻居集;
利用改进的混合蛙跳算法在候选邻居集中选取适应度靠前的N个问题组成最近邻居集;
根据最近邻居集为目标问题推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理。
进一步的,基于时间的指数遗忘函数的公式如下:
;
式中,t表示问题对该优化方案实际的评分时间,Tstart表示问题第一次参与优化方案评分的时间,Tend表示问题最近一次对优化方案评分的时间,eps=0.000001是设置的最小值。
进一步的,利用FCM算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵包括以下步骤:
设置模糊聚类数C和模糊加权指数M的值,并随机生成初始聚类中心;
计算问题隶属于每个问题类别的隶属度矩阵及每个类别的聚类中心;
计算前后两次迭代得到的J(H,V)差值,若差值小于设定的最小值,则停止迭代更新,否则返回至上一步进行执行;
问题聚类完成后,得到问题的最优聚类中心和隶属度矩阵;
其中,隶属度矩阵的计算公式如下:
;
聚类中心的计算公式如下:
;
式中,表示问题uk对第i个聚类中心vi的隶属度,vj表示第j个聚类中心,║║表示范数符号,p表示模糊聚类数C的范围,C∈[2,p],k表示自然数。
进一步的,利用改进的混合蛙跳算法在候选邻居集中选取适应度靠前的N个问题组成最近邻居集包括以下步骤:
将候选邻居集作为改进的混合蛙跳算法中的青蛙群体,通过分组,对每组进行局部搜索后进行种群内全局信息交换,直到得到最近邻居集。
本发明的有益效果为:
1)通过设置有应用数据采集模块、应用数据运行模块、运行数据分析模块及应用数据优化模块,从而不仅可以在应用数据采集模块和应用数据运行模块的作用下实现软件开发过程中应用数据的采集及联网测试,而且还可以在运行数据分析模块及应用数据优化模块的作用下对软件的各项运行数据进行检测与分析,并能够利用改进型推荐算法为软件运行过程中的问题数据推荐对应的优化方案,从而可以利用该优化方案实现对软件开发过程中问题数据的修复。
2)通过设置优化方案推荐模块,从而可以利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案,基于评分时间衰减的权值评分矩阵来根据时间的变化对推荐方案的评分进行自动更新,相比于传统的协同过滤推荐算法,本发明可以有效地解决传统推荐算法中优化方案评分不能随时间变化的问题,从而使得本发明能够根据时间的变化而推荐最优的优化方案,进而可以更好的满足于软件开发的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于互联网平台用软件开发应用数据的处理系统的结构框图;
图2是根据本发明实施例的一种基于互联网平台用软件开发应用数据的处理系统中数据存储模块的结构框图。
图中:
1、应用数据采集模块;11、用户注册登陆模块;12、用户登陆验证模块;13、应用数据输入模块;2、应用数据运行模块;21、应用数据接收模块;22、程序运行模块;3、云端服务器;31、通讯模块;32、数据存储模块;321、数据分类模块;322、数据分级模块;323、分级存储模块;324、可视化监控模块;4、运行数据分析模块;41、运行性能数据获取模块;42、标准性能数据获取模块;43、运行数据对比分析模块;44、对比分析结果显示模块;5、应用数据优化模块;51、程序运行问题数据接收模块;52、优化方案推荐模块;53、问题数据修复模块。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了一种基于互联网平台用软件开发应用数据的处理系统。
现结合附图和具体实施方式对本发明进一步说明,如图1-图2所示,根据本发明实施例的基于互联网平台用软件开发应用数据的处理系统,该处理系统包括应用数据采集模块1、应用数据运行模块2、云端服务器3、运行数据分析模块4及应用数据优化模块5,应用数据采集模块1、应用数据运行模块2、云端服务器3、运行数据分析模块4及应用数据优化模块5依次连接,且应用数据优化模块5还与云端服务器3连接;
其中,应用数据采集模块1用于采集软件开发过程中的应用数据;
具体的,应用数据采集模块1包括用户注册登陆模块11、用户登陆验证模块12及应用数据输入模块13;
其中,用户注册登陆模块11用于软件用户账号的登陆、注销及注册;
用户登陆验证模块12用于对软件用户账号的登陆进行验证;
应用数据输入模块13用于输入软件的运行数据。
应用数据运行模块2用于根据采集的应用数据运行软件程序;
具体的,应用数据运行模块2包括相互连接的应用数据接收模块21及程序运行模块22;
其中,应用数据接收模块21用于接收输入的运行数据;
程序运行模块22用于软件程序的运行。
云端服务器3用于系统中数据的传输及存储;
具体的,云端服务器3包括通讯模块31及数据存储模块32;
其中,通讯模块31用于系统中各模块之间的数据传输;
数据存储模块32用于利用分级存储技术对系统中的数据进行存储。
数据存储模块32包括依次连接的数据分类模块321、数据分级模块322、分级存储模块323及可视化监控模块324;
其中,数据分类模块321用于根据不同数据的类型进行分类处理;
数据分级模块322用于根据动态数据热度表对分类后的数据进行分级;
分级存储模块323用于对分级后的数据进行分级存储;
可视化监控模块324用于定时查询数据库中数据的占用空间及剩余空间。
运行数据分析模块4用于对软件程序运行的运行数据进行分析,并将程序运行过程中的问题数据及时发送至应用数据优化模块5;
具体的,运行数据分析模块4包括运行性能数据获取模块41、标准性能数据获取模块42、运行数据对比分析模块43及对比分析结果显示模块44;
其中,运行性能数据获取模块41用于程序运行过程中运行性能数据的获取;
标准性能数据获取模块42用于获取数据库中预设的程序运行过程中的标准性能数据;
运行数据对比分析模块43用于将获取的运行性能数据与标准性能数据进行比对分析;
对比分析结果显示模块44用于显示运行数据的比对分析结果,并将程序运行过程中的问题数据及时发送至应用数据优化模块5。
应用数据优化模块5用于利用改进型推荐算法为程序运行过程中的问题数据推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理;
应用数据优化模块5包括依次连接的程序运行问题数据接收模块51、优化方案推荐模块52及问题数据修复模块53;
程序运行问题数据接收模块51用于接收对比分析结果显示模块44发送的程序运行过程中的问题数据;
优化方案推荐模块52用于利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案;
问题数据修复模块53用于利用推荐的优化方案对程序运行过程中的问题数据进行修复处理。
由于传统的CF(协同过滤)算法基于这样一种假设:用户对项目的兴趣偏好是固定不变的,对于同一个项目的评分不会随着时间的改变而改变。而现实中,每个人的喜好并不是一成不变的。随着时间的推移,由于所处环境的变化、自身认识的开阔以及社会形式的影响,每个人的兴趣偏好也会相应的改变。传统的CF算法并没有考虑到用户兴趣随时间变化的情况,在计算相似度时把不同时期的评分数据赋予了相同的权重。通常,用户在不同时期给项目的评分对预测评分的影响程度是不同的。在一定的时间窗口内用户的兴趣是比较稳定的,所以用户最近喜爱的项目最能反映其当前的兴趣。也就是说,时间越近的评分对预测评分的影响程度越大,反之,时间越久远的评分对预测评分的影响程度就越小。
本实施例中,由于随着软件开发技术的不断发展即时间的发展,人们对软件开发过程中出现问题的修复方案会不断的进行优化或改进,即采用更加简便或高效的修复方案对问题数据进行修复,从而使得原本的老的优化方案其评分就会变低,正是基于该原因,本发明在为问题数据推荐优化方案时则采用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法来实现,从而可以基于时间的变化为其推荐最优的优化方案,可以有效地提高修复的效果和速率,更好地满足于软件开发的需求。
具体的,优化方案推荐模块52在利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案时包括以下步骤:
基于数据库中的历史数据建立软件开发过程中的问题与推荐方案的评分矩阵;
通过预先构造的基于时间的指数遗忘函数对评分矩阵进行不同程度的衰减处理,得到基于评分时间衰减的权值评分矩阵;基于时间的指数遗忘函数的公式如下:
;
式中,t表示问题对该优化方案实际的评分时间,Tstart表示问题第一次参与优化方案评分的时间,Tend表示问题最近一次对优化方案评分的时间,eps=0.000001是设置的最小值。
由上式可知,e-1≤f(t)≤1,该指数遗忘函数符合人在遗忘过程中的特点,问题对优化方案的评分越新,t越大,f(t)就越大,评分对推荐结果的影响越大。其对原始的评分矩阵R进行基于时间的衰退处理,得到基于时间衰退的权值评分矩阵R',具体公式为R' ={rij×f(t)|i∈[1, p],j∈[1,q]};
用权值评分矩阵代替原始的评分矩阵进行相似性计算,既提高了近期评分的重要性,又减小了最远评分的重要性,使计算问题相似度的准确性有所提高,可以提高推荐质量,实现基于优化方案随时间变化的推荐效果。
根据权值评分矩阵,利用FCM(模糊C-均值)算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵;
聚类的思想是“物以类聚”,将数据分类,使同一类中的对象之间的相似度很高,而不同类间的对象相似度很小。模糊C-均值(FCM)算法是聚类算法中应用最广泛的一种。FCM算法的基本思想是:同一实体可以以不同的隶属度归属于不同的类别。在一个数据集中的每个数据点都会被分组到具有一定隶属程度的每个集群。首先根据随机选取的C个聚类中心将样本群分成C类,然后根据每个样本与每个聚类中心间的距离,得到那些集合内部性质相同或者相似的模糊子集,而且每个样本与每个聚类中心都会存在一个隶属度,因此,可以形成在不同隶属度下的分类情况。
FCM聚类是通过不断地迭代更新求目标函数的最小值,对目标函数的描述可以用下式来所示:
;
式中, J(H,V)表示各类中样本到聚类中心的加权距离平方和,M表示模糊加权指数,该参数用于控制簇间边界模糊的模糊重叠程度,通常M的取值范围是 [1.25,2.5]。当达到最大的迭代次数或两次迭代的差值接近设定的阈值时,聚类过程将停止。
具体的,利用FCM(模糊C-均值)算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵包括以下步骤:
设置模糊聚类数C和模糊加权指数M的值,并随机生成初始聚类中心;
计算问题隶属于每个问题类别的隶属度矩阵及每个类别的聚类中心;
计算前后两次迭代得到的J(H,V)差值,若差值小于设定的最小值,则停止迭代更新,否则返回至上一步进行执行;
问题聚类完成后,得到问题的最优聚类中心和隶属度矩阵;
其中,隶属度矩阵的计算公式如下:
;
聚类中心的计算公式如下:
;
式中,表示问题uk对第i个聚类中心vi的隶属度,vj表示第j个聚类中心,║║表示范数符号,p表示模糊聚类数C的范围,C∈[2,p],k表示自然数。
在CF系统中,引入FCM算法对问题进行模糊聚类,根据不同的隶属度,问题可以归属于不同的用户类别,在一定程度上有效的提高了数据的密度,减少了数据稀疏,可以计算出较准确的相似度,解决了因相似性计算不准确而导致推荐质量低的问题。并且,通过计算目标问题和最优聚类中心的相似度,可以帮目标问题更快的寻找到相似邻居,在不失准确性的情况下还提高了算法的推荐速度。
利用余弦度相似算法计算目标问题与最优聚类中心的相似度,并选择相似度值靠前的若干聚类组成候选邻居集;
利用改进的混合蛙跳算法在候选邻居集中选取适应度靠前的N个问题组成最近邻居集;
ISFLA求解用户最近邻居集的基本思想为:将候选邻居集作为ISFLA中的青蛙群体,通过分组,对每组进行局部搜索后进行种群内全局信息交换,直到得到最近邻居集。当完成基于用户的模糊聚类后,计算目标用户与每个聚类中心的相似度,选取相似度较高的前L个聚类作为候选邻居集,利用ISFLA在候选邻居集中选取适应度靠前的N个用户组成最近邻居集合。
ISFLA求解最近邻居集的具体过程为:
初始化参数,所要选择的聚类数L、青蛙总数F、子群组数m、每组青蛙数n、青蛙的最大跳跃步长Smax、局部的最大迭代次数B、全局的最大迭代G;
利用青蛙的适应度函数计算每只青蛙的适应度值f(Pk), 按f(Pk)降序的方式为整个蛙群排列,并记录全局适应度最优的青蛙Pg;具体的,青蛙的适应度函数:取用户a与最近邻居集的相似度值为目标函数,具体如下:
;
按分组规则将整个青蛙群分成m组,记录每组中最优的青蛙Pb和最差的青蛙Pw;
按自适应步长更新公式对每组进行局部搜索,若更新后的newPw比Pw好,则newPw=Pw;否则,用Pg代替Pb,按改进的步长公式重新更新Pw,若newPw比Pw好,则newPw=Pw;否则,在可解的空间内随机生成一只新的青蛙代替Pw。不断重复执行上述的更新进化过程,直到达到局部的最大迭代次数。具体的,自适应步长更新公式如下:
;
改进的步长公式如下:
;
式中,S表示步长,rand()∈[0,1]是一个随机数,B表示局部的最大迭代次数,b表示当前的局部迭代次数, f(Pb)和f(Pw)分别表示每组中最优和最差青蛙的适应度值,f(Pg)表示整个种群中最优青蛙的适应度值,g为当前的全局迭代次数,G为全局的最大迭代次数。
每组都完成一遍局部搜索后,把所有组合在一起组成一个新的青蛙群,按新蛙群的f(Pk)递减的顺序排列青蛙,并更新Pg,再次执行局部搜索进化,直到满足设置的收敛条件或达到全局的最大迭代次数。这样,就通过改进的混合蛙跳算法得到了最近邻居集。
根据最近邻居集为目标问题推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理。
本实施例中,与其他流行的群集智能算法相比,SFLA(混合蛙跳算法)的思想简单,在算法实现过程中需要调整的因子数很少,但也存在搜索速度缓慢、局部信息和全局信息交流不全面的缺陷,受到SFLA在各种优化问题中成功应用的启发,本实施例提出一种改进的混合蛙跳算法(Improved Shuffled Frog Leaping Algorithm,简称ISFLA),是对原始SFLA的一种变体。原始的SFLA是通过简单的步长更新公式进行局部搜索进化,将比较差的青蛙向适应度值高的青蛙靠近。而青蛙间是有优劣之分的,为避免算法的盲目搜索,本实施例提出了一种新的蛙跳步长更新规则,加入了搜索加速因子,以增强原始算法的局部搜索和优化性能,自适应步长更新。对搜索加速因子并不使用固定值,而是在一定范围的值之间自适应调整,从而在局部和全局搜索过程中提供自适应更新。即根据种群中青蛙的f(Pk)大小、与Pg或Pb距离的远近、目前的迭代次数等自适应调整更新规则。
综上所述,借助于本发明的上述技术方案,通过设置有应用数据采集模块1、应用数据运行模块2、运行数据分析模块4及应用数据优化模块5,从而不仅可以在应用数据采集模块1和应用数据运行模块2的作用下实现软件开发过程中应用数据的采集及联网测试,而且还可以在运行数据分析模块4及应用数据优化模块5的作用下对软件的各项运行数据进行检测与分析,并能够利用改进型推荐算法为软件运行过程中的问题数据推荐对应的优化方案,从而可以利用该优化方案实现对软件开发过程中问题数据的修复。
此外,通过设置优化方案推荐模块52,从而可以利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案,基于评分时间衰减的权值评分矩阵来根据时间的变化对推荐方案的评分进行自动更新,相比于传统的协同过滤推荐算法,本发明可以有效地解决传统推荐算法中优化方案评分不能随时间变化的问题,从而使得本发明能够根据时间的变化而推荐最优的优化方案,进而可以更好的满足于软件开发的需求。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,该处理系统包括应用数据采集模块(1)、应用数据运行模块(2)、云端服务器(3)、运行数据分析模块(4)及应用数据优化模块(5),所述应用数据采集模块(1)、所述应用数据运行模块(2)、所述云端服务器(3)、所述运行数据分析模块(4)及所述应用数据优化模块(5)依次连接,且所述应用数据优化模块(5)还与所述云端服务器(3)连接;
其中,所述应用数据采集模块(1)用于采集软件开发过程中的应用数据;
所述应用数据运行模块(2)用于根据采集的应用数据运行软件程序;
所述云端服务器(3)用于系统中数据的传输及存储;
所述运行数据分析模块(4)用于对软件程序运行的运行数据进行分析,并将程序运行过程中的问题数据及时发送至应用数据优化模块(5);
所述应用数据优化模块(5)用于利用改进型推荐算法为程序运行过程中的问题数据推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理;
所述应用数据优化模块(5)包括依次连接的程序运行问题数据接收模块(51)、优化方案推荐模块(52)及问题数据修复模块(53);
所述程序运行问题数据接收模块(51)用于接收对比分析结果显示模块(44)发送的程序运行过程中的问题数据;
所述优化方案推荐模块(52)用于利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案;
所述问题数据修复模块(53)用于利用推荐的优化方案对程序运行过程中的问题数据进行修复处理。
2.根据权利要求1所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述应用数据采集模块(1)包括用户注册登陆模块(11)、用户登陆验证模块(12)及应用数据输入模块(13);
其中,所述用户注册登陆模块(11)用于软件用户账号的登陆、注销及注册;
所述用户登陆验证模块(12)用于对软件用户账号的登陆进行验证;
所述应用数据输入模块(13)用于输入软件的运行数据。
3.根据权利要求1所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述应用数据运行模块(2)包括相互连接的应用数据接收模块(21)及程序运行模块(22);
其中,所述应用数据接收模块(21)用于接收输入的运行数据;
所述程序运行模块(22)用于软件程序的运行。
4.根据权利要求1所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述云端服务器(3)包括通讯模块(31)及数据存储模块(32);
其中,所述通讯模块(31)用于系统中各模块之间的数据传输;
所述数据存储模块(32)用于利用分级存储技术对系统中的数据进行存储。
5.根据权利要求4所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述数据存储模块(32)包括依次连接的数据分类模块(321)、数据分级模块(322)、分级存储模块(323)及可视化监控模块(324);
其中,所述数据分类模块(321)用于根据不同数据的类型进行分类处理;
所述数据分级模块(322)用于根据动态数据热度表对分类后的数据进行分级;
所述分级存储模块(323)用于对分级后的数据进行分级存储;
所述可视化监控模块(324)用于定时查询数据库中数据的占用空间及剩余空间。
6.根据权利要求1所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述运行数据分析模块(4)包括运行性能数据获取模块(41)、标准性能数据获取模块(42)、运行数据对比分析模块(43)及对比分析结果显示模块(44);
其中,所述运行性能数据获取模块(41)用于程序运行过程中运行性能数据的获取;
所述标准性能数据获取模块(42)用于获取数据库中预设的程序运行过程中的标准性能数据;
所述运行数据对比分析模块(43)用于将获取的运行性能数据与标准性能数据进行比对分析;
所述对比分析结果显示模块(44)用于显示运行数据的比对分析结果,并将程序运行过程中的问题数据及时发送至应用数据优化模块(5)。
7.根据权利要求1所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述优化方案推荐模块(52)在利用基于模糊聚类和改进混合蛙跳的协同过滤推荐算法为问题数据推荐对应的优化方案时包括以下步骤:
基于数据库中的历史数据建立软件开发过程中的问题与推荐方案的评分矩阵;
通过预先构造的基于时间的指数遗忘函数对评分矩阵进行不同程度的衰减处理,得到基于评分时间衰减的权值评分矩阵;
根据权值评分矩阵,利用FCM算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵;
利用余弦度相似算法计算目标问题与最优聚类中心的相似度,并选择相似度值靠前的若干聚类组成候选邻居集;
利用改进的混合蛙跳算法在候选邻居集中选取适应度靠前的N个问题组成最近邻居集;
根据最近邻居集为目标问题推荐对应的优化方案,并基于该优化方案实现对软件开发过程中的问题数据进行修复处理。
8.根据权利要求7所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述基于时间的指数遗忘函数的公式如下:
;
式中,t表示问题对该优化方案实际的评分时间,Tstart表示问题第一次参与优化方案评分的时间,Tend表示问题最近一次对优化方案评分的时间,eps=0.000001是设置的最小值。
9.根据权利要求7所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述利用FCM算法对问题进行模糊聚类,得到最优聚类中心和隶属度矩阵包括以下步骤:
设置模糊聚类数C和模糊加权指数M的值,并随机生成初始聚类中心;
计算问题隶属于每个问题类别的隶属度矩阵及每个类别的聚类中心;
计算前后两次迭代得到的J(H,V)差值,若差值小于设定的最小值,则停止迭代更新,否则返回至上一步进行执行;
问题聚类完成后,得到问题的最优聚类中心和隶属度矩阵;
其中,隶属度矩阵的计算公式如下:
;
聚类中心的计算公式如下:
;
式中,表示问题uk对第i个聚类中心vi的隶属度,vj表示第j个聚类中心,║║表示范数符号,p表示模糊聚类数C的范围,C∈[2,p],k表示自然数。
10.根据权利要求7所述的一种基于互联网平台用软件开发应用数据的处理系统,其特征在于,所述利用改进的混合蛙跳算法在候选邻居集中选取适应度靠前的N个问题组成最近邻居集包括以下步骤:
将候选邻居集作为改进的混合蛙跳算法中的青蛙群体,通过分组,对每组进行局部搜索后进行种群内全局信息交换,直到得到最近邻居集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310868329.9A CN116595543A (zh) | 2023-07-17 | 2023-07-17 | 一种基于互联网平台用软件开发应用数据的处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310868329.9A CN116595543A (zh) | 2023-07-17 | 2023-07-17 | 一种基于互联网平台用软件开发应用数据的处理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595543A true CN116595543A (zh) | 2023-08-15 |
Family
ID=87608507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310868329.9A Pending CN116595543A (zh) | 2023-07-17 | 2023-07-17 | 一种基于互联网平台用软件开发应用数据的处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117470360A (zh) * | 2023-12-27 | 2024-01-30 | 江苏迈鼎科技(集团)有限公司 | 一种基于引导式的智能化无人值守地磅系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321032A1 (en) * | 2015-04-28 | 2016-11-03 | Qualcomm Incorporated | Determining recommended optimization strategies for software development |
CN111506484A (zh) * | 2020-03-24 | 2020-08-07 | 北京极简智能科技有限公司 | 一种程序性能评估方法、系统及设备 |
US20210004311A1 (en) * | 2019-07-02 | 2021-01-07 | International Business Machines Corporation | Automated feedback-based application optimization |
CN112379913A (zh) * | 2020-11-20 | 2021-02-19 | 上海复深蓝软件股份有限公司 | 基于风险识别的软件优化方法、装置、设备及存储介质 |
CN115618989A (zh) * | 2021-07-15 | 2023-01-17 | 上海汽车集团股份有限公司 | 一种开发进程控制方法、装置、设备、介质 |
CN115952098A (zh) * | 2023-01-05 | 2023-04-11 | 天固信息安全系统(深圳)有限公司 | 一种性能测试调优方案推荐方法及系统 |
-
2023
- 2023-07-17 CN CN202310868329.9A patent/CN116595543A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321032A1 (en) * | 2015-04-28 | 2016-11-03 | Qualcomm Incorporated | Determining recommended optimization strategies for software development |
US20210004311A1 (en) * | 2019-07-02 | 2021-01-07 | International Business Machines Corporation | Automated feedback-based application optimization |
CN111506484A (zh) * | 2020-03-24 | 2020-08-07 | 北京极简智能科技有限公司 | 一种程序性能评估方法、系统及设备 |
CN112379913A (zh) * | 2020-11-20 | 2021-02-19 | 上海复深蓝软件股份有限公司 | 基于风险识别的软件优化方法、装置、设备及存储介质 |
CN115618989A (zh) * | 2021-07-15 | 2023-01-17 | 上海汽车集团股份有限公司 | 一种开发进程控制方法、装置、设备、介质 |
CN115952098A (zh) * | 2023-01-05 | 2023-04-11 | 天固信息安全系统(深圳)有限公司 | 一种性能测试调优方案推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
许智宏等: "基于模糊聚类和改进混合蛙跳的协同过滤推荐", 计算机应用研究, pages 2908 - 2911 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117470360A (zh) * | 2023-12-27 | 2024-01-30 | 江苏迈鼎科技(集团)有限公司 | 一种基于引导式的智能化无人值守地磅系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263230B (zh) | 一种基于密度聚类的数据清洗方法及装置 | |
Wu et al. | Modeling users’ preferences and social links in social networking services: a joint-evolving perspective | |
CN111831905B (zh) | 基于团队科研影响力及可持续性建模的推荐方法和装置 | |
CN102053971A (zh) | 用于面向排序的协同过滤的推荐方法和设备 | |
CN111984873B (zh) | 一种服务推荐系统和方法 | |
CN110737805B (zh) | 图模型数据的处理方法、装置和终端设备 | |
CN104573130A (zh) | 基于群体计算的实体解析方法及装置 | |
CN109543741A (zh) | 一种基于改进人工蜂群的fcm算法优化方法 | |
CN116595543A (zh) | 一种基于互联网平台用软件开发应用数据的处理系统 | |
CN110020141A (zh) | 一种基于改进聚类和Spark框架的个性化推荐方法及系统 | |
CN109543693A (zh) | 基于正则化标签传播的弱标注数据降噪方法 | |
CN109933720A (zh) | 一种基于用户兴趣自适应演化的动态推荐方法 | |
CN110956277A (zh) | 一种交互式的迭代建模系统及方法 | |
CN114556364A (zh) | 基于相似度运算符排序的神经架构搜索 | |
CN115169534A (zh) | 卷积神经网络的样本优化训练方法及计算机可读存储介质 | |
CN111159559A (zh) | 根据用户需求和用户行为构建推荐引擎的方法 | |
Shinde et al. | A new approach for on line recommender system in web usage mining | |
CN116910628B (zh) | 创作者专业度画像评估方法及系统 | |
CN115878877A (zh) | 基于概念漂移的航空服务器访问爬虫的可视检测方法 | |
CN111191108A (zh) | 基于增强学习的软件众包项目推荐方法及系统 | |
CN115470927A (zh) | 一种替代模型自动提取方法、终端及存储介质 | |
Qu et al. | The application of interactive methods under swarm computing and artificial intelligence in image retrieval and personalized analysis | |
CN113033694A (zh) | 一种基于深度学习的数据清洗方法 | |
CN108182513B (zh) | 一种简历评估方法及装置 | |
CN108153829B (zh) | 一种简历评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230815 |