CN114238044A - 开源项目活跃度的计算方法、装置和计算机设备 - Google Patents

开源项目活跃度的计算方法、装置和计算机设备 Download PDF

Info

Publication number
CN114238044A
CN114238044A CN202111368766.1A CN202111368766A CN114238044A CN 114238044 A CN114238044 A CN 114238044A CN 202111368766 A CN202111368766 A CN 202111368766A CN 114238044 A CN114238044 A CN 114238044A
Authority
CN
China
Prior art keywords
target
activity
open source
index
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111368766.1A
Other languages
English (en)
Inventor
田蜜
杨欣捷
江一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202111368766.1A priority Critical patent/CN114238044A/zh
Publication of CN114238044A publication Critical patent/CN114238044A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种开源项目活跃度的计算方法、装置和计算机设备。该方法包括:对目标开源项目在预设周期内的多个评价指标的指标值进行计算,得到目标开源项目在预设周期内的第一活跃度值;根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算目标开源项目的衰减权重;根据第一活跃度值以及衰减权重得到目标开源项目在预设周期内的第二活跃度值。本发明实施例通过获取能够全面体现活跃度的多种评价指标的指标值,可以全面、完整地计算该开源软件项目的初始活跃度,以及通过根据衰减权重与第一活跃度计算的第二活跃度值,是符合时间阶段性变化的活跃度,保证了计算活跃度的准确性。

Description

开源项目活跃度的计算方法、装置和计算机设备
技术领域
本申请涉及数据处理技术领域,特别是涉及一种开源项目活跃度的计算方法、装置和计算机设备。
背景技术
近年来,随着计算机及互联网技术的发展,开源软件已经成功应用于商业、金融、医疗、电子政务、制造、零售、通讯、交通等各种关乎国计民生的重要行业。加之金融行业开源生态的日益成熟以及数字化生态银行转型的需求,越来越多的应用系统构建在了开源软件之上,因此,我们需要对各个开源软件项目的活跃度进行评价。
相关技术中,是通过开发者在一段周期内提交代码(commit)的角度去考虑项目的活跃度。但是,在实际应用场景中,由于开源软件项目的活跃度在一定周期内是阶段性变化的,且项目的活跃度也并不仅仅体现在提交代码指标上。因此,相关技术中仅根据提交代码的数量进行计算,得到的活跃度的评价分数并不能准确表示该开源软件项目的活跃度。
发明内容
基于此,有必要针对上述技术问题,提供能够准确计算活跃度的评价分数的一种开源项目活跃度的计算方法、装置和计算机设备。
第一方面,本申请提供了一种开源项目活跃度的计算方法。所述方法包括:
获取目标开源项目在预设周期内多个评价指标的指标值;
根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
在其中一个实施例中,所述根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值,包括:
根据预设的权重配置规则,确定各所述评价指标的权重;
根据所述评价指标的指标值以及所述评价指标的权重进行加权计算,得到所述目标开源项目在预设周期内的第一活跃度值。
在其中一个实施例中,在所述根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重的步骤之前,所述方法还包括:
根据预设的类型与衰减常数的对应关系,确定所述目标开源项目的类型对应的目标衰减常数。
在其中一个实施例中,所述方法还包括:
分别获取所述目标开源项目在连续的多个预设周期内的第二活跃度值;
根据多个第二活跃度值,计算目标时长内所述目标开源项目的目标活跃度值,所述目标时长包括连续的多个预设周期。
在其中一个实施例中,所述方法还包括:
获取多个目标时长内的所述目标开源项目的目标活跃度值,所述多个目标时长是连续的;
根据各所述目标活跃度值,计算所述目标开源项目的总活跃度值。
在其中一个实施例中,所述方法还包括:
通过下述公式计算所述目标开源项目在预设周期内的第二活跃度值Aut
Figure BDA0003361530970000021
其中,ce-kt是衰减权重,c是预设常量,e是预设自然对数,k为目标衰减常数,t是预设周期对应的参数值,Cissue_comment为问题评论指标的指标值、Copen_issue为问题指标的指标值、Copen_pr为拉取请求指标的指标值、Crevirew_comment为评审评论指标的指标值、Cpr_merged为拉取请求合并指标的指标值、Ccommit为暂存提交指标的指标值,a、b、d、f、h、g分别为各所述评价指标对应的权重。
第二方面,本申请还提供了一种开源项目活跃度的计算装置。所述装置包括:
获取模块,用于获取目标开源项目在预设周期内多个评价指标的指标值;
第一计算模块,用于根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
第二计算模块,用于根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
加权计算模块,用于根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
在其中一个实施例中,所述第一计算模块具体用于:根据预设的权重配置规则,确定各所述评价指标的权重;根据所述评价指标的指标值以及所述评价指标的权重进行加权计算,得到所述目标开源项目在预设周期内的第一活跃度值。
在其中一个实施例中,所述装置还包括:
确定模块,用于根据预设的类型与衰减常数的对应关系,确定所述目标开源项目的类型对应的目标衰减常数。
在其中一个实施例中,所述装置还包括:
活跃度获取模块,用于分别获取所述目标开源项目在连续的多个预设周期内的第二活跃度值;
第三计算模块,用于根据多个第二活跃度值,计算目标时长内所述目标开源项目的目标活跃度值,所述目标时长包括连续的多个预设周期。
在其中一个实施例中,所述装置还包括:
总活跃度计算模块,用于获取多个目标时长内的所述目标开源项目的目标活跃度值,所述多个目标时长是连续的;
第四计算模块,用于根据各所述目标活跃度值,计算所述目标开源项目的总活跃度值。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标开源项目在预设周期内多个评价指标的指标值;
根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标开源项目在预设周期内多个评价指标的指标值;
根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标开源项目在预设周期内多个评价指标的指标值;
根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
上述开源项目活跃度的计算方法、装置、计算机设备、存储介质和计算机程序产品,其中,所述方法包括:对目标开源项目在预设周期内的多个评价指标的指标值进行计算,得到目标开源项目在预设周期内的第一活跃度值;根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算目标开源项目的衰减权重;根据第一活跃度值以及衰减权重得到目标开源项目在预设周期内的第二活跃度值。本发明实施例通过获取能够全面体现活跃度的多种评价指标的指标值,可以全面、完整地计算该开源软件项目的初始活跃度,以及通过根据衰减权重与第一活跃度计算第二活跃度值,是符合时间阶段性变化的活跃度,保证了计算活跃度的准确性。
附图说明
图1为一个实施例中开源项目活跃度的计算方法的流程示意图;
图2为一个实施例中第一活跃度值计算步骤的流程示意图;
图3为一个实施例中目标活跃度值计算步骤的流程示意图;
图4为一个实施例中总活跃度值计算步骤的流程示意图;
图5为一个实施例中镜像类项目的活跃度评价指标的具体指标值的示意图;
图6为一个实施例中非镜像类项目的活跃度评价指标的具体指标值的示意图;
图7为一个实施例中镜像类以及非镜像类项目行为指标的汇总示意图;
图8为一个实施例中镜像类、非镜像类项目的Xlab和Spdb模型活跃度对比的示意图;
图9为一个实施例中各个开源软件项目的活跃度变化趋势在一段周期(一年)内的变化示意图;
图10为一个实施例中单个开源软件项目的活跃度周期内变化规律的示意图;
图11为一个实施例中通过不同计算方法计算的活跃度的计算结果的示意图;
图12为一个实施例中开源项目活跃度的计算装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
开源软件项目的活跃度在一段周期内是变化状态的,变化的原因是一个开源软件项目活跃与否和该开源软件项目的开发者行为有着直接的关系。开发者在开源软件项目的社区中产生的行为直接体现在其活跃度上。在实际应用场景之后,项目开发者在任何时间节点上都可能在该开源软件项目的社区之后产生一些行为,所以一个开源软件项目的活跃度在每个时刻均不一致,因此,认为开源软件项目的活跃度在一段周期内是变化状态的。因此,本发明实施例所提供的活跃度的计算方法可以从一段周期内计算该开源软件项目的活跃度,保证计算的活跃度的准确性。
在一个实施例中,如图1所示,提供了一种开源项目活跃度的计算方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现,上述终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该开源项目活跃度的计算方法包括以下步骤:
步骤102,获取目标开源项目在预设周期内多个评价指标的指标值。
具体地,目标开源项目可以是符合用户计算策略的开源软件项目,可以是用户正在使用的任意一个开源软件项目,例如可以是torvalds/linux开源软件项目、git/git开源软件项目、reactphp/reactphp开源软件项目、d3/d3开源软件项目等等。预设周期可以是以月份划分的,例如一个月可以是一个预设周期。多个评价指标可以包括问题评论指标(comment)、问题指标(issue)、拉取请求指标(pull request,pr)、评审评论指标(reviewcomment)、拉取请求合并指标(pr merged)、暂存提交指标(commit)中的多种指标,问题评论指标对应的指标值是问题评论的数量。
可选地,针对于目标开源软项目,终端获取该目标开源软件项目对应的多个评价指标的指标值。
步骤104,根据各评价指标的指标值,计算目标开源项目在预设周期内的第一活跃度值。
具体地,终端可以对该目标开源项目在预设周期内,各个评价指标的指标值进行求和计算,得到各个评价指标的指标值的和。终端可以将计算的各个指标值的和作为该目标开源项目在预设周期内的第一活跃度值。
可选地,终端还可以预先配置各个评价指标对应的权重,对各评价指标对应的指标值以及该评价指标的权重进行加权计算,得到该目标开源项目在预设周期内的第一活跃度值。
步骤106,根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算目标开源项目的衰减权重。
具体地,预设的衰减函数可以包括指数衰减函数、分段衰减函数、多项式衰减函数和余弦衰减函数,优选的可以是指数衰减函数。目标衰减常数可以是根据多个开源软件项目的时间维度上的衰减程度确定的,例如可以是0.05。目标衰减常数还可以根据多个开源软件项目的时间维度上的衰减程度以及该开源软件项目的类型确定的。由于各个开源软件项目的生命周期是以年作为时间单位,因此,终端可以根据各开源软件项目的生命周期的时间单位确定预设周期的时间单位是月份。那么,预设周期对应的参数值t所表征的意思可以是:距离当前时刻所在位置的时间单位的数量。例如,当预设周期的时间单位是月份的情况下,预设周期对应的参数值t是,距离当前时刻所在月份之间的月份数量。例如,预设周期所在月份可以是六月份,当前时刻所在月份可以是十一月份,那么预设周期对应的参数值可以是4,即终端需要计算距离当前时刻4个月内的预设周期内的活跃度,t=4。
可选地,终端对目标衰减常数以及该预设周期对应的月份参数值进行计算,将计算结果的相反数作为预先配置的指数衰减函数的指数部分,得到目标开源项目的衰减权重。
步骤108,根据目标开源项目在预设周期内的第一活跃度值以及衰减权重进行加权计算,得到目标开源项目在预设周期内的第二活跃度值。
具体地,针对预设周期,终端对计算得到的第一活跃度值以及计算得到的衰减权重进行加权计算,将得到的加权求和结果作为目标开源项目在预设周期内的第二活跃度值。
例如,目标开源项目在预设周期内的第一活跃度值可以是d1,计算得到的衰减权重可以是ce-kt,那么终端计算得到的第二活跃度值可以是d1*ce-kt
其中,c可以是任意一个常数,可以是1。
上述开源项目活跃度的计算方法中,对目标开源项目在预设周期内的多个评价指标的指标值进行计算,得到目标开源项目在预设周期内的第一活跃度值;根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算得到目标开源项目的衰减权重;根据第一活跃度值以及衰减权重得到目标开源项目在预设周期内的第二活跃度值。本发明实施例通过获取能够全面体现活跃度的多种评价指标的指标值,可以全面、完整地计算该开源软件项目的初始活跃度,以及通过根据衰减权重与第一活跃度计算得到的第二活跃度值,是符合时间阶段性变化的活跃度,保证了计算活跃度的准确性。
在一个实施例中,如图2所示,步骤104“根据各评价指标的指标值,计算目标开源项目在预设周期内的第一活跃度值”的具体处理过程,包括:
步骤202,根据预设的权重配置规则,确定各评价指标的权重。
具体地,预设的权重配置规则可以是通过权重确定算法生成的规则,该权重确定算法可以包括专家调查法、层次分析法、二项系数法、主成分分析法以及熵值法等等方法。预设的权重配置规则也可以是响应于用户针对该终端设备的权重数值的输入操作确定的。例如,用户可以预先配置各个评价指标的权重并输入至终端中。终端响应于用户的输入操作,获取该输入操作中的权重配置规则,并根据该权重配置规则确定各评价指标的权重。
可选地,终端确定的各个评价指标可以包括问题评论指标(comment)、问题指标(issue)、拉取请求指标(pull request,pr)、评审评论指标(review comment)、拉取请求合并指标(pr merged)、暂存提交指标(commit)。这样,终端根据预设的权重配置规则,可以确定问题评论指标的权重是1,问题指标的权重是2,拉取请求指标的权重是3,评审评论指标的权重是4,拉取请求合并指标的权重是5,暂存提交指标的权重是1。
可选地,GitHub是软件项目托管平台,可以在GitHub上存储有软件项目的关于开发、迭代、维护等数据信息。第一开源软件项目与是托管关系,该第一开源软件项目托管到该软件项目托管平台上,但是,该第一开源软件项目的问题指标、拉取请求指标是在该开源软件项目的原始数据仓库内进行维护的,也就是说,软件项目托管平台无法获取到第一开源软件项目的问题指标以及拉取请求指标的具体指标值,这样的第一开源软件项目可以称之为镜像类项目。由于镜像类项目的提交代码指标的指标数据从开源软件项目的原始数据仓库同步至软件项目托管平台,因此,终端可以获取到提交代码指标的指标值。也就是说,在计算开源软件项目的活跃度时,面向所有种类的开源软件项目(镜像类和非镜像类),选取软件项目托管平台均能获取到具体指标值的指标作为评价指标。
步骤204,根据各评价指标的指标值以及各评价指标的权重进行加权计算,得到目标开源项目在预设周期内的第一活跃度值。
具体地,终端根据各个评价指标在预设周期内的指标值以及各个评价指标对应的权重,进行加权计算。终端可以将进行加权计算后得到的计算结果作为该目标开源项目在预设周期内的第一活跃度值。
例如,距离当前时刻所在月份可以是四个月,那么,预设周期对应的参数值是4。那么终端可以获取该目标开源项目在距离当前时刻四个月内各个评价指标的指标值。终端获取的各个评价指标可以包括问题评论指标、问题指标、拉取请求指标以及评审评论指标;终端可以确定问题评论指标的指标值可以是a1,对应的权重可以b1;问题指标的指标值可以是a2,对应的权重可以b2;拉取请求指标的指标值可以是a3,对应的权重可以b3;评审评论指标的指标值可以是a4,对应的权重可以b4。那么,终端对上述评价指标的指标值以及各评价指标对应的权重进行加权计算,得到的结果是该目标开源项目在距离当前时刻四个月的第一活跃度值。该第一活跃度的具体值可以是a1b1+a2b2+a3b3+a4b4。
在一个实施例中,在步骤106“根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算目标开源项目的衰减权重”之前,该开源项目活跃度的计算方法还包括:
根据预设的类型与衰减常数的对应关系,确定目标开源项目的类型对应的目标衰减常数。
具体地,目标开源项目的类型可以包含镜像类开源软件项目以及非镜像类开源软件项目。预设的类型与衰减常数的对应关系可以是用户预先配置的,例如镜像类开源软件项目以及非镜像类开源软件项目的目标衰减常数可以相同,均为0.05;镜像类开源软件项目以及非镜像类开源软件项目的目标衰减常数也可以不相同,镜像类开源软件项目可以是0.04,非镜像类开源软件项目的目标衰减常数可以是0.05。
可选地,镜像类开源软件项目是从开源软件项目的数据仓库直接同步至软件项目托管平台(GitHub),具备以下特点,①拉取请求指标(pull request,pr)和问题指标(issue)的指标值较低;②拉取请求指标(pull request,pr)、问题指标(issue)和评论指标(comment)贡献者在总贡献者中占比较低;③提交代码指标(commit)贡献者在总贡献者中占比较大;④提交代码(commit)贡献者进行了多次的代码提交。非镜像类开源软件项目是指项目是直接托管到GitHub上的项目,这类项目披露的数据完备,也就是终端可以获取到的各个指标的指标值较为完整以及全面。非镜像类开源软件项目例如可以是reactphp/reactphp、d3/d3等等。
在一个实施例中,如图3所示,该开源项目活跃度的计算方法还包括:
步骤302,分别获取目标开源项目在连续的多个预设周期内的第二活跃度值。
具体地,预设周期可以是是月份形式,一个预设周期可以是一个月份,例如是一月份。连续的多个预设周期是多个相邻的预设周期,例如,可以是三个相邻的预设周期,例如,距离当前时刻所在月份一个月的时间段、距离当前时刻所在月份两个月的时间段以及距离当前时刻所在月份三个月的时间段。当前时刻所在月份为十一月份,那么三个相邻的预设周期可以是七月份、八月份以及九月份。
终端通过上述实施例的方法,计算该目标开源项目在距离当前时刻所在月份一个月的时间段的第二活跃度值。终端可以通过类似的过程计算距离当前时刻所在月份两个月的时间段份的第二活跃度值以及距离当前时刻所在月份三个月的时间段的第二活跃度值。
可选地,终端获取各评价指标在各预设周期内的指标值以及各评价指标的权重,进行计算后得到该目标开源项目在各个预设周期内的第二活跃度值。
步骤304,根据多个第二活跃度值,计算目标时长内目标开源项目的目标活跃度值,目标时长包括连续的多个预设周期。
具体地,终端可以将连续的多个预设周期作为一个预设的目标时长,即预设的目标时长包括连续的多个预设周期。预设的目标时长例如可以是三个预设周期,终端获取到的在距离当前时刻所在月份一个月的时间段的第二活跃度值、当前时刻所在月份两个月的时间段份的第二活跃度值以及距离当前时刻所在月份三个月的时间段的第二活跃度值,对上述多个第二活跃度值进行求和计算,得到该目标开源项目在预设的目标时长内的目标活跃度值。
本实施例通过分别计算连续的多个预设周期内的第二活跃度,并进行去和计算,得到的目标活跃度值较为准确的体现了活跃度的时间阶段性变化。
在一个实施例中,如图4所示,该开源项目活跃度的计算方法还包括:
步骤402,获取连续多个目标时长内的目标开源项目的目标活跃度值。
具体地,终端可以获取多个连续的目标时长内的该目标开源项目的目标活跃度值。例如终端可以获取第一目标时长内的该目标开源项目的目标活跃度值以及第二目标时长内的该目标开源项目的目标活跃度值,第一目标时长与第二目标时长相邻。第一目标时长可以包含七月份、八月份以及九月份,那么第二目标时长可以包含四月份、五月份以及六月份。
步骤404,根据各目标活跃度值,计算目标开源项目的总活跃度值。
具体地,终端可以对各目标活跃度值进行求和计算以及开方计算,将得到的计算结果作为该目标开源项目的总活跃度值。终端也可以直接对各目标活跃度值进行均值计算,将计算的均值作为该目标开源项目的总活跃度值。
本实施例中,通过对多个连续的目标时长对应的目标活跃度值进行求和计算以及开方计算后得到的目标开源项目的总活跃度值,综合考虑了开源软件项目的不同类别的差异性以及时间阶段性变化的特点,可以准确地反映阶段性活跃项目的整体活跃度,完善了开源软件项目活跃度评分算法,提高了活跃度计算的效率以及精度。
在一个实施例中,该开源项目活跃度的计算方法还包括:
通过下述公式计算目标开源项目在预设周期内的第二活跃度值Aut
Figure BDA0003361530970000121
其中,ce-kt是衰减权重,c是预设常量,e是预设自然对数,k为目标衰减常数,t是预设周期对应的参数值;Cissue_comment为问题评论指标的指标值、Copen_issue为问题指标的指标值、Copen_pr为拉取请求指标的指标值、Crevirew_comment为评审评论指标的指标值、Cpr_merged为拉取请求合并指标的指标值、Ccommit为暂存提交指标的指标值,a、b、d、f、h、g分别为各评价指标对应的权重。
在一个实施例中,问题评论指标对应的权重小于问题指标对应的权重,问题指标对应的权重小于拉取请求指标对应的权重,拉取请求指标对应的权重小于评审评论指标对应的权重,评审评论指标对应的权重小于拉取请求合并指标对应的权重,拉取请求合并指标对应的权重小于暂存提交指标中的多种指标。
以下结合一个实施例,详细描述本发明所提供的开源项目活跃度的计算方法的具体步骤:本发明提供的开源软件项目评分算法,利用开源社区(软件托管平台)与各个开源软件相关的数据,从开源软件的项目类别和阶段性特征角度出发,分析开源软件项目活跃度的变化情况。终端可以通过以下步骤计算目标开源软件项目在一段时间内的总活跃度值。
终端可以获取目标开源软件项目在预设周期内的多个评价指标的指标值以及各评价指标的权重。终端当前需要计算的可以是在t月份(距离当前时刻所在周期的第t个预设周期)内的活跃度值,即目标开源项目在预设周期内的第二活跃度值,目标开源项目在预设周期内的第二活跃度值也就是该软件项目的活跃度贡献者在t月的活跃度评分Aut,可以通过以下公式进行计算:
Aut=ce-kt(Cissue_comment+2Copen_issue+3Copen_pr+4Crevirew_comment+5Cpr_merged+Ccommit)
其中,ce-kt是衰减权重,c是预设常量,可以是1,e是预设自然对数,k为目标衰减常数,t是预设周期对应的参数值,Cissue_comment为问题评论指标的指标值、Copen_issue为问题指标的指标值、Copen_pr为拉取请求指标的指标值、Crevirew_comment为评审评论指标的指标值、Cpr_merged为拉取请求合并指标的指标值、Ccommit为暂存提交指标的指标值,问题评论指标的权重可以是1,问题指标的权重可以是2、拉取请求指标的权重可以是3、评审评论指标的权重可以是4、拉取请求合并指标的权重可以是5、暂存提交指标的权重可以是1。
其中,终端可以将指数衰减函数作为本实施例中的衰减函数,并根据该目标开源软件项目的类型确定目标衰减常数。终端可以将预设周期对应的参数值以及目标衰减常数进行乘积运算,并将得到的计算结果的相反数作为上述指数衰减函数的指数部分,得到目标衰减函数。终端可以根据目标衰减函数与预设常数进行计算,得到衰减权重,即ce-kt
由于一段时期内,目标开源软件项目的活跃度会随着时间的迁移进行变化,因此,活跃度值与时间相关。终端可以确定距离当前时刻越近的周期,该周期内的活跃行为的权重应该相应增高。预设常量c可以是1,是因为全权重就是1,随着时间往后推移权重逐渐变小,直到无限趋于0。目标衰减常数k为0.05,通过计算,终端可以确定目标衰减常数为0.05,且t为60时,权重介于0.05~0.01之间。
可选地,镜像类的开源软件项目与非镜像类的开源软件项目的衰减常数和初始权重可以相同。
这样,终端可以通过下述公式计算目标开源软件项目在多个连续的预设周期(目标时长)内的目标活跃度值Au(即多个连续的预设周期内的贡献者总的活跃度评分):
Au=∑Aut
这样,终端可以通过下述公式计算目标开源软件项目在多个目标时长内的总活跃度值Ar(即开源软件项目活跃度评分):
Figure BDA0003361530970000131
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
以下,详细描述本发明实施例所提供的活跃度的计算方法的构建过程,由于开源软件项目的活跃度取决于开源软件项目的社区的贡献者(即开发人员),由于开源软件项目的活跃度与项目的类别、项目阶段性特征对均具备关联关系。因此终端可以根据贡献者的活跃行为,也就是该项目的社区内存储的各个指标作为开源软件项目的活跃度的评价指标。上述评价指标可以包括拉取请求(pull request,pr)、问题(issue)、评论(comment)和提交代码(commit)等等。本发明实施例所提供的活跃度的计算方法,结合了“镜相类项目”和“时间衰减”因素计算开源软件项目的活跃度。以下针对这两个因素进行具体分析。
由于镜像类项目的特点是仅将少量的拉取请求(pull request,pr)、少量的问题(issue)的数据从该软件项目的个人数据仓库同步至GitHub,而非镜像类项目是指项目是直接托管到GitHub上的项目,这类项目披露的数据比较完整,因此本发明实施例所提供的方法选取的活跃度评价指标可以包括拉取请求(pull request,pr)、问题(issue)、评论(comment)、评审评论(review comment)、和提交代码(commit)等等。
如图5所示,是镜像类项目的活跃度评价指标的具体指标值的示意图,镜像类项目包括项目1、项目2、…、项目10。如图6所示,是非镜像类项目的活跃度评价指标的具体指标值的示意图,非镜像类项目包括项目11、项目12、…、项目20。如图7所示,是镜像类以及非镜像类项目行为指标的汇总示意图,包括镜像类项目1、项目2、…、项目10,以及非镜像类项目11、项目12、…、项目20;针对于各项评价指标,可以将镜像类项目和非镜像类项目一一对比,由于样本数据中的镜像类项目产生活跃度的贡献者数量基本上比非镜像类项目多,且进行的贡献行为次数也基本上比非镜像类项目多,因此可以确定镜像类项目活跃度并不低。
这样,可以将一个镜像类和一个非镜像类组成为一个组,共10组。每组项目可以分别通过现有的Xlab模型和现有的spdb模型计算活跃度,得到的镜像类和非镜像类活跃度大小关系完全相反,汇总的活跃度如图8所示,图8包括项目1、项目2、…、项目20。在对于镜相类项目的活跃度评估中,spdb模型考虑了提交代码(commit)因素,显然更能准确反映镜像类项目的活跃度。由于该spdb模型在计算活跃度时,考虑的指标并不全面,因此该模型计算的活跃度并不准确。
另一方面,终端需要考虑开源软件项目在一段周期内的阶段性活跃度,需要对该开源软件项目在一段周期内的活跃度变化趋势进行分析。如图9所示,是项目21、项目22、…、项目50的开源软件项目在一段周期内的活跃度变化趋势示意图,即是对样本开源软件项目在2019年3月至2020年3月这一年,每个月份的GitHub日志进行统计,分析各个开源软件项目的活跃度变化趋势,各个项目的活跃度变化趋势各不同,有的呈现波动趋势;有的比较平稳。
具体地,如图10所示,是单个开源软件项目的活跃度周期内变化规律的示意图,例如是可以对996icu/996.ICU开源软件项目(即项目21)和mrdoob/three.js(即项目48)开源软件项目的开发者活跃度进行具体分析,2019年3月至2020年3月期间996icu/996.ICU开发者人数为1263人,mrdoob/three.js开发者人数为1690人,具体分布见图10,显然996icu/996.ICU这一年来仅在2019年3月和4月开发者较多(488、627人)、贡献较大,而mrdoob/three.js开发者较为平稳地活跃。
如下表1所示,是996icu/996.ICU开源软件项目和mrdoob/three.js开源软件项目的活跃度变化汇总的示意表,可以对上述两个开源软件项目在2019年3月至2020年3月期间,每一个月的项目活跃度变化进行分析,如表1所示,容易看出,996icu/996.ICU在2019年3月、4月活跃度很高,5月之后出现明显降低趋势,而mrdoob/three.js呈现持续平稳态势。
表1
Figure BDA0003361530970000151
Figure BDA0003361530970000161
如下表2所示,是上述两个开源软件项目在2019年3月至2020年3月期间总的活跃度,可以发现,996icu/996.ICU活跃度比mrdoob/three.js高。同时我们利用spdb模型计算两者的活跃度,结果为:996icu/996.ICU(314.800000)、mrdoob/three.js(2056.500000),996icu/996.ICU活跃度比mrdoob/three.js低。究其原因,Xlab活跃度模型未考虑时间因素对活跃度的影响,使得活跃度趋势波动较大的项目的整体活跃度有异,也就是通过Xlab活跃度模型计算的活跃度并不准确。
表2
996icu/996.ICU mrdoob/three.js
总活跃度 3285.376397 3062.640067
随着金融行业开源生态的日益成熟,加上数字化生态银行转型的需求,越来越多的应用系统构建在了开源软件之上,为此本发明提供的活跃度的计算方法,可以自主、高效、安全地为使用开源软件提供技术上和制度上的支持,提升管理效能,本发明提供的开源软件项目的活跃度的计算方法可以应用于开源软件管理平台,该平台覆盖了开源软件治理四个主要的流程,引入评估、使用、安全漏洞持续评估和生命周期持续评估,做到软件使用有迹可循,实现介质来源可控,防范开源软件带来的安全问题。
现以上述开源治理平台为例,选取了平台引入的开源软件项目,以本发明提供的开源软件项目的活跃度的计算方法对引入的开源软件项目进行活跃度的计算。以一个平稳类和一个波动类为一个组,一个镜像类和一个非镜像类为一个组,每组项目分别利用Xlab活跃度模型、现有的spdb活跃度模型和本发明提供的开源软件项目的活跃度的计算方法计算活跃度,计算结果如图11所示,包含项目A、项目a、项目B、项目b以及项目1至项目20的活跃度计算结果。Xlab模型与本发明提供的开源软件项目的活跃度的计算方法基本完全相反,现有的spdb模型与本发明提供的开源软件项目的活跃度的计算方法计算出的每组活跃度大小关系基本趋同。也就是说,本发明提供的开源软件项目的活跃度的计算方法在一定程度上抹平了活跃度趋势波动较大项目的整体活跃度,同时也提高了镜像类项目的活跃度。本发明提供的开源软件项目的活跃度的计算方法即为修正后的spdb活跃度模型。
对通过Xlab活跃度模型、现有的spdb活跃度模型与本发明提供的开源软件项目的活跃度的计算方法得到的计算结果进行相关性分析,结果如下表3所示。第一,修正后的活跃度模型与Xlab活跃度模型不相关,与现有的spdb活跃度模型相关。说明修正后的活跃度模型与浦发活跃度模型结果趋同,只是现有的spdb活跃度模型未考虑拉取请求(pullrequest,pr)、问题(issue)和评论(comment)等能产生活跃度的因素。第二,Xlab活跃度模型与现有的spdb活跃度模型不相关,与修正后的活跃度模型也不相关。进一步剔除镜像类项目后,结果如表4所示。Xlab活跃度模型与现有的spdb活跃度模型相关,与修正后的活跃度模型也相关。说明虽然Xlab活跃度模型考虑的影响因素很全面,但仍在镜像类项目活跃度的计算上存在偏差。同时结合平稳类和波动类项目来看,Xlab模型又未考虑时间因素,修正后的活跃度模型考虑了时间权重因素。综上,修正后的活跃度模型同时具备了Xlab活跃度模型与现有的spdb活跃度模型的优势,从更全面的角度去反映项目活跃度。
表3
Figure BDA0003361530970000171
Figure BDA0003361530970000181
表4
Figure BDA0003361530970000182
本发明实施例提供的开源软件项目的活跃度的计算方法考虑开源社区披露的贡献者行为指标外,还将开源项目的类别和开源项目阶段性活跃度变化特征考虑其中,对项目的活跃度评分进行了探索。结合镜像类项目特点,时间权重因素,将pull拉取请求(pullrequest,pr)、问题(issue)、评论(comment)和提交代码(commit)等参数和衰减函数融合,形成修正后算法,该算法能更好地反映项目活跃度。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的开源项目活跃度的计算方法的开源项目活跃度的计算装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个开源项目活跃度的计算装置实施例中的具体限定可以参见上文中对于开源项目活跃度的计算方法的限定,在此不再赘述。
在一个实施例中,如图12所示,提供了一种开源项目活跃度的计算装置1200,包括:获取模块1201、第一计算模块1202、第二计算模块1203和加权计算模块1204,其中:
获取模块1201,用于获取目标开源项目在预设周期内多个评价指标的指标值;
第一计算模块1202,用于根据各评价指标的指标值,计算目标开源项目在预设周期内的第一活跃度值;
第二计算模块1203,用于根据预设的衰减函数、目标衰减常数以及预设周期对应的参数值,计算目标开源项目的衰减权重;
加权计算模块1204,用于根据目标开源项目在预设周期内的第一活跃度值以及衰减权重进行加权计算,得到目标开源项目在预设周期内的第二活跃度值。
在其中一个实施例中,第一计算模块具体用于:根据预设的权重配置规则,确定各评价指标的权重;根据评价指标的指标值以及评价指标的权重进行加权计算,得到目标开源项目在预设周期内的第一活跃度值。
在其中一个实施例中,装置还包括:
确定模块,用于根据预设的类型与衰减常数的对应关系,确定目标开源项目的类型对应的目标衰减常数。
在其中一个实施例中,装置还包括:
活跃度获取模块,用于分别获取目标开源项目在连续的多个预设周期内的第二活跃度值;
第三计算模块,用于根据多个第二活跃度值,计算目标时长内目标开源项目的目标活跃度值,目标时长包括连续的多个预设周期。
在其中一个实施例中,装置还包括:
总活跃度计算模块,用于获取多个目标时长内的目标开源项目的目标活跃度值,多个目标时长是连续的;
第四计算模块,用于根据各目标活跃度值,计算目标开源项目的总活跃度值。
上述开源项目活跃度的计算装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储活跃度计算的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种开源项目活跃度的计算方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种开源项目活跃度的计算方法,其特征在于,所述方法包括:
获取目标开源项目在预设周期内多个评价指标的指标值;
根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值,包括:
根据预设的权重配置规则,确定各所述评价指标的权重;
根据各所述评价指标的指标值以及各所述评价指标的权重进行加权计算,得到所述目标开源项目在预设周期内的第一活跃度值。
3.根据权利要求1所述的方法,其特征在于,在所述根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重的步骤之前,所述方法还包括:
根据预设的类型与衰减常数的对应关系,确定所述目标开源项目的类型对应的目标衰减常数。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
分别获取所述目标开源项目在连续的多个预设周期内的第二活跃度值;
根据多个第二活跃度值,计算目标时长内所述目标开源项目的目标活跃度值,所述目标时长包括连续的多个预设周期。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取多个目标时长内的所述目标开源项目的目标活跃度值,所述多个目标时长是连续的;
根据各所述目标活跃度值,计算所述目标开源项目的总活跃度值。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过下述公式计算所述目标开源项目在预设周期内的第二活跃度值Aut
Figure FDA0003361530960000021
其中,ce-kt是衰减权重,c是预设常量,e是预设自然对数,k为目标衰减常数,t是预设周期对应的参数值,Cissue_comment为问题评论指标的指标值、Copen_issue为问题指标的指标值、Copen_pr为拉取请求指标的指标值、Crevirew_comment为评审评论指标的指标值、Cpr_merged为拉取请求合并指标的指标值、Ccommit为暂存提交指标的指标值,a、b、d、f、h、g分别为各所述评价指标对应的权重。
7.一种开源项目活跃度的计算装置,其特征在于,所述装置包括:
获取模块,用于获取目标开源项目在预设周期内多个评价指标的指标值;
第一计算模块,用于根据各所述评价指标的指标值,确定所述目标开源项目在预设周期内的第一活跃度值;
第二计算模块,用于根据预设的衰减函数、目标衰减常数以及所述预设周期对应的参数值,计算所述目标开源项目的衰减权重;
加权计算模块,用于根据所述目标开源项目在预设周期内的第一活跃度值以及所述衰减权重进行加权计算,得到所述目标开源项目在预设周期内的第二活跃度值。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202111368766.1A 2021-11-18 2021-11-18 开源项目活跃度的计算方法、装置和计算机设备 Pending CN114238044A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111368766.1A CN114238044A (zh) 2021-11-18 2021-11-18 开源项目活跃度的计算方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111368766.1A CN114238044A (zh) 2021-11-18 2021-11-18 开源项目活跃度的计算方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN114238044A true CN114238044A (zh) 2022-03-25

Family

ID=80749950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111368766.1A Pending CN114238044A (zh) 2021-11-18 2021-11-18 开源项目活跃度的计算方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN114238044A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116305137A (zh) * 2023-01-12 2023-06-23 四川大学 一种面向开源项目的安全性自动化评估方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116305137A (zh) * 2023-01-12 2023-06-23 四川大学 一种面向开源项目的安全性自动化评估方法及装置
CN116305137B (zh) * 2023-01-12 2023-10-13 四川大学 一种面向开源项目的安全性自动化评估方法及装置

Similar Documents

Publication Publication Date Title
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
US8131571B2 (en) Method and system for evaluating insurance liabilities using stochastic modeling and sampling techniques
US20140337275A1 (en) Method and system for scaling panels
CN110363580B (zh) 信息推荐方法、装置、计算机设备及存储介质
US10885443B2 (en) Generating a prediction function using a genetic algorithm and a reduced number of factors
CN105677645B (zh) 一种数据表比对方法和装置
CN115564152A (zh) 基于stirpat模型的碳排放量预测方法及装置
US20120185326A1 (en) Contact stream optimization using fec and cc constraints
CN114238044A (zh) 开源项目活跃度的计算方法、装置和计算机设备
Barletta et al. Orthogonal expansions for VIX options under affine jump diffusions
Ballotta et al. Hedging of Asian options under exponential Lévy models: computation and performance
CN114881761A (zh) 相似样本的确定方法与授信额度的确定方法
CN113256422B (zh) 分仓账户识别方法、装置、计算机设备和存储介质
CN114387085A (zh) 流水数据处理方法、装置、计算机设备和存储介质
CN112445973B (zh) 一种寻找项目的方法、装置、存储介质和计算机设备
CN116188178A (zh) 资源信息处理方法、装置、设备、存储介质和产品
CN109241404B (zh) 一种信息分享方法、计算机可读存储介质及终端设备
US20240005057A1 (en) Representative simulation results for correlated variables
CN115578114A (zh) 对象交互预测方法、装置、计算机设备和存储介质
Zhou Comparative Analysis of Machine Learning Performance in House Price Prediction for Ames Iowa
CN115587285A (zh) 目标对象识别方法、装置、计算机设备和存储介质
CN117726419A (zh) 资源数据处理方法、装置、计算机设备、存储介质
CN117459576A (zh) 基于边缘计算的数据推送方法、装置和计算机设备
CN117114752A (zh) 产品估值方法、装置、计算机设备和存储介质
CN116756419A (zh) 基于人工智能的信用卡权益推荐方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination