CN116109117A - 评估项目的数据流重要度的方法和介质 - Google Patents
评估项目的数据流重要度的方法和介质 Download PDFInfo
- Publication number
- CN116109117A CN116109117A CN202310400667.XA CN202310400667A CN116109117A CN 116109117 A CN116109117 A CN 116109117A CN 202310400667 A CN202310400667 A CN 202310400667A CN 116109117 A CN116109117 A CN 116109117A
- Authority
- CN
- China
- Prior art keywords
- activity
- data
- ith
- jth
- importance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000000694 effects Effects 0.000 claims abstract description 403
- 230000008859 change Effects 0.000 claims description 22
- 208000015181 infectious disease Diseases 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000012886 linear function Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 2
- 230000036961 partial effect Effects 0.000 claims 1
- 230000009191 jumping Effects 0.000 abstract description 3
- 238000011161 development Methods 0.000 description 28
- 230000018109 developmental process Effects 0.000 description 28
- 230000006870 function Effects 0.000 description 28
- 238000004364 calculation method Methods 0.000 description 25
- 238000004088 simulation Methods 0.000 description 23
- 238000007726 management method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 238000012827 research and development Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 239000004973 liquid crystal related substance Substances 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000033772 system development Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 208000035473 Communicable disease Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及了一种评估项目的数据流重要度的方法和介质。适用于包括多个活动的项目,该方法包括:对于多个活动中的第i活动和第j活动,获得第i活动和第j活动之间的数据流量;至少基于数据流量、第一相对重要度和第二相对重要度确定第i活动和第j活动之间的跳转概率;基于第i活动的重要度、第j活动的重要度和跳转概率确定第i活动和第j活动之间的数据流重要度;其中,第一相对重要度为第i活动向第j活动输出数据流相对于第i活动输出所有数据流的重要度,第二相对重要度为第j活动收到来自第i活动的数据流相对于第j活动收到所有数据流的重要度。本申请能够提升预测的项目中活动之间数据流重要度的精准度。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种评估项目的数据流重要度的方法和介质。
背景技术
信息管理是实现高质量的项目建设和管理的有效手段。项目建设和管理过程中使用信息化技术形成的数据流,能够真实地反映项目建设水平和管理水平。
申请人发现,相关技术通过LinkRank等方式评估两个活动之间传输的数据流重要度时,得到的评估结果和用户在实际应用场景中对该数据流重要度的感官结果的一致性有待提升。
发明内容
为至少部分地解决相关技术中存在的问题,本申请提供一种评估项目的数据流重要度的方法和介质,能够提升确定的项目中活动之间数据流重要度的精准度。
本申请的第一个方面提供了一种评估项目的数据流重要度的方法,适用于包括多个活动的项目,该方法包括:对于多个活动中的第i活动和第j活动,获得第i活动和第j活动之间的数据流量;至少基于数据流量、第一相对重要度和第二相对重要度确定第i活动和第j活动之间的跳转概率;基于第i活动的重要度、第j活动的重要度和跳转概率确定第i活动和第j活动之间的数据流重要度;其中,第一相对重要度为第i活动向第j活动输出数据流相对于第i活动输出所有数据流的重要度,第二相对重要度为第j活动收到来自第i活动的数据流相对于第j活动收到所有数据流的重要度,i,j是大于1的整数。
本申请的第二方面提供了一种评估项目的数据流重要度的装置,包括:数据流量确定模块用于获得第i活动和第j活动之间的数据流量;跳转概率确定模块用于至少基于数据流量、第一相对重要度和第二相对重要度确定第i活动和第j活动之间的跳转概率;其中,第一相对重要度为第i活动向第j活动输出数据流相对于第i活动输出所有数据流的重要度,第二相对重要度为第j活动收到来自第i活动的数据流相对于第j活动收到所有数据流的重要度;重要度确定模块用于基于第i活动的重要度、第j活动的重要度和跳转概率确定第i活动和第j活动之间的数据流重要度,i,j是大于1的整数。
本申请的第三方面提供了一种电子设备,包括:处理器;存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使得处理器执行上述方法。
本申请的第四方面还提供了一种计算机可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行上述方法。
本申请的第五方面还提供了一种计算机程序产品,包括可执行代码,可执行代码被处理器执行时实现上述方法。
本申请提供的评估项目的数据流重要度的方法和介质,在评估项目的数据流重要度的过程中,至少基于第i活动和第j活动之间的数据流量、针对第i活动的第一相对重要度和针对第j活动的第二相对重要度确定第i活动和第j活动之间的跳转概率。这样相对于相关技术中仅考虑了第一相对重要度而言,能够更好地分别模拟一个活动给多个关联活动输出数据流,以及一个活动接收来自多个关联活动的数据流的场景。这样使得计算得到的跳转概率更加准确,进而提升了基于该跳转概率确定的数据流重要度的精准度。
此外,在某些实施例中,将数据流量拆分为直接数据流量和间接数据流量,分别进行计算,使得项目的活动间数据流量更加准确,进一步提升了基于该数据流量确定的数据流量重要度的精准度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1示意性示出了根据本申请实施例的可以应用评估项目的数据流重要度的方法和介质的一种示例性系统架构;
图2示意性示出了根据本申请实施例的一种评估项目的数据流重要度的方法的流程图;
图3示意性示出了根据本申请实施例的研发项目的活动网络示意图;
图4示意性示出了根据本申请实施例的直接数据流量的输出速度和输出时长对应关系的示意图;
图5示意性示出了根据本申请实施例的直接数据流量DSM的示意图;
图6示意性示出了根据本申请实施例的间接数据流的示意图;
图7示意性示出了根据本申请实施例的间接数据流量DSM的示意图;
图8示意性示出了根据本申请实施例的系统研发项目的活动网络示意图;
图9示意性示出了针对图8的研发项目中的各活动数据输出开始时间和次数对应关系示意图;
图10示意性示出了针对图8的研发项目中的各活动之间的数据流量DSM示意图;
图11示意性示出了根据本申请实施例确定的图8中各数据流的重要度仿真结果;
图12示意性示出了根据本申请实施例确定的图8中数据流e14的重要度仿真结果;
图13示意性示出了根据本申请实施例确定的图8中数据流e8的重要度仿真结果;
图14示意性示出了根据本申请实施例确定的图8中数据流e24的重要度仿真结果;
图15示意性示出了根据本申请实施例确定的图8中数据流e22的重要度仿真结果;
图16示意性示出了相关技术确定的图8中各数据流的重要度仿真结果;
图17示意性示出了相关技术确定的图8中数据流e17的重要度仿真结果;
图18示意性示出了相关技术确定的图8中数据流e9的重要度仿真结果;
图19示意性示出了相关技术确定的图8中数据流e23的重要度仿真结果;
图20示意性示出了相关技术确定的图8中数据流e21的重要度仿真结果;
图21示意性示出了根据本申请实施例的一种评估项目的数据流重要度的装置的方框图;
图22示意性示出了根据本申请实施例的一种电子设备的方框图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多的该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了便于理解本申请的技术方案,首先对部分术语进行说明。
组织机构在从事工程项目之前需要对项目进行开发,属于工程发展的前期准备。在开发的过程中涉及到的活动很繁琐,要想更好的做好项目工程的前期工作,项目开发管理就变的很重要。
项目开发管理可以加强对项目开发工作的管理能力,帮助企业缩短开发时间,节省开发成本。例如,项目开发管理可以合理分配投入的开发资金,来更有效地利用资金。项目开发管理也可以在开发过程中监控工程质量,以免出现不合格的工程。此外,项目开发管理还能实现更加合理地分配和管理人力资源,从而为企业的开发工程提高效率,更好的获得利益。
研发项目中使用信息化技术形成的数据流可以真实反映项目状况,借此可以建立基于数据流的标准管理或评价模型,实现研发项目的科学化管理和演进。
如何确定项目中的关键活动(关键节点)是一个研究热点。例如,相关技术的节点重要性排序算法,包括但不限于接近中心性排序、特征向量排序、PageRank、LeaderRank等。其中,LeaderRank是基于活动的综合信息流量构建活动跳转概率矩阵,并基于该活动跳转概率矩阵和活动输出信息重要度来确定活动之间信息流重要度,进而确定关键活动。然而,发明人发现相关技术中LinkRank仅考虑了数据流所连接的活动输出数据重要度,忽略了数据流所连接的活动接收数据重要度,导致重要度计算结果和实际感官有所偏差。
本申请旨在基于数据流量等精准地评价各数据流的重要度,进而确定项目中多个活动及其之间关系的重要度,以便提升资源分配的有效性、进行更合理地设置周期等,实现研发项目等的科学化管理和演进。具体地,本申请实施例对相关技术的数据流重要度模型进行更新,不但考虑了边所连接的活动输出数据重要度,同时还考虑了边所连接的活动接收数据重要度,相对于相关技术的仿真度更高。有助于提升评价各数据流重要度的精准度,找到更精准的关键活动和/或活动间关系。以便为关键活动分配更多资源或者着重关注关键活动的状态等,提升研发项目管理水平。
以下结合图1至图22对本申请的技术方案进行示例性说明。
图1示意性示出了根据本申请实施例的可以应用评估项目的数据流重要度的方法和介质的一种示例性系统架构。需要注意的是,图1所示仅为可以应用本申请实施例的系统架构的示例,以帮助本领域技术人员理解本申请的技术内容,但并不意味着本申请实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与其他终端设备和服务器105进行交互,以接收或发送信息等,如发送项目信息、活动信息、活动网络模型和接收重要度信息等。终端设备101、102、103可以安装有各种通讯客户端应用,例如,项目管理类应用、仿真模拟类应用、数据库类应用、制图类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等应用等。用户可以使用终端设备101、102、103评估项目的数据流重要度。
终端设备101、102、103包括但不限于智能台式电脑、平板电脑、膝上型便携计算机等等可以支持上网、图表编辑等功能的电子设备。
服务器105可以接收活动网络模型,通过执行评估项目的数据流重要度的方法得到数据流重要度,并且给终端设备101、102、103返回数据流重要度。例如,服务器105可以为主机服务器、服务器集群、后台管理服务器、云服务器等。
需要说明的是,图1中的终端设备、网络和云端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本申请实施例的一种评估项目的数据流重要度的方法的流程图。
参见图2,该实施例提供了一种评估项目的数据流重要度的方法,适用于包括多个活动的项目,该方法包括操作S210~操作S230,对于多个活动中的第i活动和第j活动,i,j是大于1的整数,具体操作如下。
在操作S210中,获得第i活动和第j活动之间的数据流量。
例如,测度两两活动之间的直接数据流量(DV)。数据流量本质上可以视为一活动对另一活动的数据输出量。为了便于进行仿真模拟,可以先构建研发项目的活动网络模型。
在某些实施例中,上述评估项目的数据流重要度的方法还可以包括构建项目的网络模型的操作。具体地,针对研发项目的网络模型可以包括节点集合V和边集合E。其中,节点集合V包括n个节点v,边集合E包括m条边e。m,n是大于1的整数。
节点集合中的各节点分别表征项目中的各活动,边集合中的各边分别表征活动之间的数据流关系,如节点 指向节点的边表示与节点对应的活动流向与节点对应的活动的数据流。第i个节点向第j个节点输出数据流的数据流权值,第j个节点向第i个节点反馈数据流的数据流权值。其中,数据流权值 为第i个节点输出给第j个节点的数据流量相对于所有数据流量的占比,如为第i个节点输出给第j个节点的数据流量相对于所有数据流量的归一化结果。i,j是大于等于1的整数。
图3示意性示出了根据本申请实施例的研发项目的活动网络示意图。以图3所示的网络为例对上述各参数进行示例性说明,根据复杂网络理论和研发流程的特征,构建了研发活动有向网络拓扑图,记为G(V,E),其中V={ ,,…,}是节点(活动)集合,E={,,…,}是边(数据流)的集合,n和m分别是活动个数和数据流个数。将w记为数据流的权值,假设第i活动为上游活动,第j个活动为下游活动,则顺序执行时的数据流权值记为;反馈执行时的数据流权值记为。所有的和共同构成活动网络的邻接矩阵。表示第i活动的出度, 表示第i活动的入度。
由于数据流量的多少与数据流量重要度相关,为了确定各数据流的重要度,可以先确定两个活动之间的数据流量。活动之间的数据流量的计算过程可以参考后续内容所示的第i活动和第j活动之间的数据流量的计算方式。
例如确定两两活动之间的直接数据流量,如第i活动和第j活动之间的直接数据流量。数据流量本质上可以视为一活动对另一活动的数据输出量。顺序执行时,上游活动向下游活动输出信息(数据)。反馈执行时,下游活动向上游活动输出信息。实践中为压缩工期,研发项目可以采用重叠并行的执行方式,因此,考虑重叠情况下的数据输出过程,并以顺序执行为例,构建数据流量模型。在确定数据输出量时,需要考虑开始时间、结束时间、输出时长、输出次数、输出速率,以及每次的间隔时间。
在某些实施例中,可以通过对两个活动之间不同时间段分别传输的数据流量进行累加的方式,来确定两个活动之间的总数据流量。
图4示意性示出了根据本申请实施例的直接数据流量的输出速度和输出时长对应关系的示意图。
参见图4,在初步规划阶段,项目经理可以确定每次数据输出的持续时长(ΔT,参见图4中的T,可记为常数),计算时直接代入即可。但是,数据的输出速率会随着时间变化;间隔时间与已输出的数据量有关;开始时间和结束时间又与间隔时间相关。基于此可以构建数据流量模型,以便计算两个活动之间的数据流量。图4中数据的输出速率会随着时间的增长而变大,以模拟现实中随着项目的不断开展,活动之间交互数据越来越多,导致数据流量不断增多。图4中间隔时间随着已输出的数据量增加而增加,以模拟现实中随着项目的不断开展,活动之间交互数据越来越规范和模式化,导致交互数据的时间间隔逐渐增长。
因此,可以基于图4所示的模型计算数据流量。具体地,两个活动之间的某个时间段内的数据流量,为数据的输出速率和输出时长的乘积结果。然后,将所有时间段内的数据流量之和作为两个活动之间的总数据流量(如第i活动和第j活动之间的总数据流量)。
重复以上过程,可以计算得到项目中任意两个直接相关的活动之间的数据流量。
在操作S220中,至少基于数据流量、第一相对重要度和第二相对重要度确定第i活动和第j活动之间的跳转概率。
其中,第一相对重要度为第i活动向第j活动输出数据流相对于第i活动输出所有数据流的重要度,第二相对重要度为第j活动收到来自第i活动的数据流相对于第j活动收到所有数据流的重要度。
在本实施例中,可以基于随机游走理论为基础计算当前第i节点跳转至第j节点的概率,以便分析复杂网络中边优先级。相关技术可以使用LinkRank,基于第i活动和第j活动之间的数据流量和第i活动的出度计算第i活动和第j活动之间的跳转概率。相关技术的LinkRank计算跳转概率的式如式(1)所示。
式(1)
然而,传统LinkRank仅考虑了边所连接的输出节点的出度,忽略了接收节点的入度。发明人发现研发项目中的一个活动(节点)可能需要接收来自多个其他活动的数据,请一并参考图3中的,需要同时接收 和的数据,它的入度为2。如果一个活动的入度非常高(即需要接收许多活动的数据),那么该活动的研发团队的精力和时间将被分散,将影响相关数据流的重要度,入度越高,相关数据流的重要度越低。因此,针对研发项目的特点,发明人对传统的LinkRank进行改进,将补充在式(1)的分母位置,得到改进后的式(2)。
式(2)
其中,w(i,j)可以是基于直接数据流量的除法运算结果或者所有数据流量V(i,j)的归一化结果。α是阻尼系数,表示当用户到达一个特定的网页时,跟踪超链接的概率。是第i节点的出度,是第j节点的入度。 表示是否为悬空节点(即不与任何节点相连),悬空节点时取1,非悬空节点时取0。
在某些实施例中,上述方法还可以将获得的多个跳转概率表示为跳转概率矩阵。具体地,获得多个活动中至少部分活动两两之间的跳转概率,以生成跳转概率矩阵G。
在操作S230中,基于第i活动的重要度、第j活动的重要度和跳转概率确定第i活动和第j活动之间的数据流重要度。
在本实施例中,可以在式(2)的基础上计算PageRank,它表示在网页上随机打开一个超链接到达特定页面的概率,用来反映节点的重要性,计算式如式(3)所示。
式(3)
其中,π是收敛状态下矩阵G的列向量。 是转置符号。
在式(3)的基础上计算边的LinkRank,可由式(4)得到。
式(4)
其中, 的值即是表示第i节点与第j节点之间边的重要度,即本申请实施例中待确定的两个活动之间数据流的重要度。 是平稳状态下通过随机游走访问第i活动的概率。πj是平稳状态下通过随机游走访问第j活动的概率。
需要说明的是,在获得跳转概率矩阵后,可以基于多个活动中任意两个活动各自的重要度π(如第i活动的重要度 、第j活动的重要度πj)和跳转概率矩阵G确定该任意两个活动(如第i活动和第j活动)之间的数据流重要度L(i,j)。
在某些实施例中,在得到了数据流重要度之后,可以基于该数据流重要度来管理研发项目,如为研发项目的各活动分配合适的人力资源和财物资源,如分配各活动的周期等。具体地,可以基于该任意两个活动之间的数据流重要度L(i,j)分配资源,以完成项目,提升项目效果。
本申请实施例提供的评估项目的数据流重要度的方法,在相关技术的基础上,进一步考虑了第二相对重要度,相比于相关技术中仅考虑第一相对重要度的方式,能够考虑活动的入度对数据流重要度的影响,仿真度更高,提升仿真结果的准确的。
在某些实施例中,相对于相关技术仅考虑直接数据流而言,本实施例中还进一步考虑了间接数据流对数据流重要度的影响,以进一步提升确定的数据流重要度的精准度。
具体地,数据流量包括直接数据流量和间接数据流量,间接数据流量包括第i活动和第j活动之间经由中介活动传输的数据流量。
相应地,获得第i活动和第j活动之间的数据流量可以包括如下所示的操作。
首先,获得第i活动和第j活动之间的直接数据流量,并且获得第i活动和第j活动之间的间接数据流量。其中,第i活动和第j活动之间的直接数据流量的计算方式可以参考如上相关部分内容。第i活动和第j活动之间的间接数据流量可以将其分解为各自与间接活动之间的直接数据流,进而基于此获得间接数据流。
然后,将直接数据流量和间接数据流量的总和作为第i活动和第j活动之间的数据流量。例如,可以直接数据流量和间接数据流量的加权和作为总数据流量。其中,直接数据流量的权重和间接数据流量的权重可以相同或者不同。
本实施例中采用了直接数据流量和间接数据流量确定两个活动之间的数据流量,不但考虑了有直接关系的活动之间的数据流量,还进一步考虑了有间接关系的活动之间的数据流量,有助于提升数据流量的准确度,进而提升确定的数据流重要度的准确度。
为例更好地理解本申请的技术方案,以下对两个活动之间的直接数据流量的建模过程和计算方式进行示例性说明。
在某些实施例中,请一并参见图4,获得第i活动和第j活动之间的直接数据流量可以包括如下操作。
首先,确定第i活动对第j活动第一次输出的第一数据量,第一数据量为在第一时间段(t1b+△T)对数据输出率函数pi(t)的积分结果,数据输出率函数与项目复杂度、项目不确定度和活动持续时长中至少一种相关,t1b为第一时间段的起始时刻。其中,数据输出率函数pi(t)是时间与数据输出速率(也可以叫做信息输出速率,information input rate)之间的关系函数,可以通过仿真模拟等方式拟合该数据输出率函数pi(t)。此外,也可以根据专家经验等设置数据输出率函数pi(t)。例如,可以采用线性函数、分段函数、单调函数、周期函数等。例如,为了同时满足函数精度要求和减少计算量的需求,可以采用线性函数拟合数据输出率函数pi(t)。
然后,确定第i活动对第j活动第p次输出的第p数据量,第p数据量为在第p时间段(t1b+△T)对数据输出率函数pi(t)的积分结果,第p时间段的起始时刻tpb为第(p-1)时间段的终止时刻和间隔时间函数值Qk的加法结果,间隔时间函数值Qk与项目复杂程度、第p数据量相关,p是大于1的整数。
接着,将第一数据量和第p数据量的加法运算结果作为直接数据流量。
在一个具体实施例中,首先,测度第一次输出量。将第一次数据输出的开始时间记为t1b,结束的时间则为(t1b+△T),参见图4中的t1f。此外,还需要确定数据输出速率,它会随活动的执行而不断变化。对于上游活动来说,开始输出的初步数据(preliminaryinformation),不确定性内容较多,有效数据较少。但随着进化度的不断提升,数据流会发生演化,有效数据量会逐渐增多,因此,数据输出率是随时间变化的增函数,采用计算量较小且精准度足够高的线性的数据输出率函数,如图4中的斜线所示,计算式如式(5)所示。
式(5)
其中,λ表示项目整体的复杂程度和不确定性,项目越复杂,包含的技术参数和资源协调信息越多,数据输出速率相对越快。ε是演化度参数,将其取值范围设为[0,1]。D表示活动的持续时间。
在式(5)基础上,可得第i活动对第j活动的第一次输出的数据量的计算式如式(6)所示。
式(6)
然后,测度第二次输出量。第二次的开始时间t2b需要在第一次结束时间的基础上,加上间隔时间函数值(即间隔时间Q1)。研究表明,随着活动的不断执行,相邻两次传递的间隔时间会越来越长,即第(c-1)次与第c次的间隔时间大于第(c-2)次与第(c-1)次的间隔,c是大于2的整数。原因在于,下一次传递与上一次相比,活动的进化度更高,输出的确定性数据更多,能够支持下游活动执行更长的时间,所以导致间隔时间递增,参见图4中的间隔时间Q1、间隔时间Q2。由此可知,间隔时间函数是随前一次数据输出量递增的函数,表达式可以如式(7)所示:
式(7)
其中, 表示第k次输出数据和第(k+1)次输出数据之间的时间间隔, 是第k次输出的数据量。λ表示复杂程度,整体越复杂,越需要频繁的数据交换,相比简单情形,它的相对间隔时间较短,k是整数。σ是误差项。由于第n次输出的是最终数据,表示最后一次输出,所以时间间隔只有(n-1)个。相应地,第i活动的在第一次输出数据之后输出数据的起始时刻包括起始时刻、……,第i活动的在第一次输出数据之后输出数据的终止时刻包括终止时刻、……。
综上,可得第一次输出数据之后输出数据的数据量如式(8)所示:
式(8)
基于上述分析,可知第n次数据输出的起始时刻 可表示为,第n次数据输出的终止时刻可以表示为 。据此,可以得知第n次的数据输出量可以表示为如式(9)所示:
式(9)
最后,通过式(9)可以得到顺序执行时,上游第i活动向下游第j活动输出的总数据量 的计算式可以如式(10)所示:
式(10)
同理,我们还能测度出反馈执行时,下游第j活动向上游第i活动输出的数据量,记为 。
此外,还可以采用设计结构矩阵(design structure matrix,简称DSM)描述活动之间的数据流量。DSM是用于对产品开发过程进行规划和分析的矩阵工具。DSM是由有向图发展而来的,一个DSM是由排列顺序相同的行列元素组成的一个方阵。DSM用矩阵的行列元素表示过程中的活动,用矩阵的非对角线单元格来表示对应的行列元素之间的联系,用矩阵单元格相对于对角线的上下位置来描述对应行列元素之间联系的方向,在对角线下方表示关系/数据的发布,是正向的,在对角线的上方表示关系/数据的反馈,如图5所示。在一个具体实施例中,全部活动的直接数据流量DSM可根据 和 得到。
以下对第i活动和第j活动之间的间接数据流量及其计算方法进行示例性说明。
图6示意性示出了根据本申请实施例的间接数据流的示意图。
根据结构洞和复杂网络理论可知,在研发活动网络中,重叠的两个活动除了因直接的数据交互而产生依赖关系外,还有可能通过第三方活动产生间接依赖关系,也就是间接数据流。
参见图6,第i活动与第j活动的依赖关系不仅需要测度直接数据流量(实线箭头),还应该需要考虑它们因存在“中介”活动(如图6中的活动q1和活动q2)而存在的间接数据流量(IV,如图6中的虚线箭头所示)。该间接数据流量IV与多个直接数据流量,如图6中的V(i,q1)、V(q1,i)、V(i,q2)、V(q2,j)相关。
在某些实施例中,获得第i活动和第j活动之间的间接数据流量可以包括如下操作。首先,获得第i活动向中介活动输出的第一直接数据流量,并且获得中介活动向第j活动输出的第二直接数据流量,中介活动包括至少一个活动。然后,基于第一直接数据和第二直接数据流量确定该间接数据流量。例如,将第i活动对第j活动的第一依赖强度和第j活动对第i活动的第二依赖强度的乘法运算结果作为第i活动和第j活动之间的间接数据流量,第一依赖强度为第一直接数据流量与直接数据流量总和之间的除法运算结果,第二依赖强度为第二直接数据流量与直接数据流量总和之间的除法运算结果,直接数据流量总和为第一直接数据流量和第二直接数据流量的加法运算结果。
具体地,为了计算上述间接数据流,采用了网络节点间接依赖模型。具体地,考虑到第i节点和第j节点之间的间接依赖强度等于第i节点对第q节点的依赖强度乘以第q节点对第j节点的依赖强度。基于此,构建了顺序执行时,第i活动和第j活动之间的间接数据流量 的计算式,如式(11)所示:
式(11)
其中,q表示顺序执行时第i活动和第j活动之间的中介活动, 是中介活动的个数。
当反馈执行时,第 活动和第 活动之间的间接数据流量的计算式,如式(12)所示:
式(12)
其中,p表示顺序执行时第i活动和第j活动之间的中介活动, 是中介活动的个数。
通过以上方式就可以得到顺序执行时第i活动和第j活动之间的间接数据流量 ,结合以上获得的上游第i活动向下游第j活动输出的直接数据流量 ,可以得到顺序执行时第i活动和第j活动之间的数据流量 ,计算式如式(13)所示。
式(13)
此外,还可以根据反馈执行时,下游第j活动向上游第i活动输出的直接数据流量 ,以及反馈执行时第j活动和第i活动之间的间接数据流量 ,得到反馈执行时第j活动和第i活动之间的数据流量 ,计算式如式(14)所示。
式(14)
此外,还可以采用DSM描述活动之间的间接数据流量,如图7所示。在一个具体实施例中,全部活动的间接数据流量DSM可通过集成 和 得到。
本实施例提供的计算第i活动和第j活动之间的数据流量 的计算方式,不但考虑了两个活动之间的直接数据流量,还进一步考虑了两个活动之间的间接数据流量,与现实中的活动之间关系更加一致,有效提升了仿真度,进而提升了基于数据流量确定的数据流重要度的准确度。
此外,本实施例提供的数据输出率函数、活动间隔函数等细化了数据流量的模型,在提升数据流量计算准确度的基础上,不会导致运算量过高的问题,提升计算资源有效利用率和响应速度。
在某些实施例中,为了验证数据流重要度的准确度,还可以对数据流重要度进行验证。具体地,上述方法还可以包括如下操作,基于第i活动和第j活动之间的数据流传染除该数据流之外数据流的能力,对数据流重要度进行验证。例如,可以考察数据流对网络某种结构和功能及对其它节点状态的影响程度来判断排序是否恰当。例如,如果评估结果是数据流1比数据流2重要,单独考察结果表明数据流1比数据流2对网络某种结构和功能及对其它节点状态的影响程度大,则表明数据流重要度比较符合实际。具体地,可以基于网络的鲁棒性和脆弱性方法以及基于网络的传播动力学模型对数据流重要度进行验证。
在某些实施例中,可以基于传染病模型的数据流重要度验证。易感-感染(susceptible-infective,简称SI)模型是经典的传染病模型方法,常用于检验网络节点或边的影响力。本实施例针对研发项目的上述特点,构建了研发项目的活动网络的风险传播SI模型,以检验某一数据流含有工程变更数据时产生的影响。
具体地,当第i活动向第j活动输出工程变更数据时,会有一定的感染概率 导致第j活动发生返工。假如第j活动发生返工,在下一时刻,第j活动也会输出工程变更数据。假如第j活动不发生返工,则第j活动不会输出工程变更数据。假设数据流总数为N,数据流只有不含工程变更数据和含有工程变更数据两种状态,当时间t趋近无穷大时,将含有工程变更数据的数据流数量记为I(t),不含工程变更数据的数据流数量记为S(t),且有I(t)+S(t)=N。
感染概率p与工程变更数据量R和活动的风险承载能力C有关。首先,计算工程变更数据量。工程变更数据量是数据流量的一部分,数据流量越高,可能会伴随着更多的变更量。基于此,本实施例构建的工程变更数据量 计算式如式(15)所示:
式(15)
其中,当第i活动向第j活动输出工程变更数据时, ,反之为0。 表示第i活动向第j活动输出的工程变更数据量,共有n个活动向第j活动输出数据。
然后,确定风险承载能力。风险承载能力取决于活动的输出和接收数据量,以及活动入度和活动出度的大小。研发人员会在前期采取预处理工作,以保证活动具备一定的风险承载能力,减小返工带来的影响。如果活动的输出和接收的数据量较多,且出度和入度较高,则会进行更多的预处理工作,也就导致该活动的风险承载能力越高。基于此,本实施例构建的风险承载能力C的计算式,如式(16)所示:
式(16)
其中, 是第j活动的出度, 是第j活动的入度。第j活动是与第i活动有数据交互的活动,共有m个。 是预处理系数, 。
接着,计算感染概率p。如 ,否则会出现重新设计、全部返工等情况。当 与 差距越大时,p越小;反之,p越大。基于此,本实施例构建了感染概率p的计算式,如式(17)所示:
式(17)
例如,仿真思路可以包括:选择重要度为高、中、低的三条数据流,当它们均含有工程变更数据且导致接收此数据的活动发生返工时,分别观测三种情况下研发活动网络的受影响程度,如果也分别是高、中、低,则证明本模型有效;反之,则无效。
以下以具体研发项目的活动网络为例,对确定的数据流重要度的精准度进行示例性说明。
图8示意性示出了根据本申请实施例的系统研发项目的活动网络示意图。
参见图8,以某互联网企业的系统研发项目为例,验证本模型的有效性。此项目共包含14个研发活动(详细数据见表1),为尽快完工,计划采用重叠并行的开发方式,但也增加了返工风险。为了有效管控风险、保证活动网络的稳定性,对重要数据流进行识别和评价是非常必要的。
表1 系统研发项目的活动及其持续时间
活动序号 | <![CDATA[v<sub>1</sub>]]> | <![CDATA[v<sub>2</sub>]]> | <![CDATA[v<sub>3</sub>]]> | <![CDATA[v<sub>4</sub>]]> | <![CDATA[v<sub>5</sub>]]> | <![CDATA[v<sub>6</sub>]]> | <![CDATA[v<sub>7</sub>]]> | <![CDATA[v<sub>8</sub>]]> | <![CDATA[v<sub>9</sub>]]> | <![CDATA[v<sub>10</sub>]]> | <![CDATA[v<sub>11</sub>]]> | <![CDATA[v<sub>12</sub>]]> | <![CDATA[v<sub>13</sub>]]> | <![CDATA[v<sub>14</sub>]]> |
时间(小时) | 150 | 150 | 180 | 90 | 60 | 70 | 65 | 200 | 40 | 40 | 100 | 150 | 100 | 150 |
通过调研,绘制了此项目的活动网络,如图8所示,活动的集合为{v1, v2,…,v14},边的集合为{e1, e2,…, e24}。
基于第一次数据输出的开始时间为t1b、结束的时间为(t1b+ΔT)、第n次数据输出的起始时刻为 、第n次数据输出的终止时刻为等,可以得到研发项目的活动的数据输出开始时间和次数,如图9所示。其中,图9的一个元素的斜对角线的左下角为次数,斜对角线的右上角为时长。
然后,基于式(13)和式(14)可得到研发项目的活动间的数据流量,并基于该数据流量得到全部活动数据流量DSM,如图10所示。
为了便于和相关技术进行比对,图11~图15示出了基于本申请改进后的LinkRank得到的针对图8的数据流重要度的计算结果。图16~图20示出了基于相关技术的LinkRank得到的针对图8的数据流重要度的计算结果。
首先,请一并参考图11和图16,数据流e1~数据流e19是顺序执行的数据流,数据流e20~数据流e24是反馈执行的数据流。从图11和图16可以看出数据流重要度(即LinkRank值)的大体趋势比较一致:数据流e1~数据流e13的数据流重要度的取值,明显小于数据流e14~数据流e19的数据流重要度的取值;反馈执行的数据流e21和数据流e22的数据流重要度的取值,明显小于其余反馈执行数据流的数据流重要度的取值。从以上比对可以得出基于本申请改进后的LinkRank得到的针对图8的数据流重要度的计算结果是具有较高参考价值的,如不会出现明显错误。
接下来,再通过感染力模型来分析基于改进后的LinkRank得到的数据流重要度的计算结果,与基于改进前的LinkRank得到的数据流重要度的计算结果的优劣。
如图11所示,在顺序执行下,本实施例基于改进后的LinkRank识别出e14的重要度最高;如图16所示,相关技术基于改进前的LinkRank识别出e17的重要度最高。基于SI模型的仿真结果进行分析比对,图12表明以e14为初始攻击边,步长在40左右即可达到百分百的感染比例,图17表明以e17为初始攻击边,需要60左右步长才能达到全部感染。因此可知,e14的重要度大于e17,这表明本实施例基于改进后的LinkRank确定的数据流重要度的精准性。
如图11所示,在顺序执行下,本实施例基于改进后的LinkRank识别出e8的重要度最低;如图16所示,相关技术基于改进前的LinkRank识别出e9的重要度最低。基于SI模型的仿真结果进行分析比对,图13表明以e8为初始攻击边,步长在200左右可达到百分百的感染比例,图18表明以e9为初始攻击边,需要180左右步长能达到全部感染。因此可知,e8的重要度小于e9,也能反映出本实施例基于改进后的LinkRank确定的数据流重要度的精准性。
如图11所示,在反馈执行下,本实施例基于改进后的LinkRank识别出e24的重要度最高;如图16所示,相关技术基于改进前的LinkRank识别出e23的重要度最高。基于SI模型的仿真结果进行分析比对,图14表明以e24为初始攻击边,步长在50多步即可达到百分百的感染比例,图19表明以e23为初始攻击边,需要不到60步长才能达到全部感染。需要说明的是,此处比对结果比较一致,区别不显著,可以着重关注其他比对实例。
如图11所示,在反馈执行下,本实施例基于改进后的LinkRank识别出e22的重要度最低;如图16所示,相关技术基于改进前的LinkRank识别出e21的重要度最低。基于SI模型的仿真结果进行分析比对,图15表明以e22为初始攻击边,步长在200左右可达到百分百的感染比例,图20表明以e21为初始攻击边,需要170左右步长能达到全部感染。因此可知,e22的重要度小于e21,也能反映出本实施例基于改进后的LinkRank确定的数据流重要度的精准性。
结合以上比对结果可以看出,本实施例基于改进后的LinkRank得到的数据流重要度的大体趋势和相关技术较一致,具有重要参考意义。并且,本实施例基于改进后的LinkRank得到的数据流重要度相对于基于改进前的LinkRank得到的数据流重要度更加准确,有效提升了确定的数据流重要度的精准度,有助于基于更加准确度的数据流重要度提升项目管理水平。
本申请的另一方面还提供了一种评估项目的数据流重要度的装置。
图21示意性示出了根据本申请实施例的一种评估项目的数据流重要度的装置的方框图。
参见图21,该评估项目的数据流重要度的装置2100适用于预测包括多个活动的项目之间数据流重要度。该装置2100可以包括:数据流量确定模块2110、跳转概率确定模块2120和重要度确定模块2130。
数据流量确定模块2110用于在处理多个活动中的第i活动和第j活动过程中,获得第i活动和第j活动之间的数据流量。
跳转概率确定模块2120用于至少基于数据流量、第一相对重要度和第二相对重要度确定第i活动和第j活动之间的跳转概率;其中,第一相对重要度为第i活动向第j活动输出数据流相对于第i活动输出所有数据流的重要度,第二相对重要度为第j活动收到来自第i活动的数据流相对于第j活动收到所有数据流的重要度。
重要度确定模块2130用于基于第i活动的重要度、第j活动的重要度和跳转概率确定第i活动和第j活动之间的数据流重要度。
在某些实施例中,数据流量包括直接数据流量和间接数据流量,间接数据流量包括第i活动和第j活动之间经由中介活动传输的数据流量。
相应地,数据流量确定模块2110包括:流量获得单元和流量加和单元。
流量获得单元,用于获得第i活动和第j活动之间的直接数据流量,并且获得第i活动和第j活动之间的间接数据流量。
流量加和单元,用于将直接数据流量和间接数据流量的总和作为第i活动和第j活动之间的数据流量。
在某些实施例中,流量获得单元包括:第一流量获得子单元、第二流量获得子单元、第一加和子单元。
第一流量获得子单元用于确定第i活动对第j活动第一次输出的第一数据量,第一数据量为在第一时间段对数据输出率函数的积分结果,数据输出率函数与项目复杂度、项目不确定度和活动持续时长中至少一种相关。
第二流量获得子单元用于确定第i活动对第j活动第p次输出的第p数据量,第p数据量为在第p时间段对数据输出率函数的积分结果,第p时间段的起始时刻为第(p-1)时间段的终止时刻和间隔时间函数值的加法结果,间隔时间函数值与项目复杂程度、第p数据量相关,p是大于1的整数。
第一加和子单元用于将第一数据量和第p数据量的加法运算结果作为直接数据流量。
在某些实施例中,数据输出率函数为线性函数。
在某些实施例中,流量获得单元还包括:中介流量获得子单元和第二加和子单元。
中介流量获得子单元用于获得第i活动向中介活动输出的第一直接数据流量,并且获得中介活动向第j活动输出的第二直接数据流量,中介活动包括至少一个活动。
第二加和子单元用于将第i活动对第j活动的第一依赖强度和第j活动对第i活动的第二依赖强度的乘法运算结果作为第i活动和第j活动之间的间接数据流量,第一依赖强度为第一直接数据流量与直接数据流量总和之间的除法运算结果,第二依赖强度为第二直接数据流量与直接数据流量总和之间的除法运算结果,直接数据流量总和为第一直接数据流量和第二直接数据流量的加法运算结果。
在某些实施例中,上述装置2100还包括:验证模块。
验证模块用于基于第i活动和第j活动之间的数据流传染除去该数据流之外数据流的能力,对数据流重要度进行验证。
在某些实施例中,验证模块包括:风险承载能力确定单元、感染能力确定单元和验证单元。
风险承载能力确定单元用于确定第i活动和第j活动之间的数据流中的第一类数据流的工程变更数据量,并且确定第i活动和第j活动之间的数据流的风险承载能力,工程变更数据量与第i活动和第j活动之间的数据流量相关,风险承载能力与第i活动和第j活动之间的数据流、第一相对重要度、第二相对重要度相关。
感染能力确定单元用于基于工程变更数据量和风险承载能力的除法运算结果,确定第i活动和第j活动之间的数据流传染其它数据流的感染能力。
验证单元用于基于感染能力和数据流重要度的一致性,对数据流重要度进行验证。
在某些实施例中,上述装置2100还包括模型构建模块。
模型构建模块用于构建针对项目的网络模型,网络模型包括节点集合V和边集合E,其中,节点集合V包括n个节点v,边集合E包括m条边e,第i个节点vi向第j个节点vj输出数据流的数据流权值 ,为数据流量 的归一化结果,第i个节点的第一相对重要度为 ,第i节点的第二相对重要度为 ,n和m是大于1的整数。
在某些实施例中,上述装置2100还包括矩阵生成模块和资源分配模块。其中,矩阵生成模块用于获得多个活动中至少部分活动两两之间的跳转概率,以生成跳转概率矩阵G(i,j)。跳转概率确定模块2120具体用于基于多个活动中任意两个活动各自的重要度π和跳转概率矩阵G(i,j)确定该任意两个活动之间的数据流重要度L(i,j)。资源分配模块用于基于该任意两个活动之间的数据流重要度L(i,j)分配资源,以完成项目。
本申请实施例提供的评估项目的数据流重要度的装置,能够有效提升确定的项目中活动之间数据流重要度的精准度。关于上述实施例中的装置2100,其中各个模块、单元、子单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
本申请的另一方面还提供了一种电子设备。
图22示意性示出了根据本申请实施例的一种电子设备的方框图。
参见图22,电子设备2200包括存储器2210和处理器2220。
处理器2220可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器2210可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器2220或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器2210可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器2210可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器2210上存储有可执行代码,当可执行代码被处理器2220处理时,处理器2220执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种评估项目的数据流重要度的方法,其特征在于,适用于包括多个活动的项目,所述方法包括:对于多个所述活动中的第i活动和第j活动,
获得第i活动和第j活动之间的数据流量;
至少基于所述数据流量、第一相对重要度和第二相对重要度确定所述第i活动和所述第j活动之间的跳转概率;
基于所述第i活动的重要度、所述第j活动的重要度和所述跳转概率确定所述第i活动和所述第j活动之间的数据流重要度;
其中,所述第一相对重要度为所述第i活动向所述第j活动输出数据流相对于所述第i活动输出所有数据流的重要度,所述第二相对重要度为所述第j活动收到来自所述第i活动的数据流相对于所述第j活动收到所有数据流的重要度,i,j是大于1的整数。
2.根据权利要求1所述的方法,其特征在于,所述数据流量包括直接数据流量和间接数据流量,所述间接数据流量包括所述第i活动和所述第j活动之间经由中介活动传输的数据流量;
所述获得第i活动和第j活动之间的数据流量,包括:
获得所述第i活动和所述第j活动之间的直接数据流量,并且获得所述第i活动和所述第j活动之间的间接数据流量;
将所述直接数据流量和所述间接数据流量的总和作为所述第i活动和所述第j活动之间的数据流量。
3.根据权利要求2所述的方法,其特征在于,所述获得所述第i活动和所述第j活动之间的直接数据流量,包括:
确定所述第i活动对所述第j活动第一次输出的第一数据量,所述第一数据量为在第一时间段对数据输出率函数的积分结果,所述数据输出率函数与项目复杂度、项目不确定度和活动持续时长中至少一种相关;
确定所述第i活动对所述第j活动在第p次输出的第p数据量,所述第p数据量为在第p时间段对所述数据输出率函数的积分结果,第p时间段的起始时刻为第(p-1)时间段的终止时刻和间隔时间函数值的加法结果,所述间隔时间函数值与项目复杂程度、所述第p数据量相关,p是大于1的整数;
将所述第一数据量和所述第p数据量的加法运算结果作为所述直接数据流量。
4.根据权利要求3所述的方法,其特征在于,所述数据输出率函数为线性函数。
5.根据权利要求2所述的方法,其特征在于,所述获得所述第i活动和所述第j活动之间的间接数据流量,包括:
获得所述第i活动向所述中介活动输出的第一直接数据流量,并且获得所述中介活动向所述第j活动输出的第二直接数据流量,所述中介活动包括至少一个活动;
将所述第i活动对所述第j活动的第一依赖强度和所述第j活动对所述第i活动的第二依赖强度的乘法运算结果作为所述第i活动和所述第j活动之间的间接数据流量,所述第一依赖强度为所述第一直接数据流量与直接数据流量总和之间的除法运算结果,所述第二依赖强度为所述第二直接数据流量与直接数据流量总和之间的除法运算结果,所述直接数据流量总和为所述第一直接数据流量和所述第二直接数据流量的加法运算结果。
6.根据权利要求1所述的方法,其特征在于,还包括:
基于所述第i活动和所述第j活动之间的数据流传染该数据流之外数据流的能力,对所述数据流重要度进行验证。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第i活动和所述第j活动之间的数据流传染该数据流之外数据流的能力,对所述数据流重要度进行验证,包括:
确定所述第i活动和所述第j活动之间的数据流中的工程变更数据量,并且确定所述第i活动和所述第j活动之间的数据流的风险承载能力,所述工程变更数据量与所述第i活动和所述第j活动之间的数据流量相关,所述风险承载能力与所述第i活动和所述第j活动之间的数据流、所述第一相对重要度、所述第二相对重要度相关;
基于所述工程变更数据量和所述风险承载能力的除法运算结果,确定所述第i活动和所述第j活动之间的数据流传染其它数据流的感染能力;
基于所述感染能力和所述数据流重要度的一致性,对所述数据流重要度进行验证。
8.根据权利要求1至7任一项所述的方法,其特征在于,还包括:
构建针对所述项目的网络模型,所述网络模型包括节点集合和边集合,其中,节点集合包括n个节点,边集合包括m条边,第i个节点向第j个节点输出数据流的数据流权值,为该第i个节点向第j个节点输出数据流量相对于所有数据流量的归一化结果,n和m是大于1的整数。
9.根据权利要求8所述的方法,其特征在于,还包括:
获得多个所述活动中至少部分活动两两之间的跳转概率,以生成跳转概率矩阵;
基于多个所述活动中任意两个活动各自的重要度和所述跳转概率矩阵确定该任意两个活动之间的数据流重要度;
基于任意两个所述活动之间的数据流重要度分配资源,以完成所述项目。
10.一种计算机可读存储介质,其特征在于,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310400667.XA CN116109117B (zh) | 2023-04-14 | 2023-04-14 | 评估数据流重要度的方法和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310400667.XA CN116109117B (zh) | 2023-04-14 | 2023-04-14 | 评估数据流重要度的方法和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116109117A true CN116109117A (zh) | 2023-05-12 |
CN116109117B CN116109117B (zh) | 2024-05-24 |
Family
ID=86254726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310400667.XA Active CN116109117B (zh) | 2023-04-14 | 2023-04-14 | 评估数据流重要度的方法和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116109117B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204502A1 (en) * | 2002-04-25 | 2003-10-30 | Tomlin John Anthony | System and method for rapid computation of PageRank |
US20120218908A1 (en) * | 2011-02-28 | 2012-08-30 | International Business Machines Corporation | System and Method for Finding Important Nodes in a Network |
CN103577442A (zh) * | 2012-07-30 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种地图数据重要度计算方法及装置 |
CN106301868A (zh) * | 2015-06-12 | 2017-01-04 | 华为技术有限公司 | 确定网络节点的重要性的方法和装置 |
CN107453919A (zh) * | 2017-08-31 | 2017-12-08 | 中国人民解放军国防科技大学 | 复杂网络节点重要性评估方法及系统 |
CN108009710A (zh) * | 2017-11-19 | 2018-05-08 | 国家计算机网络与信息安全管理中心 | 基于相似度和TrustRank算法的节点测试重要度评估方法 |
CN111666646A (zh) * | 2020-05-25 | 2020-09-15 | 上海市环境监测中心(上海长三角区域空气质量预测预报中心) | 基于复杂网络的大气污染传输关键节点的识别方法及系统 |
CN112039704A (zh) * | 2020-08-31 | 2020-12-04 | 中国民航大学 | 一种基于风险传播的信息系统风险评估方法 |
CN112364295A (zh) * | 2020-11-13 | 2021-02-12 | 中国科学院数学与系统科学研究院 | 网络节点重要性的确定方法、装置、电子设备及介质 |
-
2023
- 2023-04-14 CN CN202310400667.XA patent/CN116109117B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204502A1 (en) * | 2002-04-25 | 2003-10-30 | Tomlin John Anthony | System and method for rapid computation of PageRank |
US20120218908A1 (en) * | 2011-02-28 | 2012-08-30 | International Business Machines Corporation | System and Method for Finding Important Nodes in a Network |
CN103577442A (zh) * | 2012-07-30 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种地图数据重要度计算方法及装置 |
CN106301868A (zh) * | 2015-06-12 | 2017-01-04 | 华为技术有限公司 | 确定网络节点的重要性的方法和装置 |
CN107453919A (zh) * | 2017-08-31 | 2017-12-08 | 中国人民解放军国防科技大学 | 复杂网络节点重要性评估方法及系统 |
CN108009710A (zh) * | 2017-11-19 | 2018-05-08 | 国家计算机网络与信息安全管理中心 | 基于相似度和TrustRank算法的节点测试重要度评估方法 |
CN111666646A (zh) * | 2020-05-25 | 2020-09-15 | 上海市环境监测中心(上海长三角区域空气质量预测预报中心) | 基于复杂网络的大气污染传输关键节点的识别方法及系统 |
CN112039704A (zh) * | 2020-08-31 | 2020-12-04 | 中国民航大学 | 一种基于风险传播的信息系统风险评估方法 |
CN112364295A (zh) * | 2020-11-13 | 2021-02-12 | 中国科学院数学与系统科学研究院 | 网络节点重要性的确定方法、装置、电子设备及介质 |
Non-Patent Citations (1)
Title |
---|
YOUNGDO KIM 等: "LinkRank: Finding communities in directed networks", ARXIV:0902.3728V3, 23 November 2009 (2009-11-23), pages 1 - 9 * |
Also Published As
Publication number | Publication date |
---|---|
CN116109117B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Malawski et al. | Scheduling multilevel deadline‐constrained scientific workflows on clouds based on cost optimization | |
Kim et al. | A trust evaluation model for QoS guarantee in cloud systems | |
US20070203789A1 (en) | Designing hyperlink structures | |
IES20100757A2 (en) | A resource allocation system | |
Meyerson et al. | Online multidimensional load balancing | |
Inoue et al. | Bivariate change-point modeling for software reliability assessment with uncertainty of testing-environment factor | |
Stauffer et al. | Elasticity management for capacity planning in software as a service cloud computing | |
Peyravi et al. | Estimating runtime of a job in Hadoop MapReduce | |
Rak | Response time analysis of distributed web systems using QPNs | |
Xu et al. | MeURep: A novel user reputation calculation approach in personalized cloud services | |
Anandkumar et al. | Tracking in a spaghetti bowl: monitoring transactions using footprints | |
Bollapragada et al. | Replenishment planning in discrete-time, capacitated, non-stationary, stochastic inventory systems | |
US20110178948A1 (en) | Method and system for business process oriented risk identification and qualification | |
US20220292392A1 (en) | Scheduled federated learning for enhanced search | |
Woerner et al. | Simulation‐Based Optimization of Capacitated Assembly Systems under Beta‐Service Level Constraints | |
Al-Mistarihi et al. | On fairness, optimizing replica selection in data grids | |
Iyer et al. | Performance, scalability and reliability issues in web applications | |
CN116109117B (zh) | 评估数据流重要度的方法和介质 | |
Fu et al. | Fairness of task allocation in crowdsourcing workflows | |
Santos et al. | Quid Pro Quo: a mechanism for fair collaboration in networked systems | |
Ivashko et al. | Batch of tasks completion time estimation in a desktop grid | |
Zhao et al. | Profit maximization and time minimization admission control and resource scheduling for cloud-based big data analytics-as-a-service platforms | |
Distefano et al. | UML design and software performance modeling | |
Nguyen | Managing Cold-start in The Serverless Cloud with Temporal Convolutional Networks | |
Li et al. | SoDa: A Serverless‐Oriented Deadline‐Aware Workflow Scheduling Engine for IoT Applications in Edge Clouds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |