WO2022099915A1

WO2022099915A1 - 基于超网络模型的组织架构建模方法及空间探索算法

Info

Publication number: WO2022099915A1
Application number: PCT/CN2021/070648
Authority: WO
Inventors: 周鑫; 王维平; 井田; 杨松; 王彦锋; 黄美根; 王涛; 李小波; 林木; 李童心; 段婷; 张�杰; 王梦
Original assignee: 中国人民解放军国防科技大学
Priority date: 2020-11-13
Filing date: 2021-01-07
Publication date: 2022-05-19
Also published as: CN112632744A; CN112632744B

Abstract

一种基于超网络模型的作战体系架构建模方法，该建模方法包括以下步骤：将作战体系使命分解为可由装备系统执行的任务网络；根据任务网络和任务节点与系统节点之间的对应关系构建系统网络；建立指控网络，结合任务网络、系统网络构建成作战体系架构模型；构建作战体系架构的空间探索问题模型；将作战体系搜索问题模型中的决策者问题转换为一种形式化的动态规划问题。该建模方法构建的作战体系架构模型，便于决策者做出最佳选择。

Description

基于超网络模型的组织架构建模方法及空间探索算法

本申请要求于2020年11月13日提交中国专利局、申请号为202011267527.2、发明名称为“基于超网络模型的作战体系架构建模方法及空间探索算法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及作战系统技术领域，特别是涉及一种基于超网络模型的作战体系架构建模方法及空间探索算法。

背景技术

随着系统信息化和智能化的发展，系统之间的相互联系变得越来越多样化。组织是一种体系，是有限数量的组分系统的集成，这些系统是独立且可运行的，并且在一段时间内相互连接以实现某个更高的目标。由于组织十分复杂，如何研究组织是当前研究者迫切需要解决的问题。幸运的是，组织架构为解决该问题提供了一种行之有效的思路。组织架构反映了体系中组件的配置以及组件与外部环境之间的交互。组织架构关注物理实体、信息结构和体系功能，是体系的核心框架。组织架构贯穿设计、需求演示、原型开发、应用程序测试和外场试验全过程。因此，通过组织架构研究组织，定义一种合理的形式化组织架构，是实现组织核心要素的最佳配置。

OA是由指控网络连接的装备集合，这些装备具有某些功能以支持特定任务的完成。OA用于指导特定组织的构建。针对组织架构潜在能力不确定问题，构建架构模型、架构方案空间探索问题模型及求解算法。架构建模与选取中有如下问题需要解决：首先，架构潜在能力具有不确定性。在以往的研究中，组织能力在架构建立之后就确定了。事实上，架构潜在能力的不确定性一方面体现在任务不确定和资源组合多样性；另一方面次要因素的影响，因为在设计架构时往往只考虑影响体系能力的主要因素。其次，如果选择继续开发架构，决策者有多种策略来获得架构潜在能力。因而决策者应该评估这些策略的期望回报值，以便做出最佳选择。第三，从多个架构方案空间中选择若干个最优架构，以往研究往往只选择一个架构方案，缺乏对多架构方案选取的研究。鉴于此，亟需构建一种新颖的架构模型和组织架构方案空间探索问题，并提出了一种架构方案空间动态探索算法，以解决上述问题。

发明内容

本发明的目的是提供一种基于超网络模型的作战体系架构建模方法及空间探索算法，该建模方法能够构建出具多架构方案选取的作战体系架构模型，便于决策者做出最佳选择；该算法为基于决策指标的并行搜索算法，且该算法为多项式时间算法，其回报值明显优于其他基准算法，其在作战体系架构方案空间独立情况的假设下是最优的。

为实现上述目的，本发明提供了如下方案：

基于超网络模型的作战体系架构建模方法，根据能力生成机理，将任务、装备系统和指控结构作为作战体系架构的核心要素，所述作战体系架构由任务网络、系统网络和指控网络三种异构网络组成，具体包括以下步骤：

S1、将作战体系使命分解为由装备系统执行的任务网络；

S2、给出任务节点与系统节点之间的对应关系，并根据任务网络和任务节点与系统节点之间的对应关系构建系统网络，其中，系统节点为具有特定功能并能够独立完成特定任务的装备，记为SY；任务节点为可由装备系统执行的活动过程，记为TA；

S3、给出系统节点和指控节点之间的对应关系，并根据该关系建立指控网络，并结合任务网络、系统网络构建成作战体系架构模型；其中，指控节点为用于处理信息、管理组织、决策规划和控制反馈的逻辑节点，表示为C2，指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>，系统节点与指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中，G ^C2表示指控网络，V ^C2表示指控节点，E ^C2表示V ^C2节点之间的边集合，G ^SC表示系统节点与指控节点之间的对应关系，V ^SY表示系统节点，E ^SC表示节点V ^SY和节点V ^C2之间的边集合；

S4、根据作战体系架构模型和决策者n，构建作战体系架构的空间探索问题模型，其中，决策者n∈N,N＝{1,2,...,|N|}，第n个决策者记为Agent n；其中，Agent n表示第n个决策者的方案空间，每个方案空间包括多种作战体系架构，作战体系架构用于对作战体系进行描述；N表示决策者空间，|N|表示决策者的数量；

S5、根据作战体系架构的空间探索问题模型，将作战体系架构的空间探索问题模型中的决策者问题转换为一种形式化的动态规划问题。

进一步地，所述任务网络可抽象为有向图，记为G ^TA＝<V ^TA,E ^TA>，其中，V ^TA表示任务节点集合，E ^TA表示任务节点之间的边集合，G ^TA表示任务网络；每个所述任务网络均具有起始任务节点、结束任务节点和中间节点；所述任务网络包括因果关系和并列关系两类逻辑关系。

进一步地，所述系统网络表示系统节点之间的功能关系，记为G ^SY＝<V ^SY，E ^SY>，其中V _SY表示系统节点集合，E _SY表示系统节点之间的边集合，G ^SY表示系统网络；所述任务节点和系统节点之间的对应关系定义为二分图，记为G ^TS＝<V ^TA,V ^SY,E ^TS>，其中E ^TS表示节点V ^TA和节点V ^SY之间的边集合，G ^TS表示任务节点和系统节点之间的对应关系。

进一步地，所述指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>；所述系统节点和指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中E ^SC表示节点V ^SY和节点V ^C2之间的边集合，G ^SC表示系统节点和指控节点之间的对应关系。

进一步地，所述作战体系架构的拓扑模型由三类节点与五类关系构成的异构网络GA，记为GA＝<V ^TA,V ^SY,V ^C2,E ^TA,E ^SY,E ^C2,E ^TS,E ^SC>；所述作战体系架构的开发花费代价定义为c，且c∈C，C表示代价空间，所述作战体系架构的潜在能力定义为w，作战体系架构具有一定完成使命的能力w∈W，W表示作战体系架构具有的完成使命的能力；所述作战体系架构模型由作战体系架构的拓扑模型、开发代价和能力组成，记为<GA,C,W>。

本发明还提供一种作战体系架构方案空间探索算法，所述探索算法基于作战体系架构空间的动态规划，且该算法通过判断定义的指标来进行动作选择，具备包括以下步骤：

1)、判定指标，基于经典潘多拉规则，定义每个决策者执行不同行动的决策指标：

推导出：

根据状态

和指标集合

设计一种简单且最优的搜索规则；其中，k表示方案，每一个方案代表一个作战体系架构，K _n表示第n个决策者的方案集合，m表示行动，M _k表示第k个方案的行动集合，

表示第n个决策者第k个方案的第n个行动的决策指标，

表示第n个决策者第k个方案的第n个行动对应的开发花费代价，

表示每个方案的回报值x服从概率分布，x _k表示方案k的回报值；

2)、搜索算法，根据步骤1)中的搜索规则，将最优方案的计算简化为指标的判断，所述搜索算法包括单个决策者搜索算法和多个决策者之间的合作算法；

3)、将单决策者搜索算法分为指标排序、指标判断、方案选择三个阶段，并在Sorting程序，根据公式

计算所有架构中所有动作的指标，然后对该指标进行排序，并将排序结果保存至向量，然后调用Developing程序求得最优架构方案；其中，y _n表示第n个决策者的最大回报值，D _n表示已开发架构集合。

进一步地，步骤2)中每个所述指标的计算均是独立的，且所述指标不受其他作战体系架构回报值概率分布的影响。

本发明还提供一种作战体系架构方案空间探索方法，包括：

将作战体系使命分解为由装备系统执行的任务网络；

给出任务节点与系统节点之间的对应关系，并根据任务网络和任务节点与系统节点之间的对应关系构建系统网络，其中，系统节点为具有特定功能并能够独立完成特定任务的装备，记为SY；任务节点为由装备系统执行的活动过程，记为TA；

给出系统节点和指控节点之间的对应关系，并根据该关系建立指控网络，并结合任务网络、系统网络构建成作战体系架构模型；其中，指控节点为用于处理信息、管理组织、决策规划和控制反馈的逻辑节点，指控节点表示为C2，指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>，系统节点与指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中，G ^C2表示指控网络，V ^C2表示指控节点，E ^C2表示V ^C2节点之间的边集合，G ^SC表示系统节点与指控节点之间的对应关系，V ^SY表示系统节点，E ^SC表示节点V ^SY和节点V ^C2之间的边集合；

根据作战体系架构模型和决策者n，构建作战体系架构的空间探索问题模型，其中，决策者n∈N,N＝{1,2,...,|N|}，第n个决策者记为Agent n；其中，Agent n表示第n个决策者的方案空间，每个方案空间包括多种作战体系架构，作战体系架构用于对作战体系进行描述；N表示决策者空间，|N|表示决策者的数量；

根据作战体系架构的空间探索问题模型，将作战体系架构的空间探索问题模型中的决策者问题转换为动态规划问题；

采用探索算法进行作战体系架构空间的动态规划；其中，探索算法包括单个决策者搜索算法和多个决策者之间的合作算法；单个决策者搜索算法包括指标排序、指标判断、方案选择三个阶段；

采用单个决策者搜索算法进行作战体系架构空间的动态规划，具体包括：

基于潘多拉规则，确定每个决策者执行不同行动的决策指标：

式中，决策指标集合为

k表示方案，每一个方案代表一个作战体系架构，K _n表示第n个决策者的方案集合，m表示行动，M _k表示第k个方案的行动集合，

表示第n个决策者第k个方案的第n个行动的决策指标，

对每个决策者执行不同行动的决策指标进行排序；

将最大决策指标对应的作战体系架构添加至已开发架构集合，更新未开发架构集合；已开发架构集合与未开发架构集合的并集为决策者方案空间；

确定已开发架构集合中的作战体系架构的空间探索问题模型对应的回报值；

判断回报值是否大于或等于未开发架构集合中作战体系架构对应的最大决策指标，得到第一判断结果；

若第一判断结果为是，则根据公式

确定已开发架构集合中最大回报值对应的作战体系架构为最终方案；其中，y _n表示第n个决策者的最大回报值，D _n表示已开发架构集合；

若第一判断结果为否，则将未开发架构集合中的最大决策指标对应的作战体系架构添加至已开发架构集合，更新未开发架构集合，然后返回步骤“确定已开发架构集合中的作战体系架构的空间探索问题模型对应的回报值”。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明的基于超网络模型的作战体系架构建模方法，基于体系架构能力生成要素，根据作战体系架构的形式化定义、多Agent动态规划问题以及作战体系架构方案空间探索问题框架，能够构建出具多架构方案选取的作战体系架构模型，便于决策者做出最佳选择；该作战体系架构方案空间探索算法，为基于决策指标的并行搜索算法，该算法为多项式时间的，其回报值明显优于其他基准算法，其在作战体系架构方案空间独立情况的假设下是最优的。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中任务网络示意图；

图2是本发明实施例中系统网络示意图；

图3是本发明实施例中指控网络示意图；

图4是本发明实施例中三类网络映射关系示意图，图4a为“任务-系统”二分图，图4b为“系统-指控”二分图；

图5是本发明实施例中架构效果的可能状态之间的转移关系示意图；

图6为本发明实施例中对基于决策指标的顺次搜索算法进行分析实验的实验数据分析图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的所述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例

基于超网络模型的作战体系架构建模方法，根据能力生成机理，将任务、装备系统和指控结构作为作战体系架构的核心要素，作战体系架构由任务网络、系统网络和指控网络三种异构网络组成，具体包括以下步骤：

S1、将作战体系使命分解为可由装备系统执行的任务网络。

S2、给出任务节点与系统节点之间的对应关系，并根据任务网络和任务节点与系统节点之间的对应关系构建系统网络，其中，系统节点为具有特定功能并能够独立完成特定任务的装备，记为SY。任务节点为可由装备系统执行的活动过程，记为TA。

S3、给出系统节点和指控节点之间的对应关系，并根据该关系建立指控网络，并结合任务网络、系统网络构建成作战体系架构模型。其中，指控节点为用于处理信息、管理组织、决策规划和控制反馈的逻辑节点，表示为C2，指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>，系统节点与指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中E ^SC表示节点V ^SY和节点V ^C2之间的边集合。

S4、根据作战体系架构模型和决策者n，构建作战体系架构的空间探索问题模型，其中，决策者n∈N,N＝{1,2,...,|N|}，第n个决策者记为Agent n。

S5、根据作战体系架构搜索问题模型，将作战体系搜索问题模型中的决策者问题转换为一种形式化的动态规划问题。

在本实施例中，作战体系架构潜在能力为根据作战体系架构开发的作战体系所具备的完成特定使命的能力，记为W。

在数学上，架构潜在能力的不确定性可以用概率分布表示，即W服从某种概率分布。此外，本文认为超网络是连接多种类型节点的异构网络。基于超网络的作战体系架构是由任务网络、系统网络和指控网络三种异构网络组成的。为了完成作战体系使命，将使命分解为一系列可执行的任务，称为任务网络，如图1所示，为一个任务网络的示例。在作战体系架构中，具有特定功能的装备系统用于完成特定任务，因而系统节点(例如无人机、坦克和舰艇)之间的关系受任务节点的影响，如图2所示，其为一个系统网络的例子，表示了系统功能之间的逻辑关系。如图4所示，表示任务网络与系统网络的对应关系，图4a为“任务-系统”二分图，图4b为“系统-指控”二分图。

指控节点用于处理上级和下级的指令信息。例如，从上级指控节点接收任务信息，经过本节点处理后将子任务信息传递给下级指控节点。另一方面，保持与同级指控节点之间的信息交互。因此，指控网络是指通过指令关系连接所有指控节点的组织网络，如图3所示，其为指控网络的一个例子。

在本实施例中，根据作战体系架构的拓扑模型定性可以得到，若节点越多、连接关系越复杂，作战体系架构开发的代价将会越大，而架构潜在能力可能越大。

本实施例中的作战系统能力由回报值度量，是对作战体系架构开发代价与集群执行侦察策略所得收益的综合度量。每个方案的回报值x服从概率分布W(x)，不同方案的回报值相互独立。其中k _n∈K _n,K _n＝{1,2,…,|K _n|}， K _n为Agent n的方案空间中的方案数量。另外，有些Agent的方案空间存在交集，此时

也有可能不存在交集，此时

每个架构的回报值事先是不确定的，但可以通过不同行动获得。对于同一种方案k，Agent n可以采用行动

进行开发。不断探索未开发方案空间中的方案，最后在所有已开发的方案空间中选择一个方案作为最终选项。Agent的目标是选择一个具有最高预期回报值和最少累积搜索成本的架构。

在本实施例中，作战体系架构状态为作战体系架构在开发过程中的形态，包括未开发状态和已开发状。如图5所示，其表示一个作战体系架构状态转移关系。其中，未知状态表明该方案尚未开发，其回报值是未知的；已知状态表明该方案已经被开发，并且其回报值是已知的。基于此，基于作战体系架构空间探索问题模型的形式化描述，具体地，定义两类二元决策变量的集合：

当Agent n采用行动a开发架构k时

开发代价为

否则

表示第n个Agent是否采取行动a开发架构k，当Agent n最终采用行动m开发架构k为最终架构方案时

表示是否最终选取第n个Agent以行动m开发架构k，否则

w表示能力值。作战体系架构空间探索问题模型的形式化描述如下：

CSoSAS:

S.t.

目标函数为最大化已开发架构的回报值与最小化累积搜索成本的加和。具体而言，约束(a)确保对于任意Agent的方案空间，方案要么已经开发，要么未开发。约束(b)表示如果Agent最终选择了一个方案，那么必须已经开发了该方案。约束(c)表示每个Agent最终只选择一个方案。约束(d)表示两类决策变量的值空间。约束(e)表示对于每个方案，每个Agent执行不同动作的成本。

在本实施例中，根据作战体系架构搜索问题，将该问题转换为一种形式化的动态规划问题。以Agent n为例进行说明，在动态规划中，首先将其方案空间

划分为两个互斥的集合：一个是不断增长的已开发架构集合

另一个是一组递减的未开发架构

作战体系架构方案空间是预先获知的，是决策者面向特定使命特定领域得到的，其重点是寻找使目标函数最大化的方案。对于每次决策，Agent n可以选择是否从集合

中选择和开发未知方案，或者停止搜索并从集合D _n中选择一个最终方案。如果Agent选择继续搜索，那么它有M _k种类型的行动开发架构k。如果Agent n停止搜索，则在已开发方案空间中选择具有最高回报值的方案：

在任意时刻，Agent n的状态被定义为统计

所有Agent未开发架构空间定义为

所有Agent的已开发方案空间的最高回报值为y＝{y ₁,y ₂,...,y _N}，那么系统的状态被定义为

此外，定义状态评估函数

为当最大已知回报值为y且未开发架构集合为

时，从该时刻按照最优策略能够获得的期望折扣值。对于每个子集

和最大已知回报值y，状态评估函数

需要满足基本的迭代关系。

OSoSAS:

where

变量

表示在状态

下执行行动m后的状态评估函数，c _m,k表示所有Agent执行行动m _k开发架构k _n的代价，

进一步，Agent需要比较不同动作产生的期望值，选择和执行具有最大期望回报值的动作。以行动m为例，如果回报值x _k≤y，那么当前最高回报值将不改变，期望状态评估值为

如果x _k＞y，那么当前的最高回报值将更新为x，期望状态评估值为

任务网络可抽象为有向图，记为G ^TA＝<V ^TA,E ^TA>，其中，V ^TA表示任务节点集合，E ^TA表示节点之间的边集合。每个任务网络均具有起始任务节点、结束任务节点和中间节点。任务网络包括因果关系和并列关系两类逻辑关系。

系统网络表示系统节点之间的功能关系，记为G ^SY＝<V ^SY,E ^SY>，其中V ^SY表示系统节点集合，E ^SY表示系统节点之间的边集合。任务节点和系统节点之间的对应关系定义为二分图，记为G ^TS＝<V ^TA,V ^SY,E ^TS>，其中E ^TS表示节点V ^TA和节点V ^SY之间的边集合。

指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>。系统节点和指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中E ^SC表示节点V ^SY和节点V ^C2之间的边集合。

作战体系架构的拓扑模型由三类节点与五类关系构成的异构网络GA，记为GA＝<V ^TA,V ^SY,V ^C2,E ^TA,E ^SY,E ^C2,E ^TS,E ^SC>。作战体系架构的开发花费代价定义为c，且c∈C，作战体系架构的潜在能力定义为w，作战体系架构具有一定完成使命的能力w∈W。作战体系架构模型由作战体系架构的拓扑模型、开发代价和能力组成，记为<GA,C,W>。

实施例2：本发明还提供一种作战体系架构方案空间探索算法，搜索算法基于作战体系架构空间的动态规划，且该算法通过判断定义的指标来进行动作选择，具备包括以下步骤：

推导出：

根据状态

和指标集合

设计一种简单且最优的搜索规则。

2)、搜索算法，根据步骤1)中的搜索规则，将最优方案的计算简化为指标的判断，搜索算法包括单个决策者搜索算法和多个决策者之间的合作算法。

计算所有架构中所有动作的指标,然后对改指标进行排序，并将排序结果保存至向量，然后调用Developing程序求得最优架构方案。

步骤2)中每个指标的计算均是独立的，且指标不受其他作战体系架构回报值概率分布的影响。

在SequenceSearching程序中，最多经过K次迭代就可以计算得到最优架构方案。根据设定的规则，每轮迭代中将当前最大采样值与最大指标进行对比。如果最大采样值不小于最大指标，则停止搜索，并将具有当前最大采样回报值的架构m作为选择的架构。反之，则根据对应的架构索引i和动作a，执行程序继续搜索。如果获得了架构i的采样回报值，则更新变量，其中表示去除集合中的架构i。

在Executing程序中，如果采取的动作是咨询，则判断是否能够通过相关机构获得架构i的回报值，即判断是否为true。其中“～”表示采样，表示对概率分布进行采样。

在本实施例中，基于决策指标的顺次搜索算法是一种多项式时间算法。该算法的时间复杂度取决于排序算法的时间复杂度。在算法中，Agent是基于架构指标值的大小顺序执行相应动作，而这个顺序的在整个搜索过程中是不会发生改变的。因此，本发明提出的算法复杂度等于排序算法的复杂度，故该算法是一种多项式时间算法成立。

基于决策指标的顺次搜索算法选取的每个方案都是条件最优的，且该算法具有局部最优性。在作战体系架构问题中每个方案的选取能够映射至经典的潘多拉问题，在潘多拉问题中，每个项目的回报值都服从一个概率分布，在运行项目之前是不知道项目的实际回报值的，需要通过采样得到实际回报值。在作战体系中，每个已经架构可以看成是一个项目k，该项目具有采样回报值rk。一旦获得了方案k的采样回报值，这三个项目就被移入已探索的集合D。作战体系架构搜索问题模型使用基于指标的搜索策略，即如果Agent要探索新方案，则选择指标最高的未探索方案，否则选择具有最大采样回报值的已探索方案。则证明这种搜索策略可以有效地解决潘多拉问题并得到最好的期望回报值。

本发明还提供一种作战体系架构方案空间探索方法，包括：

将作战体系使命分解为由装备系统执行的任务网络；

式中，决策指标集合为

表示第n个决策者第k个方案的第n个行动的决策指标，

对每个决策者执行不同行动的决策指标进行排序；

若第一判断结果为是，则根据公式

以下为基于仿真实验对基于决策指标的顺次搜索算法进行分析的实验：

实验设置：假设为了完成某一使命，如边境巡逻、持续侦察、电磁干扰，需要派遣一个无人机集群前往目标区域执行任务。对于这样的新使命，如何建设无人机集群，如何规划集群任务序列，是指挥人员需要解决的问题。面向使命能力的技术方案一般是自顶向下的思路，最后转为基于多Agent系统的求解方法：首先将使命分解为任务网络；其次具有某些功能的无人机能够完成特定任务，从而构建任务域无人机之间的映射关系；再者无人机之间是具有指控关系的，从而构建指控网络；最后建立多Agent系统模型，每个Agent具有任务列表、特定功能、指控关系，这样的多Agent系统就是一种装备体系架构方案。为使体系作战效能达到最高，需要选择最优的架构方案。

为了评估GSDP(Greedy Search based Dynamic Planning，基于贪婪搜索的动态规划)算法的性能，定义如下统计指标：(1)平均效能Reward，即公式：

CSoSAS:

S.t.

描述的目标函数，其中一次仿真的效能为架构的回报值与累积代价值之差；(2)已知架构次数Number，已开发架构的平均次数；(3)运行时间Time，记录程序运行的时间。其中，平均效能用于评估算法的性能，咨询次数和已知架构次数用于分析搜索过程。

为了对比GSDP算法的性能，设计在OAS问题框架下的四种基准算法。(1)随机算法(Random Algorithm，RA)，即Agent在每个时刻随机选择一个动作。具体地，先在集合K中随机选择一个架构k。如果k∈D，即架构已被开发，则结束搜索，并获得该架构的回报值；如果

即架构k的未开发且回报值未知，随机选择一个行动，之后返回并继续执行随机动作，直至搜索结束。(2)遍历开发算法(Traversal Development Algorithm，TDA)，即Agent将开发所有的架构，获得每个架构的采样回报值。对于一个未开发的架构k，Agent选择代价最小的动作进行开发，

当Agent完成了所有架构的开发，选择所有已开发架构中回报值最高的架构作为最终方案。(3)通用开发算法(General Development Algorithm,GEA)，类似于采用指标判断的算法。局部探索算法的评判指标是最高期望值与开发代价之差，即

当已开发架构中的最高回报值已经超过该指标，则停止搜索并选择具有最高回报值的架构。

实验结果：

设计四个场景用以评估架构空间的可扩展性，架构方案数量分别为K＝{20,100,1000,10000}，开发每个架构有3种行动，每种行动的代价分别服从三种均匀分布U ₁(1,3),U2(0.5,4),U3(1.5,2.5)，每种架构的回报值服从概率分布W _k(w _k)～U(a _k,b _k)，其中，a _k～U(50,60)，b _k～U(90,100)。考察Agent的数量，选择的方案数NoS(NoS为选择的方案数量，即多Agent系统最终选择多少个方案)，为1到10时，各个算法的性能指标。图6为基于决策指标的顺次搜索算法进行分析实验的实验数据分析图。

场景B1：在包含K＝20个架构的方案空间中探索，选择最优架构，如下表p1所示，LEA为局部遍历算法。

表p1

场景B2：在包含K＝10 ⁴个架构的方案空间中探索，选择最优架构，如下表p2所示。

表p2

场景B3：在包含K＝10 ⁶个架构的方案空间中探索，选择最优架构，如下表p3所示。

表p3

在本实施例中，本发明提供的基于超网络模型的作战体系架构建模方法，基于体系架构能力生成要素，根据作战体系架构的形式化定义、多Agent动态规划问题以及作战体系架构方案空间探索问题框架，能够构建出具多架构方案选取的作战体系架构模型，便于决策者做出最佳选择；该作战体系架构方案空间探索算法，为基于决策指标的并行搜索算法，该算法为多项式时间的，其回报值明显优于其他基准算法，其在作战体系架构方案空间独立情况的假设下是最优的。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

Claims

基于超网络模型的作战体系架构建模方法，根据能力生成机理，将任务、装备系统和指控结构作为作战体系架构的核心要素，所述作战体系架构由任务网络、系统网络和指控网络三种异构网络组成，其特征是：具体包括以下步骤：

S1、将作战体系使命分解为可由装备系统执行的任务网络；

S2、给出任务节点与系统节点之间的对应关系，并根据任务网络和任务节点与系统节点之间的对应关系构建系统网络，其中，系统节点为具有特定功能并能够独立完成特定任务的装备，记为SY；任务节点为可由装备系统执行的活动过程，记为TA；

S3、给出系统节点和指控节点之间的对应关系，并根据该关系建立指控网络，并结合任务网络、系统网络构建成作战体系架构模型；其中，指控节点为用于处理信息、管理组织、决策规划和控制反馈的逻辑节点，表示为C2，指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>，系统节点与指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中E ^SC表示节点V ^SY和节点V ^C2之间的边集合；

S4、根据作战体系架构模型和决策者n，构建作战体系架构的空间探索问题模型，其中，决策者n∈N,N＝{1,2,...,|N|}，第n个决策者记为Agent n；

S5、根据作战体系架构搜索问题模型，将作战体系搜索问题模型中的决策者问题转换为一种形式化的动态规划问题。
根据权利要求1所述的基于超网络模型的作战体系架构建模方法，其特征是，所述任务网络可抽象为有向图，记为G ^TA＝<V ^TA,E ^TA>，其中，V ^TA表示任务节点集合，E ^TA表示节点之间的边集合；每个所述任务网络均具有起始任务节点、结束任务节点和中间节点；所述任务网络包括因果关系和并列关系两类逻辑关系。
根据权利要求1所述的基于超网络模型的作战体系架构建模方法，其特征是，所述系统网络表示系统节点之间的功能关系，记为G ^SY＝<V ^SY,E ^SY>，其中V ^SY表示系统节点集合，E ^SY表示系统节点之间的边集合；所述任务节点和系统节点之间的对应关系定义为二分图，记为G ^TS＝<V ^TA,V ^SY,E ^TS>，其中E ^TS表示节点V ^TA和节点V ^SY之间的边集合。
根据权利要求1所述的基于超网络模型的作战体系架构建模方法，其特征是，所述指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>；所述系统节点和指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中E ^SC表示节点V ^SY和节点V ^C2之间的边集合。
根据权利要求1所述的基于超网络模型的作战体系架构建模方法，其特征是，所述作战体系架构的拓扑模型由三类节点与五类关系构成的异构网络GA，记为GA＝<V ^TA,V ^SY,V ^C2,E ^TA,E ^SY,E ^C2,E ^TS,E ^SC>；所述作战体系架构的开发花费代价定义为c，且c∈C，所述作战体系架构的潜在能力定义为w，作战体系架构具有一定完成使命的能力w∈W；所述作战体系架构模型由作战体系架构的拓扑模型、开发代价和能力组成，记为<GA,C,W>。
一种作战体系架构方案空间探索算法，基于权利要求1至5任意一项所述的基于超网络模型的作战体系架构建模方法，其特征是：所述搜索算法基于作战体系架构空间的动态规划，且该算法通过判断定义的指标来进行动作选择，具备包括以下步骤：

1)、判定指标，基于经典潘多拉规则，定义每个决策者执行不同行动的决策指标：

推导出：

根据状态
和指标集合
设计一种简单且最优的搜索规则；

2)、搜索算法，根据步骤1)中的搜索规则，将最优方案的计算简化为指标的判断，所述搜索算法包括单个决策者搜索算法和多个决策者之间的合作算法；

3)、将单决策者搜索算法分为指标排序、指标判断、方案选择三个阶段，并在Sorting程序，根据公式
计算所有架构中所有动作的指标,然后对改指标进行排序，并将排序结果保存至向量，然后调用Developing程序求得最优架构方案。
根据权利要求6所述的一种作战体系架构方案空间探索算法，其特征是：步骤2)中每个所述指标的计算均是独立的，且所述指标不受其他作战体系架构回报值概率分布的影响。
一种作战体系架构方案空间探索方法，其特征是：方法包括：

将作战体系使命分解为由装备系统执行的任务网络；

给出任务节点与系统节点之间的对应关系，并根据任务网络和任务节点与系统节点之间的对应关系构建系统网络，其中，系统节点为具有特定功能并能够独立完成特定任务的装备，记为SY；任务节点为由装备系统执行的活动过程，记为TA；

给出系统节点和指控节点之间的对应关系，并根据该关系建立指控网络，并结合任务网络、系统网络构建成作战体系架构模型；其中，指控节点为用于处理信息、管理组织、决策规划和控制反馈的逻辑节点，指控节点表示为C2，指控网络为通过指令关系连接所有指控节点的组织网络，记为G ^C2＝<V ^C2,E ^C2>，系统节点与指控节点之间的对应关系定义为二分图，记为G ^SC＝<V ^SY,V ^C2,E ^SC>，其中，G ^C2表示指控网络，V ^C2表示指控节点，E ^C2表示V ^C2节点之间的边集合，G ^SC表示系统节点与指控节点之间的对应关系，V ^SY表示系统节点，E ^SC表示节点V ^SY和节点V ^C2之间的边集合；

根据作战体系架构模型和决策者n，构建作战体系架构的空间探索问题模型，其中，决策者n∈N,N＝{1,2,...,|N|}，第n个决策者记为Agent n；其中，Agent n表示第n个决策者的方案空间，每个方案空间包括多种作战体系架构，作战体系架构用于对作战体系进行描述；N表示决策者空间，|N|表示决策者的数量；

根据作战体系架构的空间探索问题模型，将作战体系架构的空间探索问题模型中的决策者问题转换为动态规划问题；

采用探索算法进行作战体系架构空间的动态规划；其中，探索算法包括单个决策者搜索算法和多个决策者之间的合作算法；单个决策者搜索算法包括指标排序、指标判断、方案选择三个阶段；

采用单个决策者搜索算法进行作战体系架构空间的动态规划，具体包括：

基于潘多拉规则，确定每个决策者执行不同行动的决策指标：

式中，决策指标集合为
k表示方案，每一个方案代表一个作战体系架构，K _n表示第n个决策者的方案集合，m表示行动，M _k表示第k个方案的行动集合，
表示第n个决策者第k个方案的第n个行动的决策指标，
表示第n个决策者第k个方案的第n个行动对应的开发花费代价，
表示每个方案的回报值x服从概率分布，x _k表示方案k的回报值；

对每个决策者执行不同行动的决策指标进行排序；

将最大决策指标对应的作战体系架构添加至已开发架构集合，更新未开发架构集合；已开发架构集合与未开发架构集合的并集为决策者方案空间；

确定已开发架构集合中的作战体系架构的空间探索问题模型对应的回报值；

判断回报值是否大于或等于未开发架构集合中作战体系架构对应的最大决策指标，得到第一判断结果；

若第一判断结果为是，则根据公式
确定已开发架构集合中最大回报值对应的作战体系架构为最终方案；其中，y _n表示第n个决策者的最大回报值，D _n表示已开发架构集合；

若第一判断结果为否，则将未开发架构集合中的最大决策指标对应的作战体系架构添加至已开发架构集合，更新未开发架构集合，然后返回步骤“确定已开发架构集合中的作战体系架构的空间探索问题模型对应的回报值”。