WO2020181934A1

WO2020181934A1 - 一种基于粒子群算法确定目标对象位置的方法和装置

Info

Publication number: WO2020181934A1
Application number: PCT/CN2020/073825
Authority: WO
Inventors: 林炳文
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2019-03-11
Filing date: 2020-01-22
Publication date: 2020-09-17
Also published as: CN109961130A

Abstract

一种基于粒子群算法确定目标对象位置的方法和装置，其中，所述方法包括：确定粒子群中每个粒子的速度和位置（100）；根据更新后的粒子的速度和位置，计算每个粒子的适应度值，并根据适应度值的大小进行排序，由排序结果中选择部分粒子进入交叉池，该部分粒子是根据粒子群规模和交叉概率得到（102）；由所述交叉池中选择粒子进行交叉（104）；对所述粒子群中的粒子进行变异（106）；判断是否满足粒子群算法的终止条件（108）；当不满足粒子群算法的终止条件时，则返回到步骤（100），当满足粒子群算法的终止条件时：则得到最优解（110）。

Description

一种基于粒子群算法确定目标对象位置的方法和装置

技术领域

本公开涉及机器学习技术领域，特别涉及一种基于粒子群算法确定目标对象位置的方法和装置。

背景技术

粒子群算法是一种通过模拟鸟群觅食过程中的迁徙和群聚行为，而提出的一种基于群体智能的全局随机搜索算法。粒子群算法的应用场景较多，其中一种应用场景可以是用于搜索某个对象的位置，该对象可以称为目标对象。传统的粒子群算法，可以从随机解出发，通过迭代寻找最优解作为目标对象的位置。但是这种算法经常容易陷入局部最优解，并且收敛速度并不理想，影响了对目标对象位置搜索的效率和准确性。

发明内容

有鉴于此，本说明书一个或多个实施例提供一种基于粒子群算法确定目标对象位置的方法和装置，以提高位置搜索的效率和准确性。

具体地，本说明书一个或多个实施例是通过如下技术方案实现的：

第一方面，提供一种基于粒子群算法确定目标对象的位置的方法，所述方法包括：

确定粒子群中每个粒子的速度和位置；

根据所述速度和位置，确定所述每个粒子的适应度值，所述适应度值与所述粒子和目标对象之间的距离相关；

根据所述适应度值的大小，对所述粒子群中各个粒子的适应度值排序，并由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，以由所述交叉池中选择粒子进行交叉；

对所述粒子群中的粒子进行变异；

当满足粒子群算法的终止条件时，将粒子群算法的最优解对应的位置作为所述目标对象的所在位置。

第二方面，提供一种基于粒子群算法确定目标对象的位置的装置，所述装置包括：

数据确定模块，用于确定粒子群中每个粒子的速度和位置；

交叉处理模块，用于根据所述速度和位置，确定所述每个粒子的适应度值，所述适应度值与所述粒子和目标对象之间的距离相关；并根据所述适应度值的大小，对所述粒子群中各个粒子的适应度值排序，并由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，以由所述交叉池中选择粒子进行交叉；

变异处理模块，用于对所述粒子群中的粒子进行变异；

位置确定模块，用于当满足粒子群算法的终止条件时，将粒子群算法的最优解对应的位置作为所述目标对象的所在位置。

第三方面，提供一种基于粒子群算法确定目标对象的位置的设备，所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本说明书任一实施例所述的基于粒子群算法确定目标对象位置的方法步骤。

本说明书一个或多个实施例的方法和装置，通过将交叉和变异引入粒子群算法，提高了收敛速度，并且找到的最优解效果更好。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例提供的一种基于粒子群算法确定目标对象的位置的方法；

图2为初始化时的飞行机器人群体；

图3至图5为飞行机器人搜索生命信号的过程示意图；

图6为本说明书一个或多个实施例提供的一种基于粒子群算法确定目标对象位置的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是一部分实施例，而不是全部的实施例。基于本说明书一个或多个实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

粒子群算法是一个用于求解最优解的算法，该粒子群算法的应用场景较为广泛，例如，可以用于求解路线规划中的最短路径；或者，还可以用于求解商业利润项目中的最小费用，等。可以根据需要解决的不同问题，构造对应的不同函数，该函数可以称为适应度函数，粒子群中的每个粒子都可以根据该适应度函数计算得到一个适应度值，以通过适应度值衡量粒子相对于某个问题目标的优劣。

本说明书至少一个实施例提供了一种结合遗传算法改进的粒子群算法，将遗传算法中的交叉和变异引入到粒子群。其中，遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。

图1为本说明书至少一个实施例提供的一种基于粒子群算法确定目标对象位置的方法，如图1所示，该方法可以包括如下处理：

在步骤100中，确定粒子群中每个粒子的速度和位置。

例如，本步骤可以包括如下的处理：

首先，初始化粒子群，包括群体规模，粒子群中每个粒子的位置和速度。

本步骤中，初始化粒子群的群体规模，例如，该粒子群中共有M个粒子。

并且，还可以初始化每个粒子的位置和速度，其中，粒子的位置可以是一个向量X _i＝(x _i1,x _i2,…,x _iD)，i＝1、2...M；粒子的速度可以表示成向量：V _i＝(v _i1,v _i2，…,v _iD)，i＝1、2....M。其中，D表示该粒子群算法搜索最优解的搜索空间是一个D维的搜索空间。

初始的粒子位置和速度可以是随机设定。

其次，计算每个粒子的适应度值。

本步骤中，适应度值每个粒子根据适应度函数计算得到的数值，不同的应用场景可以构造不同的适应度函数。在粒子群中，初始化时的每一个粒子都相当于一个随机解，在粒子群的迭代更新过程中，每个粒子都是一个潜在的最优解。如果一个粒子的适应度值较高，表示该粒子距离最优解越近，在搜索最优解的过程中属于性能较好的粒子。

可以用F _it[i]表示粒子群中第i个粒子的适应度值。

接着，每个粒子通过将自己的适应度值与个体极值和全局极值进行比较，更新所述粒子的速度和位置。

其中，第i个粒子迄今为止搜索到的最优位置称为个体极值，记为p _best(i)。

整个粒子群迄今为止搜索到的最优位置为全局极值，记为g _best。

粒子群算法是通过多次迭代找到最优解，其中，在每一次的迭代中，每个粒子可以通过跟踪两个极值更新自己的位置和速度：一个极值就是粒子本身所找到的最优解，即上述的个体极值；另一个极值是整个粒子群找到的最优解，即上述的全局极值。

其中，粒子的位置是适应度函数中的其中一个参数，该位置可以认为就是适应度函数的解，如果两个粒子比较，一个粒子的适应度值比另一个粒子的适应度值更优，则该适应度值更优的粒子对应的位置也是更好的解。

每个粒子可以将计算得到的自己的适应度值与个体极值和全局极值进行比较，以更新所述粒子的速度和位置，如下：

将粒子的适应度值与个体极值比较，如果该适应度值大于个体极值，则用所述粒子的位置替换掉所述个体极值。将所述粒子的适应度值与全局极值比较，若所述适应度值大于全局极值，则用所述粒子的位置替换掉所述全局极值。

以全局极值为例来说：假设适应度函数f(x,y)＝x+y，其中(x,y)是粒子的位置坐标。整个粒子群在搜索全局极值时，是将最接近期望结果的适应度值对应的粒子位置作为最优位置即全局极值。比如，期望得到的f(x,y)＝1，而某一个粒子的位置是x＝0.5，y＝0.49，f(x,y)＝0.99，那么该适应度值与期望的适应度值的误差就是0.01。而可以预先设定误差范围是2％以内，那么该0.01的误差满足误差范围的条件，则f(x,y)＝0.99对应的位置(0.5,0.49)可以替换掉原来的全局极值。即，全局极值是一个粒子的位置，如果一个粒子的适应度值最接近标准答案，最接近最优解，则将该粒子的位置作为全局极值。

再根据更新后的所述个体极值和全局极值，更新所述粒子的速度和位置。可以按照如下的公式(1)和公式(2)进行粒子速度和位置的更新：

v _id＝v _id+c ₁r ₁(p _id-x _id)+c ₂r ₂(p _gd-x _id) (1)

x _id＝x _id+v _id (2)

其中，c ₁和c ₂为学习因子，也称加速常数(acceleration constant)，r ₁和r ₂为[0，1]范围内的均匀随机数。式(1)右边由三部分组成，第一部分为“惯性(inertia)”或“动量(momentum)”部分，反映了粒子的运动“习惯(habit)”，代表粒子有维持自己先前速度的趋势；第二部分为“认知(cognition)”部分，反映了粒子对自身历史经验的记忆(memory)或回忆(remembrance)，代表粒子有向自身历史最佳位置逼近的趋势；第三部分为“社会(social)”部分，反映了粒子间协同合作与知识共享的群体历史经验，代表粒子有向群体或邻域历史最佳位置逼近的趋势。v _id是粒子的速度，v _id∈[-v _max,v _max]，v _max是常数，由用户设定用来限制粒子的速度。r ₁和r ₂是介于[0,1]之间的随机数。

经过上述处理，可以得到更新后的粒子的速度和位置。

在步骤102中，根据更新后的粒子的速度和位置，计算每个粒子的适应度值，并根据适应度值的大小进行排序；由排序结果中选择部分粒子进入交叉池，该部分粒子是根据粒子群规模和交叉概率得到。

本步骤中，是由粒子群中选择要进行交叉的粒子，组成交叉池。例如，可以按照如下处理得到交叉池，但是需要说明的是，实际实施中不限制执行顺序。

首先，可以根据更新后的粒子的速度和位置，计算每个粒子的适应度值。该适应度值可以与粒子和目标对象之间的距离相关，例如，适应度值越大，表示粒子与目标对象之间的距离越接近。

接着，可以根据适应度值的大小进行排序。

然后，根据粒子群规模和交叉概率确定要进入交叉池的部分粒子。例如，可以由粒子群规模乘以交叉概率，得到交叉池中的粒子数目N。

再者，可以根据粒子数目N，由排序结果中选择适应度值较大的前N个粒子进入交叉池。

其中，交叉概率可以是一个人为设置的数据提取比例，在0至1之间。交叉池大小N＝粒子群规模M*交叉概率，比如，当前的粒子群共有100个粒子，交叉概率＝0.1，那么交叉池大小＝10。然后就选择前10个适应度值最好的粒子放入交叉池。交叉池中的粒子都是适应度值较高的，可以认为都是较好的解。这种生成交叉池的方式，可以避免选择到适应度较差的粒子做交叉粒子。

在步骤104中，由所述交叉池中选择粒子进行交叉。

本步骤是具体的交叉操作。

可以随机的由交叉池中选择两个不同的粒子，作为父代粒子进行实数交叉。

对交叉后得到的子代粒子计算适应度值。

如果所述子代粒子的适应度值比父代粒子的适应度值高，则由所述子代粒子的位置和速度取代父代粒子的位置和速度。否则，则父代粒子的位置和速度不改变。通过对粒子群中的粒子进行交叉操作，可以增加粒子的多样性，跳出局部最优，加快收敛速度。

举例来说：两个父代粒子交叉可以生成一个子代粒子，如果子代粒子比两个父代粒子的适应度值都高，那么该子代粒子就比父代粒子好。比如，假设两个父代粒子是父代粒子A和父代粒子B，上面的f(x,y)＝x+y，标准答案是f(x,y)＝1，那么如果父代粒子A的f(x,y)＝0.8，父代粒子B的f(x,y)＝0.7，如果子代粒子的f(x,y)＝0.9，那么这个子代粒子就比两个父代粒子都好。可以保留该子代粒子的位置，而父代粒子可以由粒子群中去除。粒子群大小保持不变，比如，初始时的粒子群规模是200，始终保持200。

通过对粒子进行交叉操作，并用产生的子代粒子取代父代粒子，使得子代粒子继承了父代粒子的优点，在理论上加强了对粒子间区域的搜索能力。例如，两个父代粒子均处于不同的局部最优区域，那么二者交叉产生的子代粒子往往能够摆脱局部最优，而获得改进的搜索结果。

在步骤106中，对所述粒子群中的粒子进行变异。

本步骤中，可以对所述粒子群中的粒子进行高斯变异。高斯变异的局部搜索能力较好。高斯变异是在进行变异时用一个均值为μ、方差为σ2的正态分布的一个随机数来替换原有的基因值。

其中，可以根据变异概率，随机的从整个粒子群中选择粒子进行高斯变异。例如，变异概率可以是0.5，一个粒子要变异前，获取一个0～1之间的随机值，如果该随机值大于0.5，则进行变异；否则，不变异。

计算变异后的粒子的适应度值，如果变异后粒子的适应度值比变异前粒子的适应度值更优，则可以用变异后粒子的位置和速度取代变异前粒子的位置和速度。否则，可以不改变。

在步骤108中，判断是否满足粒子群算法的终止条件。

本步骤可以检查是否满足粒子群算法的终止条件。

该终止条件可以是最终的全局极值计算出来的适应度值在满足的精度以内，比如，上面提到的例子中，假设适应度函数f(x,y)＝x+y，期望得到的f(x,y)＝1，一个粒子的位置是x＝0.5，y＝0.49，f(x,y)＝0.99，该适应度值与期望的适应度值的误差满足精度要求，该粒子位置可以作为全局极值，即粒子群找到的最优位置。粒子群算法的最优解就是全局极值。

若本步骤的判断结果是满足，则得到最优解，即步骤110。

否则，返回继续执行对粒子群中粒子的位置和速度的更新，即返回步骤100。并且，每次更新粒子的速度和位置后，都要重新计算粒子的适应度值。

在步骤110中，得到最优解。

通过上述例子，将交叉和变异引入粒子群算法，提高了收敛速度，并且找到的最优解效果更好。

如下将本说明书至少一个实施例的粒子群算法应用于搜索目标对象的位置，该目标对象例如可以是灾难救援中的生命，例如应用于飞行机器人搜索生命的应用场景中。

地震、火灾、矿难等灾难发生后，在废墟中搜寻定位幸存者，给予必要的医疗救助，以及尽快救出被困者是救援人员面临的三项紧迫任务。这其中，幸存者的搜寻定位显得尤为重要。生命搜索探测机器人可以很好地解决上述问题。在地震初期，为了规避地表的危险，可以采用飞行机器人完成生命的搜索探测。而考虑到废墟面积的大小以及搜索的效率，可以采用一群飞行机器人来完成生命的搜索定位。此类搜索方式比较类似鸟群的捕食方式，一群鸟在随机搜索食物时，在这个区域里只有一块食物，所有的鸟都不知道食物在那里。但是它们知道当前的位置离食物还有多远。此时就可以利用粒子群算法，通过使用飞行机器人搜索探测生命，快速探测到生命。

在本例子中，每一个飞行机器人可以具有存储功能和通信功能。

其中，每个飞行机器人自身可以进行粒子群算法的迭代处理，飞行机器人可以在算法的每一步迭代中更新自己找到的最优解，并将其保存。即每个飞行机器人自身可以找到并存储个体极值。因此，机器人可以具有简单的存储功能和算法的处理功能。

此外，根据粒子群算法，每个飞行机器人还可以根据自己的最优解和全局的最优解更新自己的速度和位置，所以机器人可以具有简单的通信功能，用于在机器人之间相互进行最优解的交互，从而获知全局极值。这样每个机器人就可以根据个体极值和全局极值更新速度和位置。

因此，每个飞行机器人可以包括电池、电动机等动力模块，提供机器人的运动功能。还可以包括通信模块，负责比较记录全局最优的位置。存储模块可以用于存储简单的程序指令和个体极值、全局极值。机器人还可以通过控制模块将计算出的速度作用于动力模块，驱动机器人飞行。

其中，在上述场景中，适应度值对应的适应度函数，是根据目标对象(例如，上述的幸存者生命)的位置搜索应用构造的函数，适应度值表示机器人接收到的生命发出的信号(例如，该信号可以是声音)强度的大小，信号越强，所述适应度值越大。适应度值越大时，表明该机器人距离生命越近，该机器人的位置就越优。个体极值是用于进行搜索的机器人与生命之间最近的位置，全局极值是所有机器人中与生命之间最近的位置。

示例性的，本例子中的适应度函数可以是：

在上面的公式(1)中，MaxZ可以是适应度值，s可以是该机器人接收到的信号强度，n是该机器人迭代的步数，i和j是该机器人的二维坐标，x是该机器人的位置，d是距离，x _ij的意思是节点i到节点j，d _ij的意思是节点i到节点j的距离。其中，节点i和节点j是该机器人运动的两个位置。

例如，飞行机器人可以认为是在二维空间中执行搜索任务，设机器人群体规模为m，群体中每个机器人i(1≤i≤m)有如下属性：第t步迭代时所处的位置xi(t)＝(xi1,xi2)，飞行速度vi(t)＝(vi1,vi2)，飞行机器人记住并实时更新自身与所搜索的生命最近的位置pi(个体极值)，第i个机器人所在邻域的(整个群体看作邻域)与搜索的生命的最近的位置pl(全局极值)。

接着，可以按照图1所示的算法流程，来执行机器人对生命的搜索。方法步骤可以结合参见图1，不再详述。

其中，请参见图2，图2是初始化时的飞行机器人的群体，图中的生命附近的区域21颜色最深，图中的小黑点是飞行机器人22，颜色的深浅表示机器人在该处时接收到的生命信号的强弱。比如，如果飞行机器人在颜色较浅的区域时，该机器人计算的适应度值较低，表示接收到的生命信号较弱。

随着算法的多次迭代，每一次迭代中，机器人都是跟踪个体极值和全局极值来更新自己的位置和速度，相当于在朝着更好的位置飞行。即飞行机器人在搜索过程中，受到自身和群体的牵引在移动位置。参见图3所示，经过迭代后，原本分布松散的飞行机器人逐渐向颜色深的区域靠拢了。

请参见图4和图5所示，随着迭代的继续进行，飞行机器人更加向生命信号强的地方靠拢，最终聚集在全局生命信号最强处，这就是全局极值的位置。粒子群算法得到了收敛，飞行机器人也找到了幸存的生命。

在该例子中，每个飞行机器人可以根据个体极值和全局极值更新自己的位置和速度，到执行交叉和变异的处理时，可以在这些飞行机器人之外设置一个中央处理设备，该中央处理设备可以接收每个飞行机器人发送的适应度值，并根据适应度值的大小进行排序；由排序结果中选择适应度值较大的前N个粒子进入交叉池。中央处理设备可以由所述交叉池中选择粒子进行交叉，并将交叉得到的子代粒子的速度和位置发送到对应的父代飞行机器人，以实现子代粒子取代父代粒子。中央处理设备还可以对所述粒子群中的粒子进行变异，并将变异后得到的粒子的位置和速度发送到对应的变异前粒子，以实现变异更新。当然，以上是一种示例性的实施场景，还可以采用其他方式，比如，由其中一个飞行机器人来执行上述中央处理设备的处理。

图6为本说明书至少一个实施例提供的一种基于粒子群算法确定目标对象的位置的装置的结构示意图，如图6所示，该装置可以包括：数据确定模块61、交叉处理模块62、变异处理模块63和位置确定模块64。

数据确定模块61，用于确定粒子群中每个粒子的速度和位置；

交叉处理模块62，用于根据所述速度和位置，确定所述每个粒子的适应度值，所述适应度值与所述粒子和目标对象之间的距离相关；并根据所述适应度值的大小，对所述粒子群中各个粒子的适应度值排序，并由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，以由所述交叉池中选择粒子进行交叉；

变异处理模块63，用于对所述粒子群中的粒子进行变异；

位置确定模块64，用于当满足粒子群算法的终止条件时，将粒子群算法的最优解对应的位置作为所述目标对象的所在位置。

在一个例子中，数据确定模块61，具体用于：将所述粒子的适应度值与个体极值比较，若所述适应度值大于个体极值，则用所述粒子的位置替换掉所述个体极值；将所述粒子的适应度值与全局极值比较，若所述适应度值大于全局极值，则用所述粒子的位置替换掉所述全局极值；根据更新后的所述个体极值和全局极值，更新所述粒子的速度和位置。

在一个例子中，变异处理模块63，具体用于对所述粒子群中的粒子进行高斯变异。

在一个例子中，所述粒子群中的粒子是用于进行搜索的机器人；所述个体极值是所述机器人与目标对象的最近位置；

所述全局极值是粒子群中的所有机器人与目标对象的最近位置；

所述适应度值，表示所述机器人接收到的目标对象发出的信号强度的大小，信号越强，所述适应度值越大。

上述方法实施例中所示流程中的各个步骤，其执行顺序不限制于流程图中的顺序。此外，各个步骤的描述，可以实现为软件、硬件或者其结合的形式，例如，本领域技术人员可以将其实现为软件代码的形式，可以为能够实现所述步骤对应的逻辑功能的计算机可执行指令。当其以软件的方式实现时，所述的可执行指令可以存储在存储器中，并被设备中的处理器执行。

上述实施例阐明的装置或模块，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书至少一个实施例还提供了一种基于粒子群算法确定目标对象的位置的设备，所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：

初始化粒子群中每个粒子的位置和速度；

计算所述每个粒子的适应度值；

对于所述每个粒子，通过将所述粒子的适应度值与个体极值和全局极值进行比较，更新所述粒子的速度和位置；

根据更新后的粒子的速度和位置，计算每个粒子的适应度值，并根据所述适应度值的大小进行排序；由排序结果中选择适应度值较大的前N个粒子进入交叉池，所述N由粒子群规模乘以交叉概率得到；所述N是自然数；所述适应度值越高，粒子和目标对象之间的距离越接近；

由所述交叉池中选择粒子进行交叉；

对所述粒子群中的粒子进行变异；

判断是否满足粒子群算法的终止条件，若满足，则将粒子群算法的最优解对应的位置作为目标对象的所在位置；否则，返回继续执行对粒子群中粒子的位置和速度的更新。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于数据采集设备或者数据处理设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

一种基于粒子群算法确定目标对象的位置的方法，所述方法包括：

确定粒子群中每个粒子的速度和位置；

根据所述速度和位置，确定所述每个粒子的适应度值，所述适应度值与所述粒子和目标对象之间的距离相关；

根据所述适应度值的大小，对所述粒子群中各个粒子的适应度值排序，并由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，以由所述交叉池中选择粒子进行交叉；

对所述粒子群中的粒子进行变异；

当满足粒子群算法的终止条件时，将粒子群算法的最优解对应的位置作为所述目标对象的所在位置。
根据权利要求1所述的方法，所述由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，包括：

由排序结果中选择适应度值较大的前N个粒子进入交叉池；

所述N是由粒子群规模乘以交叉概率得到。
根据权利要求1所述的方法，

所述确定粒子群中每个粒子的速度和位置，包括：

初始化粒子群中每个粒子的位置和速度；

计算所述每个粒子的适应度值；

对于所述每个粒子，通过将所述粒子的适应度值与个体极值和全局极值进行比较，更新所述粒子的速度和位置；

所述根据所述速度和位置确定所述每个粒子的适应度值，具体为：根据更新后的粒子的速度和位置，计算所述适应度值。
根据权利要求3所述的方法，所述每个粒子通过将自己的适应度值与个体极值和全局极值进行比较，更新所述粒子的速度和位置，包括：

将所述粒子的适应度值与个体极值比较，若所述适应度值大于个体极值，则用所述粒子的位置替换掉所述个体极值；

将所述粒子的适应度值与全局极值比较，若所述适应度值大于全局极值，则用所述粒子的位置替换掉所述全局极值；

根据更新后的所述个体极值和全局极值，更新所述粒子的速度和位置。
根据权利要求3所述的方法，所述粒子群中的粒子是用于搜索目标对象的机器人；

所述个体极值是所述机器人与目标对象的最近位置；

所述全局极值是粒子群中的所有机器人与目标对象的最近位置；

所述适应度值，表示所述机器人接收到的目标对象发出的信号强度的大小，信号越强，所述适应度值越大。
根据权利要求1所述的方法，所述对所述粒子群中的粒子进行变异，具体为：对所述粒子群中的粒子进行高斯变异。
根据权利要求1所述的方法，所述由交叉池中选择粒子进行交叉，包括：

随机的由所述交叉池中选择两个不同的粒子，作为父代粒子进行交叉；

对交叉后得到的子代粒子计算适应度值；

若所述子代粒子的适应度值比父代粒子的适应度值高，则由所述子代粒子取代父代粒子。
一种基于粒子群算法确定目标对象的位置的装置，所述装置包括：

数据确定模块，用于确定粒子群中每个粒子的速度和位置；

交叉处理模块，用于根据所述速度和位置，确定所述每个粒子的适应度值，所述适应度值与所述粒子和目标对象之间的距离相关；并根据所述适应度值的大小，对所述粒子群中各个粒子的适应度值排序，并由排序结果中选择适应度值较大的部分粒子进入交叉池，所述部分粒子根据粒子群规模和交叉概率确定，以由所述交叉池中选择粒子进行交叉；

变异处理模块，用于对所述粒子群中的粒子进行变异；

位置确定模块，用于当满足粒子群算法的终止条件时，将粒子群算法的最优解对应的位置作为所述目标对象的所在位置。
根据权利要求8所述的装置，

所述数据确定模块，在用于确定粒子群中每个粒子的速度和位置时，包括：初始化粒子群中每个粒子的位置和速度；计算所述每个粒子的适应度值；对于所述每个粒子，通过将所述粒子的适应度值与个体极值和全局极值进行比较，更新所述粒子的速度和位置；所述根据所述速度和位置确定所述每个粒子的适应度值，具体为：根据更新后的粒子的速度和位置，计算所述适应度值。
根据权利要求9所述的装置，所述粒子群中的粒子是用于进行搜索的机器人；所述个体极值是所述机器人与目标对象的最近位置；

所述全局极值是粒子群中的所有机器人与目标对象的最近位置；

所述适应度值，表示所述机器人接收到的目标对象发出的信号强度的大小，信号越强，所述适应度值越大。
根据权利要求8所述的装置，

所述变异处理模块，具体用于对所述粒子群中的粒子进行高斯变异。
一种基于粒子群算法确定目标对象的位置的设备，所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至7任一所述的方法步骤。