CN103301630A

CN103301630A - 足球机器人协调与合作控制方法及系统

Info

Publication number: CN103301630A
Application number: CN2013102377277A
Authority: CN
Inventors: 侯媛彬; 张晓文; 史晓茹; 康倩; 王维; 张永飞; 郝利波; 郭建彪; 付周兴; 郭长立; 李红岩; 焦妍君; 王党树; 张轶斌; 秦昶顺; 付佩祺; 杨曼
Original assignee: Xian University of Science and Technology
Current assignee: Xian University of Science and Technology
Priority date: 2013-06-16
Filing date: 2013-06-16
Publication date: 2013-09-18
Anticipated expiration: 2033-06-16
Also published as: CN103301630B

Abstract

本发明公开了一种足球机器人协调与合作控制方法及系统，其方法包括步骤：一、足球机器人根据量子免疫算法进行自定位，二、足球机器人根据博弈论算法在博弈对抗过程中进行协调与合作；其系统包括数据处理器、数据存储器、串口通信模块、无线网卡、1394控制卡、罗盘、里程计、全向视觉模块、智能功率模块、运动控制卡和电机驱动电路模块，电机驱动电路模块的输出端接有电机，电机上接有电机编码器，电机编码器和足球机器人踢球机构均与智能功率模块相接无线网卡上接有足球机器人教练机。本发明设计新颖合理，提高了多机器人之间协调配合的能力，提高了协作效率，增加了进球数目，提高了足球机器人比赛获胜的概率，使用效果好，便于推广使用。

Description

足球机器人协调与合作控制方法及系统

技术领域

本发明涉及机器人技术领域，尤其是涉及一种足球机器人协调与合作控制方法及系统。

背景技术

足球机器人对抗赛作为一个典型的多智能体系统，它为智能理论研究及多种技术的集成应用提供了良好的实验平台，对足球机器人在运动过程中能够根据周围环境的变化而自主的采取相应措施的能力要求也越来越强，这涉及到机器人定位、路径规划、协调控制、目标追踪及决策等一系列研究课题。

足球机器人对抗赛主要任务是根据获得的目标对象状态，包括目标对象的位置，朝向；竞赛场地中我方机器人的分布、对方机器人的分布、及其场地环境中的障碍物等位姿信息进行机器人协调合作；特别是对抗赛中，当机器人可能出现迷失自我的情况时，进行复杂的动态协调和合作控制问题。

目前，国外对足球机器人的研究已经进入了高智能化与多样化的发展和研究阶段，其关键技术的研究主要集中在以下几个方面：（1）足球机器人对抗决策；（2）足球机器人识别与定位技术；（3）足球机器人避障及路径规划；（4）多机器人之间的协作问题；（5）足球机器人仿真比赛。仿真比赛是将新的理论算法应用于足球机器人中的最好研究平台。而且发展至今天，已经形成了仿真球队，在Robocup比赛中已经单列出来，成为单独的一项特色比赛。2010年B.Erina和R.Abiyeva等学者将足球机器人导航问题用EDURobot进行仿真研究，表明了机器人路径规划中，同一种算法不同的参数也会有不同的结果。

近年来，博弈论在机器人方面的应用已经有了一定的研究，意大利的学者Nicola Basilico和Nicola Gatti在其论文中将博弈论理论应用于模拟机器人学，并提出了Leader-Follower平衡；美国耶鲁大学的专家Michael Beetz，Sebastian Buck等人在其论文中将合作概率博弈应用于足球机器人策略选择中，提高了机器人应对复杂环境的能力。随着机器人学与人工智能研究的深入，博弈论应用于机器人的是不仅是一种趋势，也是一种必然。

近年来，许多学者专家研究出了不少的成果，例如，申请号为201120008202.2的中国专利公开了一种智能机器人比赛装置，包括机械部分和电路控制部分，机械部分包括球桌、控制台和机器人，电路控制部分包括位于控制上的控制模块和位于机器人上的受控模块，可以形成对抗比赛场面；申请号为201010175496.8的中国专利公开了一种机器人教育平台，其包括一个箱体、该箱体内设置衣服机械组建、传感器单元、控制单元、执行单元、接口转换单元、任务软件光盘和电源模块，适应于课堂教学的各种实验；申请号为200410016867.2的中国专利公开了一种足球机器人嵌入式直接驱动装置，针对现有自主式机器人转动部分的不足，提供了一种足球机器人驱动装置，结构紧凑调试灵活，使机器人具有快速移动、定位精确、抗冲击、对抗性强的功能；申请号为201120313058.3的中国专利公开了一种室内足球机器人双目视觉导航系统，采用全局红外视觉定位方式，结合传感器信息，实现了室内移动机器人高精度的定位与导航的室内足球机器人双目视觉导航，但它仅适用于障碍物固定且环境较稳定，单一机器人操作的情况。从现有技术看，主要有机器人平台机械结构的设计、机器人驱动装置的改造、固定环境或单一的机器人的运动控制，未见到可应用于足球机器人对抗型比赛的协调与合作控制案例，而且，现有的足球机器人比赛中，经常会出现足球机器人在足球场场地上找不到自己的位姿而自转运动的现象，经常会错失一些进球的机会，延缓了进球的速度。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种电路结构简单、设计合理、接线方便、安装布设方便、智能化程度高的足球机器人协调与合作控制方法。

为解决上述技术问题，本发明采用的技术方案是：一种足球机器人协调与合作控制方法，其特征在于该方法包括以下步骤：

步骤一、足球机器人根据量子免疫算法进行自定位，其具体过程如下：

步骤101、获取足球场场地白线观测点：采用全向视觉模块对足球机器人所在足球场场地上的白线图像进行实时采集，并将所采集到的足球场场地白线图像同步传送至数据处理器，数据处理器对其接收到的足球场场地白线图像进行分析处理，得到足球场场地白线图像各个像素点在足球场场地坐标下的坐标数据，并以多个白线观测点(x_i,y_i)的形式存储在数据存储器中；其中，x_i为第i个白线观测点在足球场场地坐标下的横坐标，y_i为第i个白线观测点在足球场场地坐标下的纵坐标，i=1～M，M为白线观测点的总数且为自然数；

步骤102、构建足球场场地白线观测点位置种群：从步骤101中得到的多个白线观测点中，随机抽取n个，构建起足球场场地白线观测点位置种群其中，n为机器人白线观测点位置种群规模大小且为自然数，t为种群进化代数，

为根据Bloch球面坐标编码方法得到的第t代足球场场地白线观测点位置种群中的第i个白线观测点的编码且有：

q_{i}^{t} = |\begin{matrix} \cos φ_{i 1} \sin ω_{i 1} \\ \sin φ_{i 1} \sin ω_{i 1} \\ \cos ω_{i 1} \end{matrix}| \begin{matrix} . . . . . . \\ . . . . . . \\ . . . . . . \end{matrix} |\begin{matrix} \cos φ_{im} \sin ω_{im} \\ \sin φ_{im} \sin ω_{im} \\ \cos ω_{im} \end{matrix}|

其中，φ_ij=2π×rnd，ω_ij=π×rnd，rnd为（0，1）之间的随机数，j=1,2，…，m，m为足球场场地白线观测点位置的量子比特位数且为自然数；

步骤103、构建亲和度函数：首先，所述数据处理器根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||，i=1,2,3,…,n

计算出足球场场地白线观测点位置种群中第i个白线观测点与足球场场地白线之间的最近距离，其中，(x_i,y_i)_r为预先存储在数据存储器中的第i个白线观测点所对应的足球场场地白线上最近点的实际坐标；然后，所述数据处理器根据量子免疫算法构建亲和度函数

并计算出足球场场地白线观测点位置种群的亲和度F；

步骤104、种群亲和度比较：将步骤103中计算得到的亲和度F与预先存储在数据存储器中的亲和度阈值F₀相比较，当F≥F₀时，执行步骤108，当F<F₀时，执行步骤105；

步骤105、种群选择：所述数据处理器根据公式

计算出选择算子D_i，并根据选择算子D_i选择保留D_i≥0.5的个体；

步骤106、种群变异：采用变异算子

V = [\begin{matrix} 0 & 1 / \tan ω & 0 \\ 1 / \tan ω & 0 & 0 \\ 0 & 0 & \tan ω \end{matrix}]

对步骤105中D_i<0.5的个体进行变异操作；再将进行变异操作之后的个体与步骤105中选择保留的个体合成新的足球场场地白线观测点位置种群；其中，ω为旋转角且ω=k×f(α_i,β_i)，k为与机器人白线观测点位置种群规模大小相关的常量，f(α_i,β_i)为决定个体接近足球场场地白线的收敛方向函数，且函数f(α_i,β_i)的取值从量子免疫算法函数f(α_i,β_i)的查询表中查询得到；

步骤107、循环执行T次步骤103～106后执行步骤108；

步骤108、获得足球机器人t时刻在足球场场地坐标下的位姿：首先，所述数据处理器根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||，i=1,2,3,…,n

计算出循环结束后的足球场场地白线观测点位置种群中所有白线观测点与足球场场地白线之间的最近距离，接着，所述数据处理器选择出所有白线观测点与足球场场地白线之间的最近距离最小的足球场场地白线观测点u，其坐标表示为(x_u,y_u)；然后，所述数据处理器根据状态方程：

[\begin{matrix} x_{u} \\ y_{u} \\ 1 \end{matrix}] = s [\begin{matrix} \cos Φ_{t} & - \sin Φ_{t} & X_{t} \\ {\sin Φ}_{t} & {\cos Φ}_{t} & Y_{t} \\ 0 & 0 & 1 \end{matrix}] {[\begin{matrix} g_{m} & 0 & m_{0} \\ 0 & g_{n} & n_{0} \\ 0 & 0 & 1 \end{matrix}]}^{- 1} [\begin{matrix} m \\ n \\ 1 \end{matrix}]

获得足球机器人t时刻在足球场场地坐标下的横坐标X_t和纵坐标Y_t；其中，s为比例因子；g_m和g_n为图像坐标系下横轴和纵轴上的尺度因子；m₀和n₀为图像中心点坐标；m_u为机器人观测点u在图像坐标系下的横坐标，n_u为机器人观测点u在图像坐标系下的纵坐标；Φ_t为足球机器人t时刻在足球场场地坐标下的偏转角；

步骤109、获得足球机器人t+1时刻在足球场场地坐标下的位姿：所述数据处理器根据公式：

\{\begin{matrix} X_{t + 1} = X_{t} + Δs \times \cos (Φ_{t} + ΔΦ) \\ Y_{t + 1} = Y_{t} + Δs \times \sin (Φ_{t} + ΔΦ) \\ Φ_{t + 1} = Φ_{t} + ΔΦ \end{matrix}

计算得到足球机器人t+1时刻在足球场场地坐标下的横坐标X_t+1、纵坐标Y_t+1和偏转角Φ_t+1；其中，Δs为足球机器人从t时刻到t+1时刻的移动距离，ΔΦ为足球机器人从t时刻到t+1时刻偏转的角度；

步骤二、足球机器人根据博弈论算法在博弈对抗过程中进行协调与合作，其具体过程如下：

步骤201、数据初始化：我方多个足球机器人均根据步骤一的方法获得自己的位姿，并将自己的位姿通过无线网卡和以太网无线传输给教练机，我方各个足球机器人均通过无线网卡和以太网与教练机无线通信，获取我方其它足球机器人的位姿；同时，我方每个足球机器人均采用全向视觉模块对其所在足球场场地上的环境信息图像进行实时采集，并将所采集到的环境信息图像同步传送至数据处理器，数据处理器对其接收到的环境信息图像进行分析处理，得到目标足球在足球场场地上的位置和对方各个机器人在足球场场地上的位姿；

步骤202、设定初始策略：定义我方多个足球机器人均为博弈中的局中人，局中人中有固定角色的前锋和后卫，以及角色能够转换的自由人，定义自由人的初始策略为协前锋；

步骤203、自由人收益计算：自由人k根据公式：

p_{k} = Σ_{s_{k} &Element; S_{k}} [Π_{z = 1}^{L} σ_{z} (s_{z})] p_{k} (s)

计算自己从策略集合中获得的收益p_k；其中，k为自然数且k=1～L，L为局中人的数量；s_k为自由人k的策略，S_k为自由人k能够选择的策略集合；z为除自由人k外的局中人，s_z为除了自由人之外的局中人能够选择的策略集合，σ_z(s_z)为策略s_z的组合；s为多个足球机器人各选择一个策略形成的策略组合且s=（s₁,s₂,…,s_n），p_k(s)为自由人k在策略组合s下的收益；

步骤204、自由人k的最佳策略

选择：自由人k在给定自己类型β_k和其他局中人的最佳策略的情况下根据公式：

s_{k}^{*} (β_{k}) &Element; \arg \max Σ_{β_{- k}} p (β_{- k} | β_{k}) p_{k} (s_{k}, s_{- k}^{*}, (β_{k}, β_{- k}))

得到自由人k的最佳策略

其中，类型β_k为随其角色变换的进攻类型或防守类型，-k为除了自由人之外的球场上的其它足球机器人，为在类型β_k下的策略s_k的收益和在类型β_-k下的策略s_-k的收益之和，且

p_{k} (s_{k}, s_{- k}^{*} (β_{k}, β_{- k})) = p_{k} (s_{k} (β_{k}), s_{- k}^{*} (β_{- k})),

p(β_-k|β_k)为自由人对除了自由人之外的球场上的其它足球机器人类型β_-k的概率判断，类型β_-k为进攻或防守；

步骤205、自由人为角色转换做准备：首先，构造足球机器人角色分配模型的整个决策博弈C=(N,{S_k},{p_k})，其中，N为博弈中的局中人，S_k为对应于局中人联盟B_k下的策略集，p_k为对应于策略集S_k下的收益；接着，根据构造的足球机器人角色分配模型的整个决策博弈构造基本策略型有限博弈C_B=(N,{S_B},{p_B})，其中，B为多种局中人联盟的集合，S_B为对应于多种局中人联盟的集合B下的策略集，p_B为对应于策略集S_B下的收益；

当自由人k的联盟为B_k时，得到其策略型博弈的纯策略集为：

其中，S_z为除自由人k外的局中人的策略集；

当自由人k的联盟为N-B_k时，得到其策略型博弈的纯策略集为：

S_{N - B_{k}} = \underset{z &Element; N - B_{k}}{Π} S_{z};

自由人k的策略型博弈的纯策略集

在局势(s′,s′′)下的支付为：

然后，构造联盟博弈的特征函数：

V (B) = \max \underset{k &Element; B}{Σ} p_{k} (s_{k}^{*} (β_{k})) \max \underset{k &Element; B}{Σ} (\underset{z &Element; B_{k}}{Σ} p_{z} (s^{'}, s^{''}))

其中，为自由人k在最佳策略为

时的收益；自由人k根据联盟博弈的特征函数为角色转换做好准备；

步骤206、自由人进行角色转换：在满足步骤205后，构造自由人k的特征函数V(R)=maxT_k，其中，T_k为自由人k的运动轮的转速；

首先，所述数据处理器根据步骤201中得到的目标足球在足球场场地上的位置，判断目标球是否在足球场场地中线位置处，当目标球在足球场场地中线位置处时，返回步骤202，当目标球不在足球场场地中线位置处时，判断目标球是在我方场地还是在对方场地，当目标球是在我方场地且满足公式：

时，自由人k通过视觉系统感知被协助角色的位姿及与自己的距离和角度，选择不碰撞的最优路径，接近后卫，从协前锋转换成后卫，配合全体队友完成动作，否则，当目标球是在我方场地但不满足公式：

时，返回步骤202；

当目标球是在对方场地且满足公式：

时，自由人k通过视觉系统感知被协助角色的位姿及与自己的距离和角度，选择不碰撞的最优路径，接近前锋，从协前锋转换成前锋，配合全体队友完成动作，否则，当目标球是在对方场地但不满足公式：

时，返回步骤202；

其中，其中T_z为除了自由人k之外局中人z的运动轮的转速，ε为足球机器人角色需要转换的运动轮的转速的最小差值；2定义为足球机器人中的前锋，3定义为足球机器人中的后卫；

步骤207、判断比赛时间是否已到，当比赛时间未到时，返回步骤202；否则，当比赛时间已到时结束比赛。

上述的足球机器人协调与合作控制方法，其特征在于：步骤102中所述n的取值范围为30～100。

上述的足球机器人协调与合作控制方法，其特征在于：步骤104中亲和度阈值F₀的取值为0.83。

上述的足球机器人协调与合作控制方法，其特征在于：步骤106中所述k的取值范围为2.20～5.00。

上述的足球机器人协调与合作控制方法，其特征在于：步骤107中所述T的取值范围为30～70。

上述的足球机器人协调与合作控制方法，其特征在于：步骤108中所述s的取值范围为0.03～0.05；步骤108中所述g_m和g_n的取值范围均为0.90～1.10。

上述的足球机器人协调与合作控制方法及系统，其特征在于：步骤205中N=｛1，2，3｝，1定义为足球机器人中可以进行角色转换的自由人，2定义为足球机器人中的前锋，3定义为足球机器人中的后卫；步骤205中局中人联盟B_k为B₁={1,2}或B₂={1,3}，B={B₁,B₂}。

上述的足球机器人协调与合作控制方法，其特征在于：步骤206中所述ε的取值为0.28m/s。

本发明还提供了一种实现方便、提高了多机器人之间协调配合的能力、提高了协作效率、增加了进球数目、提高了足球机器人比赛获胜的概率的足球机器人协调与合作控制系统，其特征在于：包括数据处理器以及与数据处理器相接的数据存储器、串口通信模块和无线网卡，所述数据处理器的输入端接有1394控制卡、罗盘和里程计，所述1394控制卡的输入端接有全向视觉模块，所述串口通信模块上接有智能功率模块，所述智能功率模块的输出端接有四个运动控制卡，四个所述运动控制卡的输出端各接有一个电机驱动电路模块，四个所述电机驱动电路模块的输出端各接有一个电机，足球机器人的四个运动轮分别对应于多个所述电机输出轴连接，四个所述电机上各接有一个用于对所述电机的转速和位置进行实时检测的电机编码器，四个所述电机编码器的输出端均与所述智能功率模块的输入端相接，足球机器人踢球机构与所述智能功率模块的输出端相接，所述无线网卡上接有足球机器人教练机。

上述的系统，其特征在于：所述全向视觉模块包括设置在足球机器人机体上的全向视觉摄像头和设置在足球机器人机体上且位于所述全向视觉摄像头上方的全景视觉反射镜，所述全向视觉摄像头与所述1394控制卡的输入端相接。

本发明与现有技术相比具有以下优点：

1、本发明足球机器人协调与合作控制系统的电路结构简单，设计合理，接线方便，安装布设方便，智能化程度高。

2、本发明足球机器人协调与合作控制方法创新性地将量子免疫算法和博弈论算法相结合，采用量子免疫实现了足球机器人在足球场场地上的动态自定位，并采用博弈论算法实现了足球机器人在博弈对抗过程中的协调与合作，创新性地提出了将我方足球机器人的前锋和后卫固定角色，并设立了自由人可以变换角色的比赛策略。

3、本发明采用量子免疫实现了足球机器人在足球场场地上的动态自定位，避免了足球机器人在足球场场地上迷失自我（找不到自己的位姿）时在足球场场地上自转运动的现象，能够准确地找准自己的位姿，并在此前提下，与我方其它机器人协调与合作进行比赛。

4、采用了本发明所述的足球机器人协调与合作控制方法后，足球机器人在比赛过程中，在不同的比赛态势下（即目标球位置的变化及足球机器人运动轮转速的变化），我方自由人能够根据比赛情况和态势的需求，进行相应的角色转换，克服了足球机器人固定角色灵活性较低，足球机器人拼抢能力较弱的不足，又弥补了足球机器人角色全动态在比赛过程中由于态势频繁变换而导致的失误和混乱情况，从整体上提高了多机器人之间协调配合的能力，提高了协作效率，增加了进球数目，提高了足球机器人比赛获胜的概率；其中的博弈论算法与2011年硕士论文《基于博弈论的足球机器人对抗策略与协调合作》公开的博弈对抗算法相比，公开的硕士论文中泛泛地介绍了博弈论算法的发展，以及采用不完全信息博弈的足球机器人对抗策略选择和采用联盟博弈论应用于多机器人协调合作的方法，也得到了比较好的效果，但是，论文中的介绍是分立的，且仅适用于我方足球机器人数量为4个、自由人只有1个的状态，在实际足球机器人竞赛中使用时，还不能克服机器人迷失自我时出现的自转运动的现象，而且角色转换的实时性欠佳；而本发明是将量子免疫算法与博弈论算法相结合，本发明的博弈论算法还将不完全信息博弈和联盟博弈巧妙融合，更深入地推导出了进行角色转换的两个公式，在公式中，自由人k的取值可以变化，最多可以达到4个，适用于我方足球机器人数量为3～6个的状态，适用范围更广泛，实验验证发明的角色转换实时性和精度更高。

5、本发明能够有效地应用于足球机器人比赛中，能够更好地实现足球机器人发现球、躲避对方球员、接近球、传球并带球射门的目的，稍加改进及扩展，可以推广应用到工业实际中需要多个机器人协调合作的场合，使用效果好。

综上所述，本发明设计新颖合理，实现方便，提高了多机器人之间协调配合的能力，提高了协作效率，增加了进球数目，提高了足球机器人比赛获胜的概率，使用效果好，便于推广使用。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明足球机器人协调与合作控制方法的方法流程图。

图2为本发明足球机器人协调与合作控制方法步骤206中自由人进行角色转换的方法流程图。

图3为本发明足球机器人的运动模型图。

图4为本发明足球机器人协调与合作控制系统的电路原理框图。

图5a为本发明目标球在足球场场地中线位置处时自由人进行角色转换前的仿真图。

图5b为本发明目标球在足球场场地中线位置处时自由人进行角色转换后的仿真图。

图5c为本发明目标球在我方场地时自由人进行角色转换前的仿真图。

图5d为本发明目标球在我方场地时自由人进行角色转换后的仿真图。

图5e为本发明目标球在对方场地时自由人进行角色转换前的仿真图。

图5f为本发明目标球在对方场地时自由人进行角色转换后的仿真图。

附图标记说明:

1—数据处理器； 2—数据存储器； 3—串口通信模块；

4—无线网卡； 5—全向视觉模块； 5-1—全向视觉摄像头；

5-2—全景视觉反射镜； 6—罗盘； 7—里程计；

8—智能功率模块； 9—运动控制卡； 10—电机驱动电路模块；

11—电机； 12—电机编码器； 13—足球机器人踢球机构；

14—足球机器人教练机； 15—1394控制卡。

具体实施方式

如图1所示的一种足球机器人协调与合作控制方法，包括以下步骤：

步骤101、获取足球场场地白线观测点：采用全向视觉模块5对足球机器人所在足球场场地上的白线图像进行实时采集，并将所采集到的足球场场地白线图像同步传送至数据处理器1，数据处理器1对其接收到的足球场场地白线图像进行分析处理，得到足球场场地白线图像各个像素点在足球场场地坐标下的坐标数据，并以多个白线观测点(x_i,y_i)的形式存储在数据存储器2中；其中，x_i为第i个白线观测点在足球场场地坐标下的横坐标，y_i为第i个白线观测点在足球场场地坐标下的纵坐标，i=1～M，M为白线观测点的总数且为自然数；所述足球场场地坐标系是以足球场中心点为坐标原点和以足球机器人进攻方向为纵轴正方向的前提下，以符合右手坐标系的方向为横轴正方向建立的；

步骤102、构建足球场场地白线观测点位置种群：从步骤101中得到的多个白线观测点中，随机抽取n个，构建起足球场场地白线观测点位置种群

其中，n为机器人白线观测点位置种群规模大小且为自然数，t为种群进化代数，

q_{i}^{t} = |\begin{matrix} \cos φ_{i 1} \sin ω_{i 1} \\ \sin φ_{i 1} \sin ω_{i 1} \\ \cos ω_{i 1} \end{matrix}| \begin{matrix} . . . . . . \\ . . . . . . \\ . . . . . . \end{matrix} |\begin{matrix} \cos φ_{im} \sin ω_{im} \\ \sin φ_{im} \sin ω_{im} \\ \cos ω_{im} \end{matrix}|

其中，φ_ij=2π×rnd，ω_ij=π×rnd，rnd为（0，1）之间的随机数，j=1,2，…，m，m为足球场场地白线观测点位置的量子比特位数且为自然数；每一个

被看作一个染色体，每个染色体中的每一个基因对应于该编码

所对应的第i个白线观测点在足球场场地坐标下的坐标(x_i,y_i)；

本实施例中，步骤102中所述n的取值范围为30～100。优选地，所述n的取值为50。

步骤103、构建亲和度函数：首先，所述数据处理器1根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||,i=1,2,3,…,n

计算出足球场场地白线观测点位置种群中第i个白线观测点与足球场场地白线之间的最近距离，其中，(x_i,y_i)_r为预先存储在数据存储器2中的第i个白线观测点所对应的足球场场地白线上最近点的实际坐标；然后，所述数据处理器1根据量子免疫算法构建亲和度函数

并计算出足球场场地白线观测点位置种群的亲和度F；亲和度F的大小表示了足球场场地白线观测点位置种群中多个白线观测点与足球场场地白线之间的匹配程度，亲和度越大，匹配程度越高，亲和度越小，匹配程度越小；

步骤104、种群亲和度比较：将步骤103中计算得到的亲和度F与预先存储在数据存储器2中的亲和度阈值F₀相比较，当F≥F₀时，执行步骤108，当F<F₀时，执行步骤105；

本实施例中，步骤104中亲和度阈值F₀的取值为0.83。具体而言，F₀的取值是取

时，根据

得到的，通过步骤104可以避免已得到的优良个体还进行种群选择和变异，提高了算法的准确度和运算速度。

步骤105、种群选择：所述数据处理器1根据公式

计算出选择算子D_i，并根据选择算子D_i选择保留D_i≥0.5的个体；这样就选择并保留了亲和度大的染色体；

步骤106、种群变异：采用变异算子

V = [\begin{matrix} 0 & 1 / \tan ω & 0 \\ 1 / \tan ω & 0 & 0 \\ 0 & 0 & \tan ω \end{matrix}]

对步骤105中D_i<0.5的个体进行变异操作；再将进行变异操作之后的个体与步骤105中选择保留的个体合成新的足球场场地白线观测点位置种群；其中，ω为旋转角且ω=k×f(α_i,β_i)，k为与机器人白线观测点位置种群规模大小相关的常量，f(α_i,β_i)为决定个体接近足球场场地白线的收敛方向函数，且函数f(α_i,β_i)的取值从量子免疫算法函数f(α_i,β_i)的查询表中查询得到；量子免疫算法函数f(α_i,β_i)的查询表如表1所示：

表1量子免疫算法函数f(α_i,β_i)的查询表

表1中，d₁=|α₁|·β₁|，ζ₁=arctan(|β₁|/|α₁|)，α₁为最优解对应于x_i的概率幅值，|β₁|为最优解对应于y_i的概率幅值；d₂=|α₂|·|β₂|，ζ₂=arctan(|β₂|/|α₂|)，|α₂|为当前解对应于x_i的概率幅值，|β₂|为当前解对应于y_i的概率幅值；

本发明的变异算子V为对称的三维方阵，经过变异算子V更新了足球场场地白线观测点位置种群，经过种群变异操作，优化了亲和度小的染色体，加快了量子免疫算法的收敛；

本实施例中，步骤106中所述k的取值范围为2.20～5.00。

步骤107、循环执行T次步骤103～106后执行步骤108；

本实施例中，步骤107中所述T的取值范围为30～70。优选地，所述T的取值为50。

步骤108、获得足球机器人t时刻在足球场场地坐标下的位姿：首先，所述数据处理器1根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||,i=1,2,3,…,n

计算出循环结束后的足球场场地白线观测点位置种群中所有白线观测点与足球场场地白线之间的最近距离，接着，所述数据处理器1选择出所有白线观测点与足球场场地白线之间的最近距离最小的足球场场地白线观测点u，即为与足球场场地白线之间的匹配程度最高的观测点，其坐标表示为(x_u,y_u)；然后，所述数据处理器1根据状态方程：

[\begin{matrix} x_{u} \\ y_{u} \\ 1 \end{matrix}] = s [\begin{matrix} \cos Φ_{t} & - \sin Φ_{t} & X_{t} \\ {\sin Φ}_{t} & {\cos Φ}_{t} & Y_{t} \\ 0 & 0 & 1 \end{matrix}] {[\begin{matrix} g_{m} & 0 & m_{0} \\ 0 & g_{n} & n_{0} \\ 0 & 0 & 1 \end{matrix}]}^{- 1} [\begin{matrix} m \\ n \\ 1 \end{matrix}]

获得足球机器人t时刻在足球场场地坐标下的横坐标X_t和纵坐标Y_t；其中，s为比例因子；g_m和g_n为图像坐标系下横轴和纵轴上的尺度因子；m₀和n₀为图像中心点坐标；m_u为机器人观测点u在图像坐标系下的横坐标，n_u为机器人观测点u在图像坐标系下的纵坐标；Φ_t为足球机器人t时刻在足球场场地坐标下的偏转角；其中，Φ_t的获得是通过罗盘6对足球机器人在足球场场地坐标下的偏转角进行实时检测，并将所检测到的信号同步传送至数据处理器1，数据处理器1对罗盘6输出的信号进行分析处理，得到足球机器人t时刻在足球场场地坐标下的偏转角Φ_t；所述图像坐标系是以图像的上边沿线为横轴（m轴），以图像的左边沿线为纵轴（n轴），并以图像的上边沿线与左边沿线的交点为圆心建立的；

本实施例中，步骤108中所述s的取值范围为0.03～0.05；步骤108中所述g_m和g_n的取值范围均为0.90～1.10。

步骤109、获得足球机器人t+1时刻在足球场场地坐标下的位姿：所述数据处理器（1）根据公式：

\{\begin{matrix} X_{t + 1} = X_{t} + Δs \times \cos (Φ_{t} + ΔΦ) \\ Y_{t + 1} = Y_{t} + Δs \times \sin (Φ_{t} + ΔΦ) \\ Φ_{t + 1} = Φ_{t} + ΔΦ \end{matrix}

计算得到足球机器人t+1时刻在足球场场地坐标下的横坐标X_t+1、纵坐标Y_t+1和偏转角Φ_t+1；其中，Δs为足球机器人从t时刻到t+1时刻的移动距离，ΔΦ为足球机器人从t时刻到t+1时刻偏转的角度；其中，Δs的获得是通过里程计7对足球机器人在足球场场地坐标下的行程进行实时检测，并将所检测到的信号同步传送至数据处理器1，数据处理器1对里程计7输出的信号进行分析处理，得到足球机器人从t时刻到t+1时刻的移动距离；ΔΦ的获得是罗盘6对足球机器人在足球场场地坐标下的偏转角进行实时检测，并将所检测到的信号同步传送至数据处理器1，数据处理器1对罗盘6输出的信号进行分析处理，得到足球机器人从t时刻到t+1时刻偏转的角度ΔΦ；理想情况下，足球机器人在(t,t+1]时间段的运动可以近似为旋转ΔΦ后再平移Δs，所建立起的足球机器人的运动模型如图3所示，根据建立起的足球机器人的运动模型，就可以推算出计算下一时刻足球机器人位姿的计算公式；这样就实现了对足球机器人运动过程的连续定位。

步骤201、数据初始化：我方多个足球机器人均根据步骤一的方法获得自己的位姿，并将自己的位姿通过无线网卡4和以太网无线传输给教练机，我方各个足球机器人均通过无线网卡4和以太网与教练机无线通信，获取我方其它足球机器人的位姿；同时，我方每个足球机器人均采用全向视觉模块5对其所在足球场场地上的环境信息图像进行实时采集，并将所采集到的环境信息图像同步传送至数据处理器1，数据处理器1对其接收到的环境信息图像进行分析处理，得到目标足球在足球场场地上的位置和对方各个机器人在足球场场地上的位姿；

步骤203、自由人收益计算：自由人k根据公式：

p_{k} = Σ_{s_{k} &Element; S_{k}} [Π_{z = 1}^{L} σ_{z} (s_{z})] p_{k} (s)

计算自己从策略集合中获得的收益p_k；其中，k为自然数且k=1～L，L为局中人的数量；s_k为自由人k的策略，S_k为自由人k能够选择的策略集合；z为除自由人k外的局中人，s_z为除了自由人之外的局中人能够选择的策略集合，σ_z(s_z)为策略s_z的组合；s为多个足球机器人各选择一个策略形成的策略组合且s=（s₁,s₂,…,s_n），p_k(s)为自由人k在策略组合s下的收益；依据博弈论算法，收益采用效用的概念，也被称为支付函数，自由人的收益为得到的期望效用；

步骤204、自由人k的最佳策略

选择：自由人k在给定自己类型β_k和其他局中人的最佳策略

的情况下根据公式：

s_{k}^{*} (β_{k}) &Element; \arg \max Σ_{β_{- k}} p (β_{- k} | β_{k}) p_{k} (s_{k}, s_{- k}^{*}, (β_{k}, β_{- k}))

得到自由人k的最佳策略

其中，类型β_k为随其角色变换的进攻类型或防守类型，-k为除了自由人之外的球场上的其它足球机器人，

为在类型β_k下的策略s_k的收益和在类型β_-k下的策略s_-k的收益之和，且

p_{k} (s_{k}, s_{- k}^{*}, (β_{k}, β_{- k})) = p_{k} (s_{k} (β_{k}), s_{- k}^{*} (β_{- k})),

为自由人对除了自由人之外的球场上的其它足球机器人类型β_-k的概率判断，类型β_-k为进攻或防守；由于博弈局势中局中人对其他局中人与该种博弈局势有关的事前信息了解不充分，因此步骤204采用了不完全信息博弈理论，自由人k获得的收益最大，即选择出最佳策略

是自由人转换角色的必要条件；

当自由人k的联盟为B_k时，得到其策略型博弈的纯策略集为：

其中，S_z为除自由人k外的局中人的策略集；

S_{N - B_{k}} = \underset{z &Element; N - B_{k}}{Π} S_{z};

自由人k的策略型博弈的纯策略集

在局势(s′,s′′)下的支付为：

然后，构造联盟博弈的特征函数：

V (B) = \max \underset{k &Element; B}{Σ} p_{k} (s_{k}^{*} (β_{k})) = \max \underset{k &Element; B}{Σ} (\underset{z &Element; B_{k}}{Σ} p_{z} (s^{'}, s^{''}))

其中，

为自由人k在最佳策略为时的收益；自由人k根据联盟博弈的特征函数为角色转换做好准备；

本实施例中，步骤205中N=｛1，2，3｝，1定义为足球机器人中可以进行角色转换的自由人，2定义为足球机器人中的前锋，3定义为足球机器人中的后卫，即表示足球场场地上共有3台足球机器人，前锋为主进攻者，主要动作有追球并绕过障碍带球到对方球门，选择合适的位置和角度射门；后卫为主防守者，主要守住本方的球门，不让对方进球；自由人可以根据足球场场地环境动态信息转换为前锋或后卫，先于前锋或后卫完成任务；步骤205中局中人联盟B_k为B₁={1,2}或B₂={1,3}，B={B₁,B₂}。其中，B₁={1,2}表示自由人选择进攻策略，充当前锋角色；B₂={1,3}表示自由人选择防守策略，充当后卫角色。在实际的足球机器人比赛中，我方和对方均可以上2～6台足球机器人。

结合图2，首先，所述数据处理器根据步骤201中得到的目标足球在足球场场地上的位置，判断目标球是否在足球场场地中线位置处，当目标球在足球场场地中线位置处时，返回步骤202，当目标球不在足球场场地中线位置处时，判断目标球是在我方场地还是在对方场地，当目标球是在我方场地且满足公式：

时，返回步骤202；

当目标球是在对方场地且满足公式：

时，返回步骤202；

其中，其中T_z为除了自由人k之外局中人z的运动轮的转速，ε为足球机器人角色需要转换的运动轮的转速的最小差值；2定义为足球机器人中的前锋，3定义为足球机器人中的后卫；当足球场场地上的我方足球机器人为3个时，k的取值为1，即将1定义为足球机器人中唯一的自由人；当足球场地上的我方足球机器人为4个时，k的取值为1和4，即将1和4定义为足球机器人中的自由人，自由人的数量为两个；当足球场地上的我方足球机器人为5个时，k的取值为1、4和5，即将1、4和5定义为足球机器人中的自由人，自由人的数量为三个；当足球场地上的我方足球机器人为6个时，k的取值为1、4、5和6，即将1、4、5和6定义为足球机器人中的自由人，自由人的数量为四个；

具体实施时，自由人k的运动轮的转速T_k和除了自由人k之外局中人z的运动轮的转速T_z是通过以下过程获得的：所述电机编码器12对所述电机11的转速进行实时检测并将所检测到的信号同步传送至智能功率模块8，智能功率模块8接收后再通过串口通信模块3同步传送至数据处理器1，数据处理器1对电机编码器12检测到的信号进行分析处理，得到自由人k的运动轮的转速T_k和除了自由人k之外局中人z的运动轮的转速T_z。

本实施例中，步骤206中所述ε的取值为0.28m/s。

如图4所示的足球机器人协调与合作控制系统，包括数据处理器1以及与数据处理器1相接的数据存储器2、串口通信模块3和无线网卡4，所述数据处理器1的输入端接有1394控制卡15、罗盘6和里程计7，所述1394控制卡15的输入端接有全向视觉模块5，所述串口通信模块3上接有智能功率模块8，所述智能功率模块8的输出端接有四个运动控制卡9，四个所述运动控制卡9的输出端各接有一个电机驱动电路模块10，四个所述电机驱动电路模块10的输出端各接有一个电机11，足球机器人的四个运动轮分别对应与四个所述电机11的输出轴连接，四个所述电机11上各接有一个用于对所述电机11的转速和位置进行实时检测的电机编码器12，四个所述电机编码器12的输出端均与所述智能功率模块8的输入端相接，足球机器人踢球机构13与所述智能功率模块8的输出端相接，所述无线网卡4上接有足球机器人教练机14。具体实施时，四个运动轮均为万向轮。足球机器人教练机14主要起到实时监视场上足球机器人状态的作用，在非比赛时间，用来训练足球机器人，在比赛时，用来将裁判盒发出的裁判指令实时可靠地发送给场上的足球机器人。

本实施例中，所述全向视觉模块5包括设置在足球机器人机体上的全向视觉摄像头5-1和设置在足球机器人机体上且位于所述全向视觉摄像头5-1上方的全景视觉反射镜5-2，所述全向视觉摄像头5-1与所述1394控制卡15的输入端相接。全向视觉模块5是足球机器人的眼睛，是足球机器人协调与控制系统的图像信号采集部件。

为了对本发明足球机器人协调与合作控制方法及系统产生的技术效果进行验证，采用MATLAB对本发明所述的足球机器人协调与合作控制方法进行了仿真。仿真时，多机器人系统由6个足球机器人和一个目标球构成，6个足球机器人分别为我方的三个角色：前锋、后卫和自由人，以及对方的三个角色：前锋、后卫和协前锋；首先，建立坐标系，定义足球机器人团队运行的环境（即足球机器人比赛场地）为18×12的有界矩形区域，中心点为（0,0），我方区域为{-9,0}，{-6，6}；对方区域为{0,9}，{-6，6}；我方球门区域为{-9,-8}，{-2，2}；对方球门区域为{8,9}，{-2，2}；中场线为横坐标为0的坐标线；接着，设定足球机器人，我方足球机器人用实心正方形表示，对方足球机器人用实心菱形表示，目标球用实心圆表示；然后进行了三种不同情况的仿真，仿真结果如图5a～5f所示。

图5a中，目标足球在足球场场地上的位置在(0，0)点，即目标球是在足球场场地中线位置处，此时，自由人k还是按照步骤202中设定的协前锋角色，接近目标球，并将目标球传向靠近我方前锋且接近对方球门处，为前锋的踢球射门做好准备，如图5b所示。

图5c中，目标足球在足球场场地上的位置在(-5，0)点，即目标球是在我方场地，而且此时，满足公式

因此，自由人k通过视觉系统感知被协助角色的位姿及与自己的距离和角度，选择不碰撞的最优路径，接近后卫，从协前锋转换成了后卫，转换成了如图5d所示的位置，阻止目标球继续向我方球门靠近，从而达到了加固防守的目的，避免了单一防守可能造成的防守失误。

图5e中，目标足球在足球场场地上的位置在(5，-0.5)点，即目标球是在对方场地，而且此时，满足公式

因此，自由人k通过视觉系统感知被协助角色的位姿及与自己的距离和角度，选择不碰撞的最优路径，接近前锋，从协前锋转换成前锋，转换成了如图5f所示的位置，与主前锋共同接近球，协助主前锋持球，并选择合适的位置和角度射门，使得进攻更加有力，提高了进球的概率。

从以上的仿真能够看出，采用了本发明所述的足球机器人协调与合作控制方法后，足球机器人在比赛过程中，在不同的比赛态势下（即目标球位置的变化及足球机器人运动轮转速的变化），我方自由人能够根据比赛情况和态势的需求，进行相应的角色转换，从而提高了足球机器人比赛时的连贯性、协调性及获胜的概率，能够克服足球机器人固定角色灵活性较低，足球机器人拼抢能力较弱的不足，又弥补了足球机器人角色全动态在比赛过程中由于态势频繁变换而导致的失误和混乱情况。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。

Claims

1.一种足球机器人协调与合作控制方法，其特征在于该方法包括以下步骤：

步骤101、获取足球场场地白线观测点：采用全向视觉模块（5）对足球机器人所在足球场场地上的白线图像进行实时采集，并将所采集到的足球场场地白线图像同步传送至数据处理器（1），数据处理器（1）对其接收到的足球场场地白线图像进行分析处理，得到足球场场地白线图像各个像素点在足球场场地坐标下的坐标数据，并以多个白线观测点(x_i,y_i)的形式存储在数据存储器（2）中；其中，x_i为第i个白线观测点在足球场场地坐标下的横坐标，y_i为第i个白线观测点在足球场场地坐标下的纵坐标，i=1～M，M为白线观测点的总数且为自然数；

q_{i}^{t} = |\begin{matrix} \cos φ_{i 1} \sin ω_{i 1} \\ \sin φ_{i 1} \sin ω_{i 1} \\ \cos ω_{i 1} \end{matrix}| \begin{matrix} . . . . . . \\ . . . . . . \\ . . . . . . \end{matrix} |\begin{matrix} \cos φ_{im} \sin ω_{im} \\ \sin φ_{im} \sin ω_{im} \\ \cos ω_{im} \end{matrix}|

步骤103、构建亲和度函数：首先，所述数据处理器（1）根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||,i=1,2,3,…,n

计算出足球场场地白线观测点位置种群中第i个白线观测点与足球场场地白线之间的最近距离，其中，(x_i,y_i)_r为预先存储在数据存储器（2）中的第i个白线观测点所对应的足球场场地白线上最近点的实际坐标；然后，所述数据处理器（1）根据量子免疫算法构建亲和度函数并计算出足球场场地白线观测点位置种群的亲和度F；

步骤104、种群亲和度比较：将步骤103中计算得到的亲和度F与预先存储在数据存储器（2）中的亲和度阈值F₀相比较，当F≥F₀时，执行步骤108，当F<F₀时，执行步骤105；

步骤105、种群选择：所述数据处理器（1）根据公式计算出选择算子D_i，并根据选择算子D_i选择保留D_i≥0.5的个体；

步骤106、种群变异：采用变异算子

V = [\begin{matrix} 0 & 1 / \tan ω & 0 \\ 1 / \tan ω & 0 & 0 \\ 0 & 0 & \tan ω \end{matrix}]

步骤107、循环执行T次步骤103～106后执行步骤108；

步骤108、获得足球机器人t时刻在足球场场地坐标下的位姿：首先，所述数据处理器（1）根据公式：

d_min,i=min||(x_i,y_i)-(x_i,y_i)_r||,i=1,2,3,…,n

计算出循环结束后的足球场场地白线观测点位置种群中所有白线观测点与足球场场地白线之间的最近距离，接着，所述数据处理器（1）选择出所有白线观测点与足球场场地白线之间的最近距离最小的足球场场地白线观测点u，其坐标表示为(x_u,y_u)；然后，所述数据处理器（1）根据状态方程：

[\begin{matrix} x_{u} \\ y_{u} \\ 1 \end{matrix}] = s [\begin{matrix} \cos Φ_{t} & - \sin Φ_{t} & X_{t} \\ {\sin Φ}_{t} & {\cos Φ}_{t} & Y_{t} \\ 0 & 0 & 1 \end{matrix}] {[\begin{matrix} g_{m} & 0 & m_{0} \\ 0 & g_{n} & n_{0} \\ 0 & 0 & 1 \end{matrix}]}^{- 1} [\begin{matrix} m \\ n \\ 1 \end{matrix}]

\{\begin{matrix} X_{t + 1} = X_{t} + Δs \times \cos (Φ_{t} + ΔΦ) \\ Y_{t + 1} = Y_{t} + Δs \times \sin (Φ_{t} + ΔΦ) \\ Φ_{t + 1} = Φ_{t} + ΔΦ \end{matrix}

步骤201、数据初始化：我方多个足球机器人均根据步骤一的方法获得自己的位姿，并将自己的位姿通过无线网卡（4）和以太网无线传输给教练机，我方各个足球机器人均通过无线网卡（4）和以太网与教练机无线通信，获取我方其它足球机器人的位姿；同时，我方每个足球机器人均采用全向视觉模块（5）对其所在足球场场地上的环境信息图像进行实时采集，并将所采集到的环境信息图像同步传送至数据处理器（1），数据处理器（1）对其接收到的环境信息图像进行分析处理，得到目标足球在足球场场地上的位置和对方各个机器人在足球场场地上的位姿；

步骤203、自由人收益计算：自由人k根据公式：

p_{k} = Σ_{s_{k} &Element; S_{k}} [Π_{z = 1}^{L} σ_{z} (s_{z})] p_{k} (s)

步骤204、自由人k的最佳策略

选择：自由人k在给定自己类型β_k和其他局中人的最佳策略

的情况下根据公式：

s_{k}^{*} (β_{k}) &Element; \arg \max Σ_{β_{- k}} p (β_{- k} | β_{k}) p_{k} (s_{k}, s_{- k}^{*}, (β_{k}, β_{- k}))

得到自由人k的最佳策略

p_{k} (s_{k}, s_{- k}^{*}, (β_{k}, β_{- k})) = p_{k} (s_{k} (β_{k}), s_{- k}^{*} (β_{- k})),

当自由人k的联盟为B_k时，得到其策略型博弈的纯策略集为：

其中，S_z为除自由人k外的局中人的策略集；

S_{N - B_{k}} = \underset{z &Element; N - B_{k}}{Π} S_{z};

自由人k的策略型博弈的纯策略集

在局势(s′,s′′)下的支付为：

然后，构造联盟博弈的特征函数：

V (B) = \max \underset{k &Element; B}{Σ} p_{k} (s_{k}^{*} (β_{k})) \max \underset{k &Element; B}{Σ} (\underset{z &Element; B_{k}}{Σ} p_{z} (s^{'}, s^{''}))

其中，

为自由人k在最佳策略为

时，返回步骤202；

当目标球是在对方场地且满足公式：

时，返回步骤202；

2.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤102中所述n的取值范围为30～100。

3.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤104中亲和度阈值F₀的取值为0.83。

4.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤106中所述k的取值范围为2.20～5.00。

5.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤107中所述T的取值范围为30～70。

6.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤108中所述s的取值范围为0.03～0.05；步骤108中所述g_m和g_n的取值范围均为0.90～1.10。

7.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤205中N=｛1，2，3｝，1定义为足球机器人中可以进行角色转换的自由人，2定义为足球机器人中的前锋，3定义为足球机器人中的后卫；步骤205中局中人联盟B_k为B₁={1,2}或B₂={1,3}，B={B₁,B₂}。

8.按照权利要求1所述的足球机器人协调与合作控制方法，其特征在于：步骤206中所述ε的取值为0.28m/s。

9.一种实现如权利要求1所述方法的足球机器人协调与合作控制系统，其特征在于：包括数据处理器（1）以及与数据处理器（1）相接的数据存储器（2）、串口通信模块（3）和无线网卡（4），所述数据处理器（1）的输入端接有1394控制卡（15）、罗盘（6）和里程计（7），所述1394控制卡（15）的输入端接有全向视觉模块（5），所述串口通信模块（3）上接有智能功率模块（8），所述智能功率模块（8）的输出端接有四个运动控制卡（9），四个所述运动控制卡（9）的输出端各接有一个电机驱动电路模块（10），四个所述电机驱动电路模块（10）的输出端各接有一个电机（11），足球机器人的四个运动轮分别对应与四个所述电机（11）的输出轴连接，四个所述电机（11）上各接有一个用于对所述电机（11）的转速和位置进行实时检测的电机编码器（12），四个所述电机编码器（12）的输出端均与所述智能功率模块（8）的输入端相接，足球机器人踢球机构（13）与所述智能功率模块（8）的输出端相接，所述无线网卡（4）上接有足球机器人教练机（14）。

10.按照权利要求9所述的系统，其特征在于：所述全向视觉模块（5）包括设置在足球机器人机体上的全向视觉摄像头（5-1）和设置在足球机器人机体上且位于所述全向视觉摄像头（5-1）上方的全景视觉反射镜（5-2），所述全向视觉摄像头（5-1）与所述1394控制卡（15）的输入端相接。