CN114579748A - 一种构建自主式交通系统功能架构的方法 - Google Patents

一种构建自主式交通系统功能架构的方法 Download PDF

Info

Publication number
CN114579748A
CN114579748A CN202210237148.1A CN202210237148A CN114579748A CN 114579748 A CN114579748 A CN 114579748A CN 202210237148 A CN202210237148 A CN 202210237148A CN 114579748 A CN114579748 A CN 114579748A
Authority
CN
China
Prior art keywords
sample
clustering
text
autonomous
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210237148.1A
Other languages
English (en)
Inventor
李传耀
陈依婷
黎昉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202210237148.1A priority Critical patent/CN114579748A/zh
Publication of CN114579748A publication Critical patent/CN114579748A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种构建自主式交通系统功能架构的方法。包括:构建面向多属性文本的优化密度峰值聚类模型;改进词频、逆向文档频率计算公式;应用文本向量空间模型计算多属性文本的空间维度坐标;高斯函数和决策值优化密度峰值聚类算法;轮廓系数评价聚类结果;依据聚类结果将自主式交通系统道路自动驾驶场景下的功能分为“自主感知、自主学习、自主决策、自主响应”4层,绘制功能架构图,支撑服务实现。本发明为自主式交通系统功能架构的构建提供参考,促进新一代交通系统功能架构的构建,推动自主式交通系统理论体系的发展。

Description

一种构建自主式交通系统功能架构的方法
技术领域
本发明属于道路交通技术领域,尤其涉及一种构建自主式交通系统功能架构的方法。
背景技术
当前要建设“安全、便捷、高效、绿色、经济”的现代综合交通运输体系。已有的交通系统体系框架很难适应新兴技术下交通从“被动智能”向“主动智慧”的发展,亟需构建适应新一代交通发展的交通系统。在此背景下,国家明确提出了构建自主式交通系统(Autonomous Transportation System,ATS),以此改进当前智能交通系统对新兴技术的适用性问题,更科学、合理地指导我国的交通运输发展。
发明内容
有鉴于此,本发明提出一种自主式交通系统功能架构构建方法,此方法促进新一代交通系统功能架构的构建,推动自主式交通系统理论体系的发展。
本发明公开的构建自主式交通系统功能架构的方法,包括以下步骤:
步骤1:针对多属性文本聚类问题,构建面向多属性文本的优化密度峰值聚类模型;
步骤2:依据多属性文本的特征计算词语属性频率和属性的逆向文档频率,根据所述词语属性频率与属性的逆向文档频率,将多属性文本转化成数值;
步骤3:依据不同属性文本的数值权重采用文本向量空间模型将数值转化成空间维度坐标;
步骤4:优化密度峰值的计算方式:采用高斯核方法优化数据点局部密度计算方式;
采用决策值优化聚类中心选取,选择决策值较大的样本作为密度峰值聚类中心,获得聚类结果;
步骤5:根据步骤4的聚类结果,采用轮廓系数法对聚类结果作出评价,对轮廓系数较低的数据点重复步骤4;
步骤6:验证算法的可行性,在自主式交通系统的道路自动驾驶场景下,三个服务域下的功能依据最终聚类结果分成“自主感知、自主学习、自主决策、自主响应”4层,依据层与层之间的关系,绘制功能架构图。
进一步的,步骤2的具体步骤如下:
(1)计算词语属性频率:
Figure BDA0003542697290000021
其中,s表示某文本的属性,
Figure BDA0003542697290000022
为该属性s在文档中出现的次数,Wn(n=1,2,...,N,N为文档总数)表示由文本属性组成的属性库;
(2)根据文本属性转换的需要,假定词语在属性库中必定出现,采用平滑的逆文档频率计算属性的逆向文档频率:
Figure BDA0003542697290000023
(3)多属性文本TF-IDF算法计算公式为TF·IDF(s,Wn,W)=TF(s,Wn)·IDF(s,W),当TF-IDF值越大时表明该词语更能代表该文档,即在TF-IDF值越大表明该属性越能够代表该文本。
进一步的,基于文本向量空间模型得到文本空间维度坐标,所述文本向量空间模型将给定的文本转换成一定维数的向量,其以特征项作为文本表示的基本单位,向量的各维对应文本中的一个特征项,而每一维本身则表示了其对应的特征项在该文本中的权值,权值代表了特征项对于所在文本的重要程度,即该特征项能够多大程度上反映它所在文档的类别。
进一步的,通过对密度峰值聚类算法进行优化,找到符合条件的聚类中心,将剩余待聚类点进行聚类,提高聚类性能,具体步骤如下:
将局部密度截断核计算方式优化为高斯核计算方式,以显著提高密度计算的精细度;所述高斯核计算方式计算欧式距离和高斯函数值,将所有点值的和作为密度,所述高斯函数值定义样本局部密度计算公式为:
Figure BDA0003542697290000031
其中,dij为样本xi和xj之间的距离,dc为截断距离,n为样本数;
计算局部密度距离:计算每个点到高于自身局部密度值点的最小距离ξi,ξi的计算公式如下:
Figure BDA0003542697290000032
对于密度最大的样本,ξi定义为ξi=maxj(dij);其中pi为样本xi的局部密度,pj为样本xj的局部密度。
对聚类中心点的选取采用决策值的方法进行优化:选择决策值γi较大的样本作为密度峰值聚类中心,即局部密度与局部密度距离乘积较大的点,γi的计算公式如下:γi=ρi·ξi
进一步的,通过轮廓系数检验聚类性能,对于轮廓系数较低的数据点进行重复聚类,具体算法流程如下:
计算样本i到同簇其他样本的平均距离ai,ai称为样本i的簇内不相似度;ai越小,说明样本i越应该被聚类到该簇,簇C中所有样本的ai均值称为簇C的簇不相似度;
计算样本i到其他某簇Cj的所有样本的平均距离bi,j,称为样本i与簇Cj的不相似度,定义样本i的簇间不相似度:bi={bi1,bi2,...,bik},bi越大,说明样本i越不属于其他簇;
根据样本i的簇内不相似度ai和簇间不相似度bi,定义样本i的轮廓系数:
Figure BDA0003542697290000033
Figure BDA0003542697290000041
判断:si接近1,则说明样本i聚类合理、有效;si接近-1,则说明样本i更应该分类到另外的簇;若si近似为0,则说明样本i在两个簇的边界上。
进一步的,针对自主式交通系统功能架构的构建,将场景下的服务域中的功能进行聚类分析,依据聚类结果搭建功能架构,绘制功能架构图。
进一步的,自主式交通系统的功能具有提供者、过程对象、服务对象三个属性,并建立属性库。
本发明的有益效果如下:
1)确定自主式交通系统功能架构构建方法,为自主式交通系统的构建提供新思路;
2)优化密度峰值聚类算法,通过高斯函数值计算数据点密度,通过决策值优化聚类中心选取;
3)针对各领域多属性文本转化成可用数据提供方法;
4)本发明提供一种自主式交通系统功能架构构建方法,是对交通系统功能架构的创新,可为下一代自主式交通系统的构建提供参考。
附图说明
图1本发明的方法流程图;
图2密度峰值聚类算法原理图;
图3道路载运工具运行服务域;
图4交通基础设施管理服务域;
图5交通安全管理服务域;
图6寻找聚类中心散点图;
图7初步聚类结果图;
图8初步聚类轮廓系数图;
图9碰撞管理子服务功能架构图。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
本发明建立一种面向多属性文本的优化密度峰值聚类算法(Density PeaksClustering,DPC)模型构建自主式交通下的功能架构。该算法结合交通系统功能架构的基本特征,通过改进的词频-逆向文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法与文本向量空间模型,将多属性文本转化成空间维度坐标。再利用高斯函数和决策值优化DPC算法进行聚类,并结合轮廓系数对聚类结果进行评价。算法个构建思路如图1所示。
TF表示词频,若某词语t在文档Dn(n=1,2,...,N,N为文档总数)中出现
Figure BDA0003542697290000051
次,则词频
Figure BDA0003542697290000052
考虑到每个文档的长度不同,根据文档长度调整得到该词语的词频为
Figure BDA0003542697290000053
考虑到本模型是为多属性文本聚类服务,每个词语有较多的属性,现依据词语属性对其进行聚类分析,为优化聚类分析结果,对词语频率TF计算公式进行改进得到词语属性频率:
Figure BDA0003542697290000054
其中,s表示某文本的属性,Wn(n=1,2,...,N,N为文档总数)表示由文本属性组成的属性库;
IDF表示逆向文档频率,可用来度量某词语的普遍重要性,IDF(t,D)可以使用文档的总数除以词语库中出现词语的文档数的对数表示,计算公式为
Figure BDA0003542697290000061
其中,t表示某词语,D表示语料库整体,N表示语料库中的文档总数,nt表示语料库整体中出现t的文本频数,l的取值根据实验来确定,一般取0.01。根据文本属性转换的需要,假定词语在属性库中必定出现,采用平滑的逆文档频率计算文本属性的逆向文档频率:
Figure BDA0003542697290000062
多属性文本TF-IDF算法计算公式为TF·IDF(s,Wn,W)=TF(s,Wn)·IDF(s,W),当TF-IDF值越大时表明该词语更能代表该文档,即在本发明中TF-IDF值越大表明该属性越能够代表该文本。由此根据每个文本的属性特征计算得到文本转化成的数据值,从而为将多属性文本转化成数据提供科学依据;
根据TF-IDF算法得到了不同属性文本的数值权重,为了采用密度峰值聚类算法进行空间聚类分析,需要将文本的属性权重转化成空间维度坐标,遂采用文本向量空间模型将属性权重转化成空间维度坐标。
文本向量空间模型(Vector Space Model,VSM)能将给定的文本转换成一定维数的向量,其以特征项作为文本表示的基本单位,向量的各维对应文本中的一个特征项,而每一维本身则表示了其对应的特征项在该文本中的权值。权值代表了特征项对于所在文本的重要程度,即该特征项能够多大程度上反映它所在文档的类别。模型的定义为:在给定的文档中D=D(s1,w1;s2,w2;...;sn,wn),D符合以下两条约定:各个特征项sk(1≤k≤n)互异;各个特征项sk无先后顺序关系,构造空间向量。即由TF-IDF算法得到文本的属性权重TF·IDF(s,Wn,W)后,根据VSM将文本的多个属性转化成文本的空间维度坐标。
密度峰值聚类算法(Density Peaks Clustering,DPC)是一种基于密度的空间聚类算法,算法的原则是:聚类中心的局部密度较大,聚类中心与高于其局部密度的其他点距离较远。该算法的步骤如下:
(1)设定截断距离dc,根据统计学经验dc=0.02或dc=0.04。
(2)对于给定的数据集XN·M=[x1,x2,...,xN]T,其中xi=[xi1,xi2,...,xiN],N为样本个数,M为样本维数。样本xi的局部密度表示为ρi,计算公式如下:ρi=∑i≠jχ(dij-dc),
Figure BDA0003542697290000071
其中,dij为样本xi和xj之间的距离,使用欧式距离计算距离,将与xi的距离小于dc的点的数量直接作为第i点密度。欧式距离计算公式
Figure BDA0003542697290000072
(i,j=1,2,...,n,i≠j,α=1,2,...,M),其中,x表示第i点的第α维坐标。
(3)计算局部密度距离:计算每个点到高于自身局部密度值点的最小距离ξi,ξi的计算公式如下:
Figure BDA0003542697290000073
对于密度最大的样本,ξi定义为ξi=maxj(dij),其中pi为样本xi的局部密度,pj为样本xj的局部密度。
(4)根据密度与距离估计中心点:对每一个待聚类点,绘制出局部密度与高于局部密度点距离的散点图,密度峰值通常是局部密度较高且相对距离较大的样本。
(5)划分剩余待聚类点:将每个数据点归类到比他们密度更大的最相近的类中心所属的类别中。密度峰值聚类算法原理如图2所示。
通过对DPC算法进行优化,能够更加精准地找到符合条件的聚类中心,将剩余待聚类点进行聚类,提高聚类性能。将局部密度截断核计算方式优化为高斯核计算方式,能够显著提高密度计算的精细度,从而更好地优化聚类效果。高斯核计算方式将计算欧式距离和高斯函数值,将所有点值的和作为密度。高斯函数值定义样本局部密度计算公式为:
Figure BDA0003542697290000081
由于密度峰值聚类算法最初是依据局部密度与高局部密度点距离的散点图人工选取聚类中心,由人工进行聚类中心的选取易出现较大的偏差,因此对聚类中心点的选取进行优化。采用决策值的方法进行优化:选择决策值γi较大的样本作为密度峰值聚类中心,即局部密度与局部密度距离乘积较大的点,γi的计算公式如下:γi=ρi·ξi
轮廓系数用于评估聚类的效果,其取值范围为[-1,1]。轮廓系数越大,表示聚类的效果越好。具体算法流程如下:
(1)计算样本i到同簇其他样本的平均距离ai,ai称为样本i的簇内不相似度。ai越小,说明样本i越应该被聚类到该簇。簇C中所有样本的ai均值称为簇C的簇不相似度。平均距离ai即计算样本i到同簇其他样本的距离之和再除以所有样本数。
(2)计算样本i到其他某簇Cj的所有样本的平均距离bi,j,称为样本i与簇Cj的不相似度。定义样本i的簇间不相似度:bi={bi1,bi2,...,bik},bi越大,说明样本i越不属于其他簇。平均距离bi,j即计算样本i到其它某簇Cj的所有样本的距离之和再除以所有样本数。
(3)根据样本i的簇内不相似度ai和簇间不相似度bi,定义样本i的轮廓系数:
Figure BDA0003542697290000082
Figure BDA0003542697290000083
(4)判断:si接近1,则说明样本i聚类合理、有效;si接近-1,则说明样本i更应该分类到另外的簇;若si近似为0,则说明样本i在两个簇的边界上。
通过选取下一代自主式交通系统中的道路自动驾驶场景下的功能数据集进行实例分析,以验证算法的性能。自主式交通系统共分成九大服务域:出行者信息服务域、道路载运工具运行服务域、货物运输服务域、交通基础设施管理服务域、公共交通服务域、交通运营管理服务域、综合交通运输服务域、交通安全管理服务域、数据管理与安全服务域。根据道路自动驾驶场景搭建的需要,研究场景下的道路载运工具运行服务域、交通基础设施管理服务域和交通安全管理服务域三个服务域,每个服务域下均有对应的服务、子服务以及功能。道路载运工具运行服务域中共有3项服务、10项子服务,该服务域分布如图3所示。交通基础设施管理服务域总共有1项服务,2项子服务,该服务域分布如图4所示。交通安全管理服务域共有2项服务、3项子服务,该服务域分布如图5所示。
三个服务域中的每项子服务中均包含多种功能,为便于进行聚类,首先对功能的属性进行如下定义并建立属性库。
(1)提供者:决定组分实体、关联技术组合和关联需求组合。对属性提供者建立库用ai(i=1,2,......,10)表示,如表1所示。
表1属性提供者库
Figure BDA0003542697290000091
Figure BDA0003542697290000101
过程对象:功能实现所利用或处理的对象。对属性过程对象建立库,用bi(i=1,2,......,25)表示,如表2所示。
表2属性过程对象库
符号 名称 符号 名称
b<sub>1</sub> 车辆基础信息 b<sub>14</sub> 路面基础信息
b<sub>2</sub> 车辆数据 b<sub>15</sub> 路网信息
b<sub>3</sub> 车辆信息 b<sub>16</sub> 任务派遣信息
b<sub>4</sub> 车辆运行信息 b<sub>17</sub> 设备操作信息
a<sub>5</sub> 车辆状态数据 b<sub>18</sub> 事故信息
b<sub>6</sub> 调度方案 b<sub>19</sub> 协同设施信息
b<sub>7</sub> 驾驶员信息 b<sub>20</sub> 养护方案
b<sub>8</sub> 交通法规信息 b<sub>21</sub> 预警方案
b<sub>9</sub> 交通状态信息 b<sub>22</sub> 预警信息
b<sub>10</sub> 紧急车辆信息 b<sub>23</sub> 支撑设施信息
b<sub>11</sub> 紧急事件信息 b<sub>24</sub> 周边车辆信息
b<sub>12</sub> 紧急预警信息 b<sub>25</sub> 周边环境信息
b<sub>13</sub> 路径导航信息
服务对象:能够直接使用功能或利用功能的输出结果的对象。对属性服务对象建立库用ci(i=1,2,......,10)表示,如表3所示。
表3属性服务对象库
Figure BDA0003542697290000102
Figure BDA0003542697290000111
结合属性库研究每个功能的属性,对道路自动驾驶场景下的子服务的各个功能采用属性组合形式表示。根据子服务的需求科学确定其所需功能,如下:
表4场景下的服务功能表
服务 功能
自动泊车 {A<sub>1</sub>;A<sub>2</sub>;A<sub>3</sub>;A<sub>4</sub>;A<sub>5</sub>;A<sub>6</sub>;A<sub>7</sub>;A<sub>8</sub>;A<sub>9</sub>}
自适应巡航 {A<sub>1</sub>;A<sub>10</sub>;A<sub>11</sub>;A<sub>12</sub>;A<sub>13</sub>;A<sub>5</sub>;A<sub>14</sub>;A<sub>15</sub>;A<sub>7</sub>;A<sub>16</sub>;A<sub>17</sub>;A<sub>18</sub>}
自动换道 {A<sub>2</sub>;A<sub>4</sub>;A<sub>10</sub>;A<sub>19</sub>;A<sub>14</sub>;A<sub>7</sub>;A<sub>16</sub>;A<sub>20</sub>;A<sub>21</sub>}
碰撞管理 {A<sub>10</sub>;A<sub>1</sub>;A<sub>19</sub>;A<sub>16</sub>;A<sub>16</sub>;A<sub>22</sub>;A<sub>23</sub>;A<sub>24</sub>}
车辆编队驾驶服务 {A<sub>1</sub>;A<sub>2</sub>;A<sub>10</sub>;A<sub>25</sub>;A<sub>7</sub>;A<sub>16</sub>;A<sub>26</sub>;A<sub>27</sub>;A<sub>28</sub>;A<sub>29</sub>}
车辆与信号灯协同驾驶服务 {A<sub>30</sub>;A<sub>13</sub>;A<sub>31</sub>;A<sub>15</sub>;A<sub>32</sub>;A<sub>33</sub>;A<sub>34</sub>}
无信号灯路口通行服务 {A<sub>10</sub>;A<sub>35</sub>;A<sub>36</sub>;A<sub>16</sub>;A<sub>36</sub>;A<sub>37</sub>;A<sub>38</sub>;A<sub>39</sub>;A<sub>40</sub>;A<sub>41</sub>}
车辆年检 {A<sub>42</sub>;A<sub>43</sub>;A<sub>44</sub>;A<sub>45</sub>;A<sub>46</sub>;A<sub>47</sub>}
无人车整车性能测试 {A<sub>48</sub>;A<sub>42</sub>;A<sub>44</sub>;A<sub>45</sub>;A<sub>49</sub>;A<sub>50</sub>}
无人车情景测试 {A<sub>48</sub>;A<sub>42</sub>;A<sub>51</sub>;A<sub>44</sub>;A<sub>45</sub>;A<sub>52</sub>;A<sub>49</sub>;A<sub>50</sub>}
通信技术协同设施管理 {A<sub>53</sub>;A<sub>54</sub>;A<sub>55</sub>;A<sub>56</sub>;A<sub>57</sub>}
人工智能信息支撑设施管理 {A<sub>58</sub>;A<sub>59</sub>;A<sub>60</sub>;A<sub>61</sub>;A<sub>62</sub>}
车载监控与预警 {A<sub>63</sub>;A<sub>48</sub>;A<sub>45</sub>;A<sub>44</sub>;A<sub>64</sub>;A<sub>65</sub>;A<sub>66</sub>}
紧急事件检测与自动识别 {A<sub>67</sub>;A<sub>68</sub>;A<sub>69</sub>;A<sub>70</sub>;A<sub>71</sub>;A<sub>72</sub>;A<sub>73</sub>;A<sub>74</sub>}
紧急车辆调度 {A<sub>75</sub>;A<sub>60</sub>;A<sub>72</sub>;A<sub>76</sub>;A<sub>77</sub>;A<sub>78</sub>}
采用TF-IDF算法将每个服务下功能的属性转化为数据,并依据VSM算法转化成空间维度坐标,如表5所示。
表5场景下的功能空间维度坐标表
Figure BDA0003542697290000121
Figure BDA0003542697290000131
由于部分不同名称的功能具有相同的属性,故将上述78个数据删去重复值后共计37个空间维度坐标数据,再运用MATLAB软件进行编程,采用优化的密度峰值聚类算法,其中dc取0.02。计算出每个功能点的密度和局部密度距离,得到寻找聚类中心散点图,如图6所示。
通过上图可以看到,针对每个功能点计算出了数据密度和局部密度距离,采用决策值法计算每个功能点的数据密度和局部密度距离乘积,按照降序排列,从第六位开始数据的决策值低于0.1,故将决策值较大的前5位记录如表6,表中数据说明待聚类点以这5个点为聚类中心较合适。
表6决策值
Figure BDA0003542697290000132
Figure BDA0003542697290000141
接着,依据密度峰值聚类算法原理,继续对数据进行聚类分析,通过MATLAB编程得到如图7所示的聚类结果图。然后,采用轮廓系数对由密度峰值聚类算法得到的各功能点进行聚类结果评价,得到如下图8所示各功能点的轮廓系数图。聚类后轮廓系数整体均值为0.84,聚类效果较好,但其中有三个数据点的轮廓系数低于0.6。为此,再次对这三个数据点所在的簇1、簇4进行聚类分析,以提高聚类结果性能。重新对簇1和簇4进行聚类分析后,整理得到如表7所示4簇聚类结果。
表7最终聚类结果
Figure BDA0003542697290000142
依据聚类结果,将簇1命名为自主感知层,该层主要是获取实体世界的信息;簇2命名为自主学习层,该层主要是处理感知数据、获取知识;簇3命名为自主决策层,该层主要是通过充分评估,形成最优控制方案;簇4命名为自主响应层,该层主要是最终执行阶段。
绘制功能架构图如图9所示,以道路载运工具运行服务域中的自动车辆驾驶服务下的碰撞管理子服务为例。在该子服务中,共有自主感知层、自主学习层、自主决策层和自主响应层四层,最终通过多种多属性功能实现碰撞管理子服务,进而支持自动车辆驾驶服务。
本发明的有益效果如下:
1)确定自主式交通系统功能架构构建方法,为自主式交通系统的构建提供新思路;
2)优化密度峰值聚类算法,通过高斯函数值计算数据点密度,通过决策值优化聚类中心选取;
3)针对各领域多属性文本转化成可用数据提供方法;
4)本发明提供一种自主式交通系统功能架构构建方法,是对交通系统功能架构的创新,可为下一代自主式交通系统的构建提供参考。
本文所使用的词语“优选的”意指用作实例、示例或例证。本文描述为“优选的”任意方面或设计不必被解释为比其他方面或设计更有利。相反,词语“优选的”的使用旨在以具体方式提出概念。如本申请中所使用的术语“或”旨在意指包含的“或”而非排除的“或”。即,除非另外指定或从上下文中清楚,“X使用A或B”意指自然包括排列的任意一个。即,如果X使用A;X使用B;或X使用A和B二者,则“X使用A或B”在前述任一示例中得到满足。
而且,尽管已经相对于一个或实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以多个或多个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的存储方法。
综上所述,上述实施例为本发明的一种实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何背离本发明的精神实质与原理下所做的改变、修饰、代替、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种构建自主式交通系统功能架构的方法,其特征在于,包括以下步骤:
步骤1:针对多属性文本聚类问题,构建面向多属性文本的优化密度峰值聚类模型;
步骤2:依据多属性文本的特征计算词语属性频率和属性的逆向文档频率,根据所述词语属性频率与属性的逆向文档频率,将多属性文本转化成数值;
步骤3:依据不同属性文本的数值权重采用文本向量空间模型将数值转化成空间维度坐标;
步骤4:优化密度峰值的计算方式:采用高斯核方法优化数据点局部密度计算方式;
采用决策值优化聚类中心选取,选择决策值较大的样本作为密度峰值聚类中心,获得聚类结果;
步骤5:根据步骤4的聚类结果,采用轮廓系数法对聚类结果作出评价,对轮廓系数较低的数据点重复步骤4;
步骤6:验证算法的可行性,在自主式交通系统的道路自动驾驶场景下,三个服务域下的功能依据最终聚类结果分成“自主感知、自主学习、自主决策、自主响应”4层,依据层与层之间的关系,绘制功能架构图。
2.根据权利要求1所述的构建自主式交通系统功能架构的方法,其特征在于,步骤2的具体步骤如下:
(1)计算词语属性频率:
Figure FDA0003542697280000011
其中,s表示某文本的属性,
Figure FDA0003542697280000012
为该属性s在文档中出现的次数,Wn(n=1,2,...,N,N为文档总数)表示由文本属性组成的属性库;
(2)根据文本属性转换的需要,假定词语在属性库中必定出现,采用平滑的逆文档频率计算属性的逆向文档频率:
Figure FDA0003542697280000021
(3)多属性文本TF-IDF算法计算公式为TF·IDF(s,Wn,W)=TF(s,Wn)·IDF(s,W),当TF-IDF值越大时表明该词语更能代表该文档,即在TF-IDF值越大表明该属性越能够代表该文本。
3.根据权利要求1所述的构建自主式交通系统功能架构的方法,其特征在于,基于文本向量空间模型得到文本空间维度坐标,所述文本向量空间模型将给定的文本转换成一定维数的向量,其以特征项作为文本表示的基本单位,向量的各维对应文本中的一个特征项,而每一维本身则表示了其对应的特征项在该文本中的权值,权值代表了特征项对于所在文本的重要程度,即该特征项能够多大程度上反映它所在文档的类别。
4.根据权利要求1所述的构建自主式交通系统功能架构的方法,其特征在于,通过对密度峰值聚类算法进行优化,找到符合条件的聚类中心,将剩余待聚类点进行聚类,提高聚类性能,具体步骤如下:
将局部密度截断核计算方式优化为高斯核计算方式,以显著提高密度计算的精细度;所述高斯核计算方式计算欧式距离和高斯函数值,将所有点值的和作为密度,所述高斯函数值定义样本局部密度计算公式为:
Figure FDA0003542697280000022
其中,dij为样本xi和xj之间的距离,dc为截断距离,n为样本数;
计算局部密度距离:计算每个点到高于自身局部密度值点的最小距离ξi,ξi的计算公式如下:
Figure FDA0003542697280000023
对于密度最大的样本,ξi定义为ξi=maxj(dij),其中pi为样本xi的局部密度,pj为样本xj的局部密度;
对聚类中心点的选取采用决策值的方法进行优化:选择决策值γi较大的样本作为密度峰值聚类中心,即局部密度与局部密度距离乘积较大的点,γi的计算公式如下:γi=ρi·ξi
5.根据权利要求1所述的构建自主式交通系统功能架构的方法,其特征在于,通过轮廓系数检验聚类性能,对于轮廓系数较低的数据点进行重复聚类,具体算法流程如下:
计算样本i到同簇其他样本的平均距离ai,ai称为样本i的簇内不相似度;ai越小,说明样本i越应该被聚类到该簇,簇C中所有样本的ai均值称为簇C的簇不相似度;
计算样本i到其他某簇Cj的所有样本的平均距离bi,j,称为样本i与簇Cj的不相似度,定义样本i的簇间不相似度:bi={bi1,bi2,...,bik},bi越大,说明样本i越不属于其他簇;
根据样本i的簇内不相似度ai和簇间不相似度bi,定义样本i的轮廓系数:
Figure FDA0003542697280000031
Figure FDA0003542697280000032
判断:si接近1,则说明样本i聚类合理、有效;si接近-1,则说明样本i更应该分类到另外的簇;若si近似为0,则说明样本i在两个簇的边界上。
6.根据权利要求1所述的构建自主式交通系统功能架构的方法,其特征在于,针对自主式交通系统功能架构的构建,将场景下的服务域中的功能进行聚类分析,依据聚类结果搭建功能架构,绘制功能架构图。
7.根据权利要求6所述的构建自主式交通系统功能架构的方法,其特征在于,自主式交通系统的功能具有提供者、过程对象、服务对象三个属性,并建立属性库。
CN202210237148.1A 2022-03-11 2022-03-11 一种构建自主式交通系统功能架构的方法 Pending CN114579748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210237148.1A CN114579748A (zh) 2022-03-11 2022-03-11 一种构建自主式交通系统功能架构的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210237148.1A CN114579748A (zh) 2022-03-11 2022-03-11 一种构建自主式交通系统功能架构的方法

Publications (1)

Publication Number Publication Date
CN114579748A true CN114579748A (zh) 2022-06-03

Family

ID=81775181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210237148.1A Pending CN114579748A (zh) 2022-03-11 2022-03-11 一种构建自主式交通系统功能架构的方法

Country Status (1)

Country Link
CN (1) CN114579748A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116810493A (zh) * 2023-08-31 2023-09-29 山东惠硕重工机械有限公司 基于数据驱动的数控机床防碰撞检测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116810493A (zh) * 2023-08-31 2023-09-29 山东惠硕重工机械有限公司 基于数据驱动的数控机床防碰撞检测方法及系统
CN116810493B (zh) * 2023-08-31 2023-11-21 山东惠硕重工机械有限公司 基于数据驱动的数控机床防碰撞检测方法及系统

Similar Documents

Publication Publication Date Title
CN109191896B (zh) 个性化停车位推荐方法和系统
Pedro et al. Integrating GIS spatial dimension into BREEAM communities sustainability assessment to support urban planning policies, Lisbon case study
CN111651545A (zh) 一种基于多源数据融合的城市边缘区提取方法
CN104992244A (zh) 一种基于sarima和rbf神经网络集成组合模型的机场货运量预测分析方法
CN112183605B (zh) 一种基于运行特征的民航管制扇区分类方法
Chen et al. Discrimination and prediction of traffic congestion states of urban road network based on spatio-temporal correlation
CN111626582B (zh) 一种城市交通出行问题热点分级方法及装置
Tu et al. Research on intelligent calculation method of intelligent traffic flow index based on big data mining
CN114579748A (zh) 一种构建自主式交通系统功能架构的方法
CN108898244A (zh) 一种耦合多源要素的数字标牌位置推荐方法
CN117725448A (zh) 气象导航信号特征的聚类分析方法
CN113240265B (zh) 一种基于多模式交通数据的城市空间划分方法
Zhu et al. Calibrating travel time thresholds with cluster analysis and AFC data for passenger reasonable route generation on an urban rail transit network
Toplak et al. Novel road classifications for large scale traffic networks
CN117610734A (zh) 基于深度学习的用户行为预测方法、系统和电子设备
CN111738527B (zh) 一种基于热点探测模型的城市交通小区划分方法
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
CN116862743A (zh) 一种旅客联程运输方案预测方法、系统及设备和介质
CN114912854B (zh) 地铁列车运行调整方法、装置、电子设备及存储介质
Xue et al. Traffic status evolution trend prediction based on congestion propagation effects under rainy weather
CN112926809B (zh) 一种基于聚类和改进的xgboost的航班流量预测方法及系统
Wang et al. An Affinity Propagation‐Based Clustering Method for the Temporal Dynamics Management of High‐Speed Railway Passenger Demand
CN114565031A (zh) 基于经纬度的车队识别方法、装置及计算机设备
CN111985526B (zh) 一种基于相似场景聚类的尾随间隔管理策略生成方法及其系统
CN114491971A (zh) 一种基于混合Logit模型和贝叶斯模型平均的出行行为建模方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination