CN114092897A - 道路分类方法与设备 - Google Patents
道路分类方法与设备 Download PDFInfo
- Publication number
- CN114092897A CN114092897A CN202010751680.6A CN202010751680A CN114092897A CN 114092897 A CN114092897 A CN 114092897A CN 202010751680 A CN202010751680 A CN 202010751680A CN 114092897 A CN114092897 A CN 114092897A
- Authority
- CN
- China
- Prior art keywords
- road
- classification
- cluster
- image frame
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/588—Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/7625—Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种道路分类方法与装置,所述方法包括:捕获当前道路的至少一个图像帧;处理所述图像帧以标识出所述图像帧内多个视觉特征;将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
Description
技术领域
本发明涉及自动驾驶,尤其是涉及用于自动驾驶的道路识别。
背景技术
目前随着网络通信技术、人工智能的发展,汽车可以实现智能网联,车辆的自动驾驶系统(ADS)自动化水平越来越高,由此自动驾驶已经逐步变为现实。而在自动驾驶中应用的一个重要的技术是地理围栏技术。地理围栏技术是指一个地理区域,在此区域内,智能网联汽车在哪进入、其速度以及燃料使用情况都受到电子监控,并且由此实现智能汽车与智能网联交通系统等控制中心的通信。而在地理围栏技术中,对汽车当前行驶道路的了解则是必须要解决的一个重要因素,ADS需要了解当前行驶道路是高速路、城市路还是普通乡村公路等。
目前,地理围栏技术的实现主要采用GPS信号或在经过收费站时收到ETC信号。显然,对于在高速公路行驶的车辆,在经过隧道、沙漠等特殊环境时GPS信号变坏或没有,或者在远离收费站时也不会收到ETC信号,因此车辆不会知道它是否还在高速公路。因此基于GPS或ETC的地理围栏技术受到很大限制。
发明内容
本发明提出一种借助于机器学习技术,基于道路的直接视觉特征来判断道路类型的技术。
根据本发明一个方面,提供一种道路分类方法,包括:捕获当前道路的至少一个图像帧;处理所述图像帧以标识出所述图像帧内多个视觉特征;将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
根据本发明另一个方面,提供一种道路分类模型的训练方法,包括:获取多个图像帧,每个图像帧包括所述道路的视觉特征;处理每一帧图像以标识出所述图像帧内包含的多个视觉特征;基于所述视觉特征,对所述多个图像帧进行聚类处理以确定每个图像帧所属的聚类簇,以形成多个聚类簇;从同一聚类簇下的图像帧中的视觉特征中选择与该聚类簇最相关的多个视觉特征,作为该聚类簇的属性特征;利用同一聚类簇下每个图像帧中的所述多个属性特征形成训练样本,用于训练与该聚类簇匹配的道路分类模型。
根据本发明再一个方面,提供一种计算系统,包括用于对行驶道路分类的道路分类模块,其中所述道路分类模块配置为:处理当前行驶道路的至少一个图像帧以标识出所述图像帧内多个视觉特征;将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
根据本发明另一个方面,提供一种道路分类装置,包括:特征提取模块,用于处理当前道路的至少一个图像帧以标识出所述图像帧内多个视觉特征;聚类模块,用于将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;特征选择模块,用于从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;分类模块,用于利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
根据本发明的方案,不但可以区分出像高速路、城市街道、乡村道路这样明显不同的道路,还可以区分出像高速公路、城市快速路这样有很大的相似性的道路。
附图说明
图1A示出了根据本发明实施例的道路分类模型训练流程图;
图1B示出根据本发明另加一实施例道路分类模型训练示意图;
图2示出了根据本发明的一个实施例的道路分类设备的示意图;
图3示出了据本发明的另一个实施例的道路分类设备的示意图;
图4示出根据本发明一个示例的道路分类方法的流程图;
图5示出根据本发明另一示例的道路分类方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是用于说明本发明为目的,而非限制性的。
在道路规划中,通常针对不同的道路设计不同的标准及交通标志。例如,对于城市道路,通过需要设置路灯、斑马线、禁止停车、禁止鸣笛等标志;而像高速公路则会通常设置例如服务区、加油站标识、距离下一出口或目标公里数等标志牌。常规地,通常基于神经网络,采用机器学习这些特征从而判断当前道路的分类,即是高速路、城镇快速路、村路、还是郊区公路。然而现实中,由于道路环境复杂、建设标准不统一或不完善,在道路环境中出现的一些特征或符号与道路并不相符。例如在城市快速路上出现非法行驶的卡车、在一些非高速道路上出现一些高速路所特有的标志等,这些都会对道路的识别造成干扰。此外,传统上通常采用单一神经网络模型来学习道路特征以实现道路分类,然而由于道路的复杂性,这种单一通用模型通常会滤掉对当前道路有用的重要特征,因此利用单一的模型并不能实现道路的准确分类。为此,本发明提出一种可专用于多种道路分类的特定融合方案,其通过将当前道路的所有视觉特征Vis_F考虑进来,并从中动态地筛选出重要的特征,利用经过训练的专用的道路分类模型来实现对道路的分类。
[模型训练]
图1A示出了根据本发明实施例的训练专用道路分类模型RCM的流程图。按照本发明的一个示例,可利用大数据处理技术(例如机器学习方法)对道路的视觉特征Vis_F进行训练处理,从而学习到视觉特征Vis_F与道路分类之间的相关性,这种相关性可以用道路分类模型RCM来表示。这里需要指出的是,道路分类模型RCM并不限于神经网络模型,还可以是以其它算法或数学表示表达的任何大数据机器学习模型,只要这种算法或数学表示表反映道路的类别与道路的视觉特征Vis_F的相关性即可。此外,按照本发明,可以为不同类型的道路训练各自不同的RCM。
首先在步骤101,针对各种类型的道路,收集包含道路的各种视觉特征Vis_F的图像帧,这里每个图像帧是针对一种类型的道路的实景拍摄。不难理解,每个图像帧可包括反映该道路特征的多个视觉图像。例如,对于高速公路,所拍摄的图像帧中的视觉特征Vis_F可能包含有卡车、收费站、加油站等高速特有的交通标志。对于城市街道,则所拍摄的图像帧中的视觉特征Vis_F则可能包含有路灯、红绿灯、人行道以及限速牌等交通标志。但是显然,针对不同的道路,也会存在相同的视觉特征例如限速牌。这里假定收集了针对不同道路的N个图像帧X1、X2、X3、X4、…XN。
在步骤103,对步骤101中所获得的每一图像帧X进行处理以标识出每一图像帧内包含的视觉特征Vis_F。由于道路中包含的交通标志等视觉特征的不确定性,按照本发明的一个实施例,对每一帧图像执行预定数量和类型的视觉特征Vis_F检测处理,这里要检测的视觉图像的数量和类型可涵盖现有交通法规及道路建设标准下的典型的交通标志或设施。例如对所有的图像帧,均执行路灯、人行道、卡车、交通标志A、交通标志B、交通标志C…收费站等W项视觉特征检测。这里可以采用现有技术已知的特征检测技术来识别出图像中可能包含的视觉特征Vis_F。例如,对于第一个图像帧X1,可以采用基于机器深度学习而训练得到的路灯检测模型,来检测图像帧X1中是否包含路灯,作为一个示例,检测结果可以用置信度来表示,用于表示该道路中检测到了路灯的概率。此外,检测结果中还可以包含在图像帧X1中路灯所处的相对位置。以此方式,可以利用事先训练得到的人行道检测模型、卡车检测模型、交通标志A检测模型、交通标志B检测模型、交通标志C检测模型…收费站检测模型等分别对同一图像帧X1执行相应的视觉特征Vis_F的检测,从而针对图像帧X1,检测出各视觉特征Vis_F,从而生成针对图像帧X1的数据,以下记为X1=(x1 (1),x1 (2),x1 (3)…x1 (W),y1),这里x1 (i)代表图像帧X1的第i个视觉特征Vis_F,这里y1代表图像帧X1所对应的道路类别,例如高速路。
以此方式,通过对其余的N-1个图像帧X2-XN分别应用路灯检测模型、人行道检测模型、卡车检测模型、交通标志A检测模型、交通标志B检测模型、交通标志C检测模型…收费站检测模型,从而生成各图像帧的视觉特征数据:
X2=(x2 (1),x2 (2),x2 (3)…x2 (W),y2),
…
XN=(xN (1),xN (2),xN (3)…xN (W),yN)。
在生成样本数据{X1,X2,…XN}后,在步骤105,利用聚类算法对这些数据样本执行聚类处理以确定可划分到同一聚类簇的数据样本X。根据本发明,由于道路类别的数量是事先知道的,因此,这里可以指定所形成的聚类簇的数量。例如y1,y2,…yN分别代表高速路、城市快速路、普通城市道路、郊区道路以及乡村道路中的一种。因此,这里可指定聚类簇的数量为5个。这里对数据样本执行聚类簇的目的在于:根据样本之间的相似性,将样本划分到不同簇中,由此确定哪些样本更适合于做本簇对应道路的类别预测,也要剔除那么不适用于预测的样本。
为执行样本聚类,首先构建样本视觉特征矩阵,矩阵中包含各个道路的视觉特征Vis_F以及道路类别标签,其中视觉特征Vis_F以其置信度值来表示。下面表1示出了利用数据样本构建的矩阵(作为示例,图中仅给出了路灯在图像帧(X1、X2、X3、X4、…XN)中的置信度数据):
表1:视觉特征矩阵
从该矩阵可以看到,每一行代表一个图像帧,其中矩阵中各元素值为该图像帧中检测到视觉特征的置信度,最后的标签列则示出该图像帧所对应道路类别。同时矩阵的每一列代表某一视觉特征在各图像帧中出现的置信度。例如,对于路灯这一元素,其在第1-N个图像帧中的出现的概率分别是:0.91,0.09,0.89,0.89,…,0.18。
根据本发明,基于样本矩阵中的视觉特征元素即置信度执行聚类处理,如图中虚线框所标示的视觉特征元素。这里需要注意的是,在执行聚类处理时,不将标签纳入,从而实现无监督学习。这里可以采用现有技术已知的任何聚类算法来实现,例如k-Means算法、Mean-Shift算法,基于密度的噪声应用空间聚类(DBSCAN)、EM(期望最大化)算法等。作为采用K-means算法的示例,由于道路分类的数量是事先可以确定的,例如可以设定为5个,因此在采用K-means算法实现时,基于数据样本与假设中心点的欧几里德距离来最终确定聚类中心CP,从而生成K(=5)个簇,对于每个确定的簇,位于该簇内的样本至中心点CP的欧几里德距离D在预设半径R内。在本例中,通过对表1里的视觉特征元素置信度进行聚类,得到5个簇C1~C5,如下表2中用点线、点划线、实线三个框示意性地示出其中的3个簇C1~C3。
表2:样本聚类
其中在点线框所示的聚类簇C1中包含样本X1,XN等元素,在点划线框所示的聚类簇C2中包含样本X2,X3等元素、在实线框所示的聚类簇C3中包含样本X4等元素。这里需要注意的是,某些或某个数据样本的标签可能存在不统一的情况,例如原采集的属于国道的数据Xm通过聚类处理后可能会归入乡村道路,因此可通过聚类处理后予以修正或予以剔除。
在步骤105确定了C1~C5聚类簇后,将每个聚类簇的所应用的算法信息、聚类条件存储起来。例如以K-means的示例,将用于聚类的K-means算法、每个聚类簇C1~C5的中心点CP_1,CP_2,CP_3,CP_4,CP_5以及用于确定对应聚类簇的欧几里德距离阈值R1,R2,R3,R4,R5分别存储在存储单元中,以备后续道路分类使用。
在上述实施例中,采用的是K-means算法,事先指定待聚类的簇的数量,但本发明并不限于此。在本发明的另一实施例中,还可以采用不指定聚类簇数量的算法,例如采用Mean-shift算法。与K-means聚类算法相比,Mean-shift算法不需要选择簇的数量,因为它是自动找寻当前的数据样本可划分成几类。利用该算法可以滤除掉偏离较大的样本,并仅选取感觉兴趣的簇。
在步骤107,在每个聚类簇内,从视觉特征(x(1),x(2),x(3)…x(W))中挑选与该簇标签即道路类型最相关的M个特征,M≤W。可以认为这M个特征决定了所拍摄的道路的类别,在本公开中也将这M个视觉特征Vis_F称之为“道路属性特征Attr_F”。按照本发明的一个示例,可以利用斯皮尔曼等级相关系数(Spermann correlation coefficient)算法,来挑选每个标签下最相关的前M个特征。Spearman相关系数在统计学上常用于用于确定样本相关性,利用两个集合中元素在各自集合的等级(排名)来计算他们之间的相关性,以便对数据进行分析。作为一个应用示例,本发明采用如下方式确定M个特征:
步骤(1):利用下式计算斯皮尔曼等级相关系数ρ:
式中,x代表每个样本中的W个视觉特征Vis_F中的每一个,y代表数据样本的标签值,例如可以是为各个聚类簇分配的唯一的ID编号。显然在本例中在各聚类簇对应于道路分类的情况下,上述ID编号也视为道路编号,或者也可以采用道路的其它特征值作为样本的标签值。从该式可以看到,在本例中,斯皮尔曼等级相关系数被用于确定各视觉特征x与标签y的相关性,也即代表了各个视觉特征x对标签y的贡献度。
步骤(2):将各个视觉特征x按照其与标签y的相关性ρ值进行排序,在本例中,按照每个视觉特征的贡献度ρ进行降序排序,并从中选择前M个视觉特征,作为对标签y即道路分类有重要影响的属性特征Attr_F。这里需要指出的是,对于每一聚类簇C,所指定的“道路属性特征Attr_F”的数量M可以互不相同,也可以是相同的,这取决于实际需要,例如可以选取每个簇内视觉特征数量的一半作为属性特征。为便于说明,仅作为示例,这里假定对聚类簇C1,指定了第(1)、(2),(5)、…(j)视觉特征Vis_F(共M个),作为道路属性特征Attr_F1,即Attr_F1=(x(1),x(2),x(5)…x(j))。
对其它聚类簇C2~C5,同样执行上述方法,从而得到每个聚类簇下的道路属性特征Attr_F,例如对于聚类簇C2,其指定了(1)、(3),(8)、…(k)视觉特征Vis_F作为道路属性特征,即Attr_F2=(x(1),x(3),x(8)…x(k))。
随后在步骤109,基于针对每个簇确定的道路属性特征Attr_F,形成训练样本,用于训练适配于该聚类簇的道路分类模型RCM。例如对于聚类簇C1:包含样本(X1、X3、X6,X7,X12),则用于聚类簇C1的训练样本构建如下:
X1=(Attr_F1,y1)=(x1 (1),x1 (2),x1 (5)…x1 (j),y1)
X3=(Attr_F3,y3)=(x3 (1),x3 (2),x3 (5)…x3 (j),y3)
X6=(Attr_F6,y6)=(x6 (1),x6 (2),x6 (5)…x6 (j),y6)
X7=(Attr_F7,y7)=(x7 (1),x7 (2),x7 (5)…x7 j),y7)
X12=(Attr_F12,y12)=(x12 (1),x12 (2),x12 (5)…x12 (j),y12)
在上述样本中,各标签y1、y3、y6、y7、y12是相同的,均指同一道路类别。然后利用训练样本(X1、X3、X6,X7,X12)来训练一神经网络,从得到适用于聚类簇C1的道路分类模型RCM1。
按照本发明的实施例,在步骤103在对图像帧中的视觉特征Vis_F进行识别时,不但给出相应视觉特征Vis_F的置信度U,而且该给出该视觉特征Vis_F在图像帧X中的相对位置L。例如在确定出图像帧中包含的道路的中心线或者最外侧道路的边缘后,这里的相对位置L可以是每个视觉特征Vis_F相对于中心线或边缘的距离。例如,对于识别出的绿化带或建筑物,其相对位置L可以是与最右侧车道的最外侧车道线的距离。因此在构建用于训练道路分类模型RCM1的样本时,这里的每个属性特征x(n)不但包含置信度、而且还包含相对位置信息,即x(n)=f(Un,Ln),其中Un表示检测出视觉特征Vis_Fx(n)的置信度,而Ln表示检测出的视觉特征Vis_Fx(n)的相对位置,而f表示对Un,Ln的组合处理函数,经过函数f转换后提供给神经网络来训练道路分类模型RCM1。不难理解,也可以是将Un,Ln直接提供给神经网络。
以此方式,针对其它聚类簇,利用每个簇内的属性特征Attr_F及标签,训练与其相应的道路分类模型RCM2~RCM5。例如对于聚类簇C2:假设其包含样本(X2、X3、X6,X8,X11)。则对聚类簇C2的训练样本构建如下:
X2=(Attr_F2,y2)=(x2 (1),x2 (3),x2 (8)…x2 (k),y2)
X3=(Attr_F3,y3)=(x3 (1),x3 (3),x3 (8)…x3 (k),y3)
X6=(Attr_F6,y6)=(x6 (1),x6 (3),x6 (8)…x6 (k),y6)
X8=(Attr_F8,y8)=(x8 (1),x8 (3),x8 (8)…x8 k),y8)
X11=(Attr_F11,y11)=(x11 (1),x11 (3),x11 (8)…x11 (k),y11)
如上所述,此时,训练样本中的各元素x是对应视觉特征Vis_F的置信度U与相对位置L的函数。
然后利用训练样本(X2、X3、X6,X8,X11)来单独训练一神经网络,从得到适用于聚类簇C2的道路分类模型RCM2。以此方式,生成适用于聚类簇C1~C5的道路分类模型RCM2~RCM5。在训练完成道路分类模型RCM1-RCM5后,可将其存储在道路分类设备的存储单元中,以供道路分类使用。
在本发明的示例中,用于学习道路的属性特征Attr_F的神经网络可以是本领域已知的任何神经网络引擎实现。例如,可利用卷积神经网络CNN、循环神经网络RNN来提取这些属性特征Attr_F中与道路的相关性特征。至于如何设计神经网络CNN、RNN的结构及每个RNN中的各单元,本领域人员可根据实际情况自行确定。例如,在一个更优选实施例中,RNN采用双向循环神经网络(BRNN)并且各节点可选用长短期记忆神经网络(LSTM)或门控循环神经网络(GRU)等不同的单元来实现。此外,在本发明的另一个实施例中,用于学习道路属性特征Attr_F的神经网络还可以采用不同类型的神经网络的级联网络实现。
在本发明的上述实施例中,在步骤105生成样本的聚类簇时采用的是K-means、Mean-shift、DBSCAN算法等单一算法来对样本进行聚类。然而在本发明的另一实施例中,还可以同时对同一样本库执行多种聚类分析。此外,在训练相应的道路分类模型时,也可以采用多种分类方法来训练。图1B示出了根据本发明另一实施例的训练方法。
如图1B所示,如前面实施例一样,在步骤103获得每一图像帧内包含的视觉特征Vis_F后,在步骤105对包含视觉特征Vis_F的各图像帧进行聚类处理。但是与图1A所示实施例不同,这里同时采用多种聚类方法基于步骤103得到的视觉特征Vis_F对各图像帧进行聚类处理,作为示例,图1B示出采用K-means,DBSCAN与EM(最大期望)算法来执行聚类。由此,在步骤105,每种聚类方法分别输出各自的聚类结果,这里假定仍对应于五种道路分类,图1B示出的K-means,DBSCAN与EM算法则分别产生五个聚类簇,其中K-means算法得到聚类簇记为C_K1~C_K5。DBSCAN算法得到聚类簇记为C_DB1~C_DB5,而EM算法得到聚类簇记为C_EM1~C_EM5。
与前面实施例类似,接下来在步骤107,对于每个聚类算法产生的各个聚类簇,从视觉特征(x(1),x(2),x(3)…x(W))中挑选与该簇标签即道路类型最相关的M个属性特征。在本例中,如图1B,在步骤107,利用例如斯皮尔曼等级相关系数算法,为聚类簇C_K1~C_K5确定属性特征C_K1_Attr_F~C_K5_Attr_F,为聚类簇C_DB1~C_DB5产生其属性特征C_DB1_Attr_F~C_DB5_Attr_F,为聚类簇C_EM1~C_EM5产生其属性特征C_EM1_Attr_F~C_EM5_Attr_F。
随后在步骤109,利用多种分类方法基于步骤107确定的属性特征来训练相应聚类簇的道路分类模型。如图所示,作为示例,示出四种分类方法即最近邻算法(K-NN)、AdaBoost级联分类器(AD)、支持向量机(SVM)、朴素贝叶斯(NB)算法。当然本发明可使用的分类算法不限于此,还可以使用本领域已知的其它算法。在步骤109,利用分类算法k-NN,AD,SVM,NB分别对在步骤105产生的所有聚类簇,基于在步骤107确定的各自属性特征来训练相应的k-NN,AD,SVM,NB分类模型。下面表3示出了针对各个聚类簇的道路分类模型RCM。
表3:多聚类-分类下的道路分类模型RCM
如表3所示,针对K-means、DBSCAN、EM中每一种聚类算法下得到的各个聚类簇,均训练出对应于四种分类算法的道路分类模型。例如,对于K-means算法下得到的聚类簇C_K1,按照K-means算法训练出分类模型RCMK 11、按照AD算法训练出分类模型RCMK 12、按照SVM算法训练出分类模型RCMK 13、按照BM算法训练出分类模型RCMK 14。
【道路分类】
利用事先训练的道路分类模型以及对应聚类簇信息,根据本发明的道路分类设备可用于预测当前行驶道路的分类。
图2示出了根据本发明的一个实施例的道路分类设备的示意图。如图所示,道路分类设备200包括存储单元201、图像捕获单元202、要素识别单元203、匹配单元204以及分类单元205。在存储单元201中存储有经过训练得到的聚类簇信息以及与其对应的道路分类模型RCM。作为单一聚类与分类方法的示例,存储单元201中例如存储有聚类簇C1~C5的中心点CP_1、CP_2、CP_3、CP_4、CP_5以及相应的阈值半径R1~R5信息,以及与簇C1~C5对应的道路分类模型RCM1~RCM5。这里的道路分类模型RCM1~RCM5是按照结合图1A所示的示例训练得到的。
图像捕获单元202用于拍摄当前行驶道路的环境图像以得到包含多个视觉特征Vis_F的一个或多个图像帧X。这里的视觉特征Vis_F可以是与当前行驶道路相关的一切特征,例如路灯、红绿灯、限速牌、出口、加油站等交通标志,还可以包括附助设施,例如人行道、隔离带或绿化带,甚至还可以包括道路自身的特征,例如分道线等。
特征识别单元203对图像帧X进行处理以标识出图像帧内包含的各视觉特征Vis_F。按照本发明的一个实施例,对图像帧执行预定数量W和类型的视觉特征Vis_F检测处理,这里要检测的视觉图像的数量和类型可涵盖现有交通法规及道路建设标准下的典型的交通标志或设施。例如对图像帧执行路灯、人行道、卡车、交通标志A、交通标志B、交通标志C…收费站等W项视觉特征Vis_F检测。这里可以采用现有技术已经存在的特征检测技术来识别出图像中可能包含的视觉特征Vis_F,例如现有技术中常用的利用卷积神经网络训练得到的各特征模型来识别道路特征的技术。例如,对于图像帧X,可以采用基于机器深度学习而训练得到的路灯检测模型,来检测图像帧X中是否包含路灯,检测结果可以置信度来表示,用于表示该道路中检测到了路灯的概率。按照本发明的实施例,在检测各视觉特征Vis_F时,还可以进一步确定包含在图像帧中各视觉特征Vis_F所处的相对位置信息。
以此方式,可以利用事先训练得到的人行道检测模型、卡车检测模型、交通标志A检测模型、交通标志B检测模型、交通标志C检测模型…收费站检测模型等分别对图像帧X执行相应的视觉特征Vis_F的检测。从而针对图像帧X,得到检测出的各视觉特征Vis_F的置信度数据U和相对位置数据L,以下记为X=(x(1),x(2),x(3)…x(W)),这里x(i)代表图像帧X的第i个视觉特征Vis_F。
匹配单元204将图像帧X的W个视觉特征Vis_F与存储器101中存储的预先确定的预定数量的聚类簇C1~C5中的每一个进行匹配以确定图像帧X属于C1-C5中哪一个聚类簇。在本例中,在采用K-means算法、基于视觉特征Vis_F的置信度训练出聚类簇C1~C5情况下,匹配单元204利用图像帧X中各视觉特征Vis_F的置信度,依次计算X与中心点CP_1、CP_2、CP_3、CP_4、CP_5的相对距离D,并与每个聚类簇的欧几里德距离阈值R1,R2,R3,R4,R5相比较,并确定相对距离D小于对应的阈值R的那个簇,作为图像帧X所属的聚类簇。例如,假定X与CP_2的相对距离D2小于R2,则可判断当前图像帧X属于聚类簇C2。
分类单元205基于图像帧X所属的聚类簇C2,从存储单元101存储的聚类簇信息中可确定聚类簇C2的道路属性特征Attr_F2为:x(1),x(3),x(8)…x(k),共M个属性特征。因此,从当前图像帧X的视觉特征(x(1),x(2),x(3)…x(W))中选取其中的视觉特征(x(1),x(3),x(8)…x(k)),作为属性特征Attr_F2,提供给与簇C2对应的道路分类模型RCM2,道路分类模型RCM2处理属性特征Attr_F2,生成相应道路的分类指示Road_ID,从而实现对当前道路的预测。如前所述,这里提供给道路分类模型RCM2的属性特征Attr_F2不但包含置信度、而且还包含相对位置信息,即属性特征中的每个元素x包括置信度以及相对位置信息。由此,分类单元205通过调用相匹配的道路分类模型RCM2,处理道路属性特征Attr_F2(x(1),x(3),x(8)…x(k))而估计出道路分类。
这里需要指出的是,上面实施例中是道路分类设备仅针对一帧图像来预测的,在本发明的另一实施例中,还可以对连续拍摄的一系列图像帧进行处理,并通过综合针对一系列图像帧中的每帧图像的预测结果来综合判断当前道路类型。
在本发明的另一实施例中,道路分类设备还可以利用结合图1B训练得到的多聚类-分类模型来执行道路分类,其中在道路分类设备的存储器101中存储有例如表3所示15个聚类簇及相应的60个道路分类模型RCM。当然这些聚类簇信息以及道路分类模型也可以存储在远端,以备道路分类设备调用。
如前所述,在特征识别单元203标识出图像帧内包含的各视觉特征Vis_F(即X=(x(1),x(2),x(3)…x(W)))后,匹配单元204将图像帧X的W个视觉特征Vis_F与存储器101中存储的预先确定的预定数量的聚类簇C_K1~C_K5、C_DB1~C_DB5、C_EM1~C_EM5中的每一个进行匹配以确定图像帧X分别属于每一类型降类簇下的哪一个聚类簇。作为示例,这里假定通过对比确定在K-means算法下,当前图像帧X属于C_K2,在DBSCAN算法下当前图像帧X属于C_DB3,以及在EM算法下,当前图像帧X属于C_EM5。
分类单元205基于图像帧X所属的聚类簇C_K2,从存储单元101中可确定聚类簇C_K2的道路属性特征K_Attr_F2为:x(1),x(3),x(8)…x(k),共M个属性特征。因此,从当前图像帧X的视觉特征Vis_F=(x(1),x(2),x(3)…x(W))中选取其中的视觉特征(x(1),x(3),x(8)…x(k)),作为属性特征K_Attr_F2,提供给利用K-NN算法训练得到的与簇C_K2对应的道路分类模型RCMK 21,以实现对当前道路的预测。如前所述,这里提供给道路分类模型RCMK 21的属性特征K_Attr_F不但包含置信度、而且还包含视觉特征x的相对位置信息。这里假定经过道路分类模型RCMK 21处理后输出的道路分类指示为Road_ID1=‘高速路’。
类似地,分类单元205将属性特征K_Attr_F2提供给与簇C_K2对应的利用AD算法训练得到的道路分类模型RCMK 22,以实现对当前道路的预测。这里假定经过道路分类模型RCMK 22处理后输出的道路分类指示为Road_ID2=‘高速路’。此外,分类单元205将属性特征K_Attr_F2提供给与簇C_K2对应的利用SVM算法训练得到的道路分类模型RCMK 23,并输出道路分类指示为Road_ID3=‘城市快速路’;分类单元205将属性特征K_Attr_F2提供给与簇C_K2对应的利用NB算法训练得到的道路分类模型RCMK 24输出道路分类指示为Road_ID4=‘城市快速路’。
与上面针对簇C_K2的处理类似,对于当前图像帧属于DBSCAN算法下的簇C_DB3以及EM算法下的簇C_EM5,同样利用上述四种分类模型来实现对当前道路的预测。具体地,分类单元205基于图像帧X所属的聚类簇C_DB3,从存储单元101中可确定聚类簇C_DB3的道路属性特征DB_Attr_F3,例如为:x(1),x(3),x(7)…x(k),共M个属性特征。因此,从当前图像帧X的视觉特征Vis_F=(x(1),x(2),x(3)…x(W))中选取其中的视觉特征(x(1),x(3),x(7)…x(k)),作为属性特征DB_Attr_F3,提供给利用K-NN算法训练得到的与簇C_DB3对应的道路分类模型RCMDB 31,利用AD算法训练得到的与簇C_DB3对应的道路分类模型RCMDB 32,利用SVM算法训练得到的与簇C_DB3对应的道路分类模型RCMDB 33,利用NB算法训练得到的与簇C_DB3对应的道路分类模型RCMDB 34,以实现对当前道路的预测。这里假定经过这四个道路分类模型处理后输出的道路分类指示为Road_ID5=‘普通公路’、Road_ID6=‘高速路’、Road_ID7=‘高速路’、Road_ID8=‘城市快速’。
对于簇C_EM5,分类单元205从存储单元101中可确定聚类簇C_EM5的道路属性特征EM_Attr_F5,例如为:x(1),x(3),x(8)…x(p),共M个属性特征。因此,从当前图像帧X的视觉特征Vis_F=(x(1),x(2),x(3)…x(W))中选取其中对应的视觉特征(x(1),x(3),x(8)…x(p)),作为属性特征EM_Attr_F5,提供给利用K-NN算法训练得到的与簇C_EM5对应的道路分类模型RCMEM 51,利用AD算法训练得到的与簇C_EM5对应的道路分类模型RCMEM 52,利用SVM算法训练得到的与簇C_EM5对应的道路分类模型RCMEM 53,利用NB算法训练得到的与簇C_EM5对应的道路分类模型RCMEM 54,以实现对当前道路的预测。这里假定经过这四个道路分类模型处理后输出的道路分类指示为Road_ID9=‘普通公路’、Road_ID10=‘高速路’、Road_ID11=‘高速路’、Road_ID12=‘高速路’。
由此,经过不同聚类簇下不同模型的预测分类处理后,得到12个道路分类指示结果(Road_ID1,Road_ID2,Road_ID3,Road_ID4,Road_ID5,Road_ID6,Road_ID7,Road_ID8,Road_ID9,Road_ID10,Road_ID11,Road_ID12)。由此,分类单元205可对上述分类指示结果进行分析以最终确定当前道路的分类。作为一个示例,分类单元205可对上述分类指示结果进行投票,将其中票数最多的分类作为当前道路的最终分类结果。显然,在本例中“高速路”得票数最多,Road_ID1=Road_ID2=Road_ID6=Road_ID7=Road_ID10=Road_ID11=Road_ID12=‘高速路’,因此分类单元205做出当前道路是高速路的最终决策。
在另一个实施例中,还可以根据当前图像帧X与15个聚类簇的匹配程度,而对对应的模型预测结果Road_ID进行加权,例如,在聚类处理时,如果匹配单元确定当前图像帧在K-means、DNSCAN、EM算法下所属的聚类簇匹配程度依次为C_DB>C_K>C_EM,则可对聚类簇C_DB下的四个预测结果Road_ID5、Road_ID6、Road_ID7、Road_ID8赋予高权重值例如1.2,而可对聚类簇C_EM下的四个预测结果Road_ID9、Road_ID10、Road_ID11、Road_ID12赋予低权重值例如0.9,对聚类簇C_K下的四个预测结果则保持不变。然后分类单元205对加权后的分类指示结果进行投票,从而确定最终的分类。
在上述实施例中,道路分类设备是以各独立单元形式实现的。然而本发明不限于此,道路分类设备可以以任何硬件、软件或其组合形式实现。图3示出了道路分类设备的另一示例。如图所示,道路分类设备300包括处理器301以及存储器302。在存储器302中存储有用于实现本发明的方法步骤的程序模块,包括特征识别模块303、匹配模块304以及分类模块305。此外,在存储器302中还包括图像存储区306以及数据存储区307,其中图像存储区306用于获取并存储从外部例如传感器接收的当前道路图像或视频X,数据存储区307则用于存储经过训练得到的聚类簇信息以及对应的道路分类模型RCM信息。由此,处理器301可被配置为通过执行存储器302中的各程序模块来实现本发明的方法。
图4示出根据本发明一个示例的由道路分类设备执行的道路分类方法的流程图。在步骤401:利用摄像机等图像传感器获取当前行驶道路的环境图像以得到包含多个视觉特征Vis_F的一个或多个图像帧X,并将图像帧X存储在存储器中。
在步骤402:对图像帧X进行处理以标识出图像帧X内包含的各视觉特征Vis_F。这里,利用路灯检测模型、人行道检测模型、卡车检测模型、交通标志A检测模型、交通标志B检测模型、交通标志C检测模型…收费站检测模型等,对图像帧X执行各视觉特征Vis_F的检测处理。检测结果可以利用检测到的视觉特征Vis_F的置信度来表示。此外,按照本发明的实施例,在检测各视觉特征Vis_F时,还可以进一步确定包含在图像帧中各视觉特征Vis_F所处的相对位置。以此方式,生成针对图像帧X的视觉特征Vis_F,即X=(x(1),x(2),x(3)…x(W))。
步骤403:将图像帧X的W个视觉特征Vis_F与存储器中预先确定的预定数量的聚类簇C1-C5中的每一个进行匹配以确定图像帧X属于C1-C5中哪一个聚类簇。在本例中,道路分类设备利用X中各视觉特征Vis_F的置信度,依次计算X与分属五个聚类簇的中心点CP_1,CP_2,CP_3,CP_4,CP_5的相对距离D,并与每个聚类簇的欧几里德距离阈值R1,R2,R3,R4,R5相比较,以确定相对距离D小于对应的半径阈值R的那个簇,作为图像帧X所属的聚类簇。在本例中,假定图像帧X属于聚类簇C2。
步骤404:基于在步骤403确定的当前图像帧X所属的聚类簇C,构建用于输入到道路分类模型RCM的输入特征,即属性特征Attr_F。作为示例,基于图像帧X所属的聚类簇C2,可确定聚类簇C2的道路属性特征Attr_F2为:x(1),x(3),x(8)…x(k),共M个属性特征。因此,从当前图像帧X的视觉特征Vis_F(x(1),x(2),x(3)…x(W))中选取其中的视觉特征(x(1),x(3),x(8)…x(k)),作为属性特征Attr_F2。如前所述,这里提供给道路分类模型RCM的属性特征Attr_F2不但包含置信度、而且还包含相对位置信息。
步骤405:调用与聚类簇C2相匹配的道路分类模型RCM2,通过处理道路属性特征Attr_F2(x(1),x(3),x(8)…x(k))而估计出道路分类。
图5示出根据本发明另一个示例的由道路分类设备执行的道路分类方法的流程图,该道路分类设备可利用图1B所示实施例训练得到的多聚类-分类模型来实现道路分类,这里仍以表3所示的多聚类-分类模型为例来说明。如图5所示,这里步骤501-503与图4所示的步骤401-403相同,在此不再赘述。但需要指出的是,在步骤503中,道路分类设备需要将当前图像帧X与预先存储的15个聚类簇C_K1~C_K5、C_DB1~C_DB5、C_EM1~C_EM5分别进行匹配,以确定在每种类型的聚类方法下的最佳匹配聚类簇。这里假定,匹配结果为C_K2,C_DB3,以及C_EM5。
步骤504:基于在步骤503确定的当前图像帧X所属的聚类簇及其指定的属性特征,构建用于道路分类模型RCM的输入。作为示例,基于图像帧X所属的聚类簇C_K2,确定聚类簇C_K2的道路属性特征K_Attr_F2。从而基于该K_Attr_F2,利用当前图像帧X中对应的视觉特征构建分类模型的输入。
步骤505:调用与聚类簇C_K2相匹配的道路分类模型RCMK 21,通过处理道路属性特征K_Attr_F2而生成道路分类指示为Road_ID1。随后在步骤506,判断是否已经针对聚类簇C_K2完成了所有类型的道路分类模型处理,如果没有则返回步骤405,继续调用下一个分类模型,例如基于AD算法训练得到的道路分类模型RCMK 22,基于SVM算法训练得到的道路分类模型RCMK 23,基于NB算法训练得到的道路分类模型RCMK 24,从而得到分类指示输出Road_ID2、Road_ID3、Road_ID4。
在步骤506确定针对当前聚类簇C_K2完成了所有类型的道路分类模型处理后,则前进至步骤507,确定是否已经针对所有的匹配聚类簇完成了道路分类处理。如果没有则返回步骤504,继续处理下一个聚类簇。在本例中,在处理完C_K2后,返回步骤504,基于图像帧X所属的聚类簇C_DB3,确定聚类簇C_DB3的道路属性特征DB_Attr_F3。从而基于DB_Attr_F3,利用当前图像帧X中对应的视觉特征构建分类模型的输入,进而通过执行步骤505与506得到针对聚类簇C_DB3的各分类指示输出Road_ID5、Road_ID6、Road_ID7、Road_ID8。以此方式,生成针对聚类簇C_EM5的各分类指示输出Road_ID9、Road_ID10、Road_ID11、Road_ID12。由此完成对所有聚类簇的道路分类处理。
在步骤507确定针对所有匹配聚类簇完成道路分类处理后,前进至步骤508,对产生的12个分类指示候选结果(Road_ID1,Road_ID2,Road_ID3,Road_ID4,Road_ID5,Road_ID6,Road_ID7,Road_ID8,Road_ID9,Road_ID10,Road_ID11,Road_ID12)进行投票,并选择票数最高的分类结果作为当前道路的最终分类结果。
以上描述了道路分类设备与方法的实施例,根据本发明的道路分类设备和方法可用于自动驾驶系统中,通过对车辆的摄像机拍摄的图像帧进行处理,从而实现对车辆当前道路的分类。
此外,尽管通过附图和优选实施例对本发明的实施例进行详细展示和说明,然而本发明不限于这些已揭示的实施例,本领域人员在上述详细公开基础上可进行任何修改,包括特征的合并、替换、增加以及删除等,这些方案均应视为落入由所附的权利要求来限定的保护范围内。
Claims (27)
1.一种道路分类方法,包括:
捕获当前道路的至少一个图像帧;
处理所述图像帧以标识出所述图像帧内多个视觉特征;
将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;
从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;
利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
2.如权利要求1的方法,
其中,所述预定数量的候选聚类簇包括利用不同聚类算法训练的多组聚类簇,每组聚类簇包括利用同一算法生成的多个候选聚类簇;
其中,确定所述图像帧所属的目标聚类簇包括:针对每一组聚类簇,确定所述图像帧所属的该组聚类簇中的一个目标聚类簇;
其中,与所确定的目标聚类簇对应的所述道路分类模型包括利用不同机器学习方法针对所述目标聚类簇训练得到的多种道路分类模型,
其中,所述利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类进一步包括:
利用所述多种道路分类模型中分别处理所述属性特征以产生多个候选分类结果,
对所述多个候选分类结果进行投票以确定所述当前道路的分类。
3.如权利要求2的方法,其中对所述多个候选分类结果进行投票以确定所述当前道路的分类包括:选择所述多个候选分类结果中指示同一分类结果的数量最多的分类结果作为所述当前道路分类。
4.如权利要求2的方法,其中对所述多个候选分类结果进行投票以确定所述当前道路的分类包括:对不同种道路分类模型产生的候选分类结果进行加权,并累积指示相同分类结果的经过加权的候选结果,选择具有最大加权和的候选结果作为当前道路的分类。
5.如权利要求1-4之一的方法,其中处理所述图像帧以标识出所述图像帧内多个视觉特征包括:利用针对所述多个视觉特征中每一个视觉特征而训练的特征检测模型来分别检测所述多个视觉特征中的每一个视觉特征,其中每一个视觉特征由置信度来表示。
6.如权利要求1-4之一的方法,其中将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配包括:利用在预先确定所述预定数量的候选聚类簇时所采用的聚类算法,重新计算所述多个视觉特征与所述预先确定的预定数量的候选聚类簇中每一个簇的聚类条件,以确定所述图像帧所属的目标聚类簇。
7.如权利要求6的方法,其中处理所述图像帧以标识出所述图像帧内多个视觉特征进一步包括:获取每个视觉特征在所述图像帧中的相对位置;以及
其中,利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征包括:基于所述属性特征的置信度与相对位置构建所述道路分类模型的输入。
8.一种道路分类模型的训练方法,包括:
获取多个图像帧,每个图像帧包括所述道路的视觉特征;
处理每一帧图像以标识出所述图像帧内包含的多个视觉特征;
基于所述视觉特征,对所述多个图像帧进行聚类处理以确定每个图像帧所属的聚类簇,以形成多个聚类簇;
从同一聚类簇下的图像帧中的视觉特征中选择与该聚类簇最相关的多个视觉特征,作为该聚类簇的属性特征;
利用同一聚类簇下每个图像帧中的所述多个属性特征形成训练样本,用于训练与该聚类簇匹配的道路分类模型。
9.如权利要求8的方法,
其中,对所述多个图像帧进行聚类处理以确定每个图像帧所属的聚类簇包括利用不同聚类算法处理所述多个图像帧以生成多组聚类簇,每组聚类簇包括利用同一聚类算法生成的多个聚类簇;
其中,利用同一聚类簇下每个图像帧中的所述多个属性特征形成训练样本,用于训练与该聚类簇匹配的道路分类模型包括:利用不同机器学习方法来学习每一组聚类簇下图像帧的属性特征,从而产生用于每一组聚类簇下每个聚类簇的多个道路分类模型;
其中对利用所述多个道路分类模型分别处理所述属性特征而产生的多个候选分类结果的投票结果,作为所述当前道路的分类。
10.如权利要求9的方法,其中所述投票结果是所述多个候选分类结果中指示同一分类结果的数量最多的分类结果。
11.如权利要求9的方法,其中所述投票包括:对不同种道路分类模型产生的候选分类结果进行加权,并累积指示相同分类结果的经过加权的候选结果,选择具有最大加权和的候选结果作为当前道路的分类。
12.如权利要求8-11之一的方法,处理每一帧图像以标识出所述图像帧内包含的多个视觉特征包括:利用针对所述多个视觉特征中每一个视觉特征而训练的特征检测模型来分别检测所述多个视觉特征中的每一个视觉特征,其中每一个视觉特征由置信度来表示。
13.如权利要求8-11之一的方法,其中处理每一帧图像以标识出所述图像帧内包含的多个视觉特征进一步包括:获取每个视觉特征在所述图像帧中的相对位置;以及
其中基于所述属性特征的置信度与相对位置构建所述道路分类模型的输入。
14.如权利要求13的方法,包括:
存储所生成的聚类簇相关信息,包括:聚类算法信息、所述属性特征的数量和类型;
存储训练得到的与所述聚类簇匹配的道路分类模型。
15.如权利要求8-11的方法,其中确定所述多个视觉特征中与该聚类簇最相关的多个属性特征是利用斯皮尔曼等级相关系数算法实现的。
16.一种计算系统,包括用于对行驶道路分类的道路分类模块,其中所述道路分类模块配置为:
处理当前行驶道路的至少一个图像帧以标识出所述图像帧内多个视觉特征;
将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;
从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;
利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
17.如权利要求16的计算系统,
其中,所述预定数量的候选聚类簇包括利用不同聚类算法训练的多组聚类簇,每组聚类簇包括利用同一算法生成的多个候选聚类簇;
其中,所述道路分类模块进一步配置为:针对每一组聚类簇,确定所述图像帧所属的该组聚类簇中的一个目标聚类簇;
其中,与所确定的目标聚类簇对应的所述道路分类模型包括利用不同机器学习方法针对所述目标聚类簇训练得到的多种道路分类模型,
其中,所述道路分类模块配置为进一步为:
利用所述多种道路分类模型中分别处理所述属性特征以产生多个候选分类结果,
对所述多个候选分类结果进行投票以确定所述当前道路的分类。
18.如权利要求16或17的计算系统,其中所述道路分类模块配置为:利用针对所述多个视觉特征中每一个视觉特征而训练的特征检测模型来分别检测所述多个视觉特征中的每一个视觉特征,其中每一个视觉特征由置信度来表示。
19.如权利要求16或17的计算系统,其中所述道路分类模块配置为:利用在预先确定所述预定数量的候选聚类簇时所采用的聚类算法,重新计算所述多个视觉特征与所述预先确定的预定数量的候选聚类簇中每一个簇的聚类条件,以确定所述图像帧所属的目标聚类簇。
20.如权利要求19的方计算系统法,其中所述道路分类模块配置为:
获取每个视觉特征在所述图像帧中的相对位置;以及
基于所述属性特征的置信度与相对位置构建所述道路分类模型的输入。
21.一种道路分类装置,包括:
特征提取模块,用于处理当前道路的至少一个图像帧以标识出所述图像帧内多个视觉特征;
聚类模块,用于将所述视觉特征与预先确定的预定数量的候选聚类簇进行匹配以确定所述图像帧所属的目标聚类簇;
特征选择模块,用于从所述多个视觉特征中选取由所确定的目标聚类簇指定的属性特征;
分类模块,用于利用与所确定的目标聚类簇对应的道路分类模型处理所述属性特征以对所述当前道路分类。
22.如权利要求21的装置,
其中,所述预定数量的候选聚类簇包括利用不同聚类算法训练的多组聚类簇,每组聚类簇包括利用同一算法生成的多个候选聚类簇;
其中,所述聚类模块针对每一组聚类簇确定所述图像帧所属的该组聚类簇中的一个目标聚类簇;
其中,与所确定的目标聚类簇对应的所述道路分类模型包括利用不同机器学习方法针对所述目标聚类簇训练得到的多种道路分类模型,
其中,所述所述分类模块进一步:
利用所述多种道路分类模型分别处理所述属性特征以产生多个候选分类结果,
对所述多个候选分类结果进行投票以确定所述当前道路的分类。
23.如权利要求22的装置,其中对所述多个候选分类结果进行投票以确定所述当前道路的分类包括:选择所述多个候选分类结果中指示同一分类结果的数量最多的分类结果作为所述当前道路分类。
24.如权利要求22的装置,其中对所述多个候选分类结果进行投票以确定所述当前道路的分类包括:对不同种道路分类模型产生的候选分类结果进行加权,并累积指示相同分类结果的经过加权的候选结果,选择具有最大加权和的候选结果作为当前道路的分类。
25.如权利要求21-24之一的装置,其中所述特征提取模块利用针对所述多个视觉特征中每一个视觉特征而训练的特征检测模型来分别检测所述多个视觉特征中的每一个视觉特征,其中每一个视觉特征由置信度来表示。
26.如权利要求21-24之一的装置,其中所述聚类模块利用在预先确定所述预定数量的候选聚类簇时所采用的聚类算法,重新计算所述多个视觉特征与所述预先确定的预定数量的候选聚类簇中每一个簇的聚类条件,以确定所述图像帧所属的目标聚类簇。
27.如权利要求26的装置,其中所述特征获取模块进一步获取每个视觉特征在所述图像帧中的相对位置;以及
其中,所述分类模块基于所述属性特征的置信度与相对位置构建所述道路分类模型的输入。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010751680.6A CN114092897A (zh) | 2020-07-30 | 2020-07-30 | 道路分类方法与设备 |
DE102021207185.6A DE102021207185A1 (de) | 2020-07-30 | 2021-07-08 | Verfahren und Vorrichtung zur Klassifizierung einer Straße |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010751680.6A CN114092897A (zh) | 2020-07-30 | 2020-07-30 | 道路分类方法与设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114092897A true CN114092897A (zh) | 2022-02-25 |
Family
ID=79300687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010751680.6A Pending CN114092897A (zh) | 2020-07-30 | 2020-07-30 | 道路分类方法与设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114092897A (zh) |
DE (1) | DE102021207185A1 (zh) |
-
2020
- 2020-07-30 CN CN202010751680.6A patent/CN114092897A/zh active Pending
-
2021
- 2021-07-08 DE DE102021207185.6A patent/DE102021207185A1/de active Pending
Also Published As
Publication number | Publication date |
---|---|
DE102021207185A1 (de) | 2022-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108171136B (zh) | 一种多任务卡口车辆以图搜图的系统及方法 | |
CN108921083B (zh) | 基于深度学习目标检测的非法流动摊贩识别方法 | |
CN109558823B (zh) | 一种以图搜图的车辆识别方法及系统 | |
Ling et al. | Identifying parking spaces & detecting occupancy using vision-based IoT devices | |
CN111079640B (zh) | 一种基于自动扩增样本的车型识别方法及系统 | |
CN111310583A (zh) | 一种基于改进的长短期记忆网络的车辆异常行为识别方法 | |
KR102089298B1 (ko) | 범용 문자 시퀀스 검출을 통한 다국적 차량번호판 인식 시스템 및 그 방법 | |
CN105868700A (zh) | 一种基于监控视频的车型识别与跟踪方法及系统 | |
CN104700099A (zh) | 识别交通标志的方法和装置 | |
CN113052159A (zh) | 一种图像识别方法、装置、设备及计算机存储介质 | |
CN111860383B (zh) | 一种群体异常行为识别方法、装置、设备及存储介质 | |
CN116206451A (zh) | 一种智慧交通车流数据分析方法 | |
CN116978093A (zh) | 基于空间数据增强和对称互注意力的跨模态行人重识别方法 | |
JP2010170207A (ja) | 車両監視システム | |
CN112308066A (zh) | 一种车牌识别系统 | |
CN114092897A (zh) | 道路分类方法与设备 | |
CN110555425A (zh) | 一种视频流实时行人检测方法 | |
CN113313008B (zh) | 基于YOLOv3网络和均值漂移的目标与识别跟踪方法 | |
CN113850112A (zh) | 基于孪生神经网络的路况识别方法和系统 | |
Liu et al. | Efficient dense attention fusion network with channel correlation loss for road damage detection | |
Zaman et al. | Deep Learning Approaches for Vehicle and Pedestrian Detection in Adverse Weather | |
Triwibowo et al. | Analysis of Classification and Calculation of Vehicle Type at APILL Intersection Using YOLO Method and Kalman Filter | |
CN114463707B (zh) | 车辆重识别方法、装置、存储介质及电子设备 | |
CN115731436B (zh) | 基于深度学习融合模型的高速公路车辆图像检索方法 | |
CN112990048B (zh) | 车纹识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |