CN111814847A - 基于车辆三维轮廓的聚类方法 - Google Patents

基于车辆三维轮廓的聚类方法 Download PDF

Info

Publication number
CN111814847A
CN111814847A CN202010564925.4A CN202010564925A CN111814847A CN 111814847 A CN111814847 A CN 111814847A CN 202010564925 A CN202010564925 A CN 202010564925A CN 111814847 A CN111814847 A CN 111814847A
Authority
CN
China
Prior art keywords
clustering
vehicle
difference
matrix
vehicles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010564925.4A
Other languages
English (en)
Other versions
CN111814847B (zh
Inventor
周乾伟
周晨
胡海根
李小薪
郭媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010564925.4A priority Critical patent/CN111814847B/zh
Publication of CN111814847A publication Critical patent/CN111814847A/zh
Application granted granted Critical
Publication of CN111814847B publication Critical patent/CN111814847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

一种基于车辆三维轮廓的聚类方法,通过拍摄实际车辆或者三维模型投影法生成车辆的二值三视图;计算差异矩阵M,即N辆车两两之间的差异性,通过比较三张图中的差异性,得到最大差异值,可以是不同像素点的总数;将M进行归一化,可以以最大差异值为基准;M中元素越大即为不同的像素点个数越多,相互间的差异性越强,为了能够表达相似性以便于聚类,可以将M取反,如M=1‑M;进行聚类算法,得到K个不同的类。本发明能够可简单快速的实现轮廓聚类,且能够突出车辆姿态估计中所需关键特征上的差异。

Description

基于车辆三维轮廓的聚类方法
技术领域
本发明属于无监督学习领域,是一种基于车辆三维轮廓差异性进行计算实现的车辆聚类方法。
背景技术
车辆的姿态估计中往往需要使用到车辆的三维模型,但由于不同品牌不同型号的车辆种类繁多,如果每种车辆的三维模型都参与姿态估计则势必会增加姿态估计算的复杂性。
发明内容
为了屏蔽无用细节对车辆轮廓聚类的影响,本发明提出一种车辆三维轮廓的聚类方法,可简单快速的实现轮廓聚类,且能够突出车辆姿态估计中所需关键特征上的差异,如车辆长度、车辆高度、车辆后视镜以及车轮的位置等。
本发明解决其技术问题所采用的技术方案是:
一种基于车辆三维轮廓的聚类方法,所述方法包括以下步骤:
1)获得车辆的二值三视图;
2)定义差异矩阵M,表达N辆车两两之间的差异性,并将M进行归一化;
3)对差异矩阵M进行相似性处理;
4)根据处理后所得相似性矩阵,使用机器学习中的无监督学习算法进行聚类,获得聚类结果。
进一步,所述步骤1)中,根据所得三视图对其进行二值化处理得到二值三视图。
再进一步,所述步骤2)中,差异矩阵的获取,通过比较两两车辆三视图中的差异性,将其最大差异性作为矩阵元素值,其元素值有多种表达差异性的形式,将两两车辆三视图中差异最大值作为元素值、将两两车辆三视图中所具有的不同像素点的数量的最大值作为元素值。
所述步骤2)中,差异矩阵的归一化以最大差异值为基准,使得M中的元素数值小于等于1,大于等于0。
所述步骤3)中,差异矩阵的相似性处理中,差异矩阵M中元素值越大,则相互间的差异性越强,为了能够表达相似性以便于聚类,将M进行相似性转换操作,对M进行取反,使得M=1-M。
所述步骤4)中,聚类操作基于机器学习中无监督学习算法进行k-mean聚类,根据相似矩阵行或列向量各维度上的分布特性计算出各行/列向量的若干个聚类中心,根据聚类原则将N辆车划分到各个聚类中心所代表的类别。
本发明的技术构思为:通过对三维模型进行聚类操作可以用少量的三维模型去估计各种不同种类的车辆的姿态。本发明提供了一种简单易用且有效的车辆模型聚类算法。本发明能够放大车辆轮廓上的关键差异,例如后视镜的位置,车辆整体尺寸的差异,车轮的位置等,而对车辆微小细节不敏感,特别适用于将轮廓大体相似的车辆聚类为一类。这一特性使得本发明尤其适用于车辆姿态估计,因为姿态估计往往只需模型上的若干关键点,无需考虑模型间细节上的差异。当用于车辆姿态估计时,那么估计算法只需要使用处于聚类中心的车辆模型即可匹配该类型的所有不同型号不同品牌的车辆。
本发明的有益效果为:简单快速的实现轮廓聚类,且能够突出车辆姿态估计中所需关键特征上的差异;极大的减小了当前所存在方法的时间复杂度,极大的提升了应用价值。
附图说明
图1为本发明中通过摄像机拍摄或三维模型投影方式所得到的三视图示例。
图2为本发明主要步骤流程图。
图3位本发明方法处理过程的可视化示例。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1~图3,一种基于车辆三维轮廓的聚类方法,实现车辆聚类,极大的减小了当前所存在算法的时间复杂度,极大的提升了应用价值,所述方法包括以下步骤:
1)通过相机拍摄实际车辆或利用车辆的三维模型生成相对应车辆的三个方向的轮廓投影(三视图),分别为自顶向下(T:俯视图),自左向右(L:左视图),自前向后(F:主视图)如说明书附图1所示,对投影做腐蚀、膨胀、填充空洞之后即可获得最终的投影图像。所有投影图像为黑白二值图像。记第i种车辆的3个投影图像为Ti,Li,Fi,假设共有N种车辆要进行3维轮廓聚类。
2)设定一个差异矩阵M,共N行N列,mij为矩阵中第i行第j列的元素,表示第i种车与第j种车之间的差异,数值越大,说明两种车的3维轮廓的差异越大。其中mij可以有多种计算方式,比如我们采用mij=max{sum(abs(Li-Lj)),sum(abs(Fi-Fj)),sum(abs(Ti-Tj))},其中asb()表示绝对值函数,sum()表示求和函数,由于所生成三视图是的二值投影图像,则比如sum(abs(Li-Lj))计算了两种车的左视图中的不同像素点的数量,即相对于左视图而言,计算车辆左边部分的差异,其他两个算式类似,因此mij为差异最大的视图中不同像素点的数量,即两种车辆之间最大的差异,如图3中第三步骤矩阵所述,63,4,…,91,125,73,24,等等数值均代表了某两种车辆之间最大差异性,即mij
将差异矩阵M进行归一化,以max(M)为基准,使得M中的元素值在0~1的范围内,其中max(M)表示差异矩阵M中的最大元素值,即N种车之间,差异最大的那一组车辆的差异值。则差异矩阵M表达各车辆之间的相对差异性,具体实现,如图3中第四步骤矩阵举例所述63/125=0.504,4/125=0.032,…,等等。
3)由于M中的元素数值越大,表示两种车辆的轮廓差异越大,所以,如果M中第i行与第j行的欧氏距离较小,只能说明第i种车和第j种车均与某一些车辆差异较大,不能说明第i种车与第j种车的差异较小,不利于聚类。故对M做进一步处理,使得其能表达相似性,如mij=1-mij,具体实现,如图3中第五步骤矩阵举例所述:0.496=1-0.504,0.968=1-0.032,…,等等。
4)以M中的第i行为第i种车的特征向量,共有N个N维的特征向量,进行聚类操作,比如可采用k均值聚类算法,即可获得K个类别以及N个特征向量各自所属的类别标签,具体实现,如图3中第六、第七步骤矩阵举例所述,将M中每一列作为一个特征向量如:(1,0.496,…,0.968,0.272)T,…,(0.272,0.808,…,0.416,1)T,对其进行聚类,得到聚类结果:(SUV,Truck,…,Saloon,Truck)T,即每辆车所对应的聚类类别。
以上通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点和功效。本发明还可以通过另外不同的具体实际方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,以上示例中所提供的图示或矩阵仅以示意方式说明本发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目绘制,其实际实施时各组件的数量及比例应当根据实际情况进行改变。

Claims (6)

1.一种基于车辆三维轮廓的聚类方法,其特征在于,所述方法包括以下步骤:
1)获得车辆的二值三视图;
2)定义差异矩阵M,表达N辆车两两之间的差异性,并将M进行归一化;
3)对差异矩阵M进行相似性处理;
4)根据处理后所得相似性矩阵,使用机器学习中的无监督学习算法进行聚类,获得聚类结果。
2.如权利要求1所述的基于车辆三维轮廓的聚类方法,其特征在于:所述步骤1)中,根据所得三视图对其进行二值化处理得到二值三视图。
3.如权利要求1或2所述的基于车辆三维轮廓的聚类方法,其特征在于:所述步骤2)中,差异矩阵的获取,通过比较两两车辆三视图中的差异性,将其最大差异性作为矩阵元素值,其元素值有多种表达差异性的形式,将两两车辆三视图中差异最大值作为元素值、将两两车辆三视图中所具有的不同像素点的数量的最大值作为元素值。
4.如权利要求1或2所述的基于车辆三维轮廓的聚类方法,其特征在于:所述步骤2)中,差异矩阵的归一化以最大差异值为基准,使得M中的元素数值小于等于1,大于等于0。
5.如权利要求1或2所述的基于车辆三维轮廓的聚类方法,其特征在于:所述步骤3)中,差异矩阵的相似性处理中,差异矩阵M中元素值越大,则相互间的差异性越强,为了能够表达相似性以便于聚类,将M进行相似性转换操作,对M进行取反,使得M=1-M。
6.如权利要求1或2所述的基于车辆三维轮廓的聚类方法,其特征在于:所述步骤4)中,聚类操作基于机器学习中无监督学习算法进行k-mean聚类,根据相似矩阵行或列向量各维度上的分布特性计算出各行/列向量的若干个聚类中心,根据聚类原则将N辆车划分到各个聚类中心所代表的类别。
CN202010564925.4A 2020-06-19 2020-06-19 基于车辆三维轮廓的聚类方法 Active CN111814847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010564925.4A CN111814847B (zh) 2020-06-19 2020-06-19 基于车辆三维轮廓的聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010564925.4A CN111814847B (zh) 2020-06-19 2020-06-19 基于车辆三维轮廓的聚类方法

Publications (2)

Publication Number Publication Date
CN111814847A true CN111814847A (zh) 2020-10-23
CN111814847B CN111814847B (zh) 2024-03-26

Family

ID=72845266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010564925.4A Active CN111814847B (zh) 2020-06-19 2020-06-19 基于车辆三维轮廓的聚类方法

Country Status (1)

Country Link
CN (1) CN111814847B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989310A (zh) * 2021-10-22 2022-01-28 广州市城市规划勘测设计研究院 建筑体量数据的估算方法、装置、设备及存储介质
CN114913469A (zh) * 2022-07-11 2022-08-16 浙江大华技术股份有限公司 一种车辆长度估计模型建立的方法、终端设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025642A (zh) * 2016-01-27 2017-08-08 百度在线网络技术(北京)有限公司 基于点云数据的车辆轮廓检测方法和装置
CN110263679A (zh) * 2019-06-03 2019-09-20 西安交通大学 一种基于深度神经网络的细粒度车辆检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025642A (zh) * 2016-01-27 2017-08-08 百度在线网络技术(北京)有限公司 基于点云数据的车辆轮廓检测方法和装置
CN110263679A (zh) * 2019-06-03 2019-09-20 西安交通大学 一种基于深度神经网络的细粒度车辆检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989310A (zh) * 2021-10-22 2022-01-28 广州市城市规划勘测设计研究院 建筑体量数据的估算方法、装置、设备及存储介质
CN113989310B (zh) * 2021-10-22 2022-05-17 广州市城市规划勘测设计研究院 建筑体量数据的估算方法、装置、设备及存储介质
CN114913469A (zh) * 2022-07-11 2022-08-16 浙江大华技术股份有限公司 一种车辆长度估计模型建立的方法、终端设备及存储介质
CN114913469B (zh) * 2022-07-11 2022-11-22 浙江大华技术股份有限公司 一种车辆长度估计模型建立的方法、终端设备及存储介质

Also Published As

Publication number Publication date
CN111814847B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN109886121B (zh) 一种遮挡鲁棒的人脸关键点定位方法
Chabot et al. Deep manta: A coarse-to-fine many-task network for joint 2d and 3d vehicle analysis from monocular image
CN109726627B (zh) 一种神经网络模型训练及通用接地线的检测方法
CN108154160B (zh) 车牌颜色识别方法及系统
CN111191583B (zh) 基于卷积神经网络的空间目标识别系统及方法
CN109671070B (zh) 一种基于特征加权和特征相关性融合的目标检测方法
CN112116599B (zh) 基于弱监督学习的痰涂片结核杆菌语义分割方法及系统
US20100310159A1 (en) Semantic scene segmentation using random multinomial logit (rml)
CN111814847B (zh) 基于车辆三维轮廓的聚类方法
CN106778814B (zh) 一种基于投影谱聚类算法的去除sar图像斑点的方法
US20220237896A1 (en) Method for training a model to be used for processing images by generating feature maps
CN113657387A (zh) 基于神经网络的半监督三维点云语义分割方法
US20220067882A1 (en) Image processing device, computer readable recording medium, and method of processing image
CN117173416B (zh) 基于图像处理的铁路货运车号图像清晰化处理方法
CN114187463A (zh) 电子档案生成方法、装置、终端设备及存储介质
CN112070116B (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
CN111523548B (zh) 一种图像语义分割、智能行驶控制方法及装置
CN112967210A (zh) 一种基于全卷积孪生网络的无人机图像去噪方法
CN110136164B (zh) 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法
CN111461002A (zh) 一种面向热成像行人检测的样本处理方法
CN111105363A (zh) 一种含噪高光谱图像快速解混方法
CN108665479B (zh) 基于压缩域多尺度特征tld的红外目标跟踪方法
US20220270351A1 (en) Image recognition evaluation program, image recognition evaluation method, evaluation apparatus, and evaluation system
CN114663861A (zh) 一种基于维度解耦和非局部关系的车辆重识别方法
CN111627033A (zh) 一种难样本实例分割方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant