CN113902022A - 自动驾驶场景数据样本相似度获取方法 - Google Patents
自动驾驶场景数据样本相似度获取方法 Download PDFInfo
- Publication number
- CN113902022A CN113902022A CN202111198782.0A CN202111198782A CN113902022A CN 113902022 A CN113902022 A CN 113902022A CN 202111198782 A CN202111198782 A CN 202111198782A CN 113902022 A CN113902022 A CN 113902022A
- Authority
- CN
- China
- Prior art keywords
- coordinate system
- similarity
- data samples
- automatic driving
- included angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000010606 normalization Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000013461 design Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种自动驾驶场景数据样本相似度获取方法,本发明的主要设计构思在于,将现有仅通过单一坐标系来判断自动驾驶场景数据相似度的方式,改进为基于两个坐标系来求取相似度,即从一维到二维来计算权衡,并将两坐标系中的相似度进行融合,用新构造的相似度指标来权衡场景数据样本的相似程度。本发明为自动驾驶场景提供的样本比对相似度的思路,可以有效避免因假相似而造成的偏差。
Description
技术领域
本发明涉及自动驾驶技术领域,尤其涉及一种自动驾驶场景数据样本相似度获取方法。
背景技术
目前对采集的自动驾驶场景样本做数据聚类分析时,其核心是相似度,根据样本之间的相似度对样本进行分类,相似度的大小直接影响样本聚类的结果。通过采用聚类分析能够从数学的角度客观来判断样本之间的相似度,能避免因人的主观因素在对样本进行分类时产生的影响,同时还能发掘出人为不易察觉的特例。
为了判断两场景样本之间的相似程度需要对两样本做相似度计算,常见的计算样本之间的相似度有闵可夫斯基距离、相关系数、样本夹角余弦等。本发明主要是针对其中的夹角余弦方式进行改进,夹角余弦是通过计算两样本的夹角余弦来判断其相似度,计算出的夹角余弦取值范围在0到1之间,如果两样本的夹角余弦值越接近1说明两样本的相似度越高,反之相似度越低。
目前,当采用夹角余弦来计算自动驾驶场景样本间的相似度时,只基于同一个坐标系,如果两样本在空间中的位置与坐标系原点三点几乎共线,但是两样本在空间位置上沿共线的方向相距很远,会造成相似的假象,从而在判断两样本之间相似与否时,会存在较大的偏差。
发明内容
鉴于上述,本发明旨在提供一种自动驾驶场景数据样本相似度获取方法,以解决相似假象问题。
本发明采用的技术方案如下:
一种自动驾驶场景数据样本相似度获取方法,其中包括:
采集自动驾驶场景的数据样本;
对所述数据样本进行归一化处理;
确定归一化后的数据样本在新构建的坐标系中的空间表达;
分别基于原坐标系以及新坐标系,计算不同场景的数据样本的夹角余弦;
融合不同坐标系下求取出的夹角余弦作为目标余弦值;
根据目标余弦值确定自动驾驶场景中数据样本的相似度。
在其中至少一种可能的实现方式中,按如下公式进行所述归一化处理:
其中,xj是当前自动驾驶场景的数据样本的第j个参数,xj_min是所有自动驾驶场景的数据样本中的最小值,xj_max是所有自动驾驶场景的数据样本中的最大值,X’j是归一化后的值。
在其中至少一种可能的实现方式中,所述新坐标系的构建方式包括:基于原始坐标系确定新坐标系的移动方向与移动距离。
在其中至少一种可能的实现方式中,所述基于原始坐标系确定新坐标系的移动方向与移动距离包括:
计算待比对场景中的同类别数据样本的差值;
基于原坐标系,获取待比对场景中的同类别数据样本之间中点的坐标;
基于所述中点的坐标,计算所述中点与原坐标系的坐标轴之间的距离;
根据所述差值以及所述距离,确定新坐标系相对原坐标系的移动方向;
由待比对的两两数据样本以及新坐标系的待定原点,构造三角形;
利用所述三角形的夹角的最大值,求解得到移动距离;其中所述夹角为两个数据样本相对于待定原点的夹角。
在其中至少一种可能的实现方式中,所述融合不同坐标系下求取出的夹角余弦作为目标余弦值包括:将所述融合不同坐标系下求取出的夹角余弦进行求和得到所述目标余弦值。
在其中至少一种可能的实现方式中,所述方法还包括:在进行归一化前,将采集的样本数据进行解构及离散处理。
本发明的主要设计构思在于,将现有仅通过单一坐标系来判断自动驾驶场景数据相似度的方式,改进为基于两个坐标系来求取相似度,即从一维到二维来计算权衡,并将两坐标系中的相似度进行融合,用新构造的相似度指标来权衡场景数据样本的相似程度。本发明为自动驾驶场景提供的样本比对相似度的思路,可以有效避免因假相似而造成的偏差。
进一步地,在构造新坐标系时,通过场景参数中较大的参数差以及中点到坐标轴距离来确定新坐标系。
附图说明
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步描述,其中:
图1为现有基于夹角余弦判断自动驾驶场景样本相似度的示意图;
图2为本发明实施例提供的自动驾驶场景数据样本相似度获取方法的流程图;
图3为数据样本在坐标系中夹角规律示意图(一);
图4为数据样本在坐标系中夹角规律示意图(二);
图5为本发明实施例提供的确定新坐标系空间的示意图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
在展开本发明具体技术方案之前,先对本发明的技术脉络进行介绍:由于根据原有夹角余弦来判断两样本之间的相似度时,如果两样本与坐标系原点共线,但是在沿线上两样本又相隔很远的距离,就会造成假相似的情况。为了避免出现假相似的情况需要对原夹角余弦来判断两样本相似的方法进行改进。而实际的自动驾驶场景样本的空间维度很多,为了方便描述简化场景样本到二维空间中,如在下图1中,若从一个坐标系来衡量样本A与样本B之间的相似度,那么从图中可知样本A和样本B之间的夹角明显小于样本A和样本C之间的夹角,从夹角余弦的角度来看的话,样本A与样本B的相似度要高于样本A与样本C之间的相似度,但是从图中可以看出样本A和样本C之间更适合聚为一类,故为应对这种情况,本发明提出需要对传统的基于夹角余弦来求样本之间相似的方式进行改进。
由此,本发明提供了一种自动驾驶场景数据样本相似度获取方法的实施例,具体来说,如图2所示,其中包括:
步骤S1、采集自动驾驶场景的数据样本;
步骤S2、对所述数据样本进行归一化处理;
具体来说,采集的场景样本数据经解构与离散处理后,场景样本的参数类型不同,参数数值变化范围差异较大,如果不做处理的话,在坐标系中场景各参数之间的坐标位置会存在很大的偏差,例如参数A的取值范围是[0,1]而参数B的取值范围是[0,10000],在坐标中A类参数之间的差值与B类参数之间的差值往往会差很多,为使各类参数之间的差值评估更为精准,需要对原数据样本做归一化处理,将场景中各参数值的变化范围划分到同一级别的区间中。归一化的具体实现方式可以见如下:
其中,xj是当前自动驾驶场景的数据样本的第j个参数,xj_min是所有自动驾驶场景的数据样本中的最小值,xj_max是所有自动驾驶场景的数据样本中的最大值,X’j是归一化后的值。
步骤S3、确定归一化后的数据样本在新构建的坐标系中的空间表达;
在实际操作中,该步骤的关键在于,需基于原始坐标系确定新坐标系的移动方向与距离。
具体地,可以假设数据样本中的参数个数为n个,且设当前有两个自动驾驶场景的数据样本A与B,两场景在原始空间上各有一个坐标点。首先计算两场景中所有参数之间的差值Δ=(Δ1,Δ2,Δ3...Δj)T,以及两场景的所有同类参数之间的中点坐标xmean=(xmean_1,xmean_2,xmean_3…xmean_j)T
Δj与xmean_j的计算方式可参考如下:
Δj=|(xA_j-xB_j)|(j=1,2,...,n)
为了使新坐标系的原点与两场景数据样本在新空间中的位置所构成的夹角尽可能大,可以从下述两个策略来考虑:
(1)如图3所示,两个场景中的某预设类别参数,在空间中的差值越大,夹角越大。
(2)如图4所示,两个场景中的某预设类别参数,二者坐标点的中点与坐标系的坐标轴之间的距离越小,夹角越大。其中涉及的两坐标的中点与坐标系的坐标轴j的距离公式如下:
由此,本发明认为可以从上述两方面来确定坐标系移动的方向和位置。具体地,由于为了使新坐标系的原点到两场景数据样本坐标点的夹角最大,前述参数之间的差值Δj尽可能大,而Dj的值尽可能小,故本发明设计如下评价机制来确定最佳的移动方向,如下所示:
Yj=Δj/Dj
当Yj取最大值时,对应的当前j值则表征新构建的坐标系沿原j轴平移的方向,例如,通过计算当j=K时,Yj能取得最大值,即移动的坐标是K轴。
接着,计算移动距离,假设新的坐标系的原点在原坐标系上的坐标为:
O‘(0,0,...,k,...,0,0)
那么,点A、B、O’三点在空间中构成一个三角形,其中该三角形各边长的表达式为:
其中,夹角的表达式为:
为使得该夹角的值最大,需求出k的值,由于直接求解k值难度较大,优选地,可以采用遍历方式获得夹角的最大值,其中,k值的取值范围是(xA_K xB_K),将这个区间中的值根据实际所需精度来进行划分,并将所选K值代入前述夹角表达式中,这样,当夹角取最大值时,当前k值即为目标值,结合图5所示,新的坐标系的原点O’位置是沿着原横轴方向平移距离k。
由上述,便得到不同场景数据样本各自在新坐标系下的空间关系。
步骤S4、分别基于原坐标系以及新坐标系,计算不同场景的数据样本的夹角余弦;
具体地,原坐标系下的夹角余弦可按如下公式计算:
新坐标系下的夹角余弦公式可按如下公式计算:
S'AB=cos∠AO'B
其中,∠AO'B为计算的最大角。
步骤S5、融合不同坐标系下求取出的夹角余弦作为目标余弦值;
结合前文,所述目标余弦值S可以按如下方式融合:
S=SAB+S′AB
步骤S6、根据目标余弦值确定自动驾驶场景中数据样本的相似度。
具体地,通过S进行相似度评估,可以避免因样本点与坐标系原点在同一个直线上而造成样本之间的假相似情况。
综上所述,本发明的主要设计构思在于,将现有仅通过单一坐标系来判断自动驾驶场景数据相似度的方式,改进为基于两个坐标系来求取相似度,即从一维到二维来计算权衡,并将两坐标系中的相似度进行融合,用新构造的相似度指标来权衡场景数据样本的相似程度。本发明为自动驾驶场景提供的样本比对相似度的思路,可以有效避免因假相似而造成的偏差。
本发明实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,但以上仅为本发明的较佳实施例,需要言明的是,上述实施例及其优选方式所涉及的技术特征,本领域技术人员可以在不脱离、不改变本发明的设计思路以及技术效果的前提下,合理地组合搭配成多种等效方案;因此,本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (6)
1.一种自动驾驶场景数据样本相似度获取方法,其特征在于,包括:
采集自动驾驶场景的数据样本;
对所述数据样本进行归一化处理;
确定归一化后的数据样本在新构建的坐标系中的空间表达;
分别基于原坐标系以及新坐标系,计算不同场景的数据样本的夹角余弦;
融合不同坐标系下求取出的夹角余弦作为目标余弦值;
根据目标余弦值确定自动驾驶场景中数据样本的相似度。
3.根据权利要求1所述的自动驾驶场景数据样本相似度获取方法,其特征在于,所述新坐标系的构建方式包括:基于原始坐标系确定新坐标系的移动方向与移动距离。
4.根据权利要求3所述的自动驾驶场景数据样本相似度获取方法,其特征在于,所述基于原始坐标系确定新坐标系的移动方向与移动距离包括:
计算待比对场景中的同类别数据样本的差值;
基于原坐标系,获取待比对场景中的同类别数据样本之间中点的坐标;
基于所述中点的坐标,计算所述中点与原坐标系的坐标轴之间的距离;
根据所述差值以及所述距离,确定新坐标系相对原坐标系的移动方向;
由待比对的两两数据样本以及新坐标系的待定原点,构造三角形;
利用所述三角形的夹角的最大值,求解得到移动距离;其中所述夹角为两个数据样本相对于待定原点的夹角。
5.根据权利要求1所述的自动驾驶场景数据样本相似度获取方法,其特征在于,所述融合不同坐标系下求取出的夹角余弦作为目标余弦值包括:将所述融合不同坐标系下求取出的夹角余弦进行求和得到所述目标余弦值。
6.根据权利要求1~5任一项所述的自动驾驶场景数据样本相似度获取方法,其特征在于,所述方法还包括:在进行归一化前,将采集的样本数据进行解构及离散处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111198782.0A CN113902022A (zh) | 2021-10-14 | 2021-10-14 | 自动驾驶场景数据样本相似度获取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111198782.0A CN113902022A (zh) | 2021-10-14 | 2021-10-14 | 自动驾驶场景数据样本相似度获取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113902022A true CN113902022A (zh) | 2022-01-07 |
Family
ID=79192188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111198782.0A Pending CN113902022A (zh) | 2021-10-14 | 2021-10-14 | 自动驾驶场景数据样本相似度获取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113902022A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807434A (zh) * | 2023-12-06 | 2024-04-02 | 中国信息通信研究院 | 一种通信数据集处理方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273926A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于余弦相似度加权的线性判别分析降维方法 |
CN112541515A (zh) * | 2019-09-23 | 2021-03-23 | 北京京东乾石科技有限公司 | 模型训练方法、驾驶数据处理方法、装置、介质和设备 |
CN113114850A (zh) * | 2021-03-18 | 2021-07-13 | 电子科技大学 | 一种基于监控视频和pdr在线融合定位方法 |
-
2021
- 2021-10-14 CN CN202111198782.0A patent/CN113902022A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273926A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于余弦相似度加权的线性判别分析降维方法 |
CN112541515A (zh) * | 2019-09-23 | 2021-03-23 | 北京京东乾石科技有限公司 | 模型训练方法、驾驶数据处理方法、装置、介质和设备 |
CN113114850A (zh) * | 2021-03-18 | 2021-07-13 | 电子科技大学 | 一种基于监控视频和pdr在线融合定位方法 |
Non-Patent Citations (2)
Title |
---|
孔造杰;李斌;: "基于三维坐标及余弦相似度的创新需求集成与筛选方法", 运筹与管理, no. 11, 25 November 2018 (2018-11-25) * |
赵杨: "基于流形学习和稀疏约束的文本分类与聚类算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 7, 15 July 2021 (2021-07-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807434A (zh) * | 2023-12-06 | 2024-04-02 | 中国信息通信研究院 | 一种通信数据集处理方法和装置 |
CN117807434B (zh) * | 2023-12-06 | 2024-07-16 | 中国信息通信研究院 | 一种通信数据集处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7414978B2 (ja) | 駐車スペース及びその方向角検出方法、装置、デバイス及び媒体 | |
US9838850B2 (en) | Systems and methods for determining indoor location and floor of a mobile device | |
CN104185275B (zh) | 一种基于wlan的室内定位方法 | |
US9930541B2 (en) | Maintaining the integrity of configuration information of a network of access points for use in positioning an apparatus | |
CN109711321B (zh) | 一种结构自适应的宽基线影像视角不变直线特征匹配方法 | |
WO2023071121A1 (zh) | 一种基于多模型融合的目标检测方法、装置、设备及介质 | |
JP2014071890A (ja) | オブジェクト検索方法、検索検証方法、及びその装置 | |
TW201618563A (zh) | 用於適應性多重特徵語意位置感測之系統及方法 | |
CN107817802B (zh) | 混合双层地图的构建方法及装置 | |
Hashemifar et al. | Augmenting visual SLAM with Wi-Fi sensing for indoor applications | |
CN103020956A (zh) | 一种基于决策判断Hausdorff距离的图像匹配方法 | |
CN113902022A (zh) | 自动驾驶场景数据样本相似度获取方法 | |
CN113761705A (zh) | 基于多维属性相关分析的多传感器融合方法及系统 | |
CN114973195A (zh) | 基于多信息融合的车辆追踪方法、装置及系统 | |
JP2001126065A (ja) | 距離分布検知装置 | |
CN110926405B (zh) | 一种基于单目视觉灭点检测的arv姿态测量方法 | |
CN112365528A (zh) | 一种基于主成分分析的三维点云模型逐步求精快速配准方法 | |
CN115205251A (zh) | 一种光学遥感影像几何质量可用性评价方法 | |
CN110906902A (zh) | 一种边坡变形监测数据两步改正方法 | |
CN110445654A (zh) | 一种基于社区划分的社交网络多源谣言溯源方法及系统 | |
KR20090113746A (ko) | 물체의 공간적 의미정보를 이용한 로봇의 자기위치 추정 방법 | |
CN114897952B (zh) | 一种自适应遮挡的单张光场影像准确深度估计方法及系统 | |
CN114220480B (zh) | 一种药物成分分析方法及系统 | |
CN114743180A (zh) | 检测结果的识别方法、装置、存储介质和处理器 | |
CN107330105B (zh) | 一种相似图像检索算法的鲁棒性评测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |