CN117173736A - 一种基于非同源双目的刷掌识别两图对齐方法 - Google Patents
一种基于非同源双目的刷掌识别两图对齐方法 Download PDFInfo
- Publication number
- CN117173736A CN117173736A CN202210593819.8A CN202210593819A CN117173736A CN 117173736 A CN117173736 A CN 117173736A CN 202210593819 A CN202210593819 A CN 202210593819A CN 117173736 A CN117173736 A CN 117173736A
- Authority
- CN
- China
- Prior art keywords
- image
- palm
- rgb
- homologous
- key points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000001680 brushing effect Effects 0.000 title claims abstract description 11
- 241001133760 Acoelorraphe Species 0.000 claims description 185
- 238000012549 training Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 14
- 238000007906 compression Methods 0.000 claims description 14
- 230000009977 dual effect Effects 0.000 claims description 14
- 244000060701 Kaempferia pandurata Species 0.000 claims description 12
- 235000016390 Uvaria chamae Nutrition 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 10
- 238000013136 deep learning model Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 241000233788 Arecaceae Species 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 210000003462 vein Anatomy 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000036544 posture Effects 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
一种基于非同源双目的刷掌识别两图对齐方法,包括如下步骤:步骤S1:对第一图像Iir和第二图像Irgb分别检测手掌,分别得到所述第一图像Iir的手掌区域ROIir和所述第二图像Irgb的手掌区域ROIrgb;其中,所述第一图像和所述第二图像是非同源图像;步骤S2:对所述手掌区域ROIir和所述手掌区域ROIrgb的手掌姿态估计,分别得到手掌的关键点;步骤S3:根据所述关键点的信息计算手掌中心的视差;步骤S4:根据所述手掌中心的视差对所述第一图像Iir和所述第二图像Irgb对齐。本发明利用非同源双目系统,直接对第一图像和第二图像进行处理,节省p‑sensor,利用手掌的关键点对第一图像和第二图像进行对齐,使得刷掌识别计算量大大减小,降低成本,有利于刷掌应用的推广。
Description
技术领域
本发明涉及刷掌识别相机领域,具体地,涉及一种基于非同源双目的刷掌识别两图对齐方法。
背景技术
由于人的手掌的纹路更加稳定,因此,刷掌识别是一种比刷脸识别更加稳定和安全的生物识别技术,因而可以通过刷掌对人身份进行识别,进而用于安检、支付、身份识别等领域。刷掌识别是一种具有广阔应用前景的技术。
在现有技术中,部分刷掌系统采用掌托固定手掌,以确定手掌位置,但实际应用不方便。部分刷掌系统采用p-sensor预估手掌深度,然后根据p-sensor对第一图像和第二图像进行像素级对齐。在实际中,由于一般为了测量范围和测量距离的考虑,一般需要在近距离处能对手掌进行完整拍摄,在远距离处需要对手掌也能清晰成像。这就需要相机的FOV足够大,相机FOV大,在远距离手掌在图像中的占比就会不是非常大,此时如果继续使用p-sensor进行两图对齐,那需要的p-sensor数量会比较大,则存在相互干扰,难以兼容设计的问题,同时成本也会升高很多。
现有技术中的双目系统均采用同源双目,可以获得目标对象的清晰的深度数据,但该双目系统计算量大,需要单独的片上系统处理相关的数据,从而导致传输延迟、识别滞后等一系列问题。
发明内容
为此,本发明利用第一相机和第二相机组成的非同源双目系统,直接对第一图像和第二图像进行处理,节省p-sensor,利用手掌的关键点对第一图像和第二图像进行对齐,使得刷掌识别计算量大大减小,依赖的设备更少,更易节省设备空间,并且具有更好的兼容性,降低成本,有利于刷掌应用的推广。
第一方面,本发明提供一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,包括如下步骤:
步骤S1:对第一图像Iir和第二图像Irgb分别检测手掌,分别得到所述第一图像Iir的手掌区域ROIir和所述第二图像Irgb的手掌区域ROIrgb;其中,所述第一图像和所述第二图像是非同源图像;
步骤S2:对所述手掌区域ROIir和所述手掌区域ROIrgb的手掌姿态估计,分别得到手掌的关键点;
步骤S3:根据所述关键点的信息计算手掌中心的视差;
步骤S4:根据所述手掌中心的视差对所述第一图像Iir和所述第二图像Irgb对齐。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在所述步骤S1之前还包括:
步骤S0:对原始第一图像和原始第二图像分别畸变校正,再进行极线校正,得到校正后的第一图像Iir和校正后的第二图像Irgb。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,所述步骤S2包括:
步骤S21:根据边缘提取算法获得手掌边缘,进而获得手掌姿态;
步骤S22:根据所述手掌姿态获得关键点;
步骤S23:将所述第一图像Iir和所述第二图像Irgb上的所述关键点进行匹配。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,所述步骤S3包括:
步骤S31:计算所述关键点的视差d;
步骤S32:根据手指根部及手掌根部的关键点计算手掌中心的位置;
步骤S33:根据手指根部及手掌根部的关键点的视差,计算得到所述手掌中心的视差b。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S1中,在对所述第一图像Iir和所述第二图像Irgb进行检测前,还对所述第一图像Iir和所述第二图像Irgb进行压缩。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,对第一图像Iir和第二图像Irgb的压缩比例不同。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S22中,采用第一深度学习模型对所述第一图像Iir中的手掌边缘进行识别获得第一关键点;采用第二深度学习模型对所述第二图像Irgb中的手掌边缘进行识别获得第二关键点,其中,所述第一深度学习模型是根据与所述第一图像Iir同源的手掌图像训练获得,所述第二深度学习模型是根据与所述第二图像Irgb同源的手掌图像训练获得。
可选地,所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S22中,将所述第一图像Iir减去所述第二图像Irgb得到第三图像I0,再根据所述第三图像I0获得关键点。
第二方面,本发明提供一种基于非同源双目的刷掌识别两图对齐设备,其特征在于,包括:
处理器;
存储器模块,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任一项所述的基于非同源双目的刷掌识别两图对齐方法的步骤。
第三方面,本发明提供一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现上述任一项所述的一种基于非同源双目的刷掌识别两图对齐方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
本发明采用第一图像和第二图像作为原始数据,不需要p-sensor等装置,使得对刷掌识别的输入条件减少,从而可以使得相应的硬件设备简化,体积更小,容易集成化,有利于设备的小型化。
本发明采用的图像可以与其他手掌识别功能共用,使得一幅图像可以用于多个功能,从而使得一幅图像功能的最大化,节省了步骤与设备空间。比如第一图像为红外图像时,不仅用可以用于对齐与重建,还可以用于活体检测;第二图像为彩色图像时,不仅可以用于对齐与重建,还可以用于掌纹识别,而本发明通过将两种不同类型的图像进行对齐,使得手掌检测、手掌分割、边缘提取、边缘匹配、深度重建等步骤更加便捷,节省了后续图像的处理步骤,提高了处理效率。
本发明使用第一相机和第二相机对手掌进行成像,实现没有深度图时两图的像素级对齐。本文提出使用第一相机和第二相机组成双目,根据双目成像理论对手掌的边缘进行三维重建,然后根据手掌边缘的深度信息实现第一图像和第二图像的像素级对齐。
本发明把非同源的第一相机和第二相机构成双目系统,但由于其非同源,现有技术中无法有效解决其匹配等问题。本发明实现了对非同源双目系统的匹配与三维重建。比如,第一相机为近红外相机,第二相机为彩色相机时,在拍摄手掌图像,由于静脉对红外光具有一定的吸收作用,会造成静脉处比较暗;而第二图像同时拍摄手掌图像时主要对手掌表面纹理进行成像,会导致第一图像与第二图像差异更大,从而无法利用现有技术进行有效处理。
本发明不需要对整幅手掌进行处理,只需要处理图像中手掌的关键点,使得处理的数据量大大减少,从而降低了对于芯片等的要求,并且不再需要单独的片上系统进行处理,可以集成于相机自带的芯片中,使得相机的结构更加简单,并降低成本,实现低成本的刷掌应用,有利于商业推广。
本发明利用手掌的关键点信息计算得到手掌中心的视差b,处理的数据大幅减少,运算步骤简单高效,可以快速得到计算结果,从而可以快速对齐,提高了图像的处理速度。相比于其他处理方法,本发明的方案可以提高刷掌响应速度,从而更加适应需要快速响应的场所。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中一种基于非同源双目的刷掌识别两图对齐方法的步骤流程图;
图2为本发明实施例中一个手掌检测图;
图3为本发明实施例中手掌关键点的空间位置;
图4为本发明实施例中一组手掌对齐图像;
图5为本发明实施例中一种获取关键点的步骤流程图;
图6为本发明实施例中一组手掌边缘图像;
图7为本实施例中一种计算手掌中心的视差的步骤流程图;
图8为本发明实施例中一种基于非同源双目的刷掌识别两图对齐设备的结构示意图;
图9为本发明实施例中一种计算机可读存储介质示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
本发明实施例提供的一种基于非同源双目的刷掌识别两图对齐方法,旨在解决现有技术中存在的问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图1为本发明实施例中一种基于非同源双目的刷掌识别两图对齐方法的步骤流程图。如图1所示,本发明实施例中一种基于非同源双目的刷掌识别两图对齐方法包括如下步骤:
步骤S1:对第一图像Iir和第二图像Irgb分别检测手掌,分别得到所述第一图像Iir的手掌区域ROIir和所述第二图像Irgb的手掌区域ROIrgb。
在本步骤中,所述第一图像和所述第二图像是非同源图像。采用手掌检测模型对于所述第一图像Iir和所述第二图像Irgb分别进行检测,从而可以判断是否有手掌存在。如果有手掌存在,则获得所述第一图像Iir的手掌区域ROIir和所述第二图像Irgb的手掌区域ROIrgb。如图2所示,手掌区域ROIir和手掌区域ROIrgb均是包含手掌在内的最小的长方形,即长方形的四个边均与手掌边缘相切。本步骤所采用的手掌检测模型可以是任何可以实现手掌检测功能的模型,本实施例对此不做限制。
在部分实施例中,适应于连续拍摄,通过后一帧图像与前一帧图像相减的方式,获得前一帧和后一帧上各自的手掌区域。由于手掌没有掌托固定,所以手掌难以保持在同一位置固定不动,因此不同时间拍摄的两帧相减,可以快速定位手掌的边缘位置,从而可以得到手掌轮廓信息,定位手掌区域。同时,图像相减的方式处理简单,处理速度快。
在部分实施例中,在执行本步骤中对图像的处理前,对第一图像Iir、第二图像Irgb进行压缩。对第一图像Iir和第二图像Irgb的压缩比例不同。比如,在执行本步骤之前,对所述第一图像Iir和所述第二图像Irgb分别进行压缩,压缩比例分别为4和2,从而使得图像的大小更为接近,并且可以保证处理的精度。优选地,当手掌距离相机越近时,压缩比越大;当手掌距离相机越远时,压缩比越小。当手掌占图像的面积的70%时,对第一图像的压缩比不小于5;当手掌占图像的面积的50%时,对第一图像的压缩比不小于2。对第一图像的压缩比是对第二图像的压缩比的3倍以上。
步骤S2:对所述第一图像的手掌区域和所述第二图像的手掌区域的手掌姿态估计,分别得到手掌的关键点。
在本步骤中,只对手掌区域进行识别,从而使得处理的数据范围减少,数据量大大减少,从而可以提高响应速度,并降低对于硬件的要求。由于第一图像与第二图像是非同源的,难以同一模型进行识别处理。图3示出了手掌关键点的空间位置。关键点包括每根手指关节与两端各四个,再加上手掌根部一个关键,共计21个关键点。
在部分实施例中,使用手掌姿态检测模型对于手掌姿态进行估计,得到各自图像中手掌的关键点。采用与第一图像同源的训练集对手掌识别模型进行训练,得到第一识别模型,从而与第一图像进行识别,得到关键点。采用与第二图像同源的训练集对手掌识别模型进行训练,得到第二识别模型,从而与第二图像进行识别,得到关键点。
在部分实施例中,使用手掌姿态检测模型对于第一图像进行手掌姿态估计,得到第一图像中的关键点,再根据第一图像与第二图像的匹配关系,得到第二图像中的关键点。这种方法使得训练模型的时间与资源消耗大大减少,提高了效率,并且可以利用现有技术中已有的模型,减少了本实施例应用的成本。
步骤S3:根据所述关键点的信息计算手掌中心的视差。
在本步骤中,关键点的信息包括位置、视差等。由于手掌关键点位于手掌的各个部分,而手掌中心一定是位于手掌上各个关键点中间,所以只需要位于手掌上的6个关键点用于计算手掌中心的视差。手掌中心为到手掌上的6个关键点距离的差别最小的点。比如,计算所述6个关键点的视差的均值,得到手掌中心的视差。
步骤S4:根据所述手掌中心的视差对所述第一图像Iir和所述第二图像Irgb对齐。
在本步骤中,利用双目系统中的极平面对图像进行平移,具体地是利用手掌中心所在的极平面对图像进行平移,使得所述第一图像Iir和所述第二图像Irgb的手掌中心重合,从而完成对齐操作。如图4所示,对齐后的图像的一致性更好,从而可以对手掌进行更好的识别与处理。对图像进行平移时,可以只平移第一图像Iir,也可以只平移第二图像Irgb,还可以对第一图像Iir和第二图像Irgb都进行平移,只要使得手掌中心重合即可。
需要说明的是,本实施例采用的所述第一图像Iir和所述第二图像Irgb是经过配准的。如果所述第一图像Iir和所述第二图像Irgb是未配准的,则需要配准后再执行本方案。
在部分实施例中,在所述步骤S1之前还包括:
步骤S0:对原始第一图像和原始第二图像分别畸变校正,再进行极线校正,得到校正后的第一图像Iir和校正后的第二图像Irgb。
在本步骤中,所述原始第一图像和所述原始第二图像是非同源图像,即采用不同的技术获得的图像。对原始第一图像进行畸变校正,再进行极线校正,得到校正后的第一图像Iir。对原始第二图像分别畸变校正,再进行极线校正,得到校正后的第二图像Irgb。由于畸变是由于透镜成像原理导致的,所以对于原始第一图像和原始第二图像的畸变校正需要根据采集设备各自的参数进行校正。极线校正是对于双目系统的校正,是通过对两个相机进行旋转,并重新定义新的像平面,让极线对共线且平行于像平面的某条坐标轴(通常是水平轴),该操作同时建立了新的立体像对。纠正完成后,同一匹配点对,位于两个视图的同一行内,这意味着它们只有水平坐标(或者说列坐标)的差异,这个差异称为视差。但由于所采用的图像分别为第一图像和第二图像,其所拍摄到的内容存在差别,无法直接采用现在技术求解视差。当第一相机拍摄手掌图像时,由于静脉对红外光具有一定的吸收作用,会造成静脉处比较暗;而第二图像同时拍摄手掌图像时主要对手掌表面纹理进行成像,两者对掌纹的成像难以直接匹配。同时,不同胖瘦、体质的人的手掌差别较大,使得红外图像与第二图像的差别更大,难以有效地进行匹配。本步骤对于两种图像进行校正,使得数据更加准确,从而使得后续的匹配更加准确。需要说明的是,本实施例所采用的原始第一图像和原始第二图像通常由于经过标定的双目系统获取,并且双目系统中一个为第一相机,另一个为第二相机。其中,所述第一相机用于获取第一图像,所述第二相机用于获取第二图像,并且所述第一相机与所述第二相机同时获取目标图像。比如,第一相机为近红外相机,第一图像为近红外图像,第二相机为彩色相机,第二图像为彩色图像。
本步骤使得畸变较大的图像也可以得到较好的处理,从而使得手掌距离拍摄设备较近,即FOV较大时,也可以获得准确的结果,提升了对于手掌的有效识别距离范围。
图5为获取关键点的步骤流程图。如图5所示,相比于上一实施例,本实施例中获取关键点的方法包括如下步骤:
步骤S21:根据边缘提取算法获得手掌边缘,进而获得手掌姿态。
在本步骤中,根据边缘提取算法,对手掌的边缘进行提取。边缘提取算法可以采取多种算法执行,比如基于设计边缘提取算子(卷积模板)的算法,边缘提取算子包括但不限于sobel、prewit、robert、LoG等。边缘提取算法也可以采用自适应算法或者机器学习训练模型等方式获取,本实施例对此不做限制。如图6所示,识别出的手掌边缘具有一定的宽度,并且因为抓取对象为同一个手掌,相比于手掌内部,边缘也具有非常好的一致性,可以取得更好的处理结果。
步骤S22:根据所述手掌姿态获得关键点。
在本步骤中,由于关键点在手掌上的特定位置,因此可以通过手掌形状与姿态获得关键点位置。比如,可以根据手指长度,按不同的比例确定关键点位置。人类手指关节比例通常是固定的,根据手指与手掌的比例关系,可以确定手指根部的位置,再根据手掌根部的形状,确定手掌根部的关键点,从而确定所有的关键点位置。
又比如,使用手掌姿态检测模型对于第一图像和第二图像中手掌姿态进行检测,得到各自图像中手掌的关键点。采用与第一图像同源的训练集对手掌识别模型进行训练,得到第一识别模型,从而与第一图像进行识别,得到关键点。采用与第二图像同源的训练集对手掌识别模型进行训练,得到第二识别模型,从而与第二图像进行识别,得到关键点。
再比如,使用手掌姿态检测模型对于第一图像中的手掌姿态进行检测,得到第一图像中的关键点,再根据第一图像与第二图像的匹配关系,得到第二图像中的关键点。这种方法使得训练模型的时间与资源消耗大大减少,提高了效率,并且可以利用现有技术中已有的模型,减少了本实施例应用的成本。
还比如,将所述第一图像Iir减去所述第二图像Irgb得到第三图像I0,再根据所述第三图像I0获得关键点。由于第一图像Iir和第二图像Irgb是非同源的,所以两幅图像相减,会得到去除部分背景信息后的第三图像I0,从而使得手掌区域的特征更加明显,从而可以采用其他模型进行处理,提高处理效果。
步骤S23:将所述第一图像Iir和所述第二图像Irgb上的所述关键点进行匹配。
在本步骤中,对不同位置处的关键点进行唯一标号,并将相同标号的关键点进行匹配。
本实施例根据手掌边缘确定手掌关键点的位置,并对第一图像Iir和第二图像Irgb中的关键点进行匹配,从而可以快速获得关键点信息,起到快速响应的目的。
图7为本实施例中一种计算手掌中心的视差的步骤流程图。如图7所示,相比于上一实施例,本实施例中一种计算手掌中心的视差的方法包括如下步骤:
步骤S31:计算所述关键点的视差d。
在本步骤中,由于第一图像和第二图像上的关键点的数量和位置均相同,所以可以根据对应手掌关键点的位置计算在两图像中的视差。本步骤中不需要计算所有关键点的视差,而只需要对位于手掌上的6个关键点,即手指根部及手掌根部的关键点,进行计算,从而得到这6个关键点的视差。
步骤S32:根据手指根部及手掌根部的关键点计算手掌中心的位置。
在本步骤中,根据手指根部及手掌根部的关键点位置,计算手掌中心的位置。手掌中心为到手掌上的6个关键点距离的差别最小的点。由于这6个关键点位置相对固定,所以手掌中心的位置也相对固定,因此在计算手掌中心的位置时,可以在预先划定的区域内进行计算,以最终确定手掌中心的位置。
在部分实施例中,计算手掌中心的位置时,包括如下步骤:
步骤S321:根据手指根部及手掌根部的关键点位置确定手掌中心的范围。
步骤S322:在所述范围的边缘随机选取三个点,且三个点构成的三角形的面积不小于所述范围的面积的一半。
步骤S323:分别计算所述三个点距离所述手指根部及手掌根部的关键点的距离的平均差值,并记录最小平均差值f。
步骤S324:将所述三个点朝所述三角形中心点方向移动,重新计算所述三个点距离所述手指根部及手掌根部的关键点的距离的平均差值,并记录当前最小平均差值g。
步骤S325:如果g<f,则将g赋值给f,并沿原方向继续移动g所对应的点,另外两个点沿与g所对应的点的连线方向移动。
步骤S326:如果g>=f,则将所述三个点朝f所对应的点的方向移动。
重复步骤S325和步骤S326,直至收敛得到与手掌上的6个关键点距离的差别最小的点,即为手掌中心。
步骤S33:根据手指根部及手掌根部的关键点的视差,计算得到所述手掌中心的视差b。
在本步骤中,根据手指根部及手掌根部的关键点与手掌中心的距离,分别赋予不同的权重,从而加权计算得到所述手掌中心的视差b。手指根部及手掌根部的关键点与手掌中心的距离越近,权重越大。6个关键点的权重值之和为1。
本发明实施例中还提供一种基于非同源双目的刷掌识别两图对齐设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于非同源双目的刷掌识别两图对齐方法的步骤。
如上,该实施例中通过使用第一相机和第二相机构成的双目系统的深度相机获取第一图像和第二图像,通过前述实施例中的方法将两种不同类型的图像进行对齐,克服不同类型图像的差异,达到稳定、快速进行对齐的目的。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图8是本发明实施例中的一种基于非同源双目的刷掌识别两图对齐设备的结构示意图。下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述基于非同源双目的刷掌识别两图对齐方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图8中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例中还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于非同源双目的刷掌识别两图对齐方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述基于非同源双目的刷掌识别两图对齐方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例的计算机可读存储介质的程序在执行时,通过使用第一相机和第二相机构成的双目系统的深度相机获取第一图像和第二图像,通过前述实施例中的方法将两种不同类型的图像进行对齐,克服不同类型图像的差异,达到稳定、快速进行对齐的目的。
图9是本发明实施例中的计算机可读存储介质的结构示意图。参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例中,通过使用第一相机和第二相机构成的双目系统的深度相机获取第一图像和第二图像,通过前述实施例中的方法将两种不同类型的图像进行对齐,克服不同类型图像的差异,达到稳定、快速进行对齐的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (10)
1.一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,包括如下步骤:
步骤S1:对第一图像Iir和第二图像Irgb分别检测手掌,分别得到所述第一图像Iir的手掌区域ROIir和所述第二图像Irgb的手掌区域ROIrgb;其中,所述第一图像和所述第二图像是非同源图像;
步骤S2:对所述手掌区域ROIir和所述手掌区域ROIrgb的手掌姿态估计,分别得到手掌的关键点;
步骤S3:根据所述关键点的信息计算手掌中心的视差;
步骤S4:根据所述手掌中心的视差对所述第一图像Iir和所述第二图像Irgb对齐。
2.根据权利要求1所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在所述步骤S1之前还包括:
步骤S0:对原始第一图像和原始第二图像分别畸变校正,再进行极线校正,得到校正后的第一图像Iir和校正后的第二图像Irgb。
3.根据权利要求1所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,所述步骤S2包括:
步骤S21:根据边缘提取算法获得手掌边缘,进而获得手掌姿态;
步骤S22:根据所述手掌姿态获得关键点;
步骤S23:将所述第一图像Iir和所述第二图像Irgb上的所述关键点进行匹配。
4.根据权利要求1所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,所述步骤S3包括:
步骤S31:计算所述关键点的视差d;
步骤S32:根据手指根部及手掌根部的关键点计算手掌中心的位置;
步骤S33:根据手指根部及手掌根部的关键点的视差,计算得到所述手掌中心的视差b。
5.根据权利要求1所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S1中,在对所述第一图像Iir和所述第二图像Irgb进行检测前,还对所述第一图像Iir和所述第二图像Irgb进行压缩。
6.根据权利要求6所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,对第一图像Iir和第二图像Irgb的压缩比例不同。
7.根据权利要求3所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S22中,采用第一深度学习模型对所述第一图像Iir中的手掌边缘进行识别获得第一关键点;采用第二深度学习模型对所述第二图像Irgb中的手掌边缘进行识别获得第二关键点,其中,所述第一深度学习模型是根据与所述第一图像Iir同源的手掌图像训练获得,所述第二深度学习模型是根据与所述第二图像Irgb同源的手掌图像训练获得。
8.根据权利要求3所述的一种基于非同源双目的刷掌识别两图对齐方法,其特征在于,在步骤S22中,将所述第一图像Iir减去所述第二图像Irgb得到第三图像I0,再根据所述第三图像I0获得关键点。
9.一种基于非同源双目的刷掌识别两图对齐设备,其特征在于,包括:
处理器;
存储器模块,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至8任一项所述的基于非同源双目的刷掌识别两图对齐方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至8任一项所述的一种基于非同源双目的刷掌识别两图对齐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210593819.8A CN117173736A (zh) | 2022-05-28 | 2022-05-28 | 一种基于非同源双目的刷掌识别两图对齐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210593819.8A CN117173736A (zh) | 2022-05-28 | 2022-05-28 | 一种基于非同源双目的刷掌识别两图对齐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117173736A true CN117173736A (zh) | 2023-12-05 |
Family
ID=88930440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210593819.8A Pending CN117173736A (zh) | 2022-05-28 | 2022-05-28 | 一种基于非同源双目的刷掌识别两图对齐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117173736A (zh) |
-
2022
- 2022-05-28 CN CN202210593819.8A patent/CN117173736A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3971686A1 (en) | Ar scenario-based gesture interaction method and apparatus, storage medium, and communication terminal | |
TWI569229B (zh) | 資料之登錄方法 | |
CN111598993B (zh) | 基于多视角成像技术的三维数据重建方法、装置 | |
US8885920B2 (en) | Image processing apparatus and method | |
WO2015172679A1 (zh) | 一种图像处理方法和装置 | |
CN110264509A (zh) | 确定图像捕捉设备的位姿的方法、装置及其存储介质 | |
KR20120048370A (ko) | 물체 자세 인식장치 및 이를 이용한 물체 자세 인식방법 | |
CN110866977A (zh) | 增强现实处理方法及装置、系统、存储介质和电子设备 | |
WO2016203731A1 (en) | Method for reconstructing 3d scene as 3d model | |
CN110363817A (zh) | 目标位姿估计方法、电子设备和介质 | |
CN111079470B (zh) | 人脸活体检测的方法和装置 | |
WO2024169384A1 (zh) | 视线估计方法、装置、可读存储介质及电子设备 | |
Anbarjafari et al. | 3D face reconstruction with region based best fit blending using mobile phone for virtual reality based social media | |
KR102315696B1 (ko) | 관절 모델 정합 장치 및 방법 | |
CN115830663A (zh) | 人脸三维关键点提取方法及装置、模型创建方法及系统 | |
CN112580395A (zh) | 基于深度信息的3d人脸活体识别方法、系统、设备及介质 | |
CN108694348B (zh) | 一种基于自然特征的跟踪注册方法及装置 | |
US11004266B2 (en) | Articulated model registration apparatus and method | |
CN109472741A (zh) | 三维拼接方法及装置 | |
CN117173736A (zh) | 一种基于非同源双目的刷掌识别两图对齐方法 | |
CN105931231A (zh) | 一种基于全连接随机场联合能量最小化的立体匹配方法 | |
Wang et al. | Im2fit: Fast 3d model fitting and anthropometrics using single consumer depth camera and synthetic data | |
CN115880428A (zh) | 一种基于三维技术的动物检测数据处理方法、装置及设备 | |
CN117173741A (zh) | 一种基于非同源双目的刷掌识别两图对齐方法 | |
CN117173740A (zh) | 一种基于非同源双目的刷掌识别两图对齐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |