CN112927131B - 图片拼接方法、装置、计算机设备和存储介质 - Google Patents

图片拼接方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112927131B
CN112927131B CN202110058679.XA CN202110058679A CN112927131B CN 112927131 B CN112927131 B CN 112927131B CN 202110058679 A CN202110058679 A CN 202110058679A CN 112927131 B CN112927131 B CN 112927131B
Authority
CN
China
Prior art keywords
target object
picture
target
preset
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110058679.XA
Other languages
English (en)
Other versions
CN112927131A (zh
Inventor
李文睿
程剑
付文宇
陈波
郑庭辉
王仪
曹洲
曾羽婷
薛宇
邓祥
何天翔
温智翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Construction Sichuan Co ltd Of China Construction Third Engineering Bureau
First Construction Co Ltd of China Construction Third Engineering Division
Original Assignee
First Construction Co Ltd of China Construction Third Engineering Division
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Construction Co Ltd of China Construction Third Engineering Division filed Critical First Construction Co Ltd of China Construction Third Engineering Division
Priority to CN202110058679.XA priority Critical patent/CN112927131B/zh
Publication of CN112927131A publication Critical patent/CN112927131A/zh
Application granted granted Critical
Publication of CN112927131B publication Critical patent/CN112927131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4038Scaling the whole image or part thereof for image mosaicing, i.e. plane images composed of plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30136Metal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image

Abstract

本发明涉及图片拼接方法、装置、计算机设备和存储介质,可以至少部分地解决相关技术中密集目标物堆叠的宽幅场景下,多拍摄装置拍摄的图片难以拼接的问题,进一步解决因多拍摄装置拍摄目标物从而导致产生重叠区域、导致目标物重复识别的问题。

Description

图片拼接方法、装置、计算机设备和存储介质
技术领域
本发明涉及图片处理和显示领域,具体涉及一种图片拼接方法、装置、计算机设备和存储介质。
背景技术
在大宽幅场景的图像识别过程中,相关技术中通常采用的是多个拍摄装置在一定距离下拍摄然后对拍摄的图片进行拼接,最终实现目标图像的识别。在上述过程中,现有的拼接技术多数为像素级的拼接,但在需要对密集型的目标物进行识别时,通常需要近距离拍摄,获得的图片之间的视差较大,采用像素级的拼接难以实现准确拼接,从而造成目标物的识别困难。
发明内容
为了解决上述现有技术中存在的问题,本发明实施例提供一种优化的图片拼接方法、装置、计算机设备和存储介质。
本发明解决其技术问题所采用的技术方案是:
本发明实施例的一个方面提供了图片拼接方法,所述方法包括:
分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图像;
通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构;
获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈,若所述结构相似性反馈在预设阈值要求内,则获取定位锚点;
根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
根据本发明实施例,所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈的方法包括:
对所述第一拓扑结构内的目标物按预设顺序得到第一目标物集合,对所述第二拓扑结构内的目标物按所述预设顺序得到第二目标物集合;
获取所述第一目标物集合中的第一预设初始目标物和所述第二目标物集合中的第二预设初始目标物;
构建所述第一预设初始目标物和所述第二预设初始目标物的映射关系;
基于预设规则,获取最近邻所述第一预设初始目标物的第一近邻目标物集合和最近邻所述第二预设目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,若得到映射目标物集合,则:
若所述映射目标物集合内的目标物数量为所述预设数量,则将所述第一预设初始目标物和所述第二预设初始目标物设置为定位锚点。
根据本发明实施例,获得所述映射目标物集合的方法具体为:
计算所述第一目标物集合中除所述第一预设初始目标物外的所有目标物与所述第一目标物之间的第一距离,以及所述第二目标物集合中除所述第二预设初始目标物外的所有目标物与所述第二目标物之间的第二距离,得到第一距离集合和第二距离集合;
基于所述第一距离集合按照预设顺序选取预设数量的目标物,得到最近邻所述第一预设初始目标物的第一近邻目标物集合,基于所述第二距离集合按照同一预设顺序选取同一预设数量的目标物,得到最近邻所述第二预设初始目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,以获得映射目标物集合。
根据本发明实施例,还包括:若所述映射目标物集合内的目标物数量小于所述预设数量,则遍历映射处理完所述第一近邻目标物集合和所述第二近邻目标物集合内的各目标物,直至所述映射目标物集合内的目标物数量为所述预设数量,获得对应的定位锚点。
根据本发明实施例,所述拼接得到未重复识别的目标物的集合的方法包括:
根据预设搜索区域大小,以定位锚点为中心,分别获取第一图片内的第一带状区域和第二图片内的第二带状区域,对应得到第一高置信搜索目标物集合和第二高置信搜索目标物集合;
获取所述第一高置信搜索目标物集合中的第一预设高置信目标物和所述第二高置信搜索目标物集合中的第二预设高置信目标物;
计算所述第一预设高置信目标物和所述第二预设高置信目标物的拓扑结构相似性,以得到高置信重叠目标物。
本发明实施例的另一个方面提供了图片拼接装置,包括获取处理模块、反馈处理模块和拼接处理模块。获取处理模块用于分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图像,以及通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构。反馈处理模块用于获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈若所述结构相似性反馈在预设阈值要求内,则获取定位锚点。拼接处理模块用于根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
本发明实施例的另一个方面提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述所述的图片拼接方法。
本发明实施例的另一个方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的图片拼接方法。
根据本发明实施例,可以至少部分地解决相关技术中密集目标物堆叠的宽幅场景下,多拍摄装置拍摄的图片难以拼接的问题,进一步解决因多拍摄装置拍摄目标物从而导致产生重叠区域、导致目标物重复识别的问题。
本发明实施例的内容以及它的其他发明目的及有益效果将会通过结合附图和对优选实施例的描述而更加明显易懂。
附图说明
图1示意性示出了根据本发明实施例的图片拼接方法的流程图;
图2示意性示出了得到图1应用场景时的钢筋编号顺序示意图;
图3示意性示出了根据本发明实施例示出的应用场景中寻找锚点算法流程示意图;
图4示意性示出了根据本发明实施例示出的应用场景中寻找高置信重叠钢筋算法流程示意图;
图5示意性示出了根据本发明实施例示出的应用场景中的图片拼接方法的流程图;
图6示意性示出了根据本发明另一实施例的图片拼接装置的框图;
图7示意性示出了根据本发明实施例中一种计算机设备的结构示意图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本发明实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本发明实施例。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的计算机设备”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的计算机设备”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的计算机设备等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性
说明书一个或多个实施例中使用了流程图用来说明根据本说明书一个或多个实施例的计算机设备所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
在大宽幅场景的图像识别过程中,相关技术中通常采用的是多个拍摄装置在一定距离下拍摄然后对拍摄的图片进行拼接,最终实现目标图像的识别。在上述过程中,现有的拼接技术多数为像素级的拼接,但在需要对密集型的目标物进行识别时,通常需要近距离拍摄,获得的图片之间的视差较大,采用像素级的拼接难以实现准确拼接,从而造成目标物的识别困难。
更为具体地,以在大量钢筋堆叠在一起进行识别的应用场景中为例。
无论在钢筋的生产过程中还是使用过程中,对于钢筋数量的统计都是非常重要的一个环节。例如在工地现场,对于进场的钢筋车,验收人员需要对车上的钢筋进行现场人工点根,确认数量后钢筋车才能完成进场卸货。而目前的现场钢筋盘点有两种方式:一种是人工计数的方式,这种方式也是目前主要采用的方式,现场的计数工人需要使用不同颜色的彩笔对不同型号的钢筋进行标记和计数,这样的计数方式不仅耗时长,消耗人力,计数效率也十分低下,一般一车钢筋一次进场盘点需数个小时,计数的准确率也会随着工作时间拉长导致的工人疲劳而降低,同时,人工计数结果也很难追溯,因此人工计数已经不能适应现代化的自动生产需求。
另外一种是基于机器视觉的智能钢筋计数技术,这种识别技术有着多种实现方案,目前已取得了巨大的进展,国内外针对不同场景设计开发了一系列产品,使得计数的工作量大大减少。但是,这些产品在使用过程中有诸多条件限制,比如只能近距离拍摄独立的捆,对整车或施工场地具有较多钢筋的宽幅场景,要拍摄独立的捆极其困难,为了识别计数,还需要对拍摄的图片进行大量的后期人工处理,无法实现自动计数,人工工作量仍然很大。为解决宽幅场景的钢筋计数识别,一个容易想到的方案是用多个摄像头在一定距离下拍摄然后对拍摄的图片进行拼接,最终实现计数,然而这种方案存在一个技术难点即大视差情况下的图像拼接问题。
现有的拼接技术是一种像素级的拼接,主要应用于一些精度要求不高的场景,比如:风景照片的拼接,建筑图片的拼接,这些都是一些大视觉范围的图片拼接,对拼接的细微结果要求不高,只需要视觉感官是一张整体画面即可,比如说一棵树的某个枝条拼接错误,对视觉效果基本没影响。但钢筋计数是一个密集型目标识别与准确计数问题,需要对实际的钢筋支数进行准确计数,任何一个细微的拼接错误都会导致计数结果产生严重的偏差。对钢筋计数问题,为了拍清楚每一根钢筋,通常需要近距离拍摄,照片的视差较大,采用传统的基于像素级的拼接方法将产生较为严重的拼接错误甚至无法拼接,从而造成识别计数的困难。
本发明实施例提供的图片拼接方法能够至少部分解决诸如上述钢筋堆叠场景等相关技术中密集目标物堆叠的宽幅场景下,多拍摄装置拍摄的图片难以拼接的问题,进一步解决因多拍摄装置拍摄目标物从而导致产生重叠区域、导致目标物重复识别的问题。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
如图1所示,在一个实施例中,提供一种图像拼接方法,包括:
步骤S110,分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图像;
步骤S120,通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构;
步骤S130,获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈,若所述结构相似性反馈在预设阈值要求内,则获取定位锚点;
其中,所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈的方法包括:
对所述第一拓扑结构内的目标物按预设顺序得到第一目标物集合,对所述第二拓扑结构内的目标物按所述预设顺序得到第二目标物集合;
获取所述第一目标物集合中的第一预设初始目标物和所述第二目标物集合中的第二预设初始目标物;
构建所述第一预设初始目标物和所述第二预设初始目标物的映射关系;
基于预设规则,获取最近邻所述第一预设初始目标物的第一近邻目标物集合和最近邻所述第二预设目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,若得到映射目标物集合,则:
若所述映射目标物集合内的目标物数量为所述预设数量,则将所述第一预设初始目标物和所述第二预设初始目标物设置为定位锚点。
在上述方法的基础上,更为具体地,获得所述映射目标物集合的方法具体为:
计算所述第一目标物集合中除所述第一预设初始目标物外的所有目标物与所述第一目标物之间的第一距离,以及所述第二目标物集合中除所述第二预设初始目标物外的所有目标物与所述第二目标物之间的第二距离,得到第一距离集合和第二距离集合;
基于所述第一距离集合按照预设顺序选取预设数量的目标物,得到最近邻所述第一预设初始目标物的第一近邻目标物集合,基于所述第二距离集合按照同一预设顺序选取同一预设数量的目标物,得到最近邻所述第二预设初始目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,以获得映射目标物集合。
在上述方法的基础上,更为具体地,还包括:若所述映射目标物集合内的目标物数量小于所述预设数量,则遍历映射处理完所述第一近邻目标物集合和所述第二近邻目标物集合内的各目标物,直至所述映射目标物集合内的目标物数量为所述预设数量,获得对应的定位锚点
步骤S140,根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
其中,所述拼接得到未重复识别的目标物的集合的方法包括:
根据预设搜索区域大小,以定位锚点为中心,分别获取第一图片内的第一带状区域和第二图片内的第二带状区域,对应得到第一高置信搜索目标物集合和第二高置信搜索目标物集合;
获取所述第一高置信搜索目标物集合中的第一预设高置信目标物和所述第二高置信搜索目标物集合中的第二预设高置信目标物;
计算所述第一预设高置信目标物和所述第二预设高置信目标物的拓扑结构相似性,以得到高置信重叠目标物。
下面结合图2至图5的应用场景,即大量密集型钢筋堆叠的场景,参考图1及上述技术方案来描述根据本发明示例性实施方式的图片拼接方法。需要注意的是,本应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
结合本应用场景,在深度学习模型基础上,提出了一种能够将多张存在重复拍摄区域的钢筋图片进行逻辑拼接的技术方法(所谓逻辑拼接,即将不同图像中重复识别的钢筋去除,将剩余未重复识别的钢筋统一计数的技术),而多张图像的拼接在原理上是两张图片拼接的拓展,因此本发明将基于同一根钢筋在不同图片中的拓扑关系不变性(即同一根钢筋在不同图片中与周围钢筋的相对位置不变的)的基本思想,以两张图片的拼接为例,阐述一种新的钢筋图片逻辑拼接技术。其具体步骤如下:
步骤1、通过深度学习识别左右两张图片中所有钢筋,获取钢筋圆心坐标R(x,y),R(x,y),钢筋半径r,r。其中,本发明提及的所有坐标均为像素坐标,坐标原点为图片左上角点,向右为x轴正向,向下为y轴正向,长度均为像素长度;
步骤2、以图片左上角的第一根钢筋为准,依次按照从左到右、从上到下的顺序(如附图2),分别对图片中的钢筋进行编号排序,左图所有钢筋编号为
Figure BDA0002901646390000111
右图所有钢筋编号为
Figure BDA0002901646390000112
为了减少计算量,本发明分别选取两张图片中的一部分钢筋计算其拓扑结构相似性,从而找到初始的锚点,本发明暂取编号前20%(向下取整)作为待计算钢筋组,为简单起见,分别记为
Figure BDA0002901646390000113
Figure BDA0002901646390000114
步骤3、对左图的每一根钢筋
Figure BDA0002901646390000115
与右图每一根钢筋
Figure BDA0002901646390000116
形成一个钢筋对
Figure BDA0002901646390000117
计算钢筋对的拓扑结构相似性。如果结构相似性满足阈值要求,则确定
Figure BDA0002901646390000118
为定位锚点,转到步骤4;如果所有钢筋对
Figure BDA0002901646390000119
的结构相似性都不满足阈值要求,无法找到锚点,拼接失败。具体计算流程如下:
S1:对左图的每一根钢筋
Figure BDA00029016463900001110
对右图每一根钢筋
Figure BDA00029016463900001111
执行如下步骤;
S2:右图选出的钢筋
Figure BDA00029016463900001112
与左图选出的钢筋
Figure BDA00029016463900001113
形成钢筋对
Figure BDA00029016463900001114
左图所选取的钢筋
Figure BDA00029016463900001115
的坐标为
Figure BDA00029016463900001116
半径为
Figure BDA00029016463900001117
右图钢筋
Figure BDA00029016463900001118
的坐标为
Figure BDA00029016463900001119
半径为
Figure BDA00029016463900001120
则从左图钢筋到右图钢筋的映射关系为
Figure BDA00029016463900001121
不同的钢筋对,映射关系不同,但由于左图和右图中的钢筋半径
Figure BDA00029016463900001122
已知,ai,j可根据
Figure BDA00029016463900001123
计算得到;
S3:对左图中除
Figure BDA00029016463900001124
外剩下的每一根钢筋
Figure BDA00029016463900001125
计算
Figure BDA00029016463900001126
Figure BDA00029016463900001127
的距离
Figure BDA00029016463900001128
按距离从小到大的顺序选取t根钢筋
Figure BDA00029016463900001129
作为钢筋
Figure BDA00029016463900001130
的最近邻钢筋组,t根据实际情况人为选取,t越大计算速度越慢,但锚点定位准确性越高,考虑到实际应用条件,本发明采用t=19。采用下式计算:
Figure BDA00029016463900001131
S4:对右图中除
Figure BDA00029016463900001132
外剩下的每一根钢筋
Figure BDA00029016463900001133
计算
Figure BDA00029016463900001134
Figure BDA00029016463900001135
的距离
Figure BDA00029016463900001136
按距离从小到大的顺序选取t根钢筋
Figure BDA00029016463900001137
作为钢筋
Figure BDA00029016463900001138
的最近邻钢筋组;
S5:根据S2所得到的
Figure BDA0002901646390000121
Figure BDA0002901646390000122
之间的映射关系ai,j,将左图的最近邻钢筋组映射到右图中,得到映射钢筋组
Figure BDA0002901646390000123
映射成功的钢筋组数量为s,初始时s=0:
S5.1对映射钢筋组
Figure BDA0002901646390000124
中每一根映射钢筋
Figure BDA0002901646390000125
对右图最近邻钢筋组
Figure BDA0002901646390000126
中的每一根钢筋
Figure BDA0002901646390000127
执行如下步骤;
S5.2
Figure BDA0002901646390000128
Figure BDA0002901646390000129
形成钢筋对
Figure BDA00029016463900001210
采用下面的公式计算钢筋对
Figure BDA00029016463900001211
的欧式距离△lp,q
Figure BDA00029016463900001212
S5.3:若△lp,q≤e则说明
Figure BDA00029016463900001213
Figure BDA00029016463900001214
之间的拓扑结构和
Figure BDA00029016463900001215
Figure BDA00029016463900001216
之间的拓扑结构相同,映射成功,其中e为设定值,需要根据实际情况选取,s=s+1;否则若△lp,q>e则说明二者拓扑结构不相同,映射失败;
S5.4:若映射成功的钢筋数量s等于t,则判定
Figure BDA00029016463900001217
Figure BDA00029016463900001218
为同一根钢筋,并设定其为锚点,转到步骤4。若映射成功数量s小于t,回到S5.1继续执行,直到右图最近邻钢筋组
Figure BDA00029016463900001219
处理完成;
S5.6若映射成功的钢筋数量s等于t,则判定
Figure BDA00029016463900001220
Figure BDA00029016463900001221
为同一根钢筋,并设定其为锚点,转到步骤4。若映射成功数量s小于t,回到S5.1继续执行,直到左图的映射钢筋组
Figure BDA00029016463900001222
处理完成;
S6:如果通过执行S2-S5没有找到锚点,回到S1继续执行,直到钢筋组
Figure BDA00029016463900001223
处理完成;
S7:如果通过执行S1-S6如果没有找到锚点,回到S1继续执行,直到钢筋组
Figure BDA00029016463900001224
处理完成;
S8:如果执行完S1-S7,都未找到锚点,匹配失败,算法终止。寻找锚点流程如附图3;
步骤4、在找到锚点后,记录锚点钢筋在左右两张图片中的圆心位置信息
Figure BDA0002901646390000131
依托此锚点位置信息,寻找高置信重叠钢筋,重叠的钢筋数量记为Nc,初始时Nc=0。具体算法流程如下:
T1:设定左图片中的矩形带状区域
Figure BDA0002901646390000132
右图片中的矩形带状区域
Figure BDA0002901646390000133
为高置信搜索区域,其中d为人为设定值,根据实际情况设定,本发明将d取锚点钢筋半径的2~3倍,
Figure BDA0002901646390000134
Figure BDA0002901646390000135
分别为左图和右图矩形带状区域的左上角坐标,
Figure BDA0002901646390000136
Figure BDA0002901646390000137
分别为左图和右图矩形带状区域的右下角坐标,
Figure BDA0002901646390000138
Figure BDA0002901646390000139
分别为左图和右图钢筋y向坐标值的最大值。左右图片中圆心坐标包含在该区域的高置信搜索钢筋集记为{R左1,R左2,……,R左z},{R右1,R右2,……,R右c};
T2对左图高置信搜索钢筋集{R左1,R左2,……,R左z}中的每一根钢筋R左i(i=1,2,L,z),对右图高置信搜索钢筋集{R右1,R右2,……,R右c}中的每一根钢筋R右j(j=1,2,L,c),执行如下步骤;
T3:对左右图片中的高置信搜索钢筋集中的每一对钢筋(R左i,R右j),采用步骤3的S1到S8判断是否为同一根钢筋。如果为同一根钢筋,Nc=Nc+1,转到T5继续执行,如果不为同一根钢筋,转到T4;
T4:重复T2-T3,直到{R右1,R右2,……,R右c}处理完成;
T5:重复T2-T4,直到{R左1,R左2,……,R左z}处理完成;
计算高置信重叠钢筋流程图如附图4;
步骤5、计算左图中矩形带状区域
Figure BDA00029016463900001310
中的所有钢筋数量Nl,计算右图中矩形带状区域
Figure BDA00029016463900001311
中的所有钢筋数量Nr,则全部钢筋的实际数量为:Ntotal=Nl+Nr-Nc
本应用场景的整体流程图如附图5。具体大致为:
U1:通过深度学习获取需要拼接的两张图片中所有钢筋圆心坐标R(x,y)、R(x,y),钢筋半径r、r
U2:根据附图2所示,依次按照从左往右,从上往下的顺序分别对左右图中所有钢筋进行编号,并取编号的前20%(向下取整)作为待计算钢筋组
Figure BDA0002901646390000141
Figure BDA0002901646390000142
U3:按照上述步骤3计算获取左右图片中的锚点钢筋,记录其圆心坐标
Figure BDA0002901646390000143
U4:按照上述步骤4计算获取全部高置信重叠钢筋数量Nc
U5:计算左图中矩形带状区域
Figure BDA0002901646390000144
中的所有钢筋数量Nl,计算右图中矩形带状区域
Figure BDA0002901646390000145
中的所有钢筋数量Nr,得到全部钢筋的实际数量为:Ntotal=Nl+Nr-Nc
本发明实施例示例性的应用场景中,采用深度学习对钢筋图像进行识别,得到所有钢筋的图像位置信息后,利用同一根钢筋在不同图片中与周围钢筋的相对位置不变的特性,寻找高置信重复识别钢筋,并依据重复识别钢筋建立左右图像钢筋重叠分界区域,最终实现相机拍摄钢筋图像的逻辑拼接,实现全自动钢筋计数。
如图6所示,本发明实施例的另一个方面提供了图片拼接装置200,包括获取处理模块210、反馈处理模块220和拼接处理模块230。获取处理模块210用于分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图像,以及通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构。反馈处理模块220用于获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈若所述结构相似性反馈在预设阈值要求内,则获取定位锚点。拼接处理模块230用于根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
在介绍了本发明示例性实施方式的方法和装置之后,接下来,参考图7对本发明实施例提供了一种计算机设备进行说明。
如图7所示,该计算机设备包括存储器31、处理器32、输入装置33和输出装置34。计算机设备中的处理器32的数量可以是一个或多个,图3中以一个处理器32为例;计算机设备中的存储器31、处理器32、输入装置33和输出装置34可以通过总线或其它方式连接,图3中以通过总线35连接为例。
存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的数据操作方法对应的程序指令/模块(例如,图片拼接装置200中的获取处理模块210、反馈处理模块220和拼接处理模块230。获取处理模块210)。处理器32通过运行存储在存储器31中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现数据操作方法。
存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器32远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。输入装置33可用于接收输入的数字或字符信息,以及产生与装置的用户设置以及功能控制有关的键信号输入。输出装置34可包括显示屏等显示设备。
最后,本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种图片拼接方法,该方法包括:
分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图像;
通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构;
获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈,若所述结构相似性反馈在预设阈值要求内,则获取定位锚点;
根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的数据操作方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。依据这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.图片拼接方法,其特征在于,所述方法包括:
分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图片;
通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构;
获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈,若所述结构相似性反馈在预设阈值要求内,则获取定位锚点;
根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合;
其中,所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈的方法包括:
对所述第一拓扑结构内的目标物按预设顺序得到第一目标物集合,对所述第二拓扑结构内的目标物按所述预设顺序得到第二目标物集合;
获取所述第一目标物集合中的第一预设初始目标物和所述第二目标物集合中的第二预设初始目标物;
构建所述第一预设初始目标物和所述第二预设初始目标物的映射关系;
基于预设规则,获取最近邻所述第一预设初始目标物的第一近邻目标物集合和最近邻所述第二预设初始目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,若得到映射目标物集合,则:
若所述映射目标物集合内的目标物数量为预设数量,则将所述第一预设初始目标物和所述第二预设初始目标物设置为定位锚点。
2.根据权利要求1所述的图片拼接方法,其特征在于,获得所述映射目标物集合的方法具体为:
计算所述第一目标物集合中除所述第一预设初始目标物外的所有目标物与所述第一目标物之间的第一距离,以及所述第二目标物集合中除所述第二预设初始目标物外的所有目标物与所述第二目标物之间的第二距离,得到第一距离集合和第二距离集合;
基于所述第一距离集合按照预设顺序选取预设数量的目标物,得到最近邻所述第一预设初始目标物的第一近邻目标物集合,基于所述第二距离集合按照同一预设顺序选取同一预设数量的目标物,得到最近邻所述第二预设初始目标物的第二近邻目标物集合;
根据所述映射关系,将所述第一近邻目标物集合映射到所述第二近邻目标物集合中,以获得映射目标物集合。
3.根据权利要求2所述的图片拼接方法,其特征在于,还包括:若所述映射目标物集合内的目标物数量小于所述预设数量,则遍历映射处理完所述第一近邻目标物集合和所述第二近邻目标物集合内的各目标物,直至所述映射目标物集合内的目标物数量为所述预设数量,获得对应的定位锚点。
4.根据权利要求1所述的图片拼接方法,其特征在于,所述拼接得到未重复识别的目标物的集合的方法包括:
根据预设搜索区域大小,以定位锚点为中心,分别获取第一图片内的第一带状区域和第二图片内的第二带状区域,对应得到第一高置信搜索目标物集合和第二高置信搜索目标物集合;
获取所述第一高置信搜索目标物集合中的第一预设高置信目标物和所述第二高置信搜索目标物集合中的第二预设高置信目标物;
计算所述第一预设高置信目标物和所述第二预设高置信目标物的拓扑结构相似性,以得到高置信重叠目标物。
5.一种图片拼接装置,其特征在于,所述装置包括:
获取处理模块,用于分别获取第一拍摄装置拍摄目标物的第一图片和第二拍摄装置拍摄目标物的第二图片 ,以及通过训练后的深度学习识别模型对所述第一图片和所述第二图片进行识别分类,以得到与所述第一图片对应的目标物的第一拓扑结构和所述第二图片对应的目标物的第二拓扑结构;
反馈处理模块,用于获取所述第一拓扑结构和所述第二拓扑结构的结构相似性反馈,若所述结构相似性反馈在预设阈值要求内,则获取定位锚点;
拼接处理模块,用于根据所述定位锚点获取并处理所述第一图片和所述第二图片中重复识别的目标物,以拼接得到未重复识别的目标物的集合。
6.一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述方法的步骤。
CN202110058679.XA 2021-01-16 2021-01-16 图片拼接方法、装置、计算机设备和存储介质 Active CN112927131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110058679.XA CN112927131B (zh) 2021-01-16 2021-01-16 图片拼接方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110058679.XA CN112927131B (zh) 2021-01-16 2021-01-16 图片拼接方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112927131A CN112927131A (zh) 2021-06-08
CN112927131B true CN112927131B (zh) 2022-11-11

Family

ID=76162977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110058679.XA Active CN112927131B (zh) 2021-01-16 2021-01-16 图片拼接方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112927131B (zh)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2761536A4 (en) * 2011-10-06 2016-04-13 Ai Cure Technologies Inc METHOD AND APPARATUS FOR FRACTAL ANALYSIS IDENTIFICATION
CN104463886A (zh) * 2014-12-18 2015-03-25 西南交通大学 一种线阵相机拍摄图像的处理方法及装置
CN105554449B (zh) * 2015-12-11 2018-04-27 浙江宇视科技有限公司 一种用于快速拼接摄像机图像的方法及装置
CN105956942B (zh) * 2016-05-12 2020-06-16 陕西瑞海电力工程有限公司 基于机器视觉的电力管廊钢筋网质量检测方法及检测装置
CN109658365B (zh) * 2017-10-11 2022-12-06 阿里巴巴(深圳)技术有限公司 图像处理方法、装置、系统和存储介质
CN108257087B (zh) * 2017-12-27 2021-03-26 深圳进化动力数码科技有限公司 一种双目相机拼接效果的检验方法、检验装置及终端设备
CN109740413B (zh) * 2018-11-14 2023-07-28 平安科技(深圳)有限公司 行人重识别方法、装置、计算机设备及计算机存储介质
CN109618222B (zh) * 2018-12-27 2019-11-22 北京字节跳动网络技术有限公司 一种拼接视频生成方法、装置、终端设备及存储介质
CN111680681B (zh) * 2020-06-10 2022-06-21 中建三局第一建设工程有限责任公司 排除非正常识别目标的图像后处理方法及系统及计数方法
CN112148909B (zh) * 2020-09-18 2024-03-29 微梦创科网络科技(中国)有限公司 搜索相似图片的方法及系统

Also Published As

Publication number Publication date
CN112927131A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
US11094198B2 (en) Lane determination method, device and storage medium
US10559090B2 (en) Method and apparatus for calculating dual-camera relative position, and device
CN111680681B (zh) 排除非正常识别目标的图像后处理方法及系统及计数方法
CN111192194B (zh) 一种针对幕墙建筑立面的全景图像拼接方法
CN101419709B (zh) 一种用于摄像机标定的平面靶标特征点的自动匹配方法
EP3620961A1 (en) Lane line tracking method and device
CN111433780A (zh) 车道线检测方法、设备、计算机可读存储介质
CN114913386A (zh) 一种多目标跟踪模型的训练方法以及多目标跟踪方法
CN112347985A (zh) 一种物料类别检测方法及装置
CN113947766A (zh) 一种基于卷积神经网络的实时车牌检测方法
CN108961276B (zh) 基于视觉伺服的配电线路巡检数据自动采集方法及系统
CN105931233A (zh) 用于输电线路螺栓紧固机器人的螺栓搜索识别方法
CN111951158B (zh) 一种无人机航拍图像拼接中断的恢复方法、装置和存储介质
CN115100489A (zh) 一种图像处理方法、装置、设备及可读存储介质
CN107423738A (zh) 一种基于模板匹配的试卷题目定位方法及装置
JP2006350553A (ja) 対応点探索方法、相互標定方法、3次元画像計測方法、対応点探索装置、相互標定装置、3次元画像計測装置、対応点探索プログラム及び対応点探索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN115359251A (zh) 一种视觉传感器数据中多个轮廓共边计算方法及系统
CN112927131B (zh) 图片拼接方法、装置、计算机设备和存储介质
CN114693529A (zh) 一种图像拼接方法、装置、设备及存储介质
CN112800887B (zh) 一种柱状目标物识别系统
CN115546221B (zh) 一种钢筋计数方法、装置、设备及存储介质
CN112598367A (zh) 工程项目建设进程监测方法、系统、智能终端及存储介质
CN110827333A (zh) 一种继电保护的压板拼接识别方法、系统及介质
CN113435412B (zh) 一种基于语义分割的水泥布料区域检测方法
CN106296580A (zh) 一种图像拼接的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221125

Address after: 4F-3, Building A, Future Design Art Center, No.2560 Park Avenue, East New District, Chengdu, Sichuan 610000 (self declared)

Patentee after: The First Construction (Sichuan) Co.,Ltd. of China Construction Third Engineering Bureau

Patentee after: CHINA CONSTRUCTION THIRD BUREAU FIRST ENGINEERING Co.,Ltd.

Address before: 430040, No. 1, Soochow Road, Dongxihu District, Hubei, Wuhan

Patentee before: CHINA CONSTRUCTION THIRD BUREAU FIRST ENGINEERING Co.,Ltd.

TR01 Transfer of patent right