CN113887346A - 基于人工智能的线段识别方法、装置、设备及存储介质 - Google Patents
基于人工智能的线段识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113887346A CN113887346A CN202111092999.3A CN202111092999A CN113887346A CN 113887346 A CN113887346 A CN 113887346A CN 202111092999 A CN202111092999 A CN 202111092999A CN 113887346 A CN113887346 A CN 113887346A
- Authority
- CN
- China
- Prior art keywords
- line segment
- decoding
- vector
- feature
- fine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 144
- 238000000605 extraction Methods 0.000 claims abstract description 44
- 230000006870 function Effects 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 31
- 230000007246 mechanism Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 18
- 230000001902 propagating effect Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于人工智能的线段识别方法,应用于人工智能技术领域,用于解决图像中线段识别的效果不准确的技术问题。本发明提供的方法包括:通过特征提取网络的不同层对待识别图像进行输出分别得到第一图像特征、第一位置特征、第二图像特征和第二位置特征,将第一图像特征、第一位置特征、第二图像特征和第二位置特征分别进行加和得到粗糙特征和深度特征;对粗糙特征进行粗编码得到第一中间特征;通过起始线段向量和粗解码模块对第一中间特征进行解码得到中间线段向量;通过细编码模块对深度特征进行细编码得到第二中间特征;通过中间线段向量和细解码模块对第二中间特征进行解码,根据得到的目标线段向量得到该图像中包含的线段的位置及端点。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的线段识别方法、装置、计算机设备及存储介质。
背景技术
随着深度神经网络变得越来越强大,在实际生活中,它的应用也越来越广泛,例如视频监控、人脸识别、语音识别、自然语言处理等领域。在很多领域,机器的识别能力已经远超过人类,各大公司都在深度学习领域投入了大量的人力、物力,以达到更好的识别效果。
从图像中识别出线段是计算机视觉领域一个非常重要的基本过程,线段信息可以对解决其他下游的计算机视觉任务有重要帮助,例如图像分割、三维重建、图像匹配、物体识别等等。
现在已有一些智能识别方法能够对图像中的线段进行识别,现有的基于深度学习的线段识别方法大多使用了启发性模块,例如边缘检测、区域检测、线组合或者后处理操作,这就大大限制了算法的性能和进一步开发,使得线段识别效果并不十分准确。
发明内容
本发明实施例提供一种基于人工智能的线段识别方法、装置、计算机设备及存储介质,以解决图像中线段识别的效果不准确的技术问题。
一种基于人工智能的线段识别方法,所述方法包括:
获取待识别的图像,将所述待识别的图像输入至训练好的线段识别模型的特征提取网络;
通过所述特征提取网络的第N层对所述待识别的图像进行输出,得到第一图像特征和第一位置特征;
将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征;
通过训练好的线段识别模型的粗编码模块对所述粗糙特征进行粗编码,得到第一中间特征;
通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量;
通过所述特征提取网络的第M层对所述待识别的图像进行输出,得到第二图像特征和第二位置特征,所述第M层的网络层级低于所述第N层的网络层级;
将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征;
通过训练好的线段识别模型的细编码模块对所述深度特征进行细编码,得到第二中间特征;
通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量;
将所述目标线段向量输入至所述训练好的线段识别模型的全连接层,得到所述待识别的图像中包含的线段的位置以及端点。
一种基于人工智能的线段识别装置,所述装置包括:
图像获取模块,用于获取待识别的图像,将所述待识别的图像输入至训练好的线段识别模型的特征提取网络;
第一输出模块,用于通过所述特征提取网络的第N层对所述待识别的图像进行输出,得到第一图像特征和第一位置特征;
第一加和模块,用于将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征;
粗编码模块,用于通过训练好的线段识别模型的粗编码模块对所述粗糙特征进行粗编码,得到第一中间特征;
粗解码模块,用于通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量;
第二输出模块,用于通过所述特征提取网络的第M层对所述待识别的图像进行输出,得到第二图像特征和第二位置特征,所述第M层的网络层级低于所述第N层的网络层级;
第二加和模块,用于将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征;
细编码模块,用于通过训练好的线段识别模型的细编码模块对所述深度特征进行细编码,得到第二中间特征;
细解码模块,用于通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量;
全连接模块,用于将所述目标线段向量输入至所述训练好的线段识别模型的全连接层,得到所述待识别的图像中包含的线段的位置以及端点。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的线段识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人工智能的线段识别方法的步骤。
本申请提出的基于人工智能的线段识别方法、装置、计算机设备及存储介质,通过对待识别的图像进行特征提取,在提取特征的过程中通过特征提取网络的不同层分别进行输出,对特征提取网络的高层输出的第一图像特征和第一位置特征进行加和处理,得到粗糙特征,并对特征提取网络的底层输出的第二图像特征和第二位置特征进行加和处理得到深度特征,然后通过训练好的线段识别模型的粗编码模块对该粗糙特征进行粗编码,得到第一中间特征,通过训练好的线段识别模型的细编码模块对该深度特征进行细编码,得到第二中间特征,再通过起始线段向量和训练好的线段识别模型的粗解码模块对该第一中间特征进行解码得到中间线段向量,并通过中间线段向量和训练好的线段识别模型的细解码模块对该第二中间特征进行解码,得到目标线段向量,最后将该目标线段向量输入至训练好的线段识别模型的全连接层,得到该待识别的图像中包含的线段的位置以及端点,整个识别过程没有用到例如边缘检测、区域检测、线组合或者后处理等启发模块,使得线段的识别准确性较高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于人工智能的线段识别方法的一应用环境示意图;
图2是本发明一实施例中基于人工智能的线段识别方法的一流程图;
图3是本发明一实施例中线段识别模型的网络结构示意图;
图4是本发明一实施例中粗编码模块的网络结构示意图;
图5是本发明一实施例中粗解码模块的网络结构示意图;
图6是本发明一实施例中细编码模块的网络结构示意图;
图7是本发明一实施例中细解码模块的网络结构示意图;
图8是本发明一实施例中基于人工智能的线段识别装置的结构示意图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的基于人工智能的线段识别方法,可应用在如图1的应用环境中,其中,该计算机设备可以通过网络与服务器进行通信。其中,该计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
在一实施例中,为了提高对图像中的线段进行识别的准确性,如图2所示,提供一种基于人工智能的线段识别方法,以该方法应用在图1中的计算机设备为例进行说明,包括如下步骤S101至S110:
S101、获取待识别的图像,将所述待识别的图像输入至训练好的线段识别模型的特征提取网络。
在其中一个实施例中,该特征提取网络可以选用ResNet框架下的残差backbone网络。
其中,该待识别的图像中可以包含待识别的线段,也可以不包含待识别的线段。该图像可以是拍摄得到的二维建筑图、风景图,也可以是通过制图软件绘制的平面图或设备机构示意图。
S102、通过所述特征提取网络的第N层对所述待识别的图像进行输出,得到第一图像特征和第一位置特征。
其中,所述线段识别模型包括特征提取网络、粗编码模块、细编码模块、粗解码模块、细解码模块以及全连接层,所述特征提取网络的第一输出连接所述粗编码模块的输入,所述特征提取网络的第二输出连接所述细编码模块的输入,所述粗编码模块的输出连接所述粗解码模块的输入,所述粗解码模块的输出和所述细编码模块的输出均连接所述细编码模块的输入,所述细编码模块的输出连接所述全连接层。
作为可选地,该特征提取网络共包括五层,可以通过该五层特征提取网络中的第五层对所述待识别的图像进行输出,即令N=5,得到该第一图像特征和第一位置特征。
在其中一个实施例中,该线段识别模型的网络结构示意图如下图3所示,图3中的FFN(feed forward neural networks,前馈神经网络)表示所述全连接层。
S103、将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征。
在其中一个实施例中,所述将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征的步骤进一步包括:
获取所述第一图像特征所在维度空间中各图像特征数值的第一坐标位置;
获取所述第一位置特征所在维度空间中各位置特征数值的第一坐标位置,所述第一图像特征的图像特征数值的第一坐标位置与所述第一图像特征的位置特征数值的第一坐标位置具有一一对应的关系;
依次将属于所述维度空间中同一第一坐标位置的所述图像特征数值和所述位置特征数值相加,得到所述粗糙特征。
可以理解的是,该粗糙特征同时结合了图像信息特征和各图像信息的位置特征,将第一图像特征和第一位置特征进行加和处理有利于后续步骤中对图像中的线段进行识别。
S104、通过训练好的线段识别模型的粗编码模块对所述粗糙特征进行粗编码,得到第一中间特征。
在其中一个实施例中,所述粗编码模块的网络结构示意图如下图4所示。在其中一个实施例中,该粗编码模块包括若干个结构相同的粗编码层,各所述粗编码层依次顺序连接,相邻的前一个粗编码层的输出为后一个粗编码层的输入。
作为可选地,如图4所示,该粗编码模块共包括六层粗编码层,其中,该粗编码模块包括的粗编码层的层数可以根据场景需要适应调节,例如也可以是五层或者七层。其中,图4中的Self-Attention表示自注意力机制,Feed-forward表示前向传播。
S105、通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量。
在其中一个实施例中,该粗解码模块包括若干个结构相同的粗解码层,各所述粗解码层依次顺序连接,相邻的前一个粗解码层的输出为后一个粗解码层的其中一个输入,其中,第一粗解码层的输入为起始线段向量和第一中间特征,该第一中间特征同时为后续每个所述粗解码层的另一个输入。
在其中一个实施例中,该通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量的步骤进一步包括:
将所述起始线段向量输入至所述粗解码模块的第一粗解码层,通过所述第一粗解码层对所述起始线段向量进行自注意力机制处理,得到第一自注意力向量;
通过所述第一粗解码层对所述第一自注意力向量和所述第一中间特征进行交叉注意力机制处理,得到第一交叉注意力向量;
通过所述第一粗解码层对所述第一交叉注意力向量进行前向传播,将所述第一交叉注意力向量发送至与所述第一粗解码层顺序连接的在后粗解码层;
将所述在后粗解码层作为当前粗解码层,通过所述当前粗解码层对所述第一交叉注意力向量进行自注意力机制处理,得到当前自注意力向量;
通过所述当前粗解码层对所述当前自注意力向量和所述第一中间特征进行交叉注意力机制处理,得到当前交叉注意力向量;
当所述当前粗解码层为所述粗解码模块的最后一层时,将所述当前交叉注意力向量作为所述中间线段向量,否则,通过所述当前粗解码层对所述当前交叉注意力向量进行前向传播,将所述当前交叉注意力向量发送至与所述当前粗解码层顺序连接的在后粗解码层,循环所述将所述在后粗解码层作为所述当前粗解码层至本步骤,直到所述当前粗解码层为所述粗解码模块的最后一层。在其中一个实施例中,所述粗解码模块的网络结构示意图如下图5所示。
可以理解的是,该粗解码模块中包括的粗解码层的层数与该粗编码模块中的粗编码层的层数相同,当该粗编码模块中的粗编码层的层数为六层时,该粗解码层的层数也为六层。其中,图5中第一粗解码层的Self-Attention表示对起始线段向量进行自注意力机制处理,得到第一自注意力向量,Cross-Attention表示对该第一中间向量和该第一中间特征进行交叉注意力机制处理,得到第一交叉注意力向量,Feed-forward表示对该第一交叉注意力向量进行前向传播,后面第二粗解码层至该第六粗解码层的解码原理与该第一粗解码层的解码原理相同,最终通过该粗解码模块的最后一个解码层输出该中间线段向量。
可以理解的是,由于模型预先不知道待识别的图像或用于训练的样本图像中实际的线段数量,该起始线段向量的数量一般高于图像中可能存在的实际线段的数量。作为可选地,该起始线段向量的数量可以预设为100个。
S106、通过所述特征提取网络的第M层对所述待识别的图像进行输出,得到第二图像特征和第二位置特征,所述第M层的网络层级低于所述第N层的网络层级。
在其中一个实施例中,该特征提取网络共包括五层,可以通过该五层特征提取网络中的第四层对该待识别的图像进行输出,即令M=4时,得到第二图像特征和第二位置特征。
S107、将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征。
在其中一个实施例中,所述将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征的步骤进一步包括:
获取所述第二图像特征所在维度空间中各图像特征数值的第二坐标位置;
获取所述第二位置特征所在维度空间中各位置特征数值的第二坐标位置,所述第二图像特征的图像特征数值的第二坐标位置与所述第二图像特征的位置特征数值的第二坐标位置具有一一对应的关系;
依次将属于所述维度空间中同一第二坐标位置的所述图像特征数值和所述位置特征数值相加,得到所述深度特征。
S108、通过训练好的线段识别模型的细编码模块对所述深度特征进行细编码,得到第二中间特征。
在其中一个实施例中,所述细编码的网络结构示意图如下图6所示。可以理解的是,该细编码的网络结构与该粗编码模块的网络结构类似,该细编码模块包括若干个结构相同的细编码层,各所述细编码层依次顺序连接,相邻的前一个细编码层的输出为后一个细编码层的输入。
作为可选地,如图6所示,该细编码模块共包括六层细编码层,同样地,该细编码模块包括的细编码层的层数也可以根据场景需要适应调节,例如也可以是五层或者七层。
S109、通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量。
可以理解的是,该细解码模块中包括的细解码层的层数与该细编码模块中的细编码层的层数相同,当该细编码模块中的细编码层的层数为六层时,该细解码层的层数也为六层。在其中一个实施例中,所述细解码模块的网络结构示意图如下图7所示。
在其中一个实施例中,所述通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量的步骤进一步包括:
将所述中间线段向量输入至所述细解码模块的第一细解码层,通过所述第一细解码层对所述中间线段向量进行自注意力机制处理,得到第二自注意力向量;
通过所述第一细解码层对所述第二自注意力向量和所述第二中间特征进行交叉注意力机制处理,得到第二交叉注意力向量;
通过所述第一细解码层对所述第二交叉注意力向量进行前向传播,将所述第二交叉注意力向量发送至与所述第一细解码层顺序连接的在后细解码层;
将所述在后细解码层作为当前细解码层,通过所述当前细解码层对所述第二交叉注意力向量进行自注意力机制处理,得到当前自注意力细解码向量;
通过所述当前细解码层对所述当前自注意力细解码向量和所述第二中间特征进行交叉注意力机制处理,得到当前交叉注意力细解码向量;
当所述当前细解码层为所述细解码模块的最后一层时,将所述当前交叉注意力细解码向量作为所述目标线段向量,否则,通过所述当前细解码层对所述当前交叉注意力细解码向量进行前向传播,将所述当前交叉注意力细解码向量发送至与所述当前细解码层顺序连接的在后细解码层,循环所述将所述在后细解码层作为所述当前细解码层至本步骤,直到所述当前细解码层为所述细解码模块的最后一层。
S110、将所述目标线段向量输入至所述训练好的线段识别模型的全连接层,得到所述待识别的图像中包含的线段的位置以及端点。
在其中一个实施例中,训练所述线段识别模型的步骤包括:
抽取携带有样本标签的样本图像,所述样本标签用于标注所述样本图像中包括的线段;
将所述样本图像输入至待训练的线段识别模型的特征提取网络,并通过所述待训练的线段识别模型的全连接层输出所述样本图像中包含的线段的预测结果;
根据所述样本标签、所述预测结果以及所述线段识别模型的损失函数计算所述线段识别模型的损失;
判断所述线段识别模型的损失的梯度是否大于预设值;
当所述线段识别模型的损失的梯度大于预设值时,则调节所述线段识别模型的参数,循环所述抽取携带有样本标签的样本图像至所述调节所述线段识别模型的参数的步骤,直至所述线段识别模型的损失的梯度小于等于所述预设值,得到训练好的线段识别模型。
可以理解的是,该样本图像在所述线段识别模型中从所述特征提取网络至所述全连接层之间的正向处理流程,与在对待识别的图像进行实际的线段识别时的处理过程相同,只是由于在训练阶段线段识别模型中各网络的参数与在实际识别阶段的参数不同,且输入至该特征提取网络的对象不同,导致该线段识别模型的全连接层的输出结果不同,在此就不再赘述了。
在其中一个实施例中,所述线段识别模型的损失函数为:
其中,L表示所述线段识别模型的损失函数,i表示第i个线段,N表示所述线段的最大数量,表示分类损失函数,表示距离损失函数,λcls表示预设的分类损失函数的权重,λdist表示预设的距离损失函数的权重,表示指示函数,σ*表示通过二分类对识别出的所有线段进行的最优排列,α1和α2表示预设的权重,p(i)表示第i个线段的预测概率,γ表示聚焦参数,表示预测目标与所述样本标签中对应线段i的欧式距离,M表示所述样本标签中目标线段的个数。
本实施例通过预先构建线段识别模型的结构,然后对该线段识别模型进行训练,在需要识别图像中的线段时,将该图像直接输入至训练好的线段识别模型,即可识别该图像中的线段,且整个识别过程没有用到例如边缘检测、区域检测、线组合或者后处理等启发模块,使得线段的识别准确性较高。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于人工智能的线段识别装置,该基于人工智能的线段识别装置与上述实施例中基于人工智能的线段识别方法一一对应。如图8所示,该基于人工智能的线段识别装置100包括图像获取模块11、第一输出模块12、第一加和模块13、粗编码模块14、粗解码模块15、第二输出模块16、第二加和模块17、细编码模块18、细解码模块19和全连接模块20。各功能模块详细说明如下:
图像获取模块11,用于获取待识别的图像,将该待识别的图像输入至训练好的线段识别模型的特征提取网络;
第一输出模块12,用于通过该特征提取网络的第N层对该待识别的图像进行输出,得到第一图像特征和第一位置特征;
第一加和模块13,用于将该第一图像特征和第一位置特征进行加和处理,得到粗糙特征;
粗编码模块14,用于通过训练好的线段识别模型的粗编码模块对该粗糙特征进行粗编码,得到第一中间特征;
粗解码模块15,用于通过起始线段向量和训练好的线段识别模型的粗解码模块对该第一中间特征进行解码,得到中间线段向量;
第二输出模块16,用于通过该特征提取网络的第M层对该待识别的图像进行输出,得到第二图像特征和第二位置特征,该第M层的网络层级低于该第N层的网络层级;
第二加和模块17,用于将该第二图像特征和该第二位置特征进行加和处理,得到深度特征;
细编码模块18,用于通过训练好的线段识别模型的细编码模块对该深度特征进行细编码,得到第二中间特征;
细解码模块19,用于通过该中间线段向量和训练好的线段识别模型的细解码模块对该第二中间特征进行解码,得到目标线段向量;
全连接模块20,用于将该目标线段向量输入至该训练好的线段识别模型的全连接层,得到该待识别的图像中包含的线段的位置以及端点。
在其中一个实施例中,该第一加和模块13具体包括:
第一位置获取单元,用于获取该第一图像特征所在维度空间中各图像特征数值的第一坐标位置;
第一特征值获取单元,用于获取该第一位置特征所在维度空间中各位置特征数值的第一坐标位置,该第一图像特征的图像特征数值的第一坐标位置与该第一图像特征的位置特征数值的第一坐标位置具有一一对应的关系;
第一加和单元,用于依次将属于该维度空间中同一第一坐标位置的该图像特征数值和该位置特征数值相加,得到该粗糙特征。
在其中一个实施例中,该第二加和模块17具体包括:
第二位置获取单元,用于获取所述第二图像特征所在维度空间中各图像特征数值的第二坐标位置;
第二特征值获取单元,用于获取所述第二位置特征所在维度空间中各位置特征数值的第二坐标位置,所述第二图像特征的图像特征数值的第二坐标位置与所述第二图像特征的位置特征数值的第二坐标位置具有一一对应的关系;
第二加和单元,用于依次将属于所述维度空间中同一第二坐标位置的所述图像特征数值和所述位置特征数值相加,得到所述深度特征。
在其中一个实施例中,该粗解码模块包括若干个结构相同的粗解码层,各该粗解码层依次顺序连接,该粗解码模块15进一步包括:
第一自注意力单元,用于将该起始线段向量输入至该粗解码模块的第一粗解码层,通过该第一粗解码层对该起始线段向量进行自注意力机制处理,得到第一自注意力向量;
第一交叉注意力单元,用于通过该第一粗解码层对该第一自注意力向量和该第一中间特征进行交叉注意力机制处理,得到第一交叉注意力向量;
第一前向传播单元,用于通过该第一粗解码层对该第一交叉注意力向量进行前向传播,将该第一交叉注意力向量发送至与该第一粗解码层顺序连接的在后粗解码层;
当前自注意力单元,用于将该在后粗解码层作为当前粗解码层,通过该当前粗解码层对该第一交叉注意力向量进行自注意力机制处理,得到当前自注意力向量;
当前交叉注意力单元,用于通过该当前粗解码层对该当前自注意力向量和该第一中间特征进行交叉注意力机制处理,得到当前交叉注意力向量;
第一循环单元,用于当该当前粗解码层为该粗解码模块的最后一层时,将该当前交叉注意力向量作为该中间线段向量,否则,通过该当前粗解码层对该当前交叉注意力向量进行前向传播,将该当前交叉注意力向量发送至与该当前粗解码层顺序连接的在后粗解码层,循环该将该在后粗解码层作为该当前粗解码层至本步骤,直到该当前粗解码层为该粗解码模块的最后一层。
在其中一个实施例中,该细解码模块中包括的细解码层的层数与该细编码模块中的细编码层的层数相同,各该细解码层依次顺序连接,该细解码模块19进一步包括:
第二自注意力单元,用于将该中间线段向量输入至该细解码模块的第一细解码层,通过该第一细解码层对该中间线段向量进行自注意力机制处理,得到第二自注意力向量;
第二交叉注意力单元,用于通过该第一细解码层对该第二自注意力向量和该第二中间特征进行交叉注意力机制处理,得到第二交叉注意力向量;
单元,用于通过该第一细解码层对该第二交叉注意力向量进行前向传播,将该第二交叉注意力向量发送至与该第一细解码层顺序连接的在后细解码层;
第二前向传播单元,用于将该在后细解码层作为当前细解码层,通过该当前细解码层对该第二交叉注意力向量进行自注意力机制处理,得到当前自注意力细解码向量;
交叉注意力细解码单元,用于通过该当前细解码层对该当前自注意力细解码向量和该第二中间特征进行交叉注意力机制处理,得到当前交叉注意力细解码向量;
第二循环单元,用于当该当前细解码层为该细解码模块的最后一层时,将该当前交叉注意力细解码向量作为该目标线段向量,否则,通过该当前细解码层对该当前交叉注意力细解码向量进行前向传播,将该当前交叉注意力细解码向量发送至与该当前细解码层顺序连接的在后细解码层,循环该将该在后细解码层作为该当前细解码层至本步骤,直到该当前细解码层为该细解码模块的最后一层。
作为可选地,该特征提取网络共包括五层,通过该特征提取网络中的第五层对该待识别的图像进行输出,得到该第一图像特征和该第一位置特征,通过该特征提取网络中的第四层对该待识别的图像进行输出,得到该第二图像特征和该第二位置特征。
在其中一个实施例中,该基于人工智能的线段识别装置具体还包括:
样本抽取模块,用于抽取携带有样本标签的样本图像,该样本标签用于标注该样本图像中包括的线段;
样本输入模块,用于将该样本图像输入至待训练的线段识别模型的特征提取网络,并通过该待训练的线段识别模型的全连接层输出该样本图像中包含的线段的预测结果;
损失计算模块,用于根据该样本标签、该预测结果以及该线段识别模型的损失函数计算该线段识别模型的损失;
判断模块,用于判断该线段识别模型的损失的梯度是否大于预设值;
循环模块,用于当该线段识别模型的损失的梯度大于预设值时,调节该线段识别模型的参数,循环该抽取携带有样本标签的样本图像至该调节该线段识别模型的参数的步骤,直至该线段识别模型的损失的梯度小于等于该预设值,得到训练好的线段识别模型。
进一步地,该线段识别模型的损失函数为:
其中,L表示所述线段识别模型的损失函数,i表示第i个线段,N表示所述线段的最大数量,表示分类损失函数,表示距离损失函数,λcls表示预设的分类损失函数的权重,λdist表示预设的距离损失函数的权重,表示指示函数,σ*表示通过二分类对识别出的所有线段进行的最优排列,α1和α2表示预设的权重,p(i)表示第i个线段的预测概率,γ表示聚焦参数,表示预测目标与所述样本标签中对应线段i的欧式距离,M表示所述样本标签中目标线段的个数。
其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。
关于基于人工智能的线段识别装置的具体限定可以参见上文中对于基于人工智能的线段识别方法的限定,在此不再赘述。上述基于人工智能的线段识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质包括非易失性存储介质和/或易失性的存储介质,该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于人工智能的线段识别方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的线段识别方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于人工智能的线段识别方法的步骤,例如图2所示的步骤101至步骤110及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中基于人工智能的线段识别装置的各模块/单元的功能,例如图8所示模块11至模块20的功能。为避免重复,这里不再赘述。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于人工智能的线段识别方法的步骤,例如图2所示的步骤101至步骤110及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中基于人工智能的线段识别装置的各模块/单元的功能,例如图8所示模块11至模块20的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性和/或易失性的计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于人工智能的线段识别方法,其特征在于,所述方法包括:
获取待识别的图像,将所述待识别的图像输入至训练好的线段识别模型的特征提取网络;
通过所述特征提取网络的第N层对所述待识别的图像进行输出,得到第一图像特征和第一位置特征;
将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征;
通过训练好的线段识别模型的粗编码模块对所述粗糙特征进行粗编码,得到第一中间特征;
通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量;
通过所述特征提取网络的第M层对所述待识别的图像进行输出,得到第二图像特征和第二位置特征,所述第M层的网络层级低于所述第N层的网络层级;
将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征;
通过训练好的线段识别模型的细编码模块对所述深度特征进行细编码,得到第二中间特征;
通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量;
将所述目标线段向量输入至所述训练好的线段识别模型的全连接层,得到所述待识别的图像中包含的线段的位置以及端点。
2.根据权利要求1所述的基于人工智能的线段识别方法,其特征在于,所述将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征的步骤进一步包括:
获取所述第一图像特征所在维度空间中各图像特征数值的第一坐标位置;
获取所述第一位置特征所在维度空间中各位置特征数值的第一坐标位置,所述第一图像特征的图像特征数值的第一坐标位置与所述第一图像特征的位置特征数值的第一坐标位置具有一一对应的关系;
依次将属于所述维度空间中同一第一坐标位置的所述图像特征数值和所述位置特征数值相加,得到所述粗糙特征。
3.根据权利要求1所述的基于人工智能的线段识别方法,其特征在于,所述粗解码模块包括若干个结构相同的粗解码层,各所述粗解码层依次顺序连接,所述通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量的步骤进一步包括:
将所述起始线段向量输入至所述粗解码模块的第一粗解码层,通过所述第一粗解码层对所述起始线段向量进行自注意力机制处理,得到第一自注意力向量;
通过所述第一粗解码层对所述第一自注意力向量和所述第一中间特征进行交叉注意力机制处理,得到第一交叉注意力向量;
通过所述第一粗解码层对所述第一交叉注意力向量进行前向传播,将所述第一交叉注意力向量发送至与所述第一粗解码层顺序连接的在后粗解码层;
将所述在后粗解码层作为当前粗解码层,通过所述当前粗解码层对所述第一交叉注意力向量进行自注意力机制处理,得到当前自注意力向量;
通过所述当前粗解码层对所述当前自注意力向量和所述第一中间特征进行交叉注意力机制处理,得到当前交叉注意力向量;
当所述当前粗解码层为所述粗解码模块的最后一层时,将所述当前交叉注意力向量作为所述中间线段向量,否则,通过所述当前粗解码层对所述当前交叉注意力向量进行前向传播,将所述当前交叉注意力向量发送至与所述当前粗解码层顺序连接的在后粗解码层,循环所述将所述在后粗解码层作为所述当前粗解码层至本步骤,直到所述当前粗解码层为所述粗解码模块的最后一层。
4.根据权利要求1所述的基于人工智能的线段识别方法,其特征在于,所述细解码模块中包括的细解码层的层数与所述细编码模块中的细编码层的层数相同,各所述细解码层依次顺序连接,所述通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量的步骤进一步包括:
将所述中间线段向量输入至所述细解码模块的第一细解码层,通过所述第一细解码层对所述中间线段向量进行自注意力机制处理,得到第二自注意力向量;
通过所述第一细解码层对所述第二自注意力向量和所述第二中间特征进行交叉注意力机制处理,得到第二交叉注意力向量;
通过所述第一细解码层对所述第二交叉注意力向量进行前向传播,将所述第二交叉注意力向量发送至与所述第一细解码层顺序连接的在后细解码层;
将所述在后细解码层作为当前细解码层,通过所述当前细解码层对所述第二交叉注意力向量进行自注意力机制处理,得到当前自注意力细解码向量;
通过所述当前细解码层对所述当前自注意力细解码向量和所述第二中间特征进行交叉注意力机制处理,得到当前交叉注意力细解码向量;
当所述当前细解码层为所述细解码模块的最后一层时,将所述当前交叉注意力细解码向量作为所述目标线段向量,否则,通过所述当前细解码层对所述当前交叉注意力细解码向量进行前向传播,将所述当前交叉注意力细解码向量发送至与所述当前细解码层顺序连接的在后细解码层,循环所述将所述在后细解码层作为所述当前细解码层至本步骤,直到所述当前细解码层为所述细解码模块的最后一层。
5.根据权利要求1所述的基于人工智能的线段识别方法,其特征在于,所述特征提取网络共包括五层,通过所述特征提取网络中的第五层对所述待识别的图像进行输出,得到所述第一图像特征和所述第一位置特征,通过所述特征提取网络中的第四层对所述待识别的图像进行输出,得到所述第二图像特征和所述第二位置特征。
6.根据权利要求1所述的基于人工智能的线段识别方法,其特征在于,训练所述线段识别模型的步骤包括:
抽取携带有样本标签的样本图像,所述样本标签用于标注所述样本图像中包括的线段;
将所述样本图像输入至待训练的线段识别模型的特征提取网络,并通过所述待训练的线段识别模型的全连接层输出所述样本图像中包含的线段的预测结果;
根据所述样本标签、所述预测结果以及所述线段识别模型的损失函数计算所述线段识别模型的损失;
判断所述线段识别模型的损失的梯度是否大于预设值;
当所述线段识别模型的损失的梯度大于预设值时,调节所述线段识别模型的参数,循环所述抽取携带有样本标签的样本图像至所述调节所述线段识别模型的参数的步骤,直至所述线段识别模型的损失的梯度小于等于所述预设值,得到训练好的线段识别模型。
8.一种基于人工智能的线段识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待识别的图像,将所述待识别的图像输入至训练好的线段识别模型的特征提取网络;
第一输出模块,用于通过所述特征提取网络的第N层对所述待识别的图像进行输出,得到第一图像特征和第一位置特征;
第一加和模块,用于将所述第一图像特征和第一位置特征进行加和处理,得到粗糙特征;
粗编码模块,用于通过训练好的线段识别模型的粗编码模块对所述粗糙特征进行粗编码,得到第一中间特征;
粗解码模块,用于通过起始线段向量和训练好的线段识别模型的粗解码模块对所述第一中间特征进行解码,得到中间线段向量;
第二输出模块,用于通过所述特征提取网络的第M层对所述待识别的图像进行输出,得到第二图像特征和第二位置特征,所述第M层的网络层级低于所述第N层的网络层级;
第二加和模块,用于将所述第二图像特征和所述第二位置特征进行加和处理,得到深度特征;
细编码模块,用于通过训练好的线段识别模型的细编码模块对所述深度特征进行细编码,得到第二中间特征;
细解码模块,用于通过所述中间线段向量和训练好的线段识别模型的细解码模块对所述第二中间特征进行解码,得到目标线段向量;
全连接模块,用于将所述目标线段向量输入至所述训练好的线段识别模型的全连接层,得到所述待识别的图像中包含的线段的位置以及端点。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述基于人工智能的线段识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述基于人工智能的线段识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111092999.3A CN113887346A (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的线段识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111092999.3A CN113887346A (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的线段识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113887346A true CN113887346A (zh) | 2022-01-04 |
Family
ID=79009540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111092999.3A Pending CN113887346A (zh) | 2021-09-17 | 2021-09-17 | 基于人工智能的线段识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113887346A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783495A (zh) * | 2020-06-30 | 2020-10-16 | 创新奇智(南京)科技有限公司 | 一种条形码识别方法、装置、电子设备及存储介质 |
WO2021169209A1 (zh) * | 2020-02-27 | 2021-09-02 | 平安科技(深圳)有限公司 | 一种基于语音及图像特征的异常行为识别方法、装置及设备 |
-
2021
- 2021-09-17 CN CN202111092999.3A patent/CN113887346A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169209A1 (zh) * | 2020-02-27 | 2021-09-02 | 平安科技(深圳)有限公司 | 一种基于语音及图像特征的异常行为识别方法、装置及设备 |
CN111783495A (zh) * | 2020-06-30 | 2020-10-16 | 创新奇智(南京)科技有限公司 | 一种条形码识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
YIFAN XU等: "Line Segment Detection Using Transformers without Edges", 《HTTPS://DOI.ORG/10.48550/ARXIV.2101.01909》, 6 January 2021 (2021-01-06), pages 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241903B (zh) | 样本数据清洗方法、装置、计算机设备及存储介质 | |
WO2021114625A1 (zh) | 用于多任务场景的网络结构构建方法和装置 | |
CN110889325B (zh) | 多任务面部动作识别模型训练和多任务面部动作识别方法 | |
CN111950638B (zh) | 基于模型蒸馏的图像分类方法、装置和电子设备 | |
CN111797893A (zh) | 一种神经网络的训练方法、图像分类系统及相关设备 | |
CN111652250B (zh) | 基于多边形的遥感影像建筑物提取方法、装置及存储介质 | |
CN111598213B (zh) | 网络训练方法、数据识别方法、装置、设备和介质 | |
CN112749666B (zh) | 一种动作识别模型的训练及动作识别方法与相关装置 | |
CN111160350A (zh) | 人像分割方法、模型训练方法、装置、介质及电子设备 | |
CN111259812B (zh) | 基于迁移学习的内河船舶重识别方法、设备及存储介质 | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN115471670A (zh) | 一种基于改进yolox网络模型的空间目标检测方法 | |
CN113128478A (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
CN112132278A (zh) | 模型压缩方法、装置、计算机设备及存储介质 | |
CN113505797A (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN113240071A (zh) | 图神经网络处理方法、装置、计算机设备及存储介质 | |
CN111652181A (zh) | 目标跟踪方法、装置及电子设备 | |
CN111783935B (zh) | 卷积神经网络构建方法、装置、设备及介质 | |
CN113705749A (zh) | 基于深度学习的二维码识别方法、装置、设备及存储介质 | |
CN113011531A (zh) | 分类模型训练方法、装置、终端设备及存储介质 | |
CN113283388B (zh) | 活体人脸检测模型的训练方法、装置、设备及存储介质 | |
CN114626524A (zh) | 目标业务网络确定方法、业务处理方法及装置 | |
CN116206212A (zh) | 一种基于点特征的sar图像目标检测方法及系统 | |
CN113887346A (zh) | 基于人工智能的线段识别方法、装置、设备及存储介质 | |
CN116362301A (zh) | 一种模型的量化方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |