CN117115614B - 户外影像的对象识别方法、装置、设备及存储介质 - Google Patents

户外影像的对象识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117115614B
CN117115614B CN202311363369.4A CN202311363369A CN117115614B CN 117115614 B CN117115614 B CN 117115614B CN 202311363369 A CN202311363369 A CN 202311363369A CN 117115614 B CN117115614 B CN 117115614B
Authority
CN
China
Prior art keywords
image
object recognition
data
outdoor
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311363369.4A
Other languages
English (en)
Other versions
CN117115614A (zh
Inventor
侯俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ape Man Innovation Technology Co ltd
Original Assignee
Shenzhen Ape Man Innovation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ape Man Innovation Technology Co ltd filed Critical Shenzhen Ape Man Innovation Technology Co ltd
Priority to CN202311363369.4A priority Critical patent/CN117115614B/zh
Publication of CN117115614A publication Critical patent/CN117115614A/zh
Application granted granted Critical
Publication of CN117115614B publication Critical patent/CN117115614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/38Outdoor scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及数据处理的技术领域,公开了一种户外影像的对象识别方法、装置、设备及存储介质。所述户外影像的对象识别方法包括:获取数据库中预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;本发明不仅可以实现高效的对象识别,还可以对识别结果进行分类,得到具体的目标对象识别结果。本发明提供了一种在多变户外环境下,实现高效、准确和鲁棒性高的物体识别和定位的方法,具有较强的实用价值和广泛的应用前景。

Description

户外影像的对象识别方法、装置、设备及存储介质
技术领域
本发明涉及数据处理的技术领域,尤其涉及一种户外影像的对象识别方法、装置、设备及存储介质。
背景技术
随着计算机视觉技术的不断进步,图像识别和物体定位已经成为了许多应用领域的核心技术。在传统的图像识别流程中,往往需要进行多个预处理步骤,如去噪、亮度和对比度调整等,以改善图像的质量和增强特征的可识别性。然而,这些手动设定的预处理步骤可能并不适应所有的环境和条件,尤其是在复杂的户外环境中,由于光线、天气和其他外部因素的影响,图像可能会存在大量的噪声和失真。
此外,物体的识别和定位不仅仅依赖于其外观特征,还涉及其几何形状、运动状态和与其他物体的空间关系等多种信息。然而,许多现有的图像识别方法往往只能处理其中的一部分信息,而忽略了其他的重要特征,这导致了在实际应用中的识别率和准确性有所限制。
目前,尽管已有不少图像识别技术在实际应用中取得了一定的效果,但如何在户外多变的环境中实现高效、准确的物体识别,同时充分利用图像中的所有特征信息,仍然是一个亟待解决的技术难题。
发明内容
本发明提供了一种户外影像的对象识别方法、装置、设备及存储介质,用于解决如何通过利用图像中的所有特征信息在户外多变的环境中实现高效、准确的物体识别的技术问题。
本发明第一方面提供了一种户外影像的对象识别方法,所述户外影像的对象识别方法包括:
获取数据库中预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到。
可选的,在本发明第一方面的第一种实现方式中,所述对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据,包括:
从预存的图像算法脚本池中查寻各个脚本的记号集;其中,所述图像算法脚本池包含多个图像分析脚本,每个脚本配备相应的记号集,每个记号集包含多个记号字符;
获取当前时间标签信息中的年和月,根据年和月组建相应的图像编码对应表;其中,所述图像编码对应表通过基于年和月重新解码的标准图像编码对应表得到;
对每个记号集中的记号字符,根据图像编码对应表进行解码,获得每个记号集对应的解码字符集;
根据图像数据库中存储的字符与图像特征参数类型间的对照关系,得到每个解码字符集对应的特征参数类型解码集;
从解码后的特征参数类型集中挑选出包含全部所需图像分析参数的组作为目标特征参数类型解码集; 将目标特征参数类型解码集对应的脚本选为自然环境图像预取样脚本;
根据预取样脚本,将各个图像特征参数信息输入至预取样脚本中,并计算各个图像特征参数信息所在的标准区间;
将各个图像特征参数信息所在的标准区间分别作为单一元素加入到同一集结中,构成一个标准区间集;
基于预设的调优算法,对标准区间集中的各个图像特征参数信息进行优化处理,得到目标环境图像。
可选的,在本发明第一方面的第二种实现方式中,所述物体识别模型的训练过程,包括:
获取户外图像数据,并获取与物体相互作用的环境因素数据;
对户外图像数据进行特征提取,得到物体特征向量;对环境因素数据进行特征提取,得到环境特征向量;将所述物体特征向量和所述环境特征向量进行拼接处理,生成第一训练特征向量;并对所形成的第一训练特征向量进行标记,生成第一训练样本数据集;
构建物体识别模型,并将第一训练样本数据集输入到物体识别模型中,通过卷积网络进行特征学习,得到第一物体识别向量;其中,所述物体识别模型由五层卷积网络、七层池化层、四层残差层以及非线性激活函数层组成;
结合户外图像数据,对第一物体识别向量进行优化,生成第二物体识别向量;将第二物体识别向量输入物体识别模型的池化层进行训练,得到对应的第二物体特征向量;
将环境特征向量与第二物体特征向量进行拼接,生成第三物体特征向量;将第三物体特征向量输入到物体识别模型的残差层进行训练,得到第三物体识别向量;
通过不断调整物体识别模型中的参数,直至物体识别模型第一训练样本数据集在激活函数层收敛,得到最终的物体识别模型。
可选的,在本发明第一方面的第三种实现方式中,所述户外图像数据至少包括建筑物、道路、人行道、绿化带,所述环境因素数据至少包括温度、气压、湿度、风力、晴朗度、噪声、声音方向、风、水流。
可选的,在本发明第一方面的第四种实现方式中,所述对所述初步的对象识别结果进行分类,得到目标对象识别结果,包括:
采集初步的对象识别结果,并基于所述初步的对象识别结果确定最优的聚类数量;
通过预设的降维算法对初步的对象识别结果进行降维处理,并从降维后的结果中选取出初始聚类中心;
基于预设的物理计算公式,计算每个识别对象在特征空间中与所有初始聚类中心的距离;并根据计算出的距离值,将每个识别对象分配到最近的初始聚类中心所在的类别,形成分类结果;
在每个类别中,计算所有对象特征向量的最大值,将所述最大值设置为新的聚类中心,并进行动态的聚类中心更新;
构建一个自适应的迭代环境,在所述自适应的迭代环境中不断更新初始聚类中心,并自动调整迭代次数,直至达到预设的最大迭代次数,得到最终的聚类中心;
根据最终的聚类中心,将每个识别对象划入相应的类别,得到目标对象识别结果,并给予目标对象识别结果对应的类别标签。
本发明第二方面提供了一种户外影像的对象识别装置,所述户外影像的对象识别装置包括:
获取模块,用于获取数据库中的预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
处理模块,用于对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
融合模块,用于分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
分类模块,用于将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到。
本发明第三方面提供了一种户外影像的对象识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述户外影像的对象识别设备执行上述的户外影像的对象识别方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的户外影像的对象识别方法。
本发明提供的技术方案中,有益效果:本发明提供一种户外影像的对象识别方法、装置、设备及存储介质。通过获取数据库中预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据; 分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果。本发明通过获取数据库中的环境参数,并根据这些参数对户外环境图像进行自适应的预处理,确保了在不同的户外环境下,都可以得到高质量的图像数据。这样不仅增强了系统的通用性,还确保了图像数据在后续的特征提取和识别过程中的准确性和有效性。并且能够从图像数据中提取多种特征数据,包括色彩信息、外观特征、几何信息、运动信息和空间关系信息。这确保了系统不仅仅依赖于单一的图像特征,而是综合考虑多种特征,大大提高了物体识别的精度和鲁棒性。然后通过预设的目标向量融合算法,将多个特征向量进行有效的融合,得到一个综合的目标特征向量。这样的处理方式进一步确保了特征的全面性和代表性,为后续的物体识别提供了更为准确和稳定的数据基础。最后将综合的目标特征向量输入到提前训练得到的物体识别模型中,不仅可以实现高效的对象识别,还可以对识别结果进行分类,得到具体的目标对象识别结果。
附图说明
图1为本发明实施例中户外影像的对象识别方法的一个实施例示意图;
图2为本发明实施例中户外影像的对象识别装置的一个实施例示意图。
具体实施方式
本发明实施例提供了一种户外影像的对象识别方法、装置、设备及存储介质。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中户外影像的对象识别方法的一个实施例包括:
步骤101、获取数据库中预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
可以理解的是,本发明的执行主体可以为户外影像的对象识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
具体的,要实现获取数据库中预先存储的环境参数,并通过目标设备对应环境参数类型的户外环境进行图像采集,可以按照以下步骤进行:
连接数据库:首先,通过网络连接或相应的数据库驱动程序,建立与数据库之间的连接。这可以使用数据库提供的客户端库或开发框架来实现。
查询环境参数:使用结构化查询语言(SQL)或类似的查询语言编写查询语句,以从数据库中获取预先存储的环境参数数据。可以使用SELECT语句指定需要检索的字段和条件,以筛选所需的环境参数数据。
解析查询结果:当查询执行成功后,数据库将返回结果集。根据查询所返回的结果集的格式,可以使用相应的数据解析技术(例如,使用JSON解析器或数据映射工具)将结果集解析为可操作的数据结构。
配置目标设备:根据环境参数的类型,对目标设备进行适当的配置,确保它可以采集与所需环境参数类型相对应的户外图像数据。例如,如果要采集温度和湿度数据,则可能需要连接相应的传感器并设置传感器参数。
进行图像采集:使用目标设备进行户外图像采集。这可能涉及使用相机或传感器等设备,以及执行必要的操作(例如配置图像分辨率、设置图像采样率等),以获取高质量的户外图像数据。
步骤102、对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
具体的,可以按照以下步骤进行:
去噪:a. 根据获取的户外图像数据,使用中值滤波算法对图像进行去噪处理。中值滤波算法通过计算像素的邻域内的中值来消除噪声。
亮度调整:a. 基于图像直方图分析,确定图像的平均亮度水平。通过计算直方图的均值得到平均亮度值。 b. 使用对比度拉伸算法,对图像进行亮度调整。对比度拉伸算法可以根据像素的当前亮度值和平均亮度值来调整像素的亮度。
对比度调整:a. 使用自适应直方图均衡化算法对图像进行对比度调整。该算法可以根据图像的局部特征对图像进行局部对比度增强。
优化处理:a. 基于边缘增强算法,对自适应预处理后的图像数据进行边缘增强。边缘增强算法可以通过突出图像的边缘细节来提高图像质量。 b. 使用去除图像伪影的算法,对图像数据进行伪影去除。这可以通过检测和修复图像中由光照条件引起的伪影来实现。
步骤103、分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
具体的,可以按照以下步骤进行:
第一特征数据提取:基于图像处理算法,从目标图像中提取色彩信息和外观特征信息。这可以通过计算图像的颜色分布、纹理特征或使用特定的特征提取器(如SIFT、SURF等)来实现。
第二特征数据提取:使用计算机视觉技术从目标图像中提取几何信息。这可以通过检测图像中物体的边缘、角点或应用特定的几何变换等方法来实现。
第三特征数据提取:通过图像处理和运动分析技术,从目标图像中提取物体的运动信息和空间关系信息。例如,可以使用光流法或背景建模方法来估计物体的运动轨迹和运动速度。
第一特征向量生成:根据第一特征数据,将提取到的色彩信息和外观特征信息转化为一个特征向量。这可以通过将颜色分布转化为直方图或计算纹理特征的统计值等方法来实现。
第二特征向量生成:基于第二特征数据,将提取到的几何信息转化为一个特征向量。这可以通过计算边缘或角点的数量、应用几何变换的参数等来构建特征向量。
第三特征向量生成:根据第三特征数据,将提取到的运动信息和空间关系信息转化为一个特征向量。可以使用光流向量或描述物体运动轨迹的特征参数作为第三特征向量。
目标特征向量融合:使用预设的目标向量融合算法,将第一特征向量、第二特征向量和第三特征向量进行融合。这可以通过计算特征向量之间的相似性、加权累加或使用神经网络等方法来实现。
步骤104、将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到。
具体的,训练后的物体识别模型:在预先训练阶段,使用大量的标注图像数据训练物体识别模型,例如卷积神经网络(CNN)。该模型可以学习图像的特征表示和对象分类能力。
目标特征向量输入:将之前提取的目标特征向量作为输入,输入到训练后的物体识别模型中。目标特征向量包含从目标图像中提取的色彩、外观特征、几何特征和运动空间关系等信息。
对象识别和物体定位:通过训练后的物体识别模型,对目标特征向量进行对象识别和物体定位。模型将对输入的特征向量进行分析和处理,并根据先前学习到的知识对图像进行分类和定位。
初步对象识别结果:根据模型的输出,得到初步的对象识别结果。这可以是一个对象标签或对象类别的置信度分布。该结果反映了模型对输入特征向量的判断和分类能力。
目标对象识别结果:对初步的对象识别结果进行分类,得到最终的目标对象识别结果。这可以通过设定阈值或使用多类别分类器来实现。分类结果可以是一个确定的对象标签或一组可能的对象类别。
本发明实施例中户外影像的对象识别方法的另一个实施例包括:
所述对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据,包括:
从预存的图像算法脚本池中查寻各个脚本的记号集;其中,所述图像算法脚本池包含多个图像分析脚本,每个脚本配备相应的记号集,每个记号集包含多个记号字符;
获取当前时间标签信息中的年和月,根据年和月组建相应的图像编码对应表;其中,所述图像编码对应表通过基于年和月重新解码的标准图像编码对应表得到;
对每个记号集中的记号字符,根据图像编码对应表进行解码,获得每个记号集对应的解码字符集;
根据图像数据库中存储的字符与图像特征参数类型间的对照关系,得到每个解码字符集对应的特征参数类型解码集;
从解码后的特征参数类型集中挑选出包含全部所需图像分析参数的组作为目标特征参数类型解码集; 将目标特征参数类型解码集对应的脚本选为自然环境图像预取样脚本;
根据预取样脚本,将各个图像特征参数信息输入至预取样脚本中,并计算各个图像特征参数信息所在的标准区间;
将各个图像特征参数信息所在的标准区间分别作为单一元素加入到同一集结中,构成一个标准区间集;
基于预设的调优算法,对标准区间集中的各个图像特征参数信息进行优化处理,得到目标环境图像。
具体的,此实施例涉及将户外图像数据进行自适应预处理并优化处理的具体方法,包括以下步骤:
先从预存的图像算法脚本池中查寻各个脚本的记号集。图像算法脚本池是一个包含多个图像分析脚本的资源库,其中每个脚本都配备相应的记号集。每个记号集包含多个记号字符,这些记号字符代表具体的图像处理功能或者参数。
接下来,获取当前时间标签信息中的年和月。这些时间信息被用来组建一个图像编码对应表。该对应表通过基于年和月重新解码的标准图像编码对应表得到。通过一种基于时间的自适应算法来进行图像处理。
对每个记号集中的记号字符,根据图像编码对应表进行解码,从而得到每个记号集对应的解码字符集。解码字符集则是包含解码后记号的集合。
然后,根据存储在图像数据库中的字符与图像特征参数类型间的对照关系,得到每个解码字符集对应的特征参数类型解码集。这一步将解码字符映射到相应的图像特征参数类型。
对解码后的特征参数类型集进行筛选,挑选出包含全部所需图像分析参数的组作为目标特征参数类型解码集。从多个特征参数组合中,选择了一组最佳的参数用于图像处理。
将目标特征参数类型解码集对应的脚本选为自然环境图像预取样脚本。
接下来,系统根据预取样脚本,将各个图像特征参数信息输入至预取样脚本中,并计算各个图像特征参数信息所在的标准区间。标准区间是一个预定义的范围,用于确定所选参数的有效性和适用性。
将各个图像特征参数信息所在的标准区间分别作为单一元素加入到同一集结中,构成一个标准区间集。是一种用于进一步选择和优化参数的策略。
最后,基于预设的优化算法,对标准区间集中的各个图像特征参数信息进行优化处理,最终得到目标环境图像。
本发明实施例中,有益效果:本发明实施例为图像处理的步骤和参数都以一种自适应的方式进行调整,以适应不同的户外环境和条件。这种方法可以提高图像分析的精准度和灵活性,从而在多种应用场景下提供优化的图像处理服务。自适应预处理阶段可以针对不同图像的特点进行灵活处理,提高后续优化处理的效果。基于解码和特征参数类型集,可以选择目标特征参数类型解码集,并相应选择适合的脚本进行预取样。通过基于预设的调优算法对标准区间集进行优化处理,可以获得最优化的目标环境图像。
本发明实施例中户外影像的对象识别方法另一个实施例包括:
所述物体识别模型的训练过程,包括:
获取户外图像数据,并获取与物体相互作用的环境因素数据;
对户外图像数据进行特征提取,得到物体特征向量;对环境因素数据进行特征提取,得到环境特征向量;将所述物体特征向量和所述环境特征向量进行拼接处理,生成第一训练特征向量;并对所形成的第一训练特征向量进行标记,生成第一训练样本数据集;
构建物体识别模型,并将第一训练样本数据集输入到物体识别模型中,通过卷积网络进行特征学习,得到第一物体识别向量;其中,所述物体识别模型由五层卷积网络、七层池化层、四层残差层以及非线性激活函数层组成;
结合户外图像数据,对第一物体识别向量进行优化,生成第二物体识别向量;将第二物体识别向量输入物体识别模型的池化层进行训练,得到对应的第二物体特征向量;
将环境特征向量与第二物体特征向量进行拼接,生成第三物体特征向量;将第三物体特征向量输入到物体识别模型的残差层进行训练,得到第三物体识别向量;
通过不断调整物体识别模型中的参数,直至物体识别模型第一训练样本数据集在激活函数层收敛,得到最终的物体识别模型。
具体的,本实施例详述了物体识别模型的训练过程,具体包括以下步骤:
首先,收集户外图像数据,同时,获取与物体交互的环境因素数据。这涉及到不同数据源的联合处理,以用于后续的分析和特征提取。
对于取得的户外图像数据,进行特征提取,得到物体特征向量。使用对于图像数据特异性的特征提取算法,提取出反映物体的主要信息。资源环境因素数据也同样接受特征提取,得到环境特征向量。依据此处的环境特征向量可能包括温度、湿度、光照条件等与物体识别有关的信息。
接着,物体特征向量与环境特征向量进行拼接处理,生成第一训练特征向量。此步骤是为了整合包含物体主要特征以及环境因素对物体影响特性的相关信息,形成一个更富信息量的特征表示。随后,将所形成的第一训练特征向量进行标记,生成第一训练样本数据集。
构建物体识别模型,其中包含五层卷积网络、七层池化层、四层残差层以及非线性激活函数层。这样的模型结构可以充分利用特征向量中的信息,并进行必要的特征转换与提取。然后,将第一训练样本数据集输入到物体识别模型中,通过卷积网络进行特征学习,得到第一物体识别向量。
结合户外图像数据,对第一物体识别向量进行优化,生成第二物体识别向量。这是一个反馈或迭代过程,优化过程反映在增强识别向量的阶段,使其在处理复杂户外环境下物体识别的任务更具效能。此后,将第二物体识别向量输入物体识别模型的池化层进行训练,得到对应的第二物体特征向量。
同样地,将环境特征向量与第二物体特征向量再次进行拼接,生成第三物体特征向量。这个过程确保模型可以充分学习并利用相关环境因素的信息进行物体识别。
接着,将第三物体特征向量输入到物体识别模型的残差层进行训练,得到第三物体识别向量。在这个步骤中,残差层的存在可以帮助模型更好地进行对特征的提取,并有利于模型对复杂的物体特征进行学习与识别。
最后,物体识别模型中的参数将不断调整,直至模型在激活函数层对第一训练样本数据集收敛,从而得到最终的物体识别模型。这个收敛过程是验证模型训练效果的关键步骤,当模型收敛时,代表模型已经学习并掌握了训练数据的主要特性,并能在新的数据上获得可靠的识别表现。
本发明实施例中,有益效果:在训练物体识别模型的过程中,通过提取图像和环境的特征信息,并结合卷积网络和残差层等深度学习技术,模型能够学习到更有效的物体特征表示。通过不断优化模型参数,使模型在训练样本数据集上逐渐收敛,从而达到准确识别物体的目的。
本发明实施例中户外影像的对象识别方法另一个实施例包括:所述户外图像数据至少包括建筑物、道路、人行道、绿化带,所述环境因素数据至少包括温度、气压、湿度、风力、晴朗度、噪声、声音方向、风、水流。
本发明实施例中户外影像的对象识别方法另一个实施例包括:
所述对所述初步的对象识别结果进行分类,得到目标对象识别结果,包括:
采集初步的对象识别结果,并基于所述初步的对象识别结果确定最优的聚类数量;
通过预设的降维算法对初步的对象识别结果进行降维处理,并从降维后的结果中选取出初始聚类中心;
基于预设的物理计算公式,计算每个识别对象在特征空间中与所有初始聚类中心的距离;并根据计算出的距离值,将每个识别对象分配到最近的初始聚类中心所在的类别,形成分类结果;
在每个类别中,计算所有对象特征向量的最大值,将所述最大值设置为新的聚类中心,并进行动态的聚类中心更新;
构建一个自适应的迭代环境,在所述自适应的迭代环境中不断更新初始聚类中心,并自动调整迭代次数,直至达到预设的最大迭代次数,得到最终的聚类中心;
根据最终的聚类中心,将每个识别对象划入相应的类别,得到目标对象识别结果,并给予目标对象识别结果对应的类别标签。
具体的,本实施例详细描述了对初步的对象识别结果进行分类,得到目标对象识别结果的具体方法,具体步骤如下:
首先,采集初步的对象识别结果。基于所采集到的初步对象识别结果,使用适当的方法如Elbow方法或者Silhouette方法确定最优的聚类数量,这一环节为后续聚类分析提供基础。
接下来,通过预设的降维算法(如主成分分析PCA或者t-SNE等)对初步的对象识别结果进行降维处理。降维过程能够减少数据的复杂性,使其更容易处理。在降维后的结果中选取初始聚类中心,例如采用K-means++初始化方法提高初始聚类中心的选择效率。
基于预设的物理计算公式,比如欧氏距离或余弦相似度,计算每个识别对象在特征空间中与所有初始聚类中心的距离。然后,根据计算出的距离值,将每个识别对象分配到最近的初始聚类中心所在的类别,通过这一过程形成分类结果。
在每个类别中,计算所有对象特征向量的最大值,并将这个最大值设置为新的聚类中心,这是动态的聚类中心更新过程,有助于更精确地确定每类的中心。
在此基础上,构建一个自适应的迭代环境,此环境的设定是用于更有效地进行聚类中心的更新。在这个自适应的迭代环境中,不断更新初始聚类中心,并自动调整迭代次数,直至达到预设的最大迭代次数,从而得到最终的聚类中心。通过不断的更新和优化,最终达到更精确的分类效果。
最后,根据最终的聚类中心,将每个识别对象划入相应的类别,得到目标对象识别结果,并根据结果给予目标对象识别相应的类别标签。这是分类结果的产出阶段,可供对下一步的物体识别和跟踪等决策提供支持。
上面对本发明实施例中户外影像的对象识别方法进行了描述,下面对本发明实施例中户外影像的对象识别装置进行描述,请参阅图2,本发明实施例中户外影像的对象识别装置一个实施例包括:
获取模块,用于获取数据库中的预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
处理模块,用于对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
融合模块,用于分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
分类模块,用于将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到。
本发明还提供一种户外影像的对象识别设备,所述户外影像的对象识别设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述户外影像的对象识别方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述户外影像的对象识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种户外影像的对象识别方法,其特征在于,包括以下步骤:
获取数据库中预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到;
所述对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据,包括:
从预存的图像算法脚本池中查寻各个脚本的记号集;其中,所述图像算法脚本池包含多个图像分析脚本,每个脚本配备相应的记号集,每个记号集包含多个记号字符;
获取当前时间标签信息中的年和月,根据年和月组建相应的图像编码对应表;其中,所述图像编码对应表通过基于年和月重新解码的标准图像编码对应表得到;
对每个记号集中的记号字符,根据图像编码对应表进行解码,获得每个记号集对应的解码字符集;
根据图像数据库中存储的字符与图像特征参数类型间的对照关系,得到每个解码字符集对应的特征参数类型解码集;
从解码后的特征参数类型集中挑选出包含全部所需图像分析参数的组作为目标特征参数类型解码集; 将目标特征参数类型解码集对应的脚本选为自然环境图像预取样脚本;
根据预取样脚本,将各个图像特征参数信息输入至预取样脚本中,并计算各个图像特征参数信息所在的标准区间;
将各个图像特征参数信息所在的标准区间分别作为单一元素加入到同一集结中,构成一个标准区间集;
基于预设的调优算法,对标准区间集中的各个图像特征参数信息进行优化处理,得到目标环境图像。
2.根据权利要求1所述的对象识别方法,其特征在于,所述物体识别模型的训练过程,包括:
获取户外图像数据,并获取与物体相互作用的环境因素数据;
对户外图像数据进行特征提取,得到物体特征向量;对环境因素数据进行特征提取,得到环境特征向量;将所述物体特征向量和所述环境特征向量进行拼接处理,生成第一训练特征向量;并对所形成的第一训练特征向量进行标记,生成第一训练样本数据集;
构建物体识别模型,并将第一训练样本数据集输入到物体识别模型中,通过卷积网络进行特征学习,得到第一物体识别向量;其中,所述物体识别模型由五层卷积网络、七层池化层、四层残差层以及非线性激活函数层组成;
结合户外图像数据,对第一物体识别向量进行优化,生成第二物体识别向量;将第二物体识别向量输入物体识别模型的池化层进行训练,得到对应的第二物体特征向量;
将环境特征向量与第二物体特征向量进行拼接,生成第三物体特征向量;将第三物体特征向量输入到物体识别模型的残差层进行训练,得到第三物体识别向量;
通过不断调整物体识别模型中的参数,直至物体识别模型第一训练样本数据集在激活函数层收敛,得到最终的物体识别模型。
3.根据权利要求2所述的对象识别方法,其特征在于,所述户外图像数据至少包括建筑物、道路、人行道、绿化带,所述环境因素数据至少包括温度、气压、湿度、风力、晴朗度、噪声、声音方向、风、水流。
4.根据权利要求1所述的对象识别方法,其特征在于,所述对所述初步的对象识别结果进行分类,得到目标对象识别结果,包括:
采集初步的对象识别结果,并基于所述初步的对象识别结果确定最优的聚类数量;
通过预设的降维算法对初步的对象识别结果进行降维处理,并从降维后的结果中选取出初始聚类中心;
基于预设的物理计算公式,计算每个识别对象在特征空间中与所有初始聚类中心的距离;并根据计算出的距离值,将每个识别对象分配到最近的初始聚类中心所在的类别,形成分类结果;
在每个类别中,计算所有对象特征向量的最大值,将所述最大值设置为新的聚类中心,并进行动态的聚类中心更新;
构建一个自适应的迭代环境,在所述自适应的迭代环境中不断更新初始聚类中心,并自动调整迭代次数,直至达到预设的最大迭代次数,得到最终的聚类中心;
根据最终的聚类中心,将每个识别对象划入相应的类别,得到目标对象识别结果,并给予目标对象识别结果对应的类别标签。
5.一种户外影像的对象识别装置,其特征在于,所述户外影像的对象识别装置包括:
获取模块,用于获取数据库中的预先存储的环境参数;通过目标设备对与所述环境参数的类型相对应的户外环境进行图像采集,得到户外图像数据;
处理模块,用于对所述户外图像数据进行自适应预处理,并基于预设的优化算法对自适应预处理后的户外图像数据进行优化处理,得到目标图像数据;其中,所述自适应预处理至少包括去噪、亮度和对比度调整;
融合模块,用于分别提取目标图像数据中的第一特征数据、第二特征数据、第三特征数据,根据所述第一特征数据生成第一特征向量,并根据所述第二特征数据生成第二特征向量,以及根据所述第三特征数据生成第三特征向量;通过预设的目标向量融合算法将所述第一特征向量、所述第二特征向量和所述第三特征向量进行融合,得到目标特征向量;其中,所述第一特征数据表示图像中物体的色彩信息、外观特征信息;所述第二特征数据表示图像中物体的几何信息;所述第三特征数据表示图像中物体的运动信息、空间关系信息;
分类模块,用于将所述目标特征向量输入至训练后的物体识别模型进行对象识别和物体定位,得到初步的对象识别结果,并对所述初步的对象识别结果进行分类,得到目标对象识别结果;其中,所述物体识别模型经过提前训练得到;
处理模块,具体用于:
从预存的图像算法脚本池中查寻各个脚本的记号集;其中,所述图像算法脚本池包含多个图像分析脚本,每个脚本配备相应的记号集,每个记号集包含多个记号字符;
获取当前时间标签信息中的年和月,根据年和月组建相应的图像编码对应表;其中,所述图像编码对应表通过基于年和月重新解码的标准图像编码对应表得到;
对每个记号集中的记号字符,根据图像编码对应表进行解码,获得每个记号集对应的解码字符集;
根据图像数据库中存储的字符与图像特征参数类型间的对照关系,得到每个解码字符集对应的特征参数类型解码集;
从解码后的特征参数类型集中挑选出包含全部所需图像分析参数的组作为目标特征参数类型解码集; 将目标特征参数类型解码集对应的脚本选为自然环境图像预取样脚本;
根据预取样脚本,将各个图像特征参数信息输入至预取样脚本中,并计算各个图像特征参数信息所在的标准区间;
将各个图像特征参数信息所在的标准区间分别作为单一元素加入到同一集结中,构成一个标准区间集;
基于预设的调优算法,对标准区间集中的各个图像特征参数信息进行优化处理,得到目标环境图像。
6.一种户外影像的对象识别设备,其特征在于,所述户外影像的对象识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述户外影像的对象识别设备执行如权利要求1-4中任一项所述的户外影像的对象识别方法。
7.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-4中任一项所述的户外影像的对象识别方法。
CN202311363369.4A 2023-10-20 2023-10-20 户外影像的对象识别方法、装置、设备及存储介质 Active CN117115614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311363369.4A CN117115614B (zh) 2023-10-20 2023-10-20 户外影像的对象识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311363369.4A CN117115614B (zh) 2023-10-20 2023-10-20 户外影像的对象识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117115614A CN117115614A (zh) 2023-11-24
CN117115614B true CN117115614B (zh) 2024-01-16

Family

ID=88796918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311363369.4A Active CN117115614B (zh) 2023-10-20 2023-10-20 户外影像的对象识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117115614B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117460128B (zh) * 2023-12-20 2024-03-19 东莞市钜欣电子有限公司 基于多维数据分析的光罩调光控制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298709A (zh) * 2011-09-07 2011-12-28 江西财经大学 复杂环境下多特征融合的节能型智能识别数字标牌
CN107292339A (zh) * 2017-06-16 2017-10-24 重庆大学 基于特征融合的无人机低空遥感影像高分地貌分类方法
CN108320735A (zh) * 2018-01-23 2018-07-24 北京易智能科技有限公司 一种多数据融合的情感识别方法及系统
CN116311078A (zh) * 2023-05-11 2023-06-23 四川三思德科技有限公司 一种林火分析及监测方法、系统
CN116343284A (zh) * 2022-12-19 2023-06-27 四川农业大学 基于注意力机制的多特征户外环境情绪识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114766039A (zh) * 2019-12-12 2022-07-19 Oppo广东移动通信有限公司 对象检测方法、对象检测设备、终端设备、以及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298709A (zh) * 2011-09-07 2011-12-28 江西财经大学 复杂环境下多特征融合的节能型智能识别数字标牌
CN107292339A (zh) * 2017-06-16 2017-10-24 重庆大学 基于特征融合的无人机低空遥感影像高分地貌分类方法
CN108320735A (zh) * 2018-01-23 2018-07-24 北京易智能科技有限公司 一种多数据融合的情感识别方法及系统
CN116343284A (zh) * 2022-12-19 2023-06-27 四川农业大学 基于注意力机制的多特征户外环境情绪识别方法
CN116311078A (zh) * 2023-05-11 2023-06-23 四川三思德科技有限公司 一种林火分析及监测方法、系统

Also Published As

Publication number Publication date
CN117115614A (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
CN111768432B (zh) 基于孪生深度神经网络的动目标分割方法及系统
CN113449594B (zh) 一种多层网络组合的遥感影像地类语义分割与面积计算方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN111178120B (zh) 一种基于作物识别级联技术的害虫图像检测方法
CN111652317B (zh) 基于贝叶斯深度学习的超参数图像分割方法
CN111079847B (zh) 一种基于深度学习的遥感影像自动标注方法
CN111310662B (zh) 一种基于集成深度网络的火焰检测识别方法及系统
CN117115614B (zh) 户外影像的对象识别方法、装置、设备及存储介质
CN110399895A (zh) 图像识别的方法和装置
CN115061769B (zh) 用于支持跨分辨率的自迭代rpa界面元素匹配方法及系统
CN114170608A (zh) 超分辨文本图像识别方法、装置、设备及存储介质
CN113435240A (zh) 一种端到端的表格检测和结构识别方法及系统
CN115116074A (zh) 一种手写体文字识别、及模型训练方法和装置
CN113269182A (zh) 一种基于变体transformer对小区域敏感的目标果实检测方法及系统
CN114333062B (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN116563410A (zh) 基于两级生成对抗网络的电气设备电火花图像生成方法
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN113920494A (zh) 一种基于transformer的车牌字符识别方法
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN114708645A (zh) 物件辨识装置及物件辨识方法
CN112418262A (zh) 车辆再识别的方法、客户端及系统
CN114283431B (zh) 一种基于可微分二值化的文本检测方法
CN113378598A (zh) 一种基于深度学习的动态条码检测方法
Rani et al. Object Detection in Natural Scene Images Using Thresholding Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant