CN115375944A - 确定图像中目标对象资源量的方法、装置、计算机设备 - Google Patents

确定图像中目标对象资源量的方法、装置、计算机设备 Download PDF

Info

Publication number
CN115375944A
CN115375944A CN202211033864.4A CN202211033864A CN115375944A CN 115375944 A CN115375944 A CN 115375944A CN 202211033864 A CN202211033864 A CN 202211033864A CN 115375944 A CN115375944 A CN 115375944A
Authority
CN
China
Prior art keywords
sample
size area
target object
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211033864.4A
Other languages
English (en)
Inventor
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou HYC Technology Co Ltd
Original Assignee
Suzhou HYC Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou HYC Technology Co Ltd filed Critical Suzhou HYC Technology Co Ltd
Priority to CN202211033864.4A priority Critical patent/CN115375944A/zh
Publication of CN115375944A publication Critical patent/CN115375944A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及确定图像中目标对象资源量的方法。所述方法包括:获取待处理的图像;将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。采用本方法能够可以快速得到目标对象的资源量。

Description

确定图像中目标对象资源量的方法、装置、计算机设备
技术领域
本申请涉及图像处理领域,特别是涉及一种确定图像中目标对象资源量的方法、装置、计算机设备。
背景技术
随着制图软件的发展,目前大多数的图纸都利用制图软件完成,工程师可以在图纸上标注零件的名称、类别、长度等。一般,根据图纸上的标注计算对应的材料用量以及费用。
相关技术中,采用人工采集判断图纸内容的方式得到图纸上的标注信息,根据图纸上的标注信息计算相应的材料用量以及费用,最后汇总成资源量清单交付给需要的客户。人工识别的方法不仅依赖工程师的工作经验,而且自动化程度低,出错率高,效率低。
发明内容
基于此,有必要针对上述技术问题,提供了一种确定图像中目标对象资源量的方法、装置、计算机设备,可以自动识别出目标对象,并根据目标对象与资源量的关联关系,确定所述目标对象的资源量。
第一方面,本申请提供了一种确定图像中目标对象资源量的方法。所述方法包括:
获取待处理的图像;
将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到;
将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到;
根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
在其中一个实施例中,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
在其中一个实施例中,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
在其中一个实施例中,所述提取所述尺寸区域样本的目标对象包括:
识别所述尺寸区域样本中的目标对象,裁剪所述尺寸区域样本的目标对象,得到所述尺寸区域样本的目标对象。
在其中一个实施例中,所述待处理的图像为预设格式的图像。
第二方面,本申请还提供了一种确定图像中目标对象资源量的装置,所述装置包括:
获取模块,用于获取待处理的图像;
区域识别模块,用于将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到;
目标对象识别模块,用于将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到;
资源量获取模块,根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
在其中一个实施例中,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
在其中一个实施例中,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
在其中一个实施例中,所述提取所述尺寸区域样本的目标对象包括:
识别所述尺寸区域样本中的目标对象,裁剪所述尺寸区域样本的目标对象,得到所述尺寸区域样本的目标对象。
在其中一个实施例中,所述待处理的图像为预设格式的图像。
第三方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时确定图像中目标对象资源量的方法的步骤。
第四方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时确定图像中目标对象资源量的方法的步骤。
第五方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时确定图像中目标对象资源量的方法的步骤。
上述确定图像中目标对象资源量的方法,至少包括以下有益效果:
本公开提供的实施例方案,将待处理图像中的尺寸区域提取出来,根据目标对象对尺寸区域分类,根据尺寸区域的类别旋转尺寸区域,得到目标对象为水平方向的尺寸区域,便于目标对象识别模型识别得到所述尺寸区域中的目标对象,可以快速得到目标对象的资源量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
为了更清楚地说明本公开实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中确定图像中目标对象资源量的方法的应用环境图;
图2为一个实施例中确定图像中目标对象资源量的方法的流程示意图;
图3为一个实施例中待处理图像的示意图;
图4为一个实施例中尺寸区域的示意图;
图5为一个实施例中尺寸区域中的目标对象的示意图;
图6为一个实施例中目标对象的子标注信息的示意图;
图7为一个实施例中预设的标注区间与资源量的关联关系;
图8为一个实施例中确定图像中目标对象资源量的装置的结构框图;
图9为一个实施例中计算机设备的内部结构图;
图10为一个实施例中一种服务器的内部结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本公开实施例提供一种确定图像中目标对象资源量的方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在本公开的一些实施例中,如图2所示,提供了一种确定图像中目标对象资源量的方法,以该方法应用于图1中的服务器对图像进行处理为例进行说明。可以理解的是,该方法可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。具体的一个实施例中,所述方法可以包括以下步骤:
S202:获取待处理的图像。
本实施例中所述的待处理的图像通常可以包括目标对象的图像,图3为一个实施例中待处理图像的示意图。所述目标对象通常指需要识别的指定目标物的图像,如本实施例应用场景中的图纸上的标注尺寸,也可以为用于照片中的人物、容器中的物体等。所述待处理图像可以包括通过软件处理后截取出的图像,也可以是拍摄设备通过硬件或通信网络传输过来的图像,或者直接输入到处理设备的包含目标对象的图像。
S204:将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到。
图像样本可以是图纸、照片、画像等,在本公开的实施例中,图像样本可以是图纸。图4为一个实施例中尺寸区域的示意图,尺寸区域样本可以是包含目标对象的区域,目标对象可以是图像样本中的文字、线条等,文字可以包括标注尺寸、器件类型等。在本公开的实施例中,目标对象可以是图像样本中的标注尺寸,机械工程师在对图纸进行手动标注时,可能会直接按照线条的方向标注文字,因此图纸中文字的方向可能不都是水平的。文字的方向一般可以分为0°、45°、90°、135°,因此在对尺寸区域样本进行分类时,可以根据尺寸区域样本中目标对象的方向对尺寸区域样本分类,既能可以保证覆盖所有角度,又不会因类别过多而变得复杂。
尺寸区域识别模型可以采用一种或多种机器学习算法,以实现样本的训练和待处理的图像的识别。本公开的一些实施例中的尺寸区域识别模型可以选择目标检测算法,包括基于目标检测算法的改进、变形、变化、与其他机器学习算法的组合等。目标检测算法可以包括YOLOV5深度学习框架、Viola-Jones算法。
在本公开的实施例中,在使用尺寸区域识别模型预测前或模型使用以及更新中,可以根据预先构建的训练样本对模型进行训练,得到符合要求的尺寸区域识别模型,实现对待处理的图像进行识别处理后可以输出尺寸区域的标注信息。标注信息可以包括尺寸区域对应的类型。
S206:将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到。
图5为一个实施例中尺寸区域中的目标对象的示意图。尺寸区域样本的目标对象可能有多个,因此尺寸区域样本对应的类型可能也有多个。例如,在根据目标对象的方向进行分类的情况下,一个尺寸区域样本可以对应0°、45°、90°。目标对象的方向为0°时,可以不用旋转目标对象。目标对象的方向为45°、90°时,可以根据目标对象的类型相应的旋转对应的角度,可以保障所有的目标对象处于水平的状态,便于后期目标对象识别模型的识别。
在本公开的实施例中,目标对象识别模型可以选择PaddleOCR深度学习框架,PaddleOCR可以分为文本检测、文本识别和方向分类器三部分。根据预先构建的训练样本对模型进行训练,得到符合要求的目标对象识别模型,实现对待处理图的像进行识别处理后可以输出尺寸区域的标注信息。
在使用尺寸区域识别模型预测前或模型使用以及更新中,可以根据预先构建的训练样本对模型进行训练,得到符合要求的尺寸区域识别模型,实现对尺寸区域的标注信息处理后可以输出尺寸区域中的目标对象。尺寸区域中的目标对象可以包括文字、线条等。
S208:根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
图6为一个实施例中目标对象的子标注信息的示意图,图7为一个实施例中预设的标注区间与资源量的关联关系。目标对象的子标注信息可以包括标注尺寸、器件类型等。在待处理图像中可能包含多个目标对象,不同的目标对象的子标注信息可能是不同的,多个子标注信息可以对应一个标注区间。标注区间与资源量之间的关联关系可以根据产品或客户需求制定,可以确定出目标对象的资源量。
上述确定图像中目标对象资源量的方法中,可以提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,训练尺寸区域识别模型,可以得到尺寸区域的标注信息。尺寸区域的标注信息可以包括尺寸区域对应的类型,提取尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,可以将目标对象都归一化为水平方向,便于目标对象识别模型识别得到所述尺寸区域中的目标对象,可以快速得到目标对象的资源量。
在本公开的一些实施例中,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
对图像样本进行二值化处理,不仅可以方便提取待处理的图像中的信息,而且在识别过程中可以增加识别效率。在图像样本不是十分清晰的情况下,进行二值化处理时,部分图像块的灰度值可能被错误判别为0或255,可以再对二值化后的图像样本进行闭运算处理。闭运算处理可以填平二值化后图像样本内的小空隙,但不会改变总的位置和形状,得到第一格式的图像。可以对第一格式的图像和图像样本进行与运算处理。例如,当两幅图像的像素值相加结果小于等于255时,则输出图像直接赋值该结果,如果两幅图像的像素值相加结果大于255,直接赋值为255。根据上述得到的处理后的图像样本,可以更加精确的得到所述图像样本中的尺寸区域。
在本公开的一些实施例中,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
在本公开的实施例中,可以将尺寸区域样本做缩放处理,例如,缩放到640*640尺寸。在缩放过程中,可能图片会发生变形的情况,可以固定图像缩放的宽度,高度随着图像的比例变化,若缩放后的高度超出预设值,自动将超出的部分裁剪,若缩放后的高度小于预设值,自动将缺失的部分填充,得到对应尺寸的尺寸区域样本。可以将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到尺寸区域样本的特征。尺寸区域样本的特征可以包括尺寸区域样本中目标对象的方向,可以根据尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
在本公开的一些实施例中,所述提取所述尺寸区域样本的目标对象包括:
识别所述尺寸区域样本中的目标对象,裁剪所述尺寸区域样本的目标对象,得到所述尺寸区域样本的目标对象。
在一个尺寸区域样本中可以有多个目标对象,不同的目标对象可以对应不同的方向,因此尺寸区域样本对应的类型也可能为多个。在尺寸区域样本对应的类型为多个的情况下,在识别出尺寸区域样本的目标对象后,可以对尺寸区域样本的目标对象进行裁剪。可以对裁剪后的目标对象旋转,可以得到所有目标对象都是水平方向的尺寸区域样本。
在本公开的一些实施例中,所述待处理的图像为预设格式的图像。
在本公开的实施例中,待处理图像可以通过制图软件获得,在一些实施例中,选取的制图软件可以是CAD(Computer Aided Design),CAD可以用于二维和三维仿真,最后保存的图像为dwg格式,可以转换为常用的png、jpg格式,便于后续输入图片中进行识别。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的针对确定图像中目标对象资源量的方法的确定图像中目标对象资源量的装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的确定图像中目标对象资源量的装置实施例中的具体限定可以参见上文中对于确定图像中目标对象资源量的方法的限定,在此不再赘述。
所述装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思,本公开实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
在一个实施例中,如图8所示,提供了一种确定图像中目标对象资源量的装置800,所述装置可以为前述服务器,或者集成于所述服务器的模块、组件、器件、单元等。该装置800可以包括:
获取模块802,用于获取待处理的图像;
区域识别模块804,用于将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到;
目标对象识别模块806,用于将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到;
资源量获取模块808,根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
在一个实施例中,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
在一个实施例中,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
在一个实施例中,所述提取所述尺寸区域样本的目标对象包括:
识别所述尺寸区域样本中的目标对象,裁剪所述尺寸区域样本的目标对象,得到所述尺寸区域样本的目标对象。
在一个实施例中,所述待处理的图像为预设格式的图像。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述针对确定图像中目标对象资源量的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标对象。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种确定图像中目标对象资源量的方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现确定图像中目标对象资源量的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9、图10中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本公开任一实施例所述的方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本公开所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开构思的前提下,还可以做出若干变形和改进,这些都属于本公开的保护范围。因此,本公开的保护范围应以所附权利要求为准。

Claims (10)

1.一种确定图像中目标对象资源量的方法,其特征在于,所述方法包括:
获取待处理的图像;
将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到;
将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到;
根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
2.根据权利要求1所述的方法,其特征在于,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
3.根据权利要求1所述的方法,其特征在于,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
4.根据权利要求1所述的方法,其特征在于,所述提取所述尺寸区域样本的目标对象包括:
识别所述尺寸区域样本中的目标对象,裁剪所述尺寸区域样本的目标对象,得到所述尺寸区域样本的目标对象。
5.根据权利要求1所述的方法,其特征在于,所述待处理的图像为预设格式的图像。
6.一种确定图像中目标对象资源量的装置,其特征在于,所述装置包括:
获取模块,用于获取待处理的图像;
区域识别模块,用于将所述待处理的图像输入至尺寸区域识别模型,输出得到尺寸区域的标注信息;所述尺寸区域识别模型包括根据下述方式获得:提取图像样本中的尺寸区域样本,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类,得到所述尺寸区域样本对应的类型作为训练样本,基于目标检测算法作为尺寸区域识别模型进行训练得到;
目标对象识别模块,用于将所述尺寸区域的标注信息输入至目标对象识别模型,得到所述尺寸区域中的目标对象;所述目标对象识别模型包括:提取所述尺寸区域样本的目标对象,根据尺寸区域样本对应的类型将尺寸区域样本中的目标对象旋转对应的角度,得到处理后的尺寸区域样本作为训练样本,基于深度学习框架作为目标对象识别模型进行训练得到;
资源量获取模块,根据所述目标对象的子标注信息以及预设的标注区间与资源量的关联关系,确定所述目标对象的资源量。
7.根据权利要求6所述的装置,其特征在于,所述提取图像样本中的尺寸区域样本包括:
根据二值化后的图像样本进行闭运算处理,得到第一格式的图像;
对所述第一格式的图像和所述图像样本进行与运算处理,得到所述图像样本中的尺寸区域样本。
8.根据权利要求6所述的装置,其特征在于,根据所述尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类包括:
对所述尺寸区域样本做缩放处理,将缩放后的尺寸区域样本分隔为多个网格,提取每个网格中的特征,输入至卷积神经网络,得到所述尺寸区域样本的特征;
根据所述尺寸区域样本的特征得到尺寸区域样本中目标对象的方向,利用尺寸区域样本中目标对象的方向对所述尺寸区域样本进行分类。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202211033864.4A 2022-08-26 2022-08-26 确定图像中目标对象资源量的方法、装置、计算机设备 Pending CN115375944A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211033864.4A CN115375944A (zh) 2022-08-26 2022-08-26 确定图像中目标对象资源量的方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211033864.4A CN115375944A (zh) 2022-08-26 2022-08-26 确定图像中目标对象资源量的方法、装置、计算机设备

Publications (1)

Publication Number Publication Date
CN115375944A true CN115375944A (zh) 2022-11-22

Family

ID=84067159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211033864.4A Pending CN115375944A (zh) 2022-08-26 2022-08-26 确定图像中目标对象资源量的方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN115375944A (zh)

Similar Documents

Publication Publication Date Title
CN111079632A (zh) 文本检测模型的训练方法、装置、计算机设备和存储介质
CN109740571A (zh) 图像采集的方法、图像处理的方法、装置和电子设备
US11704357B2 (en) Shape-based graphics search
CN105765624B (zh) 内容感知图像旋转
WO2021238548A1 (zh) 区域识别方法、装置、设备及可读存储介质
CN112241565A (zh) 建模方法及相关装置
CN114550051A (zh) 一种车损检测方法、装置、计算机设备及存储介质
CN109697722B (zh) 用于生成三分图的方法及装置
Chen et al. Mobile imaging and computing for intelligent structural damage inspection
CN116310308A (zh) 图像分割方法、装置、计算机设备和存储介质
CN115375944A (zh) 确定图像中目标对象资源量的方法、装置、计算机设备
CN114238541A (zh) 敏感目标信息获取方法、装置和计算机设备
CN115731442A (zh) 图像处理方法、装置、计算机设备和存储介质
CN112669426B (zh) 基于生成对抗网络的三维地理信息模型渲染方法及系统
CN115063473A (zh) 物体高度的检测方法、装置、计算机设备、存储介质
CN114078204A (zh) 目标检测方法、装置、电子设备及存储介质
Choi et al. Object-aware image thumbnailing using image classification and enhanced detection of ROI
CN116452702B (zh) 信息图表快速设计方法、装置、计算机设备和存储介质
CN116612474B (zh) 对象检测方法、装置、计算机设备及计算机可读存储介质
CN118154689B (zh) 零件位置获取方法、装置、计算机设备、存储介质和产品
CN115063481A (zh) 图像中的目标对象定位方法、装置、计算机设备
KR102317855B1 (ko) 프로젝트 분석을 위한 사용자 인터페이스
CN115862027A (zh) 手写签名分割方法、装置、计算机设备、存储介质和产品
CN114841949A (zh) 栈板存取方法、装置、计算机设备和存储介质
CN114331983A (zh) 划痕检测方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination