CN114359645B - 基于特征区域的图像拓展方法、装置、设备及存储介质 - Google Patents
基于特征区域的图像拓展方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114359645B CN114359645B CN202210032523.9A CN202210032523A CN114359645B CN 114359645 B CN114359645 B CN 114359645B CN 202210032523 A CN202210032523 A CN 202210032523A CN 114359645 B CN114359645 B CN 114359645B
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- target
- pixel
- image block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013507 mapping Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 17
- 238000012800 visualization Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000007794 visualization technique Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000004891 communication Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及人工智能技术,揭露了一种基于特征区域的图像拓展方法,包括:获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;按照预设比例将所述基础图像划分为多个图像块;提取所述多个图像块内每个图像块的图像特征;利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。此外,本发明还涉及区块链技术,基础图像和随机图像可存储于区块链的节点。本发明还提出一种基于特征区域的图像拓展装置、电子设备以及存储介质。本发明可以提高图像拓展的效果。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于特征区域的图像拓展方法、装置、电子设备及计算机可读存储介质。
背景技术
目前深度学习技术广泛应用于图像分类任务,然而现有的深度学习方法往往需要大量的标柱数据才可训练出效果较好的模型。而标注数据往往需要耗费大量的人力物力。针对这种情况,已经有人提出使用Mixup方法来用有限的标注数据拓展出更多新的标注数据。
已有Mixup方法有明显的两点不足,一是Mixup方法是将两个图片内像素按比例相加进行融合,虽然能够拓展得到新样本,但是新样本的数据(像素)分布与原始样本的数据分布会有一定差异,因此,此方法的图像拓展效果有限;二是这种Mixup方法将图片中主要物体信息与背景信息看作同样的信息,而实际中图像中的物体信息是用于分类判断的主要信息,这也导致Mixup方法的图像拓展效果不佳,因此如何对数据进行有效拓展成为了亟待解决的问题。
发明内容
本发明提供一种基于特征区域的图像拓展方法、装置及计算机可读存储介质,其主要目的在于解决进行图像拓展时的效果较差的问题。
为实现上述目的,本发明提供的一种基于特征区域的图像拓展方法,包括:
获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
按照预设比例将所述基础图像划分为多个图像块;
提取所述多个图像块内每个图像块的图像特征;
利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
可选地,所述按照预设比例将所述基础图像划分为多个图像块,包括:
按照所述预设尺寸生成图像框;
利用所述图像框对所述基础图像中的区域进行不重复地框选,直至所述基础图像中所有区域被框选完成,得到多个图像块。
可选地,所述提取所述多个图像块内每个图像块的图像特征,包括:
逐个从所述多个图像块内选取一个图像块为目标图像块;
根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征;
利用预设的滑动窗口对所述目标图像块中的区域进行逐一框选,得到像素窗口;
根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征;
汇集所述全局特征与所述局部特征为所述目标图像块的图像特征。
可选地,所述根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征,包括:
统计所述目标图像块中每个像素点的像素值;
将所述像素值中最大像素值与最小像素值作为预设的映射函的参数,并利用所述预设函数将所述目标图像块中每个像素点的像素值映射至预设范围内;
计算映射后的所述目标图像块中每一行像素的像素梯度,将每一行像素的像素梯度转换为行向量,将所述行向量拼接为所述目标图像块的全局特征。
可选地,所述根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征,包括:
从所述像素窗口中逐个选取其中一个像素点为目标像素点;
判断所述目标像素点的像素值在所述像素窗口内是否为极值;
当所述目标像素点的像素值在所述像素窗口内不是极值时,返回从所述像素窗口中逐个选取其中一个像素点为目标像素点的步骤;
当所述目标像素点的像素值在所述像素窗口内是极值时,确定所述目标像素点为关键点;
将所有像素窗口内的所有关键点的像素值进行向量化,并将得到的向量汇集为所述目标图像块的局部特征。
可选地,所述利用特征可视化技术识别每个图像特征的特征重要度,包括:
对每个所述图像特征进行插值处理,得到所述预设尺寸的复原特征;
利用预设的激活函数计算每个所述复原特征与预设图像标签的相对概率值,确定所述相对概率值为每个所述图像特征的特征重要度。
可选地,所述将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像,包括:
统计所述目标特征对应的图像块的数量为目标数量;
从所述目标特征对应的图像块中随机选取小于或等于所述目标数量的图像块为拓展图像块;
统计每个所述拓展图像块在所述基础图像内的位置信息;
将所述拓展图像块映射至所述随机图像内所述位置信息相应的位置上,得到拓展图像。
为了解决上述问题,本发明还提供一种基于特征区域的图像拓展装置,所述装置包括:
图像预处理模块,用于获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
图像划分模块,用于按照预设比例将所述基础图像划分为多个图像块;
特征提取模块,用于提取所述多个图像块内每个图像块的图像特征;
特征筛选模块,用于利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
图像拓展模块,用于将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于特征区域的图像拓展方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于特征区域的图像拓展方法。
本发明实施例能够将基础图像划分为多个图像块,提取每个图像块的图像特征,并分析提取到的每个图像块的特征重要度,进而根据特征重要度筛选出较为重要的图像块,将筛选出的图像块映射至随机图像中,以生成拓展图像,减少了生成的拓展图像中数据(像素)分布与基础图像的差异性,同时,实现了利用基础图像内的关键区域进行针对性的图像拓展,有利于提升图像拓展的效果。因此本发明提出的基于特征区域的图像拓展方法、装置、电子设备及计算机可读存储介质,可以提高图像扩展的效果。
附图说明
图1为本发明一实施例提供的基于特征区域的图像拓展方法的流程示意图;
图2为本发明一实施例提供的提取多个图像块内每个图像块的图像特征的流程示意图;
图3为本发明一实施例提供的生成拓展图像的流程示意图;
图4为本发明一实施例提供的基于特征区域的图像拓展装置的功能模块图;
图5为本发明一实施例提供的实现所述基于特征区域的图像拓展方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于特征区域的图像拓展方法。所述基于特征区域的图像拓展方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于特征区域的图像拓展方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于特征区域的图像拓展方法的流程示意图。在本实施例中,所述基于特征区域的图像拓展方法包括:
S1、获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理。
本发明实施例中,所述基础图像可以为任何图像,例如,猫咪的图像,狗的图像等,所述随机图像可以为任何与所述基础图像不相同的图像,例如,当所述基础图像为猫咪的图像时,所述随机图像可以为狗的图像,或者,所述随机图像可以为包含与所述基础图像内的猫咪不相同猫咪的图像。
详细地,可利用具有数据抓取功能的计算机语句(如java语句、python语句等)从预先确定的数据存储区域内抓取预先存储的基础图像和随机图像,其中,所述数据存储区域包括但不限于数据库、区块链节点、网络缓存。
进一步地,由于所述基础图像和所述随机图像可能存在着尺寸的差异,因此,为了提高后续对所述基础图像和所述随机图像进行处理的效率,可对所述基础图像和所述随机图像的尺寸进行缩放,以实现对所述基础图像和所述随机图像的图像尺寸的尺寸归一化处理,得到具有相同像素尺寸的基础图像和随机图像。
S2、按照预设比例将所述基础图像划分为多个图像块。
本发明其中一个实际应用场景中,由于所述基础图像内包含大量像素信息,但并非每一个像素信息均为所述基础图像的关键信息,因此,可按照预设比例对所述基础图像进行划分,以将所述基础图像划分为多个图像块,以便于后续针对每个图像块进行精确分析,提升对所述基础图像进行图像拓展的效果。
本发明实施例中,所述按照预设比例将所述基础图像划分为多个图像块,包括:
按照所述预设尺寸生成图像框;
利用所述图像框对所述基础图像中的区域进行不重复地框选,直至所述基础图像中所有区域被框选完成,得到多个图像块。
详细地,所述预设尺寸可以为预先获取的,每个所述基础图像的长度和宽度等数据。
具体地,可按照所述预设尺寸生成图像框,进而利用生成的图像框在所述基础图像内进行不重复地款选,以得到多个图像块。
例如,所述基础图像的长度为10cm,宽度为10cm,按照所述预设尺寸生成的图像框的长度为2cm,宽度为2cm,则可利用该图像框在所述基础图像中进行框选得到25个长度为2cm,宽度为2cm的图像块。
本发明实施例中,将所述基础图像划分为多个图像块,有利于后续针对每一个图像块进行细化分析,以提高最终对所述基础图像进行图像扩展的精确度。
S3、提取所述多个图像块内每个图像块的图像特征。
本发明实施例中,为了实现对所述基础图像内每一个图像块进行针对性的分析,可分别提取所述多个图像块内每一个图像块对应的图像特征。
详细地,所述图像特征包括每个图像块的全局特征与局部特征。
本发明实施例中,参图2所示,所述提取所述多个图像块内每个图像块的图像特征,包括:
S21、逐个从所述多个图像块内选取一个图像块为目标图像块;
S22、根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征;
S23、利用预设的滑动窗口对所述目标图像块中的区域进行逐一框选,得到像素窗口;
S24、根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征;
S25、汇集所述全局特征与所述局部特征为所述目标图像块的图像特征。
本发明其中一个实施例中,可采用HOG(Histogram of Oriented Gradient,方向梯度直方图)、DPM(Deformable Part Model,可变性组件模型)、LBP(Local BinaryPatterns,局部二值模式)等方式来生成所述目标图像块的全局特征,或者,可采用预先训练的具体图像特征提取功能的人工智能模型来提取所述目标图像块的全局特征,所述人工智能模型包括但不限于VGG-net模型、U-net模型。
本发明另一实施例中,所述根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征,包括:
统计所述目标图像块中每个像素点的像素值;
将所述像素值中最大像素值与最小像素值作为预设的映射函的参数,并利用所述预设函数将所述目标图像块中每个像素点的像素值映射至预设范围内;
计算映射后的所述目标图像块中每一行像素的像素梯度,将每一行像素的像素梯度转换为行向量,将所述行向量拼接为所述目标图像块的全局特征。
示例性地,所述预设的映射函可以为:
其中,Yi为目标图像块中第i个像素点映射至预设范围内后的像素值,xi为目标图像块中第i个像素点的像素值,max(X)为目标图像块中最大像素值,min(X)为目标图像块中最小像素值。
进一步地,可利用预设的梯度算法计算映射后的所述目标图像块中每一行像素的像素梯度,所述梯度算法包括但不限于二维离散求导算法、soble算子等。
本申请实施例中,可将每一行像素的像素梯度转换为行向量,并拼接为所述目标图像块的全局特征。
例如,选取的目标图像块中包括三行像素,第一行像素的像素梯度为q,w,e,第一行像素的像素梯度为a,s,d,第一行像素的像素梯度为z,x,c,则可分别将每一行像素的像素梯度作为行向量,拼接为如下全局特征:
进一步地,所述根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征,包括:
从所述像素窗口中逐个选取其中一个像素点为目标像素点;
判断所述目标像素点的像素值在所述像素窗口内是否为极值;
当所述目标像素点的像素值在所述像素窗口内不是极值时,返回从所述像素窗口中逐个选取其中一个像素点为目标像素点的步骤;
当所述目标像素点的像素值在所述像素窗口内是极值时,确定所述目标像素点为关键点;
将所有像素窗口内的所有关键点的像素值进行向量化,并将得到的向量汇集为所述目标图像块的局部特征。
本申请实施例中,所述滑动窗口可以为预先构建的具有一定面积的选择框,可用于对所述目标图像块中的像素进行框选,例如,以10像素为高度,10像素为宽度构建的方形选择框。
详细地,所述极值包括极大值与极小值,当所述目标像素点的像素值在所述像素窗口内为极大值或极小值时,即确定所述目标像素点为所述像素窗口的关键点。
具体地,所述将所述像素窗口内所有关键点的像素值进行向量化的步骤,和所述计算映射后的所述目标图像块中每一行像素的像素梯度,将每一行像素的像素梯度转换为行向量的步骤一致,再次不做赘述。
S4、利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征。
本发明实施例中,由于所述多个图像块内每个图像块包含的所述基础图像的关键信息的量不一致,因此,可利用特征可视化技术分析得到每个图像特征的特征重要度,进而根据所述特征重要度实现对所述多个图像特征的筛选。
详细地,所述特征可视化技术包括CAM(Class Activation Mapping,类别激活映射图)技术。
本发明实施例中,所述利用特征可视化技术识别每个图像特征的特征重要度,包括:
对每个所述图像特征进行插值处理,得到所述预设尺寸的复原特征;
利用预设的激活函数计算每个所述复原特征与预设图像标签的相对概率值,确定所述相对概率值为每个所述图像特征的特征重要度。
详细地,由于所述图像特征是通过卷积、池化或关键点识别得到的,在识别出所述图像特征的过程中,不可避免地会对每个图像块的原始像素信息进行丢失,进而导致识别出的图像特征与该图像特征对应的图像块的尺寸之间存在差异,因此,可对每个图像特征进行插值处理,得到所述预设尺寸的复原特征,以实现对所有图像特征的尺寸统一化,有利于提升后续分析每个图像特征的特征重要度的精确性。
具体地,可利用平均插值法对所述图像特征进行插值,例如,图像特征内存在相邻的数值为10和20,则可在该相邻数值之间插入其均值:15,以对该相邻数值进行插值,实现对图像特征的尺度进行扩充。
进一步的,所述激活函数包括但不限于softmax激活函数、sigmoid激活函数,可逐个将每个复原特征和所述预设图像标签作为参数代入所述激活函数中,以计算出每个所述复原特征与预设图像标签的相对概率值,其中,所述相对概率值是指所述复原特征与所述预设图像标签相一致的概率。
本发明实施例中,可根据所述特征重要度对多个图像中每个图像对应的图像特征进行筛选,得到所述特征重要度大于预设阈值的图像特征,以便于后续利用被选取的特征重要度较高的图像特征对所述基础图像进行图像拓展,提升图像拓展的效果。
S5、将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
本发明实施例中,可通过图像映射的方式,将所述目标特征对应的图像块映射至所述随机图像内的相应位置,以生成所述基础图像的拓展图像。
详细地,所述映射可以为全部映射或局部映射,例如,将所述目标特征对应的所有图像块映射至所述随机图像内的相应位置,或者,随机选取所述目标特征对应的部分图像块并将选取的图像块映射至所述随机图像内的相应位置。
本发明实施例中,所述将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像,包括:
统计所述目标特征对应的图像块的数量为目标数量;
从所述目标特征对应的图像块中随机选取小于或等于所述目标数量的图像块为拓展图像块;
统计每个所述拓展图像块在所述基础图像内的位置信息;
将所述拓展图像块映射至所述随机图像内所述位置信息相应的位置上,得到拓展图像。
详细地,所述位置信息是指被选取的拓展图像块在所述基础图像内所处的位置的信息,由于所述基础图像与所述随机图像的图像尺寸完全一致,因此,可根据每个拓展图像块在所述基础图像内的位置信息将其映射至所述随机图像的相应位置,即利用所述拓展图像块对所述随机图像内相应位置上的图像块进行替换,以得到所述拓展图像。
示例性地,如图3所示,基础图像块内包含图像块A、图像块B、图像块C和图像块D,随机图像内包含图像块a、图像块b、图像块c和图像块d,其中,基础图像块内的图像块A和图像块D为拓展图像块,则可利用该基础图像内的图像块A和图像块D对所述随机图像内的图像块a和图像块d进行替换,得到拓展图像。
本发明实施例能够将基础图像划分为多个图像块,提取每个图像块的图像特征,并分析提取到的每个图像块的特征重要度,进而根据特征重要度筛选出较为重要的图像块,将筛选出的图像块映射至随机图像中,以生成拓展图像,减少了生成的拓展图像中数据(像素)分布与基础图像的差异性,同时,实现了利用基础图像内的关键区域进行针对性的图像拓展,有利于提升图像拓展的效果。因此本发明提出的基于特征区域的图像拓展方法,可以提高图像扩展的效果。
如图4所示,是本发明一实施例提供的基于特征区域的图像拓展装置的功能模块图。
本发明所述基于特征区域的图像拓展装置100可以安装于电子设备中。根据实现的功能,所述基于特征区域的图像拓展装置100可以包括图像预处理模块101、图像划分模块102、特征提取模块103、特征筛选模块104及图像拓展模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述图像预处理模块101,用于获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
所述图像划分模块102,用于按照预设比例将所述基础图像划分为多个图像块;
所述特征提取模块103,用于提取所述多个图像块内每个图像块的图像特征;
所述特征筛选模块104,用于利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
所述图像拓展模块105,用于将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
详细地,本发明实施例中所述基于特征区域的图像拓展装置100中所述的各模块在使用时采用与上述图1至图3中所述的基于特征区域的图像拓展方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明一实施例提供的实现基于特征区域的图像拓展方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于特征区域的图像拓展程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于特征区域的图像拓展程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于特征区域的图像拓展程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图中仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图中示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于特征区域的图像拓展程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
按照预设比例将所述基础图像划分为多个图像块;
提取所述多个图像块内每个图像块的图像特征;
利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
按照预设比例将所述基础图像划分为多个图像块;
提取所述多个图像块内每个图像块的图像特征;
利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于特征区域的图像拓展方法,其特征在于,所述方法包括:
获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
按照预设比例将所述基础图像划分为多个图像块;
提取所述多个图像块内每个图像块的图像特征;
利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
2.如权利要求1所述的基于特征区域的图像拓展方法,其特征在于,所述按照预设比例将所述基础图像划分为多个图像块,包括:
按照所述预设尺寸生成图像框;
利用所述图像框对所述基础图像中的区域进行不重复地框选,直至所述基础图像中所有区域被框选完成,得到多个图像块。
3.如权利要求1所述的基于特征区域的图像拓展方法,其特征在于,所述提取所述多个图像块内每个图像块的图像特征,包括:
逐个从所述多个图像块内选取一个图像块为目标图像块;
根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征;
利用预设的滑动窗口对所述目标图像块中的区域进行逐一框选,得到像素窗口;
根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征;
汇集所述全局特征与所述局部特征为所述目标图像块的图像特征。
4.如权利要求3所述的基于特征区域的图像拓展方法,其特征在于,所述根据所述目标图像块中的像素梯度生成所述目标图像块的全局特征,包括:
统计所述目标图像块中每个像素点的像素值;
将所述像素值中最大像素值与最小像素值作为预设的映射函的参数,并利用所述预设函数将所述目标图像块中每个像素点的像素值映射至预设范围内;
计算映射后的所述目标图像块中每一行像素的像素梯度,将每一行像素的像素梯度转换为行向量,将所述行向量拼接为所述目标图像块的全局特征。
5.如权利要求3所述的基于特征区域的图像拓展方法,其特征在于,所述根据每一个所述像素窗口中的像素值生成所述目标图像块的局部特征,包括:
从所述像素窗口中逐个选取其中一个像素点为目标像素点;
判断所述目标像素点的像素值在所述像素窗口内是否为极值;
当所述目标像素点的像素值在所述像素窗口内不是极值时,返回从所述像素窗口中逐个选取其中一个像素点为目标像素点的步骤;
当所述目标像素点的像素值在所述像素窗口内是极值时,确定所述目标像素点为关键点;
将所有像素窗口内的所有关键点的像素值进行向量化,并将得到的向量汇集为所述目标图像块的局部特征。
6.如权利要求1所述的基于特征区域的图像拓展方法,其特征在于,所述利用特征可视化技术识别每个图像特征的特征重要度,包括:
对每个所述图像特征进行插值处理,得到所述预设尺寸的复原特征;
利用预设的激活函数计算每个所述复原特征与预设图像标签的相对概率值,确定所述相对概率值为每个所述图像特征的特征重要度。
7.如权利要求1至6中任一项所述的基于特征区域的图像拓展方法,其特征在于,所述将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像,包括:
统计所述目标特征对应的图像块的数量为目标数量;
从所述目标特征对应的图像块中随机选取小于或等于所述目标数量的图像块为拓展图像块;
统计每个所述拓展图像块在所述基础图像内的位置信息;
将所述拓展图像块映射至所述随机图像内所述位置信息相应的位置上,得到拓展图像。
8.一种基于特征区域的图像拓展装置,其特征在于,所述装置包括:
图像预处理模块,用于获取基础图像和随机图像,将所述基础图像与所述随机图像进行尺寸归一化处理;
图像划分模块,用于按照预设比例将所述基础图像划分为多个图像块;
特征提取模块,用于提取所述多个图像块内每个图像块的图像特征;
特征筛选模块,用于利用特征可视化技术识别每个图像特征的特征重要度,选取所述特征重要度大于预设阈值的图像特征为目标特征;
图像拓展模块,用于将每个所述目标特征对应的图像块映射至所述随机图像内的相应位置,得到拓展图像。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于特征区域的图像拓展方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于特征区域的图像拓展方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032523.9A CN114359645B (zh) | 2022-01-12 | 2022-01-12 | 基于特征区域的图像拓展方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032523.9A CN114359645B (zh) | 2022-01-12 | 2022-01-12 | 基于特征区域的图像拓展方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114359645A CN114359645A (zh) | 2022-04-15 |
CN114359645B true CN114359645B (zh) | 2024-05-21 |
Family
ID=81108824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210032523.9A Active CN114359645B (zh) | 2022-01-12 | 2022-01-12 | 基于特征区域的图像拓展方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114359645B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2002542A1 (en) * | 1988-12-20 | 1990-06-20 | Henry Spalding Baird | Imaged symbol classification |
JP2004265029A (ja) * | 2003-02-28 | 2004-09-24 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2006217045A (ja) * | 2005-02-01 | 2006-08-17 | Olympus Corp | インデックス画像生成装置及びインデックス画像を生成するプログラム |
CN101763514A (zh) * | 2010-01-15 | 2010-06-30 | 西安电子科技大学 | 基于特征重要度排序谱聚类的图像分割方法 |
JP2010148132A (ja) * | 2010-01-20 | 2010-07-01 | Casio Computer Co Ltd | 撮像装置、画像検出装置及びプログラム |
CN107886476A (zh) * | 2016-09-30 | 2018-04-06 | 联咏科技股份有限公司 | 纹理合成的方法以及使用该方法的图像处理设备 |
CN110070091A (zh) * | 2019-04-30 | 2019-07-30 | 福州大学 | 用于街景理解的基于动态插值重建的语义分割方法及系统 |
KR102074406B1 (ko) * | 2019-07-25 | 2020-02-06 | 주식회사 딥노이드 | 영상 랜드마크 분류 장치 및 방법 |
CN111275686A (zh) * | 2020-01-20 | 2020-06-12 | 中山大学 | 用于人工神经网络训练的医学图像数据的生成方法及装置 |
CN111274883A (zh) * | 2020-01-10 | 2020-06-12 | 杭州电子科技大学 | 基于多尺度hog特征和深层特征的合成素描人脸识别方法 |
CN111291819A (zh) * | 2020-02-19 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN111476225A (zh) * | 2020-06-28 | 2020-07-31 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的车内人脸识别方法、装置、设备及介质 |
CN113283446A (zh) * | 2021-05-27 | 2021-08-20 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
WO2021167998A1 (en) * | 2020-02-17 | 2021-08-26 | DataRobot, Inc. | Automated data analytics methods for non-tabular data, and related systems and apparatus |
CN113705460A (zh) * | 2021-08-30 | 2021-11-26 | 平安科技(深圳)有限公司 | 图像中人脸睁眼闭眼检测方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11260078B2 (en) * | 2017-07-25 | 2022-03-01 | Insilico Medicine Ip Limited | Method of treating senescence with multi-stage longevity therapeutics |
-
2022
- 2022-01-12 CN CN202210032523.9A patent/CN114359645B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2002542A1 (en) * | 1988-12-20 | 1990-06-20 | Henry Spalding Baird | Imaged symbol classification |
JP2004265029A (ja) * | 2003-02-28 | 2004-09-24 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2006217045A (ja) * | 2005-02-01 | 2006-08-17 | Olympus Corp | インデックス画像生成装置及びインデックス画像を生成するプログラム |
CN101763514A (zh) * | 2010-01-15 | 2010-06-30 | 西安电子科技大学 | 基于特征重要度排序谱聚类的图像分割方法 |
JP2010148132A (ja) * | 2010-01-20 | 2010-07-01 | Casio Computer Co Ltd | 撮像装置、画像検出装置及びプログラム |
CN107886476A (zh) * | 2016-09-30 | 2018-04-06 | 联咏科技股份有限公司 | 纹理合成的方法以及使用该方法的图像处理设备 |
CN110070091A (zh) * | 2019-04-30 | 2019-07-30 | 福州大学 | 用于街景理解的基于动态插值重建的语义分割方法及系统 |
KR102074406B1 (ko) * | 2019-07-25 | 2020-02-06 | 주식회사 딥노이드 | 영상 랜드마크 분류 장치 및 방법 |
CN111274883A (zh) * | 2020-01-10 | 2020-06-12 | 杭州电子科技大学 | 基于多尺度hog特征和深层特征的合成素描人脸识别方法 |
CN111275686A (zh) * | 2020-01-20 | 2020-06-12 | 中山大学 | 用于人工神经网络训练的医学图像数据的生成方法及装置 |
WO2021167998A1 (en) * | 2020-02-17 | 2021-08-26 | DataRobot, Inc. | Automated data analytics methods for non-tabular data, and related systems and apparatus |
CN111291819A (zh) * | 2020-02-19 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN111476225A (zh) * | 2020-06-28 | 2020-07-31 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的车内人脸识别方法、装置、设备及介质 |
CN113283446A (zh) * | 2021-05-27 | 2021-08-20 | 平安科技(深圳)有限公司 | 图像中目标物识别方法、装置、电子设备及存储介质 |
CN113705460A (zh) * | 2021-08-30 | 2021-11-26 | 平安科技(深圳)有限公司 | 图像中人脸睁眼闭眼检测方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于图像显著特征的非重叠视域行人再识别;王彩玲;唐松;荆晓远;;南京邮电大学学报(自然科学版);20160629(第03期);第106-111页 * |
基于随机森林特征选择算法的鼻咽肿瘤分割;李鲜;王艳;罗勇;周激流;;计算机应用;20190121(第05期);第1485-1489页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114359645A (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112232293B (zh) | 图像处理模型训练、图像处理方法及相关设备 | |
CN113283446B (zh) | 图像中目标物识别方法、装置、电子设备及存储介质 | |
CN111695609B (zh) | 目标物损伤程度判定方法、装置、电子设备及存储介质 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN113705462B (zh) | 人脸识别方法、装置、电子设备及计算机可读存储介质 | |
CN111914939B (zh) | 识别模糊图像的方法、装置、设备及计算机可读存储介质 | |
CN111639704A (zh) | 目标识别方法、装置及计算机可读存储介质 | |
CN112749653A (zh) | 行人检测方法、装置、电子设备及存储介质 | |
CN114758249A (zh) | 基于野外夜间环境的目标物监测方法、装置、设备及介质 | |
CN114049568A (zh) | 基于图像比对的标的物形变检测方法、装置、设备及介质 | |
CN114550076A (zh) | 区域异常行为监控方法、装置、设备及存储介质 | |
CN112528903B (zh) | 人脸图像获取方法、装置、电子设备及介质 | |
CN117455762A (zh) | 基于全景行车记录仪的记录画面分辨率提升方法及系统 | |
CN115049836B (zh) | 图像分割方法、装置、设备及存储介质 | |
CN114359645B (zh) | 基于特征区域的图像拓展方法、装置、设备及存储介质 | |
CN113887384B (zh) | 基于多轨迹融合的行人轨迹分析方法、装置、设备及介质 | |
CN113888086B (zh) | 基于图像识别的物品签收方法、装置、设备及存储介质 | |
CN112434601B (zh) | 基于行车视频的车辆违法检测方法、装置、设备及介质 | |
CN112541436B (zh) | 专注度分析方法、装置、电子设备及计算机存储介质 | |
CN114187476A (zh) | 基于图像分析的车险信息核对方法、装置、设备及介质 | |
CN110414845B (zh) | 针对目标交易的风险评估方法及装置 | |
CN114049676A (zh) | 疲劳状态检测方法、装置、设备及存储介质 | |
CN112580505A (zh) | 网点开关门状态识别方法、装置、电子设备及存储介质 | |
CN113918769B (zh) | 视频中关键动作标记方法、装置、设备及存储介质 | |
CN114283492B (zh) | 基于员工行为的工作饱和度分析方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |