CN117152497A - 一种图像智能识别装置及方法 - Google Patents
一种图像智能识别装置及方法 Download PDFInfo
- Publication number
- CN117152497A CN117152497A CN202311028721.9A CN202311028721A CN117152497A CN 117152497 A CN117152497 A CN 117152497A CN 202311028721 A CN202311028721 A CN 202311028721A CN 117152497 A CN117152497 A CN 117152497A
- Authority
- CN
- China
- Prior art keywords
- image
- image recognition
- target
- model
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004458 analytical method Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011430 maximum method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图像智能识别装置及方法,涉及深度学习领域。该用于图像智能识别装置及方法,包括图像获取单元,用于获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型;运行状态获取单元,用于分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除所述目标图像识别模型之外的图像识别模型;用于若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对待识别图像进行图像识别,通过设置装置提高了提取效率,节约所需时间,降低成本。
Description
技术领域
本发明涉及深度学习技术领域,具体为一种图像智能识别装置及方法。
背景技术
机器学习是指机器通过统计学算法,对大量历史数据进行学习,进而利用生成的经验模型指导业务。它是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习的核心是“使用算法解析数据,从中学习,然后对新数据做出决定或预测”。图像识别被广泛用于各个行业,常用于检测用户期待的目标物体,在检测时,以计算机为基础,并在此基础上进行图像处理和检测,在处理时,常通过分析待识别的图像,在待识别的图像中提取需要进行检测的目标物体。
申请人在申请本发明时,经过检索,发现中国专利公开了一种“基于人工智能的图像识的方法以及相关装置”,其申请号为“202110083832.4”,该专利主要通过获取输入图像;然后将输入图像输入目标模型中的预设识别网络,以得到注意力图,注意力图中包含注意力区域,并基于注意力区域对注意力图进行图像调整得到增强图像,并根据增强图像对预设识别网络进行训练,以得到目标识别网络;进一步的将输入图像输入目标识别网络,以得到图像特征图;进而将图像特征图输入目标模型中的分级识别网络,以得到第一类型标签和第二类型标签,其中,分级识别网络包括一级标签分支和二级标签分支,一级标签分支用于确定输入图像的第一类型标签,二级标签分支用于识别输入图像的第二类型标签,第一类型标签和第二类型标签用于指示同一目标对象,且第二类型标签对于目标对象描述粒度小于第一类型标签对于目标对象描述粒度。从而实现基于注意力区域引导的图像分级识别过程,由于采用注意力图中的注意力区域进行增强图像的获取,使得模型专注于关键部位的数据学习,并采用分级识别的方式进行展现,使得图像中的细节部分得以识别,提高了图像识别的准确性。
图像识别的种类包括图像分类识别、图像姿态识别和图像分割识别等方式,现有的图像识别过程中,均是采用图像识别模型的方式自动进行图像的识别,但现有的图像识别模型使用过程中,均是通过人工手动的方式进行不同效果的图像识别模型的选择,并基于选择到的图像识别模型达到对应的图像识别效果,进而导致用户操作繁琐,降低了图像识别效率。但在图像识别的过程中,光照的干扰影响较大,例如在拍摄过程中由于对焦不充分或背景光线干扰等因素,导致拍摄的图像会存在局部曝光、清晰度不足等现象,降低了图像识别的准确率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种图像智能识别装置及方法,解决了导致拍摄的图像会存在局部曝光、清晰度不足等现象,降低了图像识别的准确率。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种图像智能识别装置,包括图像获取单元,用于获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型;运行状态获取单元,用于分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除所述目标图像识别模型之外的图像识别模型;图像识别单元,用于若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果;重置提醒单元,用于若非目标图像识别模型的运行状态均是未运行,且目标图像识别模型的运行状态是运行中,则发送图像重置提醒,图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行待识别图像的识别;图像识别单元还用于,若接收到针对图像重置提醒的确定指令,则指示目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
优选的,包括:获取图像识别指令和所述图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型;分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除所述目标图像识别模型之外的图像识别模型;若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果;若非目标图像识别模型的运行状态均是未运行,且目标图像识别模型的运行状态是运行中,则发送图像重置提醒,所述图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行所述待识别图像的识别;若接收到针对图像重置提醒的确定指令,则指示目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
优选的,所述运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果,包括:根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,并获取目标类别对应的物体在待识别图像中的位置信息;若目标类别不是预设类别,则将获取到的位置信息和位置信息对应的目标类别进行对应存储,得到图像识别结果;若目标类别是预设类别,则根据目标图像识别模型对目标类别对应的物体进行姿态分析,得到姿态分析结果,并将同一所述物体对应的姿态分析结果、位置信息和目标类别对应进行存储,得到图像识别结果。
优选的,所述根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,包括:根据目标图像识别模型对待识别图像进行图像灰度处理,得到灰度图像,并提取灰度图像中物体对应的灰度直方图;将提取到的灰度直方图与预存储的类别查询表进行匹配,得到目标类别,所述类别查询表中存储有不同灰度直方图与对应类别之间的对应关系,所述根据目标图像识别模型对目标类别对应的物体进行姿态分析,得到姿态分析结果,包括:获取目标类别对应的关节节点,并根据目标图像识别模型,获取待识别图像中物体上关节节点的位置坐标;获取关节节点之间的姿态顺序,并根据姿态顺序对获取到的位置坐标进行连接,得到姿态图像;将姿态图像与预存储的姿态列表进行匹配,得到姿态分析结果,所述姿态列表中存储有不同姿态图像与对应姿态分析结果之间的对应关系。
优选的,所述分别获取目标图像识别模型和非目标图像识别模型的运行状态,包括:获取目标图像识别模型的运行参数,并根据运行参数确定目标图像识别模型的运行状态;获取本地模型运行环境中的负载标识,所述负载标识用于表征本地模型运行环境中是否存在运行中的图像识别模型,并根据负载标识确定非目标图像识别模型的运行状态,停止对应非目标图像识别模型的运行,并运行目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果,包括:获取负载标识中携带的模型标识,所述负载标识中携带的模型标识用于表征对应非目标图像识别模型,并停止模型标识所指向的运行线程;对目标图像识别模型分配运行内存,并运行目标图像识别模型对应的运行程序;将待识别图像输入运行后的目标图像识别模型进行图像识别,得到图像识别结果,所述分别获取目标图像识别模型和非目标图像识别模型的运行状态之后,还包括:若非目标图像识别模型和目标图像识别模型的运行状态均是未运行,则直接运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
优选的,包括:响应于图像识别请求,获取图像识别请求中携带的待识别图像的第一灰度图像数据和识别类型;对第一灰度图像数据进行二值化处理,得到第二灰度图像数据;根据识别类型,基于待识别图像的初始图像数据和第二灰度图像数据来确定目标图像数据;以及将目标图像数据输入到与识别类型对应的图像识别模型中,输出得到待识别图像的识别结果。所述识别类型包括图像识别和颜色识别;所述根据识别类型,基于待识别图像的初始图像数据和第二灰度图像数据来确定目标图像数据,包括:在识别类型为图像识别的情况下,确定目标图像数据为第二灰度图像数据;以及在识别类型为颜色识别的情况下,根据第二灰度图像数据中像素点的灰度值来处理初始图像数据,以得到目标图像数据,第二灰度图像数据中像素点的灰度值为第一灰度值或第二灰度值;所述根据第二灰度图像数据中像素点的灰度值来处理初始图像数据,以得到目标图像数据。
优选的,包括:将初始图像数据和第二灰度图像数据置入预设参考系中,以确定初始图像数据中的各个像素点和第二灰度图像数据中的各个像素点在预设参考系中的位置信息;根据第二灰度图像数据中灰度值为所述第一灰度值的所有像素点的位置信息,确定位置信息集合;根据位置信息集合,从初始图像数据中确定目标像素点;以及将初始图像数据中所有目标像素点的值修改为预设值,以得到目标图像数据。所述将目标图像数据输入到与识别类型对应的图像识别模型中,输出得到待识别图像的识别结果,包括:在识别类型为图像识别的情况下,将目标图像数据输入到图像识别模型中,输出得到表征待识别图像中的图像内容的所述识别结果;以及在识别类型为颜色识别的情况下,将目标图像数据输入到颜色识别模型中,输出得到表征待识别图像的颜色的识别结果。
优选的,包括:图像获取模块,所述图像获取模块获取投标文件的图像;区域图像获取模块,所述区域图像获取模块识别出所述图像中数据的位置,截取出含有数据的区域图像;数据获取模块,所述数据获取模块将含有数据的区域图像处理后输入神经网络模型中,输出数据,还包括区域图像处理模块,所述区域图像处理模块识别出区域图像内的表格区域内的文字blob块所述数据获取模块将表格中大blob输入神经网络进行识别,所述神经网络为卷积神经网络,该网络的结构包括:第一卷积层、第一下采样层、第二卷积层、第二下才采样层、第三卷积层、softmax层,输出为字符。所述数据获取模块在MatConvNet环境下搭建神经网络。还包括纠偏模块,所述纠偏模块将含有数据的区域图像纠偏。
(三)有益效果
本发明提供了一种图像智能识别装置及方法。具备以下有益效果:
1、通过获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型,能根据用户的需求自动选择对应识别效果的图像识别模型,无需用户手动的进行图像识别模型的选择,方便了用户的图像识别操作,提高了图像识别效率。
2、通过分别获取目标图像识别模型和非目标图像识别模型的运行状态,有效地提高了目标图像识别模型运行的准确性,若任一非目标图像识别模型的运行状态是运行中,通过停止对应非目标图像识别模型的运行,有效地防止了非目标图像识别模型和目标图像识别模型同时运行所导致的图像识别错误,进一步提高了图像识别的准确性。
3、通过对第一灰度图像数据进行二值化处理,可以自适应地对图像数据中各种复杂光照和噪声干扰情况进行处理,至少部分解决了图像拍摄过程中由于对焦不充分和光线背景干扰而引发的图像清晰度不足的问题,有效提高了图像识别的准确性和鲁棒性。
4、通过设置装置提高了提取效率,节约所需时间,降低成本。
附图说明
图1为本发明所提出的一种图像智能识别装置及方法的图像识别装置的结构框图;
图2为本发明所提出的一种图像智能识别装置及方法的图像识别方法的流程图;
图3为本发明所提出的一种图像智能识别装置及方法的图像识别方法实现流程图;
图4为本发明所提出的一种图像智能识别装置及方法的对灰度数据的流程图;
图5为本发明所提出的一种图像智能识别装置及方法的图像识别装置的模块图;
图6为背景技术所提技术问题的现有装置结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
如图1-5所示,本发明实施例提供一种图像智能识别装置及方法,包括:图像获取单元10、运行状态获取单元11、图像识别单元12和重置提醒单元13,其中:图像获取单元10,用于获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型。
运行状态获取单元11,用于分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除目标图像识别模型之外的图像识别模型。
其中,该运行状态获取单元11还用于获取目标图像识别模型的运行参数,并根据运行参数确定目标图像识别模型的运行状态;
获取本地模型运行环境中的负载标识,负载标识用于表征本地模型运行环境中是否存在运行中的图像识别模型,并根据负载标识确定非目标图像识别模型的运行状态。
进一步地,该运行状态获取单元11还用于获取负载标识中携带的模型标识,负载标识中携带的模型标识用于表征对应非目标图像识别模型,并停止模型标识所指向的运行线程;对目标图像识别模型分配运行内存,并运行目标图像识别模型对应的运行程序;
将待识别图像输入运行后的目标图像识别模型进行图像识别,得到图像识别结果。
图像识别单元12,用于若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
其中,该图像识别单元12还用于根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,并获取目标类别对应的物体在待识别图像中的位置信息;若目标类别不是预设类别,则将获取到的位置信息和位置信息对应的目标类别进行对应存储,得到图像识别结果;
若目标类别是预设类别,则根据目标图像识别模型对目标类别
对应的物体进行姿态分析,得到姿态分析结果,并将同一物体对应的姿态分析结果、位置信息和目标类别对应进行存储,得到图像识别结果。
可选的,该图像识别单元12还用于根据目标图像识别模型对待识别图像进行图像灰度处理,得到灰度图像,并提取灰度图像中物体对应的灰度直方图;将提取到的灰度直方图与预存储的类别查询表进行匹配,得到目标类别,类别查询表中存储有不同灰度直方图与对应类别之间的对应关系。
进一步地,该图像识别单元12还用于获取目标类别对应的关节节点,并根据目标图像识别模型,获取待识别图像中物体上关节节点的位置坐标;
获取关节节点之间的姿态顺序,并根据姿态顺序对获取到的位置坐标进行连接,得到姿态图像;
将姿态图像与预存储的姿态列表进行匹配,得到姿态分析结果,姿态列表中存储有不同姿态图像与对应姿态分析结果之间的对应关系。
重置提醒单元13,用于若非目标图像识别模型的运行状态均是未运行,且目标图像识别模型的运行状态是运行中,则发送图像重置提醒,图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行待识别图像的识别。可选的,本实施例中,该图像识别单元12还用于若接收到针对图像重置提醒的确定指令,则指示目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。该图像识别单元12还用于若非目标图像识别模型和目标图像识别模型的运行状态均是未运行,则直接运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
步骤S10,获取图像识别指令和所述图像识别指令所指向的待识别图像,并根据所述图像识别指令的指令标识确定目标图像识别模型。
其中,通过将该图像识别指令的指令标识与预存储的模型查询表进行匹配,以得到该图像识别指令对应的目标图像识别模型,该模型查询表中存储有不同指令标识与对应目标图像识别模型之间的对应关系。
具体的,该图像识别指令可以采用语音指令、触控指令或文字指令的方式进行传输,该指令标识可以采用数字、字母或文字的方式存储在该图像识别指令中。
本实施例中至少包括两个不同的图像识别模型,该图像识别模型可以为图像分类识别模型、图像姿态识别模型和图像分割识别模型等,且不同图像识别模型之间对应的模型标识不相同。
步骤S20,分别获取所述目标图像识别模型和非目标图像识别模型的运行状态。
其中,该非目标图像识别模型为除目标图像识别模型之外的图像识别模型,例如,本实施例中的图像识别模型包括图像识别模型a1、图像识别模型a2和图像识别模型a3,根据图像识别指令的指令标识确定到的目标图像识别模型是图像识别模型a2时,则分别获取目标图像识别模型a2和非目标图像识别模型a1、a3的运行状态。
具体的,该步骤中,所述分别获取所述目标图像识别模型和非目标图像识别模型的运行状态,包括:获取所述目标图像识别模型的运行参数,并根据所述运行参数确定所述目标图像识别模型的运行状态,其中,若运行参数中指定参数的参数值等于预设参数值时,则判定该目标图像识别模型的运行状态是运行中的状态,若运行参数中指定参数的参数值不等于预设参数值时,则判定该目标图像识别模型的运行状态是未运行状态;获取本地模型运行环境中的负载标识,并根据所述负载标识确定所述非目标图像识别模型的运行状态,其中,该负载标识用于表征本地模型运行环境中是否存在运行中的图像识别模型,具体的,该步骤中,若本地模型运行环境中的负载标识等于预设标识,则判定本地模型运行环境中存在运行中的图像识别模型,若本地模型运行环境中的负载标识不等于预设标识,则判定本地模型运行环境中不存在运行中的图像识别模型。
进一步地,该步骤中,所述停止对应所述非目标图像识别模型的运行,并运行所述目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果,包括:获取所述负载标识中携带的模型标识,并停止所述模型标识所指向的运行线程,其中,该负载标识中携带的模型标识用于表征对应非目标图像识别模型,通过停止模型标识所指向的运行线程,以达到停止对应非目标图像识别模型运行的效果,进而有效防止了目标图像识别模型和非目标图像识别模型同时运行所导致的图像识别错误;
对所述目标图像识别模型分配运行内存,并运行所述目标图像识别模型对应的运行程序,其中,通过对目标图像识别模型分配运行内存,有效地保障了目标图像识别模型的运行;
将所述待识别图像输入运行后的所述目标图像识别模型进行图像识别,得到所述图像识别结果。
可选的,该步骤中,所述分别获取所述目标图像识别模型和非目标图像识别模型的运行状态之后,还包括:若所述非目标图像识别模型和所述目标图像识别模型的运行状态均是未运行,则直接运行所述目标图像识别模型对所述待识别图像进行图像识别,得到所述图像识别结果,其中,若非目标图像识别模型和目标图像识别模型的运行状态均是未运行,通过直接运行目标图像识别模型对待识别图像进行图像识别,有效地提高了对待识别图像的识别效率。
步骤S30,若任一所述非目标图像识别模型的运行状态是运行中,且所述目标图像识别模型的运行状态是未运行,则停止对应所述非目标图像识别模型的运行,并运行所述目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果。
其中,若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,通过停止对应非目标图像识别模型的运行,有效地防止了非目标图像识别模型和目标图像识别模型同时运行所导致的图像识别错误。
例如,当本实施例中的图像识别模型包括图像识别模型a1、图像识别模型a2和图像识别模型a3,根据图像识别指令的指令标识确定到的目标图像识别模型是图像识别模型a2,当图像识别模型a1的运行状态是运行中,图像识别模型a2是未运行时,则停止图像识别模型a1的运行,并当停止图像识别模型a1运行后,运行图像识别模型a2对待识别图像进行图像识别,得到该图像识别结果。
步骤S40,若所述非目标图像识别模型的运行状态均是未运行,且所述目标图像识别模型的运行状态是运行中,则发送图像重置提醒。
其中,该图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行待识别图像的识别,该图像重置提醒可以采用文字、语音或图像等方式对用户进行提醒。
可选的,该步骤中,通过获取该待识别图像的图像标识,并将该图像标识插入至预设提醒语句中的指定位置,以生成该图像重置提醒,该预设提醒语句可以根据需求进行文字设置,例如,该预设提醒语句可以设置为“是否重新运行目标图像识别模型,并对()进行图像识别?”,其中“()”是预设提醒语句中的指定位置。
步骤S50,若接收到针对所述图像重置提醒的确定指令,则指示所述目标图像识别模型对所述待识别图像进行图像识别,得到所述图像识别结果。
可选的,本实施例中,若在预设时间内未接收到针对该图像重置提醒的确定指令,或接收到了针对该图像重置提醒的取消指令,则持续获取该目标图像识别模型的运行状态,直至当检测到该目标图像识别模型的运行状态是未运行时,则重新运行该目标图像识别模型,并根据运行后的目标图像识别模型对该待识别图像进行图像识别,得到该图像识别结果。
进一步地,本实施例中,所述指示所述目标图像识别模型对所述待识别图像进行图像识别,得到所述图像识别结果之后,还包括:若接收到针对待识别图像的模型切换指令,则根据该模型切换指令的指令标识确定待切换图像识别模型,并获取待切换图像识别模型的运行状态;
若待切换图像识别模型的运行状态是未运行,则停止目标图像识别模型的运行,并运行该待切换图像识别模型对待识别图像进行图像识别;
其中,通过停止目标图像识别模型的运行,并运行该待切换图像识别模型对待识别图像进行图像识别,使得本地模型运行环境中仅有一个图像识别模型处理运行中的状态,提高了图形识别的准确性,且基于模型切换指令,有效地保障了用户对待识别图像不同的识别需求,提高了用户的使用体验。
本实施例中,通过获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型,能根据用户的需求自动选择对应识别效果的图像识别模型,无需用户手动的进行图像识别模型的选择,方便了用户的图像识别操作,提高了图像识别效率,通过分别获取目标图像识别模型和非目标图像识别模型的运行状态,有效地提高了目标图像识别模型运行的准确性,若任一非目标图像识别模型的运行状态是运行中,通过停止对应非目标图像识别模型的运行,有效地防止了非目标图像识别模型和目标图像识别模型同时运行所导致的图像识别错误,进一步提高了图像识别的准确性。
步骤S31,根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,并获取目标类别对应的物体在待识别图像中的位置信息。
其中,通过目标图像识别模型对待识别图像中的物体进行分类识别,能有效的对待识别图像中的物体进行分类,得到该物体对应的目标类别,并通过获取该目标类别对应的物体在待识别图像中的位置信息,有效地方便了对该物体位置信息识别结果的展示,方便了用户对图像识别结果的查看。
具体的,该步骤中,根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,包括:根据目标图像识别模型对待识别图像进行图像灰度处理,得到灰度图像,并提取灰度图像中物体对应的灰度直方图,其中,可以指示目标图像识别模型采用灰度分量法、灰度最大值法或灰度加权平均法的方式,对该待识别图像中的像素点进行灰度处理,以达到将待识别图像转换为灰度图像的效果;
将提取到的灰度直方图与预存储的类别查询表进行匹配,得到目标类别,其中,该类别查询表中存储有不同灰度直方图与对应类别之间的对应关系,该灰度直方图是关于灰度级分布的函数,是对灰度图像中灰度级分布的统计,灰度直方图是将灰度图像中的所有像素,按照灰度值的大小,统计其出现的频率,该灰度图像中像素的个数反映了灰度图像中对应灰度出现的频率。
步骤S32,若所述目标类别不是预设类别,则将获取到的所述位置信息和所述位置信息对应的所述目标类别进行对应存储,得到所述图像识别结果。其中,通过将获取到的位置信息和位置信息对应的目标类别进行对应存储,有效地提高了图像识别结果展示的准确性,该步骤中,通过将对应存储后的位置信息和目标类别进行展示,以达到对待识别图像的识别结果展示效果。
步骤S33,若所述目标类别是所述预设类别,则根据所述目标图像识别模型对所述目标类别对应的所述物体进行姿态分析,得到姿态分析结果,并将同一所述物体对应的所述姿态分析结果、所述位置信息和所述目标类别对应进行存储,得到所述图像识别结果。
其中,该预设类别可以根据需求进行设置,例如,该预设类别可以设置为“行人”“动物”“植物”或“汽车”等类别,若目标类别不是预设类别,则判定针对该目标类别对应的物体无需进行姿态分析。
该步骤中,若目标类别是预设类别,则判定针对该目标类别对应的物体需进行姿态分析,因此,通过目标图像识别模型对目标类别对应的物体进行姿态分析,以得到该物体对应的姿态分析结果。
进一步地,该步骤中,通过将同一物体对应的姿态分析结果、位置信息和目标类别对应进行存储,以达到对该物体同时进行姿态分析结果、位置信息和目标类别的展示效果,方便了用户对该待识别图像中物体类别、姿态和位置的查看。
具体的,该步骤中,根据目标图像识别模型对目标类别对应的物体进行姿态分析,得到姿态分析结果,包括:获取目标类别对应的关节节点,并根据目标图像识别模型,获取待识别图像中物体上关节节点的位置坐标,其中,本实施例中预存储有关节查询表,该关节查询表中存储有不同类别与对应关节节点之间的对应关系,因此,通过将该目标类别与关节查询表进行匹配,得到该目标类别对应的关节节点,并通过获取待识别图像中物体上关节节点的位置坐标,有效地提高了对该物体姿态分析的准确性;获取关节节点之间的姿态顺序,并根据姿态顺序对获取到的位置坐标进行连接,得到姿态图像,该姿态图像用于表征对应物体的动作姿态;将姿态图像与预存储的姿态列表进行匹配,得到姿态分析结果,其中,该姿态列表中存储有不同姿态图像与对应姿态分析结果之间的对应关系。
本实施例中,通过获取该目标类别对应的物体在待识别图像中的位置信息,有效地方便了对该物体位置信息识别结果的展示,方便了用户对图像识别结果的查看,若目标类别不是预设类别,通过将获取到的位置信息和位置信息对应的目标类别进行对应存储,有效地提高了图像识别结果展示的准确性,若目标类别是预设类别,则判定针对该目标类别对应的物体需进行姿态分析,通过目标图像识别模型对目标类别对应的物体进行姿态分析,以得到该物体对应的姿态分析结果。
在操作S201,响应于图像识别请求,获取图像识别请求中携带的待识别图像的第一灰度图像数据和识别类型。
在操作S202,对第一灰度图像数据进行二值化处理,得到第二灰度图像数据。
在操作S203,根据识别类型,基于待识别图像的初始图像数据和第二灰度图像数据来确定目标图像数据。
在操作S204,将目标图像数据输入到与识别类型对应的图像识别模型中,输出得到待识别图像的识别结果。
根据本公开的实施例,图像识别请求可以是请求对图像内的对象进行识别,待识别对象可以是图像中文字、颜色等元素,或者也可以是图像中的设备、设备的指示灯、设备的显示屏等,在此不作限定。
根据本公开的实施例,待识别图像可以是包括待识别对象的图像。待识别图像可以通过巡检机器人等巡检设备拍摄机柜内的设备而得到的图像,也可以是预先获取并存储在本地的待识别的图像。
根据本公开的实施例,第一灰度图像数据可以是将待识别图像的图像数据映射到灰度空间后得到的图像数据。即第一灰度图像数据可以是通过将待识别图像的每个像素点的图像数据映射为0~255之间的一个数值而得到的。
根据本公开的实施例,识别类型可以是与该待识别对象相对应的的类型。例如,文字识别类型、颜色识别类型、形状识别类型等。具体地,在待识别对象为设备的型号、设备显示屏中的文字信息等的情况下,识别类型可以是文字识别类型;在待识别对象为指示灯颜色等的情况下,识别类型可以是颜色识别类型;在待识别对象为设备、设备的指示灯、设备的显示屏等的情况下,待识别类型可以是形状识别类型。
图像获取模块200,所述图像获取模块200获取投标文件的图像;区域图像获取模块300,所述区域图像获取模块300识别出所述图像中数据的位置,截取出含有数据的区域图像;数据获取模块400,所述数据获取模块400将含有数据的区域图像处理后输入神经网络模型中,输出数据,还包括区域图像处理模块,所述区域图像处理模块识别出区域图像内的表格区域内的文字blob块所述数据获取模块将表格中大blob输入神经网络进行识别,所述神经网络为卷积神经网络,该网络的结构包括:第一卷积层、第一下采样层、第二卷积层、第二下才采样层、第三卷积层、softmax层,输出为字符。所述数据获取模块在MatConvNet环境下搭建神经网络。还包括纠偏模块,所述纠偏模块将含有数据的区域图像纠偏。
实施例二:
参照图6,一种基于人工智能的图像识别的方法以及相关装置,可以应用于终端设备中包含图像识别的功能的系统或程序中,通过获取输入图像;然后将输入图像输入目标模型中的预设识别网络,以得到注意力图,注意力图中包含注意力区域,并基于注意力区域对注意力图进行图像调整得到增强图像,并根据增强图像对预设识别网络进行训练,以得到目标识别网络;进一步的将输入图像输入目标识别网络,以得到图像特征图;进而将图像特征图输入目标模型中的分级识别网络,以得到第一类型标签和第二类型标签,其中,分级识别网络包括一级标签分支和二级标签分支,一级标签分支用于确定输入图像的第一类型标签,二级标签分支用于识别输入图像的第二类型标签,第一类型标签和第二类型标签用于指示同一目标对象,且第二类型标签对于目标对象描述粒度小于第一类型标签对于目标对象描述粒度。从而实现基于注意力区域引导的图像分级识别过程,由于采用注意力图中的注意力区域进行增强图像的获取,使得模型专注于关键部位的数据学习,并采用分级识别的方式进行展现,使得图像中的细节部分得以识别,提高了图像识别的准确性。
本实施例与实施例一的不同之处在于:没有实施例一好。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种图像智能识别装置,包括图像获取单元,用于获取图像识别指令和图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型;运行状态获取单元,用于分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除所述目标图像识别模型之外的图像识别模型;图像识别单元,用于若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果;重置提醒单元,用于若非目标图像识别模型的运行状态均是未运行,且目标图像识别模型的运行状态是运行中,则发送图像重置提醒,图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行待识别图像的识别;图像识别单元还用于,若接收到针对图像重置提醒的确定指令,则指示目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
2.根据权利要求1所述的一种图像智能识别方法,其特征在于:包括:获取图像识别指令和所述图像识别指令所指向的待识别图像,并根据图像识别指令的指令标识确定目标图像识别模型;分别获取目标图像识别模型和非目标图像识别模型的运行状态,非目标图像识别模型为除所述目标图像识别模型之外的图像识别模型;若任一非目标图像识别模型的运行状态是运行中,且目标图像识别模型的运行状态是未运行,则停止对应非目标图像识别模型的运行,并运行目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果;若非目标图像识别模型的运行状态均是未运行,且目标图像识别模型的运行状态是运行中,则发送图像重置提醒,所述图像重置提醒用于提示用户对运行中的目标图像识别模型是否进行所述待识别图像的识别;若接收到针对图像重置提醒的确定指令,则指示目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
3.根据权利要求2所述的一种图像智能识别方法,其特征在于:所述运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果,包括:根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,并获取目标类别对应的物体在待识别图像中的位置信息;若目标类别不是预设类别,则将获取到的位置信息和位置信息对应的目标类别进行对应存储,得到图像识别结果;若目标类别是预设类别,则根据目标图像识别模型对目标类别对应的物体进行姿态分析,得到姿态分析结果,并将同一所述物体对应的姿态分析结果、位置信息和目标类别对应进行存储,得到图像识别结果。
4.根据权利要求2所述的一种图像智能识别方法,其特征在于:所述根据目标图像识别模型对待识别图像中的物体进行分类识别,得到目标类别,包括:根据目标图像识别模型对待识别图像进行图像灰度处理,得到灰度图像,并提取灰度图像中物体对应的灰度直方图;将提取到的灰度直方图与预存储的类别查询表进行匹配,得到目标类别,所述类别查询表中存储有不同灰度直方图与对应类别之间的对应关系,所述根据目标图像识别模型对目标类别对应的物体进行姿态分析,得到姿态分析结果,包括:获取目标类别对应的关节节点,并根据目标图像识别模型,获取待识别图像中物体上关节节点的位置坐标;获取关节节点之间的姿态顺序,并根据姿态顺序对获取到的位置坐标进行连接,得到姿态图像;将姿态图像与预存储的姿态列表进行匹配,得到姿态分析结果,所述姿态列表中存储有不同姿态图像与对应姿态分析结果之间的对应关系。
5.根据权利要求2所述的一种图像智能识别方法,其特征在于:所述分别获取目标图像识别模型和非目标图像识别模型的运行状态,包括:获取目标图像识别模型的运行参数,并根据运行参数确定目标图像识别模型的运行状态;获取本地模型运行环境中的负载标识,所述负载标识用于表征本地模型运行环境中是否存在运行中的图像识别模型,并根据负载标识确定非目标图像识别模型的运行状态,停止对应非目标图像识别模型的运行,并运行目标图像识别模型对所述待识别图像进行图像识别,得到图像识别结果,包括:获取负载标识中携带的模型标识,所述负载标识中携带的模型标识用于表征对应非目标图像识别模型,并停止模型标识所指向的运行线程;对目标图像识别模型分配运行内存,并运行目标图像识别模型对应的运行程序;将待识别图像输入运行后的目标图像识别模型进行图像识别,得到图像识别结果。
6.根据权利要求2所述的一种图像智能识别方法,其特征在于:所述分别获取目标图像识别模型和非目标图像识别模型的运行状态之后,还包括:若非目标图像识别模型和目标图像识别模型的运行状态均是未运行,则直接运行目标图像识别模型对待识别图像进行图像识别,得到图像识别结果。
7.根据权利要求4所述的一种图像智能识别方法,其特征在于:包括:响应于图像识别请求,获取图像识别请求中携带的待识别图像的第一灰度图像数据和识别类型;对第一灰度图像数据进行二值化处理,得到第二灰度图像数据;根据识别类型,基于待识别图像的初始图像数据和第二灰度图像数据来确定目标图像数据;以及将目标图像数据输入到与识别类型对应的图像识别模型中,输出得到待识别图像的识别结果。所述识别类型包括文字识别和颜色识别;所述根据识别类型,基于待识别图像的初始图像数据和第二灰度图像数据来确定目标图像数据,包括:在识别类型为文字识别的情况下,确定目标图像数据为第二灰度图像数据;以及在识别类型为颜色识别的情况下,根据第二灰度图像数据中像素点的灰度值来处理初始图像数据,以得到目标图像数据,第二灰度图像数据中像素点的灰度值为第一灰度值或第二灰度值;所述根据第二灰度图像数据中像素点的灰度值来处理初始图像数据,以得到目标图像数据。
8.根据权利要求7所述的一种图像智能识别方法,其特征在于:包括:将初始图像数据和第二灰度图像数据置入预设参考系中,以确定初始图像数据中的各个像素点和第二灰度图像数据中的各个像素点在预设参考系中的位置信息;根据第二灰度图像数据中灰度值为所述第一灰度值的所有像素点的位置信息,确定位置信息集合;根据位置信息集合,从初始图像数据中确定目标像素点;以及将初始图像数据中所有目标像素点的值修改为预设值,以得到目标图像数据。所述将目标图像数据输入到与识别类型对应的图像识别模型中,输出得到待识别图像的识别结果,包括:在识别类型为图像识别的情况下,将目标图像数据输入到图像识别模型中,输出得到表征待识别图像中的图像内容的所述识别结果;以及在识别类型为颜色识别的情况下,将目标图像数据输入到颜色识别模型中,输出得到表征待识别图像的颜色的识别结果。
9.根据权利要求1所述的一种图像智能识别装置模块,其特征在于:包括:图像获取模块,所述图像获取模块获取投标文件的图像;区域图像获取模块,所述区域图像获取模块识别出所述图像中数据的位置,截取出含有数据的区域图像;数据获取模块,所述数据获取模块将含有数据的区域图像处理后输入神经网络模型中,输出数据。
10.根据权利要求1所述的一种图像智能识别装置及方法,其特征在于:还包括区域图像处理模块,所述区域图像处理模块识别出区域图像内的表格区域内的文字blob块所述数据获取模块将表格中大blob输入神经网络进行识别,所述神经网络为卷积神经网络,该网络的结构包括:第一卷积层、第一下采样层、第二卷积层、第二下才采样层、第三卷积层、softmax层,输出为字符。所述数据获取模块在MatConvNet环境下搭建神经网络。还包括纠偏模块,所述纠偏模块将含有数据的区域图像纠偏。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311028721.9A CN117152497A (zh) | 2023-08-15 | 2023-08-15 | 一种图像智能识别装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311028721.9A CN117152497A (zh) | 2023-08-15 | 2023-08-15 | 一种图像智能识别装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117152497A true CN117152497A (zh) | 2023-12-01 |
Family
ID=88899790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311028721.9A Withdrawn CN117152497A (zh) | 2023-08-15 | 2023-08-15 | 一种图像智能识别装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117152497A (zh) |
-
2023
- 2023-08-15 CN CN202311028721.9A patent/CN117152497A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109142366B (zh) | 球形外壳缺陷检测方法、装置及计算机可读存储介质 | |
US10885618B2 (en) | Inspection apparatus, data generation apparatus, data generation method, and data generation program | |
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
US10878283B2 (en) | Data generation apparatus, data generation method, and data generation program | |
CN110148130B (zh) | 用于检测零件缺陷的方法和装置 | |
US11176650B2 (en) | Data generation apparatus, data generation method, and data generation program | |
JP6869490B2 (ja) | 欠陥検査装置、欠陥検査方法、及びそのプログラム | |
KR102058427B1 (ko) | 검사 장치 및 방법 | |
CN114266773B (zh) | 显示面板缺陷定位方法、装置、设备及存储介质 | |
CN110596120A (zh) | 玻璃边界缺陷检测方法、装置、终端及存储介质 | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
US10726535B2 (en) | Automatically generating image datasets for use in image recognition and detection | |
CN111626177A (zh) | 一种pcb元件识别方法及装置 | |
CN114202532A (zh) | 一种喷涂缺陷的检测方法、装置、设备及存储介质 | |
CN114170227A (zh) | 产品表面缺陷检测方法、装置、设备及存储介质 | |
CN113537037A (zh) | 路面病害识别方法、系统、电子设备及存储介质 | |
CN116542975A (zh) | 一种玻璃面板的缺陷分类方法、装置、设备和介质 | |
KR101842535B1 (ko) | 부호의 광학적 검출 방법 | |
CN110532938B (zh) | 基于Faster-RCNN的纸质作业页码识别方法 | |
CN115731208A (zh) | 金属复杂面高精度缺陷检测方法、装置、设备及存储介质 | |
CN117351011B (zh) | 屏幕缺陷检测方法、设备和可读存储介质 | |
CN113435219B (zh) | 防伪检测方法、装置、电子设备及存储介质 | |
CN117152497A (zh) | 一种图像智能识别装置及方法 | |
CN112581472B (zh) | 一种面向人机交互的目标表面缺陷检测方法 | |
CN114332016A (zh) | 设备屏幕光斑检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20231201 |