CN111598082A - 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法 - Google Patents

一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法 Download PDF

Info

Publication number
CN111598082A
CN111598082A CN202010330322.8A CN202010330322A CN111598082A CN 111598082 A CN111598082 A CN 111598082A CN 202010330322 A CN202010330322 A CN 202010330322A CN 111598082 A CN111598082 A CN 111598082A
Authority
CN
China
Prior art keywords
text
network
thermodynamic diagram
prediction
electric power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010330322.8A
Other languages
English (en)
Other versions
CN111598082B (zh
Inventor
李仕林
赵旭
李正志
李梅玉
张�诚
李宏杰
杨勇
樊蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202010330322.8A priority Critical patent/CN111598082B/zh
Publication of CN111598082A publication Critical patent/CN111598082A/zh
Application granted granted Critical
Publication of CN111598082B publication Critical patent/CN111598082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,属于计算机视觉与模式识别技术领域。首先利用基于VGG16网络的卷积层对电力铭牌图像进行文本/非文本预测提取和不同实例之间的链接预测的提取;然后利用实例分割网络对目标图像进行分割并输出电力铭牌相应的热力图表示,同时利用全卷积网络对目标图像进行语义分割,获得边缘较为准确的实例热力图,接着将两个网络所得的热力图进行融合得到目标热力图;最后基于所得目标热力图生成文本边界框,得到电力铭牌文本检测的最终结果。本发明提出的关于电力铭牌的文本检测方法,不管是从主观视觉还是从客观评价指标上,检测效果和准确率明显优于其他的传统方法。

Description

一种基于全卷积网络与实例分割网络的电力铭牌文本检测 方法
技术领域
本发明属于计算机视觉与模式识别技术领域,具体涉及一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法。
背景技术
在计算机视觉与模式识别领域,文本检测技术由于文本的长度与文字排布的不规则性而区别于目标检测技术,对于文本检测技术的研究越来越受到广大研究者的热衷,针对于不同视角的文本,不同排列方式的文本:环形,矩形,平行四边形等,研究者们提出了很多的针对不同文本的文本检测技术方法。所谓的文本检测技术就是利用神经网络对目标图像进行特征提取,将图像中与文本相关的信息提取出来,并利用相应的边界框去把文本信息给标注出来。文本检测技术的应用领域比较广泛,在无人驾驶,车牌识别,电力铭牌识别,公共安全和计算机视觉等方面都有着极其重要的应用场景。对于电力铭牌中的文本检测,大多数文本都是成矩形排列,但是由于拍摄视角的不同,有不少的铭牌图像中的文本属于平行四边形排列。而目前主流的文本检测技术主要有基于VGG16网络的CTPN技术,基于VGG16的SegLink技术,两者都主要是通过利用对文本生成一系列的小矩形框,然后通过分数评价需要保留的矩形框,再通过框与框之间的链接,把所有的矩形框连接起来形成文本检测的边界框。虽然这操作的计算量比较大,但仍然是文本检测的主流技术。而经过研究者们的日夜研究,目前的新方法不再需要对文本生成一系列的小矩形框,通过对图像中文本进行实例分割,并通过像素级别的细化处理,能够大大降低计算量的同时,达到比较好的实验效果。
通常在现实中的文本排列不规则和拍摄视角的不同而导致一种文本检测技术往往不能同时在不同文本排列上实现想要的结果,到目前为止还没有一种文本技术能同时在不同文本排列或者不同拍摄视角的图像上实现等同的实验效果。为此,在对于不同的文本进行检测时,往往需要采用不同的技术,而没有一种较为通用的技术可以涵盖大部分文本,对于规则排列的矩形样本的方法一般不适用于圆形或者环形排列的样本。而我们日常生活中的大部分文本排列都是以矩形排列为主,所以大部分技术都是针对于矩形文本排列,或者增加多一点适用性,对于平行四边形排列的文本也能实现较好的实验结果,对于电力铭牌中的文本检测,我们需要的就是能同时适用于矩形排列和平行四边形排列方式的文本检测技术。。
发明内容
本发明的目的在于克服现有文本检测系统适应性不高、无法全方位准确识别的问题,提出了一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法。
本发明采用如下技术方案:
一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,其关键在于,包括以下步骤:
S1.输入目标电力铭牌图像,利用基于VGG16的全卷积神经网络,进行文本预测和非文本预测,其预测结果用热力图A表示;
S2.对所述目标电力铭牌图像不同方向分别进行链接预测,其预测结果均采用热力图表示,随后将不同方向的预测结果的热力图进行融合操作得到热力图B;
S3.利用全卷积网络对所述目标电力铭牌图像进行语义分割预测提取,得到对应的热力图C;
S4.利用实例分割网络对所述热力图A和热力图B进行关于每一个实例的分割,得出对应的分割效果较好、边界较为分明的热力图D;
S5.将所述热力图C与所述热力图D进行融合操作得到热力图E;
S6.基于所述热力图E,利用边界框生成网络生成出所述目标铭牌的文本检测边界框。
作为优选方案,步骤S2需要对所述目标电力铭牌图像从8个不同方向分别进行链接预测,其方向包括左边、左下、左上、右边、右下、右上、上边和下边,8个不同方向分别输出不同的热力图。
作为优选方案,步骤S2中所述目标电力铭牌图像从不同方向分别进行链接预测的预测结果需要利用滤波器对融合后的热力图进行噪声系成分的过滤后才能得到所述热力图B。
作为优选方案,所述的全卷积网络模型公式为:
Figure BDA0002464723100000031
其中,yij表示网络的输出,k表示卷积核的大小,s是步长或者次采样因子,fks决定的是层的类型:卷积层或者是平均池化层的矩阵乘法,或者是激活函数的非线性元素乘法等其他类型的层。
有益效果:本发明主要利用了全卷积网络对于物体的边缘比较敏感,能够很精确的检测出物体的边缘的特性,不仅对于物体和背景具有好的实验效果,对于电力铭牌中的文本和其单一的背景颜色的边缘部分也是如此,全卷积网络能够精确的提取出文本的边缘,能使得网络生成的边界框更加的贴合文本,而由于电力铭牌背景的单一性,此方法能够更加精确的把铭牌中的文本信息给框选出来,将其提取的结果作用于实例分割对文本的相对精确的检测输出,将两者融合之后,得到的文本边界框能够更加的贴合文本信息,能使得电力铭牌上的文本检测实现更好的效果。
附图说明
图1为本发明实施例的流程图;
图2为本发明的整体框架图;
图3为实施例中热力图A;
图4为目标电力铭牌图像的八个不同方向的链接预测热力图;
图5为目标电力铭牌图像的实例分割后对应的热力图D与文本边界框输出;
图6为本发明经全卷积网络细调之后的电力铭牌的热力图E与文本边界框输出结果。
具体实施方式
下面结合附图对本发明作进一步的详细说明:
实施例:
如附图1-6所示,一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,包括以下步骤:
S1.输入目标电力铭牌图像,利用基于VGG16的全卷积神经网络,进行文本预测和非文本预测,其预测结果用热力图A表示;
S2.对所述目标电力铭牌图像从8个不同方向分别进行链接预测,其方向包括左边、左下、左上、右边、右下、右上、上边和下边,8个不同方向分别输出不同的热力图,并对8个热力图分别进行链接预测,其预测结果均采用热力图表示,各方向热力图如附图4所示,随后将不同方向的预测结果的热力图进行融合操作得到热力图B;
S3.利用全卷积网络对所述目标电力铭牌图像进行语义分割预测提取,得到对应的热力图C;
S4.利用实例分割网络对所述热力图A和热力图B进行关于每一个实例的分割,得出对应的分割效果较好、边界较为分明的热力图D;
S5.将所述热力图C与所述热力图D进行融合操作得到热力图E;
S6.基于所述热力图E,利用边界框生成网络生成出所述目标铭牌的文本检测边界框。
在具体实施的时候,其具体操作步骤如下:
Step1、输入电力铭牌图像,利用预训练好的VGG16网络对图像进行特征提取,在利用1*1卷积核进行处理时,为其文本/非文本预测分配2个1*1卷积核,则输出1个2通道的文本/非文本预测热力图,用A表示。为链接预测分配16个1*1卷积核,输出8个2通道的链接预测热力图,8个分别代表从左边,左下,左上,右边,右下,右上,上边,下边八个不同方向所进行的预测(结果如图4所示);
Step2、将输入的电力铭牌图像利用全卷积网络进行语义分割提取生成对应的热力图C,所述全卷积网络的模型为:
Figure BDA0002464723100000041
其中,yij表示网络的输出,k表示卷积核的大小,s是步长或者次采样因子,fks决定的是层的类型:卷积层或者是平均池化层的矩阵乘法,或者是激活函数的非线性元素乘法等其他类型的层;
Step3、通过实例分割网络对目标电力铭牌图像的文本/非文本预测热力图A和链接预测热力图B进行文本实例分割得到热力图C,并输出分割之后的热力图C与电力铭牌目标图像对应的热力图D,在实例分割网络中,对像素级别和链接级别的预测分配两个不同的阈值,超过阈值的积极像素通过积极链接预测链接在一起,以此来代表检测到的文本实例。在对两个相邻积极像素进行链接预测时,链接预测由两者共同决定,当它们其中一个链接预测为积极样本或者两个链接预测都是积极样本时,将两者链接在一起,这个链接过程可以使用不相交的数据结构来实现,在实验时两个预测阈值都被设置为0.8;
Step4、对于实例分割后所得的电力铭牌热力图D,因为在像素进行链接的过程中不可避免的有噪声干扰,所以需要利用一个滤波器将噪声成分给过滤掉。对于训练数据中的图像样本,将训练集中第99百分数选择为过滤的阈值,例如10作为阈值,训练数据集中99%的文本实例的最短边像素个数都大于10,而低于10像素的部分我们就可以视为噪声分量过滤掉;
Step5、将Step4中所得的电力铭牌热力图D与Step2中所得的热力图C进行一个融合操作,把实例分割得到的较为准确的文本实例热力图与经由全卷积网络语义分割提取的边缘信息比较精确的热力图结合起来,能得到边缘准确,内容精确的结果,其融合后的电力铭牌热力图表示为E;
Step6、基于Step5的电力铭牌热力图E,采用类似minAreaRect的方法,提取出我们最终的需要的文本边界框,minAreaRect的输出为一个定向矩形,这里可以灵活选择其他的边界框生成方法。本发明方法没有对文本边界框进行方向的约束,所以对于倾斜的文本排列也能实现较好的实验结果,其输出不同于minAreaRect的定向矩形,输出结果有可能为平行四边形,其能基本覆盖所有的有关电力铭牌中的文本检测,实验的最终输出如图5所示。
除了主观上对文本检测的精确度结果进行评价之外,客观评价也是必不可少的。在实验中,采用召回率Recall,精确率Precision和F分数(F-score)三个客观评价指标对不同的方法下的关于电力铭牌中文本检测效果和精确度进行了评价。其中Recall指标就是所有准确的条目有多少被检索出来了,能说明在文本检测的边界框中,正确区分正确的文本检测边界框和错误的文本检测边界框;Precision则表示检索出来的文本检测边界框有多少是准确的,能反映出在生成的边界框中,精确边界框的比例;F-score则是前两者的调和平均数,因为一般情况下,我们需要在保证召回率的条件下,尽量的提升精确度。精确度的数值越大越能证明该文本检测方法性能越好。表1数据表明本发明方法在客观评价上具有较高的指标值,这从客观上也证明了本发明方法是有效的。
总的来说,本发明所提出的基于全卷积网络对实例分割结果进行细调提升电力铭牌中文本检测准确度的方法,利用了全卷积网络对于目标边缘提取的精确性高的特性,使得经由实例分割之后再与全卷积网络输出热力图进行融合,能够得到与文本实例更加紧密的文本边界框,同时也能保证文本检测的准确性。
表1:不同文本检测方法的客观评价数据
方法\评价指标 Recall Precision F-score
本发明 83.6 87.4 85.4
SegLink+VGG16 76.8 73.1 75.0
CTPN+VGG16 51.6 74.2 60.9
最后需要说明的是,上述描述仅仅为本发明的优选实施例,本领域的普通技术人员在本发明的启示下,在不违背本发明宗旨及权利要求的前提下,可以做出多种类似的表示,这样的变换均落入本发明的保护范围之内。

Claims (4)

1.一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,其特征在于,包括以下步骤:
S1.输入目标电力铭牌图像,利用基于VGG16的全卷积神经网络,进行文本预测和非文本预测,其预测结果用热力图A表示;
S2.对所述目标电力铭牌图像不同方向分别进行链接预测,其预测结果均采用热力图表示,随后将不同方向的预测结果的热力图进行融合操作得到热力图B;
S3.利用全卷积网络对所述目标电力铭牌图像进行语义分割预测提取,得到对应的热力图C;
S4.利用实例分割网络对所述热力图A和热力图B进行关于每一个实例的分割,得出对应的分割效果较好、边界较为分明的热力图D;
S5.将所述热力图C与所述热力图D进行融合操作得到热力图E;
S6.基于所述热力图E,利用边界框生成网络生成出所述目标铭牌的文本检测边界框。
2.根据权利要求书1所述的一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,其特征在于:步骤S2需要对所述目标电力铭牌图像从8个不同方向分别进行链接预测,其方向包括左边、左下、左上、右边、右下、右上、上边和下边,8个不同方向分别输出不同的热力图。
3.根据权利要求书1或2所述的一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,其特征在于:步骤S2中所述目标电力铭牌图像从不同方向分别进行链接预测的预测结果需要利用滤波器对融合后的热力图进行噪声系成分的过滤后才能得到所述热力图B。
4.根据权利要求书3所述的一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法,其特征在于:所述的全卷积网络模型公式为:
Figure FDA0002464723090000011
其中,yij表示网络的输出,k表示卷积核的大小,s是步长或者次采样因子,fks决定的是层的类型:卷积层或者是平均池化层的矩阵乘法,或者是激活函数的非线性元素乘法等其他类型的层。
CN202010330322.8A 2020-04-24 2020-04-24 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法 Active CN111598082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010330322.8A CN111598082B (zh) 2020-04-24 2020-04-24 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010330322.8A CN111598082B (zh) 2020-04-24 2020-04-24 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法

Publications (2)

Publication Number Publication Date
CN111598082A true CN111598082A (zh) 2020-08-28
CN111598082B CN111598082B (zh) 2023-10-17

Family

ID=72183569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010330322.8A Active CN111598082B (zh) 2020-04-24 2020-04-24 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法

Country Status (1)

Country Link
CN (1) CN111598082B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861739A (zh) * 2021-02-10 2021-05-28 中国科学技术大学 端到端文本识别方法、模型训练方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018101317A4 (en) * 2018-09-07 2018-10-11 Chen, Guoyi Mr A Deep Learning Based System for Animal Species Classification
CN108734169A (zh) * 2018-05-21 2018-11-02 南京邮电大学 一种基于全卷积网络改进的场景文本提取方法
CN108764228A (zh) * 2018-05-28 2018-11-06 嘉兴善索智能科技有限公司 一种图像中文字目标检测方法
CN109902622A (zh) * 2019-02-26 2019-06-18 中国科学院重庆绿色智能技术研究院 一种用于登机牌信息验证的文字检测识别方法
CN109948510A (zh) * 2019-03-14 2019-06-28 北京易道博识科技有限公司 一种文档图像实例分割方法及装置
CN110188766A (zh) * 2019-04-17 2019-08-30 平安科技(深圳)有限公司 基于卷积神经网络的图像主目标检测方法及装置
CN110956171A (zh) * 2019-11-06 2020-04-03 广州供电局有限公司 铭牌自动识别方法、装置、计算机设备和存储介质
CN110991448A (zh) * 2019-11-27 2020-04-10 云南电网有限责任公司电力科学研究院 电力设备铭牌图像的文本检测方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734169A (zh) * 2018-05-21 2018-11-02 南京邮电大学 一种基于全卷积网络改进的场景文本提取方法
CN108764228A (zh) * 2018-05-28 2018-11-06 嘉兴善索智能科技有限公司 一种图像中文字目标检测方法
AU2018101317A4 (en) * 2018-09-07 2018-10-11 Chen, Guoyi Mr A Deep Learning Based System for Animal Species Classification
CN109902622A (zh) * 2019-02-26 2019-06-18 中国科学院重庆绿色智能技术研究院 一种用于登机牌信息验证的文字检测识别方法
CN109948510A (zh) * 2019-03-14 2019-06-28 北京易道博识科技有限公司 一种文档图像实例分割方法及装置
CN110188766A (zh) * 2019-04-17 2019-08-30 平安科技(深圳)有限公司 基于卷积神经网络的图像主目标检测方法及装置
CN110956171A (zh) * 2019-11-06 2020-04-03 广州供电局有限公司 铭牌自动识别方法、装置、计算机设备和存储介质
CN110991448A (zh) * 2019-11-27 2020-04-10 云南电网有限责任公司电力科学研究院 电力设备铭牌图像的文本检测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
余峥;王晴晴;吕岳;: "基于特征融合网络的自然场景文本检测" *
应自炉;赵毅鸿;宣晨;邓文博;: "多特征融合的文档图像版面分析" *
熊彬程: "自然场景图像下文本检测的研究" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861739A (zh) * 2021-02-10 2021-05-28 中国科学技术大学 端到端文本识别方法、模型训练方法及装置
CN112861739B (zh) * 2021-02-10 2022-09-09 中国科学技术大学 端到端文本识别方法、模型训练方法及装置

Also Published As

Publication number Publication date
CN111598082B (zh) 2023-10-17

Similar Documents

Publication Publication Date Title
Mehta et al. Deepsolareye: Power loss prediction and weakly supervised soiling localization via fully convolutional networks for solar panels
CN105550701B (zh) 实时图像提取识别方法及装置
CN110826684B (zh) 卷积神经网络的压缩方法、装置、电子设备和介质
US10121245B2 (en) Identification of inflammation in tissue images
CN108334881B (zh) 一种基于深度学习的车牌识别方法
CN107133943A (zh) 一种防震锤缺陷检测的视觉检测方法
CN105354565A (zh) 基于全卷积网络人脸五官定位与判别的方法及系统
Park et al. MarsNet: multi-label classification network for images of various sizes
CN109063619A (zh) 一种基于自适应背景抑制滤波器和组合方向梯度直方图的交通信号灯检测方法和系统
CN109145964B (zh) 一种实现图像颜色聚类的方法和系统
CN106297755A (zh) 一种用于乐谱图像识别的电子设备及识别方法
CN112330616A (zh) 一种脑脊液细胞图像自动化识别和计数的方法
CN108764287B (zh) 基于深度学习和分组卷积的目标检测方法及系统
Zhu et al. A modified deep neural network enables identification of foliage under complex background
CN116012653A (zh) 一种注意力残差单元神经网络高光谱图像分类方法及系统
CN111611933A (zh) 文档图像的信息提取方法及系统
Song et al. A novel self-learning weighted fuzzy local information clustering algorithm integrating local and non-local spatial information for noise image segmentation
Zeeshan et al. A newly developed ground truth dataset for visual saliency in videos
CN111598082B (zh) 一种基于全卷积网络与实例分割网络的电力铭牌文本检测方法
Ju et al. A novel fully convolutional network based on marker-controlled watershed segmentation algorithm for industrial soot robot target segmentation
Mseddi et al. Real-time scene background initialization based on spatio-temporal neighborhood exploration
CN117372853A (zh) 一种基于图像增强和注意力机制的水下目标检测算法
CN104809438B (zh) 一种检测电子眼的方法和设备
CN111127407A (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
Kaufhold et al. Recognition and segmentation of scene content using region-based classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant