CN108229506A - 基于层次聚类和深度学习的箱号识别方法 - Google Patents

基于层次聚类和深度学习的箱号识别方法 Download PDF

Info

Publication number
CN108229506A
CN108229506A CN201611144568.6A CN201611144568A CN108229506A CN 108229506 A CN108229506 A CN 108229506A CN 201611144568 A CN201611144568 A CN 201611144568A CN 108229506 A CN108229506 A CN 108229506A
Authority
CN
China
Prior art keywords
character
line
text
hierarchical clustering
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611144568.6A
Other languages
English (en)
Inventor
崔鹏飞
范柘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aware Information Technology Co ltd
Original Assignee
Shanghai Aware Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aware Information Technology Co ltd filed Critical Shanghai Aware Information Technology Co ltd
Priority to CN201611144568.6A priority Critical patent/CN108229506A/zh
Publication of CN108229506A publication Critical patent/CN108229506A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/273Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及基于层次聚类和深度学习的箱号识别方法,识别步骤如下:步骤1,首先通过单个字符检测算法得到候选字符区域;步骤2,通过字符过滤和字符合并得到真正的集装箱号码字符;步骤3,集装箱号码字符通过层次聚类算法得到候选的文本行;步骤4,过文本行过滤得到最终的集装箱箱号文本行;步骤5,对文本行中的单个字符采用深度学习技术进行识别,最终得到箱号的识别结果。

Description

基于层次聚类和深度学习的箱号识别方法
技术领域
本发明涉及基于层次聚类和深度学习的箱号识别方法,特别是涉及基于层次聚类和深度学习的箱号识别方法。
背景技术
集装箱作为国际运输业的重要组成部分,其应用范围和数量都在大幅度的增加。目前中国的集装箱运输呈现出了飞跃式的发展,货物量的大幅度增加给集装箱的追踪和统计提出了更高的要求,使得智能集装箱识别系统的研究和开发成为迫切的需求。
集装箱箱号识别是智能集装箱识别系统的一个关键技术,在实际应用中集装箱图像较为复杂,主要表现在以下方面:1.货运车停泊位置不固定,拍摄视角难以固定,使集装箱图像产生畸变。2.夜晚、早晨、傍晚的光照条件不同,此外,白天常存在强光照射,使得图像复杂化。3.雨、雪天气,箱体污染等因素对图像产生干扰。4.由于拍摄设备等原因,图像清晰度较低。
发明内容
本发明针对实际应用中集装箱成像条件较为复杂的背景下,提出了一种基于层次聚类和深度学习的箱号识别方法。能够克服多种复杂条件的影响,保持较高的识别率。
技术方案
基于层次聚类和深度学习的箱号识别方法。首先通过单个字符检测算法得到候选字符区域,然后通过字符过滤和字符合并得到真正的集装箱号码字符;集装箱号码字符通过层次聚类算法得到候选的文本行,再通过文本行过滤得到最终的集装箱箱号文本行;最后对得到的文本行进行识别,得到箱号的识别结果。识别整体流程图图1所示。
所述的基于层次聚类和深度学习的箱号识别方法,单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域,MSER算法基于分水岭的思想,其公式为,表示为Qi为第i个连通区域的面积,Δ为阈值的微小变化,v(i)小于阈值时,认为该区域为MSER。实际使用的时候,需要原图做一次MSER,原图取反后再做一次MSER,两次的结果取并。
所述的基于层次聚类和深度学习的箱号识别方法,因为箱体有些掉漆、破损、污渍等,也会被MSER算法误判为字符区域,所以要通过字符过滤规则进行过滤。字符过滤的规则如下:
(1)利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的,即认为是字符区域,不满足,则是非字符区域。
(2)取出字符区域对应的灰度图像,利用方差特征过滤非字符区域。满足规则,即认为是字符区域,不满足,则是非字符区域。
(3)利用致密度(Solidity)特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,contourNumber代表MSER区域白色前景点最小凸多边形的面积。
(4)利用Extent特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,rectArea代表MSER区域白色前景点最小外接矩形的面积。
(5)利用离心率特征过滤非字符区域。
(6)取出MSER区域对应的灰度图像,提取方向梯度直方图(Hog)特征,然后利用线性支持向量机分类器进行过滤非字符区域
所述的基于层次聚类和深度学习的箱号识别方法,经过字符过滤后,如果两个字符之间有重叠,则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形,分别为box1和box2。如果box1∩box2/box1∪box2>th,th为对应的门限,则舍弃掉面积较小的mser。
所述的基于层次聚类和深度学习的箱号识别方法,经过字符检测、字符过滤、字符合并之后,会得到真正的字符区域。因为集装箱号码是以文本行的形式存在的,所以要使相邻的单个字符能够连起来,生成相应的文本行。文本行的生成基于下列的假设:
(1)集装箱号里面的字母和数字位于一条直线上。
(2)集装箱号里面的字母和数字的的高度是一致的。
(3)集装箱号里面的字母和数字间隔是相等的。
文本行的生成步骤如下:
(1)寻找相邻的字符对,连接相邻字符的中心形成线段。
(2)对相邻的字符对线段进行聚类。
(3)根据聚类结果生成文本行。
相邻字符对的形成条件如下:
(1)两字符中心点的Y(或X)坐标小于两者高度较小值th倍,th为对应的门限。
(2)两字符高度较小值和较大值的比值小于th,th为对应的门限。
(3)两字符之间的间隔小于两字符高度较小值的th倍,th为对应的门限
(4)设A,B为两个字符,A和B应该互不包含,即th为对应的门限。
所述的基于层次聚类和深度学习的箱号识别方法,字符对聚类的规则:如果两个线段有公共端点,并且以公共点为起点的两个向量夹角接近于180度,则认为这两个线段在同一条直线上,聚类方法采用层次聚类算法。图2为两个字符对聚类的示意图,左边的图满足字符对聚类规则(两个向量夹角接近于180度),右边的图则不满足(两个向量夹角与180度相差太大)。
所述的基于层次聚类和深度学习的箱号识别方法,文层次聚类的结果可以以树状图体现出来,具有相同根节点的子节点可以认为是一类,如图3所示,AF为一类,BC为一类,DEG为一类。取出每个聚类结果包含的所有字符对,然后生成所有字符的最小外接矩形,即为文本行。
所述的基于层次聚类和深度学习的箱号识别方法,通常集装箱箱体会有一些干扰的字符,同样也会产生文本行,需要过滤掉由干扰产生的文本行,得到真正的集装箱字符区域。过滤方法是,对候选文本行对应区域的灰度图像提取方向梯度直方图特征,然后利用线性支持向量机分类器进行判别。
所述的基于层次聚类和深度学习的箱号识别方法,集装箱箱号的分布有两种类型:四位字母和六位数字是连接在一起的;四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔。所以经过文本行过滤后,文本行的识别也会出现两种情况:六位数字和四位字母在一个文本行里面;六位数字在一个文本行里面,四位字母在一个文本行里面。
四位字母和六位数字是连接在一起的设为类型1,四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔的设为类型2。箱号类型判断规则如下:
(1)利用噪声数字字母分类器寻找含有数字最多的文本行;
(2)如果(1)中文本行里面含有数字和字母的个数>=10,则为类型1,返回;
(3)利用数字字母分类器寻找含有字母最多的文本行和含有数字最多的文本行,字母文本行和数字文本行融合得到类型2。
所述的基于层次聚类和深度学习的箱号识别方法,箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法,深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器,前四位字母利用字母分类器进行识别,后六位数字利用数字分类器进行识别。
CNN的输入为48*48的彩色图像,包括8个卷积层、4个下采样层,2个全连接层。卷积层参数为卷积核的大小为3*3,步长为1,pad为1。下采样层采用最大值池化,卷积核大小为2*2,步长为2,pad为0。CNN最后输出为1152维的特征,最后送入SoftMax分类器进行分类。
本发明的有益效果:
1、本发明在实际应用中达到了较高的识别率,白天的识别率可以95%;夜晚的识别率可以达到85%;适用于刮风、下雨、下雪等多种复杂的场景。
2、提高了集装箱码头的现代化管理水平,只能识别代替了传统的人工读取和记录集装箱号码,提高了集装箱的通关速度。
附图说明
图1:集装箱箱号识别流程示意图;
图2:符合字符对聚类和不符合字符对聚类规则示意图;
图3:层次聚类示意图;
具体实施方式
实施例一:参见图1,本发明基于层次聚类和深度学习的箱号识别方法。首先通过单个字符检测算法得到候选字符区域,然后通过字符过滤和字符合并得到真正的集装箱号码字符;集装箱号码字符通过层次聚类算法得到候选的文本行,再通过文本行过滤得到最终的集装箱箱号文本行;最后对得到的文本行进行识别,得到箱号的识别结果。
实施例二:本实施例基于层次聚类和深度学习的箱号识别方法,单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域,MSER算法基于分水岭的思想,其公式为,表示为Qi为第i个连通区域的面积,Δ为阈值的微小变化,v(i)小于阈值时,认为该区域为MSER。实际使用的时候,需要原图做一次MSER,原图取反后再做一次MSER,两次的结果取并。
因为箱体有些掉漆、破损、污渍等,也会被MSER算法误判为字符区域,所以要通过字符过滤规则进行过滤。字符过滤的规则如下:
(1)利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的,即认为是字符区域,不满足,则是非字符区域。
(2)取出字符区域对应的灰度图像,利用方差特征过滤非字符区域。满足规则,即认为是字符区域,不满足,则是非字符区域。
(3)利用致密度(Solidity)特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,contourNumber代表MSER区域白色前景点最小凸多边形的面积。
(4)利用Extent特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,rectArea代表MSER区域白色前景点最小外接矩形的面积。
(5)利用离心率特征过滤非字符区域。
(6)取出MSER区域对应的灰度图像,提取方向梯度直方图(Hog)特征,然后利用线性支持向量机分类器进行过滤非字符区域
经过字符过滤后,如果两个字符之间有重叠,则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形,分别为box1和box2。如果box1∩box2/box1∪box2>th,th为对应的门限,则舍弃掉面积较小的mser。
实施例三:本实施例基于层次聚类和深度学习的箱号识别方法,在实施例二的基础上:经过字符检测、字符过滤、字符合并之后,会得到真正的字符区域。因为集装箱号码是以文本行的形式存在的,所以要使相邻的单个字符能够连起来,生成相应的文本行。文本行的生成基于下列的假设:
(1)集装箱号里面的字母和数字位于一条直线上。
(2)集装箱号里面的字母和数字的的高度是一致的。
(3)集装箱号里面的字母和数字间隔是相等的。
文本行的生成步骤如下:
(1)寻找相邻的字符对,连接相邻字符的中心形成线段。
(2)对相邻的字符对线段进行聚类。
(3)根据聚类结果生成文本行。
相邻字符对的形成条件如下:
(1)两字符中心点的Y(或X)坐标小于两者高度较小值th倍,th为对应的门限。
(2)两字符高度较小值和较大值的比值小于th,th为对应的门限。
(3)两字符之间的间隔小于两字符高度较小值的th倍,th为对应的门限
(4)设A,B为两个字符,A和B应该互不包含,即th为对应的门限。
字符对聚类的规则:如果两个线段有公共端点,并且以公共点为起点的两个向量夹角接近于180度,则认为这两个线段在同一条直线上,聚类方法采用层次聚类算法。图2为两个字符对聚类的示意图,左边的图满足字符对聚类规则(两个向量夹角接近于180度),右边的图则不满足(两个向量夹角与180度相差太大)。
文层次聚类的结果可以以树状图体现出来,具有相同根节点的子节点可以认为是一类,如图3所示,AF为一类,BC为一类,DEG为一类。取出每个聚类结果包含的所有字符对,然后生成所有字符的最小外接矩形,即为文本行。
实施例四:本实施例基于层次聚类和深度学习的箱号识别方法,在实施例三的基础上:通常集装箱箱体会有一些干扰的字符,同样也会产生文本行,需要过滤掉由干扰产生的文本行,得到真正的集装箱字符区域。过滤方法是,对候选文本行对应区域的灰度图像提取方向梯度直方图特征,然后利用线性支持向量机分类器进行判别。
实施例五:本实施例基于层次聚类和深度学习的箱号识别方法,与施例二、三、四不同的是:集装箱箱号的分布有两种类型:四位字母和六位数字是连接在一起的;四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔。所以经过文本行过滤后,文本行的识别也会出现两种情况:六位数字和四位字母在一个文本行里面;六位数字在一个文本行里面,四位字母在一个文本行里面。
四位字母和六位数字是连接在一起的设为类型1,四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔的设为类型2。箱号类型判断规则如下:
(1)利用噪声数字字母分类器寻找含有数字最多的文本行;
(2)如果(1)中文本行里面含有数字和字母的个数>=10,则为类型1,返回;
(3)利用数字字母分类器寻找含有字母最多的文本行和含有数字最多的文本行,字母文本行和数字文本行融合得到类型2。
实施例六:本实施例基于层次聚类和深度学习的箱号识别方法,在实施例五的基础上:箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法,深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器,前四位字母利用字母分类器进行识别,后六位数字利用数字分类器进行识别。
CNN的输入为48*48的彩色图像,包括8个卷积层、4个下采样层,2个全连接层。卷积层参数为卷积核的大小为3*3,步长为1,pad为1。下采样层采用最大值池化,卷积核大小为2*2,步长为2,pad为0。CNN最后输出为1152维的特征,最后送入SoftMax分类器进行分类。

Claims (15)

1.基于层次聚类和深度学习的箱号识别方法,其特征在于:识别步骤如下:
步骤1,首先通过单个字符检测算法得到候选字符区域;
步骤2,通过字符过滤和字符合并得到真正的集装箱号码字符;
步骤3,集装箱号码字符通过层次聚类算法得到候选的文本行;
步骤4,过文本行过滤得到最终的集装箱箱号文本行;
步骤5,对文本行中的单个字符采用深度学习技术进行识别,最终得到箱号的识别结果。
2.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征在于:单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域,MSER算法基于分水岭思想,其公式表示为Qi为第i个连通区域的面积,Δ为阈值的微小变化,v(i)小于阈值时,认为该区域为MSER;实际使用的时候,需要原图做一次MSER,原图取反后再做一次MSER,两次的结果取并。
3.根据权利要求2所述的基于层次聚类和深度学习的箱号识别方法,其特征在于:所述单个字符检测算法还需要通过字符过滤规则进行过滤,字符过滤的规则如下:
步骤11,利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的,即认为是字符区域,不满足,则是非字符区域。
步骤12,取出字符区域对应的灰度图像,利用方差特征过滤非字符区域。满足规则,即认为是字符区域,不满足,则是非字符区域。
步骤13,利用致密度(Solidity)特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,contourNumber代表MSER区域白色前景点最小凸多边形的面积。
步骤14,利用Extent特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,rectArea代表MSER区域白色前景点最小外接矩形的面积。
步骤15,利用离心率特征过滤非字符区域。
步骤16提取MSER区域对应的灰度图像,提取方向梯度直方图(Hog)特征,然后利用线性支持向量机分类器过滤非字符区域。
4.根据权利要求3所述的基于层次聚类和深度学习的箱号识别方法,其特征是:经过字符过滤后,如果两个字符之间有重叠,则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形,分别为box1和box2。如果box1∩box2/box1∪box2>th,th为对应的门限,则舍弃掉面积较小的mser。
5.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:经过字符检测、字符过滤、字符合并之后,会得到真正的字符区域,因为集装箱号码是以文本行的形式存在的,所以要使相邻的单个字符能够连起来,生成相应的文本行。
6.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:文本行的生成基于下列的假设:
(1)集装箱号里面的字母和数字位于一条直线上。
(2)集装箱号里面的字母和数字的的高度是一致的。
(3)集装箱号里面的字母和数字间隔是相等的。
7.根据权利要求6所述的基于层次聚类和深度学习的箱号识别方法,其特征是:生成文本行的步骤:
步骤31,寻找相邻的字符对,连接相邻字符的中心形成线段。
步骤32,对相邻的字符对线段进行聚类。
步骤33,根据聚类结果生成文本行。
8.根据权利要求7所述的基于层次聚类和深度学习的箱号识别方法,其特征是:相邻字符对的形成条件:
步骤311,两字符中心点的Y(或X)坐标小于两者高度较小值th倍,th为对应的门限。
步骤312,两字符高度较小值和较大值的比值小于th,th为对应的门限
步骤313,两字符之间的间隔小于两字符高度较小值的th倍,th为对应的门限
步骤314,设A,B为两个字符,A和B应该互不包含,即th为对应的门限。
9.根据权利要求6-8任一项所述的基于层次聚类和深度学习的箱号识别方法,其特征是:字符对聚类的规则:如果两个线段有公共端点,并且以公共点为起点的两个向量夹角接近于180度,则认为这两个线段在同一条直线上,聚类方法采用层次聚类算法。
10.根据权利要求6-9任一项所述的基于层次聚类和深度学习的箱号识别方法,其特征是:文本行生成:层次聚类的结果可以以树状图体现出来,具有相同根节点的子节点可以认为是一类,如图3所示,AF为一类,BC为一类,DEG为一类。取出每个聚类结果包含的所有字符对,然后生成所有字符的最小外接矩形,即为文本行。
11.根据权利要求6-10任一项所述的基于层次聚类和深度学习的箱号识别方法,其特征是:文本行过滤:通常集装箱箱体会有一些干扰的字符,同样也会产生文本行,需要过滤掉由干扰产生的文本行,得到真正的集装箱字符区域。过滤方法是,对候选文本行对应区域的灰度图像提取方向梯度直方图特征,然后利用线性支持向量机分类器进行判别。
12.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:集装箱箱号的分布有两种类型:四位字母和六位数字是连接在一起的;四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔。所以经过文本行过滤后,文本行的识别也会出现两种情况:六位数字和四位字母在一个文本行里面;六位数字在一个文本行里面,四位字母在一个文本行里面。
13.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:四位字母和六位数字是连接在一起的设为类型1,四位字母连接在一起,六位数字连接在一起,字母和数字之间有较大的间隔的设为类型2。箱号类型判断规则如下:
(1)利用噪声数字字母分类器寻找含有数字最多的文本行;
(2)如果(1)中文本行里面含有数字和字母的个数>=10,则为类型1,返回;
(3)利用数字字母分类器寻找含有字母最多的文本行和含有数字最多的文本行,字母文本行和数字文本行融合得到类型2。
14.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法,深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器,前四位字母利用字母分类器进行识别,后六位数字利用数字分类器进行识别。
15.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:CNN的输入为48*48的彩色图像,包括8个卷积层、4个下采样层,2个全连接层。卷积层参数为卷积核的大小为3*3,步长为1,pad为1。下采样层采用最大值池化,卷积核大小为2*2,步长为2,pad为0。CNN经过全连接层后的输出为1152维特征,最后送入SoftMax分类器进行分类。
CN201611144568.6A 2016-12-13 2016-12-13 基于层次聚类和深度学习的箱号识别方法 Pending CN108229506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611144568.6A CN108229506A (zh) 2016-12-13 2016-12-13 基于层次聚类和深度学习的箱号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611144568.6A CN108229506A (zh) 2016-12-13 2016-12-13 基于层次聚类和深度学习的箱号识别方法

Publications (1)

Publication Number Publication Date
CN108229506A true CN108229506A (zh) 2018-06-29

Family

ID=62638009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611144568.6A Pending CN108229506A (zh) 2016-12-13 2016-12-13 基于层次聚类和深度学习的箱号识别方法

Country Status (1)

Country Link
CN (1) CN108229506A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034248A (zh) * 2018-07-27 2018-12-18 电子科技大学 一种基于深度学习的含噪声标签图像的分类方法
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备
CN109344824A (zh) * 2018-09-21 2019-02-15 泰康保险集团股份有限公司 一种文本行区域检测方法、装置、介质和电子设备
CN109784272A (zh) * 2019-01-13 2019-05-21 南京邮电大学盐城大数据研究院有限公司 一种集装箱识别系统及集装箱识别方法
CN109886985A (zh) * 2019-01-22 2019-06-14 浙江大学 融合深度学习网络和分水岭算法的图像精确分割方法
CN110427909A (zh) * 2019-08-09 2019-11-08 杭州有盾网络科技有限公司 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN111382733A (zh) * 2018-12-28 2020-07-07 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统
CN111401142A (zh) * 2020-02-25 2020-07-10 杭州测质成科技有限公司 基于深度学习的航空发动机叶片金属表面蚀刻字符识别方法
CN112508133A (zh) * 2021-02-01 2021-03-16 聚时科技(江苏)有限公司 一种多模态信息融合的集装箱类型识别方法及系统
CN113903018A (zh) * 2021-03-22 2022-01-07 南京中理外轮理货有限公司 一种基于神经网络的集装箱号识别方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034248B (zh) * 2018-07-27 2022-04-05 电子科技大学 一种基于深度学习的含噪声标签图像的分类方法
CN109034248A (zh) * 2018-07-27 2018-12-18 电子科技大学 一种基于深度学习的含噪声标签图像的分类方法
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备
CN109344824A (zh) * 2018-09-21 2019-02-15 泰康保险集团股份有限公司 一种文本行区域检测方法、装置、介质和电子设备
CN109344824B (zh) * 2018-09-21 2022-06-10 泰康保险集团股份有限公司 一种文本行区域检测方法、装置、介质和电子设备
CN111382733B (zh) * 2018-12-28 2023-09-15 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统
CN111382733A (zh) * 2018-12-28 2020-07-07 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统
CN109784272A (zh) * 2019-01-13 2019-05-21 南京邮电大学盐城大数据研究院有限公司 一种集装箱识别系统及集装箱识别方法
CN109886985A (zh) * 2019-01-22 2019-06-14 浙江大学 融合深度学习网络和分水岭算法的图像精确分割方法
CN110427909A (zh) * 2019-08-09 2019-11-08 杭州有盾网络科技有限公司 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN111401142A (zh) * 2020-02-25 2020-07-10 杭州测质成科技有限公司 基于深度学习的航空发动机叶片金属表面蚀刻字符识别方法
CN112508133A (zh) * 2021-02-01 2021-03-16 聚时科技(江苏)有限公司 一种多模态信息融合的集装箱类型识别方法及系统
CN112508133B (zh) * 2021-02-01 2021-06-04 聚时科技(上海)有限公司 一种多模态信息融合的集装箱类型识别方法及系统
CN113903018A (zh) * 2021-03-22 2022-01-07 南京中理外轮理货有限公司 一种基于神经网络的集装箱号识别方法

Similar Documents

Publication Publication Date Title
CN108229506A (zh) 基于层次聚类和深度学习的箱号识别方法
CN105930791B (zh) 基于ds证据理论的多摄像头融合的路面交通标志识别方法
CN101877050B (zh) 一种车牌字符的自动提取方法
CN103839084B (zh) 一种应用于行人再识别的多核支持向量机多示例学习算法
Kuo et al. Two-stage road sign detection and recognition
CN104134079B (zh) 一种基于极值区域和极限学习机的车牌识别方法
CN107103317A (zh) 基于图像融合和盲反卷积的模糊车牌图像识别算法
CN101329734B (zh) 基于k-l变换和ls-svm的车牌字符识别方法
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
Pal et al. Automatic recognition of unconstrained off-line Bangla handwritten numerals
WO2022121039A1 (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN109460704B (zh) 一种基于深度学习的疲劳检测方法、系统和计算机设备
CN103488978B (zh) 一种基于灰度跳变和字符投影间隔模式的车牌定位方法
CN106845487A (zh) 一种端到端的车牌识别方法
CN107066933A (zh) 一种道路标牌识别方法及系统
CN106529532A (zh) 一种基于积分特征通道与灰度投影的车牌识别系统
CN103413119A (zh) 基于人脸稀疏描述子的单样本人脸识别方法
CN105528609A (zh) 一种基于字符位置的车牌定位方法
CN105760858A (zh) 一种基于类Haar中间层滤波特征的行人检测方法及装置
CN109886168B (zh) 一种基于层阶的地面交通标志识别方法
CN105117707A (zh) 一种基于区域图像的人脸表情识别方法
CN104598928A (zh) 一种基于类字典稀疏识别的车辆分类方法
CN104156701A (zh) 一种基于决策树和svm的车牌相似字符识别方法
Hamdi et al. Road signs classification by ANN for real-time implementation
CN111814917B (zh) 一种存在模糊态的字轮图像数字识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180629

WD01 Invention patent application deemed withdrawn after publication