CN109284678A - 路牌语义识别方法及系统 - Google Patents

路牌语义识别方法及系统 Download PDF

Info

Publication number
CN109284678A
CN109284678A CN201810942636.6A CN201810942636A CN109284678A CN 109284678 A CN109284678 A CN 109284678A CN 201810942636 A CN201810942636 A CN 201810942636A CN 109284678 A CN109284678 A CN 109284678A
Authority
CN
China
Prior art keywords
guideboard
image
identified
deep learning
identification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810942636.6A
Other languages
English (en)
Inventor
高三元
王晶
李晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kuandeng Beijing Technology Co ltd
Original Assignee
Kuandeng Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuandeng Beijing Technology Co ltd filed Critical Kuandeng Beijing Technology Co ltd
Priority to CN201810942636.6A priority Critical patent/CN109284678A/zh
Publication of CN109284678A publication Critical patent/CN109284678A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种路牌语义识别方法及系统,该路牌语义识别方法包括:步骤S1:对待识别路牌图像进行预处理;步骤S2:获取基于深度学习的OCR识别模型;步骤S3:采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。本发明提供的路牌语义识别方法,采用基于深度学习的OCR识别模型对待识别路牌图像进行识别,有利于提高识别结果的精准度。

Description

路牌语义识别方法及系统
技术领域
本发明涉及计算机技术领域,具体涉及一种路牌语义识别方法及系统。
背景技术
近年来,人工智能、自然语言识别、机器识别等逐渐成为热点,自动驾驶、智能机器人等行业均逐步实现自动化,其中,深度学习技术便是多种应用中的关键技术。通过深度学习,可以有效地解决图像自动识别的问题。
自动驾驶车辆需要对交通标志进行检测和分类,来学习路段的交通规则;然而目前市场中的对交通标志进行检测和分类的技术并不成熟,大部分情况下,都是根据交通标志的类别进行分类,根据交通标志的轮廓、形状以及标志中的部分固定的内容含义,比如说:可以识别出路牌中的箭头、图形,并判断其含义;也就是说,用此种办法只可以识别出部分交通标志的含义。
然而,对于目前国内的路牌指示标志,其种类多样复杂,不同地区的指示标志也会略有差异;单从路牌种类多样性的问题来讲,要求能识别每个路牌中每个指示的具体含义,从而能够促进自动驾驶技术的进一步推进,然而,目前市场中,对路牌语义的解析规则并不完整和规范,也因此导致语义识别存在误差,最终影响机器对路牌语义的解析。
发明内容
本发明的目的在于提供一种路牌语义识别方法及系统,有利于提高识别结果的精准度。
为实现上述目的,本发明的技术方案提供了一种路牌语义识别方法,包括:
步骤S1:对待识别路牌图像进行预处理;
步骤S2:获取基于深度学习的OCR识别模型;
步骤S3:采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
进一步地,所述步骤S1包括:
对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
进一步地,所述步骤S2包括:
利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
进一步地,所述步骤S2包括:
步骤S21:构建卷积神经网络模型;
步骤S22:获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
步骤S23:采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型。
为实现上述目的,本发明的技术方案还提供了一种路牌语义识别系统,包括:
预处理模块,用于对待识别路牌图像进行预处理;
获取模块,用于获取基于深度学习的OCR识别模型;
识别模块,用于采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
进一步地,所述预处理模块被配置为对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
进一步地,所述获取模块利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
进一步地,所述获取模块包括:
构建单元,用于构建卷积神经网络模型;
获取单元,用于获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
训练单元,用于采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型。
本发明提供的路牌语义识别方法,采用基于深度学习的OCR识别模型对待识别路牌图像进行识别,有利于提高识别结果的精准度。
附图说明
图1是本发明实施例提供的一种路牌语义识别方法的流程图;
图2是本发明实施例提供的一种OCR识别模型对路牌语义归类的示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
参见图1,图1是本发明实施例提供的一种路牌语义识别方法的流程图,该路牌语义识别方法包括:
步骤S1:对待识别路牌图像进行预处理;
步骤S2:获取基于深度学习的OCR(Optical Character Recognition,光学字符识别)识别模型;
步骤S3:采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
本发明实施例提供的路牌语义识别方法,采用基于深度学习的OCR识别模型对待识别路牌图像进行识别,有利于提高识别结果的精准度。
其中,在本实施例中,所述步骤S1包括:
对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
具体地,首先可以对待识别路牌图像进行图像分割处理,得到若干个图像块,每一个图像块只包含一种含义的交通标志,例如,若待识别路牌图像中包含3个不同含义的交通标志,可从中提取3个图像块;
之后对提取的图像块进行图像尺寸处理,将其处理为预设尺寸的图像,然后对其进行图像二值化处理;
其中,在本实施例中,所述步骤S2包括:
利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
具体地,所述步骤S2包括:
步骤S21:构建卷积神经网络模型;
步骤S22:获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
例如,参见图2,在本实施例中,路牌可以分类为多含义指示路牌以及单含义指示路牌;
其中,多含义指示路牌包含多种不同含义的交通标志,是在高速、城快或普通道路上较常见的路牌,其又包括四种分类:文字、图形、箭头、公路编号、数字标识,其中,文字指的是路牌中出现的中文含义;图形指的是路牌中部通常会有的立交桥形状图例以及所有固定含义的图片标识;箭头指的是路牌中用于引导、指示前方道路方向时的箭头;公路编号特指路牌中出现的带有底色的公路编号标志,包括:国家级高速公路、省级主干道公路、国道、省道、县道等;数字标识指的是路牌中包含的标识距离、速度等含义的数字。
单含义指示路牌指的是小众分类的、一个路牌只表示一种含义的情况,需要将单含义路牌中的文字或箭头或数字信息识别,以确定具体含义。
具体地,在采集不同种类的路牌图像后,可通过上述分类方式对路牌图像进行标注分类,从而得到训练样本集;
步骤S23:采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型;
具体地,首先对训练样本集的每一个训练样本(即路牌图像)进行预处理,包括图像分割处理、图像尺寸处理以及图像二值化处理,然后采用预处理后得到的图像对构建的卷积神经网络模型进行训练,从而得到所需的OCR识别模型。
本发明实施例提供的路牌语义识别方法,有利于覆盖更多的使用场景(可达到覆盖95%以上的场景),通过采用更加合理的语义分类,能有效提高判断路牌语义的准确度,且还可正确还原部分信息在路牌中的位置,更有利于判断语义信息的精准性。
此外,本发明实施例还提供了一种路牌语义识别系统,包括:
预处理模块,用于对待识别路牌图像进行预处理;
获取模块,用于获取基于深度学习的OCR识别模型;
识别模块,用于采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
在一实施例中,所述预处理模块被配置为对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
在一实施例中,所述获取模块利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
在一实施例中,所述获取模块包括:
构建单元,用于构建卷积神经网络模型;
获取单元,用于获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
训练单元,用于采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (8)

1.一种路牌语义识别方法,其特征在于,包括:
步骤S1:对待识别路牌图像进行预处理;
步骤S2:获取基于深度学习的OCR识别模型;
步骤S3:采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
2.根据权利要求1所述的路牌语义识别方法,其特征在于,所述步骤S1包括:
对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
3.根据权利要求1所述的路牌语义识别方法,其特征在于,所述步骤S2包括:
利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
4.根据权利要求3所述的路牌语义识别方法,其特征在于,所述步骤S2包括:
步骤S21:构建卷积神经网络模型;
步骤S22:获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
步骤S23:采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型。
5.一种路牌语义识别系统,其特征在于,包括:
预处理模块,用于对待识别路牌图像进行预处理;
获取模块,用于获取基于深度学习的OCR识别模型;
识别模块,用于采用所述基于深度学习的OCR识别模型对经过所述预处理的待识别路牌图像进行识别。
6.根据权利要求5所述的路牌语义识别系统,其特征在于,所述预处理模块被配置为对所述待识别路牌图像进行图像分割处理、图像尺寸处理以及图像二值化处理。
7.根据权利要求5所述的路牌语义识别系统,其特征在于,所述获取模块利用卷积神经网络模型得到所述基于深度学习的OCR识别模型。
8.根据权利要求7所述的路牌语义识别系统,其特征在于,所述获取模块包括:
构建单元,用于构建卷积神经网络模型;
获取单元,用于获取训练样本集,所述训练样本集包括若干个已标注分类的路牌图像;
训练单元,用于采用所述训练样本集对所述卷积神经网络模型进行训练,从而得到所述基于深度学习的OCR识别模型。
CN201810942636.6A 2018-08-17 2018-08-17 路牌语义识别方法及系统 Pending CN109284678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810942636.6A CN109284678A (zh) 2018-08-17 2018-08-17 路牌语义识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810942636.6A CN109284678A (zh) 2018-08-17 2018-08-17 路牌语义识别方法及系统

Publications (1)

Publication Number Publication Date
CN109284678A true CN109284678A (zh) 2019-01-29

Family

ID=65183220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810942636.6A Pending CN109284678A (zh) 2018-08-17 2018-08-17 路牌语义识别方法及系统

Country Status (1)

Country Link
CN (1) CN109284678A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860084A (zh) * 2019-04-30 2020-10-30 千寻位置网络有限公司 图像特征的匹配、定位方法及装置、定位系统
CN112070086A (zh) * 2020-09-09 2020-12-11 平安科技(深圳)有限公司 文本识别系统的优化方法、计算机设备及存储介质
CN112967000A (zh) * 2021-03-11 2021-06-15 中工美(北京)供应链物流管理有限责任公司 白银仓储自动入库系统的外观和重量识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009548A (zh) * 2018-01-09 2018-05-08 贵州大学 一种智能路牌识别方法及系统
CN108021862A (zh) * 2016-11-03 2018-05-11 福特全球技术公司 道路标志识别
WO2018125926A1 (en) * 2016-12-27 2018-07-05 Datalogic Usa, Inc Robust string text detection for industrial optical character recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021862A (zh) * 2016-11-03 2018-05-11 福特全球技术公司 道路标志识别
WO2018125926A1 (en) * 2016-12-27 2018-07-05 Datalogic Usa, Inc Robust string text detection for industrial optical character recognition
CN108009548A (zh) * 2018-01-09 2018-05-08 贵州大学 一种智能路牌识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数平精准推荐团队: "《OCR技术之识别篇》", 《微信公众号-腾讯大数据》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860084A (zh) * 2019-04-30 2020-10-30 千寻位置网络有限公司 图像特征的匹配、定位方法及装置、定位系统
CN111860084B (zh) * 2019-04-30 2024-04-16 千寻位置网络有限公司 图像特征的匹配、定位方法及装置、定位系统
CN112070086A (zh) * 2020-09-09 2020-12-11 平安科技(深圳)有限公司 文本识别系统的优化方法、计算机设备及存储介质
WO2021169363A1 (zh) * 2020-09-09 2021-09-02 平安科技(深圳)有限公司 文本识别系统的优化方法、计算机设备及存储介质
CN112070086B (zh) * 2020-09-09 2024-05-07 平安科技(深圳)有限公司 文本识别系统的优化方法、计算机设备及存储介质
CN112967000A (zh) * 2021-03-11 2021-06-15 中工美(北京)供应链物流管理有限责任公司 白银仓储自动入库系统的外观和重量识别方法

Similar Documents

Publication Publication Date Title
CN106778757B (zh) 基于文本显著性的场景文本检测方法
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
CN101122953B (zh) 一种图片文字分割的方法
CN102332096B (zh) 一种视频字幕文本提取和识别的方法
CN111860348A (zh) 基于深度学习的弱监督电力图纸ocr识别方法
CN107392141B (zh) 一种基于显著性检测和lsd直线检测的机场提取方法
CN103870803A (zh) 一种基于粗定位与精定位融合的车牌识别方法和系统
CN112016605B (zh) 一种基于边界框角点对齐和边界匹配的目标检测方法
Sulaiman et al. Development of automatic vehicle plate detection system
CN105574513A (zh) 文字检测方法和装置
CN105574550A (zh) 一种车辆识别方法及装置
CN101221623B (zh) 一种物体类型的在线训练和识别方法及其系统
CN106156766A (zh) 文本行分类器的生成方法及装置
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
CN101329731A (zh) 图像中数学公式的自动识别方法
CN105469047A (zh) 基于无监督学习深度学习网络的中文检测方法及系统
CN109697397B (zh) 一种目标检测方法及装置
CN111027443B (zh) 一种基于多任务深度学习的票据文本检测方法
CN109284678A (zh) 路牌语义识别方法及系统
Al Faqheri et al. A real-time Malaysian automatic license plate recognition (M-ALPR) using hybrid fuzzy
CN107330365A (zh) 基于最大稳定极值区域和svm的交通标志识别方法
CN105279506A (zh) 满文单词中轴线的定位方法
Pandya et al. Morphology based approach to recognize number plates in India
Riaz et al. YOLO based recognition method for automatic license plate recognition
Cao et al. An end-to-end neural network for multi-line license plate recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190129