CN114332867A - 一种钢印字符识别方法及系统 - Google Patents

一种钢印字符识别方法及系统 Download PDF

Info

Publication number
CN114332867A
CN114332867A CN202111644385.1A CN202111644385A CN114332867A CN 114332867 A CN114332867 A CN 114332867A CN 202111644385 A CN202111644385 A CN 202111644385A CN 114332867 A CN114332867 A CN 114332867A
Authority
CN
China
Prior art keywords
character recognition
character
algorithm
layer
cnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111644385.1A
Other languages
English (en)
Inventor
宫鹏涵
康小勇
曹金荣
贾云非
李晨
刘家儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA University of Science and Technology
Original Assignee
PLA University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA University of Science and Technology filed Critical PLA University of Science and Technology
Priority to CN202111644385.1A priority Critical patent/CN114332867A/zh
Publication of CN114332867A publication Critical patent/CN114332867A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种钢印字符识别方法及系统,该系统包括界面层:用户界面,用于软件和用户互动实时显示图像与数据信息;硬件层:连接摄像采集装置、打印机等硬件设备,用于采集枪支上钢印字符图像及打印标签;工作层:负责整体业务逻辑,及与用户间的信息交互;数据层:负责数据库管理,实现对数据的保存和查询的功能;算法层:负责基于硬件层采集到的图像进行图像处理,及字符识别;本发明优点在于模型小,训练速度快,且不需要进行字符分割和水平缩放操作,只需要垂直方向缩放到固定长度即可,同时可以识别任意长度的序列。

Description

一种钢印字符识别方法及系统
技术领域
本发明涉及字符识别技术领域,具体涉及用于枪支管理的钢印字符识别方法及系统。
背景技术
枪支是一种震慑犯罪的特殊工具,是指以火药或者压缩气体等为动力,利用管状器具发射金属弹丸或者其他物质,足以致人伤亡或者丧失知觉的武器,因此对于枪支的管理显得愈发重要,目前枪支出入库管理过程中枪支编码信息的读取仍然采用的是人工检视,手动录入的方法,枪号录入流程多,耗时长,工作量大,实现信息化可视化大数据监管难度较高,这样会导致在枪支使用的过程中,需要过多的人工进行参与枪支管理流程,如枪支的分发、枪支的维护保养以及枪支的归还等,从而容易造成在枪支收发过程中会耗费较多的时间成本和人力成本,进而会大大降低枪支收发管理的效率以及枪支分发时的安全性。
目前军队枪支管理中的许多工作,诸如数据录入、枪支清点和盘库等,仍然主要依靠人工来完成,不仅工作效率低、容易出差错,而且运行管理投入高,数据不能共享,枪支安全性无法得到有效保障,偶发被盗被抢事件甚至危及国家和人民的安全。为此我们提出了一种用于识别枪支上的钢印字符,实现枪支的管理,用来解决上述问题。
发明内容
为了解决上述技术问题,本发明所采用的技术方案是提供了一种钢印字符识别系统,包括:
界面层:用户界面,用于软件和用户互动实时显示图像与数据信息;
硬件层:连接摄像采集装置、打印机等硬件设备,用于采集枪支上钢印字符图像及打印标签;
工作层:负责整体业务逻辑,及与用户间的信息交互;
数据层:负责数据库管理,实现对数据的保存和查询的功能;
算法层:负责基于硬件层采集到的图像进行图像处理,及字符识别;
其中,
算法层实现字符识别集体包括以下步骤实现:
通过文本检测算法对硬件层采集到的图像进行文字检测并定位;
通过深度学习的文字识别算法对检测到的文字识别,特征提取,获得相应的字符串并输出。
在上述方法中,所述文字识别算法训练具体如下:
获取硬件层采集的大量历史图像,并对进行标记;
将带有标记的初始文字识别模型,直至文字识别模型训练完成。
在上述方法中,所述文本检测算法为CTPN、TextBoxes或EAST算法。
在上述方法中,所述文字识别模型为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC模型。
本发明还提供了一种钢印字符识别方法,包括步骤:
通过图像采集装置采集枪支上钢印字符图像及打印标签;
通过文本检测算法对采集到的图像进行文字检测并定位;
通过深度学习的文字识别算法对检测到的文字进行识别,特征提取,获得相应的字符串并输出。
在上述方法中,所述文字识别算法训练具体如下:
获取图像采集装置采集的大量历史钢印字符图像,并对其进行标记;
将带有标记的图像输入至初始文字识别模型,直至文字识别模型训练完成。
在上述方法中,所述文本检测算法为CTPN、TextBoxes或EAST算法。
在上述方法中,所述文字识别模型为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC模型。
本发明还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述钢印字符识别方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一项所述钢印字符识别方法。
本发明CTPN文字检测算法获取输入的图像中的钢印区作为目标区域并进行定位,使其变形为标准字符图片,训练好的CRNN模型对变形后的字符图片进行内容识别;优点在于模型小,训练速度快,且不需要进行字符分割和水平缩放操作,只需要垂直方向缩放到固定长度即可,同时可以识别任意长度的序列。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的网络结构示意图;
图2为本发明提供的CTPN结合CNN与LSTM深度网络文字检测的效果图;
图3为本发明提供的文字检测结果示意图;
图4为本发明提供的CNN+RNN+attention算法模型图示意图;
图5为本发明提供的识别出的字符串示意图;
图6为本发明提供的方法流程图;
图7为本发明提供的计算机设备示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语"中心"、"纵向"、"横向"、"长度"、"宽度"、"厚度"、"上"、"下"、"前"、"后"、"左"、"右"、"竖直"、"水平"、"顶"、"底"、"内"、"外"、"顺时针"、"逆时针"等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语"第一"、"第二"仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有"第一"、"第二"的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,"多个"的含义是两个或两个以上,除非另有明确具体的限定。此外,术语"安装"、"相连"、"连接"应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面结合具体实施方式和说明书附图对本发明做出详细的说明。
系统实施例
根据本发明实施例,提供了一种钢印字符识别系统,如图1所示,为本实施例提供的系统结构示意图,根据本发明实施例的钢印字符识别系统,包括:
界面层:用户界面,用于软件和用户互动实时显示图像与数据信息;
硬件层:连接摄像采集装置、打印机等硬件设备,用于采集枪支上钢印字符图像及打印标签;
工作层:负责整体业务逻辑,及与用户间的信息交互;
数据层:负责数据库管理,实现对数据的保存和查询的功能;
算法层:负责基于硬件层采集到的图像进行图像处理,及字符识别;
其中,
算法层实现字符识别集体包括以下步骤实现:
步骤1、通过包含CTPN、TextBoxes或EAST文本检测算法对硬件层采集到的图像进行文字检测并定位;
步骤2、通过深度学习的文字识别算法对检测到的文字进行识别,特征提取,获得相应的字符串并输出。
其中,文字识别算法训练具体如下:
获取硬件层采集的大量历史钢印字符图像,并对进行标记,本实施例中,通过人工标记;
将带有标记的图像输入至初始文字识别模型,直至文字识别模型训练完成。
本实施例,文字识别模型可为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC。
下面通过具体实施例说明本技术的字符串提取。
本实施例提供的CTPN的文本检测算法网络结构示意图,主体网络采用CTPN的文本检测算法,由Faster RCNN改进而来,且结合了CNN与LSTM深度网络,支持任意尺寸的图像输入,并能够直接在卷积层中定位文本行;CTPN结合CNN与LSTM深度网络,能有效的检测出复杂场景的横向分布的文字,效果如图2所示。
本实施例CTPN是由检测小尺度文本框、循环连接文本框、文本行边细化三个部分组成,具体实现流程为:
1.使用VGG16网络提取特征,得到conv5_3的特征图;
2.在所得特征图上使用3*3滑动窗口进行滑动,得到相应的特征向量;
3.将所有特征向量输入BLSTM,学习序列特征,然后连接一个全连接FC层;
4.最后结果输出层输出结果;
CTPN是基于Anchor的算法,在检测横向分布的文字时能得到较好的效果,而且引入BLST进一步提高了其检测能力,如图3所示,为文本检测结果图。
基于上述文字检测的结果,本实施例文字识别提取方法具体如下:
本实施例,文字识别网络算法采用的是CNN+RNN+attention算法模型来实现,本方法是基于视觉注意力的文字识别方法,如图4所示为本实施例提供的CNN+RNN+attention算法模型图,具体实现包括以下步骤:
1.基于文字检测结果,模型首先在图片上运行滑动CNN以提取特征;
2.将所得特征序列输入到堆叠在CNN顶部的LSTM进行特征序列的编码;
3.使用注意力模型进行解码,并输出标签序列,如图5所示,为识别出的字符串。
本实施例,CTPN文字检测算法获取输入的图像中的钢印区作为目标区域并进行定位,使其变形为标准字符图片,训练好的CRNN模型对变形后的字符图片进行内容识别;优点在于模型小,训练速度快,且不需要进行字符分割和水平缩放操作,只需要垂直方向缩放到固定长度即可,同时可以识别任意长度的序列。
方法实施例
根据本发明实施例,提供了一种钢印字符识别方法,如图6所示,为本实施例提供的方法流程图,根据本发明实施例的钢印字符识别方法,包括步骤:
S1、通过图像采集装置采集枪支上钢印字符图像及打印标签;
S2、通过文本检测算法对采集到的图像进行文字检测并定位;
S3、通过深度学习的文字识别算法对检测到的文字进行识别,特征提取,获得相应的字符串并输出;
其中,文字识别算法训练具体如下:
获取图像采集装置采集的大量历史钢印字符图像,并对其进行标记,本实施例中,通过人工标记;
将带有标记的图像输入至初始文字识别模型,直至文字识别模型训练完成。
本实施例,文字识别模型可为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC。
本实施例,文本检测采用的主体网络为CTPN算法,且文字识别与文本检测过程具体参考上述系统部分,本方法实施例不再赘述。
如图7所示,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中钢印字符识别系统,或者计算机程序被处理器执行时实现上述实施例中钢印字符识别系统。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种钢印字符识别系统,其特征在于,包括:
界面层:用户界面,用于软件和用户互动实时显示图像与数据信息;
硬件层:连接摄像采集装置、打印机硬件设备,用于采集枪支上钢印字符图像及打印标签;
工作层:负责整体业务逻辑,及与用户间的信息交互;
数据层:负责数据库管理,实现对数据的保存和查询的功能;
算法层:负责基于硬件层采集到的图像进行图像处理,及字符识别;
其中,
算法层实现字符识别集体包括以下步骤实现:
通过文本检测算法对硬件层采集到的图像进行文字检测并定位;
通过深度学习的文字识别算法对检测到的文字识别,特征提取,获得相应的字符串并输出。
2.如权利要求1所述的钢印字符识别系统,其特征在于,所述文字识别算法训练具体如下:
获取硬件层采集的大量历史图像,并对进行标记;
将带有标记的初始文字识别模型,直至文字识别模型训练完成。
3.如权利要求1所述的钢印字符识别系统,其特征在于,所述文本检测算法为CTPN、TextBoxes或EAST算法。
4.如权利要求1所述的钢印字符识别系统,其特征在于,所述文字识别模型为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC模型。
5.一种钢印字符识别方法,其特征在于,包括步骤:
通过图像采集装置采集枪支上钢印字符图像及打印标签;
通过文本检测算法对采集到的图像进行文字检测并定位;
通过深度学习的文字识别算法对检测到的文字进行识别,特征提取,获得相应的字符串并输出。
6.如权利要求5所述的钢印字符识别方法,其特征在于,所述文字识别算法训练具体如下:
获取图像采集装置采集的大量历史钢印字符图像,并对其进行标记;
将带有标记的图像输入至初始文字识别模型,直至文字识别模型训练完成。
7.如权利要求5所述的钢印字符识别方法,其特征在于,所述文本检测算法为CTPN、TextBoxes或EAST算法。
8.如权利要求5所述的钢印字符识别方法,其特征在于,所述文字识别模型为CNN+softmax、CNN+RNN+attention、CNN+stacked或CNN+CTC模型。
9.计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求5至8任一项所述钢印字符识别方法。
10.计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求5至8任一项所述钢印字符识别方法。
CN202111644385.1A 2021-12-30 2021-12-30 一种钢印字符识别方法及系统 Pending CN114332867A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111644385.1A CN114332867A (zh) 2021-12-30 2021-12-30 一种钢印字符识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111644385.1A CN114332867A (zh) 2021-12-30 2021-12-30 一种钢印字符识别方法及系统

Publications (1)

Publication Number Publication Date
CN114332867A true CN114332867A (zh) 2022-04-12

Family

ID=81017943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111644385.1A Pending CN114332867A (zh) 2021-12-30 2021-12-30 一种钢印字符识别方法及系统

Country Status (1)

Country Link
CN (1) CN114332867A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183233A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船牌识别方法及系统
CN112446370A (zh) * 2020-11-24 2021-03-05 东南大学 一种电力设备铭牌文本信息识别的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183233A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船牌识别方法及系统
CN112446370A (zh) * 2020-11-24 2021-03-05 东南大学 一种电力设备铭牌文本信息识别的方法

Similar Documents

Publication Publication Date Title
WO2020232872A1 (zh) 表格识别方法、装置、计算机设备和存储介质
WO2018166116A1 (zh) 车损识别方法、电子装置及计算机可读存储介质
WO2021114612A1 (zh) 目标重识别方法、装置、计算机设备和存储介质
CN103793702A (zh) 基于协同尺度学习的行人重识别方法
CN110059688B (zh) 图片信息识别方法、装置、计算机设备和存储介质
CN109446873A (zh) 手写字体识别方法、系统以及终端设备
CN108364037A (zh) 识别手写汉字的方法、系统及设备
CN113837151A (zh) 表格图像处理方法、装置、计算机设备及可读存储介质
US20160055178A1 (en) Method for swiftly searching for target objects
CN111985467B (zh) 聊天记录截图处理方法、装置、计算机设备和存储介质
Akter et al. Advancements in animal tracking: Assessing deep learning algorithms
CN110580507B (zh) 一种城市肌理分类识别方法
Arsenovic et al. Deep learning driven plates recognition system
CN116229552A (zh) 一种基于yolov7模型的面向嵌入式硬件的人脸识别方法
CN111291741A (zh) 单据识别方法、装置、计算机设备和存储介质
CN114332867A (zh) 一种钢印字符识别方法及系统
CN115063804A (zh) 印章识别和防伪检测方法和系统
CN115761781B (zh) 一种用于工程电子档案笔记图像数据识别系统
Calefati et al. Reading meter numbers in the wild
CN117765555A (zh) 基于字迹检测的古籍文本图像排序召回方法,系统及装置
Raja Utilizing YOLO 8x Models, Deep Learning-Based Head protector Detection for Construction Workers
CN110852713A (zh) 一种统一信用代码证识别系统和算法
CN108984776A (zh) 一种可自动更新且精准识别产品的智能化识别系统
Deepa et al. An intelligent invoice processing system using tesseract OCR
RU2560789C1 (ru) Способ идентификации печати на цифровом изображении

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination