CN116563875B - 一种具有加密功能的智能图文识别方法及系统 - Google Patents
一种具有加密功能的智能图文识别方法及系统 Download PDFInfo
- Publication number
- CN116563875B CN116563875B CN202310815676.5A CN202310815676A CN116563875B CN 116563875 B CN116563875 B CN 116563875B CN 202310815676 A CN202310815676 A CN 202310815676A CN 116563875 B CN116563875 B CN 116563875B
- Authority
- CN
- China
- Prior art keywords
- layer
- input end
- output end
- contour
- adder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000000605 extraction Methods 0.000 claims description 29
- 238000011176 pooling Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种具有加密功能的智能图文识别方法及系统,属于数据处理技术领域,本发明先对图像灰度处理,便于提取轮廓图,在轮廓图提取后,对灰度值进行归一化处理,降低计算量,再对归一化轮廓图进行分类处理,得到图像上各个轮廓对象的类型,在存在文字类型时,从归一化轮廓图上提取出文字部分的文字轮廓图,避免其他非文字部分对文字识别过程的影响,提高文字识别精度,采用文字识别模型对文字轮廓图进行识别,得到文字信息,将文字信息和类型信息加密输出,避免识别方随意获取图文信息。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种具有加密功能的智能图文识别方法及系统。
背景技术
现有针对电子设备(例如扫描仪或数码相机)检查纸上打印的字符,采用光学字符识别技术OCR,但通常情况下,图和文字均在一个图像上,若仅采用光学字符识别技术OCR来识别图像上的文字,那么图像上的非文字部分则会干扰文字部分的检测,影响文字的识别精度。同时,现有识别文字的方法将识别后的文字直接展示出来,造成内容信息容易被窃取,不便于信息的管理。
发明内容
针对现有技术中的上述不足,本发明提供的一种具有加密功能的智能图文识别方法及系统解决了光学字符识别技术OCR存在识别精度不高,且信息容易被窃取的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种具有加密功能的智能图文识别方法,包括以下步骤:
S1、采集待识别图文的图像,并对图像灰度处理,得到灰度图;
S2、对灰度图提取轮廓,得到轮廓图;
S3、将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;
S4、对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;
S5、在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;
S6、采用文字识别模型对文字轮廓图进行处理,得到文字信息;
S7、将文字信息和对象类型加密输出,得到加密的图文信息。
进一步地,所述S2包括以下分步骤:
S21、设定轮廓提取窗口;
S22、采用轮廓提取窗口在灰度图上滑动;
S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点;
S24、判断当前待处理的像素点是否满足轮廓像素点条件,若是,则将当前待处理的像素点保留,作为轮廓图的像素点,若否,则将当前待处理的像素点剔除。
上述进一步地方案的有益效果为:轮廓提取窗口在灰度图上滑动,每滑动一次后,就要进行步骤S24的判断,判断轮廓提取窗口下中心像素点是否满足轮廓像素点条件,如果满足,则保留下来,如果不满足,则剔除,将轮廓像素点选出来,从而实现轮廓图的提取,通过轮廓提取窗口不断滑动实现对灰度图上像素点的遍历。
进一步地,所述S24中轮廓像素点条件为:
条件一:
,
条件二:
或/>,
其中,为轮廓提取窗口中第/>个像素点的灰度值,/>为当前待处理的像素点的灰度值,/>为灰度差阈值,/>为轮廓提取窗口下像素点数量,/>为当前待处理的像素点右侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧的第/>个像素点的灰度值,/>为当前待处理的像素点上侧的第/>个像素点的灰度值,/>为当前待处理的像素点下侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。
上述进一步地方案的有益效果为:上述条件一和条件二轮廓像素点均需满足,在条件一中,需要判断该像素点是否与周边像素点存在较大灰度差,若存在较大灰度差,则该像素点可能是在轮廓上,若不存在,则该像素点肯定不是轮廓像素点,在该像素点满足条件一的情况下,通过条件二尽可能的去避免该像素点为异常点的可能性,通过条件二中任一不等式,去判断该像素点周边像素值的分布情况,若该像素点为轮廓像素点则其周边像素点也存在轮廓像素点,因此其上下左右也存在满足条件二的像素点,通过条件二来进一步确定该像素点为轮廓像素点。
进一步地,所述S3中归一化处理的公式为:
,
其中,为第/>个像素点的归一化灰度值,/>为轮廓图上最大灰度值,/>为轮廓图上最小灰度值,/>为轮廓图上第/>个像素点的灰度值。
上述进一步地方案的有益效果为:本发明对轮廓图的灰度值归一化处理,减少计算量。
进一步地,所述S6中文字识别模型包括:CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络;
所述CNN神经网络的输入端作为文字识别模型的输入端,其输出端分别与最大池化层的输入端和平均池化层的输入端连接;所述第一LSTM层的输入端与最大池化层的输出端连接;所述第二LSTM层的输入端与平均池化层的输出端连接;所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接,其输出端与特征识别网络的输入端连接;所述特征识别网络的输出端作为文字识别模型的输出端。
进一步地,所述特征识别网络包括:第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层;
所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接,并作为特征识别网络的输入端;所述第一加法器A1的第二输入端与第一卷积块的输出端连接,其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端连接;所述第二卷积块的输出端与第二加法器A2的第二输入端连接;所述第二加法器A2的输出端与第三加法器A3的第二输入端连接;所述上采样层的输入端与第三加法器A3的输出端连接,其输出端与第一卷积层的输入端连接;所述第二卷积层的输入端与第一卷积层的输出端连接,其输出端作为特征识别网络的输出端。
上述进一步地方案的有益效果为:本发明中采用CNN神经网络提取特征,通过最大池化层和平均池化层再分别提取显著特征和全局特征,显著特征传输给第一LSTM层处理,全局特征传输给第二LSTM层处理,将第二LSTM层和第一LSTM层处理后的特征输入特征拼接层,进行特征拼接,再将拼接后的特征输入到特征识别网络中,进行文字识别,本发明为了解决梯度消失的问题,将特征拼接层连接到第三加法器A3,一方面能保障特征的丰富性,另一方面能增强部分特征的表达,提高识别精度。
进一步地,所述特征拼接层的表达式为:
,
,
,
其中,为特征拼接层的输出特征,/>为第一LSTM层输出后的压缩特征,/>为第二LSTM层输出后的压缩特征,/>为特征的长度,/>为特征的宽度,/>为第一LSTM层的输出特征第/>行第/>列元素,/>为第二LSTM层的输出特征第/>行第/>列元素,/>为激活函数,/>为第一权值,/>为第二权值,/>为特征拼接符号。
上述进一步地方案的有益效果为:本发明先对第一LSTM层和第一LSTM层输出后的特征进行压缩处理,实现数据空间上的融合,再将数据分别赋予不同权值,再采用激活函数解决梯度消失的问题,增强模型的适应性。
进一步地,所述S7包括以下分步骤:
S71、将文字信息和对象类型转成二进制码,得到信息向量;
S72、将信息向量进行切分,得到多份子信息向量;
S73、将每份子信息向量转成十进制数,得到多个信息值;
S74、采用加密序列中加密元素与信息值一对一相乘,得到加密的图文信息。
上述进一步地方案的有益效果为:本发明中将文字信息和对象类型转成二进制码,将二进制码构成的信息向量进行切分,实现对数据的第一层加密,再将每份子信息向量转成十进制数,得到信息值,再采用加密元素对信息值进行第二层加密,得到加密的图文信息,在解密时,将加密的图文信息除以加密元素,还原信息值,将信息值再转成二进制码,得到子信息向量,将子信息向量进行拼接,得到信息向量,实现一种快速的加密解密过程。
一种具有加密功能的智能图文识别方法的系统,包括:灰度处理单元、图文轮廓提取单元、归一化单元、分类单元、文字轮廓提取单元、文字识别单元和加密单元;
所述灰度处理单元用于采集待识别图文的图像,并对图像灰度处理,得到灰度图;所述图文轮廓提取单元用于对灰度图提取轮廓,得到轮廓图;所述归一化单元用于将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;所述分类单元用于对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;所述文字轮廓提取单元用于在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;所述文字识别单元用于采用文字识别模型对文字轮廓图进行处理,得到文字信息;所述加密单元用于将文字信息和对象类型加密输出,得到加密的图文信息。
综上,本发明的有益效果为:本发明先对图像灰度处理,便于提取轮廓图,在轮廓图提取后,对灰度值进行归一化处理,降低计算量,再对归一化轮廓图进行分类处理,得到图像上各个轮廓对象的类型,在存在文字类型时,从归一化轮廓图上提取出文字部分的文字轮廓图,避免其他非文字部分对文字识别过程的影响,提高文字识别精度,采用文字识别模型对文字轮廓图进行识别,得到文字信息,将文字信息和类型信息加密输出,避免识别方随意获取图文信息。
附图说明
图1为一种具有加密功能的智能图文识别方法的流程图;
图2为文字识别模型的结构示意图;
图3为第一LSTM层的输出门的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种具有加密功能的智能图文识别方法,包括以下步骤:
S1、采集待识别图文的图像,并对图像灰度处理,得到灰度图;
S2、对灰度图提取轮廓,得到轮廓图;
所述S2包括以下分步骤:
S21、设定轮廓提取窗口;
S22、采用轮廓提取窗口在灰度图上滑动;
S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点;
S24、判断当前待处理的像素点是否满足轮廓像素点条件,若是,则将当前待处理的像素点保留,作为轮廓图的像素点,若否,则将当前待处理的像素点剔除。
所述S24中轮廓像素点条件为:
条件一:
,
条件二:
或/>,
其中,为轮廓提取窗口中第/>个像素点的灰度值,/>为当前待处理的像素点的灰度值,/>为灰度差阈值,/>为轮廓提取窗口下像素点数量,/>为当前待处理的像素点右侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧的第/>个像素点的灰度值,/>为当前待处理的像素点上侧的第/>个像素点的灰度值,/>为当前待处理的像素点下侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。
在本实施例中,的大小根据需求进行选取。
S3、将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;
所述S3中归一化处理的公式为:
,
其中,为第/>个像素点的归一化灰度值,/>为轮廓图上最大灰度值,/>为轮廓图上最小灰度值,/>为轮廓图上第/>个像素点的灰度值。
S4、对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;
在步骤S4中,可采用YOLO神经网络实现对轮廓图上各个轮廓对象的分类。
S5、在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;
S6、采用文字识别模型对文字轮廓图进行处理,得到文字信息;
如图2所示,所述S6中文字识别模型包括:CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络;
所述CNN神经网络的输入端作为文字识别模型的输入端,其输出端分别与最大池化层的输入端和平均池化层的输入端连接;所述第一LSTM层的输入端与最大池化层的输出端连接;所述第二LSTM层的输入端与平均池化层的输出端连接;所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接,其输出端与特征识别网络的输入端连接;所述特征识别网络的输出端作为文字识别模型的输出端。
所述特征识别网络包括:第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层;
所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接,并作为特征识别网络的输入端;所述第一加法器A1的第二输入端与第一卷积块的输出端连接,其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端连接;所述第二卷积块的输出端与第二加法器A2的第二输入端连接;所述第二加法器A2的输出端与第三加法器A3的第二输入端连接;所述上采样层的输入端与第三加法器A3的输出端连接,其输出端与第一卷积层的输入端连接;所述第二卷积层的输入端与第一卷积层的输出端连接,其输出端作为特征识别网络的输出端。
在本实施例中,卷积块包括:卷积层、批归一化层和ReLU层。
对第一卷积块输出的特征施加权重W1,对第二卷积块输出的特征施加权重W2,对第二加法器A2输出的特征施加权重W3,实现自适应的关注重点特征,提高模型识别精度。
所述特征拼接层的表达式为:
,
,
,
其中,为特征拼接层的输出特征,/>为第一LSTM层输出后的压缩特征,/>为第二LSTM层输出后的压缩特征,/>为特征的长度,/>为特征的宽度,/>为第一LSTM层的输出特征第/>行第/>列元素,/>为第二LSTM层的输出特征第/>行第/>列元素,/>为激活函数,/>为第一权值,/>为第二权值,/>为特征拼接符号。
第一LSTM层和第二LSTM层之间共享状态量,两个LSTM层中输出门的表达式均为:
,
其中,为输出门第/>时刻的输出,/>为sigmoid激活函数,/>为输出门的第一权重,/>为输出门的第一偏置,/>为输出门的第二权重,/>为输出门的第二偏置,/>为双曲正切激活函数,/>为第一LSTM层的第/>时刻的状态量,/>为第二LSTM层的第/>时刻的状态量,/>为输出门第/>时刻的输出,/>为输出门第/>时刻的输入。
如图3所示,第一LSTM层的来自于第二LSTM层,同理,第二LSTM层的/>来自于第一LSTM层。
S7、将文字信息和对象类型加密输出,得到加密的图文信息。
所述S7包括以下分步骤:
S71、将文字信息和对象类型转成二进制码,得到信息向量;
S72、将信息向量进行切分,得到多份子信息向量;
S73、将每份子信息向量转成十进制数,得到多个信息值;
S74、采用加密序列中加密元素与信息值一对一相乘,得到加密的图文信息。
在本实施例,加密序列相当于是密码,在知道加密序列中所有元素的情况下,才能正确解密加密图文信息,在解密得到信息值后,还要进行二进制转换,转换后再拼接,才能实现完全解密,但本发明中的加密解密过程简单,不涉及复杂的计算公式,因此,本发明在保障数据安全的同时,也能快速加解密。
一种具有加密功能的智能图文识别方法的系统,包括:灰度处理单元、图文轮廓提取单元、归一化单元、分类单元、文字轮廓提取单元、文字识别单元和加密单元;
所述灰度处理单元用于采集待识别图文的图像,并对图像灰度处理,得到灰度图;所述图文轮廓提取单元用于对灰度图提取轮廓,得到轮廓图;所述归一化单元用于将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;所述分类单元用于对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;所述文字轮廓提取单元用于在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;所述文字识别单元用于采用文字识别模型对文字轮廓图进行处理,得到文字信息;所述加密单元用于将文字信息和对象类型加密输出,得到加密的图文信息。
在本实施例中,系统的具体实现过程与方法的具体实现过程一致。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种具有加密功能的智能图文识别方法,其特征在于,包括以下步骤:
S1、采集待识别图文的图像,并对图像灰度处理,得到灰度图;
S2、对灰度图提取轮廓,得到轮廓图;
S3、将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;
S4、对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;
S5、在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;
S6、采用文字识别模型对文字轮廓图进行处理,得到文字信息;
S7、将文字信息和对象类型加密输出,得到加密的图文信息;
所述S6中文字识别模型包括:CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络;
所述CNN神经网络的输入端作为文字识别模型的输入端,其输出端分别与最大池化层的输入端和平均池化层的输入端连接;所述第一LSTM层的输入端与最大池化层的输出端连接;所述第二LSTM层的输入端与平均池化层的输出端连接;所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接,其输出端与特征识别网络的输入端连接;所述特征识别网络的输出端作为文字识别模型的输出端;
所述特征识别网络包括:第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层;
所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接,并作为特征识别网络的输入端;所述第一加法器A1的第二输入端与第一卷积块的输出端连接,其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端连接;所述第二卷积块的输出端与第二加法器A2的第二输入端连接;所述第二加法器A2的输出端与第三加法器A3的第二输入端连接;所述上采样层的输入端与第三加法器A3的输出端连接,其输出端与第一卷积层的输入端连接;所述第二卷积层的输入端与第一卷积层的输出端连接,其输出端作为特征识别网络的输出端;
所述特征拼接层的表达式为:
,
,
,
其中,为特征拼接层的输出特征,/>为第一LSTM层输出后的压缩特征,/>为第二LSTM层输出后的压缩特征,/>为特征的长度,/>为特征的宽度,/>为第一LSTM层的输出特征第/>行第/>列元素,/>为第二LSTM层的输出特征第/>行第/>列元素,/>为激活函数,为第一权值,/>为第二权值,/>为特征拼接符号。
2.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S2包括以下分步骤:
S21、设定轮廓提取窗口;
S22、采用轮廓提取窗口在灰度图上滑动;
S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点;
S24、判断当前待处理的像素点是否满足轮廓像素点条件,若是,则将当前待处理的像素点保留,作为轮廓图的像素点,若否,则将当前待处理的像素点剔除。
3.根据权利要求2所述的具有加密功能的智能图文识别方法,其特征在于,所述S24中轮廓像素点条件为:
条件一:
,
条件二:
或/>,
其中,为轮廓提取窗口中第/>个像素点的灰度值,/>为当前待处理的像素点的灰度值,为灰度差阈值,/>为轮廓提取窗口下像素点数量,/>为当前待处理的像素点右侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧的第/>个像素点的灰度值,/>为当前待处理的像素点上侧的第/>个像素点的灰度值,/>为当前待处理的像素点下侧的第/>个像素点的灰度值,/>为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。
4.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S3中归一化处理的公式为:
,
其中,为第/>个像素点的归一化灰度值,/>为轮廓图上最大灰度值,/>为轮廓图上最小灰度值,/>为轮廓图上第/>个像素点的灰度值。
5.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S7包括以下分步骤:
S71、将文字信息和对象类型转成二进制码,得到信息向量;
S72、将信息向量进行切分,得到多份子信息向量;
S73、将每份子信息向量转成十进制数,得到多个信息值;
S74、采用加密序列中加密元素与信息值一对一相乘,得到加密的图文信息。
6.根据权利要求1~5任一项所述的具有加密功能的智能图文识别方法的系统,其特征在于,包括:灰度处理单元、图文轮廓提取单元、归一化单元、分类单元、文字轮廓提取单元、文字识别单元和加密单元;
所述灰度处理单元用于采集待识别图文的图像,并对图像灰度处理,得到灰度图;所述图文轮廓提取单元用于对灰度图提取轮廓,得到轮廓图;所述归一化单元用于将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;所述分类单元用于对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;所述文字轮廓提取单元用于在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;所述文字识别单元用于采用文字识别模型对文字轮廓图进行处理,得到文字信息;所述加密单元用于将文字信息和对象类型加密输出,得到加密的图文信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815676.5A CN116563875B (zh) | 2023-07-05 | 2023-07-05 | 一种具有加密功能的智能图文识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815676.5A CN116563875B (zh) | 2023-07-05 | 2023-07-05 | 一种具有加密功能的智能图文识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116563875A CN116563875A (zh) | 2023-08-08 |
CN116563875B true CN116563875B (zh) | 2023-09-08 |
Family
ID=87491844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310815676.5A Active CN116563875B (zh) | 2023-07-05 | 2023-07-05 | 一种具有加密功能的智能图文识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116563875B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN106096437A (zh) * | 2016-06-02 | 2016-11-09 | 努比亚技术有限公司 | 一种证件卡片管理装置和方法 |
CN111404676A (zh) * | 2020-03-02 | 2020-07-10 | 北京丁牛科技有限公司 | 安全隐秘的密钥与密文的生成、存储与传递方法和装置 |
CN112640083A (zh) * | 2018-08-30 | 2021-04-09 | 朗姆研究公司 | 使用识别符将边缘环零件号映射至槽号 |
CN112749606A (zh) * | 2020-03-05 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种文本定位方法和装置 |
CN112861648A (zh) * | 2021-01-19 | 2021-05-28 | 平安科技(深圳)有限公司 | 文字识别方法、装置、电子设备及存储介质 |
CN112926564A (zh) * | 2021-02-25 | 2021-06-08 | 中国平安人寿保险股份有限公司 | 图片分析方法、系统、计算机设备和计算机可读存储介质 |
CN114329030A (zh) * | 2021-11-25 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、计算机设备和存储介质 |
CN114821781A (zh) * | 2022-04-25 | 2022-07-29 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于红外微光望远镜的多源融合唇语识别方法和系统 |
CN115439857A (zh) * | 2022-11-03 | 2022-12-06 | 武昌理工学院 | 一种基于复杂背景图像的倾斜字符识别方法 |
CN115865523A (zh) * | 2023-02-14 | 2023-03-28 | 杭银消费金融股份有限公司 | 一种用于信息分析系统的数据加密传输方法 |
CN116110036A (zh) * | 2023-04-10 | 2023-05-12 | 国网江西省电力有限公司电力科学研究院 | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 |
CN116319117A (zh) * | 2023-05-26 | 2023-06-23 | 浙江御安信息技术有限公司 | 一种网络安全信息数据的实时分析监控方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8799671B2 (en) * | 2009-05-06 | 2014-08-05 | Empire Technology Development Llc | Techniques for detecting encrypted data |
-
2023
- 2023-07-05 CN CN202310815676.5A patent/CN116563875B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN106096437A (zh) * | 2016-06-02 | 2016-11-09 | 努比亚技术有限公司 | 一种证件卡片管理装置和方法 |
CN112640083A (zh) * | 2018-08-30 | 2021-04-09 | 朗姆研究公司 | 使用识别符将边缘环零件号映射至槽号 |
CN111404676A (zh) * | 2020-03-02 | 2020-07-10 | 北京丁牛科技有限公司 | 安全隐秘的密钥与密文的生成、存储与传递方法和装置 |
CN112749606A (zh) * | 2020-03-05 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种文本定位方法和装置 |
CN112861648A (zh) * | 2021-01-19 | 2021-05-28 | 平安科技(深圳)有限公司 | 文字识别方法、装置、电子设备及存储介质 |
CN112926564A (zh) * | 2021-02-25 | 2021-06-08 | 中国平安人寿保险股份有限公司 | 图片分析方法、系统、计算机设备和计算机可读存储介质 |
CN114329030A (zh) * | 2021-11-25 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、计算机设备和存储介质 |
CN114821781A (zh) * | 2022-04-25 | 2022-07-29 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于红外微光望远镜的多源融合唇语识别方法和系统 |
CN115439857A (zh) * | 2022-11-03 | 2022-12-06 | 武昌理工学院 | 一种基于复杂背景图像的倾斜字符识别方法 |
CN115865523A (zh) * | 2023-02-14 | 2023-03-28 | 杭银消费金融股份有限公司 | 一种用于信息分析系统的数据加密传输方法 |
CN116110036A (zh) * | 2023-04-10 | 2023-05-12 | 国网江西省电力有限公司电力科学研究院 | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 |
CN116319117A (zh) * | 2023-05-26 | 2023-06-23 | 浙江御安信息技术有限公司 | 一种网络安全信息数据的实时分析监控方法 |
Non-Patent Citations (1)
Title |
---|
面向医疗数据安全存储的增强混合加密方法;康海燕等;《北京理工大学学报》;第41卷(第10期);1058-1068 * |
Also Published As
Publication number | Publication date |
---|---|
CN116563875A (zh) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fang et al. | Screen-shooting resilient watermarking | |
CN111738244B (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
Patel et al. | Optical character recognition by open source OCR tool tesseract: A case study | |
US9542752B2 (en) | Document image compression method and its application in document authentication | |
US20140334736A1 (en) | Face recognition method and device | |
US9830508B1 (en) | Systems and methods of extracting text from a digital image | |
US10140510B2 (en) | Machine print, hand print, and signature discrimination | |
CN112070649B (zh) | 一种去除特定字符串水印的方法及系统 | |
CN108062668B (zh) | 基于后台图片加密识别的二维码支付方法与系统 | |
TWI765469B (zh) | 車牌辨識系統與方法及提取車牌中複數個字元段的方法 | |
CN101320425B (zh) | 图像处理装置及方法、图像形成装置 | |
Costa Filho et al. | A fully automatic method for recognizing hand configurations of Brazilian sign language | |
WO2024051770A1 (zh) | 一种智能设备真随机密钥生成方法、装置、终端及介质 | |
CN116563875B (zh) | 一种具有加密功能的智能图文识别方法及系统 | |
CN112581344A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
CN106055632B (zh) | 基于场景帧指纹的视频认证方法 | |
CN111242829A (zh) | 一种水印提取方法、装置、设备及存储介质 | |
KR20140112635A (ko) | 특징점 기반 영상처리 장치 및 그 영상 처리 방법 | |
CN102881008A (zh) | 基于圆环统计特征的抗旋转图像Hash方法 | |
JP2009505133A (ja) | ピクセルを用いたデータの暗号化及び解読方法 | |
Sourvanos et al. | Challenges in input preprocessing for mobile OCR applications: A realistic testing scenario | |
Pinto et al. | Protection of JPEG compressed e-comics by selective encryption | |
CN107609595B (zh) | 一种线裁剪图像检测方法 | |
CN104036310A (zh) | 带有微观特征的墨点构成的点阵图形及辨别其真伪的方法 | |
CN116828127B (zh) | 一种结合文档数据的指纹加密存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |