CN117423117A - 一种基于深度学习技术的机构文档识别方法 - Google Patents
一种基于深度学习技术的机构文档识别方法 Download PDFInfo
- Publication number
- CN117423117A CN117423117A CN202311741010.6A CN202311741010A CN117423117A CN 117423117 A CN117423117 A CN 117423117A CN 202311741010 A CN202311741010 A CN 202311741010A CN 117423117 A CN117423117 A CN 117423117A
- Authority
- CN
- China
- Prior art keywords
- document
- neural network
- mechanism document
- image
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000005516 engineering process Methods 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 16
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 12
- 238000012937 correction Methods 0.000 claims abstract description 9
- 238000005520 cutting process Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 6
- 238000003032 molecular docking Methods 0.000 claims abstract description 3
- 230000011218 segmentation Effects 0.000 claims abstract 2
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 230000008520 organization Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000005260 corrosion Methods 0.000 claims description 3
- 230000007797 corrosion Effects 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000004806 packaging method and process Methods 0.000 claims 1
- 230000036541 health Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 3
- 210000000746 body region Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习技术的机构文档识别方法,包括如下步骤:(1)根据不同机构文档类型,采集机构文档图像,进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;(2)对机构文档图片集逐个进行单元格定位与分割;(3)基于循环卷积神经网络算法,构建中英文文字识别模型,对分割出的图像进行文字识别;(4)对识别的图像文本进行键值对对齐与文本校正操作;(5)使用Flask框架,在步骤(1)、(2)、(3)、(4)组成的机构文档识别模型的基础上对接Web管理平台。本发明能够将海关报关单、医院检查检验报告等机构文档智能地识别为结构化文本,助力跨境贸易、健康医疗等行业自动化效率提升。
Description
技术领域
本发明涉及图像识别技术领域,特别涉及一种基于深度学习技术的机构文档识别方法。
背景技术
跨境贸易、健康医疗等行业发展过程中,产生了海量非结构化机构文档、图片等数据(如海关报关单、医院检查检验报告、药品清单等),使用传统人工录入方式需要耗费大量的时间与精力,而传统手工设计文本特征训练模型方式的自动化识别效果也存在瓶颈。随着计算机视觉与深度学习技术的不断发展,机构文档图片识别技术逐渐由手工设计文本特征训练模型的方式演变成使用深度神经网络模型,在文本识别的效果上也有了较大提升。
因此需要研究一种基于深度学习技术的机构文档图片识别技术,实现有效且高速便捷的一体化机构文档图片识别服务,助力跨境贸易、健康医疗等行业自动化效率提升。
发明内容
本发明目的在于提供一种基于深度学习技术的机构文档识别方法,能够有效、批量、智能地将海关报关单、医院检查检验报告、药品清单等机构文档识别为结构化文本,助力跨境贸易、健康医疗等行业自动化效率提升。
为解决上述技术问题,本发明提供一种基于深度学习技术的机构文档识别方法,包括如下步骤:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;
步骤(2):对步骤(1)得到的机构文档图片集逐个进行单元格定位与分割,得到对应子图片集;
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对所述步骤(2)中分割的图像进行文字识别;
步骤(4):把所述步骤(3)中识别的图像文本进行键值对对齐与文本校正操作;
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入系统鉴权、接口调用记录管理模块,并对接Web管理平台,批量识别机构文档。
优选的,步骤(1)中,不同的文档类型具体为:包括PDF、WORD、PNG、JPG和JPEG;标准化具体为:将机构文档图片转换为统一的分辨率和大小,如输入的文档类型为PDF、WORD,读取并提取文档中表格图片,再将其转换为统一的分辨率和大小;版面划分具体为:把机构文档图片进行版面识别与分析后,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。
优选的,步骤(2)中,对机构文档图片集逐个进行单元格定位与分割,得到对应子图片集,包括如下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,将灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为依次获取行、列卷积核后,进行腐蚀、膨胀操作,减少噪声点后,结合已有行列线得到表格交点坐标矩阵L,再根据交点坐标矩阵L计算并确认表格锚点a,最后结合L和a对整个机构文档表格中所有单元格,尤其是隐藏直线的单元格,进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
优选的,步骤(3)中,循环卷积神经网络算法具体为:依次使用卷积神经网络(CNN)、循环神经网络(RNN)和全连接神经网络组成;CNN用于提取图像特征,RNN使用双向长短时记忆网络(BiLSTM),用于在卷积特征的基础上继续提取文字序列特征,全连接神经网络用于进一步增加模型复杂度与模型输出,损失函数使用连接时序分类损失函数(CTCLoss)解决输出和标签长度不一致的问题;模型输入层的数据是分割后的机构文档子图;输出层输出的数据为识别出的文字。
优选的,步骤(4)中键值对对齐具体为:把不同表现形式的表格键值对进行比对对齐,如一键对一值、一键对横向多值、一键对竖向多值等;文本校正具体为:对模型识别出的文本,根据其中的关键要素进行规则匹配,最大程度进行纠正,如DNA等专有名词需符合专业知识。
优选的,步骤(5)中Web管理平台具体为:对外开放使用的网站系统,提供可以便捷调用机构文档识别模型的接口,有效、批量、智能地进行机构文档识别;鉴权系统具体为:包括用户身份验证、HTTPS协议、权限管理与限制;接口调用记录管理模块具体为:记录系统访问人数、接口调用次数、时间与返回状态。
本发明的优点为:
本发明采用锚点定位标记技术,解决无线框、线框杂乱等原因导致的图像轮廓检测、边缘切割不准的问题;
本发明把机构文档识别模型进行集成封装,对接Web管理平台,便于用户调用与批量机构文档识别。
附图说明
图1为本发明中方法流程图。
图2为本发明中表格主体区域划分与锚点展示图(1)。
图3为本发明中表格主体区域划分与锚点展示图(2)。
图4为本发明中中英文文字识别模型架构图。
图5为本发明中图像分割后的机构文档子图及其中英文文字识别模型预测结果图。
图6为本发明中报关单机构文档识别结果与键值对对齐示意例图。
具体实施方式
为了更好地了解本发明的目的、结构及功能,下面结合本发明实施例附图,对本发明一种基于深度学习技术的机构文档识别方法实施例进行清楚、完整地描述。
下述机构文档以海关报关单为例,并结合附图对本发明做进一步的详细的描述。
如图1所示,本发明提供一种基于深度学习技术的机构文档识别方法,包括:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。本实施例中输入机构文档数据为报关单PDF文件,读取该PDF文件并提取转换为图片,转换为统一的分辨率和大小,其中,图片x、y轴缩放系数设置为1.33;再使用OCR工具对图片进行版面划分,筛选并裁剪出表格主体区域(如图2和3所示的虚线方框圈出部分所示),得到相应的机构文档图片集。
步骤(2):对所述得到的机构文档图片集依次进行图像分割,根据特定的单元格,把机构文档表格切分成单元格子图片集,以便于后期图像文本识别。其中,主要包括以下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,其中,根据图片特点,将像素的领域块大小设置为3,偏移值调整量设置为-9,把灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为先暂将待检测行、列数设置为42、30,再依次获取行、列卷积核后,然后进行腐蚀、膨胀操作,减少噪声点后,获得表格轮廓;并结合已有行列线得到表格交点坐标矩阵L;再根据交点坐标矩阵L,确认最长的横线和最高的竖线,结合规则与特征,计算并确认表格锚点a(如图2和3所示的圆圈圈出部分所示);最后结合L和a对整个机构文档表格中所有单元格,尤其是隐藏线框的单元格(如图2和3所示的图片中所示的无竖线的单元格),进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对分割的图像进行文字识别;其中,如图4所示,循环卷积神经网络算法模型依次使用卷积神经网络(CNN)、循环神经网络(RNN)和全连接神经网络组成;其中,将输入图像统一缩放至32*W*3后,利用CNN提取图像卷积特征,得到的特征维度大小为1*W/4*512,再将上述特征输入到RNN(本发明使用的RNN网络为双向长短时记忆网络)提取文字序列特征,得到W/4*n后验概率矩阵,最后使用全连接神经网络进一步增加模型复杂度与模型输出,特别的,损失函数使用连接时序分类损失函数(CTCLoss)解决输出和标签长度不一致的问题;模型输入层的数据是分割后的机构文档子图;输出层输出的数据为识别出的文字。其中,训练集和验证集的数据量比例为5:1,测试集数据为真实的海关报关单文件;epoch设置为500、batch size设置为64、优化器选择Adam、学习率初始设置为1e-6。如图5所示,为分割的机构文档子图及其文字识别结果。
步骤(4):对识别的图像文本进行键值对对齐与文本校正;把不同表现形式的表格键值对进行比对对齐,如一键对一值、一键对横向多值、一键对竖向多值等,并对模型识别出的文本,根据其中的关键要素进行规则匹配,最大程度进行纠正,如DNA等专有名词需符合专业知识;如图6所示,为图2所示机构文档识别结果与键值对对齐示意例图。
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入用户身份验证、HTTPS协议、权限管理与限制等系统鉴权和记录系统访问人数、接口调用次数、时间与返回状态的接口调用记录管理模块,并对接对外开放使用的Web管理平台,提供可以便捷调用机构文档识别模型的接口,有效、批量、智能地进行机构文档识别。
Claims (6)
1.一种基于深度学习技术的机构文档识别方法,其特征在于,包括如下步骤:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;
步骤(2):对所述得到的机构文档图片集逐个进行单元格定位与分割,得到对应子图片集;
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对分割的图像进行文字识别;
步骤(4):对识别的图像文本进行键值对对齐与文本校正;
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入系统鉴权、接口调用记录管理模块,并对接Web管理平台,批量识别机构文档。
2.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(1)还包括:判断输入文件类型,读取机构文档并提取其中表格图片,转换为统一的分辨率和大小;再对图片进行版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。
3.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(2)还包括:对机构文档图片集逐个进行单元格定位与分割,得到对应子图片集,包括如下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,将灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为依次获取行、列卷积核后,进行腐蚀、膨胀操作,减少噪声点后,结合已有行列线得到表格交点坐标矩阵L,再根据交点坐标矩阵L计算并确认表格锚点a,最后结合L和a对整个机构文档表格中所有单元格,进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
4.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(3)还包括:使用循环卷积神经网络算法构建中英文文字识别模型,对步骤(2)分割的机构文档子图片集进行文字识别;所述循环卷积神经网络由卷积神经网络+循环神经网络+全连接神经网络组成;卷积神经网络用于提取图像特征,循环神经网络使用双向长短时记忆网络,用于在卷积特征的基础上继续提取文字序列特征,全连接神经网络用于进一步增加模型复杂度与模型输出,损失函数使用连接时序分类损失函数解决输出和标签长度不一致的问题。
5.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(4)还包括:对步骤(3)中识别的图像文本进行键值对对齐和文本校正操作。
6.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(5)还包括:使用Flask框架对所述步骤(1)的版面划分、步骤(2)图像分割、步骤(3)的中英文文字识别模型和步骤(4)的识别后的文本处理组成的机构文档识别模型进行API封装,并加入鉴权管理、API接口调用记录管理模块,对接Web管理平台,对导入的机构文档进行有效、批量、智能的结构化识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311741010.6A CN117423117B (zh) | 2023-12-18 | 2023-12-18 | 一种基于深度学习技术的机构文档识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311741010.6A CN117423117B (zh) | 2023-12-18 | 2023-12-18 | 一种基于深度学习技术的机构文档识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117423117A true CN117423117A (zh) | 2024-01-19 |
CN117423117B CN117423117B (zh) | 2024-05-14 |
Family
ID=89528775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311741010.6A Active CN117423117B (zh) | 2023-12-18 | 2023-12-18 | 一种基于深度学习技术的机构文档识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117423117B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
CN112418225A (zh) * | 2020-10-16 | 2021-02-26 | 中山大学 | 一种面向地址场景识别的离线文字识别方法 |
CN113139535A (zh) * | 2021-05-08 | 2021-07-20 | 上海趋研信息科技有限公司 | 一种ocr文档识别方法 |
CN115424282A (zh) * | 2022-09-28 | 2022-12-02 | 山东省计算中心(国家超级计算济南中心) | 一种非结构化文本表格识别方法和系统 |
CN116612398A (zh) * | 2022-12-12 | 2023-08-18 | 中国计量大学 | 基于ctpn算法的无人机巡检照片杆塔号牌文字识别方法 |
-
2023
- 2023-12-18 CN CN202311741010.6A patent/CN117423117B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
CN112418225A (zh) * | 2020-10-16 | 2021-02-26 | 中山大学 | 一种面向地址场景识别的离线文字识别方法 |
CN113139535A (zh) * | 2021-05-08 | 2021-07-20 | 上海趋研信息科技有限公司 | 一种ocr文档识别方法 |
CN115424282A (zh) * | 2022-09-28 | 2022-12-02 | 山东省计算中心(国家超级计算济南中心) | 一种非结构化文本表格识别方法和系统 |
CN116612398A (zh) * | 2022-12-12 | 2023-08-18 | 中国计量大学 | 基于ctpn算法的无人机巡检照片杆塔号牌文字识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117423117B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10817717B2 (en) | Method and device for parsing table in document image | |
CN109902622B (zh) | 一种用于登机牌信息验证的文字检测识别方法 | |
US10685462B2 (en) | Automatic data extraction from a digital image | |
CN107067044B (zh) | 一种财务报销全票据智能审核系统 | |
CN110751143A (zh) | 一种电子发票信息的提取方法及电子设备 | |
CN112016481B (zh) | 基于ocr的财务报表信息检测和识别方法 | |
US11436852B2 (en) | Document information extraction for computer manipulation | |
CN111914805A (zh) | 表格结构化方法、装置、电子设备及存储介质 | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
US11887393B2 (en) | End-to-end system for extracting tabular data present in electronic documents and method thereof | |
CN115546809A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
CN115881265A (zh) | 电子病历智能病案质控方法、系统、设备及存储介质 | |
CN114581928A (zh) | 一种表格识别方法及系统 | |
CN118135584A (zh) | 一种基于深度学习的手写表单自动识别方法和系统 | |
CN111914706B (zh) | 一种文字检测输出结果质量检测和控制的方法与装置 | |
CN112149523B (zh) | 基于深度学习和并查集算法识别并抽取图片的方法及装置 | |
CN111611883B (zh) | 基于最小单元格聚类的表格版面分析方法、系统及设备 | |
CN117423117B (zh) | 一种基于深度学习技术的机构文档识别方法 | |
Fang | Semantic segmentation of PHT based on improved DeeplabV3+ | |
CN115731550A (zh) | 一种基于深度学习的药品说明书自动识别方法、系统及存储介质 | |
Drah et al. | Handwritten Character Recognition Using Convolutional Neural Network for Asante Twi Language Alphabets | |
CN111325270A (zh) | 一种基于模板匹配和bp神经网络的东巴文识别方法 | |
CN118196818A (zh) | 基于深度学习的商业发票智能报销方法及其系统 | |
Sahle | Segmentation of Real Life Amharic Documents for Improving Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |