CN117423117A - 一种基于深度学习技术的机构文档识别方法 - Google Patents

一种基于深度学习技术的机构文档识别方法 Download PDF

Info

Publication number
CN117423117A
CN117423117A CN202311741010.6A CN202311741010A CN117423117A CN 117423117 A CN117423117 A CN 117423117A CN 202311741010 A CN202311741010 A CN 202311741010A CN 117423117 A CN117423117 A CN 117423117A
Authority
CN
China
Prior art keywords
document
neural network
mechanism document
image
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311741010.6A
Other languages
English (en)
Other versions
CN117423117B (zh
Inventor
崔秋季
黄璐
徐晓岚
李郭成
阚苏立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Jiangbei New Area Biopharmaceutical Public Service Platform Co ltd
Original Assignee
Nanjing Jiangbei New Area Biopharmaceutical Public Service Platform Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Jiangbei New Area Biopharmaceutical Public Service Platform Co ltd filed Critical Nanjing Jiangbei New Area Biopharmaceutical Public Service Platform Co ltd
Priority to CN202311741010.6A priority Critical patent/CN117423117B/zh
Publication of CN117423117A publication Critical patent/CN117423117A/zh
Application granted granted Critical
Publication of CN117423117B publication Critical patent/CN117423117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习技术的机构文档识别方法,包括如下步骤:(1)根据不同机构文档类型,采集机构文档图像,进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;(2)对机构文档图片集逐个进行单元格定位与分割;(3)基于循环卷积神经网络算法,构建中英文文字识别模型,对分割出的图像进行文字识别;(4)对识别的图像文本进行键值对对齐与文本校正操作;(5)使用Flask框架,在步骤(1)、(2)、(3)、(4)组成的机构文档识别模型的基础上对接Web管理平台。本发明能够将海关报关单、医院检查检验报告等机构文档智能地识别为结构化文本,助力跨境贸易、健康医疗等行业自动化效率提升。

Description

一种基于深度学习技术的机构文档识别方法
技术领域
本发明涉及图像识别技术领域,特别涉及一种基于深度学习技术的机构文档识别方法。
背景技术
跨境贸易、健康医疗等行业发展过程中,产生了海量非结构化机构文档、图片等数据(如海关报关单、医院检查检验报告、药品清单等),使用传统人工录入方式需要耗费大量的时间与精力,而传统手工设计文本特征训练模型方式的自动化识别效果也存在瓶颈。随着计算机视觉与深度学习技术的不断发展,机构文档图片识别技术逐渐由手工设计文本特征训练模型的方式演变成使用深度神经网络模型,在文本识别的效果上也有了较大提升。
因此需要研究一种基于深度学习技术的机构文档图片识别技术,实现有效且高速便捷的一体化机构文档图片识别服务,助力跨境贸易、健康医疗等行业自动化效率提升。
发明内容
本发明目的在于提供一种基于深度学习技术的机构文档识别方法,能够有效、批量、智能地将海关报关单、医院检查检验报告、药品清单等机构文档识别为结构化文本,助力跨境贸易、健康医疗等行业自动化效率提升。
为解决上述技术问题,本发明提供一种基于深度学习技术的机构文档识别方法,包括如下步骤:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;
步骤(2):对步骤(1)得到的机构文档图片集逐个进行单元格定位与分割,得到对应子图片集;
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对所述步骤(2)中分割的图像进行文字识别;
步骤(4):把所述步骤(3)中识别的图像文本进行键值对对齐与文本校正操作;
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入系统鉴权、接口调用记录管理模块,并对接Web管理平台,批量识别机构文档。
优选的,步骤(1)中,不同的文档类型具体为:包括PDF、WORD、PNG、JPG和JPEG;标准化具体为:将机构文档图片转换为统一的分辨率和大小,如输入的文档类型为PDF、WORD,读取并提取文档中表格图片,再将其转换为统一的分辨率和大小;版面划分具体为:把机构文档图片进行版面识别与分析后,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。
优选的,步骤(2)中,对机构文档图片集逐个进行单元格定位与分割,得到对应子图片集,包括如下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,将灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为依次获取行、列卷积核后,进行腐蚀、膨胀操作,减少噪声点后,结合已有行列线得到表格交点坐标矩阵L,再根据交点坐标矩阵L计算并确认表格锚点a,最后结合L和a对整个机构文档表格中所有单元格,尤其是隐藏直线的单元格,进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
优选的,步骤(3)中,循环卷积神经网络算法具体为:依次使用卷积神经网络(CNN)、循环神经网络(RNN)和全连接神经网络组成;CNN用于提取图像特征,RNN使用双向长短时记忆网络(BiLSTM),用于在卷积特征的基础上继续提取文字序列特征,全连接神经网络用于进一步增加模型复杂度与模型输出,损失函数使用连接时序分类损失函数(CTCLoss)解决输出和标签长度不一致的问题;模型输入层的数据是分割后的机构文档子图;输出层输出的数据为识别出的文字。
优选的,步骤(4)中键值对对齐具体为:把不同表现形式的表格键值对进行比对对齐,如一键对一值、一键对横向多值、一键对竖向多值等;文本校正具体为:对模型识别出的文本,根据其中的关键要素进行规则匹配,最大程度进行纠正,如DNA等专有名词需符合专业知识。
优选的,步骤(5)中Web管理平台具体为:对外开放使用的网站系统,提供可以便捷调用机构文档识别模型的接口,有效、批量、智能地进行机构文档识别;鉴权系统具体为:包括用户身份验证、HTTPS协议、权限管理与限制;接口调用记录管理模块具体为:记录系统访问人数、接口调用次数、时间与返回状态。
本发明的优点为:
本发明采用锚点定位标记技术,解决无线框、线框杂乱等原因导致的图像轮廓检测、边缘切割不准的问题;
本发明把机构文档识别模型进行集成封装,对接Web管理平台,便于用户调用与批量机构文档识别。
附图说明
图1为本发明中方法流程图。
图2为本发明中表格主体区域划分与锚点展示图(1)。
图3为本发明中表格主体区域划分与锚点展示图(2)。
图4为本发明中中英文文字识别模型架构图。
图5为本发明中图像分割后的机构文档子图及其中英文文字识别模型预测结果图。
图6为本发明中报关单机构文档识别结果与键值对对齐示意例图。
具体实施方式
为了更好地了解本发明的目的、结构及功能,下面结合本发明实施例附图,对本发明一种基于深度学习技术的机构文档识别方法实施例进行清楚、完整地描述。
下述机构文档以海关报关单为例,并结合附图对本发明做进一步的详细的描述。
如图1所示,本发明提供一种基于深度学习技术的机构文档识别方法,包括:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。本实施例中输入机构文档数据为报关单PDF文件,读取该PDF文件并提取转换为图片,转换为统一的分辨率和大小,其中,图片x、y轴缩放系数设置为1.33;再使用OCR工具对图片进行版面划分,筛选并裁剪出表格主体区域(如图2和3所示的虚线方框圈出部分所示),得到相应的机构文档图片集。
步骤(2):对所述得到的机构文档图片集依次进行图像分割,根据特定的单元格,把机构文档表格切分成单元格子图片集,以便于后期图像文本识别。其中,主要包括以下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,其中,根据图片特点,将像素的领域块大小设置为3,偏移值调整量设置为-9,把灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为先暂将待检测行、列数设置为42、30,再依次获取行、列卷积核后,然后进行腐蚀、膨胀操作,减少噪声点后,获得表格轮廓;并结合已有行列线得到表格交点坐标矩阵L;再根据交点坐标矩阵L,确认最长的横线和最高的竖线,结合规则与特征,计算并确认表格锚点a(如图2和3所示的圆圈圈出部分所示);最后结合L和a对整个机构文档表格中所有单元格,尤其是隐藏线框的单元格(如图2和3所示的图片中所示的无竖线的单元格),进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对分割的图像进行文字识别;其中,如图4所示,循环卷积神经网络算法模型依次使用卷积神经网络(CNN)、循环神经网络(RNN)和全连接神经网络组成;其中,将输入图像统一缩放至32*W*3后,利用CNN提取图像卷积特征,得到的特征维度大小为1*W/4*512,再将上述特征输入到RNN(本发明使用的RNN网络为双向长短时记忆网络)提取文字序列特征,得到W/4*n后验概率矩阵,最后使用全连接神经网络进一步增加模型复杂度与模型输出,特别的,损失函数使用连接时序分类损失函数(CTCLoss)解决输出和标签长度不一致的问题;模型输入层的数据是分割后的机构文档子图;输出层输出的数据为识别出的文字。其中,训练集和验证集的数据量比例为5:1,测试集数据为真实的海关报关单文件;epoch设置为500、batch size设置为64、优化器选择Adam、学习率初始设置为1e-6。如图5所示,为分割的机构文档子图及其文字识别结果。
步骤(4):对识别的图像文本进行键值对对齐与文本校正;把不同表现形式的表格键值对进行比对对齐,如一键对一值、一键对横向多值、一键对竖向多值等,并对模型识别出的文本,根据其中的关键要素进行规则匹配,最大程度进行纠正,如DNA等专有名词需符合专业知识;如图6所示,为图2所示机构文档识别结果与键值对对齐示意例图。
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入用户身份验证、HTTPS协议、权限管理与限制等系统鉴权和记录系统访问人数、接口调用次数、时间与返回状态的接口调用记录管理模块,并对接对外开放使用的Web管理平台,提供可以便捷调用机构文档识别模型的接口,有效、批量、智能地进行机构文档识别。

Claims (6)

1.一种基于深度学习技术的机构文档识别方法,其特征在于,包括如下步骤:
步骤(1):根据不同机构文档类型,采集文档图像并基于计算机视觉技术对机构文档图片进行标准化与版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集;
步骤(2):对所述得到的机构文档图片集逐个进行单元格定位与分割,得到对应子图片集;
步骤(3):基于循环卷积神经网络算法,构建中英文文字识别模型,对分割的图像进行文字识别;
步骤(4):对识别的图像文本进行键值对对齐与文本校正;
步骤(5):使用Flask框架,在所述步骤(1)、(2)、(3)、(4)算法与模型组成的机构文档识别模型的基础上加入系统鉴权、接口调用记录管理模块,并对接Web管理平台,批量识别机构文档。
2.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(1)还包括:判断输入文件类型,读取机构文档并提取其中表格图片,转换为统一的分辨率和大小;再对图片进行版面划分,筛选并裁剪出表格主体区域,得到相应的机构文档图片集。
3.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(2)还包括:对机构文档图片集逐个进行单元格定位与分割,得到对应子图片集,包括如下步骤:
步骤(21):对机构文档图片集逐个进行灰度处理,将三通道的彩色图片转化为单通道的灰度图像;
步骤(22):对灰度处理的图片集逐个进行局部二值化处理,使用自适应阈值函数,通过高斯加权和计算邻域内像素阈值,将灰度图像转化为黑白图像,减少图像中数据量,凸显轮廓与形状;
步骤(23):对二值化的机构文档图片逐个进行表格行列提取与描补,具体为依次获取行、列卷积核后,进行腐蚀、膨胀操作,减少噪声点后,结合已有行列线得到表格交点坐标矩阵L,再根据交点坐标矩阵L计算并确认表格锚点a,最后结合L和a对整个机构文档表格中所有单元格,进行坐标校正、描边与线框补全;
步骤(24):对已校正并明确所有单元格边框的机构文档图片集依次进行分割,得到该机构文档表格对应的所有子图片集。
4.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(3)还包括:使用循环卷积神经网络算法构建中英文文字识别模型,对步骤(2)分割的机构文档子图片集进行文字识别;所述循环卷积神经网络由卷积神经网络+循环神经网络+全连接神经网络组成;卷积神经网络用于提取图像特征,循环神经网络使用双向长短时记忆网络,用于在卷积特征的基础上继续提取文字序列特征,全连接神经网络用于进一步增加模型复杂度与模型输出,损失函数使用连接时序分类损失函数解决输出和标签长度不一致的问题。
5.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(4)还包括:对步骤(3)中识别的图像文本进行键值对对齐和文本校正操作。
6.根据权利要求1所述的基于深度学习技术的机构文档识别方法,其特征在于,所述步骤(5)还包括:使用Flask框架对所述步骤(1)的版面划分、步骤(2)图像分割、步骤(3)的中英文文字识别模型和步骤(4)的识别后的文本处理组成的机构文档识别模型进行API封装,并加入鉴权管理、API接口调用记录管理模块,对接Web管理平台,对导入的机构文档进行有效、批量、智能的结构化识别。
CN202311741010.6A 2023-12-18 2023-12-18 一种基于深度学习技术的机构文档识别方法 Active CN117423117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311741010.6A CN117423117B (zh) 2023-12-18 2023-12-18 一种基于深度学习技术的机构文档识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311741010.6A CN117423117B (zh) 2023-12-18 2023-12-18 一种基于深度学习技术的机构文档识别方法

Publications (2)

Publication Number Publication Date
CN117423117A true CN117423117A (zh) 2024-01-19
CN117423117B CN117423117B (zh) 2024-05-14

Family

ID=89528775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311741010.6A Active CN117423117B (zh) 2023-12-18 2023-12-18 一种基于深度学习技术的机构文档识别方法

Country Status (1)

Country Link
CN (1) CN117423117B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052853A (zh) * 2020-09-09 2020-12-08 国家气象信息中心 一种基于深度学习的手写气象档案资料的文本定位方法
CN112418225A (zh) * 2020-10-16 2021-02-26 中山大学 一种面向地址场景识别的离线文字识别方法
CN113139535A (zh) * 2021-05-08 2021-07-20 上海趋研信息科技有限公司 一种ocr文档识别方法
CN115424282A (zh) * 2022-09-28 2022-12-02 山东省计算中心(国家超级计算济南中心) 一种非结构化文本表格识别方法和系统
CN116612398A (zh) * 2022-12-12 2023-08-18 中国计量大学 基于ctpn算法的无人机巡检照片杆塔号牌文字识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052853A (zh) * 2020-09-09 2020-12-08 国家气象信息中心 一种基于深度学习的手写气象档案资料的文本定位方法
CN112418225A (zh) * 2020-10-16 2021-02-26 中山大学 一种面向地址场景识别的离线文字识别方法
CN113139535A (zh) * 2021-05-08 2021-07-20 上海趋研信息科技有限公司 一种ocr文档识别方法
CN115424282A (zh) * 2022-09-28 2022-12-02 山东省计算中心(国家超级计算济南中心) 一种非结构化文本表格识别方法和系统
CN116612398A (zh) * 2022-12-12 2023-08-18 中国计量大学 基于ctpn算法的无人机巡检照片杆塔号牌文字识别方法

Also Published As

Publication number Publication date
CN117423117B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
US10817717B2 (en) Method and device for parsing table in document image
CN109902622B (zh) 一种用于登机牌信息验证的文字检测识别方法
US10685462B2 (en) Automatic data extraction from a digital image
CN107067044B (zh) 一种财务报销全票据智能审核系统
CN110751143A (zh) 一种电子发票信息的提取方法及电子设备
CN112016481B (zh) 基于ocr的财务报表信息检测和识别方法
US11436852B2 (en) Document information extraction for computer manipulation
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN112560849B (zh) 基于神经网络算法的文理分割方法及系统
US11887393B2 (en) End-to-end system for extracting tabular data present in electronic documents and method thereof
CN115546809A (zh) 基于单元格约束的表格结构识别方法及其应用
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
CN115881265A (zh) 电子病历智能病案质控方法、系统、设备及存储介质
CN114581928A (zh) 一种表格识别方法及系统
CN118135584A (zh) 一种基于深度学习的手写表单自动识别方法和系统
CN111914706B (zh) 一种文字检测输出结果质量检测和控制的方法与装置
CN112149523B (zh) 基于深度学习和并查集算法识别并抽取图片的方法及装置
CN111611883B (zh) 基于最小单元格聚类的表格版面分析方法、系统及设备
CN117423117B (zh) 一种基于深度学习技术的机构文档识别方法
Fang Semantic segmentation of PHT based on improved DeeplabV3+
CN115731550A (zh) 一种基于深度学习的药品说明书自动识别方法、系统及存储介质
Drah et al. Handwritten Character Recognition Using Convolutional Neural Network for Asante Twi Language Alphabets
CN111325270A (zh) 一种基于模板匹配和bp神经网络的东巴文识别方法
CN118196818A (zh) 基于深度学习的商业发票智能报销方法及其系统
Sahle Segmentation of Real Life Amharic Documents for Improving Recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant