CN108921166A - 基于深度神经网络的医疗票据类文本检测识别方法及系统 - Google Patents
基于深度神经网络的医疗票据类文本检测识别方法及系统 Download PDFInfo
- Publication number
- CN108921166A CN108921166A CN201810653246.7A CN201810653246A CN108921166A CN 108921166 A CN108921166 A CN 108921166A CN 201810653246 A CN201810653246 A CN 201810653246A CN 108921166 A CN108921166 A CN 108921166A
- Authority
- CN
- China
- Prior art keywords
- bill
- text
- picture
- neural network
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度神经网络的医疗票据类文本检测识别方法及系统,该方法包括:使用目标检测算法,检测出票据图片中票据的所在位置,对票据图片进行裁剪;对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;对完成裁剪和旋转后的票据图片进行文字检测和识别;根据识别出来的文字与方位,进行筛选和提取,获得所需数据。本发明结合了目标检测、文字识别等方法,可以提高数据录入的效率与准确度。并且本发明基于深度神经网络,在文本检测和文本识别中能获取极高的准确率;通过使用传统的图像处理算法对图片做方便提取特征的处理,使得在医疗票据的复杂场景下也能达到超高准确率。
Description
技术领域
本发明涉及文字识别技术领域,尤其涉及一种基于深度神经网络的医疗票据类文本检测识别方法及系统。
背景技术
保险公司处理医疗类保险案件时,用户会提供大量的报销票据或复印件的图片,而保险公司需要根据这些图片内容,录入保险案件所需要的医疗数据。目前,对于医疗票据类文本的录入都是依靠人工的方式来识别票据图片中的内容,进而实现保险案件所需要的医疗数据的录入,因此这部分工作需要大量的人力,人工成本极高,且录入过程耗时过长,效率较低。
此外,保险公司常见的医疗票据主要分为4个大类:门诊票据、住院票据、结算单、明细单。每个大类下有各个省份各个医院不同样式的小类,小类数量超过上百种,而且不同小类别的票据可能样式差别极大,再加上票据本身的背景较为复杂,导致通过传统识别系统自动识别票据文本非常困难。因此采用传统的文本检测和文本识别方法,会有准确率过低的问题;虽然对于简单环境下的文本,传统方式识别准确率较高,但是由于票据本身的一些特点,比如拍摄角度非水平、票据过小等,传统识别方式的准确率就会受到很大影响。
发明内容
针对上述现有技术中存在的不足之处,本发明提供一种基于深度神经网络的医疗票据类文本检测识别方法及系统,通过结合目标检测、文字识别等方法,对医疗票据类文本图片进行了数据提取,用以提高医疗票据类的数据录入的效率与准确度。
该基于深度神经网络的医疗票据类文本检测识别方法包括以下步骤:
步骤一、使用目标检测算法,检测出票据图片中票据的所在位置;
步骤二、根据检测出的票据的所在位置对票据图片进行裁剪;
步骤三、对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
步骤四、对完成裁剪和旋转后的票据图片进行文字检测和识别;
步骤五、根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
可选地,所述步骤一中的目标检测算法为Faster RCNN、SSD、YOLO以及YOLO-v2中的任意一种。
优选地,所述步骤一中的目标检测算法为Faster RCNN;进一步地,所述步骤一中检测票据的所在位置的过程具体为:
深度卷积网络提取票据图片抽象特征;使用区域候选网络推荐票据候选区域;从候选区域回归票据的精准区域,检测出票据图片中票据的所在位置。
优选地,所述步骤三中采用Sobel边缘检测算子对裁剪后的票据图片进行边缘检测。
可选地,所述步骤四中对完成裁剪和旋转后的票据图片进行文字检测的算法为Faster RCNN、SSD、YOLO、EAST、RRCNN、TextBoxes以及CTPN中的任意一种。
优选地,所述步骤四中对完成裁剪和旋转后的票据图片进行文字检测的算法为Faster RCNN。
进一步地,所述步骤四中对完成裁剪和旋转后的票据图片的文字识别结合了深度卷积神经网络和循环神经网络,其过程具体为:
使用卷积网络提取票据图片特征;将提取到的票据图片特征输入LSTM构成的双向循环神经网络;使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
进一步地,所述基于深度神经网络的医疗票据类文本检测识别方法还包括:针对票据中预设类型的数字,训练一个只有数字集合的数字识别模型;
当所述步骤四中识别出的文本为纯数字时,使用所述数字识别模型重新进行一次识别,以提高数字的准确率。
进一步地,所述步骤五具体为:
根据不同票据的格式,首先搜索具有预设特征的文字,然后在搜索到的文字附近寻找对应的项目与金额。
该基于深度神经网络的医疗票据类文本检测识别系统包括:
目标检测模块,用于使用目标检测算法,检测出票据图片中票据的所在位置;
裁剪模块,用于根据检测出的票据的所在位置对票据图片进行裁剪;
旋转模块,用于对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
文字检测和识别模块,用于对完成裁剪和旋转后的票据图片进行文字检测和识别;
文字筛选和提取模块,用于根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
本发明结合了目标检测、文字识别等方法,可以对医疗票据类文本图片进行数据提取,用以提高医疗票据类的数据录入的效率与准确度。通过检测票据图片中票据的所在位置,对票据图片进行裁剪;将裁剪后的票据图片旋转至水平方向;对完成裁剪和旋转后的票据图片进行文字检测和识别;根据识别出来的文字与方位,进行筛选和提取,获得所需数据。实现对医疗票据类文本的检测和识别;并且本发明基于深度神经网络,在文本检测和文本识别中能获取极高的准确率;通过使用传统的图像处理算法对图片做方便提取特征的处理,使得在医疗票据的复杂场景下也能达到超高准确率。
附图说明
图1为本发明第一实施例提供的基于深度神经网络的医疗票据类文本检测识别方法的流程示意图;
图2为本发明第一实施例提供的基于深度神经网络的医疗票据类文本检测识别方法的另一流程示意图;
图3为本发明第二实施例提供的基于深度神经网络的医疗票据类文本检测识别系统结构框图;
图4为通过Faster RCNN进行目标检测的原理示意图;
图5为本发明对文字进行识别的原理图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一实施例
请参阅图1,图1示出了本实施例中的基于深度神经网络的医疗票据类文本检测识别方法的流程图,该基于深度神经网络的医疗票据类文本检测识别方法包括以下步骤:
S101,使用目标检测算法,检测出票据图片中票据的所在位置;
S102,根据检测出的票据的所在位置对票据图片进行裁剪;
S103,对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
S104,对完成裁剪和旋转后的票据图片进行文字检测和识别;
S105,根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
进一步地,在本实施例中,上述S101中的目标检测算法可以为现有目标检测算法中的任意一种,比如Faster RCNN、SSD、YOLO、YOLO-v2等。本实施例以Faster RCNN为例来说明其检测原理;该模型对于较大的物体有比较高的准确率,该模型对图片提取特征后,会选取图中最有可能的特征点,根据特征点位置枚举大量的矩形来试图框选出对应的物体,然后根据矩形与原图实际物体所在位置进行比对,选取最好的框。
进一步地,请参阅图4,本实施例中进行目标检测的原理为:深度卷积网络(convlayers)提取票据图片抽象特征(feature maps);使用区域候选网络推荐票据候选区域;从候选区域回归票据的精准区域,检测出票据图片中票据的所在位置。
上述S103中采用Sobel边缘检测算子对裁剪后的票据图片进行边缘检测。因为票据类的图片往往票据本身带有较为明显的水平和竖直的直线,因此通过边缘检测算法检测出票据中的水平和竖直的直线后,就可以根据票据中的水平和竖直的直线的角度,对票据进行旋转,将票据旋转至接近水平的方向,以便后续对票据中的文字进行检测和识别。
使用Sobel边缘检测算子可以减少票据中噪音的干扰;Sobel边缘检测算子主要用作边缘检测,在技术上,它是一离散性差分算子,用来运算图像亮度函数的灰度的近似值。在图像的任何一点使用此算子,将会产生对应的灰度矢量或是其法矢量。Sobel卷积因子为:
该算子包含两组3x3的矩阵,分别为横向及纵向,将其与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像灰度值,其公式如下:
具体计算如下:
Gx=(-1)*f(x-1,y-1)+0*f(x,y-1)+1*f(x+1,y-1)
+(-2)*f(x-1,y)+0*f(x,y)+2*f(x+1,y)
+(-1)*f(x-1,y+1)+0*f(x,y+1)+1*f(x+1,y+1)
=[f(x+1,y-1)+2*f(x+1,y)+f(x+1,y+1)]-[f(x-1,y-1)+2*f(x-1,y)+f(x-1,y+1)]
Gy=1*f(x-1,y-1)+2*f(x,y-1)+1*f(x+1,y-1)
+0*f(x-1,y)0*f(x,y)+0*f(x+1,y)
+(-1)*f(x-1,y+1)+(-2)*f(x,y+1)+(-1)*f(x+1,y+1)
=[f(x-1,y-1)+2f(x,y-1)+f(x+1,y-1)]-[f(x-1,y+1)+2*f(x,y+1)+f(x+1,y+1)]
其中,f(a,b)表示图像(a,b)点的灰度值;图像的每一个像素的横向及纵向灰度值通过以下公式结合,来计算该点灰度的大小:
通常,为了提高效率使用不开平方的近似值:|G|=|Gx|+|Gy|,如果梯度G大于某一阀值则认为该点(x,y)为边缘点。然后可用以下公式计算梯度方向:Sobel算子根据像素点上下、左右邻点灰度加权差,在边缘处达到极值这一现象检测边缘。对噪声具有平滑作用,提供较为精确的边缘方向信息。
此外,Hough变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换的基本原理在于利用点与线的对偶性,将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点。这样就把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。也即把检测整体特性转化为检测局部特性。比如直线、椭圆、圆、弧线等。
上述S104中对完成裁剪和旋转后的票据图片进行文字检测可以使用通用的目标检测算法,比如:Faster RCNN、SSD、YOLO等,也可以使用专门为文字检测优化过后的算法:比如:EAST、RRCNN、TextBoxes、CTPN等。本实施例中采用Faster RCNN对完成裁剪和旋转后的票据图片进行文字检测。
上述S104中对完成裁剪和旋转后的票据图片的文字识别结合了深度卷积神经网络和循环神经网络,共同实现图片到文字的转换,其原理如图5所示,其算法原理为:使用卷积网络提取票据图片特征;将提取到的票据图片特征输入LSTM构成的双向循环神经网络;使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
此外,本实施例中的基于深度神经网络的医疗票据类文本检测识别方法还包括:针对票据中特征比较明显且比较重要的数字,训练一个只有数字集合的数字识别模型;当上述S104中识别出的文本为纯数字时,使用训练出的数字识别模型重新进行一次识别,以提高数字的准确率,如图2所示。
上述S105具体为:根据不同票据的格式,首先搜索具有比较强特征的文字,然后在搜索到的文字附近寻找对应的项目与金额。
第二实施例
请参阅图3,图3示出了本实施中的基于深度神经网络的医疗票据类文本检测识别系统300的结构框图,该基于深度神经网络的医疗票据类文本检测识别系统300包括以下结构:
目标检测模块301,用于使用目标检测算法,检测出票据图片中票据的所在位置;
裁剪模块302,用于根据检测出的票据的所在位置对票据图片进行裁剪;
旋转模块303,用于对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
文字检测和识别模块304,用于对完成裁剪和旋转后的票据图片进行文字检测和识别;
文字筛选和提取模块305,用于根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
该基于深度神经网络的医疗票据类文本检测识别系统300可以实现上述的基于深度神经网络的医疗票据类文本检测识别方法中需要系统实现的功能,故,在此不再赘述。
本发明结合了目标检测、文字识别等方法,可以对医疗票据类文本图片进行数据提取,用以提高医疗票据类的数据录入的效率与准确度。通过检测票据图片中票据的所在位置,对票据图片进行裁剪;将裁剪后的票据图片旋转至水平方向;对完成裁剪和旋转后的票据图片进行文字检测和识别;根据识别出来的文字与方位,进行筛选和提取,获得所需数据。实现对医疗票据类文本的检测和识别;并且本发明基于深度神经网络,在文本检测和文本识别中能获取极高的准确率;通过使用传统的图像处理算法对图片做方便提取特征的处理,使得在医疗票据的复杂场景下也能达到超高准确率。
需要说明的是,本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明实施例可采用完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照本发明的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述方法包括以下步骤:
步骤一、使用目标检测算法,检测出票据图片中票据的所在位置;
步骤二、根据检测出的票据的所在位置对票据图片进行裁剪;
步骤三、对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
步骤四、对完成裁剪和旋转后的票据图片进行文字检测和识别;
步骤五、根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
2.如权利要求1所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤一中的目标检测算法为Faster RCNN、SSD、YOLO以及YOLO-v2中的任意一种。
3.如权利要求2所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤一中的目标检测算法为Faster RCNN;所述步骤一中检测票据的所在位置的过程具体为:
深度卷积网络提取票据图片抽象特征;使用区域候选网络推荐票据候选区域;从候选区域回归票据的精准区域,检测出票据图片中票据的所在位置。
4.如权利要求1所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤三中采用Sobel边缘检测算子对裁剪后的票据图片进行边缘检测。
5.如权利要求1所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤四中对完成裁剪和旋转后的票据图片进行文字检测的算法为Faster RCNN、SSD、YOLO、EAST、RRCNN、TextBoxes以及CTPN中的任意一种。
6.如权利要求5所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤四中对完成裁剪和旋转后的票据图片进行文字检测的算法为Faster RCNN。
7.如权利要求6所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤四中对完成裁剪和旋转后的票据图片的文字识别结合了深度卷积神经网络和循环神经网络,其过程具体为:
使用卷积网络提取票据图片特征;将提取到的票据图片特征输入LSTM构成的双向循环神经网络;使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
8.如权利要求1所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述基于深度神经网络的医疗票据类文本检测识别方法还包括:针对票据中预设类型的数字,训练一个只有数字集合的数字识别模型;
当所述步骤四中识别出的文本为纯数字时,使用所述数字识别模型重新进行一次识别,以提高数字的准确率。
9.如权利要求1所述的基于深度神经网络的医疗票据类文本检测识别方法,其特征在于,所述步骤五具体为:
根据不同票据的格式,首先搜索具有预设特征的文字,然后在搜索到的文字附近寻找对应的项目与金额。
10.一种基于深度神经网络的医疗票据类文本检测识别系统,其特征在于,所述基于深度神经网络的医疗票据类文本检测识别系统包括:
目标检测模块,用于使用目标检测算法,检测出票据图片中票据的所在位置;
裁剪模块,用于根据检测出的票据的所在位置对票据图片进行裁剪;
旋转模块,用于对裁剪后的票据图片进行边缘检测,并根据票据图片中的水平和竖直的直线的角度,将票据图片旋转至水平方向;
文字检测和识别模块,用于对完成裁剪和旋转后的票据图片进行文字检测和识别;
文字筛选和提取模块,用于根据识别出来的文字与方位,进行筛选和提取,获得所需数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810653246.7A CN108921166A (zh) | 2018-06-22 | 2018-06-22 | 基于深度神经网络的医疗票据类文本检测识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810653246.7A CN108921166A (zh) | 2018-06-22 | 2018-06-22 | 基于深度神经网络的医疗票据类文本检测识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108921166A true CN108921166A (zh) | 2018-11-30 |
Family
ID=64421319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810653246.7A Pending CN108921166A (zh) | 2018-06-22 | 2018-06-22 | 基于深度神经网络的医疗票据类文本检测识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108921166A (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635743A (zh) * | 2018-12-13 | 2019-04-16 | 深源恒际科技有限公司 | 一种结合stn模块的文本检测深度学习方法及系统 |
CN109670494A (zh) * | 2018-12-13 | 2019-04-23 | 深源恒际科技有限公司 | 一种附带识别置信度的文本检测方法及系统 |
CN109670495A (zh) * | 2018-12-13 | 2019-04-23 | 深源恒际科技有限公司 | 一种基于深度神经网络的长短文本检测的方法及系统 |
CN109740542A (zh) * | 2019-01-07 | 2019-05-10 | 福建博思软件股份有限公司 | 基于改进型east算法的文本检测方法 |
CN109815957A (zh) * | 2019-01-30 | 2019-05-28 | 邓悟 | 一种基于彩色图像在复杂背景下的文字识别方法 |
CN109829453A (zh) * | 2018-12-29 | 2019-05-31 | 天津车之家数据信息技术有限公司 | 一种卡证中文字的识别方法、装置以及计算设备 |
CN109886077A (zh) * | 2018-12-28 | 2019-06-14 | 北京旷视科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN109934181A (zh) * | 2019-03-18 | 2019-06-25 | 北京海益同展信息科技有限公司 | 文本识别方法、装置、设备和计算机可读介质 |
CN109993165A (zh) * | 2019-03-28 | 2019-07-09 | 永康市几米电子科技有限公司 | 药片板药名识别及药片板信息获取方法、装置与系统 |
CN110032990A (zh) * | 2019-04-23 | 2019-07-19 | 杭州智趣智能信息技术有限公司 | 一种发票文本识别方法、系统及相关组件 |
CN110135411A (zh) * | 2019-04-30 | 2019-08-16 | 北京邮电大学 | 名片识别方法和装置 |
CN110135431A (zh) * | 2019-05-16 | 2019-08-16 | 深圳市信联征信有限公司 | 营业执照的自动识别方法及系统 |
CN110263694A (zh) * | 2019-06-13 | 2019-09-20 | 泰康保险集团股份有限公司 | 一种票据识别方法及装置 |
CN110399875A (zh) * | 2019-07-31 | 2019-11-01 | 山东浪潮人工智能研究院有限公司 | 一种基于深度学习与像素投影的通用表格信息提取方法 |
CN110427932A (zh) * | 2019-08-02 | 2019-11-08 | 杭州睿琪软件有限公司 | 一种识别图像中多个票据区域的方法及装置 |
CN110443252A (zh) * | 2019-08-16 | 2019-11-12 | 广东工业大学 | 一种文字检测方法、装置及设备 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN111046886A (zh) * | 2019-12-12 | 2020-04-21 | 吉林大学 | 号码牌自动识别方法、装置、设备及计算机可读存储介质 |
CN111105549A (zh) * | 2019-12-19 | 2020-05-05 | 紫光云(南京)数字技术有限公司 | 光学字符识别方法、装置及计算机存储介质 |
CN111222572A (zh) * | 2020-01-06 | 2020-06-02 | 紫光云技术有限公司 | 一种面向办公场景的光学文字识别方法 |
CN111291726A (zh) * | 2020-03-12 | 2020-06-16 | 泰康保险集团股份有限公司 | 医疗票据分拣方法、装置、设备和介质 |
CN111414905A (zh) * | 2020-02-25 | 2020-07-14 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111444792A (zh) * | 2020-03-13 | 2020-07-24 | 安诚迈科(北京)信息技术有限公司 | 票据识别方法、电子设备、存储介质及装置 |
CN111832556A (zh) * | 2020-06-04 | 2020-10-27 | 国家海洋局南海调查技术中心(国家海洋局南海浮标中心) | 一种基于深度学习的船舷字符精准检测方法 |
CN112149654A (zh) * | 2020-09-23 | 2020-12-29 | 四川长虹电器股份有限公司 | 基于深度学习的发票文本信息识别方法 |
CN112347994A (zh) * | 2020-11-30 | 2021-02-09 | 四川长虹电器股份有限公司 | 一种基于深度学习的发票图像目标检测与角度检测方法 |
CN112364837A (zh) * | 2020-12-09 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种基于目标检测和文本识别的票据信息识别方法 |
CN112818951A (zh) * | 2021-03-11 | 2021-05-18 | 南京大学 | 一种票证识别的方法 |
WO2021128578A1 (zh) * | 2019-12-27 | 2021-07-01 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113343873A (zh) * | 2021-06-17 | 2021-09-03 | 湖北亿咖通科技有限公司 | 信号灯识别方法、装置、设备、介质及产品 |
CN113723508A (zh) * | 2021-08-30 | 2021-11-30 | 杭州米数科技有限公司 | 票据图像分类方法、装置、计算设备和存储介质 |
CN113743412A (zh) * | 2021-07-22 | 2021-12-03 | 苏州藤岛自动化设备有限公司 | 一种基于深度神经网络的包装瓶身文字检测、识别系统 |
CN114419651A (zh) * | 2022-03-03 | 2022-04-29 | 深圳依时货拉拉科技有限公司 | 智能票据识别方法、计算机可读存储介质及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
CN106226050A (zh) * | 2016-07-15 | 2016-12-14 | 北京航空航天大学 | 一种tfds故障自动识别方法 |
CN107391609A (zh) * | 2017-07-01 | 2017-11-24 | 南京理工大学 | 一种双向多模态递归网络的图像描述方法 |
CN107480665A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 文字检测方法、装置及计算机可读存储介质 |
CN108171127A (zh) * | 2017-12-13 | 2018-06-15 | 广东电网有限责任公司清远供电局 | 一种基于深度学习的发票自动识别方法 |
-
2018
- 2018-06-22 CN CN201810653246.7A patent/CN108921166A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
CN106226050A (zh) * | 2016-07-15 | 2016-12-14 | 北京航空航天大学 | 一种tfds故障自动识别方法 |
CN107391609A (zh) * | 2017-07-01 | 2017-11-24 | 南京理工大学 | 一种双向多模态递归网络的图像描述方法 |
CN107480665A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 文字检测方法、装置及计算机可读存储介质 |
CN108171127A (zh) * | 2017-12-13 | 2018-06-15 | 广东电网有限责任公司清远供电局 | 一种基于深度学习的发票自动识别方法 |
Non-Patent Citations (3)
Title |
---|
《录井技术》编辑部编: "《录井技术文集》", 30 September 1999, 石油工业出版社 * |
王云: "《光盘情报检索方法与技巧》", 30 June 1997 * |
韦康博: "《人工智能比你想象的更具颠覆性的智能革命》", 30 September 2016 * |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670494A (zh) * | 2018-12-13 | 2019-04-23 | 深源恒际科技有限公司 | 一种附带识别置信度的文本检测方法及系统 |
CN109670495A (zh) * | 2018-12-13 | 2019-04-23 | 深源恒际科技有限公司 | 一种基于深度神经网络的长短文本检测的方法及系统 |
CN109635743A (zh) * | 2018-12-13 | 2019-04-16 | 深源恒际科技有限公司 | 一种结合stn模块的文本检测深度学习方法及系统 |
CN109670494B (zh) * | 2018-12-13 | 2023-09-01 | 北京深智恒际科技有限公司 | 一种附带识别置信度的文本检测方法及系统 |
CN109886077A (zh) * | 2018-12-28 | 2019-06-14 | 北京旷视科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN109829453A (zh) * | 2018-12-29 | 2019-05-31 | 天津车之家数据信息技术有限公司 | 一种卡证中文字的识别方法、装置以及计算设备 |
CN109740542A (zh) * | 2019-01-07 | 2019-05-10 | 福建博思软件股份有限公司 | 基于改进型east算法的文本检测方法 |
CN109740542B (zh) * | 2019-01-07 | 2020-11-27 | 福建博思软件股份有限公司 | 基于改进型east算法的文本检测方法 |
CN109815957A (zh) * | 2019-01-30 | 2019-05-28 | 邓悟 | 一种基于彩色图像在复杂背景下的文字识别方法 |
CN109934181A (zh) * | 2019-03-18 | 2019-06-25 | 北京海益同展信息科技有限公司 | 文本识别方法、装置、设备和计算机可读介质 |
CN109993165A (zh) * | 2019-03-28 | 2019-07-09 | 永康市几米电子科技有限公司 | 药片板药名识别及药片板信息获取方法、装置与系统 |
CN110032990A (zh) * | 2019-04-23 | 2019-07-19 | 杭州智趣智能信息技术有限公司 | 一种发票文本识别方法、系统及相关组件 |
CN110135411A (zh) * | 2019-04-30 | 2019-08-16 | 北京邮电大学 | 名片识别方法和装置 |
CN110135411B (zh) * | 2019-04-30 | 2021-09-10 | 北京邮电大学 | 名片识别方法和装置 |
CN110135431A (zh) * | 2019-05-16 | 2019-08-16 | 深圳市信联征信有限公司 | 营业执照的自动识别方法及系统 |
CN110263694A (zh) * | 2019-06-13 | 2019-09-20 | 泰康保险集团股份有限公司 | 一种票据识别方法及装置 |
CN110399875A (zh) * | 2019-07-31 | 2019-11-01 | 山东浪潮人工智能研究院有限公司 | 一种基于深度学习与像素投影的通用表格信息提取方法 |
CN110427932A (zh) * | 2019-08-02 | 2019-11-08 | 杭州睿琪软件有限公司 | 一种识别图像中多个票据区域的方法及装置 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN110443252A (zh) * | 2019-08-16 | 2019-11-12 | 广东工业大学 | 一种文字检测方法、装置及设备 |
CN111046886A (zh) * | 2019-12-12 | 2020-04-21 | 吉林大学 | 号码牌自动识别方法、装置、设备及计算机可读存储介质 |
CN111105549A (zh) * | 2019-12-19 | 2020-05-05 | 紫光云(南京)数字技术有限公司 | 光学字符识别方法、装置及计算机存储介质 |
WO2021128578A1 (zh) * | 2019-12-27 | 2021-07-01 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111222572A (zh) * | 2020-01-06 | 2020-06-02 | 紫光云技术有限公司 | 一种面向办公场景的光学文字识别方法 |
CN111414905A (zh) * | 2020-02-25 | 2020-07-14 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111414905B (zh) * | 2020-02-25 | 2023-08-18 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111291726A (zh) * | 2020-03-12 | 2020-06-16 | 泰康保险集团股份有限公司 | 医疗票据分拣方法、装置、设备和介质 |
CN111291726B (zh) * | 2020-03-12 | 2023-08-08 | 泰康保险集团股份有限公司 | 医疗票据分拣方法、装置、设备和介质 |
CN111444792A (zh) * | 2020-03-13 | 2020-07-24 | 安诚迈科(北京)信息技术有限公司 | 票据识别方法、电子设备、存储介质及装置 |
CN111444792B (zh) * | 2020-03-13 | 2023-05-09 | 安诚迈科(北京)信息技术有限公司 | 票据识别方法、电子设备、存储介质及装置 |
CN111832556A (zh) * | 2020-06-04 | 2020-10-27 | 国家海洋局南海调查技术中心(国家海洋局南海浮标中心) | 一种基于深度学习的船舷字符精准检测方法 |
CN112149654A (zh) * | 2020-09-23 | 2020-12-29 | 四川长虹电器股份有限公司 | 基于深度学习的发票文本信息识别方法 |
CN112149654B (zh) * | 2020-09-23 | 2022-08-02 | 四川长虹电器股份有限公司 | 基于深度学习的发票文本信息识别方法 |
CN112347994A (zh) * | 2020-11-30 | 2021-02-09 | 四川长虹电器股份有限公司 | 一种基于深度学习的发票图像目标检测与角度检测方法 |
CN112364837A (zh) * | 2020-12-09 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种基于目标检测和文本识别的票据信息识别方法 |
CN112818951A (zh) * | 2021-03-11 | 2021-05-18 | 南京大学 | 一种票证识别的方法 |
CN112818951B (zh) * | 2021-03-11 | 2023-11-21 | 南京大学 | 一种票证识别的方法 |
CN113343873A (zh) * | 2021-06-17 | 2021-09-03 | 湖北亿咖通科技有限公司 | 信号灯识别方法、装置、设备、介质及产品 |
CN113743412A (zh) * | 2021-07-22 | 2021-12-03 | 苏州藤岛自动化设备有限公司 | 一种基于深度神经网络的包装瓶身文字检测、识别系统 |
CN113723508A (zh) * | 2021-08-30 | 2021-11-30 | 杭州米数科技有限公司 | 票据图像分类方法、装置、计算设备和存储介质 |
CN113723508B (zh) * | 2021-08-30 | 2024-04-19 | 杭州米数科技有限公司 | 票据图像分类方法、装置、计算设备和存储介质 |
CN114419651A (zh) * | 2022-03-03 | 2022-04-29 | 深圳依时货拉拉科技有限公司 | 智能票据识别方法、计算机可读存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921166A (zh) | 基于深度神经网络的医疗票据类文本检测识别方法及系统 | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
WO2021217857A1 (zh) | 切片缺陷检测方法、装置、电子设备及可读存储介质 | |
CN103577475B (zh) | 一种图片自动化分类方法、图片处理方法及其装置 | |
CN109378052B (zh) | 图像标注的预处理方法及系统 | |
US11074442B2 (en) | Identification of table partitions in documents with neural networks using global document context | |
US11861925B2 (en) | Methods and systems of field detection in a document | |
CN103268358B (zh) | 多源控制点影像数据库构建及更新方法 | |
US11170249B2 (en) | Identification of fields in documents with neural networks using global document context | |
CN105989330A (zh) | 一种图片检测方法及设备 | |
CN106055573A (zh) | 一种多示例学习框架下的鞋印图像检索方法及系统 | |
CN112037180B (zh) | 染色体分割方法及装置 | |
CN113033516A (zh) | 对象识别统计方法及装置、电子设备、存储介质 | |
CN110427853B (zh) | 一种智能票据信息提取处理的方法 | |
CN113609984A (zh) | 一种指针式仪表读数识别方法、装置及电子设备 | |
CN103776482A (zh) | 无标尺线指针式仪表刻度的图像检测方法 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN110135408B (zh) | 文本图像检测方法、网络以及设备 | |
CN104408403A (zh) | 一种二次录入不一致的仲裁方法及装置 | |
CN106548195A (zh) | 一种基于改进型hog‑ulbp特征算子的目标检测方法 | |
Zhang et al. | A YOLOv3‐Based Industrial Instrument Classification and Reading Recognition Method | |
CN104809336B (zh) | 一种考虑空间相关性的区域要素抽样方法 | |
CN107657262A (zh) | 一种计算机自动分类精度评价方法 | |
KR102416714B1 (ko) | 3차원 이미지 및 딥러닝을 활용한 도시 규모 나무 지도 작성 시스템 및 방법 | |
Heitzler et al. | A modular process to improve the georeferencing of the Siegfried map |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181130 |