CN109670494A - 一种附带识别置信度的文本检测方法及系统 - Google Patents
一种附带识别置信度的文本检测方法及系统 Download PDFInfo
- Publication number
- CN109670494A CN109670494A CN201811526406.8A CN201811526406A CN109670494A CN 109670494 A CN109670494 A CN 109670494A CN 201811526406 A CN201811526406 A CN 201811526406A CN 109670494 A CN109670494 A CN 109670494A
- Authority
- CN
- China
- Prior art keywords
- text
- picture
- identification
- filed
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000003134 recirculating effect Effects 0.000 description 2
- 230000001373 regressive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种附带识别置信度的文本检测方法及系统,检测方法包括对原始图片进行标注,标注图片文本区域和文本内容;基于标注的图片文本区域,训练检测模型;基于标注的文本内容,训练识别模型;基于检测模型与识别模型对原始图片进行预测,得到图片文本区域和文本内容的预测结果;基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;基于新标注的图片文本区域和文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
Description
技术领域
本发明涉及文本检测技术领域,具体涉及一种附带识别置信度的文本检测方法及系统。
背景技术
OCR(Optical Character Recognition光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。目前,保险公司在处理各种医疗案件时候,需要将用户提供的大量的报销票据或复印件的图片电子化,转变为案件所需要的的医疗数据,这部分工作需要大量的人力,而将图片转为电子数据的这项技术靠的就是OCR。
目前的OCR技术,分为检测和识别两个模块,检测模型有其置信度,代表检测出来的区域为文本的置信度;识别模型也有其置信度,代表的是裁剪出来的图像识别出正确文本的置信度。在实际使用场景中,这两个置信度都有其局限性,无法真正的表示出这个文本正确的概率。前者,对于模糊或者有遮挡的文字仍然可以正常检测出,当时往往识别难以正确,而后者,如果遇到区域有切字,会出现置信度较高但是实际错误的情况,又或者文本较长(但本身较为清楚)时,往往会出现置信度较低,但实际上正确的情况。
发明内容
针对上述问题中存在的不足之处,本发明提供一种附带识别置信度的文本检测方法及系统。
本发明公开了一种附带识别置信度的文本检测方法,包括:
对原始图片进行标注,标注图片文本区域和文本内容;
基于标注的图片文本区域,训练检测模型;
基于标注的文本内容,训练识别模型;
基于所述检测模型与识别模型对所述原始图片进行预测,得到图片文本区域和文本内容的预测结果;
基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
基于新标注的图片文本区域和所述文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
作为本发明的进一步改进,所述训练检测模型包括:
基于标注的图片文本区域,采用Faster-RCNN、SSD、YOLO、YOLO-v2、EAST、RRCNN或TextBoxes目标检测算法训练检测模型。
作为本发明的进一步改进,基于标注的图片文本区域,采用Faster-RCNN目标检测算法训练检测模型;包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域。
作为本发明的进一步改进,所述训练识别模型的文字识别算法结合深度卷积神经网络和循环神经网络,实现图片到文字的转换,包括:
基于深度卷积网络提取图片特征;
将图片特征输入LSTM构成的双向循环神经网络;
使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
作为本发明的进一步改进,所述生成文本区域识别难易程度标签包括:
若标注的图片文本区域与预测的图片文本区域的交集大于预设阈值,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签;
若标注的文本内容与预测的文本内容一致,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签。
作为本发明的进一步改进,所述训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于新标注的图片文本区域和所述文本区域识别难易程度标签,采用改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型。
作为本发明的进一步改进,所述改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域;
从候选区域回归文本的识别难易。
本发明还提供一种附带识别置信度的文本检测系统,包括:
标注模块,用于对原始图片进行标注,标注图片文本区域和文本内容;
检测模型训练模块,用于基于标注的图片文本区域,训练检测模型;
识别模型训练模块,用于基于标注的文本内容,训练识别模型;
预测模块,用于基于所述检测模型与识别模型对所述原始图片进行预测,得到图片文本区域和文本内容的预测结果;
比较模块,用于基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
训练模块,用于基于新标注的图片文本区域和所述文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
与现有技术相比,本发明的有益效果为:
本发明在文本检测和文本识别中能获取极高的准确率,对图片做提取特征的处理,使得在复杂场景也能达到超高准确率;
本发明的目标检测自带置信度是对目标定位是否足够准确的一种评估指标,并不能真正的代表检测识别出来的文本是否可用,在实际场景中,新的识别置信度代表的是文本的识别难易程度,对于使用者意义更加明确,使用上更加方便。
附图说明
图1为本发明一种实施例公开的附带识别置信度的文本检测方法的流程图;
图2为本发明一种实施例公开的附带识别置信度的文本检测系统的框架图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
如图1所示,本发明公开了一种附带识别置信度的文本检测方法,包括:
步骤1、对原始图片进行标注,标注图片文本区域和文本内容;
步骤2、基于标注的图片文本区域,训练检测模型;
步骤3、基于标注的文本内容,训练识别模型;
步骤4、基于检测模型与识别模型对原始图片进行预测,得到图片文本区域和文本内容的预测结果;
步骤5、基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
步骤6、基于新标注的图片文本区域和文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
其中:
本发明的训练检测模型的检测算法采用Faster-RCNN、SSD、YOLO、YOLO-v2、EAST、RRCNN或TextBoxes等通用的目标检测算法。
Faster-RCNN检测算法的原理为:
基于深度卷积网络(conv layers)提取原始图片(票据图片)抽象特征(featuremaps);
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域。
Faster-RCNN检测算法的流程为:
1、对图片提取特征;
2、枚举大量的矩形来试图回归出对应的物体;
3、将枚举出的矩形分成2类:包含目标且交集较大的正样本和其他负样本;
4、.将正样本从特征图中裁剪出来,然后根据特征图去回归目标的边界;
5、根据其识别难度,区分图像是否为易识别,容易对的且边界回归较好的区域。
本发明文字识别算法结合了深度卷积神经网络和循环神经网络,共同实现图片到文字的转换。其算法原理如下:
使用卷积网络提取耳标图片特征;
将上述特征输入LSTM构成的双向循环神经网络;
使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
本发明文字识别算法的流程为:
深度循环网络进行文字串识别,结合了CNN与RNN,由CNN提取图像特征,对特征图进行横向切片,然后采用LSTM循环网络进行推理文本,最后采用CTC损失函数计算预测字符串与标注的差距,完成端到端的训练。
本发明在步骤5中生成文本区域识别难易程度标签包括:
若标注的图片文本区域与预测的图片文本区域的交集大于预设阈值(一般取0.5–0.7),则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签;
若标注的文本内容与预测的文本内容一致,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签。
本发明在步骤6中训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于新标注的图片文本区域和文本区域识别难易程度标签,采用改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型。
本发明带识别难易程度的检测模型,是在Faster-RCNN的基础上进行的改良的检测模型;改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域;
从候选区域回归文本的识别难易。
如图2所示,本发明还提供一种附带识别置信度的文本检测系统,包括:
标注模块,用于对原始图片进行标注,标注图片文本区域和文本内容;
检测模型训练模块,用于基于标注的图片文本区域,训练检测模型;
识别模型训练模块,用于基于标注的文本内容,训练识别模型;
预测模块,用于基于检测模型与识别模型对原始图片进行预测,得到图片文本区域和文本内容的预测结果;
比较模块,用于基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
训练模块,用于基于新标注的图片文本区域和文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
其中:
本发明的训练检测模型的检测算法采用Faster-RCNN、SSD、YOLO、YOLO-v2、EAST、RRCNN或TextBoxes等通用的目标检测算法。
Faster-RCNN检测算法的原理为:
基于深度卷积网络(conv layers)提取原始图片(票据图片)抽象特征(featuremaps);
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域。
Faster-RCNN检测算法的流程为:
1、对图片提取特征;
2、枚举大量的矩形来试图回归出对应的物体;
3、将枚举出的矩形分成2类:包含目标且交集较大的正样本和其他负样本;
4、.将正样本从特征图中裁剪出来,然后根据特征图去回归目标的边界;
5、根据其识别难度,区分图像是否为易识别,容易对的且边界回归较好的区域。
本发明文字识别算法结合了深度卷积神经网络和循环神经网络,共同实现图片到文字的转换。其算法原理如下:
使用卷积网络提取耳标图片特征;
将上述特征输入LSTM构成的双向循环神经网络;
使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
本发明文字识别算法的流程为:
深度循环网络进行文字串识别,结合了CNN与RNN,由CNN提取图像特征,对特征图进行横向切片,然后采用LSTM循环网络进行推理文本,最后采用CTC损失函数计算预测字符串与标注的差距,完成端到端的训练。
本发明在步骤5中生成文本区域识别难易程度标签包括:
若标注的图片文本区域与预测的图片文本区域的交集大于预设阈值(一般取0.5–0.7),则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签;
若标注的文本内容与预测的文本内容一致,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签。
本发明在步骤6中训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于新标注的图片文本区域和文本区域识别难易程度标签,采用改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型。
本发明带识别难易程度的检测模型,是在Faster-RCNN的基础上进行的改良的检测模型;改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域;
从候选区域回归文本的识别难易。
本发明的优点为:
本发明在文本检测和文本识别中能获取极高的准确率,对图片做提取特征的处理,使得在复杂场景也能达到超高准确率;本发明的目标检测自带置信度是对目标定位是否足够准确的一种评估指标,并不能真正的代表检测识别出来的文本是否可用,在实际场景中,新的识别置信度代表的是文本的识别难易程度,对于使用者意义更加明确,使用上更加方便。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种附带识别置信度的文本检测方法,其特征在于,包括:
对原始图片进行标注,标注图片文本区域和文本内容;
基于标注的图片文本区域,训练检测模型;
基于标注的文本内容,训练识别模型;
基于所述检测模型与识别模型对所述原始图片进行预测,得到图片文本区域和文本内容的预测结果;
基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
基于新标注的图片文本区域和所述文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度文本检测模型。
2.如权利要求1所述的附带识别置信度的文本检测方法,其特征在于,所述训练检测模型包括:
基于标注的图片文本区域,采用Faster-RCNN、SSD、YOLO、YOLO-v2、EAST、RRCNN或TextBoxes目标检测算法训练检测模型。
3.如权利要求2所述的附带识别置信度的文本检测方法,其特征在于,基于标注的图片文本区域,采用Faster-RCNN目标检测算法训练检测模型;包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域。
4.如权利要求1所述的附带识别置信度的文本检测方法,其特征在于,所述训练识别模型的文字识别算法结合深度卷积神经网络和循环神经网络,实现图片到文字的转换,包括:
基于深度卷积网络提取图片特征;
将图片特征输入LSTM构成的双向循环神经网络;
使用CTC算法合并叠字和占位符,输出概率最大的文字序列。
5.如权利要求1所述的附带识别置信度的文本检测方法,其特征在于,所述生成文本区域识别难易程度标签包括:
若标注的图片文本区域与预测的图片文本区域的交集大于预设阈值,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签;
若标注的文本内容与预测的文本内容一致,则生成“容易识别”的文本区域识别标签;否则,生成“难以识别”的文本区域识别标签。
6.如权利要求1所述的附带识别置信度的文本检测方法,其特征在于,所述训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于新标注的图片文本区域和所述文本区域识别难易程度标签,采用改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型。
7.如权利要求6所述的附带识别置信度的文本检测方法,其特征在于,所述改进的Faster-RCNN框架训练新的带有文本识别难易程度置信度的文本检测模型包括:
基于深度卷积网络提取原始图片抽象特征;
使用区域候选网络推荐原始图片的候选区域;
从候选区域回归文本的精准区域;
从候选区域回归文本的识别难易。
8.一种如权利要求1-7中任一项所述的附带识别置信度的文本检测方法的文本检测系统,其特征在于,包括:
标注模块,用于对原始图片进行标注,标注图片文本区域和文本内容;
检测模型训练模块,用于基于标注的图片文本区域,训练检测模型;
识别模型训练模块,用于基于标注的文本内容,训练识别模型;
预测模块,用于基于所述检测模型与识别模型对所述原始图片进行预测,得到图片文本区域和文本内容的预测结果;
比较模块,用于基于预测的图片文本区域和文本内容与标注的图片文本区域和文本内容进行比对,生成文本区域识别难易程度标签;
训练模块,用于基于新标注的图片文本区域和所述文本区域识别难易程度标签,训练新的带有文本识别难易程度置信度的文本检测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526406.8A CN109670494B (zh) | 2018-12-13 | 2018-12-13 | 一种附带识别置信度的文本检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526406.8A CN109670494B (zh) | 2018-12-13 | 2018-12-13 | 一种附带识别置信度的文本检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109670494A true CN109670494A (zh) | 2019-04-23 |
CN109670494B CN109670494B (zh) | 2023-09-01 |
Family
ID=66145096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811526406.8A Active CN109670494B (zh) | 2018-12-13 | 2018-12-13 | 一种附带识别置信度的文本检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670494B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211048A (zh) * | 2019-05-28 | 2019-09-06 | 湖北华中电力科技开发有限责任公司 | 一种基于卷积神经网络的复杂档案图像倾斜矫正方法 |
CN110688849A (zh) * | 2019-09-03 | 2020-01-14 | 平安科技(深圳)有限公司 | 渐进式阅读方法、装置、设备及可读存储介质 |
CN111242120A (zh) * | 2020-01-03 | 2020-06-05 | 中国科学技术大学 | 文字检测方法及系统 |
CN111414905A (zh) * | 2020-02-25 | 2020-07-14 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111539417A (zh) * | 2020-04-28 | 2020-08-14 | 深源恒际科技有限公司 | 一种基于深度神经网络的文本识别训练优化方法 |
CN111860487A (zh) * | 2020-07-28 | 2020-10-30 | 天津恒达文博科技股份有限公司 | 基于深度神经网络的碑文标注检测识别系统 |
CN111881881A (zh) * | 2020-08-10 | 2020-11-03 | 晶璞(上海)人工智能科技有限公司 | 一种基于多维度的机器智能文本识别可信度判别方法 |
CN112257965A (zh) * | 2020-11-26 | 2021-01-22 | 深源恒际科技有限公司 | 图像文本识别置信度的预测方法和预测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156766A (zh) * | 2015-03-25 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108921166A (zh) * | 2018-06-22 | 2018-11-30 | 深源恒际科技有限公司 | 基于深度神经网络的医疗票据类文本检测识别方法及系统 |
CN108959252A (zh) * | 2018-06-28 | 2018-12-07 | 中国人民解放军国防科技大学 | 基于深度学习的半监督中文命名实体识别方法 |
-
2018
- 2018-12-13 CN CN201811526406.8A patent/CN109670494B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156766A (zh) * | 2015-03-25 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108921166A (zh) * | 2018-06-22 | 2018-11-30 | 深源恒际科技有限公司 | 基于深度神经网络的医疗票据类文本检测识别方法及系统 |
CN108959252A (zh) * | 2018-06-28 | 2018-12-07 | 中国人民解放军国防科技大学 | 基于深度学习的半监督中文命名实体识别方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211048A (zh) * | 2019-05-28 | 2019-09-06 | 湖北华中电力科技开发有限责任公司 | 一种基于卷积神经网络的复杂档案图像倾斜矫正方法 |
CN110211048B (zh) * | 2019-05-28 | 2020-06-16 | 国家电网有限公司 | 一种基于卷积神经网络的复杂档案图像倾斜矫正方法 |
CN110688849A (zh) * | 2019-09-03 | 2020-01-14 | 平安科技(深圳)有限公司 | 渐进式阅读方法、装置、设备及可读存储介质 |
CN110688849B (zh) * | 2019-09-03 | 2023-09-15 | 平安科技(深圳)有限公司 | 渐进式阅读方法、装置、设备及可读存储介质 |
CN111242120B (zh) * | 2020-01-03 | 2022-07-29 | 中国科学技术大学 | 文字检测方法及系统 |
CN111242120A (zh) * | 2020-01-03 | 2020-06-05 | 中国科学技术大学 | 文字检测方法及系统 |
CN111414905A (zh) * | 2020-02-25 | 2020-07-14 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111414905B (zh) * | 2020-02-25 | 2023-08-18 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111539417A (zh) * | 2020-04-28 | 2020-08-14 | 深源恒际科技有限公司 | 一种基于深度神经网络的文本识别训练优化方法 |
CN111539417B (zh) * | 2020-04-28 | 2024-04-05 | 深源恒际科技有限公司 | 一种基于深度神经网络的文本识别训练优化方法 |
CN111860487A (zh) * | 2020-07-28 | 2020-10-30 | 天津恒达文博科技股份有限公司 | 基于深度神经网络的碑文标注检测识别系统 |
CN111860487B (zh) * | 2020-07-28 | 2022-08-19 | 天津恒达文博科技股份有限公司 | 基于深度神经网络的碑文标注检测识别系统 |
CN111881881A (zh) * | 2020-08-10 | 2020-11-03 | 晶璞(上海)人工智能科技有限公司 | 一种基于多维度的机器智能文本识别可信度判别方法 |
CN112257965A (zh) * | 2020-11-26 | 2021-01-22 | 深源恒际科技有限公司 | 图像文本识别置信度的预测方法和预测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109670494B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670494A (zh) | 一种附带识别置信度的文本检测方法及系统 | |
CN111476067B (zh) | 图像的文字识别方法、装置、电子设备及可读存储介质 | |
CN110135411B (zh) | 名片识别方法和装置 | |
CN108108732B (zh) | 字符辨识系统及其字符辨识方法 | |
CN110442744B (zh) | 提取图像中目标信息的方法、装置、电子设备及可读介质 | |
CN105930836B (zh) | 一种视频文字的识别方法和装置 | |
JP2020527260A (ja) | テキスト検出分析方法、装置及びデバイス | |
CN103995904B (zh) | 一种影像档案电子资料的识别系统 | |
EP3079100B1 (en) | Image processing apparatus, image processing method and computer readable storage medium | |
CN108229481B (zh) | 屏幕内容分析方法、装置、计算设备及存储介质 | |
CN111539417B (zh) | 一种基于深度神经网络的文本识别训练优化方法 | |
CN110135225B (zh) | 样本标注方法及计算机存储介质 | |
CN112257413B (zh) | 地址参数处理方法及相关设备 | |
CN108052931A (zh) | 一种车牌识别结果融合方法及装置 | |
CN112766255A (zh) | 一种光学文字识别方法、装置、设备及存储介质 | |
CN117094311B (zh) | 一种关于中文语法纠错的误纠过滤器的建立方法 | |
CN115393902A (zh) | 一种基于对比语言图像预训练模型clip的行人重识别方法 | |
CN112232354A (zh) | 一种文字识别方法、装置、设备及存储介质 | |
CN114419636A (zh) | 文本识别方法、装置、设备以及存储介质 | |
CN113610770A (zh) | 一种车牌识别方法和装置及设备 | |
US10540541B2 (en) | Cognitive image detection and recognition | |
CN111753618A (zh) | 图像识别方法、装置、计算机设备及计算机可读存储介质 | |
CN116740723A (zh) | 一种基于开源Paddle框架的PDF文档识别方法 | |
CN114637877A (zh) | 标注方法、电子设备及存储介质 | |
CN110503087A (zh) | 一种拍照框题的搜索方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 203, 2nd Floor, Building 6, Qinghe Xisanqi East Road, Haidian District, Beijing, 100000 Applicant after: Beijing Shenzhi Hengji Technology Co.,Ltd. Address before: 0706-003, 113 Zhichun Road, Haidian District, Beijing 100086 Applicant before: SHENYUAN HENGJI TECHNOLOGY CO.,LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |