CN107437085A - 一种提升ocr识别率的方法、装置及可读存储介质 - Google Patents
一种提升ocr识别率的方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN107437085A CN107437085A CN201710674304.XA CN201710674304A CN107437085A CN 107437085 A CN107437085 A CN 107437085A CN 201710674304 A CN201710674304 A CN 201710674304A CN 107437085 A CN107437085 A CN 107437085A
- Authority
- CN
- China
- Prior art keywords
- fragment
- bill
- information
- ocr
- rectangular block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000012634 fragment Substances 0.000 claims abstract description 86
- 238000013467 fragmentation Methods 0.000 claims description 9
- 238000006062 fragmentation reaction Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 6
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种提升OCR识别率的方法、装置及可读存储介质,所述方法包括:S1:输入待识别票据图像的基本信息和模板集合;S2:对票据进行检测,判断票据类型,匹配某套特定模板;S3:对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;S4:使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;S5:通过前面的步骤处理,获取一张票据中所有的碎片信息;S6:针对碎片进行特征匹配,得到碎片中的文字信息。本发明经重新切割和定位碎片的位置和尺寸,解决套模板截取区域不全、截取偏差等情况,最终提高了OCR的识别率。
Description
技术领域
本发明涉及一种光学字符识别(OCR)领域的图像处理技术,特别提供一种提升OCR识别率的方法、装置及可读存储介质。
背景技术
目前,普通的OCR识别技术,根据扫描到的字符版面进行字符识别,字体类型大小变化不大,采用投影算法,分割出每一行的字符,进行识别,成功率很高。
但是,在票据OCR识别场景中,进行OCR识别的票据种类繁多,需要采用套模板的方式,针对不同种类的票据,使用相应的模板,截取出需要进行识别的小区域图像,然后对这些小区域分别进行OCR识别。由于票据上字符的字体类型不确定、大小不统一,区域不固定,分辨率不一致,还有票据本身折叠、老化、扭曲等,在进行套模板的时候会出现截取区域的位置偏移、尺寸过大或过小,导致截取区域不全、截取偏差等情况。
发明内容
为了解决上述现有技术套模板截取区域不全、截取偏差等问题,本发明的目的是提供了一种提升OCR识别率的方法与系统。
为达到上述目的,本发明的技术方案如下。
一种提升OCR识别率的方法,所述方法包括:
S1:输入待识别票据图像的基本信息和模板集合;
S2:对票据进行检测,判断票据类型,匹配某套特定模板;
S3:对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
S4:使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;
S5:通过前面的步骤处理,获取一张票据中所有的碎片信息;
S6:针对碎片进行特征匹配,得到碎片中的文字信息。
进一步,所述步骤S2的匹配模板包括原图中的位置信息、尺寸信息、碎片业务类型信息。
进一步,所述步骤S4中的重新切割和定位过程包括以下步骤:
S41:获取票据原图、碎片的信息;
S42:根据碎片的水平与竖直方向做投影,检测出线条并用背景色填充,同时去除线条;
S43:根据碎片水平方向投影检测行区域,再对每个行区域进行竖直方向投影,将前景纹理标记成多个矩形块;
S44:对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块;
S45:根据得到的大块是否在碎片图像的边缘处,判断该矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
S46:输出最终碎片信息。
进一步,对所述从原图中获取新碎片,包括:
根据所述S44步骤得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片。
一种提升OCR识别率的装置,所述装置包括:
输入模块,用于输入待识别票据图像的基本信息和模板集合;
匹配模块,用于对票据进行检测,判断票据类型,匹配某套特定模板;
纠偏模块,用于对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
重定位模块,使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;
信息获取模块,通过前面的步骤处理,获取一张票据中所有的碎片信息;
OCR识别模块,针对碎片进行特征匹配,得到碎片中的文字信息。
进一步,所述匹配模块包括:
信息单元:包含原图中的位置信息、尺寸信息、碎片业务类型信息。
进一步,所述重定位模块包括:
信息获取单元,用于获取票据原图、碎片的信息;
除扰单元,用于去除碎片表格线的干扰;
检测单元,对碎片边缘检测获取前景纹理区域,同时将前景纹理区域标记成多个矩形块;
过滤单元,用于对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块;
判断单元,用于判断矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
输出单元,输出最终碎片信息。
进一步,对所述的判断单元还包括:
扩展单元,根据所述过滤单元得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片。
本发明的有益效果是:经使用基础图像处理技术,综合分析了碎片中的纹理情况,重新切割和定位碎片的位置和尺寸,解决套模板截取区域不全、截取偏差等情况,重新选取区域的位置和尺寸以获取更精准的目标区域,提高最终OCR的识别率。
附图说明
图1为本发明的流程图;图2为本发明的碎片重定位流程图;图3为本发明的一个实施流程图;图4为本发明的实施前后对比图。
具体实施方式
下面结合附图进一步详细描述本发明的具体实施方式。
如图1配合图3所示,一种提升OCR识别率的方法,所述方法包括:
S1:输入待识别票据图像的基本信息和模板集合;
S2:对票据进行检测,判断票据类型,匹配某套特定模板;
所述步骤S2的匹配模板包括原图中的位置信息、尺寸信息、碎片业务类型信息;
S3:对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
S4:使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸,其中步骤:
S41:获取票据原图、碎片的信息,得到票据图片a;
S42:根据碎片的水平与竖直方向做投影,检测出线条并用背景色填充,同时去除线条,得到票据图片b;
S43:根据碎片水平方向投影检测行区域,再对每个行区域进行竖直方向投影,将前景纹理标记成多个矩形块,得到纹理候选区域图片c;
S44:对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块,得到最终的字符区域即为图片d;
S45:根据得到的大块是否在碎片图像的边缘处,判断该矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
S46:输出最终碎片信息,即为图片e;
S5:通过前面的步骤处理,获取一张票据中所有的碎片信息;
S6:针对碎片进行特征匹配,得到碎片中的文字信息。
进一步,对所述从原图中获取新碎片,包括:
根据所述S44步骤得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片。
如图2所示,一种提升OCR识别率的装置,是一种计算机可读存储介质,其上存储有计算机程序(指令),所述装置包括:
所述输入模块,用于输入待识别票据图像的基本数据、基本像素与尺寸;
所述匹配模块,用于对票据进行检测,判断票据类型,匹配某套特定模板;
所述匹配模块包括:
信息单元,包含原图中的位置信息、尺寸信息、碎片业务类型信息;
所述纠偏模块,用于对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
所述重定位模块,使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;
所述重定位模块包括:
信息获取单元,用于获取票据原图、碎片的信息;
除扰单元,用于去除碎片表格线的干扰;
检测单元,对碎片边缘检测获取前景纹理区域,同时将前景纹理区域标记成多个矩形块;
过滤单元,用于对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块;
判断单元,用于判断矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
所述的判断单元还包括:
扩展单元,根据所述过滤单元得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片;
输出单元,输出最终碎片信息;
所述信息获取模块,通过前面的步骤处理,获取一张票据中所有的碎片信息;
所述OCR识别模块,针对碎片进行特征匹配,得到碎片中的文字信息。
经本发明的上述实施例以及图4(1)、(2)处理前后的对比图可以看出,原始票据经过本发明的一系列技术操作后,不仅解决套模板截取区域不全、截取偏差等情况,还得到了更精准的目标区域,最终提高了OCR的识别率。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (9)
1.一种提升OCR识别率的方法,其特征在于,所述方法包括:
S1:输入待识别票据图像的基本信息和模板集合;
S2:对票据进行检测,判断票据类型,匹配某套特定模板;
S3:对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
S4:使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;
S5:通过前面的步骤处理,获取一张票据中所有的碎片信息;
S6:针对碎片进行特征匹配,得到碎片中的文字信息。
2.根据权利要求1所述的提升OCR识别率的方法,其特征在于:所述步骤S2的匹配模板包括原图中的位置信息、尺寸信息、碎片业务类型信息。
3.根据权利要求1所述的提升OCR识别率的方法,其特征在于,所述步骤S4中的重新切割和定位过程包括以下步骤:
S41:获取票据原图、碎片的信息;
S42:根据碎片的水平与竖直方向做投影,检测出线条并用背景色填充,同时去除线条;
S43:根据碎片水平方向投影检测行区域,再对每个行区域进行竖直方向投影,将前景纹理标记成多个矩形块;
S44:对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块;
S45:根据得到的大块是否在碎片图像的边缘处,判断该矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
S46:输出最终碎片信息。
4.根据权利要求3所述的提升OCR识别率的方法,其特征在于,对所述从原图中获取新碎片,包括:
根据所述S44步骤得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片。
5.一种提升OCR识别率的装置,其特征在于,所述装置包括:
输入模块,用于输入待识别票据图像的基本信息和模板集合;
匹配模块,用于对票据进行检测,判断票据类型,匹配某套特定模板;
纠偏模块,用于对比模板中碎片的位置与实际在票据中的位置,纠正碎片位置不准确的情况;
重定位模块,使用图像处理技术,综合分析碎片中的纹理情况,重新切割和定位碎片的位置和尺寸;
信息获取模块,通过前面的步骤处理,获取一张票据中所有的碎片信息;
OCR识别模块,针对碎片进行特征匹配,得到碎片中的文字信息。
6.根据权利要求5所述的提升OCR识别率的装置,其特征在于,所述匹配模块包括:
信息单元:包含原图中的位置信息、尺寸信息、碎片业务类型信息。
7.根据权利要求5所述的提升OCR识别率的装置,其特征在于:所述重定位模块包括:
信息获取单元,用于获取票据原图、碎片的信息;
除扰单元,用于去除碎片表格线的干扰;
检测单元,对碎片边缘检测获取前景纹理区域,同时将前景纹理区域标记成多个矩形块;
过滤单元,用于对间距比较小的矩形块进行合并,形成大块,过滤掉孤立的小矩形块,保留具有多个相似小块合并后的大块;
判断单元,用于判断矩形块是否完整,如果矩形块在碎片图像的边缘,则认为该矩形块不完整,需要重定位,从原图中获取新碎片;否则,直接切割碎片以获取新碎片;
输出单元,输出最终碎片信息。
8.根据权利要求6所述的提升OCR识别率的装置,其特征在于:对所述的判断单元还包括:
扩展单元:根据所述过滤单元得出的矩形块的宽高和间距等信息,对所述大块的上、下、左、右四个方向往外扩展,直到扩展到不能添加新纹理或者扩展次数达到阈值,得到新的碎片。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710674304.XA CN107437085A (zh) | 2017-08-09 | 2017-08-09 | 一种提升ocr识别率的方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710674304.XA CN107437085A (zh) | 2017-08-09 | 2017-08-09 | 一种提升ocr识别率的方法、装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107437085A true CN107437085A (zh) | 2017-12-05 |
Family
ID=60461441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710674304.XA Pending CN107437085A (zh) | 2017-08-09 | 2017-08-09 | 一种提升ocr识别率的方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107437085A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271951A (zh) * | 2018-09-28 | 2019-01-25 | 厦门商集网络科技有限责任公司 | 一种提升记账审核效率的方法及系统 |
CN109584335A (zh) * | 2018-11-16 | 2019-04-05 | 金蝶软件(中国)有限公司 | 图形填充方法、装置、计算机设备和存储介质 |
CN109886257A (zh) * | 2019-01-30 | 2019-06-14 | 四川长虹电器股份有限公司 | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 |
WO2019140641A1 (zh) * | 2018-01-19 | 2019-07-25 | 深圳前海达闼云端智能科技有限公司 | 信息处理方法、系统、云处理设备以及计算机程序产品 |
CN110059559A (zh) * | 2019-03-15 | 2019-07-26 | 深圳壹账通智能科技有限公司 | Ocr识别文件的处理方法及其电子设备 |
CN111259882A (zh) * | 2020-01-14 | 2020-06-09 | 平安科技(深圳)有限公司 | 票据识别的方法、装置及计算机设备 |
CN111680679A (zh) * | 2020-06-03 | 2020-09-18 | 重庆数道科技有限公司 | 一种基于ocr的单据自动识别方法 |
CN112801232A (zh) * | 2021-04-09 | 2021-05-14 | 苏州艾隆科技股份有限公司 | 一种应用于处方录入的扫描识别方法及系统 |
CN112801086A (zh) * | 2021-03-30 | 2021-05-14 | 中国建设银行股份有限公司 | 凭证分类的方法、装置、电子设备和存储介质 |
WO2022262114A1 (zh) * | 2021-06-16 | 2022-12-22 | 北京来也网络科技有限公司 | 结合rpa和ai报关信息的处理方法和处理装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830024A1 (en) * | 2012-03-22 | 2015-01-28 | Glory Ltd. | System for reading paper sheet serial number, and method for reading paper sheet serial number |
EP2919167A2 (en) * | 2014-03-14 | 2015-09-16 | Omron Corporation | Image processing device, image processing method, and image processing program |
CN105184265A (zh) * | 2015-09-14 | 2015-12-23 | 哈尔滨工业大学 | 一种基于自学习的手写表格数字字符串快速识别的方法 |
CN105320952A (zh) * | 2015-10-15 | 2016-02-10 | 广东广信通信服务有限公司 | 一种基于ocr的行驶证信息识别方法 |
CN106485255A (zh) * | 2016-09-29 | 2017-03-08 | 深圳元启智能技术有限公司 | 一种dm码定位及识别的方法与系统 |
US20170116494A1 (en) * | 2015-10-22 | 2017-04-27 | Abbyy Development Llc | Video capture in data capture scenario |
CN106778730A (zh) * | 2016-12-29 | 2017-05-31 | 深圳爱拼信息科技有限公司 | 一种用于快速生成ocr训练样本的自适应方法及系统 |
-
2017
- 2017-08-09 CN CN201710674304.XA patent/CN107437085A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830024A1 (en) * | 2012-03-22 | 2015-01-28 | Glory Ltd. | System for reading paper sheet serial number, and method for reading paper sheet serial number |
EP2919167A2 (en) * | 2014-03-14 | 2015-09-16 | Omron Corporation | Image processing device, image processing method, and image processing program |
CN105184265A (zh) * | 2015-09-14 | 2015-12-23 | 哈尔滨工业大学 | 一种基于自学习的手写表格数字字符串快速识别的方法 |
CN105320952A (zh) * | 2015-10-15 | 2016-02-10 | 广东广信通信服务有限公司 | 一种基于ocr的行驶证信息识别方法 |
US20170116494A1 (en) * | 2015-10-22 | 2017-04-27 | Abbyy Development Llc | Video capture in data capture scenario |
CN106485255A (zh) * | 2016-09-29 | 2017-03-08 | 深圳元启智能技术有限公司 | 一种dm码定位及识别的方法与系统 |
CN106778730A (zh) * | 2016-12-29 | 2017-05-31 | 深圳爱拼信息科技有限公司 | 一种用于快速生成ocr训练样本的自适应方法及系统 |
Non-Patent Citations (2)
Title |
---|
林强: "基于OCR的支票识别系统的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈强: "非限定手写体汉字分割与多类别票据处理研究", 《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019140641A1 (zh) * | 2018-01-19 | 2019-07-25 | 深圳前海达闼云端智能科技有限公司 | 信息处理方法、系统、云处理设备以及计算机程序产品 |
CN110291527A (zh) * | 2018-01-19 | 2019-09-27 | 深圳前海达闼云端智能科技有限公司 | 信息处理方法、系统、云处理设备以及计算机程序产品 |
CN110291527B (zh) * | 2018-01-19 | 2023-03-24 | 达闼机器人股份有限公司 | 信息处理方法、系统、云处理设备以及计算机程序产品 |
CN109271951A (zh) * | 2018-09-28 | 2019-01-25 | 厦门商集网络科技有限责任公司 | 一种提升记账审核效率的方法及系统 |
CN109584335A (zh) * | 2018-11-16 | 2019-04-05 | 金蝶软件(中国)有限公司 | 图形填充方法、装置、计算机设备和存储介质 |
CN109886257B (zh) * | 2019-01-30 | 2022-10-18 | 四川长虹电器股份有限公司 | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 |
CN109886257A (zh) * | 2019-01-30 | 2019-06-14 | 四川长虹电器股份有限公司 | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 |
CN110059559A (zh) * | 2019-03-15 | 2019-07-26 | 深圳壹账通智能科技有限公司 | Ocr识别文件的处理方法及其电子设备 |
CN111259882A (zh) * | 2020-01-14 | 2020-06-09 | 平安科技(深圳)有限公司 | 票据识别的方法、装置及计算机设备 |
CN111259882B (zh) * | 2020-01-14 | 2023-12-26 | 平安科技(深圳)有限公司 | 票据识别的方法、装置及计算机设备 |
CN111680679A (zh) * | 2020-06-03 | 2020-09-18 | 重庆数道科技有限公司 | 一种基于ocr的单据自动识别方法 |
CN112801086A (zh) * | 2021-03-30 | 2021-05-14 | 中国建设银行股份有限公司 | 凭证分类的方法、装置、电子设备和存储介质 |
CN112801232A (zh) * | 2021-04-09 | 2021-05-14 | 苏州艾隆科技股份有限公司 | 一种应用于处方录入的扫描识别方法及系统 |
WO2022262114A1 (zh) * | 2021-06-16 | 2022-12-22 | 北京来也网络科技有限公司 | 结合rpa和ai报关信息的处理方法和处理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107437085A (zh) | 一种提升ocr识别率的方法、装置及可读存储介质 | |
CN104392238B (zh) | 含多类型标识的信息载体的识别方法 | |
CN109902758B (zh) | 基于深度学习的车道区域识别的数据集标定方法 | |
KR101207127B1 (ko) | 문자 인식 전처리 방법 및 장치 | |
CN104200210A (zh) | 一种基于部件的车牌字符分割方法 | |
CN104616275A (zh) | 一种缺陷检测方法和装置 | |
CN111737478B (zh) | 文本检测方法、电子设备及计算机可读介质 | |
CN112329641B (zh) | 一种表格识别方法、装置、设备及可读存储介质 | |
CN112906695B (zh) | 适配多类ocr识别接口的表格识别方法及相关设备 | |
CN101958989A (zh) | 图像处理装置、图像处理系统及图像处理方法 | |
CN110807454A (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
CN112348019B (zh) | 一种答题卡矫正方法、装置、电子设备及存储介质 | |
CN103488986A (zh) | 自适应字符切分及提取方法 | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
CN104361335B (zh) | 一种基于扫描图像自动去除黑边的处理方法 | |
CN115063802A (zh) | 一种基于PSENet的圆形印章识别方法、设备及介质 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
KR20140093407A (ko) | 인식기, 차량모델인식장치 및 방법 | |
CN113642380A (zh) | 一种用于无线表格的识别技术 | |
JP7258632B2 (ja) | 物体検出装置 | |
JP4013060B2 (ja) | 画像補正方法および画像補正装置 | |
CN110610163B (zh) | 一种自然场景下基于椭圆拟合的表格提取方法及系统 | |
CN109635798B (zh) | 一种信息提取方法及装置 | |
CN111340000A (zh) | 一种针对pdf文档表格提取优化方法及系统 | |
CN115035541A (zh) | 一种大尺寸复杂pdf工程图纸文本检测与识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 361000 room 3008, Xuan Ye Lou, Pioneer Park, Xiamen torch high tech Zone, Xiamen, Fujian Applicant after: XIAMEN SHANGJI NETWORK TECHNOLOGY Co.,Ltd. Address before: 361000 room 3008, Xuan Ye Lou, Pioneer Park, Xiamen torch high tech Zone, Xiamen, Fujian Applicant before: XIAMEN SHANGJEE ENTERPRISE CONSULTING CO.,LTD. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171205 |
|
RJ01 | Rejection of invention patent application after publication |