CN101458770A - 一种文字识别的方法和系统 - Google Patents

一种文字识别的方法和系统 Download PDF

Info

Publication number
CN101458770A
CN101458770A CNA2008102409578A CN200810240957A CN101458770A CN 101458770 A CN101458770 A CN 101458770A CN A2008102409578 A CNA2008102409578 A CN A2008102409578A CN 200810240957 A CN200810240957 A CN 200810240957A CN 101458770 A CN101458770 A CN 101458770A
Authority
CN
China
Prior art keywords
image
deformation pattern
literal
carried out
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102409578A
Other languages
English (en)
Other versions
CN101458770B (zh
Inventor
张岩
于啸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING WINTONE Technologies Co Ltd
Original Assignee
BEIJING WINTONE Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING WINTONE Technologies Co Ltd filed Critical BEIJING WINTONE Technologies Co Ltd
Priority to CN2008102409578A priority Critical patent/CN101458770B/zh
Publication of CN101458770A publication Critical patent/CN101458770A/zh
Application granted granted Critical
Publication of CN101458770B publication Critical patent/CN101458770B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种文字识别的方法和系统,首先获取变形图像矫正所需的几何特征参数;在变形图像上等距离绘制网格,并将网格点投影到成像平面;对每一个网格进行四边形变换,获得网格的矫正图像,并将所有网格的矫正图像拼接成最终矫正图像;确定要识别的文字段落区域,对应到最终矫正图像区域进行预处理,切分得到独立文字;对独立文字图像,采用基于灰度的识别算法进行识别。采用了本发明的技术方案,可以将变形图像复原成为原始状态,然后再进行图像文字提取并实现变形图像的识别。

Description

一种文字识别的方法和系统
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字识别的方法和系统。
背景技术
目前光学字符识别(OCR)技术已经非常成熟并形成了一系列的产品,其中中文OCR识别技术已经在生产生活中得到广泛应用,中文印刷体的识别率可以达到98%以上。但是目前的OCR技术只能处理从扫描仪得到的高清晰度图像,从扫描仪获取的图像,是在源文档完全平整的条件下获取的,因此几乎不会存在几何失真,所得图像值可能在角度上存在一定的倾斜,对于这种倾斜的校正处理实际上已经相当成熟,几乎所有针对扫描仪的商业化OCR软件或者文档采集软件都具备相应的功能。
一个汉字识别系统大体上可分为输入、预处理、识别、后处理和输出共五个部分。
脱机汉字识别系统的对象是印(写)在纸上的文字。它的输入装置可以是扫描仪、传真机、一般摄像机或数字相机等。这些输入装置通常把印在纸上的图文整页地输入计算机。预处理的主要作用不但要把页面上的图文分开,还必须把所有文字逐个分离。在正常情况下,各行文字的投影之间有一空隙。利用这些间隔可以实现行切割,把各行文字分开。同理把每一行文字向垂直方向投影也可以得到投影图。汉字通常是矩形,彼此间有间隔,因此利用各行的垂直投影进行字切割也不困难。
对某一待识字进行识别时,一般必须将该字按一定准则,与存储在机内的每一个标准汉字模板逐一比较,找出其中最相似的字,作为识别的结果。显然,汉字集合的字量越大,识别速度越低。为了提高识别速度,常采用树分类,即多级识别方法,先进行粗分类,再进行单字识别。因此识别模块包含粗分类和单字识别两部分。粗分类的作用是把整个汉字集合划分为若干个较小的子集,叫做候选集。有时有的候选集中的字数较多,还可以进行第二次粗分类,使候选集的字数进一步减少。这样的识别方法通常叫做树分类法,它好像是一棵树,整个汉字集合是树根;然后有树干和树枝,最后的树叶就是单字。顺便指出,这种具有多层分类结构的识别方法,对粗分类特征的要求更高,因为如果粗分类错误,影响很大。
后处理模块的作用是对单字识别器的输出进行校对、纠错,以提高整个系统的正确识别率。后处理纠错方法可以是人工的,也可以是自动的。
通过数码相机采集文档图像,是一个全新的应用领域。与传统的文档图像采集设备——扫描仪相比,数字照相机具有使用灵活,携带方便,不受版面大小限制等优点。
但是,现有的方案主要对于来自扫描仪的工整图像和具有一定倾斜角度的图像都可以很好的识别,对于来自数码相机和收集的任意角度拍摄的图像不能还不能识别。主要是视觉变形的图像不能通过传统的预处理进行有效分割,也不能采取简单的二值化方法进行特征提取。
直接拍摄得到的文档图像通常会存在一定程度的几何畸变,从而降低文档图像的质量,不利于人们对图像文档的阅读效果,同时也不利于后期进行分析和文字识别。如何将直接拍摄的文档图像进行处理以消除这种几何畸变就成为了一个亟待解决的问题。
发明内容
本发明的目的在于提出一种文字识别的方法和系统,能够解决几何畸变图像的文字识别问题。
为达此目的,本发明采用以下技术方案:
一种文字识别的方法,包括以下步骤:
A、获取变形图像矫正所需的几何特征参数;
B、在所述变形图像上等距离绘制网格,并将网格点投影到成像平面;
C、对每一个网格进行四边形变换,获得所述网格的矫正图像,并将所有网格的矫正图像拼接成最终矫正图像;
D、确定要识别的文字段落区域,对应到最终矫正图像区域进行预处理,切分得到独立文字;
E、对所述独立文字图像,采用基于灰度的识别算法进行识别。
步骤A中,所述变形图像矫正所需的几何特征参数包括全局Bezier曲线和消失点。
步骤A进一步包括以下步骤:
获取所述变形图像的水平基线和垂直基线;
对所有的垂直基线交点按照交点的权重取加权平均,获得所述变形图像的垂直方向消失点;
对所有的水平基线变换到同一位置,利用所有的水平基线的点同一进行Bezier曲线拟和,获得一条Bezier准线;
使用最小二乘法进行三次Bezier曲线拟和,获得所述变形图像的全局Bezier曲线。
获取所述变形图像的水平基线进一步包括以下步骤:
对所述变形图像按亮度进行灰度化处理;
将灰度图像进行模糊处理;
对得到的图像进行二值化,数学形态学独粘连处理,形成互相独立的文本行连通域;
对图像进行连通域分析,计算出上下边缘曲线的平均曲线作为水平基线。
使用霍夫变换,从文本行的左右端点中获取所述变形图像的垂直基线。
步骤C中,对每一个网格进行四边形变换是通过双线形插值。
一种文字识别的系统,包括摄影几何参数提取装置、图像变换装置、文档图像版面分析装置和OCR文字识别装置,其中,
摄影几何参数提取装置,用于获取变形图像矫正所需的几何特征参数,并发给图像变换装置;
图像变换装置,用于根据几何特征参数,将变形图像变换为最终矫正图像,并发给文档图像版面分析装置;
文档图像版面分析装置,用于确定要识别的文字段落区域,并发送给OCR文字识别装置;
OCR文字识别装置,用于对图像进行语言判断和识别。
采用了本发明的技术方案,可以将变形图像复原成为原始状态,然后再进行图像文字提取并实现变形图像的识别,从而使得数码相机和手机成为有效的信息采集工具,这样广大群众可以使用自己现有的设备进行信息输入,大大提高工作效率并避免了设备采购的资源消耗。
附图说明
图1是本发明具体实施方式中文字识别系统的结构示意图;
图2是本发明具体实施方式中文字识别的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明技术方案的主要思想是从透镜系统的成像几何关系出发,分析了用照相机拍摄时最经常所遇到的两种文档图像几何畸变:透视畸变和装订线弯曲畸变的成因。将一般柱面模型抽象为Bezier柱面模型,将非参数模型转化为参数模型,并利用该几何模型,给出一整套参数估计与图像校正的算法,不仅解决了对装订线畸变的校正问题,而且可以将透视畸变作为模型的一个特例进行校正。
图1是本发明具体实施方式中文字识别系统的结构示意图。如图1所示,文字识别系统包括摄影几何参数提取装置101、图像变换装置102、文档图像版面分析装置103和OCR文字识别装置104,其中,摄影几何参数提取装置获取变形图像矫正所需的几何特征参数,并发给图像变换装置;图像变换装置根据几何特征参数,将变形图像变换为最终矫正图像,并发给文档图像版面分析装置;文档图像版面分析装置确定要识别的文字段落区域,并发送给OCR文字识别装置;OCR文字识别装置对图像进行语言判断和识别。
图2是本发明具体实施方式中文字识别的流程图。如图2所示,文字识别的流程包括以下步骤:
步骤201、用户用数码相机及手机随时随地采集信息,经USB读卡器或经蓝牙无线传递至计算机。
根据摄影几何原理可以证明,只要计算出消失点的位置和任意一条准线的投影,就可以恢复柱面的形状。
步骤202、计算机对接收到的变形图像按亮度进行灰度化处理,并将灰度图像进行模糊处理。对得到的图像进行二值化,数学形态学独粘连处理,形成互相独立的文本行连通域。
步骤203、对图像进行连通域分析,筛选出宽高比较大的连通域,计算出上下边缘曲线的平均曲线作为水平基线。
步骤204、使用霍夫变换,从文本行的左右端点中获取变形图像的垂直基线。也可以采用与获得水平基线类似的方法获得垂直基线。
步骤205、对所有的垂直基线交点按照交点的权重取加权平均,获得所述变形图像的垂直方向消失点。
步骤206、根据图像的对应的原始曲面特征采用不同的拟合函数f(x),常用的方法是采用最小均方误差方法来确定多项式拟合函数f(x)的参数。根据曲面特征可以选择相应的拟合方法,如抛物线拟合、椭圆拟合、二维三阶拟合(例如二维高斯拟合)等。对于柱面的书籍变形曲面,可以采用三次Bezier曲线拟合。
即对所有的水平基线变换到同一位置,利用所有的水平基线的点同一进行Bezier曲线拟和,获得一条Bezier准线。使用最小二乘法进行三次Bezier曲线拟和,获得变形图像的全局Bezier曲线。
对于其他形式的投影几何变形文档图像的校正,可以采用同样的方法处理,只是要选取一种跟变形曲面接近的曲线作为准线,采用最小二乘法进行拟和即可。
步骤207、在变形图像上等距离绘制网格,并将网格点投影到成像平面。对每一个网格通过双线形插值进行四边形变换,获得所述网格的矫正图像,并将所有网格的矫正图像拼接成最终矫正图像。
其中双线形插值是图像四边形变换中最为简单的一种。双线形插值变换算法效率较高,但存在一定误差。当图像区域较大,也就是网格较为稀疏时,这种算法并不理想,一定会存在相当大的误差,严重影响校正图像质量。然而当网格数较多,每个网格尺寸较小时,该误差完全可以忽略,而此时其模型简单、计算效率较高的特点就完全显现了出来。因此我们对每个网格内的图像校正采用了双线形插值的算法,可以兼顾算法效率与校正质量。
步骤208、确定要识别的文字段落区域,对应到最终矫正图像区域进行预处理,切分得到独立文字,对所述独立文字图像,采用基于灰度的识别算法进行识别。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1、一种文字识别的方法,其特征在于,包括以下步骤:
A、获取变形图像矫正所需的几何特征参数;
B、在所述变形图像上等距离绘制网格,并将网格点投影到成像平面;
C、对每一个网格进行四边形变换,获得所述网格的矫正图像,并将所有网格的矫正图像拼接成最终矫正图像;
D、确定要识别的文字段落区域,对应到最终矫正图像区域进行预处理,切分得到独立文字;
E、对所述独立文字图像,采用基于灰度的识别算法进行识别。
2、根据权利要求1所述的一种文字识别的方法,其特征在于,步骤A中,所述变形图像矫正所需的几何特征参数包括全局Bezier曲线和消失点。
3、根据权利要求2所述的一种文字识别的方法,其特征在于,步骤A进一步包括以下步骤:
获取所述变形图像的水平基线和垂直基线;
对所有的垂直基线交点按照交点的权重取加权平均,获得所述变形图像的垂直方向消失点;
对所有的水平基线变换到同一位置,利用所有的水平基线的点同一进行Bezier曲线拟和,获得一条Bezier准线;
使用最小二乘法进行三次Bezier曲线拟和,获得所述变形图像的全局Bezier曲线。
4、根据权利要求3所述的一种文字识别的方法,其特征在于,获取所述变形图像的水平基线进一步包括以下步骤:
对所述变形图像按亮度进行灰度化处理;
将灰度图像进行模糊处理;
对得到的图像进行二值化,数学形态学独粘连处理,形成互相独立的文本行连通域;
对图像进行连通域分析,计算出上下边缘曲线的平均曲线作为水平基线。
5、根据权利要求3所述的一种文字识别的方法,其特征在于,使用霍夫变换,从文本行的左右端点中获取所述变形图像的垂直基线。
6、根据权利要求1所述的一种文字识别的方法,其特征在于,步骤C中,对每一个网格进行四边形变换是通过双线形插值。
7、一种文字识别的系统,其特征在于,包括摄影几何参数提取装置、图像变换装置、文档图像版面分析装置和OCR文字识别装置,其中,
摄影几何参数提取装置,用于获取变形图像矫正所需的几何特征参数,并发给图像变换装置;
图像变换装置,用于根据几何特征参数,将变形图像变换为最终矫正图像,并发给文档图像版面分析装置;
文档图像版面分析装置,用于确定要识别的文字段落区域,并发送给OCR文字识别装置;
OCR文字识别装置,用于对图像进行语言判断和识别。
CN2008102409578A 2008-12-24 2008-12-24 一种文字识别的方法和系统 Expired - Fee Related CN101458770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102409578A CN101458770B (zh) 2008-12-24 2008-12-24 一种文字识别的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102409578A CN101458770B (zh) 2008-12-24 2008-12-24 一种文字识别的方法和系统

Publications (2)

Publication Number Publication Date
CN101458770A true CN101458770A (zh) 2009-06-17
CN101458770B CN101458770B (zh) 2011-07-06

Family

ID=40769619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102409578A Expired - Fee Related CN101458770B (zh) 2008-12-24 2008-12-24 一种文字识别的方法和系统

Country Status (1)

Country Link
CN (1) CN101458770B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346736A (zh) * 2010-07-28 2012-02-08 阿里巴巴集团控股有限公司 一种网页数字信息的保护方法及系统
CN102663382A (zh) * 2012-04-25 2012-09-12 重庆邮电大学 基于子网格特征自适应加权的视频图像文字识别方法
CN102682007A (zh) * 2011-03-11 2012-09-19 阿里巴巴集团控股有限公司 创建图像数据库的方法和装置
CN102752549A (zh) * 2011-05-17 2012-10-24 新奥特(北京)视频技术有限公司 一种基于网格形变的特效的实现方法
CN102782702A (zh) * 2010-03-10 2012-11-14 微软公司 在光学字符识别(ocr)过程中的段落识别
CN104700360A (zh) * 2015-04-01 2015-06-10 中国科学院自动化研究所 基于边缘自适应的图像缩放方法及系统
CN104809436A (zh) * 2015-04-23 2015-07-29 天津大学 一种弯曲书面文字识别方法
CN104835120A (zh) * 2015-04-23 2015-08-12 天津大学 一种基于基准线的弯曲书面展平方法
CN105069766A (zh) * 2015-07-24 2015-11-18 北京航空航天大学 一种基于汉字图像轮廓特征描述的碑文修复方法
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
CN105825282A (zh) * 2016-03-16 2016-08-03 上海翼锐汽车科技有限公司 一种充电桩云平台
CN106127688A (zh) * 2016-06-30 2016-11-16 北京大学 一种超分辨率图像重建方法及其系统
CN106650719A (zh) * 2016-12-21 2017-05-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108229436A (zh) * 2018-02-02 2018-06-29 杭州清本科技有限公司 用于证书识别的彩色图像灰度化方法及装置、存储介质
CN108335266A (zh) * 2017-04-14 2018-07-27 陈思远 一种文档图像畸变的矫正方法
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
CN109214387A (zh) * 2018-09-14 2019-01-15 辽宁奇辉电子系统工程有限公司 一种基于文字识别技术的铁路作业检测系统
CN110807454A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质
WO2020140198A1 (zh) * 2019-01-02 2020-07-09 深圳市邻友通科技发展有限公司 指甲图像分割方法、装置、设备和存储介质
CN111815507A (zh) * 2020-07-20 2020-10-23 中国人民解放军国防科技大学 一种个人图书馆构建方法及装置
CN111860484A (zh) * 2020-07-22 2020-10-30 腾讯科技(深圳)有限公司 一种区域标注方法、装置、设备及存储介质
CN112233313A (zh) * 2020-10-19 2021-01-15 中国工商银行股份有限公司 一种纸币识别方法、装置及设备
CN112330786A (zh) * 2020-11-03 2021-02-05 阳光保险集团股份有限公司 一种生成三维变形文本图像的方法及设备
CN113221545A (zh) * 2021-05-10 2021-08-06 北京有竹居网络技术有限公司 一种文本处理方法、装置、设备及介质、程序产品
CN113888536A (zh) * 2021-12-01 2022-01-04 武汉市利友印务有限公司 一种基于计算机视觉的印刷品重影检测方法及系统

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102782702A (zh) * 2010-03-10 2012-11-14 微软公司 在光学字符识别(ocr)过程中的段落识别
US8565474B2 (en) 2010-03-10 2013-10-22 Microsoft Corporation Paragraph recognition in an optical character recognition (OCR) process
CN102346736B (zh) * 2010-07-28 2014-04-09 阿里巴巴集团控股有限公司 一种网页数字信息的保护方法及系统
CN102346736A (zh) * 2010-07-28 2012-02-08 阿里巴巴集团控股有限公司 一种网页数字信息的保护方法及系统
CN102682007A (zh) * 2011-03-11 2012-09-19 阿里巴巴集团控股有限公司 创建图像数据库的方法和装置
CN102752549B (zh) * 2011-05-17 2017-04-12 新奥特(北京)视频技术有限公司 一种基于网格形变的特效的实现方法
CN102752549A (zh) * 2011-05-17 2012-10-24 新奥特(北京)视频技术有限公司 一种基于网格形变的特效的实现方法
CN102663382A (zh) * 2012-04-25 2012-09-12 重庆邮电大学 基于子网格特征自适应加权的视频图像文字识别方法
US10346703B2 (en) 2014-11-06 2019-07-09 Alibaba Group Holding Limited Method and apparatus for information recognition
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
CN104700360A (zh) * 2015-04-01 2015-06-10 中国科学院自动化研究所 基于边缘自适应的图像缩放方法及系统
CN104700360B (zh) * 2015-04-01 2018-06-05 北京思朗科技有限责任公司 基于边缘自适应的图像缩放方法及系统
CN104809436B (zh) * 2015-04-23 2017-12-15 天津大学 一种弯曲书面文字识别方法
CN104835120B (zh) * 2015-04-23 2017-07-28 天津大学 一种基于基准线的弯曲书面展平方法
CN104835120A (zh) * 2015-04-23 2015-08-12 天津大学 一种基于基准线的弯曲书面展平方法
CN104809436A (zh) * 2015-04-23 2015-07-29 天津大学 一种弯曲书面文字识别方法
CN105069766B (zh) * 2015-07-24 2017-12-08 北京航空航天大学 一种基于汉字图像轮廓特征描述的碑文修复方法
CN105069766A (zh) * 2015-07-24 2015-11-18 北京航空航天大学 一种基于汉字图像轮廓特征描述的碑文修复方法
CN105825282A (zh) * 2016-03-16 2016-08-03 上海翼锐汽车科技有限公司 一种充电桩云平台
CN106127688A (zh) * 2016-06-30 2016-11-16 北京大学 一种超分辨率图像重建方法及其系统
CN106127688B (zh) * 2016-06-30 2019-10-18 北京大学 一种超分辨率图像重建方法及其系统
CN106650719A (zh) * 2016-12-21 2017-05-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN106650719B (zh) * 2016-12-21 2020-04-10 浙江宇视科技有限公司 识别图片文字的方法及装置
CN108335266A (zh) * 2017-04-14 2018-07-27 陈思远 一种文档图像畸变的矫正方法
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108229436A (zh) * 2018-02-02 2018-06-29 杭州清本科技有限公司 用于证书识别的彩色图像灰度化方法及装置、存储介质
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
CN108549643B (zh) * 2018-04-08 2022-08-05 北京百度网讯科技有限公司 翻译处理方法和装置
CN109214387A (zh) * 2018-09-14 2019-01-15 辽宁奇辉电子系统工程有限公司 一种基于文字识别技术的铁路作业检测系统
WO2020140198A1 (zh) * 2019-01-02 2020-07-09 深圳市邻友通科技发展有限公司 指甲图像分割方法、装置、设备和存储介质
WO2021051527A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质
CN110807454A (zh) * 2019-09-19 2020-02-18 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质
CN110807454B (zh) * 2019-09-19 2024-05-14 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质
CN111815507A (zh) * 2020-07-20 2020-10-23 中国人民解放军国防科技大学 一种个人图书馆构建方法及装置
CN111815507B (zh) * 2020-07-20 2023-06-20 中国人民解放军国防科技大学 一种个人图书馆构建方法及装置
CN111860484A (zh) * 2020-07-22 2020-10-30 腾讯科技(深圳)有限公司 一种区域标注方法、装置、设备及存储介质
CN111860484B (zh) * 2020-07-22 2023-11-03 腾讯科技(深圳)有限公司 一种区域标注方法、装置、设备及存储介质
CN112233313A (zh) * 2020-10-19 2021-01-15 中国工商银行股份有限公司 一种纸币识别方法、装置及设备
CN112330786A (zh) * 2020-11-03 2021-02-05 阳光保险集团股份有限公司 一种生成三维变形文本图像的方法及设备
CN113221545A (zh) * 2021-05-10 2021-08-06 北京有竹居网络技术有限公司 一种文本处理方法、装置、设备及介质、程序产品
CN113221545B (zh) * 2021-05-10 2023-08-08 北京有竹居网络技术有限公司 一种文本处理方法、装置、设备及介质、程序产品
CN113888536A (zh) * 2021-12-01 2022-01-04 武汉市利友印务有限公司 一种基于计算机视觉的印刷品重影检测方法及系统

Also Published As

Publication number Publication date
CN101458770B (zh) 2011-07-06

Similar Documents

Publication Publication Date Title
CN101458770B (zh) 一种文字识别的方法和系统
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
CN109657665B (zh) 一种基于深度学习的发票批量自动识别系统
CN103488983B (zh) 一种基于知识库的名片ocr数据修正方法和系统
CN106960208B (zh) 一种仪表液晶数字自动切分和识别的方法及系统
RU2678485C1 (ru) Способ сегментации и распознавания символов
CN103617415A (zh) 一种自动识别发票的装置和方法
CN101908136A (zh) 一种表格识别处理方法及系统
CN103927352A (zh) 利用知识库海量关联信息的中文名片ocr数据修正系统
CN105701488A (zh) 一种身份证识别方法
CN110969129A (zh) 一种端到端税务票据文本检测与识别方法
CN110807455A (zh) 基于深度学习的票据检测方法、装置、设备及存储介质
CN105225218B (zh) 用于文档图像的畸变校正方法和设备
CN105844277B (zh) 标签识别方法和装置
CN107451582A (zh) 一种图文识别系统及其识别方法
CN101887519A (zh) 文字识别、编改的方法
CN110490185A (zh) 一种基于多次对比矫正ocr名片信息识别改进方法
Edward V Support vector machine based automatic electric meter reading system
CN115909375A (zh) 一种基于智能识别的报表分析方法
CN102915449A (zh) 一种照片分类方法
CN112329641B (zh) 一种表格识别方法、装置、设备及可读存储介质
WO2022082431A1 (en) Systems and methods for extracting information from paper media based on depth information
KR100655916B1 (ko) 방대한 데이터의 디지털화를 위한 문서영상처리 및검증시스템 및 그 방법
CN110414517B (zh) 一种用于配合拍照场景的快速高精度身份证文本识别算法
CN117292102A (zh) 基于融合特征的提取印章褶皱优化方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110706

Termination date: 20201224

CF01 Termination of patent right due to non-payment of annual fee