CN101833648A - 文本图像的校正方法 - Google Patents

文本图像的校正方法 Download PDF

Info

Publication number
CN101833648A
CN101833648A CN200910079865A CN200910079865A CN101833648A CN 101833648 A CN101833648 A CN 101833648A CN 200910079865 A CN200910079865 A CN 200910079865A CN 200910079865 A CN200910079865 A CN 200910079865A CN 101833648 A CN101833648 A CN 101833648A
Authority
CN
China
Prior art keywords
character
text
text image
block
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910079865A
Other languages
English (en)
Other versions
CN101833648B (zh
Inventor
万鑫
刘正珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Rongguan Technology Development Co ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN2009100798650A priority Critical patent/CN101833648B/zh
Publication of CN101833648A publication Critical patent/CN101833648A/zh
Application granted granted Critical
Publication of CN101833648B publication Critical patent/CN101833648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明文本图像的校正方法,属于光学字符识别领域,包括以下步骤:定位文本图像中的字符区域并提取疑似字符;对疑似字符进行识别,若识别可信度大于单个字符可信度参考值,则字符有效方向为正向,否则将疑似字符分别逆时针旋转来判断有效方向;提取具有有效方向的字符至有效字符集,直到某方向识别可信度累加值高于既定的识别可信度,则提取对应的文本方向;校正图像的方向,进行文本图像的识别并输出。本方法有效滤除了不可靠的字符的影响,避免文字区域中的不可靠的区域对文字方向判断的影响。对于复杂文本图像、含有噪声的文本图像、质量较差的文本图像具有较好的自适应,能较快、正确的判断出文本图像方向,进而有效地进行文本图像的识别。

Description

文本图像的校正方法
技术领域
本发明属于光学字符识别(OCR)领域,涉及一种文本图像的校正方法。
背景技术
当待识别的文档通过图像录入装置(如扫描仪、照相机等)转换成文本图像时,其文字方向不一定是正向的,可能旋转了90°、180°、270°。若是直接将非正向的文本图像送入识别引擎进行识别,无法得到正确的识别结果。
为保证文本图像中的信息能够正确被识别、并保存成电子文档,目前通常采取两种方案。
方案一:手工校正图像方向。该方法耗时耗力,尤其对大量图像进行操作时,效率及其低下。
方案二:利用指定区域内的识别信息,对文本图像方向进行校正。
方案二实现了文本图像识别的自动化,大大提高了效率。
申请号为98105597.4的专利提出了一种文本图像方向判断校正的方法,该方法检测文本图像内部一个字符区域的预定部分,并识别该区域,最后根据该区域中的字符平均识别可信度,判断文本图像方向。该方法对于包含纯文字的文本图像具有良好效果。但是,由于没有对待识别区域内的字符进行有效性的筛选,若是选取的区域中包含本身包含非文字区域(例如:图标、噪声等)或是识别可靠度低的区域(例如:成像质量差的字符),则可能造成该区域平均识别可靠性低于参考值。此时可能对四个方向均进行识别,大大增加了判断时间和系统资源。此外,区域中包含的字符数过少,判断准确度比较低,而区域中包含的字符数过多,速度会比较慢。
因此,需要提供一种对图像适应性更强的方法,不受区域选择限制及区域中的不良因素的干扰,有效判断各类复杂的文本图像。
发明内容
本发明目的在于提供一种文本图像的校正方法,适用于各类复杂的文本图像。在定位文本图像中的字符区域后,根据若干字符方向性判断文本的方向,在此基础上校正图像的方向,进行文本图像的识别。本方法不受区域选择限制及区域中的不良因素的干扰,有效判断各类复杂的文本图像。
文本图像的校正方法,该方法包括以下步骤:
步骤1:定位文本图像中的字符区域;
步骤2:对字符区域中的字符块进行基于结构特征的分类,并从中提取疑似字符;
步骤3:用字符识别引擎对提取的疑似字符进行识别;若得到的识别可信度大于单个字符可信度参考值,则字符有效方向为正向,转到步骤4;否则将疑似字符分别逆时针旋转90°、180°、270°进行识别,若各方向的识别可信度仅有一个大于单个字符可信度参考值,则对应的方向为该字符的有效方向,转到步骤4;否则转到步骤2;
步骤4:逐个提取具有有效方向的字符至有效字符集,计算其中各字符的四个方向上的识别可信度累加值,直到某方向识别可信度累加值高于既定的识别可信度;将该累加值对应的方向作为文本方向;
步骤5:根据文本方向判断结果,校正图像的方向,进行文本图像的识别并输出。
所述步骤2中,对字符块进行基于结构特征的分类包括:选取字符块结构特征;计算字符块结构特征值;根据字符块结构特征值提取疑似字符。
所述步骤2中,疑似字符为与待识别语言的字符结构特征相似的字符块。
所述步骤2中字符块结构特征包括:字符的宽度、高度、宽高比、上下穿刺特征、笔画特征、连通域特征。提取疑似字符块采用的字符结构特征包括:宽度W、高度H、宽高比W/H。若字符块相应结构特征同时满足0.5≤W/H≤2、W≥HL/4和H≥HL/4,就认为该字符为疑似字符,否则,为无效块。其中,若文本行为水平方向,则HL为字符所在的文本行的行高;若文本行为竖直方向,则HL为字符所在的文本行的行宽。
所述步骤3中,若正向识别得到的识别可信度大于单个字符可信度参考值,不再对该字符进行其他方向上的识别,直接确定字符有效方向为正向,将该字符加入有效字符集中,转到步骤4;若已知输入文本图像多数为其他方向,也可以优先识别该方向。
所述步骤4中,有效字符集为存储字符的内存空间,用来存储具有有效方向的字符。
所述步骤4中,既定的识别可信度为一可信度的设定值,用来与各方向的识别可信度累加值进行比较。
本发明文本图像的校正方法,与现有技术相比,其优点在于:
1.通过有效字符集的提取与该集合中四个方向的识别可信度的累加,判断文本方向,有效滤除了不可靠的字符的影响,避免文字区域中的不可靠的区域对文字方向判断的影响。
2.本发明通过有限个字符进行文本图像的校正,对于复杂文本图像、含有噪声的文本图像、质量较差的文本图像,本方法都具有较好的自适应,能较快、正确的判断出文本图像方向,进而有效地进行文本图像的识别。
附图说明
图1为本发明文本图像的校正方法的方法流程图;
图2为本发明文本图像的校正方法的实施过程示意图,其中:
图2(a)是拍摄得到的一个二值文本图像;
图2(b)是文本图像字符区域标记图;
图2(c)是字符有效方向判断图示例说明;
图2(d)是文本方向的判断图示说明图;
图2(e)是采用本方法校正得到的正向图像后与相应的文本识别结果的比对图。
具体实施方式
本发明在于提供一种适用于各类包含文字内容的自动文本图像方向判断方法,为文本图像识别全自动化提供保障。
以下结合附图并以文字方向为90°的中文拍摄文本二值图像为例,对本发明的文本图像方向判断方法进行详细说明。如图1所示,同时参考图2,本发明的文本图像方向判断方法的一个具体实施例,包括以下步骤:
步骤一:图像中的字符区域定位。输入识别系统的文本图像,经过文本结构分析后,得到文本区域中的字符块区域。本实施例中,对文本结构分析定位字符块区域步骤包括:文本行切分,得到若干行单行文本;行内字符块切分,得到若干单个字符块。字符区域的定位结果见图2(b)所示,方框为字符块边界。
在本实施例中,为避免左右分离结果的字符被切分,还可以对字符块进一步进行合并处理:根据文本区域统计的字符宽高信息,对一些距离比较近的字符块进行合并,完成字符区域定位。
文本行切分:文本行方向判断,通过水平方向投影和竖直方向投影直方图的效果,判断文本行的方向,在正确的方向进行投影,得到的直方图上存在明显的落差较大波峰和波谷。在本实施例中,文本行被判定为竖直方向,因此利用竖直方向投影直方图切分文本行:逐列计算图像中的每一像素列中前景像素的个数,得到图像竖直投影直方图;选取合适的阈值,在竖直投影直方图上确定文本行的边界,在本实施例中选取0为文本行切分阈值:若第i列投影值为0,第i+1列投影值>0,则第i+1列作为一行的起始边界;若第i列投影值为0,第i-1列投影值>0,则第i-1列作为一行的结束边界。当然,在其他实施例中也可采取其他数值为行切分阈值对文本进行切分。若文本方向为水平,则利用水平方向投影图切分文本行,方法与竖直方向投影直方图切分文本行方法类似。
行内字符块切分:在本实施例中,对于竖直文本行利用水平方向投影直方图切分字符块:逐列计算单个竖直文本行图像中的每一像素行中前景像素的个数,得到水平投影直方图;选取合适的阈值,在水平投影直方图上确定字符块区域的上下边界,在本实施例中选取0为切分阈值:若第i行投影值为0,第i+1行投影值>0,则第i+1行作为字符块的上边界;若第i行投影值为0,第i-1行投影值>0,则第i-1行作为字符块的下边界;当然,在其他实施例中也可采取其他数值为字符块切分阈值。当字符上下边界确定后,字符左右边界为该上下区域内左右第一个像素投影值非0的列。若文本方向为水平,则利用文本行的竖直方向投影直方图切分字符块,方法与水平方向投影直方图切分字符块方法类似。
本实施例中,字符块区域的定位采用的是至上而下的方法。在其他实施例中,可以采用之下而上的方法,例如,通过连通域合并得到字符的区域位置信息。
步骤二:在文本区域中提取疑似字符块。该步骤主要目的在于,部分剔除图标、噪声、不完整的字符等影响。按照某种顺序,提取文本区域中的一个字符块,并进行疑似字符块判断。若该字符块为疑似字符,进入步骤三处理,否则继续提取字符块进行判断。
疑似字符是指,与待识别语言的字符结构特征相似的字符块。字符块的结构特征有很多,例如字符的宽度、高度、宽高比、上下穿刺特征、笔画特征、连通域特征等。合适的特征有助于排除不属于该语言的字符块。本实施例中,提取疑似字符块采用的字符结构特征包括:宽度W、高度H、宽高比W/H。若字符块相应结构特征同时满足0.5≤W/H≤2、W≥HL/4和H≥HL/4,就认为该字符为疑似字符,否则,为无效块,为没有判定为疑似字符块的字符块。其中,若文本行为水平方向,则HL为字符所在的文本行的行高;若文本行为竖直方向,则HL为字符所在的文本行的行宽。
所述无效块,可能是非字符块(噪声、图像)、字符的一部分、小点符号、宽高过小的字符。
字符结构特征分类的参考值的选取是经过统计和实验得到的。本实施例中,识别中文文本,大部分中文字符的相应的结构特征满足如下的统计特征:宽高比一般在W/H0.5~2之间。条件W≥HL/4和H≥HL/4目的是滤除小符号(如’.’)和宽高过小的字符(如汉字‘一’、数字‘1’等),该类字符若不滤除,即使进行识别,其识别可信度在若干方向均比较高,是没有判断意义的。如图2(b)所示,其中的字符块1、字符块2和字符块3在同一竖向文本行中,文本行的行宽HL=30(Pixel),HL/4=7.5(Pixel)。对字符块1、字符块2和字符块3进行疑似字符的判断,相应的计算得到的结构特征值与疑似字符判断结果见表1。其中,字符块1和字符块3分别不满足字符宽高比和字符大小的条件,判定为无效块;字符块2为疑似字符。
表1疑似字符判断示例
Figure B2009100798650D0000051
本实施例中,按照版面位置顺序,采用至上而下、从左到右的顺序,提取字符块。在其他实施例中,可以按照字符的结构特征如宽高比、笔画特征等对行内字符进行排序(使得无效块顺序靠后),按照结构特征值的排序结果进行字符块提取。
此外,在本实施例中,笔画特征等信息也可以作为判断标准,进行疑似字符的提取。
步骤三:对步骤二得到的疑似字符,通过识别的方式进行有效方向的判断。若该字符块为有效字符,进入步骤四处理,否则转入步骤二,继续提取疑似字符块。
有效字符是指,可以判断出字符有效方向的字符。
判断字符的有效方向时,由于字符识别核心对于非正确方向输入的字符无法正确识别,非正确方向输入的字符输出的识别结果的识别可信度远低于以正确方向上的识别结果。因此,每个字符块在四个方向上分别进行识别比较,可以判断字符的有效性和字符的有效方向。
本实施例中,对步骤二得到的疑似字符进行字符的有效方向的判断:对疑似字符的区域图像进行四个方向上的识别,即原始方向、逆时针旋转90°、180°、270°方向,得到相应的四个识别可信度T0、T1、T2和T3。其中,T0是字符在12点钟方向上的识别可信度,T1是字符在3点钟方向上的识别可信度,T2是字符在6点钟方向上的识别可信度,T3是字符在9点钟方向上的识别可信度。若其中仅有一个值Ti(i=0,...,3)大于单个字符的可信度参考值T,则可确定该字符为有效字符,其有效方向为Ti对应的方向。否则,为无效字符,为不具有有效方向的字符。图2(c)为字符有效方向判断的示意图。在本实施例中,采用汉王科技股份有限公司的中文OCR识别引擎(HW_CNOCR 1.0.0.1)进行字符的识别。该识别引擎对字符进行识别后,返回字符的识别可信度的值为0或1,其中0表示识别结果不可信,1表示识别结果可信。单个字符可信度参考值T为0.5。图中,左边的字符采用本实施例的识别方式,得到四个方向上的识别可信度T0、T1、T2和T3,分别为0、0、0、1。右图中,经过比较,只有T0值大于为0.5的单个字符可信度参考值T,故T0>T,该字符为有效字符,有效方向为正方向。
所述无效字符,可能是非字符块(噪声、图像)、字符的一部分、或是质量较差的字符。滤除掉无效字符后,可以提高文本方向判断的准确性,排除干扰。如图2(b)所示,其中,字符块0的图像成像质量较差,在四方向上的字符识别可信度均低于参考值,是无效字符。
在本实施例中,为了提高速度,也可以首先识别正向图像,若正向识别得到的可信度T0大于单个字符可信度参考值T,不再对该字符进行其他方向上的识别,直接确定字符有效方向为正向。该处理流程是基于输入文本图像大多数为正立的。若已知输入文本图像大多数为其他方向,也可以优先识别该方向。在图2(c)的字符有效方向判断的示意图中,右边字符采用该处理方式,由于正向识别可信度T0>T,因此不进行其他三个方向识别;这样该方向就可以确定为字符的有效方向,进入步骤四处理。但若正向识别可信度T0≤T,处理方式同本实施例,进行四个方向的识别,进一步判断字符的有效方向。
步骤四:文本方向判断。将步骤二、步骤三得到的有效字符逐个加入到有效字符集中,有效字符集为存储字符的内存空间,用来存储具有有效方向的字符。本实施例中为一循环队列,用来统计有效字符集的在各方向上的特征值Ei(i=0,...,3);若某一方向特征值Ei高于特征参考值E,则结束字符方向性判断,得到四个方向上的特征值,即识别可信度累加值,将识别可信度累加值高于既定的识别可信度的对应的方向作为文本方向,然后转到步骤五;否则,转入步骤二,提取下一个疑似字符,直至某一方向的特征值Ei高于特征参考值E。
本实施例中,采用相应方向上的有效字符的识别可信度累加值作为特征值:在0°方向,识别可信度累加值E0为有效方向为0°的字符在0°方向识别的可信度之和;同理可得,其他方向上的识别可信度累加值的结果。
既定的识别可信度为一可信度的设定值,用来与各方向的识别可信度累加值进行比较;各方向的识别可信度仅有一个大于单个字符可信度参考值,则对应的方向为该字符的有效方向。
若四个方向上的特征值均未达到既定的识别可信度E,则说明提取出的有效字符还不够,需要进一步提取有效字符,扩大有效字符集的范围,则转到步骤二,进行疑似字符的判别;直到某一方向的识别可信度累加值高于既定的识别可信度E,即可结束字符方向性判断,转到步骤五。
本实施例中,采用汉王科技股份有限公司的中文OCR识别引擎(HW_CNOCR1.0.0.1)进行字符的识别。四个文本方向上,既定的识别可信度E为10。文本图像的方向判断示意如图2(d)所示,按照图示的过程,进行文本方向判断的过程中,跳过无效块和无效字符,仅对于有效字符,分别统计有效字符四个方向上的识别可信度的值。其中,无效块是不满足疑似字符的字符块(形如如图2(d)中字符块1);而无效字符是没有有效方向的疑似字符(形如如图2(d)中字符块0)。
图中识别出的各文字中,沿正方向逆时针旋转90°的方向,即9点钟的方向的识别可信度T3为1均大于其他方向的识别可信度0,也大于单个字符可信度参考值0.5。所以,当这些文字的9点钟方向识别可信度累加值E3大于既定的识别可信度E时,可得到9点钟方向,即沿正方向逆时针旋转90°的方向为文本方向其值为90°。
步骤五:根据步骤四判断得到的文本方向,校正图像,即对图像进行旋转。本实施例中,得到的文字方向为90°,因此将图像顺时针旋转90°后,将文本区域送入识别引擎进行识别并输出。本实施例中,校正后的文本图像与相应的文本识别结果见图2(e)。
本发明的方法,可用于对扫描、拍摄图像的处理。该方法同样适用于其他语言的文本图像如:日韩文、英文、西欧语言等。其中的相应的字符特征、可信度参考值等可以根据具体的语言、识别引擎进行调整。
本发明中采用的优选实施例,只是对本发明思想的一种具体实施方式的描述。其具体应用形式的多样的,本领域技术人员将能够设计很多替代实施例而不脱离附后的权利要求书的范围。

Claims (7)

1.一种文本图像的校正方法,其特征在于,包括以下步骤:
步骤一:定位文本图像中的字符区域;
步骤二:对字符区域中的字符块进行基于结构特征的分类,并从中提取疑似字符;
步骤三:用字符识别引擎对提取的疑似字符进行识别;若得到的识别可信度大于单个字符可信度参考值,则字符有效方向为正向,转到步骤四;否则将疑似字符分别逆时针旋转90°、180°、270°进行识别,若各方向的识别可信度仅有一个大于单个字符可信度参考值,则对应的方向为该字符的有效方向,转到步骤四;否则转到步骤二;
步骤四:逐个提取具有有效方向的字符至有效字符集,计算其中各字符的四个方向上的识别可信度累加值,直到某方向识别可信度累加值高于既定的识别可信度;将该累加值对应的方向作为文本方向;
步骤五:根据文本方向判断结果,校正图像的方向,进行文本图像的识别并输出。
2.根据权利要求1所述一种文本图像的校正方法,其特征在于:所述步骤二中,对字符块进行基于结构特征的分类包括:选取字符块结构特征;计算字符块结构特征值;根据字符块结构特征值提取疑似字符。
3.根据权利要求1所述一种文本图像的校正方法,其特征在于:所述步骤二中,疑似字符为与待识别语言的字符结构特征相似的字符块。
4.根据权利要求2所述一种文本图像的校正方法,其特征在于:所述步骤二中字符块结构特征包括:字符的宽度、高度、宽高比、上下穿刺特征、笔画特征、连通域特征;提取疑似字符块采用的字符结构特征包括:宽度W、高度H、宽高比W/H;若字符块相应结构特征同时满足0.5≤W/H≤2、W≥HL/4和H≥HL/4,就认为该字符为疑似字符,否则,为无效块;其中,若文本行为水平方向,则HL为字符所在的文本行的行高;若文本行为竖直方向,则HL为字符所在的文本行的行宽。
5.根据权利要求1所述一种文本图像的校正方法,其特征在于:所述步骤三中,若正向识别得到的识别可信度大于单个字符可信度参考值,不再对该字符进行其他方向上的识别,直接确定字符有效方向为正向,将该字符加入有效字符集中,转到步骤四;若已知输入文本图像多数为其他方向,也可以优先识别该方向。
6.根据权利要求1所述一种文本图像的校正方法,其特征在于:所述步骤四中,有效字符集为存储字符的内存空间,用来存储具有有效方向的字符。
7.根据权利要求1所述一种文本图像的校正方法,其特征在于:所述步骤四中,既定的识别可信度为一可信度的设定值,用来与各方向的识别可信度累加值进行比较。
CN2009100798650A 2009-03-13 2009-03-13 文本图像的校正方法 Active CN101833648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100798650A CN101833648B (zh) 2009-03-13 2009-03-13 文本图像的校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100798650A CN101833648B (zh) 2009-03-13 2009-03-13 文本图像的校正方法

Publications (2)

Publication Number Publication Date
CN101833648A true CN101833648A (zh) 2010-09-15
CN101833648B CN101833648B (zh) 2012-05-02

Family

ID=42717713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100798650A Active CN101833648B (zh) 2009-03-13 2009-03-13 文本图像的校正方法

Country Status (1)

Country Link
CN (1) CN101833648B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567732A (zh) * 2011-12-28 2012-07-11 方正国际软件有限公司 一种文档排版类型的检测方法及系统
CN102779276A (zh) * 2011-05-09 2012-11-14 汉王科技股份有限公司 文本图像识别方法和装置
CN102890784A (zh) * 2011-07-20 2013-01-23 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102902947A (zh) * 2011-07-27 2013-01-30 阿里巴巴集团控股有限公司 一种图像识别显示方法、装置及用户设备
CN102915431A (zh) * 2012-09-12 2013-02-06 广东欧珀移动通信有限公司 一种根据终端设备照片内容自动摆正照片的方法
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
EP2660753A2 (en) 2012-05-04 2013-11-06 Fujitsu Limited Image processing method and apparatus
CN103455814A (zh) * 2012-05-31 2013-12-18 佳能株式会社 用于文档图像的文本行分割方法和系统
CN103455806A (zh) * 2012-05-31 2013-12-18 富士通株式会社 文档处理装置、文档处理方法以及扫描仪
CN103502962A (zh) * 2011-04-28 2014-01-08 乐天株式会社 服务器装置、服务器装置的控制方法、程序以及记录介质
US8737743B2 (en) 2011-07-20 2014-05-27 Fujitsu Limited Method of and device for identifying direction of characters in image block
US8805080B2 (en) 2011-06-29 2014-08-12 Fujitsu Limited Method of and device for identifying direction of characters in image block
CN104346610A (zh) * 2013-08-09 2015-02-11 富士施乐株式会社 图像读取装置和方法
CN105989341A (zh) * 2015-02-17 2016-10-05 富士通株式会社 文字识别方法和装置
CN108509960A (zh) * 2018-04-20 2018-09-07 科大讯飞股份有限公司 一种文本朝向检测方法及装置
CN108921155A (zh) * 2018-04-23 2018-11-30 新疆大学 一种联机手写维吾尔文单词倾斜矫正方法
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
CN111353494A (zh) * 2020-04-09 2020-06-30 成都睿琪科技有限责任公司 钢材编码识别系统及方法
CN112818983A (zh) * 2021-01-22 2021-05-18 常州友志自动化科技有限公司 一种利用图片相识度判断字符倒置的方法
CN113852730A (zh) * 2021-09-28 2021-12-28 科大讯飞股份有限公司 一种倾斜角确定方法及其相关设备
CN114118075A (zh) * 2022-01-28 2022-03-01 北京易真学思教育科技有限公司 文本识别方法、装置、电子设备和存储介质
WO2023005813A1 (zh) * 2021-07-30 2023-02-02 广州视源电子科技股份有限公司 图像方向调整方法、装置、存储介质及电子设备
CN115984859A (zh) * 2022-12-14 2023-04-18 广州市保伦电子有限公司 一种图像文字识别的方法、装置及存储介质

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103502962B (zh) * 2011-04-28 2016-06-22 乐天株式会社 服务器装置和服务器装置的控制方法
CN103502962A (zh) * 2011-04-28 2014-01-08 乐天株式会社 服务器装置、服务器装置的控制方法、程序以及记录介质
CN102779276A (zh) * 2011-05-09 2012-11-14 汉王科技股份有限公司 文本图像识别方法和装置
CN102779276B (zh) * 2011-05-09 2015-05-20 汉王科技股份有限公司 文本图像识别方法和装置
US8805080B2 (en) 2011-06-29 2014-08-12 Fujitsu Limited Method of and device for identifying direction of characters in image block
US8737743B2 (en) 2011-07-20 2014-05-27 Fujitsu Limited Method of and device for identifying direction of characters in image block
CN102890784A (zh) * 2011-07-20 2013-01-23 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102890784B (zh) * 2011-07-20 2016-03-30 富士通株式会社 识别图像块中文字的方向的方法和装置
US8787674B2 (en) 2011-07-20 2014-07-22 Fujitsu Limited Method of and device for identifying direction of characters in image block
CN102902947A (zh) * 2011-07-27 2013-01-30 阿里巴巴集团控股有限公司 一种图像识别显示方法、装置及用户设备
CN102902947B (zh) * 2011-07-27 2015-05-27 阿里巴巴集团控股有限公司 一种图像识别显示方法、装置及用户设备
CN102567732B (zh) * 2011-12-28 2013-11-06 方正国际软件有限公司 一种文档排版类型的检测方法及系统
CN102567732A (zh) * 2011-12-28 2012-07-11 方正国际软件有限公司 一种文档排版类型的检测方法及系统
US9082181B2 (en) 2012-05-04 2015-07-14 Fujitsu Limited Image processing method and apparatus
EP2660753A2 (en) 2012-05-04 2013-11-06 Fujitsu Limited Image processing method and apparatus
CN103455806A (zh) * 2012-05-31 2013-12-18 富士通株式会社 文档处理装置、文档处理方法以及扫描仪
CN103455814A (zh) * 2012-05-31 2013-12-18 佳能株式会社 用于文档图像的文本行分割方法和系统
CN103455814B (zh) * 2012-05-31 2017-04-12 佳能株式会社 用于文档图像的文本行分割方法和系统
CN103455806B (zh) * 2012-05-31 2017-06-13 富士通株式会社 文档处理装置、文档处理方法以及扫描仪
CN102915431A (zh) * 2012-09-12 2013-02-06 广东欧珀移动通信有限公司 一种根据终端设备照片内容自动摆正照片的方法
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
CN103077389B (zh) * 2013-01-07 2016-08-03 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
CN104346610A (zh) * 2013-08-09 2015-02-11 富士施乐株式会社 图像读取装置和方法
CN105989341A (zh) * 2015-02-17 2016-10-05 富士通株式会社 文字识别方法和装置
CN108509960B (zh) * 2018-04-20 2022-04-22 科大讯飞股份有限公司 一种文本朝向检测方法及装置
CN108509960A (zh) * 2018-04-20 2018-09-07 科大讯飞股份有限公司 一种文本朝向检测方法及装置
CN108921155A (zh) * 2018-04-23 2018-11-30 新疆大学 一种联机手写维吾尔文单词倾斜矫正方法
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
CN111353494A (zh) * 2020-04-09 2020-06-30 成都睿琪科技有限责任公司 钢材编码识别系统及方法
CN111353494B (zh) * 2020-04-09 2023-06-23 成都睿琪科技有限责任公司 钢材编码识别系统及方法
CN112818983A (zh) * 2021-01-22 2021-05-18 常州友志自动化科技有限公司 一种利用图片相识度判断字符倒置的方法
WO2023005813A1 (zh) * 2021-07-30 2023-02-02 广州视源电子科技股份有限公司 图像方向调整方法、装置、存储介质及电子设备
CN113852730A (zh) * 2021-09-28 2021-12-28 科大讯飞股份有限公司 一种倾斜角确定方法及其相关设备
CN113852730B (zh) * 2021-09-28 2023-12-01 科大讯飞股份有限公司 一种倾斜角确定方法及其相关设备
CN114118075A (zh) * 2022-01-28 2022-03-01 北京易真学思教育科技有限公司 文本识别方法、装置、电子设备和存储介质
CN115984859A (zh) * 2022-12-14 2023-04-18 广州市保伦电子有限公司 一种图像文字识别的方法、装置及存储介质

Also Published As

Publication number Publication date
CN101833648B (zh) 2012-05-02

Similar Documents

Publication Publication Date Title
CN101833648B (zh) 文本图像的校正方法
CN109241894B (zh) 一种基于表格定位和深度学习的票据内容识别系统和方法
CN101122953B (zh) 一种图片文字分割的方法
TWI536277B (zh) Form identification method and device
CN104298982B (zh) 一种文字识别方法及装置
CN105760901B (zh) 一种多语种倾斜文档图像的自动语言判别方法
Shivakumara et al. An efficient edge based technique for text detection in video frames
Arai et al. Method for automatic e-comic scene frame extraction for reading comic on mobile devices
Kumar et al. Segmentation of printed text in devanagari script and gurmukhi script
US20070154112A1 (en) Image processing apparatus, image processing method, and computer program
CN113537227B (zh) 一种结构化文本识别方法及系统
US20150371100A1 (en) Character recognition method and system using digit segmentation and recombination
CN106778736B (zh) 一种鲁棒的车牌识别方法及其系统
CN107766854A (zh) 一种基于模板匹配实现快速页码识别的方法
CN102194117A (zh) 文稿页面方向检测方法和装置
JP2014130415A (ja) 文字認識装置、文字認識方法、及び文字認識プログラム
CN113139535A (zh) 一种ocr文档识别方法
CN112464940A (zh) 一种基于深度学习的车辆前挡风玻璃vin码识别方法及系统
CN111104826B (zh) 一种车牌字符识别方法、装置及电子设备
CN114565927A (zh) 表格识别方法、装置、电子设备及存储介质
CN106033534A (zh) 基于直线检测的电子阅卷方法
CN112329641B (zh) 一种表格识别方法、装置、设备及可读存储介质
JP2004280334A (ja) 画像読み取り装置
CN113743318A (zh) 基于行列分割的表格结构识别方法、存储介质和电子装置
JP5271956B2 (ja) 原稿方向の検出方法及び装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220512

Address after: 430014 No. 28, Jiangda Road, Jiang'an District, Wuhan City, Hubei Province

Patentee after: Wuhan Rongguan Technology Development Co.,Ltd.

Address before: 100193, No. 5, building 8, No. three northeast Wang Xi Road, Beijing, Haidian District

Patentee before: HANWANG TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right