CN113392772B - 一种面向文字识别的文字图像收缩变形增强方法 - Google Patents

一种面向文字识别的文字图像收缩变形增强方法 Download PDF

Info

Publication number
CN113392772B
CN113392772B CN202110669815.9A CN202110669815A CN113392772B CN 113392772 B CN113392772 B CN 113392772B CN 202110669815 A CN202110669815 A CN 202110669815A CN 113392772 B CN113392772 B CN 113392772B
Authority
CN
China
Prior art keywords
character image
image
text
pixel point
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110669815.9A
Other languages
English (en)
Other versions
CN113392772A (zh
Inventor
李旭东
黄辉辉
王静一
黄永科
张海洋
张玉志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN202110669815.9A priority Critical patent/CN113392772B/zh
Publication of CN113392772A publication Critical patent/CN113392772A/zh
Application granted granted Critical
Publication of CN113392772B publication Critical patent/CN113392772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种面向文字识别的文字图像收缩变形增强方法,属于计算机领域。一种面向文字识别的文字图像收缩变形增强方法包括:获取“原文字图像”尺寸及颜色信息;创建一个与“原文字图像”尺寸相同的空白“新文字图像”;设置“原文字图像”和“新文字图像”具有相同的基准点;设置收缩变形系数k;遍历“新文字图像”上的每一个像素点R,根据收缩变形函数f(d)计算出在“原文字图像”上对应的像素点P,并将“新文字图像”上的像素点R的颜色值设置为“原文字图像”中像素点P的颜色值;完成“新文字图像”的生成。本发明将给定的文字图像进行收缩变形来建立新风格的文字图像,从而丰富机器学习的训练数据集,并提高文字识别的准确率。

Description

一种面向文字识别的文字图像收缩变形增强方法
技术领域
本发明属于计算机领域,主要关注如何提高基于机器学习算法文字识别的准确率,特别是汉字识别的准确率。
背景技术
近些年采用机器学习、AI深度学习等算法进行文字识别已经成为重要的途径。这类算法需要让计算机从人类社会活动的经验即数据中来获取知识、构建复杂多层次的概念模型。印刷体文字的识别已经达到非常好的效果,但是对于手写体文字的识别还需要做大量的工作。
对于手写体文字,每个人的书写风格不同,甚至每个人的不同成长时期的书写风格也不尽相同。在采用机器学习算法时,搜集大量不同人的所书写的文字是比较困难的,另外训练集的文字与测试集的文字也可能是不同人所书写的,因此要实现一种通用的、光谱的基于机器学习的文字识别就更加困难。
发明内容
本发明目的是为了提高基于机器学习算法汉字识别的准确率,提供一种面向文字识别的文字图像收缩变形增强方法。
本发明通过对已有训练集中不同人所书写的文字图像进行收缩变形处理从而生成更多风格的文字图像案例,这些新风格的文字图像可能包含了更多人的书写风格,从而扩大了文字训练集,从而有助于提高基于机器学习的文字识别准确率。
本发明可对包括汉字在内的各种文字字体进行训练集扩充。
面向文字识别的文字图像收缩变形增强方法包括:获取“原文字图像”尺寸及颜色信息;创建一个与“原文字图像”尺寸相同的空白“新文字图像”;设置“原文字图像”和“新文字图像”具有相同的基准点;设置收缩变形系数;遍历“新文字图像”上的每一个像素点R,根据收缩变形函数f(d)计算出在“原文字图像”上对应的像素点P,并将“新文字图像”上的像素点R的颜色值设置为“原文字图像”中像素点P的颜色值;完成“新文字图像”的生成。
本发明的技术方案
一种面向文字识别的文字图像收缩变形增强方法,包括具体步骤如下:
第1、输入待收缩变形的文字图像,该文字图像简称为“原文字图像”;
第2、获取第1步中的“原文字图像”的背景颜色值C、以及尺寸大小即宽W和高H;
第3、建一个新的空白文字图像简称“新文字图像”,该“新文字图像”的尺寸与原文字图像的尺寸相同,该“新文字图像”上每个点的像素值均设置为“原文字图像”的背景颜色值C;
第4、选取“原文字图像”的中心点作为基准点O,其坐标为(ox,oy);
所述的“基准点”也可以选取文字图像上的任意一个点作为“基准点”替换中心点;
第5、设置“新文字图像”的基准点O与“原文字图像”的基准点坐标相同;
第6、设置收缩变形系数k的值,k值的取值范围为大于等于1的正整数;
第7、遍历“新文字图像”上的每一个像素点R,其坐标为(rx,ry),执行如下子步骤:
第7.1、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O形成的OR线段与X轴的夹角α的值,公式为
Figure BDA0003118279520000021
第7.2、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O的距离|OR|,公式为
Figure BDA0003118279520000022
第7.3、根据收缩变形函数f(d)来计算“新文字图像”上的像素点R所对应的被收缩的原始距离|OP|,f(d)的公式为
Figure BDA0003118279520000023
因此根据第7.2步中的|OR|来计算出
Figure BDA0003118279520000024
所述的“收缩变形函数f(d)”的公式,也可以采用
Figure BDA0003118279520000025
替换;
第7.4、根据第7.3步中被收缩的原始距离|OP|,进一步计算出“新文字图像”上的像素点R所对应的被收缩的“原文字图像”中的像素点P,像素点P的坐标为(px,py),即
Figure BDA0003118279520000026
第7.5、若第7.4步中计算出的“原文字图像”上的像素点P的坐标(px,py)不在“原文字图像”的尺寸大小范围内,则执行第7.7步,否则执行第7.6步;
第7.6、将“原文字图像”中的像素点P的颜色值G(px,py)作为“新文字图像”中像素点R的颜色值G′(rx,ry),即G′(rx,ry)=G(px,py);进一步执行第7.8步;
第7.7、将“新文字图像”中像素点R的颜色值G′(rx,ry)设置为“原文字图像”的背景颜色值C;
第7.8、“新文字图像”上的当前像素点R的颜色值G′(rx,ry)设置完毕;
第8、完成“新文字图像”的生成,“新文字图像”就是“原文字图像”的收缩变形后的文字图像,程序执行结束。
其中,第6步所述的“收缩变形系数k”的设置方法是,通过采用一个给定文字的手写体“文字图像”与该给定文字的标准印刷体“文字图像”在相同“文字图像”尺寸下计算得到k,
Figure BDA0003118279520000031
其中O为“基准点”、Plt为该给定文字的标准印刷体“文字图像”的左上角像素点、Rlt为该给定文字的手写体“文字图像”的左上角像素点、Prt为该给定文字的标准印刷体“文字图像”的右上角像素点、Rrt为该给定文字的手写体“文字图像”的右上角像素点、Plb为该给定文字的标准印刷体“文字图像”的左下角像素点、Rlb为该给定文字的手写体“文字图像”的左下角像素点、Prb为该给定文字的标准印刷体“文字图像”的右下角像素点、Rrb为该给定文字的手写体“文字图像”的右下角像素点,max{}函数为取{}中所有数的最大值。
进一步地,所述的“收缩变形系数k”的设置方法,通过对一组给定文字的手写体“文字图像”来与各自对应的标准印刷体“文字图像”进行比对来计算出一组ki,其中i的值从1到给定文字总数M,然后计算得到
Figure BDA0003118279520000032
本发明的优点和积极效果:
本发明能够在有限的文字训练集基础上通过对已有文字图像进行收缩变形处理来生成更多不同风格的文字图像,从而大大扩充了文字训练集,并因此可提高基于机器学习、AI深度学习类算法进行文字识别的准确率。
附图说明
图1是本发明中算法程序运行流程图。
图2是“原文字图像”实例-“麦”字。
图3是“麦”字“原文字图像”上的基准点O和某一像素点P。
图4是“麦”字“新文字图像”上的基准点O和某一像素点R。
图5是“麦”字的多个“新文字图像”实例,其中,(a)收缩变形系数k取7,(b)收缩变形系数k取9。
具体实施方式
本发明提供了一种面向文字识别的文字图像收缩变形增强方法。
本发明所提供的一种面向文字识别的文字图像收缩变形增强方法,参见图1,具体步骤如下:
第1、输入待收缩变形的文字图像,该文字图像简称为“原文字图像”;
第2、获取第1步中的“原文字图像”的背景颜色值C、以及尺寸大小即宽W和高H;
第3、建一个新的空白文字图像简称“新文字图像”,该“新文字图像”的尺寸与原文字图像的尺寸相同,该“新文字图像”上每个点的像素值均设置为“原文字图像”的背景颜色值C;
第4、选取“原文字图像”的中心点作为基准点O,其坐标为(ox,oy);
第5、设置“新文字图像”的基准点O与“原文字图像”的基准点坐标相同;
第6、设置收缩变形系数k的值,k值的取值范围为大于等于1的正整数;
第7、遍历“新文字图像”上的每一个像素点R,其坐标为(rx,ry),执行如下子步骤:
第7.1、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O形成的OR线段与X轴的夹角α的值,公式为
Figure BDA0003118279520000041
第7.2、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O的距离|OR|,公式为
Figure BDA0003118279520000042
第7.3、根据收缩变形函数f(d)来计算“新文字图像”上的像素点R所对应的被收缩的原始距离|OP|,f(d)的公式为
Figure BDA0003118279520000043
因此根据第7.2步中的|OR|来计算出
Figure BDA0003118279520000044
第7.4、根据第7.3步中被收缩的原始距离|OP|,进一步计算出“新文字图像”上的像素点R所对应的被收缩的“原文字图像”中的像素点P,像素点P的坐标为(px,py),即
Figure BDA0003118279520000045
第7.5、若第7.4步中计算出的“原文字图像”上的像素点P的坐标(px,py)不在“原文字图像”的尺寸大小范围内,则执行第7.7步,否则执行第7.6步;
第7.6、将“原文字图像”中的像素点P的颜色值G(px,py)作为“新文字图像”中像素点R的颜色值G′(rx,ry),即G′(rx,ry)=G(px,py);进一步执行第7.8步;
第7.7、将“新文字图像”中像素点R的颜色值G′(rx,ry)设置为“原文字图像”的背景颜色值C;
第7.8、“新文字图像”上的当前像素点R的颜色值G′(rx,ry)设置完毕;
第8、完成“新文字图像”的生成,“新文字图像”就是“原文字图像”的收缩变形后的文字图像,程序执行结束。
按照本发明提供的建立方法,所述的,第4步所述的“基准点”的选取方法,可以选取文字图像上的任意一个点作为“基准点”。
按照本发明提供的建立方法,所述的,第6步所述的“收缩变形系数k”的设置方法是,通过采用一个给定文字的手写体“文字图像”与该给定文字的标准印刷体“文字图像”在相同“文字图像”尺寸下计算得到k,
Figure BDA0003118279520000051
其中O为“基准点”、Plt为该给定文字的标准印刷体“文字图像”的左上角像素点、Rlt为该给定文字的手写体“文字图像”的左上角像素点、Prt为该给定文字的标准印刷体“文字图像”的右上角像素点、Rrt为该给定文字的手写体“文字图像”的右上角像素点、Plb为该给定文字的标准印刷体“文字图像”的左下角像素点、Rlb为该给定文字的手写体“文字图像”的左下角像素点、Prb为该给定文字的标准印刷体“文字图像”的右下角像素点、Rrb为该给定文字的手写体“文字图像”的右下角像素点,max{}函数为取{}中所有数的最大值。。
按照本发明提供的建立方法,所述的,“收缩变形系数k”的设置方法,通过对一组给定文字的手写体“文字图像”来与各自对应的标准印刷体“文字图像”进行比对来计算出一组ki,其中i的值从1到给定文字总数M,然后计算得到
Figure BDA0003118279520000052
按照本发明提供的建立方法,所述的,第7.3步所述的“收缩变形函数f(d)”的公式,可以采用
Figure BDA0003118279520000061
替换。
为能进一步了解本发明的技术内容、特点及功效,兹列举以下应用实例,并配合附图详细说明如下:
应用实例1
如图2所示,以文字训练集中的已有的“麦”字的文字实例。
针对应用实例1应用本发明给出的方法,具体步骤如下:
第1、输入待收缩变形的文字图像,该文字图像简称为“原文字图像”;
即:图2所示的“麦”字的文字实例。
第2、获取第1步中的“原文字图像”的背景颜色值C、以及尺寸大小即宽W和高H;
即:如图3所示,“麦”字的“原文字图像”背景颜色为白色,背景颜色值C为255;“原文字图像”的尺寸大小:宽W为96,高H为96。
第3、建一个新的空白文字图像简称“新文字图像”,该“新文字图像”的尺寸与原文字图像的尺寸相同,该“新文字图像”上每个点的像素值均设置为“原文字图像”的背景颜色值C;
即:“新文字图像”的尺寸大小:宽W为96,高H为96;“新文字图像”的背景颜色值C为255。
第4、选取“原文字图像”的中心点作为基准点O,其坐标为(ox,oy);
即:如图3所示,选取“原文字图像”的中心点作为基准点O,其坐标为(48.0,48.0)。
第5、设置“新文字图像”的基准点O与“原文字图像”的基准点坐标相同;
即:如图4所示,“新文字图像”的基准点O的坐标点也是(48.0,48.0)。
第6、设置收缩变形系数k的值,k值的取值范围为大于等于1的正整数;
本应用实例中k取值为7。
第7、遍历“新文字图像”上的每一个像素点R,其坐标为(rx,ry),执行如下子步骤:
本应用实例中,以坐标(74,17)的像素点R为例来讨论。
第7.1、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O形成的OR线段与X轴的夹角α的值,公式为
Figure BDA0003118279520000062
即:α的值为:-50°。
第7.2、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O的距离|OR|,公式为
Figure BDA0003118279520000071
即:距离|OR|值为40.45985664828782。
第7.3、根据收缩变形函数f(d)来计算“新文字图像”上的像素点R所对应的被收缩的原始距离|OP|,f(d)的公式为
Figure BDA0003118279520000072
因此根据第7.2步中的|OR|来计算出
Figure BDA0003118279520000073
即:根据|OR|和k可求得|OP|值为44.52564402415874。
第7.4、根据第7.3步中被收缩的原始距离|OP|,进一步计算出“新文字图像”上的像素点R所对应的被收缩的“原文字图像”中的像素点P,像素点P的坐标为(px,py),即
Figure BDA0003118279520000074
即:在图3上可求得P点的坐标为(76,13)。
第7.5、若第7.4步中计算出的“原文字图像”上的像素点P的坐标(px,py)不在“原文字图像”的尺寸大小范围内,则执行第7.7步,否则执行第7.6步;
第7.6、将“原文字图像”中的像素点P的颜色值G(px,py)作为“新文字图像”中像素点R的颜色值G′(rx,ry),即G′(rx,ry)=G(px,py);进一步执行第7.8步;
即:如图3所示,P点为坐标(76,13),P点在图3的尺寸大小范围内,图3为灰度图像,G(px,py)值为0,因此G′(rx,ry)也为0,即图4中“新文字图像”上的像素点R的背景颜色值为0。
第7.7、将“新文字图像”中像素点R的颜色值G′(rx,ry)设置为“原文字图像”的背景颜色值C;
第7.8、“新文字图像”上的当前像素点R的颜色值G′(rx,ry)设置完毕;
第8、完成“新文字图像”的生成,“新文字图像”就是“原文字图像”的收缩变形后的文字图像,程序执行结束。
应用实例2
如图2所示,以文字训练集中的已有的“麦”字的文字实例。
当收缩变形系数k的值设置不同值的情况。图5所示,当收缩变形系数k分别取7(a)、9(b)时,k越大挤压效果越明显。
应用实例3
如图2所示,以文字训练集中的已有的“麦”字的文字实例。
按照本发明提供的建立方法,所述的,第4步所述的“基准点”的选取方法,选取文字图像上的任意一个点作为“基准点”。
即:文字图像的“基准点”不需要一定采用中心点(48.0,48.0)作为基准点O,而是可以选取文字图像上的任意一个点作为“基准点”。这样做,将使得距离基准点O越远的像素点收缩的越大、而距离基准点O越近的像素点收缩的越小。
按照本发明提供的建立方法,所述的,第6步所述的“收缩变形系数k”的设置方法是,通过采用一个给定文字的手写体“文字图像”与该给定文字的标准印刷体“文字图像”在相同“文字图像”尺寸下计算得到k,
Figure BDA0003118279520000081
其中O为“基准点”、Plt为该给定文字的标准印刷体“文字图像”的左上角像素点、Rlt为该给定文字的手写体“文字图像”的左上角像素点、Prt为该给定文字的标准印刷体“文字图像”的右上角像素点、Rrt为该给定文字的手写体“文字图像”的右上角像素点、Plb为该给定文字的标准印刷体“文字图像”的左下角像素点、Rlb为该给定文字的手写体“文字图像”的左下角像素点、Prb为该给定文字的标准印刷体“文字图像”的右下角像素点、Rrb为该给定文字的手写体“文字图像”的右下角像素点,max{}函数为取{}中所有数的最大值。
即:针对一个给定文字的手写体“文字图像”,从计算机标准字库中生成该给定文字的标准印刷体“文字图像”,并且该该给定文字的标准印刷体“文字图像”的尺寸大小与该给定文字的手写体“文字图像”的尺寸大小相同;然后分别获取两个“文字图像”的最左上角、最右上角、最左下角、最右下角的坐标,对于汉字而言更容易获取这四个点的坐标,因为汉字是方框文字、有明显的四个角坐标;然后通过上述公式
Figure BDA0003118279520000082
即可获得k值。
按照本发明提供的建立方法,所述的,“收缩变形系数k”的设置方法,通过对一组给定文字的手写体“文字图像”来与各自对应的标准印刷体“文字图像”进行比对来计算出一组ki,其中i的值从1到给定文字总数M,然后计算得到
Figure BDA0003118279520000083
即:为了能够具有普遍意义、而非偶然的书写风格,还可以对一组给定文字的手写体“文字图像”来与它们对应的标准印刷体“文字图像”进行比对来计算出一组ki,其中i=1...给定文字总数M,然后计算得到
Figure BDA0003118279520000091
按照本发明提供的建立方法,所述的,第7.3步所述的“收缩变形函数f(d)”的公式,采用
Figure BDA0003118279520000092
替换。
即:根据|OR|和k可求得|OP|值为140.8,而非应用实例1中的44.5,相比应用实例1,在此案例中“原文字图像”将被进一步收缩变形。
考虑到在此公开的对本发明的描述和特例的实施例,本发明的其他实施例对于本领域的技术人员来说是显而意见的。这些说明和实施例仅作为例子来考虑,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种面向文字识别的文字图像收缩变形增强方法,其特征在于,所述方法包括具体步骤如下:
第1、输入待收缩变形的文字图像,该文字图像简称为“原文字图像”;
第2、获取第1步中的“原文字图像”的背景颜色值C、以及尺寸大小即宽W和高H;
第3、建一个新的空白文字图像简称“新文字图像”,该“新文字图像”的尺寸与原文字图像的尺寸相同,该“新文字图像”上每个点的像素值均设置为“原文字图像”的背景颜色值C;
第4、选取“原文字图像”的中心点作为基准点O,其坐标为(ox,oy);
第5、设置“新文字图像”的基准点O与“原文字图像”的基准点坐标相同;
第6、设置收缩变形系数k的值,k值的取值范围为大于等于1的正整数;
第7、遍历“新文字图像”上的每一个像素点R,其坐标为(rx,ry),执行如下子步骤:
第7.1、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O形成的OR线段与X轴的夹角α的值,公式为
Figure FDA0003118279510000011
第7.2、计算“新文字图像”上的像素点R和“新文字图像”上的基准点O的距离|OR|,公式为
Figure FDA0003118279510000012
第7.3、根据收缩变形函数f(d)来计算“新文字图像”上的像素点R所对应的被收缩的原始距离|OP|,f(d)的公式为
Figure FDA0003118279510000013
因此根据第7.2步中的|OR|来计算出
Figure FDA0003118279510000014
第7.4、根据第7.3步中被收缩的原始距离|OP|,进一步计算出“新文字图像”上的像素点R所对应的被收缩的“原文字图像”中的像素点P,像素点P的坐标为(px,py),即
Figure FDA0003118279510000015
第7.5、若第7.4步中计算出的“原文字图像”上的像素点P的坐标(px,py)不在“原文字图像”的尺寸大小范围内,则执行第7.7步,否则执行第7.6步;
第7.6、将“原文字图像”中的像素点P的颜色值G(px,py)作为“新文字图像”中像素点R的颜色值G′(rx,ry),即G′(rx,ry)=G(px,py);进一步执行第7.8步;
第7.7、将“新文字图像”中像素点R的颜色值G′(rx,ry)设置为“原文字图像”的背景颜色值C;
第7.8、“新文字图像”上的当前像素点R的颜色值G′(rx,ry)设置完毕;
第8、完成“新文字图像”的生成,“新文字图像”就是“原文字图像”的收缩变形后的文字图像,程序执行结束。
2.根据权利要求1所述的方法,其特征在于,第4步所述的“基准点”的选取方法,选取文字图像上的任意一个点作为“基准点”替换中心点。
3.根据权利要求1所述的方法,其特征在于,第6步所述的“收缩变形系数k”的设置方法是,通过采用一个给定文字的手写体“文字图像”与该给定文字的标准印刷体“文字图像”在相同“文字图像”尺寸下计算得到k,
Figure FDA0003118279510000021
其中O为“基准点”、Plt为该给定文字的标准印刷体“文字图像”的左上角像素点、Rlt为该给定文字的手写体“文字图像”的左上角像素点、Prt为该给定文字的标准印刷体“文字图像”的右上角像素点、Rrt为该给定文字的手写体“文字图像”的右上角像素点、Plb为该给定文字的标准印刷体“文字图像”的左下角像素点、Rlb为该给定文字的手写体“文字图像”的左下角像素点、Prb为该给定文字的标准印刷体“文字图像”的右下角像素点、Rrb为该给定文字的手写体“文字图像”的右下角像素点,max{}函数为取{}中所有数的最大值。
4.根据权利要求1或3所述的方法,其特征在于,“收缩变形系数k”的设置方法,通过对一组给定文字的手写体“文字图像”来与各自对应的标准印刷体“文字图像”进行比对来计算出一组ki,其中i的值从1到给定文字总数M,然后计算得到
Figure FDA0003118279510000022
5.根据权利要求1所述的方法,其特征在于,第7.3步所述的“收缩变形函数f(d)”的公式,采用
Figure FDA0003118279510000023
替换。
CN202110669815.9A 2021-06-17 2021-06-17 一种面向文字识别的文字图像收缩变形增强方法 Active CN113392772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110669815.9A CN113392772B (zh) 2021-06-17 2021-06-17 一种面向文字识别的文字图像收缩变形增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110669815.9A CN113392772B (zh) 2021-06-17 2021-06-17 一种面向文字识别的文字图像收缩变形增强方法

Publications (2)

Publication Number Publication Date
CN113392772A CN113392772A (zh) 2021-09-14
CN113392772B true CN113392772B (zh) 2022-04-19

Family

ID=77621568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110669815.9A Active CN113392772B (zh) 2021-06-17 2021-06-17 一种面向文字识别的文字图像收缩变形增强方法

Country Status (1)

Country Link
CN (1) CN113392772B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503880B (zh) * 2023-06-29 2023-10-31 武汉纺织大学 一种倾斜字体的英文字符识别方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008020557A1 (fr) * 2006-08-14 2008-02-21 Kite Image Technologies Inc. Procédé de reconnaissance d'écriture manuscrite, système de reconnaissance d'écriture manuscrite, programme de reconnaissance d'écriture manuscrite, et support de données
CN103810739A (zh) * 2014-02-20 2014-05-21 南京师范大学 一种图像文字变形动画的生成方法
CN104899571A (zh) * 2015-06-12 2015-09-09 成都数联铭品科技有限公司 一种用于复杂文字识别的随机样本产生方法
CN107357778A (zh) * 2017-06-22 2017-11-17 达而观信息科技(上海)有限公司 一种变形词的识别验证方法及系统
CN112528997A (zh) * 2020-12-24 2021-03-19 西北民族大学 一种基于文本中心区域扩增的藏汉双语场景文本检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008020557A1 (fr) * 2006-08-14 2008-02-21 Kite Image Technologies Inc. Procédé de reconnaissance d'écriture manuscrite, système de reconnaissance d'écriture manuscrite, programme de reconnaissance d'écriture manuscrite, et support de données
CN103810739A (zh) * 2014-02-20 2014-05-21 南京师范大学 一种图像文字变形动画的生成方法
CN104899571A (zh) * 2015-06-12 2015-09-09 成都数联铭品科技有限公司 一种用于复杂文字识别的随机样本产生方法
CN107357778A (zh) * 2017-06-22 2017-11-17 达而观信息科技(上海)有限公司 一种变形词的识别验证方法及系统
CN112528997A (zh) * 2020-12-24 2021-03-19 西北民族大学 一种基于文本中心区域扩增的藏汉双语场景文本检测方法

Also Published As

Publication number Publication date
CN113392772A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN109190722B (zh) 基于满文字符图片的字体风格迁移变换方法
CN103488711B (zh) 一种快速制作矢量字库的方法及系统
Karthick et al. Steps involved in text recognition and recent research in OCR; a study
US7633512B2 (en) Information processing apparatus, information processing method and program
US11587275B2 (en) Method for generating a handwriting vector
Zong et al. Strokebank: Automating personalized chinese handwriting generation
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
CN112784531B (zh) 一种基于深度学习和部件拼接的中文字形及字库生成方法
Hung et al. Micrography QR codes
CN111523622B (zh) 基于特征图像自学习的机械臂模拟手写笔迹方法
KR102677200B1 (ko) 터치-기반 사용자 인터페이스 입력에서의 제스처 스트로크 인식
CN113392772B (zh) 一种面向文字识别的文字图像收缩变形增强方法
JP2015049618A (ja) 手書き文書処理装置、手書き文書処理方法及び手書き文書処理プログラム
CN114419632A (zh) 一种ocr训练样本生成方法、装置及系统
CN110211032B (zh) 汉字字符的生成方法、装置及可读存储介质
Yan et al. SMFNet: One Shot Recognition of Chinese Character Font Based on Siamese Metric Model
Balreira et al. Handwriting synthesis from public fonts
CN113392780B (zh) 一种面向ai识别汉字的文字图像扭曲变形方法
CN114241486A (zh) 一种提高识别试卷学生信息准确率的方法
Li et al. Design and implementation of handwritten Chinese character recognition method based on CNN and TensorFlow
Suchenwirth et al. Optical recognition of Chinese characters
CN108345853B (zh) 基于同构理论的字符识别方法、装置及终端设备
Salameh Arabic Digits Recognition Using Statistical Analysis for End/Conjunction Points and Fuzzy Logic for Pattern Recognition Techniques.
JP2010211346A (ja) 手書き文字認識システム
CN105809160B (zh) 一种基于交点数判定手写数字的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant