CN113688838A - 红色笔迹提取方法、系统、可读存储介质及计算机设备 - Google Patents
红色笔迹提取方法、系统、可读存储介质及计算机设备 Download PDFInfo
- Publication number
- CN113688838A CN113688838A CN202111237447.7A CN202111237447A CN113688838A CN 113688838 A CN113688838 A CN 113688838A CN 202111237447 A CN202111237447 A CN 202111237447A CN 113688838 A CN113688838 A CN 113688838A
- Authority
- CN
- China
- Prior art keywords
- image
- pixel
- value
- gray
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种红色笔迹提取方法、系统、可读存储介质及计算机设备,该方法包括:输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;将原始图像进行灰度化处理以降低原始图像中红色颜色笔迹的灰度值,得到灰度图像;将灰度图像进行二值化处理以将灰度图像中的背景元素和文字元素进行分割,得到二值化图像;根据红色笔迹对应的预设像素范围从像素列表中筛选出符合预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对文字元素当中的红色笔迹进行提取,以得到新的图像。本发明提出的红色笔迹提取方法,能够提高笔迹提取的准确度和清晰度。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种红色笔迹提取方法、系统、可读存储介质及计算机设备。
背景技术
随着互联网技术的发展,手写文档识别迅速兴起并蓬勃发展,其应用已遍及多个领域,对人们的生活产生了较大影响,尤其是对教育领域的发展更是至关重要,如机器自动阅卷,试卷电子化等,都需要对手写文档进行版面分析。
现有技术中,学生在修改试卷等作业时,往往会使用到红笔,由于学生手写的字体常常比较随意,导致手写文本不规范,如出现字迹不工整、潦草等情况,再加上红色字体容易造成试卷背面透光,影响试卷整体背景,使得在对手写文档中的红色字体进行提取时容易出现文字模糊,准确度较低的问题。
发明内容
基于此,本发明的目的是提出一种红色笔迹提取方法、系统、可读存储介质及计算机设备,以解决传统手写文档提取方法存在的文字模糊以及准确度较低的问题。
根据本发明提出的一种红色笔迹提取方法,所述方法包括:
输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
综上,根据上述的红色笔迹提取方法,当接收到有待处理的原始图像时,开始遍历该原始图像以得到关于原始图像当中所有像素点的像素列表,再对原始图像进行灰度化处理,以降低红色颜色笔迹的灰度值,防止红色透光造成背景干扰,而后再将灰度化后的灰度图片进行特殊的二值化处理,以将灰度图像当中的背景元素和文字元素进行区分,最后根据原始图像像素列表,锁定红色笔迹对应的所有像素点的坐标,再根据红色笔迹对应的所有像素点的坐标对二值化图像当中的文字元素中的红色笔迹进行提取,从而极大地提高了文字提取的准确度和清晰度。
进一步地,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤之后还包括:
对二值化图像当中的文字元素进行轮廓分析,以将每个文字对应的矩形信息制成初始轮廓列表;
获取所述初始轮廓列表中的每个矩形元素的宽和高,并将每个矩形元素的宽和高进行乘积;
判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表。
进一步地,所述判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表的步骤之后还包括:
遍历所述二值化图像中的像素点,以获取所述二值化图像中的每个像素点的坐标;
根据所述二值化图像中的每个像素点的坐标判断所述二值化图像中的像素点是否包含所述最终轮廓列表的其中一个矩形元素;
若是则将包含所述最终轮廓列表的其中一个矩形元素的像素点的值设为0,得到去噪点图像。
进一步地,所述根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像的步骤还包括:
创建一张与所述原始图像的尺寸完全相同的新的图片F;
根据以下公式对新的图片中的所有像素点进行处理:
其中,F(x,y)表示坐标为(x,y)的像素点在图片F上的RGB值,Rx,y、Gx,y以及Bx,y分别表示原始图像中坐标为(x,y)的像素点的R值、G值以及B值,C(x,y)表示去噪点图像中坐标为(x,y)的像素点的RGB值,bate的取值范围为30-50。
进一步地,所述将所述原始图像进行灰度化处理以降低所述原始图像中红色笔迹的灰度值,得到灰度图像的步骤包括:
获取原始图像的R值、B值和G值,并根据R值、B值以及G值分别对应的第一预设比重,第二预设比重以及第三预设比重求得灰度值,所述第二预设比重和所述第三预设比重均大于所述第一预设比重,所述第一预设比重、所述第二预设比重以及所述第三预设比重之和为1;
根据得到的灰度值对原始图像进行灰度化处理。
进一步地,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤包括:
获取所述灰度图像的尺寸,以根据所述灰度图像的尺寸计算得到所述灰度图像总像素数量;
获取所述灰度图像中前景像素点占灰度图像总像素数量的比例,以及前景平均灰度值;
获取所述灰度图像中背景像素点占灰度图像总像素数量的比例,以及背景平均灰度值;
建立目标函数,所述目标函数的公式为:
g(t)表示灰度阀值为t下的类间方差,w0表示前景像素点占灰度图像总像素数量的比例,w1表示背景像素点占灰度图像总像素数量的比例,u0表示前景平均灰度值,u1表示背景平均灰度值。
进一步地,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤还包括:
根据所述目标函数获取最大的g(t)值,并根据最大的g(t)值对应的灰度阀值作为最佳灰度阀值;
根据所述最佳灰度阀值将所述灰度图像中的前景和背景分成黑白两部分。
根据本发明实施例的一种红色笔迹提取系统,所述红色笔迹提取系统包括:
第一获取模块,用于输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
灰度化处理模块,用于将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
二值化处理模块,用于将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
提取模块,用于根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
本发明另一方面还提供一种可读存储介质,包括所述可读存储介质存储一个或多个程序,该程序被执行时实现如上述的红色笔迹提取方法。
本发明另一方面还提供一种计算机设备,所述计算机设备包括存储器和处理器,其中:
所述存储器用于存放计算机程序;
所述处理器用于执行所述存储器上所存放的计算机程序时,实现如上述的红色笔迹提取方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
图1为本发明第一实施例提出的红色笔迹提取方法的流程图;
图2为本发明第一实施例提出的步骤S03的细化图;
图3为本发明第二实施例提出的红色笔迹提取方法的流程图;
图4为本发明第三实施例提出的红色笔迹提取系统的结构示意图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干个实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1,所示为本发明第一实施例中的红色笔迹提取方法的流程图,该方法包括步骤S01至步骤S04,其中:
步骤S01:输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
需要说明的是,待处理的原始图像包括但不限于png、jpg、jpeg等格式,若原始图像的格式为word、pdf等格式则需转换成专属格式,才能进行相应的提取步骤,且为了保证提取效率,在接收到原始图像时会对其存储大小进行检测,若超过预设存储阀值则会首先进行图像压缩,由于预设存储阀值与用户提取需求有关,在此不作具体限定。
可以理解的,在遍历原始图像获取到原始图像所有像素点的像素数据以及对应标后,建立相关的像素列表,并将该像素列表进行预存。
步骤S02:将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
需要指出的是,为了在视觉上增加对比,并突出文字区域,本发明首先对原始图像进行灰度化处理,具体包括:
获取原始图像的R值、B值和G值,并根据R值、B值以及G值分别对应的第一预设比重,第二预设比重以及第三预设比重求得灰度值,所述第二预设比重和所述第三预设比重均大于所述第一预设比重,所述第一预设比重、所述第二预设比重以及所述第三预设比重之和为1,并根据得到的灰度值对原始图像进行灰度化处理。在本实施例中,第一预设比重,第二预设比重以及第三预设比重分别设为0、0.5、0.5,以使图像中红色笔迹的灰度值更小,提高运算速度的同时,能够减轻红色透光带来的背景整体干扰。
步骤S03:将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
进一步地,请参阅图2,步骤S03包括步骤S031至步骤S036,其中:
步骤S031:获取所述灰度图像的尺寸,以根据所述灰度图像的尺寸计算得到所述灰度图像总像素数量;
可以理解的,在获取到灰度图像的尺寸后,将高记为w,宽记为h,则高与宽的乘积为灰度图像的总像素数量。
步骤S032:获取所述灰度图像中前景像素点占灰度图像总像素数量的比例,以及前景平均灰度值;
需要说明的是,为了找到合适的灰度值,以使背景和前景的区别最大,通过算出不同灰度值下的像素方差,当像素方差值最大时,则表示背景和前景区别最大,在本实施例中,前景即为文字元素。
可以理解的,选取一个灰度值,则小于该灰度值的像素为前景,大于该灰度值的像素为背景。
步骤S033:获取所述灰度图像中背景像素点占灰度图像总像素数量的比例,以及背景平均灰度值;
步骤S034:建立目标函数;
需要说明的是,所述目标函数的公式为:
g(t)表示灰度阀值为t下的类间方差,w0表示前景像素点占灰度图像总像素数量的比例,w1表示背景像素点占灰度图像总像素数量的比例,u0表示前景平均灰度值,u1表示背景平均灰度值。
步骤S035:根据所述目标函数获取最大的g(t)值,并根据最大的g(t)值对应的灰度阀值作为最佳灰度阀值;
可以理解的,通过遍历每一个灰度值,从而找到像素方差最大对应的灰度值,即为最佳灰度阀值。
步骤S036:根据所述最佳灰度阀值将所述灰度图像中的前景和背景分成黑白两部分。
步骤S04:根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
需要说明的是,由于红色常常包括深红,橘红,粉红等多种,在实际红色笔迹提取过程中,需要根据图像中的红色笔迹大致判断其所属的像素范围,即为预设像素范围,而后再根据该预设像素范围比对原始图像像素列表中的所有像素点对应的像素,以找到符合该预设像素范围的像素点,再对应调取出这些像素点的坐标,即锁定了红色笔迹在原始图像中的所有位置,而后再根据符合该预设像素范围的像素点坐标数据对二值化图像当中的红色笔迹进行提取,以得到新的图片,且该新的图片只含有红色笔迹相关的文字。
综上,根据上述的红色笔迹提取方法,当接收到有待处理的原始图像时,开始遍历该原始图像以得到关于原始图像当中所有像素点的像素列表,再对原始图像进行灰度化处理,以降低红色颜色笔迹的灰度值,防止红色透光造成背景干扰,而后再将灰度化后的灰度图片进行特殊的二值化处理,以将灰度图像当中的背景元素和文字元素进行区分,最后根据原始图像像素列表,锁定红色笔迹对应的所有像素点的坐标,再根据红色笔迹对应的所有像素点的坐标对二值化图像当中的文字元素中的红色笔迹进行提取,从而极大地提高了文字提取的准确度和清晰度。
请参阅3,所示为本发明第二实施例中的红色笔迹提取方法的流程图,该方法包括步骤S11至步骤S20,其中:
步骤S11:输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
步骤S12:将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
步骤S13:将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
步骤S14:对二值化图像当中的文字元素进行轮廓分析,以将每个文字对应的矩形信息制成初始轮廓列表;
可以理解的,由于在实际获取原始图像的过程中,一般使通过拍照获得的,常常会出现拍照光线不足的情况,基于此,为了去除因光线不足导致的图像噪点问题,在得到二值化图像后,本方法还会对该二值化图像分割出的文字元素进行轮廓分析,在本实施例中,通过采用OpenCV里面的FindContours函数获取一个轮廓列表,所谓轮廓, 即是在二值化图像当中白色联通区的矩形信息。
步骤S15:获取所述初始轮廓列表中的每个矩形元素的宽和高,并将每个矩形元素的宽和高进行乘积;
可以理解的,由于白色联通区对应的一般为噪点和文字,为了筛选出所需的轮廓,还需对每个矩形元素的尺寸进行分析,以便删除大面积轮廓。
步骤S16:判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表。
可以理解的,为了剔除掉不需要的大面积轮廓,通过设定预设尺寸阈值,将大于该预设尺寸阈值的全部删除,以留下小面积轮廓构成最终轮廓列表。
需要说明的是,在本实施例中,预设尺寸阈值设定为9,在本发明的其他实施例中,预设尺寸阈值还可以设置成其他数值,同样能够达到去除大面积轮廓的目的。
步骤S17:遍历所述二值化图像中的像素点,以获取所述二值化图像中的每个像素点的坐标;
可以理解的,为了删除二值化图像中的噪点,以使图片更加清晰,还需获取二值化图像中的所有像素点的位置坐标。
步骤S18:根据所述二值化图像中的每个像素点的坐标判断所述二值化图像中的像素点是否包含所述最终轮廓列表的其中一个矩形元素;
可以理解的,当根据二值化图像中的像素点的坐标分析到,该像素点包含最终轮廓列表中的其中一个矩形元素,则说明该像素点为噪点。
步骤S19:若是则将包含所述最终轮廓列表的其中一个矩形元素内的像素点的值设为0,得到去噪点图像;
在分析到包含所述最终轮廓列表的其中一个矩形元素内的像素点为噪点后,通过将该像素点的像素值设为0,以使其变为黑点,从而达到去除噪点的目的,得到去噪点图片。
步骤S20 :根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
需要说明的是,在最终提取红色笔迹的过程中,首先会创建一张与所述原始图像的尺寸完全相同的新的图片;
而后根据以下公式对新的图片中的所有像素点进行处理:
其中,F表示新的图片,F(x,y)表示坐标为(x,y)的像素点在图片F上的RGB值,Rx,y、Gx,y以及Bx,y分别表示原始图像中坐标为(x,y)的像素点的R值、G值以及B值,C(x,y)表示去噪点图像中坐标为(x,y)的像素点的RGB值,bate的取值范围为30-50。
进一步的,只有在满足预设像素范围内的像素点才会被设定为255,其他所有的情况均设定为0,从而只对去噪点图像中的红色笔迹进行有效提取,保证了提取的准确度。
综上,根据上述的红色笔迹提取方法,当接收到有待处理的原始图像时,开始遍历该原始图像以得到关于原始图像当中所有像素点的像素列表,再对原始图像进行灰度化处理,以降低红色颜色笔迹的灰度值,防止红色透光造成背景干扰,而后再将灰度化后的灰度图片进行特殊的二值化处理,以将灰度图像当中的背景元素和文字元素进行区分,而后再通过轮廓分析去去除光线较差带来的噪点问题,最后根据原始图像像素列表,锁定红色笔迹对应的所有像素点的坐标,再根据红色笔迹对应的所有像素点的坐标对去噪点图像当中的文字元素中的红色笔迹进行提取,从而极大地提高了文字提取的准确度和清晰度。
请参阅图4,所示为本发明第三实施例中的红色笔迹提取系统的结构示意图,该系统包括:
第一获取模块10,用于输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
灰度化处理模块20,用于将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
二值化处理模块30,用于将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
进一步地,二值化处理模块30还包括:
总像素获取单元,用于获取所述灰度图像的尺寸,以根据所述灰度图像的尺寸计算得到所述灰度图像总像素数量;
前景参数获取单元,用于获取所述灰度图像中前景像素点占灰度图像总像素数量的比例,以及前景平均灰度值;
背景参数获取单元,用于获取所述灰度图像中背景像素点占灰度图像总像素数量的比例,以及背景平均灰度值;
函数建立单元,用于建立目标函数;
最佳灰度值获取单元,用于根据所述目标函数获取最大的g(t)值,并根据最大的g(t)值对应的灰度阀值作为最佳灰度阀值;
分割单元,用于根据所述最佳灰度阀值将所述灰度图像中的前景和背景分成黑白两部分。
轮廓分析模块40,用于对二值化图像当中的文字元素进行轮廓分析,以将每个文字对应的矩形信息制成初始轮廓列表;
第二获取模块50,用于获取所述初始轮廓列表中的每个矩形元素的宽和高,并将每个矩形元素的宽和高进行乘积;
小面积轮廓筛选模块60,用于判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表;
第三获取模块70,用于遍历所述二值化图像中的像素点,以获取所述二值化图像中的每个像素点的坐标;
噪点分析模块80,用于根据所述二值化图像中的每个像素点的坐标判断所述二值化图像中的像素点是否包含所述最终轮廓列表的其中一个矩形元素;
去噪点模块90,用于若是则将包含所述最终轮廓列表的其中一个矩形元素内的像素点的值设为0,得到去噪点图像;
提取模块100,用于根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
综上,根据上述的红色笔迹提取方法,当接收到有待处理的原始图像时,开始遍历该原始图像以得到关于原始图像当中所有像素点的像素列表,再对原始图像进行灰度化处理,以降低红色颜色笔迹的灰度值,防止红色透光造成背景干扰,而后再将灰度化后的灰度图片进行特殊的二值化处理,以将灰度图像当中的背景元素和文字元素进行区分,最后根据原始图像像素列表,锁定红色笔迹对应的所有像素点的坐标,再根据红色笔迹对应的所有像素点的坐标对二值化图像当中的文字元素中的红色笔迹进行提取,从而极大地提高了文字提取的准确度和清晰度。
本发明另一方面还提出计算机可读存储介质,其上存储有一个或多个程序,该程序给处理器执行时实现上述的红色笔迹提取方法。
本发明另一方面还提出一种计算机设备,包括存储器和处理器,其中存储器用于存放计算机程序,处理器用于执行存储器上所存放的计算机程序,以实现上述的红色笔迹提取方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
Claims (10)
1.一种红色笔迹提取方法,其特征在于,所述方法包括:
输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
2.根据权利要求1所述的红色笔迹提取方法,其特征在于,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤之后还包括:
对二值化图像当中的文字元素进行轮廓分析,以将每个文字对应的矩形信息制成初始轮廓列表;
获取所述初始轮廓列表中的每个矩形元素的宽和高,并将每个矩形元素的宽和高进行乘积;
判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表。
3.根据权利要求2所述的红色笔迹提取方法,其特征在于,所述判断每个矩形元素的宽和高乘积是否大于预设尺寸阀值,若是则将大于预设尺寸阀值对应的矩形元素删除,以生成最终轮廓列表的步骤之后还包括:
遍历所述二值化图像中的像素点,以获取所述二值化图像中的每个像素点的坐标;
根据所述二值化图像中的每个像素点的坐标判断所述二值化图像中的像素点是否包含所述最终轮廓列表的其中一个矩形元素;
若是则将包含所述最终轮廓列表的其中一个矩形元素的像素点的值设为0,得到去噪点图像。
4.根据权利要求3所述的红色笔迹提取方法,其特征在于,所述根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像的步骤还包括:
创建一张与所述原始图像的尺寸完全相同的新的图片F;
根据以下公式对新的图片中的所有像素点进行处理:
其中,F(x,y)表示坐标为(x,y)的像素点在图片F上的RGB值,Rx,y、Gx,y以及Bx,y分别表示原始图像中坐标为(x,y)的像素点的R值、G值以及B值,C(x,y)表示去噪点图像中坐标为(x,y)的像素点的RGB值,bate的取值范围为30-50。
5.根据权利要求1所述的红色笔迹提取方法,其特征在于,所述将所述原始图像进行灰度化处理以降低所述原始图像中红色笔迹的灰度值,得到灰度图像的步骤包括:
获取原始图像的R值、B值和G值,并根据R值、B值以及G值分别对应的第一预设比重,第二预设比重以及第三预设比重求得灰度值,所述第二预设比重和所述第三预设比重均大于所述第一预设比重,所述第一预设比重、所述第二预设比重以及所述第三预设比重之和为1;
根据得到的灰度值对原始图像进行灰度化处理。
6.根据权利要求1所述的红色笔迹提取方法,其特征在于,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤包括:
获取所述灰度图像的尺寸,以根据所述灰度图像的尺寸计算得到所述灰度图像总像素数量;
获取所述灰度图像中前景像素点占灰度图像总像素数量的比例,以及前景平均灰度值;
获取所述灰度图像中背景像素点占灰度图像总像素数量的比例,以及背景平均灰度值;
建立目标函数,所述目标函数的公式为:
g(t)表示灰度阀值为t下的类间方差,w0表示前景像素点占灰度图像总像素数量的比例,w1表示背景像素点占灰度图像总像素数量的比例,u0表示前景平均灰度值,u1表示背景平均灰度值。
7.根据权利要求6所述的红色笔迹提取方法,其特征在于,所述将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像的步骤还包括:
根据所述目标函数获取最大的g(t)值,并根据最大的g(t)值对应的灰度阀值作为最佳灰度阀值;
根据所述最佳灰度阀值将所述灰度图像中的前景和背景分成黑白两部分。
8.一种红色笔迹提取系统,其特征在于,所述红色笔迹提取系统包括:
第一获取模块,用于输入待处理的原始图像,并遍历所述原始图像以获取原始图像像素列表,所述像素列表包括原始图像中所有像素点坐标以及与像素点坐标对应的像素数据;
灰度化处理模块,用于将所述原始图像进行灰度化处理以降低所述原始图像中红色颜色笔迹的灰度值,得到灰度图像;
二值化处理模块,用于将灰度图像进行二值化处理以将所述灰度图像中的背景元素和文字元素进行分割,得到二值化图像;
提取模块,用于根据红色笔迹对应的预设像素范围从所述像素列表中筛选出符合所述预设像素范围的像素点坐标,并根据符合预设像素范围的像素点坐标对所述文字元素当中的红色笔迹进行提取,以得到新的图像。
9.一种可读存储介质,其特征在于,包括:所述可读存储介质存储一个或多个程序,该程序被处理器执行时实现如权利要求1-7任一所述的红色笔迹提取方法。
10.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,其中:
所述存储器用于存放计算机程序;
所述处理器用于执行所述存储器上所存放的计算机程序时,实现权利要求1-7任一所述的红色笔迹提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111237447.7A CN113688838B (zh) | 2021-10-25 | 2021-10-25 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111237447.7A CN113688838B (zh) | 2021-10-25 | 2021-10-25 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113688838A true CN113688838A (zh) | 2021-11-23 |
CN113688838B CN113688838B (zh) | 2022-03-22 |
Family
ID=78587723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111237447.7A Active CN113688838B (zh) | 2021-10-25 | 2021-10-25 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688838B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984863A (zh) * | 2023-03-17 | 2023-04-18 | 中化现代农业有限公司 | 图像处理方法、装置、设备及存储介质 |
CN116311543A (zh) * | 2023-02-03 | 2023-06-23 | 汇金智融(深圳)科技有限公司 | 一种基于图像识别技术的笔迹分析方法及系统 |
CN117647295A (zh) * | 2024-01-30 | 2024-03-05 | 合肥金星智控科技股份有限公司 | 基于机器视觉的熔池液位测量方法、电子设备及存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894268A (zh) * | 2010-07-16 | 2010-11-24 | 西安理工大学 | 一种可消除底单干扰的印鉴真伪识别方法 |
CN102054168A (zh) * | 2010-12-23 | 2011-05-11 | 武汉大学苏州研究院 | 一种有价票据圆形印鉴识别方法 |
CN103064946A (zh) * | 2012-12-26 | 2013-04-24 | 天津三星通信技术研究有限公司 | 手写原笔迹保存方法及装置、手写原笔迹检索方法及装置 |
CN105184232A (zh) * | 2015-08-12 | 2015-12-23 | 祁亨年 | 一种o2o互联网作业本、系统及实现方法 |
CN105988567A (zh) * | 2015-02-12 | 2016-10-05 | 北京三星通信技术研究有限公司 | 手写信息的识别方法和装置 |
CN106599818A (zh) * | 2016-12-07 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种基于图片生成笔迹格式的文件的方法及装置 |
CN107025456A (zh) * | 2017-03-20 | 2017-08-08 | 安徽七天教育科技有限公司 | 一种教师批改痕迹自动识别的方法 |
CN108647680A (zh) * | 2018-04-28 | 2018-10-12 | 北京盒子鱼教育科技有限公司 | 图像定位框检测方法和装置 |
CN109271882A (zh) * | 2018-08-28 | 2019-01-25 | 昆明理工大学 | 一种区分颜色的手写体汉字提取方法 |
CN109993758A (zh) * | 2019-04-23 | 2019-07-09 | 北京华力兴科技发展有限责任公司 | 分割方法、分割装置、计算机设备及存储介质 |
CN110414563A (zh) * | 2019-06-27 | 2019-11-05 | 深圳中兴网信科技有限公司 | 考试成绩统计方法、系统及计算机可读存储介质 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
CN111415363A (zh) * | 2020-04-20 | 2020-07-14 | 电子科技大学中山学院 | 一种图像边缘识别方法 |
CN111695550A (zh) * | 2020-03-26 | 2020-09-22 | 遥相科技发展(北京)有限公司 | 一种文字提取方法、图像处理设备和计算机可读存储介质 |
CN111914683A (zh) * | 2020-07-14 | 2020-11-10 | 南京邮电大学 | 一种基于仿生图像增强算法和fpga硬件加速的手写成绩录入系统 |
CN113205633A (zh) * | 2020-01-16 | 2021-08-03 | 深圳怡化电脑股份有限公司 | 票据红蓝纤维的检测方法、装置、电子设备和存储介质 |
-
2021
- 2021-10-25 CN CN202111237447.7A patent/CN113688838B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894268A (zh) * | 2010-07-16 | 2010-11-24 | 西安理工大学 | 一种可消除底单干扰的印鉴真伪识别方法 |
CN102054168A (zh) * | 2010-12-23 | 2011-05-11 | 武汉大学苏州研究院 | 一种有价票据圆形印鉴识别方法 |
CN103064946A (zh) * | 2012-12-26 | 2013-04-24 | 天津三星通信技术研究有限公司 | 手写原笔迹保存方法及装置、手写原笔迹检索方法及装置 |
CN105988567A (zh) * | 2015-02-12 | 2016-10-05 | 北京三星通信技术研究有限公司 | 手写信息的识别方法和装置 |
CN105184232A (zh) * | 2015-08-12 | 2015-12-23 | 祁亨年 | 一种o2o互联网作业本、系统及实现方法 |
CN106599818A (zh) * | 2016-12-07 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种基于图片生成笔迹格式的文件的方法及装置 |
CN107025456A (zh) * | 2017-03-20 | 2017-08-08 | 安徽七天教育科技有限公司 | 一种教师批改痕迹自动识别的方法 |
CN108647680A (zh) * | 2018-04-28 | 2018-10-12 | 北京盒子鱼教育科技有限公司 | 图像定位框检测方法和装置 |
CN109271882A (zh) * | 2018-08-28 | 2019-01-25 | 昆明理工大学 | 一种区分颜色的手写体汉字提取方法 |
CN109993758A (zh) * | 2019-04-23 | 2019-07-09 | 北京华力兴科技发展有限责任公司 | 分割方法、分割装置、计算机设备及存储介质 |
CN110414563A (zh) * | 2019-06-27 | 2019-11-05 | 深圳中兴网信科技有限公司 | 考试成绩统计方法、系统及计算机可读存储介质 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
CN113205633A (zh) * | 2020-01-16 | 2021-08-03 | 深圳怡化电脑股份有限公司 | 票据红蓝纤维的检测方法、装置、电子设备和存储介质 |
CN111695550A (zh) * | 2020-03-26 | 2020-09-22 | 遥相科技发展(北京)有限公司 | 一种文字提取方法、图像处理设备和计算机可读存储介质 |
CN111415363A (zh) * | 2020-04-20 | 2020-07-14 | 电子科技大学中山学院 | 一种图像边缘识别方法 |
CN111914683A (zh) * | 2020-07-14 | 2020-11-10 | 南京邮电大学 | 一种基于仿生图像增强算法和fpga硬件加速的手写成绩录入系统 |
Non-Patent Citations (1)
Title |
---|
常治国: "《基于彩色图像分割的带网格底纹文档笔迹提取方法》", 《电子技术与软件工程》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311543A (zh) * | 2023-02-03 | 2023-06-23 | 汇金智融(深圳)科技有限公司 | 一种基于图像识别技术的笔迹分析方法及系统 |
CN116311543B (zh) * | 2023-02-03 | 2024-03-08 | 汇金智融(深圳)科技有限公司 | 一种基于图像识别技术的笔迹分析方法及系统 |
CN115984863A (zh) * | 2023-03-17 | 2023-04-18 | 中化现代农业有限公司 | 图像处理方法、装置、设备及存储介质 |
CN117647295A (zh) * | 2024-01-30 | 2024-03-05 | 合肥金星智控科技股份有限公司 | 基于机器视觉的熔池液位测量方法、电子设备及存储介质 |
CN117647295B (zh) * | 2024-01-30 | 2024-05-14 | 合肥金星智控科技股份有限公司 | 基于机器视觉的熔池液位测量方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113688838B (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
US9042649B2 (en) | Color document image segmentation and binarization using automatic inpainting | |
US8644616B2 (en) | Character recognition | |
JP5844783B2 (ja) | テキスト領域を含むグレースケール文書画像を処理する方法、グレースケール文書画像の少なくともテキスト領域を二値化する方法、グレースケール文書画像においてグリッドを形成するテーブルの抽出方法及びプログラム | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
US20070253040A1 (en) | Color scanning to enhance bitonal image | |
CN111401372A (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
US8385643B2 (en) | Determination of inputted image to be document or non-document | |
CN101599125A (zh) | 复杂背景下图像处理的二值化方法 | |
CN111915635A (zh) | 支持自阅卷的试题解析信息生成方法及系统 | |
CN113392819B (zh) | 一种批量化学术图像自动分割标注装置和方法 | |
Grover et al. | Text extraction from document images using edge information | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
US20120250985A1 (en) | Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images | |
CN113033562A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN112749696A (zh) | 一种文本检测方法及装置 | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
Polyakova et al. | Improvement of the Color Text Image Binarization Methodusing the Minimum-Distance Classifier | |
CN113158745B (zh) | 一种基于多特征算子的乱码文档图片识别方法及系统 | |
Boiangiu et al. | Methods of bitonal image conversion for modern and classic documents | |
CN111753842A (zh) | 票据文本区域检测方法及装置 | |
Das et al. | Adaptive method for multi colored text binarization | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |