CN111695550A - 一种文字提取方法、图像处理设备和计算机可读存储介质 - Google Patents

一种文字提取方法、图像处理设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111695550A
CN111695550A CN202010225359.4A CN202010225359A CN111695550A CN 111695550 A CN111695550 A CN 111695550A CN 202010225359 A CN202010225359 A CN 202010225359A CN 111695550 A CN111695550 A CN 111695550A
Authority
CN
China
Prior art keywords
image
value
line
character
gray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010225359.4A
Other languages
English (en)
Other versions
CN111695550B (zh
Inventor
李佳
杨阳
刘旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN ELOAM TECHNOLOGY CO LTD
Original Assignee
Telephase Technology Development Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telephase Technology Development Beijing Co ltd filed Critical Telephase Technology Development Beijing Co ltd
Priority to CN202010225359.4A priority Critical patent/CN111695550B/zh
Publication of CN111695550A publication Critical patent/CN111695550A/zh
Application granted granted Critical
Publication of CN111695550B publication Critical patent/CN111695550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种文字提取方法、图像处理设备和计算机可读存储介质。该方法包括:获取待提取图像;将待提取图像的每个像素点的R值、G值和B值调整为灰度值,生成灰度图像;获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像;根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取行文字图像;获取每个文字的宽度,根据每个文字的宽度获取行文字图像中的单个文字图像;提取单个文字图像中的待提取文字。通过上述方式,本发明能够有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。

Description

一种文字提取方法、图像处理设备和计算机可读存储介质
技术领域
本发明涉及图像处理领域,特别是涉及一种文字提取方法、图像处理设备和计算机可读存储介质。
背景技术
对于OCR(Optical Character Recognition,光学字符识别)来说,能否准确地对文字进行提取,是非常重要的一个环节。
目前针对文字提取中,首先完成行切分,然后再行切分出来基础上再做字的切分。对于行切分根据行与行的空白间隙处的水平积分投影理论值为0,而文字行的水平积分投影不为0的原理。对文字的各行进行水平投影积分而获取对应文字行位置。然后再每一行文字的基础上逐个切分文字。这里面有2个小的不足。一是对行的水平投影积分,需要做逻辑判断,占用计算资源和效率不高;二是对于文字的分割,对文字的切割宽度采用经验值,如果一个印刷体既有文字,又有数字,在默认文字切割宽度下就会进行反复手动调整,造成效率不高。
发明内容
本发明主要解决的技术问题是能够有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种文字提取方法,包括:获取待提取图像,所述待提取图像包括至少一行待提取文字行,每行所述待提取文字行包括至少一个待提取文字;将所述待提取图像的每个像素点的R、G和B值调整为灰度值,生成灰度图像;获取所述灰度图像中每个像素点的灰度像素值,将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值,将所述灰度像素值小于所述预设阈值的像素点赋予第二数值,生成二值图像;根据具有第一数值的像素点的行坐标对所述二值图像进行行提取,获取行文字图像;获取每个文字的宽度,根据所述每个文字的宽度获取所述行文字图像中的单个文字图像;提取所述单个文字图像中的所述待提取文字。
其中,所述将所述待提取图像的每个像素点的R、G和B值调整为灰度值的步骤,包括:为所述R值、G值和B值赋予不同的权重,将每个所述像素点的所述R值、G值和B值分别乘以各自的权重后相加,获取每个所述像素点的灰度值。
其中,所述获取所述灰度图像中每个像素点的灰度像素值的步骤之后,包括:采用OTSU算法计算出所述灰度图像的预设阈值。
其中,所述根据具有第一数值的像素点的行坐标对所述二值图像进行行提取的步骤,包括:获取所有具有第一数值的所述像素点的第一行坐标,统计所述第一行坐标在每一行的分布频数,根据所述分布频数生成分布向量;计算所述分布向量和单位向量的卷积,根据所述卷积获取每一行文字图像的初始行坐标。
其中,所述根据所述卷积获取每一行文字图像的初始行坐标的步骤,包括:获取所述卷积值为2时的第二行坐标,将所述第一行坐标除去所述第二行坐标获取第三行坐标,所述第三行坐标为所述每一行文字图像的初始坐标。
其中,所述获取每个文字的宽度的步骤,包括:获取每个所述行文字图像中文字的行高,根据所述行高获取所述行文字图像中所述每个文字的宽度。
其中,所述根据所述行高获取所述行文字图像中所述每个文字的宽度的步骤,包括:对所述二值图像进行行投影和列投影,分别获取所述至少一行待提取文字之间的行间距和每行待提取文字之间的字间距;获取行间距最小值和字间距最小值,根据所述行高、所述行间距最小值和所述字间距最小值计算出所述每个文字的宽度。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种图像处理设备,包括:获取图像模块,用于获取待提取图像,所述待提取图像包括至少一行待提取文字,每行所述待提取文字包括至少一个待提取文字;灰度模块,用于将所述待提取图像的R、G和B值调整为灰度值,生成灰度图像;二值模块,用于获取所述灰度图像中每个像素点的灰度像素值,将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值,将所述灰度像素值小于所述预设阈值的像素点赋予第二数值,生成二值图像;行图像提取模块,用于根据具有第一数值的像素点的行坐标对所述二值图像进行行提取,获取至少一个行文字图像;文字图像提取模块,用于获取每个文字的宽度,根据所述每个文字的宽度获取每个所述行文字图像中的单个文字图像;文字提取模块,用于提取所述单个文字图像中的所述待提取文字。
为解决上述技术问题,本发明采用的再一个技术方案是:提供一种图像处理设备,包括:处理器和存储器,所述处理器耦接所述存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如上所述的方法。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序能够被处理器执行以实现如上所述的方法。
本发明的有益效果是:区别于现有技术的情况,本发明将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的文字提取方法的第一实施例的流程示意图;
图2是本发明提供的文字提取方法的第二实施例的流程示意图;
图3是本发明提供的文字提取方法的第三实施例的流程示意图;
图4a为待提取图像的示意图;
图4b为灰度图像的示意图;
图4c为二值图像的示意图;
图4d为行文字图像的示意图;
图4e为提取出的单个文字图像的示意图;
图4f是提取结果的示意图;
图4g是行投影的示意图;
图4h是列投影的示意图;
图4i是投影间距的示意图;
图5是本发明提供的图像处理设备的第一实施例的结构示意图;
图6是本发明提供的图像处理设备的第二实施例的结构示意图;
图7是本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明提供的文字提取方法的第一实施例的流程示意图。本发明提供的文字提取方法包括如下步骤:
S101:获取待提取图像,待提取图像包括至少一行待提取文字行,每行待提取文字行包括至少一个待提取文字。
在一个具体的实施场景中,获取待提取图像,待提取图像中包括至少一行待提取文字行,每行待提取文字行包括至少一个待提取文字。待提取文字可以是中文、英文或者其他语言文字、字母、数字、标点符号等。在本实施场景中,请结合参阅图4a,图4a为待提取图像的示意图。
S102:将待提取图像每个像素点的R、G和B值调整为灰度值,生成灰度图像。
在具体的实施场景中,当调整待提取图像每个像素点的R值=G值=B值时,则待提取图像的色彩为一种灰度颜色,生成灰度图像,此时的R值=G值=B值=灰度值。灰度图像每个像素点只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。在本实施场景中,灰度值可以根据用户经验或者使用需求预先设置,或者可以根据预设的算法,结合R值、G值和B值进行运算。在本实施场景中,请结合参阅图 4b,图4b为灰度图像的示意图。
S103:获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像。
在一个具体的实施场景中,获取灰度图像中每个像素点的灰度像素值。预设阈值T,将灰度图像中的像素点分为灰度像素值大于或等于预设阈值T的第一像素点群和灰度像素值小于预设阈值T的第二像素点群,将第一像素点群中的像素点赋予第一数值,将第二像素点群中的像素点赋予第二数值,生成二值图像。请结合参阅图4c,图4c为二值图像的示意图。在本实施场景中,第一数值为1,第二数值为0,在其他实施场景中,第一数值和第二数值可以为其他不相等的任意值。
S104:根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取行文字图像。
在一个具体的实施场景中,获取所有具有第一数值的像素点的行坐标,或者可以获取第一像素点群中的所有像素点的行坐标,根据该行坐标对二值图像进行提取,获取行文字图像。例如,可以根据获取的行坐标进行统计,将出现概率较高的行坐标做为起点,提取这些行坐标对应的部分图像,或者删除概率较低的行坐标对应的部分图像,得到行文字图像。请结合参阅图4d,图4d为行文字图像的示意图。
S105:获取每个文字的宽度,根据每个文字的宽度获取每个行文字图像中的单个文字图像。
在一个具体的实施场景中,获取每个文字的宽度,确定行文字图像中每一行文字的初始位置,将该初始位置记为k1,将文字的宽度记为 wd_len,在每一行获取文字的初始位置k1到wd_len之间的所有列,从而实现对文字的提取。初始位置k1随着文字的宽度递增,获取行文字图像中的单个文字图像。请结合参阅图4e,图4e为提取出的单个文字图像的示意图。
S106:提取单个文字图像中的待提取文字。
在一个具体的实施场景中,提取每个单个文字图像中的待提取文字,具体地说,可以是采用神经网络或者文字识别等方法提取单个文字图像中的待提取文字。请结合参阅图4f,图4f是提取结果的示意图。
通过上述描述可知,在本实施例中,将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
请参阅图2,图2是本发明提供的文字提取方法的第二实施例的流程示意图。本发明提供的文字提取方法包括如下步骤:
S201:获取待提取图像,待提取图像包括至少一行待提取文字行,每行待提取文字行包括至少一个待提取文字。
在一个具体的实施场景中,本步骤与本发明提供的文字提取方法的第一实施例中的步骤S101基本一致,此处不再进行赘述。
S202:将每个像素点的R值、G值和B值分别乘以各自的权重后相加获取每个像素点的灰度值。
在一个具体的实施场景中,在生成灰度图像之前,需要先获取每个像素点需要调整至的灰度值,在本实施场景中,灰度值与待提取图像中该像素点的R值、G值和B值相关。
在本实施场景中,为R值、G值和B值赋予不同的权重,将每个像素点的R值、G值和B值分别乘以各自的权重后相加,获取每个像素点的灰度值。具体地,根据以下公式计算出每个像素点的灰度值:
Gray=0.3*R+0.59*G+0.11*B
其中,R为像素点的R值,G为像素点的G值,B为像素点的G值,Gray为像素点的灰度值。
在本实施场景中,根据浮点算法获取像素点的灰度值,在其他实施场景中,还可以根据其他算法获取像素点的灰度值。例如:
1.整数方法:Gray=(R*30+G*59+B*11)/100;
2.移位方法:Gray=(R*28+G*151+B*77)>>8;
3.平均值法:Gray=(R+G+B)/3;
4.仅取绿色:Gray=G。
S203:将待提取图像的每个像素点的R、G和B值调整为灰度值,生成灰度图像。
在一个具体的实施场景中,本步骤与本发明提供的文字提取方法的第一实施例中的步骤S102基本一致,此处不再进行赘述。
S204:采用OTSU算法计算出灰度图像的预设阈值。
在一个具体的实施场景中,在对图像进行二值化处理之前,采用 OTSU算法,计算出灰度图像的预设阈值。按图像的灰度特性,将图像分成背景和前景两部分。因方差是灰度分布均匀性的一种度量,背景和前景之间的类间方差越大,说明构成图像的两部分的差别越大,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。针对每一个图像用OTSU算法都会返回其特点的阈值,近似等于两个峰值之间的低谷。将该阈值作为预设阈值T。
在其他实施场景中,还可以采用其他方法获取预设阈值T,例如其他自适应阈值算法,或者有用户自行设置。
S205:获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像。
S206:根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取行文字图像。
S207:获取每个文字的宽度,根据每个文字的宽度获取行文字图像中的单个文字图像。
S208:提取单个文字图像中的待提取文字。
在一个具体的实施场景中,步骤S205-S208与本发明提供的文字提取方法的第一实施例中的步骤S103-S106基本一致,此处不再进行赘述。
通过上述描述可知,在本实施例中将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
请参阅图3,图3是本发明提供的文字提取方法的第三实施例的流程示意图。本发明提供的文字提取方法包括如下步骤:
S301:获取待提取图像,待提取图像包括至少一行待提取文字行,每行待提取文字行包括至少一个待提取文字。
S302:将每个像素点的R值、G值和B值分别乘以各自的权重后相加获取每个像素点的灰度值。
S303:将待提取图像的每个像素点的R、G和B值调整为灰度值,生成灰度图像。
S304:采用OTSU算法计算出灰度图像的预设阈值。
S305:获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像。
在一个具体的实施场景中,步骤S301-S305与本发明提供的文字提取方法的第二实施例中的步骤S201-S205基本一致,此处不再进行赘述。
S306:获取所有具有第一数值的像素点的第一行坐标,统计第一行坐标在每一行的分布频数,根据分布频数生成分布向量。
在一个具体的实施场景中,获取所有具有第一数值的像素点的第一行坐标,获取第一行坐标在各行的分布频数,例如,在二值图像中共有 100个具有第一数值的像素点,共有10行像素点,则若第2行有20个具有第一数值的像素点,第二行的频数为20%。根据改行的分布频数生成分布向量u。
S307:计算分布向量和单位向量的卷积,根据卷积获取每一行文字图像的初始行坐标。
在一个具体的实施场景中,新建单位向量v[1,1,1],计算向量u 和v的卷积w。在本实施场景中通过下列向量卷积计算公式进行计算:
Figure RE-GDA0002554794700000111
其中,w表示卷积,k表示第k个像素点(从1开始),假设向量u 的长度为m,向量v的长度为n,则j在max(1,k+1-n)和min(k,m)之间。
在结果w中获取w=2时的行坐标,即为行与行之间非重叠的位置,将第一行坐标除去第二行坐标获取第三行坐标,因此第三行坐标即为有效文字的每行的起始行坐标,从而实现对每行文字的提取。
S308:获取每个行文字图像中文字的行高,根据行高获取行文字图像中每个文字的宽度。
在一个具体的实施场景中,在获得行文字图像的基础上,需要进一步确定每行里面每一个文字的位置。因此,需要获取每行文字内每个文字的宽度和每行文字的行高,根据文字的宽度和行高,获取每一个文字的位置,从而进行切分,获取单个文字图像。
在本实施场景中,假设文字的宽度wd_len,文字的高度默认与所在行高wd_length一致。
在其他实施场景中,通过对二值图像进行行和列的文字积分投影, 根据行和列积分投影,获取行间距和列间距。请结合参阅图4g、图4h 和图4i,图4g是行投影的示意图,图4h是列投影的示意图,图4i是投影间距的示意图。
根据以下公式计算文字宽度:
wd_len=wd_len gth*(min(col_d)/min(row_d))
其中,wd_len是文字宽度,wd_length高度,col_d是列积分投影的间距,row_d是行积分投影的间距。
确定每一行文字的开始位置,第一个文字初始位置记为k1,在每一行获取文字的初始位置k1到wd_len之间的所有列,从而实现对单个文字图像的切分。初始位置k1随着文字的宽度递增,实现每行所有文字的提取。
S309:根据每个文字的宽度获取行文字图像中的单个文字图像。
S310:提取单个文字图像中的待提取文字。
在一个具体的实施场景中,步骤S309-S310与本发明提供的文字提取方法的第二实施例中的步骤S207-S208基本一致,此处不再进行赘述。
通过上述描述可知,在本实施例中统计第一行坐标在每一行的分布频数,根据分布频数生成分布向量,计算分布向量和单位向量的卷积,根据卷积获取每一行文字图像的初始行坐标,通过引入行和列的文字积分投影,根据行和列积分投影,获取行间距和列间距,根据行间距和列间距获取文字宽度,可以准确的获取单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
请参阅图5,图5是本发明提供的图像处理设备的第一实施例的结构示意图。图像处理设备10包括:获取图像模块11、灰度模块12、二值模块13、行图像提取模块14、文字图像提取模块15、文字提取模块 16。
获取图像模块11用于获取待提取图像,待提取图像包括至少一行待提取文字,每行待提取文字包括至少一个待提取文字。灰度模块12 用于将待提取图像的R、G和B值调整为灰度值,生成灰度图像。二值模块13用于获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像。行图像提取模块14用于根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取至少一个行文字图像。文字图像提取模块15用于获取每个文字的宽度,根据每个文字的宽度获取每个行文字图像中的单个文字图像。文字提取模块 16用于提取单个文字图像中的待提取文字。
灰度模块12还用于为R值、G值和B值赋予不同的权重,将每个像素点的R值、G值和B值分别乘以各自的权重后相加,获取每个像素点的灰度值。
二值模块13还用于采用OTSU算法计算出灰度图像的预设阈值。
行图像提取模块14还用于获取所有具有第一数值的像素点的第一行坐标,统计第一行坐标在每一行的分布频数,根据分布频数生成分布向量;计算分布向量和单位向量的卷积,根据卷积获取每一行文字图像的初始行坐标。
行图像提取模块14还用于获取卷积值为2时的第二行坐标,将第一行坐标除去第二行坐标获取第三行坐标,第三行坐标为每一行文字图像的初始坐标。
文字图像提取模块15还用于获取每个行文字图像中文字的行高,根据行高获取行文字图像中每个文字的宽度。
文字图像提取模块15还用于对二值图像进行行投影和列投影,分别获取至少一行待提取文字之间的行间距和每行待提取文字之间的字间距;获取行间距最小值和字间距最小值,根据行高、行间距最小值和字间距最小值计算出每个文字的宽度。
通过上述描述可知,在本实施例中图像处理设备将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
请参阅图6,图6是本发明提供的图像处理设备的第二实施例的结构示意图,图像处理设备20包括处理器21、存储器22。处理器21耦接存储器22。存储器22中存储有计算机程序,处理器21在工作时执行该计算机程序以实现如图1-图3所示的方法。详细的方法可参见上述,在此不再赘述。
通过上述描述可知,在本实施例中图像处理设备将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
请参阅图7,图7是本发明提供的计算机可读存储介质的一实施例的结构示意图。计算机可读存储介质30中存储有至少一个计算机程序 31,计算机程序31用于被处理器执行以实现如图1-图3所示的方法,详细的方法可参见上述,在此不再赘述。在一个实施例中,计算机可读存储介质30可以是终端中的存储芯片、硬盘或者是移动硬盘或者优盘、光盘等其他可读写存储的工具,还可以是服务器等等。
通过上述描述可知,在本实施例中计算机可读存储介质中的计算机程序可以用于将待提取图像进行灰度处理和二值化处理,获取二值图像,根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
区别于现有技术,本发明根据具有第一数值的像素点的行坐标最二值图像进行提取获取行文字图像,根据每个文字的宽度获取行文字图像中的单个文字图像,提取单个文字图像中的待提取文字,可以准确的获取行文字图像以及单个文字图像,从而有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种文字提取方法,其特征在于,包括:
获取待提取图像,所述待提取图像包括至少一行待提取文字行,每行所述待提取文字行包括至少一个待提取文字;
将所述待提取图像的每个像素点的R值、G值和B值调整为灰度值,生成灰度图像;
获取所述灰度图像中每个像素点的灰度像素值,将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值,将所述灰度像素值小于所述预设阈值的像素点赋予第二数值,生成二值图像;
根据具有第一数值的像素点的行坐标对所述二值图像进行行提取,获取行文字图像;
获取每个文字的宽度,根据所述每个文字的宽度获取所述行文字图像中的单个文字图像;
提取所述单个文字图像中的所述待提取文字。
2.根据权利要求1所述的方法,其特征在于,所述将所述待提取图像的每个像素点的R、G和B值调整为灰度值的步骤,包括:
为所述R值、G值和B值赋予不同的权重,将每个所述像素点的所述R值、G值和B值分别乘以各自的权重后相加,获取每个所述像素点的灰度值。
3.根据权利要求1所述的方法,其特征在于,所述获取所述灰度图像中每个像素点的灰度像素值的步骤之后,包括:
采用OTSU算法计算出所述灰度图像的预设阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据具有第一数值的像素点的行坐标对所述二值图像进行行提取的步骤,包括:
获取所有具有第一数值的所述像素点的第一行坐标,统计所述第一行坐标在每一行的分布频数,根据所述分布频数生成分布向量;
计算所述分布向量和单位向量的卷积,根据所述卷积获取每一行文字图像的初始行坐标。
5.根据权利要求4所述的方法,其特征在于,所述根据所述卷积获取每一行文字图像的初始行坐标的步骤,包括:
获取所述卷积值为2时的第二行坐标,将所述第一行坐标除去所述第二行坐标获取第三行坐标,所述第三行坐标为所述每一行文字图像的初始坐标。
6.根据权利要求1所述的方法,其特征在于,所述获取每个文字的宽度的步骤,包括:
获取每个所述行文字图像中文字的行高,根据所述行高获取所述行文字图像中所述每个文字的宽度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述行高获取所述行文字图像中所述每个文字的宽度的步骤,包括:
对所述二值图像进行行投影和列投影,分别获取所述至少一行待提取文字之间的行间距和每行待提取文字之间的字间距;
获取行间距最小值和字间距最小值,根据所述行高、所述行间距最小值和所述字间距最小值计算出所述每个文字的宽度。
8.一种图像处理设备,其特征在于,包括:
获取图像模块,用于获取待提取图像,所述待提取图像包括至少一行待提取文字,每行所述待提取文字包括至少一个待提取文字;
灰度模块,用于将所述待提取图像的R、G和B值调整为灰度值,生成灰度图像;
二值模块,用于获取所述灰度图像中每个像素点的灰度像素值,将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值,将所述灰度像素值小于所述预设阈值的像素点赋予第二数值,生成二值图像;
行图像提取模块,用于根据具有第一数值的像素点的行坐标对所述二值图像进行行提取,获取至少一个行文字图像;
文字图像提取模块,用于获取每个文字的宽度,根据所述每个文字的宽度获取每个所述行文字图像中的单个文字图像;
文字提取模块,用于提取所述单个文字图像中的所述待提取文字。
9.一种图像处理设备,其特征在于,包括:处理器和存储器,所述处理器耦接所述存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-7任一项所述的方法。
CN202010225359.4A 2020-03-26 2020-03-26 一种文字提取方法、图像处理设备和计算机可读存储介质 Active CN111695550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010225359.4A CN111695550B (zh) 2020-03-26 2020-03-26 一种文字提取方法、图像处理设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010225359.4A CN111695550B (zh) 2020-03-26 2020-03-26 一种文字提取方法、图像处理设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111695550A true CN111695550A (zh) 2020-09-22
CN111695550B CN111695550B (zh) 2023-12-08

Family

ID=72476291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010225359.4A Active CN111695550B (zh) 2020-03-26 2020-03-26 一种文字提取方法、图像处理设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111695550B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487696A (zh) * 2021-07-09 2021-10-08 北京百度网讯科技有限公司 电子地图生成方法、装置、电子设备及存储介质
CN113688838A (zh) * 2021-10-25 2021-11-23 江西软云科技股份有限公司 红色笔迹提取方法、系统、可读存储介质及计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100275111A1 (en) * 2009-04-28 2010-10-28 Perceptive Software, Inc. Automatic forms processing systems and methods
US20110255795A1 (en) * 2010-04-19 2011-10-20 Hiroshi Nakamura Apparatus and method for character string recognition
CN102314608A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 文字图像中行提取的方法和装置
CN104978576A (zh) * 2014-04-02 2015-10-14 阿里巴巴集团控股有限公司 一种文字识别方法及装置
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN109241962A (zh) * 2018-08-30 2019-01-18 云南电网有限责任公司普洱供电局 一种字符识别方法及装置
CN110807457A (zh) * 2019-10-12 2020-02-18 浙江大华技术股份有限公司 Osd字符识别方法、装置及存储装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100275111A1 (en) * 2009-04-28 2010-10-28 Perceptive Software, Inc. Automatic forms processing systems and methods
US20110255795A1 (en) * 2010-04-19 2011-10-20 Hiroshi Nakamura Apparatus and method for character string recognition
CN102314608A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 文字图像中行提取的方法和装置
CN104978576A (zh) * 2014-04-02 2015-10-14 阿里巴巴集团控股有限公司 一种文字识别方法及装置
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN109241962A (zh) * 2018-08-30 2019-01-18 云南电网有限责任公司普洱供电局 一种字符识别方法及装置
CN110807457A (zh) * 2019-10-12 2020-02-18 浙江大华技术股份有限公司 Osd字符识别方法、装置及存储装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邱立松等: "文本图像信息的提取与识别" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487696A (zh) * 2021-07-09 2021-10-08 北京百度网讯科技有限公司 电子地图生成方法、装置、电子设备及存储介质
CN113487696B (zh) * 2021-07-09 2023-09-22 北京百度网讯科技有限公司 电子地图生成方法、装置、电子设备及存储介质
CN113688838A (zh) * 2021-10-25 2021-11-23 江西软云科技股份有限公司 红色笔迹提取方法、系统、可读存储介质及计算机设备
CN113688838B (zh) * 2021-10-25 2022-03-22 江西软云科技股份有限公司 红色笔迹提取方法、系统、可读存储介质及计算机设备

Also Published As

Publication number Publication date
CN111695550B (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
US9251614B1 (en) Background removal for document images
WO2016065701A1 (zh) 图像文字识别方法及装置
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
WO2016068326A1 (ja) 画像処理装置、文字認識装置、画像処理方法、およびプログラム
CN111695550B (zh) 一种文字提取方法、图像处理设备和计算机可读存储介质
CN111461126B (zh) 文本行中的空格识别方法、装置、电子设备及存储介质
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
CN111368638A (zh) 电子表格的创建方法、装置、计算机设备和存储介质
WO2013136546A1 (ja) 画像処理装置、及び画像処理方法
US8259374B2 (en) Image processing apparatus and image forming apparatus
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
CN111611783B (zh) 一种图形表格的定位分割方法及装置
CN114550173A (zh) 图像预处理方法、装置、电子设备以及可读存储介质
JP4516940B2 (ja) 累積和基盤の変化点分析を利用した虹彩認識方法及びその装置
JP2003067738A (ja) 網点除去方法及びシステム
CN114267035A (zh) 一种文档图像处理方法、系统、电子设备及可读介质
CN110895849A (zh) 冠字号切割定位方法、装置、计算机设备及存储介质
CN111414919B (zh) 带表格印刷体图片文字提取方法、装置、设备及存储介质
CN111079756B (zh) 一种单据图像中的表格提取与重建方法和设备
CN113343866A (zh) 表格信息的识别方法及装置、电子设备
CN113076952A (zh) 一种文本自动识别和增强的方法及装置
CN111814780A (zh) 一种票据图像处理方法、装置、设备及存储介质
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
JP3845227B2 (ja) かすれ補正装置、かすれ補正方法および記録媒体
CN109117844B (zh) 一种密码确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231113

Address after: Building 31, Lianchuang Science and Technology Park, No. 21 Bulan Road, Xialilang Community, Nanwan Street, Longgang District, Shenzhen City, Guangdong Province, 518000, Building 1704-1706, Building 2, Building 301-302501-502

Applicant after: SHENZHEN ELOAM TECHNOLOGY CO.,LTD.

Address before: 1405-008, 14th floor, shining building, 35 Xueyuan Road, Haidian District, Beijing

Applicant before: Telephase technology development (Beijing) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant