CN113780265B - 英文单词的空格识别方法、装置、存储介质及计算机设备 - Google Patents
英文单词的空格识别方法、装置、存储介质及计算机设备 Download PDFInfo
- Publication number
- CN113780265B CN113780265B CN202111086602.XA CN202111086602A CN113780265B CN 113780265 B CN113780265 B CN 113780265B CN 202111086602 A CN202111086602 A CN 202111086602A CN 113780265 B CN113780265 B CN 113780265B
- Authority
- CN
- China
- Prior art keywords
- english
- interval
- column
- determining
- pixel points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims description 58
- 230000006399 behavior Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Character Discrimination (AREA)
Abstract
本发明公开了一种英文单词的空格识别方法、装置、计算机设备和存储介质,涉及信息技术领域,主要在于能够提高英文单词的空格识别精度。其中方法包括:将英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;根据各列像素点对应的列像素值,确定所述英文图像中存在的各个英文间隔;确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;根据所述间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。本发明适用于对英文单词的空格进行识别。
Description
技术领域
本发明涉及信息技术领域,尤其是涉及一种英文单词的空格方法、装置、存储介质及计算机设备。
背景技术
随着社会的不断发展,很多传统情境下需要依赖人工来完成的工作正在逐步由机器所替代,其中不乏一些枯燥的重复性任务,既无法满足劳动者积累经验创造价值的初心,同时也是对人力资源的极大浪费,如采用机器学习的方式对图像资料中的英文单词进行识别,取代传统的人为识别英文单词的方式。
目前,通常通过光学字符识别系统对英文图像中的英文单词进行识别来获取英文文本。然而,英文识别与中文识别有所不同,英文是以词作为基本单位的语言,这种光学字符的识别方式无法有效识别英文单词之间的空格,即对英文空格识别的准确度较低,由此可能会导致识别出来的英文单词连接在一起,使英文文本失去可读性。
发明内容
本发明提供了一种英文单词的空格识别方法、装置、存储介质及计算机设备,主要在于能够提高英文单词的空格识别精度。
根据本发明的第一个方面,提供一种英文单词的空格识别方法,包括:
获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
根据本发明的第二个方面,提供一种英文单词的空格识别装置,包括:
求和单元,用于获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
确定单元,用于从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
计算单元,用于根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
判定单元,用于确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
根据本发明提供的一种英文单词的空格识别方法、装置、存储介质及计算机设备,与目前通过光学字符识别系统对英文图像中英文单词进行识别来获取英文文本的方式相比,本发明通过将英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;并从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;与此同时,根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,进而计算所述各个英文间隔对应的间隔长度;最终确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格,由此通过确定英文图像中存在的各个英文间隔及其对应的间隔长度,能够依据该间隔长度,判定各个英文间隔是否为英文单词之间的空格,从而能够提高英文单词之间空格的识别精度,进而能够避免识别出来的英文单词连接在一起,使英文文本失去可读性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种英文单词的空格识别方法流程图;
图2示出了本发明实施例提供的另一种英文单词的空格识别方法流程图;
图3示出了本发明实施例提供的一种英文单词的空格识别装置的结构示意图;
图4示出了本发明实施例提供的另一种英文单词的空格识别装置的结构示意图;
图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
目前,通过光学字符识别系统对英文图像中的英文单词进行识别来获取英文文本的方式,无法有效识别英文单词之间的空格,即对英文空格识别的准确度较低,由此可能会导致识别出来的英文单词连接在一起,使英文文本失去可读性。
为了解决上述问题,本发明实施例提了一种英文单词的空格识别方法,如图1所示,所述方法包括:
101、获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
其中,待识别的英文图像为仅包含一行英文文字的图像,其对应的二值化像素矩阵可以是一个长度为w,宽度为h的矩阵,为了克服现有技术中对英文空格识别准确度较低的缺陷,本发明实施例利用英文单词的空格识别系统,计算英文图像在水平方向上不同位置处的各列像素点对应的列像素值,并根据不同位置处的列像素值,确定英文图像中存在的各个英文间隔,最终基于各个英文间隔对应的间隔长度,判定各个英文间隔是否为英文单词之间的空格,从而能够提高英文空格识别的精度。本发明实施例主要应用于对英文单词空格进行识别的场景,本发明实施例的执行主体为能够对英文单词空格进行识别的装置或者设备,具体可以设置在客户端或者服务器一侧。
具体地,对英文图像进行检测识别后,得到英文图像对应的识别结果,该英文图像在进行检测识别的过程中已经被剪裁成仅包含一行英文的图像了,例如,若一个英文图像中包含10行英文,为了便于识别,需要将所述的英文图像裁剪成10个英文图像,每个英文图像中仅包含一行英文,之后将经过检测识别的英文图像和识别结果一同输入至英文单词的空格识别系统进行空格识别,在具体进行空格识别之前,英文单词的空格识别系统首先会根据输入的识别结果,判断是否为英文,如果为英文,则对英文图像对应的像素矩阵进行灰度处理和二值化处理,得到英文图像对应的二值化像素矩阵,同时为了便于后续对英文单词之间的空格进行识别,需要判断所述英文图像是否为黑底白字的英文图像,若所述英文图像不是黑底白字的英文图像,需要将其转化为黑底白字的英文图像。
进一步地,将所述转化后的英文图像对应的二值化像素矩阵沿矩阵的纵列方向进行求和,得到二值化像素矩阵中各列像素点对应的列像素值,并将所述各列像素值记录至二维列表中,并根据二维列表中的各列像素值,确定英文图像中存在的各个英文间隔,进而根据各个英文间隔对应的间隔长度,判定各个英文间隔是否为英文单词之间的空格。需要说明的是,本申请中的英文图像对应的二值化像素矩阵也可以为白底黑字的像素矩阵,本申请不做具体限定。
102、从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔。
具体地,理想情况下,各个英文间隔位置对应的列像素值应为0,实际应用中为了避免噪声影响,取一个预设列像素值作为各个英文间隔对应的列像素值,若列像素值小于或等于该预设列像素值,则说明该列像素值对应的一列像素点很可能是背景色像素,这一列像素点即为目标列像素点,若列像素值大于该预设列像素值,则说明该列像素值对应的一列像素点很可能不是背景色像素,进一步地,检查各列像素值中是否存在连续的小于预设列像素值的目标列像素点,若存在,则将连续的目标列像素点进行合并,作为一个英文间隔,同时将单独的小于所述预设列像素值的目标列像素点也作为一个英文间隔。
103、根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度。
对于本发明实施例,如果英文间隔是由相邻的目标列像素点合并来的,则合并后的目标列像素点中第一列像素点对应的列信息即为英文间隔对应的起始位置信息,合并后的目标列像素点中最后一列像素点对应的列信息即为英文间隔对应的终止位置信息,若所述英文间隔是由单独的列像素点确定的,则所述单独的列像素点对应的列信息即为该英文间隔对应的起始位置信息和终止位置信息,根据英文间隔对应的起始位置信息和终止位置信息,确定各个英文间隔对应的间隔长度,并根据间隔长度,判断各个英文间隔是否为英文单词之间的空格,提高了英文单词之间空格的识别精度,能够避免识别出来的英文单词连接在一起,使英文文本失去可读性。
104、确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
对于本发明实施例,首先,确定各个间隔长度中的最小间隔长度和最大间隔长度,并计算所述最小间隔长度和所述最大间隔长度的比值,若该比值小于预设比值,则确定各个英文间隔为英文单词之间的空格或者英文字符之间的间隔,进一步地,当具体判断各个英文间隔属于英文单词之间的空格还是英文字符之间的间隔时,需要计算各个英文间隔与最小英文间隔之间的第一距离和与最大英文间隔之间的第二距离,并根据第一距离和第二距离,判断所述各个英文间隔是否为英文单词之间的空格。
进一步地,若所述最小间隔长度和所述最大间隔长度的比值大于或等于所述预设比值,则步骤104中的根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格,具体方法包括:若所述比值大于或者等于预设比值,则将所述各个英文间隔对应的间隔长度相加,得到英文间隔总长度,并将所述英文图像对应的长度与所述英文间隔总长度相减,得到英文字符总长度;基于所述英文间隔总长度和所述英文字符长度,分别计算所述各个英文间隔对应的第一平均长度,以及所述英文图像中各个英文字符对应的第二平均长度;将所述第一平均长度和所述第二平均长度相除,得到平均长度比;若所述平均长度比大于或者等于预设长度比,则确定所述各个英文间隔均为英文单词之间的空格;若所述平均长度比小于所述预设长度比,则确定所述各个英文间隔均为英文字符之间的间隔。
其中,第一平均长度为英文间隔总长度与英文间隔数量的比值,第二平均长度为英文字符总长度与英文字符数量的比值。
对于本发明实施例,若各个英文间隔对应的间隔长度中最小间隔长度与最大间隔长度的比值大于或等于预设比值,则确定各个英文间隔都属于英文字符之间的间隔或各个英文间隔都属于英文单词之间的空格,若待识别英文图像中仅包含一个英文单词,则出现各个英文间隔都属于英文字符之间的间隔的情况,若待识别英文图像中的英文单词由于字体或连写等原因,各个英文字符之间不存在间隔,则会出现各个英文间隔都属于英文单词之间的空格的情况,为了具体区分各个英文间隔属于英文字符之间的间隔还是属于英文单词之间的空格,具体方法为,将各个英文间隔对应的间隔长度相加,得到英文间隔总长度,并用英文间隔总长度除以英文间隔的数量,得到平均英文间隔长度,即各个英文间隔对应的第一平均长度,与此同时,用英文图像对应的长度减去所述英文间隔总长度,得到英文字符总长度,之后用英文字符总长度除以英文字符的数量,得到平均英文字符长度,即所述英文图像中各个英文字符对应的第二平均长度,最终用第一平均长度除以第二平均长度,得到平均长度比,若该平均长度比大于或等于预设阈值,则确定所述各个英文间隔均为英文单词之间的空格,若该平均长度比小于预设阈值,则确定所述各个英文间隔均为英文字符之间的间隔。通过利用英文间隔对应的间隔长度来判断英文间隔是否属于英文单词之间空格的方法,提高了英文单词空格识别的精度。
根据本发明提供的一种英文单词的空格识别方法,与目前通过光学字符识别系统对英文图像中英文单词进行识别来获取英文文本的方式相比,本发明通过将英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;并从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;与此同时,根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,进而计算所述各个英文间隔对应的间隔长度;最终确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格,由此通过确定英文图像中存在的各个英文间隔及其对应的间隔长度,能够依据该间隔长度,判定各个英文间隔是否为英文单词之间的空格,从而能够提高英文单词之间空格的识别精度,进而能够避免识别出来的英文单词连接在一起,使英文文本失去可读性。
进一步的,为了更好的说明上述对英文单词的空格识别过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种英文单词的空格识别方法,如图2所示,所述方法包括:
201、获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
对于本发明实施例,为了便于后续对英文单词之间的空格进行识别,在将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值之前,需要判断英文图像具体是白底黑字的英文图像还是黑底白字的英文图像,如果所述英文图像是白底黑字的英文图像,需要将白底黑字的英文图像转化为黑底白字的英文图像,传统判断英文图像是白底黑字的图像还是黑底白字的图像的方法为,判断英文图像四个顶点是否为0,或计算图像矩阵中为0的像素点的数量与不为0的像素点的数量之比,这两种方法虽然在大部分情况下有效,但仍具有较大的局限性,例如,若一个黑底白字的英文图像矩阵中出现四个顶点中有三个不是背景色像素,即是文字,而非一般情况中的背景色像素,容易造成误判,另一方面,若该英文图像中的字体较粗,英文单词部分占比大于背景色像素占比,而非一般情况中的背景色像素占比过半,同样容易造成误判。
具体地,本发明实施列中为了准确判断英文图像具体是白底黑字的英文图像还是黑底白字的英文图像,避免传统判断方法造成误判的问题,所述方法包括:分别确定所述二值化像素矩阵中第一行为0的像素点数量和不为0的像素点数量,以及最后一行为0的像素点数量和不为0的像素点数量;将所述第一行为0的像素点数量和所述最后一行为0的像素点数量相加,得到所述二值化像素矩阵中首尾行为0的像素点的第一总数量;将所述第一行不为0的像素点数量和所述最后一行不为0的像素点数量相加,得到所述二值化像素矩阵中首尾行不为0的像素点的第二总数量;计算所述第一总数量和所述第二总数量的比值,若所述比值小于预设比值,则判定所述英文图像为白底黑字的英文图像,并将所述白底黑字的英文图像转化为黑底白字的英文图像。
对于本发明实施例,本发明实施例中的预设英文单词的空格识别系统中包含了一种更具普适性的预设判断机制,该判断机制依据英文字符上下并非对称的原则,首先,将二值化像素矩阵中第一行为0的数量与最后一行为0的数量进行相加,得到首尾行为0的总数量,同时将第一行不为0的数量与最后一行不为0的数量进行相加,得到首尾行不为0的总数量,然后将首尾行为0的总数量除以首尾行不为0的总数量,得到比值,若所述比值大于或等于预设比值,则判断所述英文图像为黑底白字的英文图像,若所述比值小于预设比值,则确定所述英文图像为白底黑字的英文图像,若所述英文图像为白底黑字的英文图像,则需要将所述白底黑字的英文图像转化为黑底白字的英文图像,得到转化后的黑底白字的英文图像,进一步地,对于本发明实施例,为了基于所述转化后的英文图像,计算各列像素点对应的列像素值,步骤201具体包括:将转化后的英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
具体地,本实施例中的二值化像素矩阵可以是长度为w,宽度为h的二维矩阵,将转化为黑底白字的英文图像对应的二值化像素矩阵沿矩阵的纵列方向进行求和,得到二值化像素矩阵对应的列像素值,并将所述各列像素值按照顺序依次记录在长度为w的二维列表中,得到各列像素点对应的列信息,并利用二维列表中记录的各列像素值及各列像素点对应的列信息,确定英文图像中存在的各个英文间隔,进而根据各个英文间隔对应的间隔长度,判定各个英文间隔是否为英文单词之间的空格。
202、从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔。
对于本发明实施例,各个英文间隔对应的一列像素点应为背景色像素,同时英文图像中的背景色像素对应的列像素值应为0,但在实际应用中,为了避免噪声影响,将背景色像素对应的列像素值设为一个较小的像素值,即预设列像素值,依次遍历整个二维列表,若二维列表中的列像素值小于或等于预设列像素值,则说明该列像素值对应的一列像素点很可能是背景色像素,这一列像素点即为目标列像素点,并将二维列表中该列像素值标记为false,若列像素值大于预设列像素值,则说明该列像素值对应的一列像素点很可能不是背景色像素,将二维列表中该列像素值标记为true,进一步地,遍历整个二维列表,若二维列表中出现两个或两个以上的false相连续,则将连续false对应的列像素点进行合并,作为一个英文间隔,同时将单独标记为false的一列像素点也作为一个英文间隔。需要说明的是,本发明实施例不仅仅局限于用falseh和true对列像素值进行标记,也可以采用其他字母或数字等对列像素值进行标记。
203、根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度。
对于本发明实施例,为了确定各个英文间隔对应的起始位置信息和终止位置信息,所述方法包括:获取所述合并后的目标列像素点中第一列像素点对应的列信息和最后一列像素点对应的列信息;将所述第一列像素点对应的列信息确定为所述合并后的目标列像素点对应的起始列信息,并将所述最后一列像素点对应的列信息确定为所述合并后的目标列像素点对应的终止列信息;将所述起始列信息和所述终止列信息分别确定为所述合并后的目标列像素点对应的英文间隔的起始位置信息和终止位置信息;将所述未进行合并的目标列像素点对应的列信息确定为所述未进行合并的目标列像素点对应的英文间隔的起始位置信息和终止位置信息。
对于本发明实施例,如果英文间隔是由相邻的目标列像素点合并来的,则需要确定合并后的目标列像素点中第一列像素点对应的列信息,并将第一列像素点对应的列信息确定为合并后的目标像素点的起始列信息,同理确定最后一列像素点对应的列信息,并将最后一列像素点对应的列信息确定为合并后的目标像素点的终止列信息,根据该起始列信息和终止列信息,能够确定英文间隔对应的起始位置信息和终止位置信息,例如,某个英文间隔包括两个连续被标记为false的列像素值,两个连续被标记为false的列像素值中第一列像素点对应的列信息为5,最后一列像素点对应的列信息为6,由此可以确定该英文间隔对应的起始位置信息为5,终止位置信息为6,如果英文间隔是单独的一列像素点,则英文间隔对应的起始位置信息和终止位置信息均是该列像素点对应的列信息,最终将确定的各个英文间隔对应的起始位置信息和终止位置信息记录在间隔位置信息表中。
进一步地,由于本发明实施例中的空格识别仅发生在英文文字内部,因此在确定各个英文间隔对应的起始位置信息和终止位置信息之后,需要对英文图像进行边缘切割,确保英文文字的两端与英文图像边缘之间不再存在英文间隔,具体方法包括:确定所述各个英文间隔中第一个英文间隔对应的起始位置信息,以及最后一个英文间隔对应的终止位置信息;若所述起始位置信息为0,则确定所述第一个英文间隔为英文文本与所述英文图像左侧边缘之间的间隔,将所述第一个英文间隔舍弃;若所述终止位置信息为目标位置信息,则确定所述最后一个英文间隔为所述英文文本与所述英文图像右侧边缘之间的间隔,将所述最后一个英文间隔舍弃。
其中,若所述英文图像对应的像素矩阵是长度为w的矩阵,则目标位置信息即为w-1,对于本发明实施例,从间隔位置信息列表中获取第一个英文间隔对应的起位置信息,如果该起始位置信息为0,说明第一个英文间隔是英文文字与英文图像左侧边缘之间的间隔,将该英文间隔舍弃,进一步地,从间隔位置信息列表中获取最后一个英文间隔对应的终止位置信息,如果该终止位置信息为w-1,说明最后一个英文间隔是英文文字与图像右侧边缘之间的间隔,将该英文间隔舍弃,由此实现了对英文图像的边缘切割,并根据边缘切割后的英文间隔对应的起始位置信息和终止位置信息,计算各个英文间隔对应的间隔长度,具体计算方法为:将所述终止位置信息和所述起始位置信息相减后加1,得到所述各个英文间隔对应的间隔长度。
例如,进行边缘切割后的某个英文间隔对应的起始位置信息为2,终止位置信息为5,则将所述终止位置信息与所述起始位置信息相减后加1,得到4,所述4即为该英文间隔对应的间隔长度,根据上述方法能够计算各个英文间隔对应的间隔长度,最终根据各个英文间隔对应的间隔长度,判断各个英文间隔是否为英文单词之间的空格。
204、确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值。
对于本发明实施例,各个英文间隔可能属于英文单词之间的空格和英文字符之间的间隔,同时各个英文间隔也可能只属于英文单词之间的空格,或者只属于英文字符之间的间隔,为了确定所述各个英文间隔是否为英文单词之间的空格,需要获得各个英文间隔长度中的最大间隔长度和最小间隔长度,并将所述最小间隔长度与所述最大间隔长度相除,得到比值,并根据所述比值,判断各个英文间隔是否为英文单词之间的空格。
205、若所述比值小于预设比值,则分别计算所述各个英文间隔与所述最小英文间隔之间的第一距离,以及所述各个英文间隔与所述最大英文间隔之间的第二距离。
对于本发明实施例,若各个英文间隔中的最小间隔长度与最大间隔长度的比值小于预设阈值,则确定各个英文间隔为英文单词之间的空格或者为英文字符之间的间隔,之后分别计算各个英文间隔与最小英文间隔之间的第一距离,和各个英文间隔与最大英文间隔之间的第二距离,最终根据所述第一距离和所述第二距离,确定各个英文间隔是否为英文单词之间的空格。
206、若所述各个英文间隔中目标英文间隔对应的第一距离大于或等于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文单词之间的空格。
其中,目标英文间隔对应的第一距离是所述目标英文间隔与最小英文间隔之间的距离,目标英文间隔对应的第二距离是所述目标英文间隔与最大英文间隔之间的距离,对于本发明实施例,因为英文单词之间的空格比英文字符之间的间隔大,所以为了确定各个英文间隔是英文单词之间的空格,还是英文字符之间的间隔,需要判断各个英文间隔与最小英文间隔靠近,还是与最大英文间隔靠近,具体判断方法为,若各个英文间隔中目标英文间隔与最小英文间隔之间的距离大于或等于所述目标英文间隔与最大英文间隔之间的距离,即目标英文间隔与最大英文间隔更靠近,则确定所述目标英文间隔为英文单词之间的空格。
207、若所述目标英文间隔对应的第一距离小于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文字符之间的间隔。
对于本发明实施例,若各个英文间隔中目标英文间隔与最小英文间隔之间的距离小于所述目标英文间隔与最大英文间隔之间的距离,即目标英文间隔与最小英文间隔靠近,则确定所述目标英文间隔为英文字符之间的间隔。
例如,各个英文间隔的间隔长度为[2,3,4,10,11,12],其中,最大英文间隔对应的间隔长度的值为12,最小英文间隔对应的间隔长度的值为2,那么具体判断目标英文间隔属于英文单词之间的空格还是英文字符之间的间隔的过程如下:若目标英文间隔对应的间隔长度的值为2,那么通过计算得到2-2=0,即目标英文间隔与最小英文间隔的距离是0,与此同时,通过计算得到12-2=10,即目标英文间隔与最大英文间隔的距离是10,因为0<10,因此目标英文间隔为英文字符之间的间隔,按照上述方法可知,若目标英文间隔对应的间隔长度的值为3或4,则判断所述目标英文间隔为英文字符之间的间隔,若目标英文间隔对应的间隔长度的值为10,那么通过计算得到10-2=8,即目标英文间隔与最小英文间隔的距离是8,与此同时,通过计算得到12-10=2,即目标英文间隔与最大英文间隔的距离是2,因为2<8,因此目标英文间隔为英文单词之间的空格,按照上述方法可知,若目标英文间隔对应的间隔长度的值为11或12,则判断所述目标英文间隔为英文单词之间的空格。
进一步地,为了提高英文单词空格识别的准确度,在确定各个英文间隔是否为英文单词之间的空格之后,所述方法还包括:确定所述英文图像中存在的空格数量和英文字符数量;将所述英文字符数量与所述空格数量相除,得到数量比;若所述数量比小于预设数量比,则确定识别出的空格无效;若所述数量比大于或者等于预设数量比,则确定识别出的空格有效,基于所述空格对应的起始位置信息和终止位置信息,对所述英文图像进行切割,并对切割后的英文图像中的英文单词进行识别,将识别出的英文单词通过空格拼接在一起,生成所述英文图像对应的英文文本。
对于本发明实施例,在确定英文单词之间的空格之后,需要确定英文图像中英文单词之间空格的数量和英文字符的数量,并将所述英文单词之间空格的数量除以英文字符的数量,将其相除得到的比值与预设数量比进行比较,若所述比值小于预设数量比,则确定识别出的英文单词之间的空格是无效的,例如,英文图像中含有10个英文字符,通过对英文图像进行英文单词的空格识别,得到该英文图像对应的英文单词之间的空格数量为5个,则平均每个英文单词仅有两个英文字符组成,这种情况缺乏合理性,所以对该英文图像识别出的英文单词之间的空格视为无效,与此同时,若该比值大于或等于预设数量比,则证明该英文单词之间的空格是有效且合理的,对于识别到的有效的英文单词之间的空格,使用间隔位置信息列表中记录的英文单词之间的空格的起始位置信息和终止位置信息的均值,按照顺序对输入的英文图像进行分割,将分割后的英文单词加入到待识别列表中,然后利用光学字符识别系统对待识别列表中的分割后的英文单词进行重新识别,并将分割后的各个英文单词之间加入空格拼接在一起,生成最终的英文图像识别结果。
根据本发明提供的另一种英文单词的空格识别方法,与目前通过光学字符识别系统对英文图像中英文单词进行识别来获取英文文本的方式相比,本发明通过将英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;并从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;与此同时,根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,进而计算所述各个英文间隔对应的间隔长度;最终确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格,由此通过确定英文图像中存在的各个英文间隔及其对应的间隔长度,能够依据该间隔长度,判定各个英文间隔是否为英文单词之间的空格,从而能够提高英文单词之间空格的识别精度,进而能够避免识别出来的英文单词连接在一起,使英文文本失去可读性。
进一步地,作为图1的具体实现,本发明实施例提供了一种英文单词的空格识别装置,如图3所示,所述装置包括:第一求和单元31、第一确定单元32、计算单元33和判定单元34。
所述第一求和单元31,可以用于获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
所述第一确定单元32,可以用于从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔。
所述计算单元33,可以用于根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度。
所述判定单元34,可以用于确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
在具体应用场景中,为了确定所述英文图像是否为黑底白字的英文图像,如图4所示,所述装置还包括:第二确定单元35、第二求和单元36、第三求和单元37、第一相除单元38。
所述第二确定单元35,可以用于分别确定所述二值化像素矩阵中第一行为0的像素点数量和不为0的像素点数量,以及最后一行为0的像素点数量和不为0的像素点数量。
所述第二求和单元36,可以用于将所述第一行为0的像素点数量和所述最后一行为0的像素点数量相加,得到所述二值化像素矩阵中首尾行为0的像素点的第一总数量。
所述第三求和单元37,可以用于将所述第一行不为0的像素点数量和所述最后一行不为0的像素点数量相加,得到所述二值化像素矩阵中首尾行不为0的像素点的第二总数量。
所述第一相除单元38,可以用于计算所述第一总数量和所述第二总数量的比值,若所述比值小于预设比值,则判定所述英文图像为白底黑字的英文图像,并将所述白底黑字的英文图像转化为黑底白字的英文图像。
在具体应用场景中,所述第一求和单元31具体可以用于将转化后的英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
在具体应用场景中,为了确定各个英文间隔对应的起始位置信息和终止位置信息,所述装置还包括:第三确定单元39和舍弃单元40。
所述第三确定单元39,可以用于确定所述各个英文间隔中第一个英文间隔对应的起始位置信息,以及最后一个英文间隔对应的终止位置信息。
所述舍弃单元40,可以用于若所述起始位置信息为0,则确定所述第一个英文间隔为英文文本与所述英文图像左侧边缘之间的间隔,将所述第一个英文间隔舍弃。
所述舍弃单元40,还可以用于若所述终止位置信息为目标位置信息,则确定所述最后一个英文间隔为所述英文文本与所述英文图像右侧边缘之间的间隔,将所述最后一个英文间隔舍弃。
在具体应用场景中,为了计算各个英文间隔对应的间隔长度,所述计算单元33,包括获取模块331、第一确定模块332、第二确定模块333和相减模块334。
所述获取模块331,可以用于获取所述合并后的目标列像素点中第一列像素点对应的列信息和最后一列像素点对应的列信息。
所述第一确定模块332,可以用于将所述第一列像素点对应的列信息确定为所述合并后的目标列像素点对应的起始列信息,并将所述最后一列像素点对应的列信息确定为所述合并后的目标列像素点对应的终止列信息。
所述第一确定模块332,具体可以用于将所述起始列信息和所述终止列信息分别确定为所述合并后的目标列像素点对应的英文间隔的起始位置信息和终止位置信息。
所述第二确定模块333,可以用于将所述未进行合并的目标列像素点对应的列信息确定为所述未进行合并的目标列像素点对应的英文间隔的起始位置信息和终止位置信息。
所述相减模块334,可以用于将所述终止位置信息和所述起始位置信息相减后加1,得到所述各个英文间隔对应的间隔长度。
在具体应用场景中,为了判断各个英文间隔是否为英文单词之间的空格,所述判定单元34,包括第一计算模块341和第三确定模块342。
所述第一计算模块341,可以用于若所述比值小于预设比值,则分别计算所述各个英文间隔与所述最小英文间隔之间的第一距离,以及所述各个英文间隔与所述最大英文间隔之间的第二距离。
第三确定模块342,可以用于若所述各个英文间隔中目标英文间隔对应的第一距离大于或等于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文单词之间的空格。
所述第三确定模块342,还可以用于若所述目标英文间隔对应的第一距离小于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文字符之间的间隔。
在具体应用场景中,为了判断各个英文间隔是否为英文单词之间的空格,所述判定单元34,还包括相加模块343,第二计算模块344,相除模块345和第四确定模块346。
所述相加模块343,可以用于若所述比值大于或者等于预设比值,则将所述各个英文间隔对应的间隔长度相加,得到英文间隔总长度,并将所述英文图像对应的长度与所述英文间隔总长度相减,得到英文字符总长度。
所述第二计算模块344,可以用于基于所述英文间隔总长度和所述英文字符长度,分别计算所述各个英文间隔对应的第一平均长度,以及所述英文图像中各个英文字符对应的第二平均长度。
所述相除模块345,可以用于将所述第一平均长度和所述第二平均长度相除,得到平均长度比。
所述第四确定模块346,可以用于若所述平均长度比大于或者等于预设长度比,则确定所述各个英文间隔均为英文单词之间的空格。
所述第四确定模块346,还可以用于若所述平均长度比小于所述预设长度比,则确定所述各个英文间隔均为英文字符之间的间隔。
在具体应用场景中,为了判断识别出的英文单词之间的空格是否有效,所述装置还包括:第四确定单元41、第二相除单元42、第五确定单元43和切割单元44。
所述第四确定单元41,可以用于确定所述英文图像中存在的空格数量和英文字符数量。
所述第二相除单元42,可以用于将所述英文字符数量与所述空格数量相除,得到数量比。
所述第五确定单元43,可以用于若所述数量比小于预设数量比,则确定识别出的空格无效。
所述切割单元44,可以用于若所述数量比大于或者等于预设数量比,则确定识别出的空格有效,基于所述空格对应的起始位置信息和终止位置信息,对所述英文图像进行切割,并对切割后的英文图像中的英文单词进行识别,将识别出的英文单词通过空格拼接在一起,生成所述英文图像对应的英文文本。
需要说明的是,本发明实施例提供的一种英文单词的空格识别装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器51、存储器52、及存储在存储器52上并可在处理器上运行的计算机程序,其中,存储器52和处理器51均设置在总线53上所述处理器51执行所述程序时实现以下步骤:获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格。
通过本发明的技术方案,本发明通过将英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;并从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;与此同时,根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,进而计算所述各个英文间隔对应的间隔长度;最终确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值,根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格,由此通过确定英文图像中存在的各个英文间隔及其对应的间隔长度,能够依据该间隔长度,判定各个英文间隔是否为英文单词之间的空格,从而能够提高英文单词之间空格的识别精度,进而能够避免识别出来的英文单词连接在一起,使英文文本失去可读性。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (8)
1.一种英文单词的空格识别方法,其特征在于,包括:
获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值;
若所述比值小于预设比值,则分别计算所述各个英文间隔与所述最小间隔长度之间的第一距离,以及所述各个英文间隔与所述最大间隔长度之间的第二距离;若所述各个英文间隔中目标英文间隔对应的第一距离大于或等于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文单词之间的空格;若所述目标英文间隔对应的第一距离小于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文字符之间的间隔;
若所述比值大于或者等于预设比值,则将所述各个英文间隔对应的间隔长度相加,得到英文间隔总长度,并将所述英文图像对应的长度与所述英文间隔总长度相减,得到英文字符总长度;基于所述英文间隔总长度和所述英文字符长度,分别计算所述各个英文间隔对应的第一平均长度,以及所述英文图像中各个英文字符对应的第二平均长度;将所述第一平均长度和所述第二平均长度相除,得到平均长度比;若所述平均长度比大于或者等于预设长度比,则确定所述各个英文间隔均为英文单词之间的空格;若所述平均长度比小于所述预设长度比,则确定所述各个英文间隔均为英文字符之间的间隔。
2.根据权利要求1所述的方法,其特征在于,在所述将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值之前,所述方法还包括:
分别确定所述二值化像素矩阵中第一行为0的像素点数量和不为0的像素点数量,以及最后一行为0的像素点数量和不为0的像素点数量;
将所述第一行为0的像素点数量和所述最后一行为0的像素点数量相加,得到所述二值化像素矩阵中首尾行为0的像素点的第一总数量;
将所述第一行不为0的像素点数量和所述最后一行不为0的像素点数量相加,得到所述二值化像素矩阵中首尾行不为0的像素点的第二总数量;
计算所述第一总数量和所述第二总数量的比值,若所述比值小于预设比值,则判定所述英文图像为白底黑字的英文图像,并将所述白底黑字的英文图像转化为黑底白字的英文图像;
所述将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值,包括:
将转化后的英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息之后,所述方法还包括:
确定所述各个英文间隔中第一个英文间隔对应的起始位置信息,以及最后一个英文间隔对应的终止位置信息;
若所述起始位置信息为0,则确定所述第一个英文间隔为英文文本与所述英文图像左侧边缘之间的间隔,将所述第一个英文间隔舍弃;
若所述终止位置信息为目标位置信息,则确定所述最后一个英文间隔为所述英文文本与所述英文图像右侧边缘之间的间隔,将所述最后一个英文间隔舍弃。
4.根据权利要求1所述的方法,其特征在于,所述根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度,包括:
获取所述合并后的目标列像素点中第一列像素点对应的列信息和最后一列像素点对应的列信息;
将所述第一列像素点对应的列信息确定为所述合并后的目标列像素点对应的起始列信息,并将所述最后一列像素点对应的列信息确定为所述合并后的目标列像素点对应的终止列信息;
将所述起始列信息和所述终止列信息分别确定为所述合并后的目标列像素点对应的英文间隔的起始位置信息和终止位置信息;
将所述未进行合并的目标列像素点对应的列信息确定为所述未进行合并的目标列像素点对应的英文间隔的起始位置信息和终止位置信息;
将所述终止位置信息和所述起始位置信息相减后加1,得到所述各个英文间隔对应的间隔长度。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述比值和所述各个间隔长度,判定所述各个英文间隔是否为英文单词之间的空格之后,所述方法还包括:
确定所述英文图像中存在的空格数量和英文字符数量;
将所述英文字符数量与所述空格数量相除,得到数量比;
若所述数量比小于预设数量比,则确定识别出的空格无效;
若所述数量比大于或者等于预设数量比,则确定识别出的空格有效,基于所述空格对应的起始位置信息和终止位置信息,对所述英文图像进行切割,并对切割后的英文图像中的英文单词进行识别,将识别出的英文单词通过空格拼接在一起,生成所述英文图像对应的英文文本。
6.一种英文单词的空格识别装置,其特征在于,包括:
求和单元,用于获取待识别的英文图像,将所述英文图像对应的二值化像素矩阵沿纵列方向进行求和,得到所述二值化像素矩阵中各列像素点对应的列像素值;
确定单元,用于从所述各列像素点中确定所述列像素值小于预设列像素值的目标列像素点,根据所述目标列像素点对应的列信息,将相邻的目标列像素点进行合并,根据合并后的目标列像素点和未进行合并的目标列像素点,确定所述英文图像中存在的各个英文间隔;
计算单元,用于根据所述合并后的目标列像素点对应的起始列信息和终止列信息,以及所述未进行合并的目标列像素点对应的列信息,确定所述各个英文间隔对应的起始位置信息和终止位置信息,根据所述起始位置信息和所述终止位置信息,计算所述各个英文间隔对应的间隔长度;
判定单元,用于:确定各个间隔长度中的最大间隔长度和最小间隔长度,并计算所述最小间隔长度与所述最大间隔长度的比值;
若所述比值小于预设比值,则分别计算所述各个英文间隔与所述最小间隔长度之间的第一距离,以及所述各个英文间隔与所述最大间隔长度之间的第二距离;若所述各个英文间隔中目标英文间隔对应的第一距离大于或等于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文单词之间的空格;若所述目标英文间隔对应的第一距离小于所述目标英文间隔对应的第二距离,则确定所述目标英文间隔为英文字符之间的间隔;
若所述比值大于或者等于预设比值,则将所述各个英文间隔对应的间隔长度相加,得到英文间隔总长度,并将所述英文图像对应的长度与所述英文间隔总长度相减,得到英文字符总长度;基于所述英文间隔总长度和所述英文字符长度,分别计算所述各个英文间隔对应的第一平均长度,以及所述英文图像中各个英文字符对应的第二平均长度;将所述第一平均长度和所述第二平均长度相除,得到平均长度比;若所述平均长度比大于或者等于预设长度比,则确定所述各个英文间隔均为英文单词之间的空格;若所述平均长度比小于所述预设长度比,则确定所述各个英文间隔均为英文字符之间的间隔。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111086602.XA CN113780265B (zh) | 2021-09-16 | 2021-09-16 | 英文单词的空格识别方法、装置、存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111086602.XA CN113780265B (zh) | 2021-09-16 | 2021-09-16 | 英文单词的空格识别方法、装置、存储介质及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780265A CN113780265A (zh) | 2021-12-10 |
CN113780265B true CN113780265B (zh) | 2023-12-15 |
Family
ID=78851471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111086602.XA Active CN113780265B (zh) | 2021-09-16 | 2021-09-16 | 英文单词的空格识别方法、装置、存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780265B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH056459A (ja) * | 1990-10-01 | 1993-01-14 | Fuji Facom Corp | 単語間スペース検出方法 |
JPH0567237A (ja) * | 1991-05-13 | 1993-03-19 | Hitachi Eng Co Ltd | 空白認識方法、空白認識装置、文字認識装置、英日翻 訳装置 |
JPH09167206A (ja) * | 1995-12-18 | 1997-06-24 | Ricoh Co Ltd | 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法 |
JP2013097561A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム |
CN107133622A (zh) * | 2016-02-29 | 2017-09-05 | 阿里巴巴集团控股有限公司 | 一种单词的分割方法和装置 |
CN110096980A (zh) * | 2019-04-20 | 2019-08-06 | 东莞中科蓝海智能视觉科技有限公司 | 字符检测识别系统 |
CN111461126A (zh) * | 2020-03-23 | 2020-07-28 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
CN111639646A (zh) * | 2020-05-18 | 2020-09-08 | 山东大学 | 一种基于深度学习的试卷手写英文字符识别方法及系统 |
-
2021
- 2021-09-16 CN CN202111086602.XA patent/CN113780265B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH056459A (ja) * | 1990-10-01 | 1993-01-14 | Fuji Facom Corp | 単語間スペース検出方法 |
JPH0567237A (ja) * | 1991-05-13 | 1993-03-19 | Hitachi Eng Co Ltd | 空白認識方法、空白認識装置、文字認識装置、英日翻 訳装置 |
JPH09167206A (ja) * | 1995-12-18 | 1997-06-24 | Ricoh Co Ltd | 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法 |
JP2013097561A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム |
CN107133622A (zh) * | 2016-02-29 | 2017-09-05 | 阿里巴巴集团控股有限公司 | 一种单词的分割方法和装置 |
CN110096980A (zh) * | 2019-04-20 | 2019-08-06 | 东莞中科蓝海智能视觉科技有限公司 | 字符检测识别系统 |
CN111461126A (zh) * | 2020-03-23 | 2020-07-28 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
CN111639646A (zh) * | 2020-05-18 | 2020-09-08 | 山东大学 | 一种基于深度学习的试卷手写英文字符识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113780265A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10817741B2 (en) | Word segmentation system, method and device | |
CN109522816B (zh) | 表格识别方法及装置、计算机存储介质 | |
CN112528813B (zh) | 表格识别方法、装置以及计算机可读存储介质 | |
CN111340037B (zh) | 文本版面分析方法、装置、计算机设备和存储介质 | |
US9183636B1 (en) | Line segmentation method | |
CN108734161B (zh) | 冠字号区域的识别方法、装置、设备及存储介质 | |
CN108830275B (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN112686134B (zh) | 手写识别方法、装置、电子设备和存储介质 | |
CN113505781B (zh) | 目标检测方法、装置、电子设备及可读存储介质 | |
CN112069991A (zh) | 一种pdf的表格信息提取方法及相关装置 | |
CN116311214B (zh) | 车牌识别方法和装置 | |
CN111507337A (zh) | 基于混合神经网络的车牌识别方法 | |
CN113780265B (zh) | 英文单词的空格识别方法、装置、存储介质及计算机设备 | |
CN101901333B (zh) | 文本图像中切分词的方法及使用该方法的识别装置 | |
US10970848B2 (en) | Font family and size aware character segmentation | |
CN113762455A (zh) | 检测模型训练方法、单字检测方法、装置、设备及介质 | |
CN112084103A (zh) | 界面测试方法、装置、设备和介质 | |
CN112699634B (zh) | 电子书的排版处理方法、电子设备及存储介质 | |
CN110895849A (zh) | 冠字号切割定位方法、装置、计算机设备及存储介质 | |
CN115565193A (zh) | 问卷信息录入方法、装置、电子设备及存储介质 | |
EP3832544A1 (en) | Visually-aware encodings for characters | |
CN107085849B (zh) | 一种图像二值化处理方法、装置、设备和存储介质 | |
CN110826488B (zh) | 一种针对电子文档的图像识别方法、装置及存储设备 | |
CN109409370B (zh) | 一种远程桌面字符识别方法和装置 | |
CN112434700A (zh) | 车牌识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |