CN111401352B - 文本图片下划线识别方法、装置、计算机设备及存储介质 - Google Patents

文本图片下划线识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111401352B
CN111401352B CN202010173523.1A CN202010173523A CN111401352B CN 111401352 B CN111401352 B CN 111401352B CN 202010173523 A CN202010173523 A CN 202010173523A CN 111401352 B CN111401352 B CN 111401352B
Authority
CN
China
Prior art keywords
result
underline
key information
initial
straight lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010173523.1A
Other languages
English (en)
Other versions
CN111401352A (zh
Inventor
郑泽重
范有文
谭江龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Original Assignee
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd filed Critical Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority to CN202010173523.1A priority Critical patent/CN111401352B/zh
Publication of CN111401352A publication Critical patent/CN111401352A/zh
Application granted granted Critical
Publication of CN111401352B publication Critical patent/CN111401352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明涉及文本图片下划线识别方法、装置、计算机设备及存储介质,该方法包括获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;对中间结果进行拓展和信息获取,以得到下划线对应的关键信息;反馈下划线对应的关键信息,以进行文本内容识别。本发明实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。

Description

文本图片下划线识别方法、装置、计算机设备及存储介质
技术领域
本发明涉及图片识别方法,更具体地说是指文本图片下划线识别方法、装置、计算机设备及存储介质。
背景技术
随着信息技术的飞速发展,图片和视频数据量快速增长。对于海量图片或视频帧来说,根据画面中是否包含文本内容,可分类为文本图片和非文本图片。对于文本图片来讲,其包括的文本内容通常携带丰富的信息,是辅助理解和认知图片的重要信息来源,所以文本内容作为一个重要线索在诸如图片搜索、人机交互和盲人辅助系统等场景中被广泛挖掘和应用。
对于有些带有关键信息标注的文本图片而言,在其进行文本内容识别的过程中,会涉及到将这些关键信息标注对应的文本内容进行单独提取,以减短文本内容识别所花费的时间,现有技术一般或者使用OPENCV识别出文本图片中的直线等标注,但是并没有根据实际场景对这些标注进行扩展识别和处理,导致后续文本内容识别的效率较低,而且采用现有技术识别的效率也不高,且准确率较低。
因此,有必要设计一种新的方法,实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。
发明内容
本发明的目的在于克服现有技术的缺陷,提供文本图片下划线识别方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:文本图片下划线识别方法,包括:
获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;
对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;
对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;
对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;
反馈下划线对应的关键信息,以进行文本内容识别。
其进一步技术方案为:所述初始识别结果包括线段。
其进一步技术方案为:所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果,包括:
根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。
其进一步技术方案为:所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果,包括:
对所述初始过滤结果进行重复直线的去除,以得到单线结果;
根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
其进一步技术方案为:所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息,包括:
对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;
对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;
对合并结果进行向左延伸,以得到延伸结果;
根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。
其进一步技术方案为:所述对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果,包括:
获取所述拓展结果中所有直线的像素坐标;
筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
其进一步技术方案为:所述对合并结果进行向左延伸,以得到延伸结果,包括:
获取所述合并结果中的直线对应的像素点;
从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
本发明还提供了文本图片下划线识别装置,包括:
初始获取单元,用于获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;
过滤单元,用于对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;
去除单元,用于对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;
拓展单元,用于对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;
发送单元,用于反馈下划线对应的关键信息,以进行文本内容识别。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过对使用OPENCV对文本图片的识别结果进行长度和范围的过滤后,再进行重复直线和印章范围内的直线的去除,并拓展直线、合并直线以及延伸直线至文本图片内的关键信息下方均有直线,并对下方有直线的图块进行关键信息的获取,反馈获取到的关键信息,以便于进行文本识别,实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文本图片下划线识别方法的流程示意图;
图2为本发明实施例提供的文本图片下划线识别方法的子流程示意图;
图3为本发明实施例提供的文本图片下划线识别方法的子流程示意图;
图4为本发明实施例提供的文本图片下划线识别方法的子流程示意图;
图5为本发明实施例提供的文本图片下划线识别方法的子流程示意图;
图6为本发明实施例提供的文本图片下划线识别装置的示意性框图;
图7为本发明实施例提供的文本图片下划线识别装置的去除单元的示意性框图;
图8为本发明实施例提供的文本图片下划线识别装置的拓展单元的示意性框图;
图9为本发明实施例提供的文本图片下划线识别装置的合并子单元的示意性框图;
图10为本发明实施例提供的文本图片下划线识别装置的延伸子单元的示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的文本图片下划线识别方法的示意性流程图。该文本图片下划线识别方法应用于服务器中。
图1是本发明实施例提供的文本图片下划线识别方法的流程示意图。如图1所示,该方法包括以下步骤S110至S150。
S110、获取使用OPENCV对文本图片的识别结果,以得到初始识别结果。
在本实施例中,所述初始识别结果包括线段。
具体地,根据霍夫曼变换的原理使用OPENCV对文本图片进行直线的识别。OpenCV是一个基于BSD许可发行的跨平台计算机视觉库。
S120、对初始识别结果进行长度和范围的过滤,以得到初始过滤结果。
在本实施例中,初始过滤结果是指长度以及位置符合要求的线段,在本实施例中,初始过滤结果是直线。
具体地,根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。
初始识别结果中有大量文字部分被识别为线段,故而只保留一定长度内和图片中一定位置范围内的横线,设置一定位置范围的下值和上值和直线长度阈值,超出这个位置范围和/或直线长度阈值的横线将会被过滤。
S130、对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果。
在本实施例中,中间结果是指在某一位置只有一条且不存在印章范围内的直线。
在一实施例中,请参阅图2,上述的步骤S130可包括步骤S131~S132。
S131、对所述初始过滤结果进行重复直线的去除,以得到单线结果。
在本实施例中,单线结果是指不存在重复直线的直线集合。
初始过滤结果中有大量的直线重复堆砌在一定的位置范围区间内,可以采用OpenCV过滤这个位置范围区间内重复的直线,只保留一条直线。
S132、根据HSV(色调饱和度明度,Hue Saturation Value)色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
部分印章上的直线无法直接被设定的长度阈值过滤,故而根据HSV色彩空间识别过滤红色印章范围内的直线,直线一般都是单一的颜色,通常为黑色,因此可以采用色彩差距将处于红色印章范围内的直线过滤,以得到处于非红色印章范围内的直线。
S140、对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息。
在本实施例中,下划线对应的关键信息包括中间结果拓展后形成的直线的上方对应的文字信息,一般包括授权书图片中的人名、手机、邮箱等信息。
在一实施例中,请参阅图3,上述的步骤S140可包括步骤S141~S144。
S141、对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果。
在本实施例中,拓展结果是指直线完全延伸至可获取到所有关键信息的下方。
根据文本图片背景的平均灰度值,以此设定直线的灰度值范围,比如文本图片背景的平均灰度值为18%,则可以说设定直线的灰度值范围为88%~100%,虽然直线的颜色是黑色,但是由于是在文本图片背景的衬托下会有一些偏差,因此,需要根据实际情况设定直线的灰度值范围,根据该灰度值范围便可定位到中间结果的两侧直线,根据两侧直线的位置以及关键信息所在的图块的边界线判断中间结果是否已经拓展到足够获取所有关键信息的程度,也就是所有关键信息的下方均有直线的存在,以此提高整个下划线识别的准确率,对于由于拍摄等原因导致下方直线模糊的关键信息也就可以清楚地被定位到,其中,关键信息为授权书图片中的人名、手机、邮箱等信息。
S142、对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果。
在本实施例中,合并结果是指同一关键信息下的多段直线合并形成的一条直线。
在一实施例中,请参阅图4,上述的步骤S142可包括步骤S1421~S1422。
S1421、获取所述拓展结果中所有直线的像素坐标。
拓展结果中的直线都是明确的,因此可以快速获取到像素坐标。
S1422、筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
根据同个关键信息下的多条直线在图片中的像素坐标进行判断,多条直线在纵坐标上相差不多,并且依次的横坐标的数值相差不大,就可以认为是在同一个关键信息下的直线,可以使用黑色像素填充多个直线之间的间断部分,以此完成直线的合并。
S143、对合并结果进行向左延伸,以得到延伸结果。
在本实施例中,延伸结果是指将直线延伸至关键信息前端的文字位置,比如文本图片上的是“姓名:李某某”,如果直接利用合并结果获取下划线对应的关键信息,则出来的会是李某某,但是这样子的信息并不能准确地进行识别,因此,需要将直线向左进行延伸,延伸至姓名的下方也有直线的存在,这才可以算是能够准确获取关键信息的字段的位置。
在一实施例中,请参阅图5,上述的步骤S143可包括步骤S1431~S1432。
S1431、获取所述合并结果中的直线对应的像素点;
S1432、从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
关键信息前的字段描述后一般有部分的空白,然后才是横线和横线上的关键信息,如“姓名:__________”,姓名这个词之前会有一个空白的字节。延伸主要是像素在识别到的直线的位置开始,从该像素点向着左边进行搜索,检测上方一定区域内的图块,这些图块高度与一个字体汉字所占像素高度大致相同,然后根据的图片中的描述的特点,例如描述的长度最长为4个汉字的像素宽度,就可以从直线的最左端开始使用黑色的像素块来填充到左边属于空白字节且整体长度为4个汉字的像素宽度的位置,此时“姓名:______”经过延伸后会变成“姓名:”。
S144、根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。
在本实施例中,下划线对应的关键信息是指延伸结果中的直线上方的关键信息。
根据延伸结果得知直线的所在位置和长度等信息后,便可对应截取该直线上方的关键信息的字段。
S150、反馈下划线对应的关键信息,以进行文本内容识别。
针对性地对于文本图片进行关键信息的下划线识别和处理,并且处理结果能进而使用在文本图片关键信息文字的解析上。
上述的文本图片下划线识别方法,通过对使用OPENCV对文本图片的识别结果进行长度和范围的过滤后,再进行重复直线和印章范围内的直线的去除,并拓展直线、合并直线以及延伸直线至文本图片内的关键信息下方均有直线,并对下方有直线的图块进行关键信息的获取,反馈获取到的关键信息,以便于进行文本识别,实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。
图6是本发明实施例提供的一种文本图片下划线识别装置300的示意性框图。如图6所示,对应于以上文本图片下划线识别方法,本发明还提供一种文本图片下划线识别装置300。该文本图片下划线识别装置300包括用于执行上述文本图片下划线识别方法的单元,该装置可以被配置于服务器中。具体地,请参阅图6,该文本图片下划线识别装置300包括初始获取单元301、过滤单元302、去除单元303、拓展单元304以及发送单元305。
初始获取单元301,用于获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;过滤单元302,用于对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;去除单元303,用于对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;拓展单元304,用于对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;发送单元305,用于反馈下划线对应的关键信息,以进行文本内容识别。
在一实施例中,如图7所示,所述去除单元303包括重复直线去除子单元3031以及印章直线去除子单元3032。
重复直线去除子单元3031,用于对所述初始过滤结果进行重复直线的去除,以得到单线结果;印章直线去除子单元3032,用于根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
在一实施例中,如图8所示,所述拓展单元304包括直线拓展子单元3041、合并子单元3042、延伸子单元3043以及字段获取子单元3044。
直线拓展子单元3041,用于对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;合并子单元3042,用于对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;延伸子单元3043,用于对合并结果进行向左延伸,以得到延伸结果;字段获取子单元3044,用于根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。
在一实施例中,如图9所示,所述合并子单元3042包括坐标获取模块30421以及筛选模块30422。
坐标获取模块30421,用于获取所述拓展结果中所有直线的像素坐标;筛选模块30422,用于筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
在一实施例中,如图10所示,所述延伸子单元3043包括像素点获取子单元30431以及填充处理子单元30432。
像素点获取子单元30431,用于获取所述合并结果中的直线对应的像素点;填充处理子单元30432,用于从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述文本图片下划线识别装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述文本图片下划线识别装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种文本图片下划线识别方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种文本图片下划线识别方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;反馈下划线对应的关键信息,以进行文本内容识别。
其中,所述初始识别结果包括线段。
在一实施例中,处理器502在实现所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果步骤时,具体实现如下步骤:
根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。
在一实施例中,处理器502在实现所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果步骤时,具体实现如下步骤:
对所述初始过滤结果进行重复直线的去除,以得到单线结果;根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
在一实施例中,处理器502在实现所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息步骤时,具体实现如下步骤:
对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;对合并结果进行向左延伸,以得到延伸结果;根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。
在一实施例中,处理器502在实现所述对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果步骤时,具体实现如下步骤:
获取所述拓展结果中所有直线的像素坐标;筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
在一实施例中,处理器502在实现所述对合并结果进行向左延伸,以得到延伸结果步骤时,具体实现如下步骤:
获取所述合并结果中的直线对应的像素点;从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;反馈下划线对应的关键信息,以进行文本内容识别。
其中,所述初始识别结果包括线段。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果步骤时,具体实现如下步骤:
根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果步骤时,具体实现如下步骤:
对所述初始过滤结果进行重复直线的去除,以得到单线结果;根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息步骤时,具体实现如下步骤:
对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;对合并结果进行向左延伸,以得到延伸结果;根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果步骤时,具体实现如下步骤:
获取所述拓展结果中所有直线的像素坐标;筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对合并结果进行向左延伸,以得到延伸结果步骤时,具体实现如下步骤:
获取所述合并结果中的直线对应的像素点;从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.文本图片下划线识别方法,其特征在于,包括:
获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;
对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;
对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;
对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;
反馈下划线对应的关键信息,以进行文本内容识别;
所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息,包括:
对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;
对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;
对合并结果进行向左延伸,以得到延伸结果;
根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息;
所述对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果,包括:
获取所述拓展结果中所有直线的像素坐标;
筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
2.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述初始识别结果包括线段。
3.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果,包括:
根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。
4.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果,包括:
对所述初始过滤结果进行重复直线的去除,以得到单线结果;
根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。
5.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对合并结果进行向左延伸,以得到延伸结果,包括:
获取所述合并结果中的直线对应的像素点;
从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。
6.文本图片下划线识别装置,其特征在于,包括:
初始获取单元,用于获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;
过滤单元,用于对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;
去除单元,用于对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;
拓展单元,用于对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;
发送单元,用于反馈下划线对应的关键信息,以进行文本内容识别;
所述拓展单元包括直线拓展子单元、合并子单元、延伸子单元以及字段获取子单元;
直线拓展子单元,用于对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;合并子单元,用于对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;延伸子单元,用于对合并结果进行向左延伸,以得到延伸结果;字段获取子单元,用于根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息;
所述合并子单元包括坐标获取模块以及筛选模块;
坐标获取模块,用于获取所述拓展结果中所有直线的像素坐标;筛选模块,用于筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至5中任一项所述的方法。
CN202010173523.1A 2020-03-13 2020-03-13 文本图片下划线识别方法、装置、计算机设备及存储介质 Active CN111401352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010173523.1A CN111401352B (zh) 2020-03-13 2020-03-13 文本图片下划线识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010173523.1A CN111401352B (zh) 2020-03-13 2020-03-13 文本图片下划线识别方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111401352A CN111401352A (zh) 2020-07-10
CN111401352B true CN111401352B (zh) 2023-10-20

Family

ID=71434484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010173523.1A Active CN111401352B (zh) 2020-03-13 2020-03-13 文本图片下划线识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111401352B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418204A (zh) * 2020-11-18 2021-02-26 杭州未名信科科技有限公司 基于纸质文档的文本识别方法、系统及计算机介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446274A (zh) * 2010-09-30 2012-05-09 汉王科技股份有限公司 带有下划线的文本图像预处理方法和装置
US10169650B1 (en) * 2017-06-30 2019-01-01 Konica Minolta Laboratory U.S.A., Inc. Identification of emphasized text in electronic documents
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN110020692A (zh) * 2019-04-13 2019-07-16 南京红松信息技术有限公司 一种基于印刷体模板的手写体分离与定位方法
CN110619642A (zh) * 2019-09-05 2019-12-27 四川大学 一种票据图像中印章与背景文字分离方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446274A (zh) * 2010-09-30 2012-05-09 汉王科技股份有限公司 带有下划线的文本图像预处理方法和装置
US10169650B1 (en) * 2017-06-30 2019-01-01 Konica Minolta Laboratory U.S.A., Inc. Identification of emphasized text in electronic documents
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN110020692A (zh) * 2019-04-13 2019-07-16 南京红松信息技术有限公司 一种基于印刷体模板的手写体分离与定位方法
CN110619642A (zh) * 2019-09-05 2019-12-27 四川大学 一种票据图像中印章与背景文字分离方法

Also Published As

Publication number Publication date
CN111401352A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN109670500B (zh) 一种文字区域获取方法、装置、存储介质及终端设备
EP3401842B1 (en) Text image processing method and apparatus
CN104616021B (zh) 交通标志图像处理方法及装置
US7965894B2 (en) Method for detecting alterations in printed document using image comparison analyses
JP5455038B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN110781877B (zh) 一种图像识别方法、设备及存储介质
CN111274957A (zh) 网页页面验证码识别方法、装置、终端和计算机存储介质
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
CN116228746B (zh) 缺陷检测方法、装置、电子设备、存储介质和程序产品
CN111401352B (zh) 文本图片下划线识别方法、装置、计算机设备及存储介质
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN108268868B (zh) 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN110598575B (zh) 表格版面分析与提取方法及相关装置
EP2919149A2 (en) Image processing apparatus and image processing method
JP2016053763A (ja) 画像処理装置、画像処理方法及びプログラム
JP2007072642A (ja) 画像処理装置および画像処理装置の制御方法
CN112580594A (zh) 文档识别方法、装置、计算机设备和存储介质
KR101473713B1 (ko) 문자 인식 장치 및 방법
CN111178340B (zh) 图像识别方法及图像识别模型的训练方法
JP2012222581A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
CN106934814B (zh) 一种基于图像的背景信息识别方法及装置
CN111340677A (zh) 视频水印检测方法、装置、电子设备、计算机可读介质
JP4253265B2 (ja) 影検出装置、影検出方法及び影検出プログラム、影検出装置を用いた画像処理装置、影検出方法を用いた画像処理方法及び影検出プログラムを用いた画像処理プログラム
WO2017088478A1 (zh) 数字分离方法及装置
JP2002074358A (ja) 道路抽出画像処理装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant