CN112529014A - 直线检测方法、信息提取方法、装置、设备及存储介质 - Google Patents

直线检测方法、信息提取方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112529014A
CN112529014A CN202011478759.2A CN202011478759A CN112529014A CN 112529014 A CN112529014 A CN 112529014A CN 202011478759 A CN202011478759 A CN 202011478759A CN 112529014 A CN112529014 A CN 112529014A
Authority
CN
China
Prior art keywords
straight line
detection
line
straight
document picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011478759.2A
Other languages
English (en)
Other versions
CN112529014B (zh
Inventor
熊军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011478759.2A priority Critical patent/CN112529014B/zh
Publication of CN112529014A publication Critical patent/CN112529014A/zh
Application granted granted Critical
Publication of CN112529014B publication Critical patent/CN112529014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种图像检测技术,揭露了一种直线检测方法、信息提取方法、装置、设备及存储介质,直线检测方法包括:获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。本发明能够提高直线检测的准确性。

Description

直线检测方法、信息提取方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种直线检测方法、信息提取方法、装置、设备及存储介质。
背景技术
文档(例如,报告单、票据、清单)在计算机中可以以图片的形式存储,目前可以采用多种方法对文档图片进行结构化信息提取。以报告单为例,目标是要提取出报告单中每个基础项(key)对应的相应的指标(value)。常用的提取方法是根据检测算法得出文字的位置信息,根据位置信息提取基础项及对应的指标。
当拍摄或扫描角度不正确时,会导致文档图片中的文字存在一定角度倾斜,基础项与指标可能会错行。因此为了准确提取出基础项与指标,必须知道文字倾斜的斜率。目前计算文字倾斜的斜率的方法包括以下两种:1、采用基于每行的文字的位置拟合出一条直线得出斜率,但该方法依赖于检测出的文字位置,如果某个文字没有检测出来,容易导致斜率计算不准确。2、通过对图的处理得到目标的边界点集合,然后利用霍夫变换提取目标边界上的直线;但该方法用霍夫变换检测出的直线非常多,且直线呈现断断续续的状态,无法确定哪些文字使用哪些直线进行检测,准确性有待提高。
发明内容
本发明的目的在于提供一种直线检测方法、信息提取方法、装置、设备及存储介质,旨在提高直线检测的准确性。
本发明提供一种直线检测方法,包括:
获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
本发明还提供一种信息提取方法,包括:
获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线;
采用预定的文字检测算法检测所述文档图片,得到所述文档图片中各个文字块分别对应的各条待分析直线;
基于各条待分析直线分析相邻的两两文字块是否处于同一行;
若是,对于处于同一行的文字块,计算所述处于同一行的文字块中任一文字块的中心点坐标到各条检测直线的距离;
获取距离最小对应的检测直线,基于距离最小对应的检测直线对所述处于同一行的文字块进行检测,提取所述文档图片中的结构化信息。
本发明还提供一种直线检测装置,包括:
检测模块,用于获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
剔除模块,用于获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
过滤模块,用于分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
本发明还提供一种计算机设备,所述计算机设备包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的直线检测方法的步骤,或者实现如上述的信息提取方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的直线检测方法的步骤,或者实现如上述的信息提取方法的步骤。
本发明的有益效果是:本发明首先采用霍夫直线检测方法检测文档图片得到较多的直线,然后将长度小于预设第一阈值的短直线进行剔除,以将对于检测意义不大的短直线过滤,最后分别获取文档图片中剩余的各条直线对应的截距,基于截距对剩余的各条直线进行过滤处理,通过分析截距再对剩余的较长的直线进行进一步的过滤,得到文档图片的检测直线。本发明基于霍夫直线检测方法检测直线,再采用基于截距分析的后处理策略进行进一步过滤直线,最终得到的直线不仅避免多直线造成的干扰,还具有更高的准确性,有利于后续提取文档图片中的结构化信息。
附图说明
图1为本发明直线检测方法一实施例的流程示意图;
图2为图1中的步骤S3的细化流程示意图;
图3为本发明信息提取方法一实施例的流程示意图;
图4为本发明直线检测装置一实施例的结构示意图;
图5为本发明信息提取装置一实施例的结构示意图;
图6为本发明计算机设备一实施例的硬件架构的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明直线检测方法一实施例的流程示意图。该直线检测方法包括以下步骤:
步骤S1,获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
文档图片例如为医疗报告单,发票,清单等。获取上传的文档图片,对文档图片进行灰度化并进行自适应二值化处理,二值化处理后,文档图片中的背景为黑色,文字为白色。进一步地,为了去除文档图片中文字的干扰,采用形态学的方法提取出直线,具体地,对二值化后的文档图片设置腐蚀区及膨胀区为一个较大的横向直条,例如设置腐蚀的kernel=(cols//10,1),其中cols为图片的宽度width,先腐蚀再膨胀处理,再对处理后的文档图片进行霍夫直线检测。
其中,霍夫直线检测原理是:通过从直角坐标系到极坐标系的转换,将直角坐标系中的一条直线,转换为极坐标系上的一个点,落到这条直线上的像素点越多,这个极坐标中点的权越重,最终通过分析各个点的权重,获取重要线段。进行霍夫直线检测时,得出的是每条直线的起始点与终点坐标,根据起始点与终点坐标计算出直线的斜率及截距,最终得到直线y=kx+b。经霍夫直线检测后,得出的直线的数量较多且直线呈断断续续的状态,因此,需要进行进一步处理。
步骤S2,获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
通过上述的起始点与终点坐标可以计算直线的长度。短直线有些可能是由于背景或噪声等其他因素形成的,一般对于检测的意义不大。对于小于预设的第一阈值的直线进行剔除,即对相对较短的部分直线进行剔除,保留相对较长的直线,以去除短直线的干扰,利于后续对直线的处理,提高处理速度。
步骤S3,分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
对于剩余的各条较长的直线,计算每条直线的截距(即直线y=kx+b中当x=0时y的值),通过分析截距再对保留的较长的直线进行进一步的过滤,得到置信度高的直线。本实施例中,通过霍夫直线检测方法检测得到的直线经过过滤较短直线后,剩下较长直线,其斜率一般相差不大,如果截距相差较大,可以确定这两条直线不相似。
进一步地,如图2所示,上述步骤S3具体包括:
步骤A,在所述剩余的各条直线中,获取长度最大的直线,将除了所述长度最大的直线外的其他直线作为待处理直线;
步骤B,计算所述长度最大的直线的截距分别与各待处理直线的截距的差值,分析各个差值是否小于预设的第二阈值;
步骤C,若有所述差值小于预设的第二阈值,则将所述差值小于预设的第二阈值对应的待处理直线过滤;
步骤D1,在分析完各个差值后,将所述长度最大的直线作为所述检测直线输出;
步骤D2,分析剩余的待处理直线的数量是否为0,若是,则进入步骤E,否则进入步骤D3;
步骤D3,在经过滤后剩余的待处理直线中获取长度最大的直线,返回所述步骤B中进行新一轮的直线过滤;
步骤E,获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线。
进一步地,为了方便后续提取文档图片中的信息,上述步骤F,具体包括:分别将输出的各条检测直线进行延长处理,将延长处理后的各条检测直线作为所述文档图片的各条检测直线。
其中,首先取出长度最大的直线,长度大的直线一般是表格线或分割线,其与相邻的文字块所在的直线的斜率一般相同,可直接根据该直线对相邻的文字块进行检测,因此认为是置信度高的直线。计算长度最大的直线的截距分别与其他各待处理直线的截距的差值,在第一轮过滤中,如果有差值小于预设的第二阈值,认为这两条直线相似(包括斜率及截距相似),可以将这条待处理直线过滤掉,保留长度最大的直线即可;如果差值大于等于预设的第二阈值,则不需要将该条待处理直线过滤,而是作为下一轮用于过滤的直线先暂时保留。在本轮分析完所有的差值后,将长度最大的直线作为检测直线输出,将待处理直线中没有被过滤掉的待处理直线进行第二轮过滤。第二轮过滤时,首先从没有被过滤掉的待处理直线中找出长度最大的直线,将没有被过滤掉的待处理直线中除了这条长度最大的直线外剩余的直线再作为本轮的待处理直线,计算长度最大的直线的截距分别与本轮的待处理直线的截距的差值,将差值小于预设的第二阈值的待处理直线再进行过滤,依此循环,直到剩余的待处理直线的数量为0。本实施例通过逐步的过滤,得到各条检测直线。
在具体实施例方式中,首先把所有剩余的各条直线按长度从大到小排序,放在一个列表input中,取列表中第一条最长的直线与其它的直线进行截距比较,如果两者截距的差值小于预设的第二阈值,直接在input列表中把该直线删除,比较完一轮后把最长的直线从该input列表移到新的一个output列表,output列表用来存储最终输出的检测直线。重复上面的步骤直到input的列表为空,迭代停止。
经过过滤处理后得到的各条检测直线,作为文档图片的检测直线。
本实施例首先采用霍夫直线检测方法检测文档图片得到较多的直线,然后将长度小于预设第一阈值的短直线进行剔除,以将对于检测意义不大的短直线过滤,最后分别获取文档图片中剩余的各条直线对应的截距,基于截距对剩余的各条直线进行过滤处理,通过分析截距再对剩余的较长的直线进行进一步的过滤,得到文档图片的检测直线。本实施例基于霍夫直线检测方法检测直线,再采用基于截距分析的后处理策略进行进一步过滤直线,最终得到的直线不仅避免多直线造成的干扰,还具有更高的准确性,有利于后续提取文档图片中的结构化信息。
在一实施例中,本发明提供一种信息提取方法,如图3所示,该信息提取方法包括以下步骤:
步骤S101,获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
文档图片例如为医疗报告单,发票,清单等。获取上传的文档图片,对文档图片进行灰度化并进行自适应二值化处理,二值化处理后,文档图片中的背景为黑色,文字为白色。进一步地,为了去除文档图片中文字的干扰,采用形态学的方法提取出直线,具体地,对二值化后的文档图片设置腐蚀区及膨胀区为一个较大的横向直条,例如设置腐蚀的kernel=(cols//10,1),其中cols为图片的宽度width,先腐蚀再膨胀处理,再对处理后的文档图片进行霍夫直线检测。
其中,霍夫直线检测原理是:通过从直角坐标系到极坐标系的转换,将直角坐标系中的一条直线,转换为极坐标系上的一个点,落到这条直线上的像素点越多,这个极坐标中点的权越重,最终通过分析各个点的权重,获取重要线段。进行霍夫直线检测时,得出的是每条直线的起始点与终点坐标,根据起始点与终点坐标计算出直线的斜率及截距,最终得到直线y=kx+b。经霍夫直线检测后,得出的直线的数量较多且直线呈断断续续的状态,因此,需要进行进一步处理。
步骤S102,获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
通过上述的起始点与终点坐标可以计算直线的长度。短直线有些可能是由于背景或噪声等其他因素形成的,一般对于检测的意义不大。对于小于预设的第一阈值的直线进行剔除,即对相对较短的部分直线进行剔除,保留相对较长的直线,以去除短直线的干扰,利于后续对直线的处理,提高处理速度。
步骤S103,分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线;
对于剩余的各条较长的直线,计算每条直线的截距(即直线y=kx+b中当x=0时y的值),通过分析截距再对保留的较长的直线进行进一步的过滤,得到置信度高的直线。本实施例中,通过霍夫直线检测方法检测得到的直线经过过滤较短直线后,剩下较长直线,其斜率一般相差不大,如果截距相差较大,可以确定这两条直线不相似。
进一步地,步骤S103具体包括:
步骤a,在所述剩余的各条直线中,获取长度最大的直线,将除了所述长度最大的直线外的其他直线作为待处理直线;
步骤b,计算所述长度最大的直线的截距分别与各待处理直线的截距的差值,分析各个差值是否小于预设的第二阈值;
步骤c,若有所述差值小于预设的第二阈值,则将所述差值小于预设的第二阈值对应的待处理直线过滤;
步骤d,在分析完各个差值后,将所述长度最大的直线作为所述检测直线输出,在经过滤后剩余的待处理直线中获取长度最大的直线,返回所述步骤b中进行新一轮的直线过滤,直至剩余的待处理直线的数量为0;
步骤e,获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线。
进一步地,为了方便后续提取文档图片中的信息,上述步骤f,具体包括:分别将输出的各条检测直线进行延长处理,将延长处理后的各条检测直线作为所述文档图片的各条检测直线。
其中,首先取出长度最大的直线,长度大的直线一般是表格线或分割线,其与相邻的文字块所在的直线的斜率一般相同,可直接根据该直线对相邻的文字块进行检测,因此认为是置信度高的直线。计算长度最大的直线的截距分别与其他各待处理直线的截距的差值,在第一轮过滤中,如果有差值小于预设的第二阈值,认为这两条直线相似(包括斜率及截距相似),可以将这条待处理直线过滤掉,保留长度最大的直线即可;如果差值大于等于预设的第二阈值,则不需要将该条待处理直线过滤,而是作为下一轮用于过滤的直线先暂时保留。在本轮分析完所有的差值后,将长度最大的直线作为检测直线输出,将待处理直线中没有被过滤掉的待处理直线进行第二轮过滤。第二轮过滤时,首先从没有被过滤掉的待处理直线中找出长度最大的直线,将没有被过滤掉的待处理直线中除了这条长度最大的直线外剩余的直线再作为本轮的待处理直线,计算长度最大的直线的截距分别与本轮的待处理直线的截距的差值,将差值小于预设的第二阈值的待处理直线再进行过滤,依此循环,直到剩余的待处理直线的数量为0。本实施例通过逐步的过滤,得到各条检测直线。
在具体实施例方式中,首先把所有剩余的各条直线按长度从大到小排序,放在一个列表input中,取列表中第一条最长的直线与其它的直线进行截距比较,如果两者截距的差值小于预设的第二阈值,直接在input列表中把该直线删除,比较完一轮后把最长的直线从该input列表移到新的一个output列表,output列表用来存储最终输出的检测直线。重复上面的步骤直到input的列表为空,迭代停止。
经过过滤处理后得到的各条检测直线,作为文档图片的检测直线。
本实施例基于霍夫直线检测方法检测直线,再采用基于截距分析的后处理策略进行进一步过滤,最终得到的直线不仅避免多直线造成的干扰,还具有更高的准确性。
步骤S104,采用预定的文字检测算法检测所述文档图片,得到所述文档图片中各个文字块分别对应的各条待分析直线;
其中,可以采用现有的文字检测算法检测文档图片,例如基于滑动窗口的检测方法或者基于连通分量的检测方法等。检测后,可以得到每一文字块的坐标信息。通过该坐标信息,可以确定通过该文字块的待分析直线。在一实施方式中,检测后得到的文字块的坐标信息为(x,y,w,h),(x,y)为文字块所在的矩形框左上角的坐标,w为文字块所在矩形框的宽度,h为文字块所在矩形框的高度,通过坐标信息(x,y,w,h),可以得到一条通过文字块所在的矩形框中心点的直线y=ax+c,该直线的斜率为该文字块对应的斜率,该直线即为待分析直线。
步骤S105,基于各条待分析直线分析相邻的两两文字块是否处于同一行;
对于文档图片,其包含的结构化信息一般包括属性字段及该属性字段对应的实际内容,例如,对于一张体检报告单中的某个基础项为白细胞,该基础项对应的指标为6.80。又如,对于某种客户单中的某个基础项为姓名,该基础项对应的指标为张三。在检测时,基础项作为一个文字块,而该基础项对应的指标可能作为另一个文字块,两文字块相距较近且对应的斜率基本相同。因此,可以通过相邻两文字块对应的待分析直线的截距分析相邻的两两文字块是否处于同一行,以便后续提取结构化信息。
进一步地,步骤S105基于各条待分析直线分析相邻的两两文字块是否处于同一行的步骤,具体包括:基于所述相邻的两两文字块分别对应的待分析直线,获取所述相邻的两两文字块分别对应的截距,获取所述截距之差,若所述截距之差小于预设的第三阈值,则确定所述相邻的两两文字块为处于同一行的文字块。
其中,通过文字块的待分析直线y=ax+c,当x=0时得到y的值为c,c为截距。预设第三阈值,如果两条待分析直线的截距之差小于预设的第三阈值,则说明两条待分析直线较相似,则可以确定这两个文字块为处于同一行的文字块;如果两条待分析直线的截距之差大于等于预设的第三阈值,则说明两条待分析直线较不相似,则可以确定这两个文字块为处于不同行的文字块。
步骤S106,若是,对于处于同一行的文字块,计算所述处于同一行的文字块中任一文字块的中心点坐标到各条检测直线的距离;
对于处于同一行的文字块,计算处于同一行的文字块中任一文字块的中心点坐标到各条检测直线的距离,即计算点到直线的距离,文字块中心点坐标通过上述的坐标信息(x,y,w,h)可以确定,检测直线可以是文字块上方的直线也可以是文字块下方的直线。优选地,选择文字块上方的检测直线计算点到直线的距离。
步骤S107,获取距离最小对应的检测直线,基于距离最小对应的检测直线对所述处于同一行的文字块进行检测,提取所述文档图片中的结构化信息。
选择点到直线的距离最小对应的检测直线,基于该检测直线,可以直接对该处于同一行的文字块进行检测,提取文档图片中的结构化信息。
本实施例首先采用霍夫直线检测方法检测文档图片得到较多的直线,将长度小于预设第一阈值的短直线进行剔除,以将对于检测意义不大的短直线过滤,分别获取文档图片中剩余的各条直线对应的截距,基于截距对剩余的各条直线进行过滤处理,通过分析截距再对剩余的较长的直线进行进一步的过滤,得到文档图片的检测直线;然后检测文字块,得到文字块的待分析直线,根据待分析直线分析相邻的两两文字块是否处于同一行,对于处于同一行的文字块,计算文字块的中心点坐标到各条检测直线的距离,最后获取距离最小对应的检测直线,基于该检测直线对该同一行的文字块进行检测,提取文档图片中的结构化信息。本实施例基于霍夫直线检测方法检测直线,再采用基于截距分析的后处理策略进行进一步过滤直线,得到的直线不仅避免多直线造成的干扰,还具有更高的准确性,能够快速、准确地提取文档图片中的结构化信息。
在一实施例中,本发明提供一种直线检测装置,该直线检测装置与上述实施例中直线检测方法一一对应。如图4所示,该直线检测装置包括:
检测模块101,用于获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
剔除模块102,用于获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
过滤模块103,用于分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
直线检测装置的具体限定可以参见上文中对于直线检测方法的限定,在此不再赘述。上述直线检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,本发明提供一种信息提取装置,该信息提取装置与上述实施例中信息提取方法一一对应。如图5所示,该信息提取装置包括:
第一检测模块201,用于获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
剔除模块202,用于获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
过滤模块203,用于分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线;
第二检测模块204,用于采用预定的文字检测算法检测所述文档图片,得到所述文档图片中各个文字块分别对应的各条待分析直线;
分析模块205,用于基于各条待分析直线分析相邻的两两文字块是否处于同一行;
计算模块206,用于若是,对于处于同一行的文字块,计算所述处于同一行的文字块中任一文字块的中心点坐标到各条检测直线的距离;
第三检测模块207,用于获取距离最小对应的检测直线,基于距离最小对应的检测直线对所述处于同一行的文字块进行检测,提取所述文档图片中的结构化信息。
信息提取装置的具体限定可以参见上文中对于信息提取方法的限定,在此不再赘述。上述信息提取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述计算机设备可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
如图6所示,所述计算机设备可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的计算机程序。需要指出的是,图6仅示出了具有组件11-13的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11可以是非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。本实施例中,存储器11的可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如存储本发明一实施例中的计算机程序的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central ProcessingUnit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片,用于运行所述存储器11中存储的程序代码或者处理数据,例如运行计算机程序等。
所述网络接口13可包括标准的无线网络接口、有线网络接口,该网络接口13通常用于在所述计算机设备与其他电子设备之间建立通信连接。
所述计算机程序存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器12执行,以实现上述的直线检测方法的步骤,或者实现上述的信息提取方法的步骤。
在一个实施例中,本发明提供了一种计算机可读存储介质,计算机可读存储介质可以是非易失性和/或易失性存储器,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中直线检测方法的步骤,例如图1所示的步骤S1至步骤S3,或者,实现上述实施例中信息提取方法的步骤,例如图3所示的步骤S101至步骤S107。或者,计算机程序被处理器执行时实现上述实施例中直线检测装置的各模块/单元的功能,例如图4所示模块101至模块103的功能,或者,实现上述实施例中信息提取装置的各模块/单元的功能,例如图5所示模块201至模块207的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种直线检测方法,其特征在于,包括:
获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
2.根据权利要求1所述的直线检测方法,其特征在于,所述分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的直线作为所述文档图片的检测直线的步骤,具体包括:
步骤A,在所述剩余的各条直线中,获取长度最大的直线,将除了所述长度最大的直线外的其他直线作为待处理直线;
步骤B,计算所述长度最大的直线的截距分别与各待处理直线的截距的差值,分析各个差值是否小于预设的第二阈值;
步骤C,若有所述差值小于预设的第二阈值,则将所述差值小于预设的第二阈值对应的待处理直线过滤;
步骤D,在分析完各个差值后,将所述长度最大的直线作为所述检测直线输出,在经过滤后剩余的待处理直线中获取长度最大的直线,返回所述步骤B中进行新一轮的直线过滤,直至剩余的待处理直线的数量为0;
步骤E,获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线。
3.根据权利要求2所述的直线检测方法,其特征在于,所述获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线的步骤,具体包括:分别将输出的各条检测直线进行延长处理,将延长处理后的各条检测直线作为所述文档图片的各条检测直线。
4.一种信息提取方法,其特征在于,包括:
获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线;
采用预定的文字检测算法检测所述文档图片,得到所述文档图片中各个文字块分别对应的各条待分析直线;
基于各条待分析直线分析相邻的两两文字块是否处于同一行;
若是,对于处于同一行的文字块,计算所述处于同一行的文字块中任一文字块的中心点坐标到各条检测直线的距离;
获取距离最小对应的检测直线,基于距离最小对应的检测直线对所述处于同一行的文字块进行检测,提取所述文档图片中的结构化信息。
5.根据权利要求4所述的信息提取方法,其特征在于,所述分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的直线作为所述文档图片的检测直线的步骤,具体包括:
步骤a,在所述剩余的各条直线中,获取长度最大的直线,将除了所述长度最大的直线外的其他直线作为待处理直线;
步骤b,计算所述长度最大的直线的截距分别与各待处理直线的截距的差值,分析各个差值是否小于预设的第二阈值;
步骤c,若有所述差值小于预设的第二阈值,则将所述差值小于预设的第二阈值对应的待处理直线过滤;
步骤d,在分析完各个差值后,将所述长度最大的直线作为所述检测直线输出,在经过滤后剩余的待处理直线中获取长度最大的直线,返回所述步骤b中进行新一轮的直线过滤,直至剩余的待处理直线的数量为0;
步骤e,获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线。
6.根据权利要求5所述的信息提取方法,其特征在于,所述获取输出的各条检测直线,将输出的各条检测直线作为所述文档图片的各条检测直线的步骤,具体包括:分别将输出的各条检测直线进行延长处理,将延长处理后的各条检测直线作为所述文档图片的各条检测直线。
7.根据权利要求4至6任一项所述的信息提取方法,其特征在于,所述基于各条待分析直线分析相邻的两两文字块是否处于同一行的步骤,具体包括:基于所述相邻的两两文字块分别对应的待分析直线,获取所述相邻的两两文字块分别对应的截距,获取所述截距之差,若所述截距之差小于预设的第三阈值,则确定所述相邻的两两文字块为处于同一行的文字块。
8.一种直线检测装置,其特征在于,包括:
检测模块,用于获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;
剔除模块,用于获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;
过滤模块,用于分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。
9.一种计算机设备,所述计算机设备包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的直线检测方法的步骤,或者实现如权利要求4至7中任一项所述的信息提取方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的直线检测方法的步骤,或者实现如权利要求4至7中任一项所述的信息提取方法的步骤。
CN202011478759.2A 2020-12-14 2020-12-14 直线检测方法、信息提取方法、装置、设备及存储介质 Active CN112529014B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011478759.2A CN112529014B (zh) 2020-12-14 2020-12-14 直线检测方法、信息提取方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011478759.2A CN112529014B (zh) 2020-12-14 2020-12-14 直线检测方法、信息提取方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112529014A true CN112529014A (zh) 2021-03-19
CN112529014B CN112529014B (zh) 2023-09-26

Family

ID=75000188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011478759.2A Active CN112529014B (zh) 2020-12-14 2020-12-14 直线检测方法、信息提取方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112529014B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989355A (zh) * 2021-10-21 2022-01-28 北京远舢智能科技有限公司 烟丝宽度检测方法、系统、终端及存储介质
CN115130437A (zh) * 2022-08-31 2022-09-30 南京擎盾信息科技有限公司 一种文档智能填写方法、装置及存储介质
CN115376153A (zh) * 2022-08-31 2022-11-22 南京擎盾信息科技有限公司 一种合同比对方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6259809B1 (en) * 1997-08-29 2001-07-10 Advantest Corporation System and method for recognition of image information
CN105069786A (zh) * 2015-07-31 2015-11-18 小米科技有限责任公司 直线检测方法及装置
CN105118069A (zh) * 2015-09-30 2015-12-02 杭州南江机器人股份有限公司 一种复杂环境直线检测和筛选方法及应用该方法的机器人
CN107909047A (zh) * 2017-11-28 2018-04-13 上海信耀电子有限公司 一种汽车及其应用的车道检测方法及系统
CN110189344A (zh) * 2019-04-24 2019-08-30 河海大学常州校区 一种电力刀闸图像中直线段提取方法
WO2019227615A1 (zh) * 2018-06-01 2019-12-05 平安科技(深圳)有限公司 校正发票图像的方法、装置、计算机设备和存储介质
CN111161169A (zh) * 2019-12-20 2020-05-15 五邑大学 基于霍夫变换的绝对相位噪声去除方法、装置和存储介质
CN111476804A (zh) * 2020-05-15 2020-07-31 天地(常州)自动化股份有限公司 托辊图像高效分割方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6259809B1 (en) * 1997-08-29 2001-07-10 Advantest Corporation System and method for recognition of image information
CN105069786A (zh) * 2015-07-31 2015-11-18 小米科技有限责任公司 直线检测方法及装置
CN105118069A (zh) * 2015-09-30 2015-12-02 杭州南江机器人股份有限公司 一种复杂环境直线检测和筛选方法及应用该方法的机器人
CN107909047A (zh) * 2017-11-28 2018-04-13 上海信耀电子有限公司 一种汽车及其应用的车道检测方法及系统
WO2019227615A1 (zh) * 2018-06-01 2019-12-05 平安科技(深圳)有限公司 校正发票图像的方法、装置、计算机设备和存储介质
CN110189344A (zh) * 2019-04-24 2019-08-30 河海大学常州校区 一种电力刀闸图像中直线段提取方法
CN111161169A (zh) * 2019-12-20 2020-05-15 五邑大学 基于霍夫变换的绝对相位噪声去除方法、装置和存储介质
CN111476804A (zh) * 2020-05-15 2020-07-31 天地(常州)自动化股份有限公司 托辊图像高效分割方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田文利;: "基于霍夫直线检测与二维透视变换的图像校正恢复算法", 电子测量技术, no. 09, pages 135 - 138 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989355A (zh) * 2021-10-21 2022-01-28 北京远舢智能科技有限公司 烟丝宽度检测方法、系统、终端及存储介质
CN115130437A (zh) * 2022-08-31 2022-09-30 南京擎盾信息科技有限公司 一种文档智能填写方法、装置及存储介质
CN115376153A (zh) * 2022-08-31 2022-11-22 南京擎盾信息科技有限公司 一种合同比对方法、装置及存储介质
CN115376153B (zh) * 2022-08-31 2024-05-17 南京擎盾信息科技有限公司 一种合同比对方法、装置及存储介质

Also Published As

Publication number Publication date
CN112529014B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
CN112529014B (zh) 直线检测方法、信息提取方法、装置、设备及存储介质
CN109859227B (zh) 翻拍图像检测方法、装置、计算机设备及存储介质
CN110781859B (zh) 图像标注方法、装置、计算机设备和存储介质
CN110136069B (zh) 文本图像矫正方法、装置与电子设备
CN107315989B (zh) 针对医学资料图片的文本识别方法和装置
CN110298858B (zh) 一种图像裁剪方法及装置
CN109934262B (zh) 图片差异性判断方法、装置、计算机设备和存储介质
CN111739020B (zh) 周期纹理背景缺陷标签自动标注方法、装置、设备及介质
CN110738236A (zh) 图像匹配方法、装置、计算机设备及存储介质
CN108229232B (zh) 批量扫描二维码的方法和批量扫描二维码的装置
JP2021135993A (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
CN112686893B (zh) 一种卫星影像区域网平差方法及装置
CN106569946B (zh) 一种移动终端性能测试方法及系统
CN112508910A (zh) 用于多分类缺陷检测的缺陷提取方法及装置
CN111611944A (zh) 身份识别方法及装置、电子设备、存储介质
CN111159150A (zh) 一种数据扩充方法及装置
CN111242840A (zh) 手写体字符生成方法、装置、计算机设备和存储介质
CN109656474B (zh) 数据存储方法、装置、计算机设备和存储介质
CN109377444B (zh) 图像处理方法、装置、计算机设备及存储介质
CN108268868B (zh) 身份证图像的倾斜值获取方法及装置、终端、存储介质
JP4685711B2 (ja) 画像処理方法及び装置及びプログラム
CN109063601B (zh) 唇纹检测方法、装置、计算机设备和存储介质
CN108364024B (zh) 图像匹配方法、装置、计算机设备和存储介质
CN110895849A (zh) 冠字号切割定位方法、装置、计算机设备及存储介质
CN107688788B (zh) 文档图表抽取方法、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant