CN117010351A - 表格斜线的处理方法、装置、电子设备及存储介质 - Google Patents
表格斜线的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117010351A CN117010351A CN202210484167.4A CN202210484167A CN117010351A CN 117010351 A CN117010351 A CN 117010351A CN 202210484167 A CN202210484167 A CN 202210484167A CN 117010351 A CN117010351 A CN 117010351A
- Authority
- CN
- China
- Prior art keywords
- candidate
- line
- oblique
- diagonal
- lines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title description 5
- 238000012545 processing Methods 0.000 claims abstract description 94
- 238000001514 detection method Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000001914 filtration Methods 0.000 claims abstract description 48
- 230000008569 process Effects 0.000 claims description 8
- 230000015654 memory Effects 0.000 description 36
- 238000004422 calculation algorithm Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例涉及一种表格斜线的处理方法、装置、电子设备及存储介质,包括:获取图像表格对应的单元格信息;根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合;依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,从而能够准确得检测和还原图像表格中的一条或多条斜线,实现了单元格斜线的自动还原。
Description
技术领域
本发明实施例涉及计算机领域,尤其涉及一种表格斜线的处理方法、装置、电子设备及存储介质。
背景技术
在日常的办公和学习场景中,为了快捷地记录纸质文件上的关键信息,人们通常会采用拍摄图片的方式进行关键信息记录。然而,在通过图片记录信息之后,将图片中的信息转化为可编辑的电子文档就成为了一种很繁琐的工作,如在图片存在表格情况下,不仅需要对该表格的单元格线条进行还原,还需要对单元格内部的斜线进行还原。
现有的图片识别技术可利用直线检测,识别出表格的单元格线条,但是无法对该表格的单元格内部的斜线进行准确识别。具体而言,现有的直线检测方案主要是基于霍夫变换(Hough Transform)算法来进行检测,而霍夫直线检测容易受到噪声点的影响,因此使用霍夫直线检测会检测得到大量的冗余线段,这些冗余线段中许多是无效的。此外,霍夫直线检测只能确定直线的方向,无法确定实际的线段长度,无法直接应用于表格的单元格中的斜线还原。
发明内容
有鉴于此,本发明实施例提供一种表格斜线的处理方法、装置、电子设备及存储介质,以对图像类型的表格中的单元格内部斜线进行检测和还原,进一步完善表格结构的还原效果。
第一方面,本发明实施例提供一种表格斜线的处理方法,包括:
获取图像表格对应的单元格信息;
根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合;
依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
在一可能的实施方式中,根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合,包括:
将所述图像表格转换为二值化图像信息;
根据所述单元格信息,对所述二值化图像信息进行直线检测,得到潜在直线集合;
依据所述潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到所述候选斜线集合。
在一可能的实施方式中,所述根据所述单元格信息,对所述二值化图像信息进行直线检测,得到潜在直线集合,包括:
基于所述单元格信息中的行参数和列参数,对所述二值化图像信息进行目标单元格遍历,得到目标单元格信息;
利用所述目标单元格信息对目标单元格进行形状检测,得到潜在直线信息,所述潜在直线信息包含每条潜在直线的至少两个点描述信息;
基于所述每条潜在直线的至少两个点描述信息,生成所述潜在直线集合。
在一可能的实施方式中,所述依据所述潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到所述候选斜线集合,包括:
确定所述潜在直线集合中的每一条潜在直线的直线斜率;
将所述直线斜率在斜线斜率范围内的潜在直线确定为目标斜线;
依据每条所述目标斜线与单元格的交点,确定每条候选斜线对应的候选交点信息;
基于所述候选交点信息,生成所述候选斜线集合。
在一可能的实施方式中,所述基于所述候选交点信息,生成所述候选斜线集合,包括:
根据所述候选交点信息进行交点连线处理,得到所述候选交点信息对应的候选斜线;
根据所述候选斜线生成所述候选斜线集合。
在一可能的实施方式中,所述依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,包括:
确定所述候选斜线集合中的候选斜线的数量;
在所述数量大于预设数量阈值的情况下,基于所述候选斜线集合中任意两条候选斜线之间的夹角,对所述候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合,并将所述候选斜线更新集合中的所有候选斜线确定为所述单元格斜线;
在所述数量等于或小于所述预设数量阈值的情况下,将所述候选斜线集合中的候选斜线确定为所述单元格斜线。
在一可能的实施方式中,所述基于所述候选斜线集合中任意两条候选斜线之间的夹角,对所述候选斜线集合中的冗余斜线进行删除处理,包括:
确定所述候选斜线集合中任意两条候选斜线之间的夹角;
在两条候选斜线之间的夹角小于预设夹角阈值的情况下,将所述两条候选斜线中任一条候选斜线确定为冗余斜线,并从所述候选斜线集合中删除所述冗余斜线,直到所述候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。
在一可能的实施方式中,上述表格斜线的处理方法,还包括:根据所述单元格信息的行参数和列参数,生成初始可编辑表格;基于所述初始可编辑表格和所述单元格斜线,生成所述图像表格对应的可编辑表格。
第二方面,本发明实施例提供一种表格斜线的处理装置,包括:
单元格信息获取模块,用于获取图像表格对应的单元格信息;
直线检测处理模块,用于根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合;
冗余过滤处理模块,用于依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
在一可能的实施方式中,所述直线检测处理模块包括:
二值化转换子模块,用于将所述图像表格转换为二值化图像信息;
直线检测子模块,用于根据所述单元格信息,对所述二值化图像信息进行直线检测,得到潜在直线集合;
直线过滤子模块,用于依据所述潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到所述候选斜线集合。
在一可能的实施方式中,直线检测子模块包括:
单元格遍历单元,用于基于所述单元格信息中的行参数和列参数,对所述二值化图像信息进行目标单元格遍历,得到目标单元格信息;
形状检测单元,用于利用所述目标单元格信息对目标单元格进行形状检测,得到潜在直线信息,所述潜在直线信息包含每条潜在直线的至少两个点描述信息;
潜在直线集合单元,用于基于所述每条潜在直线的至少两个点描述信息,生成所述潜在直线集合。
在一可能的实施方式中,所述直线过滤子模块包括:
直线斜率确定单元,用于确定所述潜在直线集合中的每一条潜在直线的直线斜率;
候选斜线确定单元,用于将所述直线斜率在斜线斜率范围内的潜在直线确定为目标斜线;
候选交点信息单元,用于依据每条所述目标斜线与单元格的交点,确定每条目标斜线对应的候选交点信息;
候选斜线集合单元,用于基于所述候选交点信息,生成所述候选斜线集合。
在一可能的实施方式中,候选斜线集合单元,具体用于根据所述候选交点信息进行交点连线处理,得到所述候选交点信息对应的候选斜线;并根据所述候选斜线生成所述候选斜线集合。
在一可能的实施方式中,所述冗余过滤处理模块可以包括如下子模块:
候选斜线数量确定子模块,用于确定所述候选斜线集合中的候选斜线的数量;
冗余删除处理子模块,用于在所述数量大于预设数量阈值的情况下,基于所述候选斜线集合中任意两条候选斜线之间的夹角,对所述候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合;
单元格斜线确定子模块,用于将所述候选斜线更新集合中的所有候选斜线确定为所述单元格斜线;或者,用于在所述数量等于或小于所述预设数量阈值的情况下,将所述候选斜线集合中的候选斜线确定为所述单元格斜线。
在一可能的实施方式中,所述冗余删除处理子模块,具体用于:确定所述候选斜线集合中任意两条候选斜线之间的夹角;在两条候选斜线之间的夹角小于预设夹角阈值的情况下,将所述两条候选斜线中任一条候选斜线确定为冗余斜线,并从所述候选斜线集合中删除所述冗余斜线,直到所述候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。
在一可能的实施方式中,表格斜线的处理装置还包括:初始可编辑表格模块和可编辑表格生成模块。初始可编辑表格模块可以用于根据所述单元格信息中的行参数和列参数,生成初始可编辑表格;可编辑表格生成模块,用于基于所述初始可编辑表格和所述单元格斜线,生成所述图像表格对应的可编辑表格。
第三方面,本发明实施例提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面中任一项所述的表格斜线的处理方法的步骤。
第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的表格斜线的处理方法。
本发明实施例提供的技术方案,通过获取图像表格对应的单元格信息,并根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合,随后依据该候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,从而能够准确地检测和还原图像表格中的一条或多条斜线,实现了自动还原图像表格中的单元格斜线,进一步完善表格结构的还原效果。
附图说明
图1为带有单元格斜线的图像表格的一种示意图;
图2为本发明实施例提供的一种表格斜线的处理方法的步骤流程图;
图3为本申请一个示例中的一种图像表格的示意图;
图4为本申请一个示例中的一种二值化图像信息的图像效果示意图;
图5为本发明一个可选实施例提供的一种表格斜线的处理方法的步骤流程图;
图6为本发明一个可选示例中的表格斜线还原流程的示意图;
图7为本申请一个示例中的单元格斜线还原效果示意图;
图8本发明实施例提供的一种表格斜线的处理装置的结构框图;
图9为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在实际处理中,可以将图像类型的表格作为本申请实施例中的图像表格,该图像表格中可以存在一条或多条单元格斜线。例如,如图1所示,图1中的图像表格中不仅可以包含有多个单元格,还包含有一条单元格斜线。这里的单元格斜线可以是指一个单元格内部的斜线;一个单元格内部可以包含有一条或多条斜线,或者可以不包含斜线,图1中仅以单元格包含一条斜线或不包含斜线为例。
在一些应用场景中,如在PDF文件扫描应用场景中,会涉及对图像表格进行还原,以将图像表格转换还原为处于编辑状态的表格,举例来说,可以将jpg格式的图像表格文件转换为xls或xlsx格式的表格文件,使其可以在文档编辑客户端中被用户编辑。需要说明的是,在PDF文件扫描应用场景中,通过扫描产生的PDF文件中的表格是不可编辑的图像表格,在扫描产生的PDF文件中的表格包含有单元格斜线的情况下,需要针对pdf文件中的表格进行斜线还原。
例如,在对图1所示的图像表格进行还原时,通常涉及图像表格中单元格和单元格内部斜线的检测,以对该图像表格中的单元格和单元格斜线进行还原(即,使单元格和单元格斜线处于可编辑状态)。但是,现有的图片识别技术利用霍夫直线检测,只能检测出单元格线条,实现表格中的单元格还原,无法还原出单元格斜线,影响表格结构的还原效果。由此可见,如何对图像表格中的单元格内部斜线进行检测还原成为亟待解决的技术问题。
对此,本发明实施例提供一种表格斜线的处理方法,以自动还原图像表格中的单元格斜线,进一步完善表格结构的还原效果。
下面结合附图以具体实施例对本发明提供的表格斜线的处理方法做进一步的解释说明,实施例并不构成对本发明实施例的限定。
参见图2,为本发明实施例提供的一种表格斜线的处理方法的步骤流程图。本申请实施例提供的表格斜线的处理方法,具体可以包括以下步骤:
步骤201、获取图像表格对应的单元格信息。
其中,图像表格可以包含各种待还原的图像类型的表格,如可以是彩色图片中的表格;图像表格对应的单元格信息可以包括预先对该图像表格进行识别检测得到的单元格行列信息,具体可以用于还原该图像表格中的单元格。例如,在检测得到的单元格行列信息包含有单元格的行参数和列参数的情况下,可以利用单元格的行参数还原画出单元格的行,并可利用单元格的列参数还原画出单元格的列,进而可以还原绘制出包含可编辑单元格的表格。
在一个可选实施方式中,图像表格对应的单元格信息可以包含有图像表格中每个单元格的长度信息、宽度信息以及位置信息,从而可以在图像表格还原过程中,根据每个单元格的长度信息、宽度信息以及位置信息绘制每个单元格,实现单元格的还原。
步骤202、根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合。
具体而言,本申请实施例在对图像表格进行还原时,可以获取该图像表格对应的单元格信息,以在直线检测的基础上结合单元格信息,对该图像表格进行直线检测处理,从而可以检测到图像表格中单元格内部的潜在直线,进而可以基于检测到的潜在直线确定出候选斜线,以基于候选斜线生成候选斜线集合。其中,图像表格中单元格可以根据单元格信息确定,如可以根据单元格信息中的行参数和列参数确定图像表格中的单元格;列参数可以用于确定图像表格的列,如可以包含图像表格中列的数量、各列的列宽等;行参数可以用于确定图像表格的行,如可以包含图像表格中行的数量、各行的行高等。候选斜线集合可以包含一条或多条候选斜线,或者可以是不包含候选斜线的空集,本申请实施例对此不作具体限制。
步骤203、依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
具体的,本申请实施例在得到候选斜线集合后,可以确定该候选斜线集合中的候选斜线的数量,以在候选斜线的数量大于预设数量阈值的情况下进行斜线冗余过滤处理,如可以依据该候选斜线集合中的任意两条候选斜线之间的夹角进行斜线冗余过滤处理,以过滤掉重叠冗余的斜线,得到最终的单元格斜线,实现了单元格斜线的自动还原。例如,在预设数量阈值设置为1的情况下,可以通过判断候选斜线的数量是否大于预设数量阈值,确定该候选斜线集合是否包含有两条或两条以上的候选斜线,从而可以在该候选斜线集合包含有两条或两条以上的候选斜线的情况下,依据该候选斜线集合中的任意两条候选斜线之间的夹角进行斜线冗余过滤处理,以过滤掉重叠冗余的斜线,得到最终的单元格斜线。
可见,本申请实施例通过获取图像表格对应的单元格信息,并根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合,随后依据该候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,从而能够准确地还原图像表格中的单元格斜线,实现了单元格斜线的自动还原,进一步完善表格结构的还原效果。
在实际处理中,本申请实施例在得到单元格斜线后,可以依据该单元格斜线和单元格信息进行表格还原,以还原出图像表格对应的可编辑表格。可选的,在上述实施的基础上,本申请实施例提供的表格斜线的处理方法,还包括:根据单元格信息中的行参数和列参数,生成初始可编辑表格;基于初始可编辑表格和单元格斜线,生成图像表格对应的可编辑表格。其中,初始可编辑表格可以是指处于编辑状态且不包含有单元格斜线的表格,即初始可编辑表格中的单元格内部没有斜线;可编辑表格可以是指处于编辑状态的表格,如可以是可供用户编辑的Excel表格,也可以是Word文档中的可编辑表格等,本申请实施例对此不作具体限制。
在一个可选实施例中,可以将待还原的图像表格进行图像二值化,以便后续可以利用二值化图像信息进行霍夫直线检测。具体而言,考虑到不能直接利用原始的图像表格的信息进行霍夫直线检测,本申请实施例在获取到图像表格后,可以通过图像二值化的方式,将图像表格转换为二值化图像信息,随后可利用该二值化图像信息,结合该图像表格对应的单元格信息进行直线检测,以对图像表格中的单元格斜线单独进行检测和还原,实现对单元格斜线单独进行检测和还原,进一步完善表格结构的还原效果。进一步而言,本申请实施例根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合,具体可以包括:将图像表格转换为二值化图像信息;根据单元格信息,对二值化图像信息进行直线检测,得到潜在直线集合;依据潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到候选斜线集合。其中,二值化图像信息可以用于表示图像二值化后得到的二值化图像,具体可以包含将图像表格进行图像二值化得到的表格图像二值化信息,如在二值化图像是一个只有黑和白这两种颜色的图像的情况下,二值化图像信息可以包含黑色对应的颜色强度值和白色对应的颜色强度值。例如,在将如图3所示的图像表格进行二值化后,可以利用得到的二值化图像信息显示出如图4所示的二值化图像,且该二值化图像中各像素点的颜色强度值可以是0或255,需要说明的是,数值0可以表示黑色,数值255可以表示白色,本示例对此不作具体限制。
参见图5,为本发明一个可选实施例提供的一种表格斜线的处理方法的步骤流程图。如图5所示,本申请实施实施例中的表格斜线的处理方法可包括以下步骤:
步骤501、获取图像表格对应的单元格信息。
步骤502、将图像表格转换为二值化图像信息。
步骤503、根据单元格信息,对二值化图像信息进行直线检测,得到潜在直线集合。
具体而言,本申请实施例在对存在单元格斜线的图像表格进行还原时,可以对当前所需要还原的图像表格进行图像二值化处理,得到二值化图像信息,该二值化图像信息可以用于表示一个只有黑和白的二值化图像,随后可根据单元格信息对二值化图像信息进行直线检测,如基于单元格信息中的行参数和列参数,利用二值化图像信息进行霍夫直线检测,如图6所示,即结合单元格信息进行霍夫直线检测,从而可以检测到潜在直线,进而可以基于检测到的潜在直线形成潜在直线集合。该潜在直线集合可以包含一条或多条潜在直线,如可以包含一条或多条潜在直线的描述信息,本申请实施例对此不作具体限制。
进一步而言,本申请实施例根据单元格信息,对二值化图像信息进行直线检测,得到潜在直线集合,具体可以包括如下子步骤:
子步骤5031,基于单元格信息中的行参数和列参数,对二值化图像信息进行目标单元格遍历,得到目标单元格信息;
子步骤5032,利用目标单元格信息对目标单元格进行形状检测,得到潜在直线信息,潜在直线信息包含每条潜在直线的至少两个点描述信息;
子步骤5033,基于每条潜在直线的至少两个点描述信息,生成潜在直线集合。
其中,单元格信息中的行参数可以用于确定单元格的行,且单元格信息中的列参数可以用于确定单元格的列;目标单元格信息可以用于表示二值化图像中的单元格。具体的,本申请实施例在进行图像表格还原时,可以根据单元格信息中的行参数和列参数,对二值化图像信息进行目标单元格遍历,以将二值化图像信息中的单元格信息确定为目标单元格信息,即根据图像表格对应的单元格信息遍历二值化图像中的单元格,以将二值化图像中的单元格确定为目标单元格,随后可利用目标单元格信息对目标单元格进行形状检测,如可以按照预设的直线检测算法,利用目标单元格信息对目标单元格进行形状检测,以检测出每个目标单元格中的潜在直线,从而可将检测到的潜在直线的描述信息作为潜在直线信息,以便后续可以利用该潜在直线信息生成潜在直线集合。
例如,可以对目标单元格信息进行霍夫直线检测,以使用霍夫变换算法检测潜在的直线,即对每一个目标单元格进行霍夫直线检测,得到每条潜在直线的描述信息,随后可将每条潜在直线的描述信息确定为潜在直线信息,以便后续可以利用该潜在直线信息生成潜在直线集合。
当然,本申请实施例除了可以使用霍夫变换算法进行形状检测之外,还可以利用其它直线检测算法进行形状检测,本申请实施例对此不作具体限制。
在实际处理中,可以采用两个点描述直线。因此,本申请实施例可以将潜在直线的两个点描述信息作为潜在直线信息,以利用潜在直线的两个点描述信息确定潜在直线。当然,除了可以用潜在直线的两个点描述信息确定潜在直线之外,还可以用潜在直线的三个或三个以上的点信描述信息确定潜在直线,本申请实施例对此不作限制。
在具体实现时,本申请实施例在得到潜在直线信息后,可以根据该潜在直线信息中所包含的每一条潜在直线的至少两个点描述信息生成潜在直线,从而基于生成的潜在直线形成潜在直线集合。潜在直线集合可以包含一条或多条潜在直线,本申请实施例对此不作具体限制。
步骤504、依据潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到候选斜线集合。
在具体实现中,可以从每条潜在直线的至少两个点描述信息中选取出任意两个点描述信息,以选取出的两个点描述信息确定出潜在直线的直线斜率,即利用潜在直线的两个点确定潜在直线的斜率。在确定潜在直线直线集合中每一条潜在直线的直线斜率后,可以利用该直线斜率对潜在直线进行直线过滤,如进行水平线过滤和垂直线过滤,以滤除潜在直线集合中的水平线和垂直线,保留潜在直线集合中的斜线(即,和水平线或垂直线之间存在夹角的直线),并可将保留的斜线作为候选斜线,形成候选斜线集合。在一个可选实施方式中,上述依据潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到候选斜线集合,具体可以包括如下子步骤:
子步骤5041,确定潜在直线集合中的每一条潜在直线的直线斜率;
子步骤5042,将直线斜率在斜线斜率范围内的潜在直线确定为目标斜线;
子步骤5043,依据每条目标斜线与单元格的交点,确定每条目标斜线对应的候选交点信息;
子步骤5044,基于候选交点信息,生成候选斜线集合。
具体而言,本申请实施例在得到潜在直线集合后,可以采用该潜在直线集合中的每一条潜在直线的两个点描述信息,分别确定每一条潜在直线的直线斜率,即针对潜在直线集合中的任意一条潜在直线,依据潜在直线的两个点描述信息确定该潜在直线的直线斜率,随后可判断每一条潜在直线的直线斜率是否是在预设斜线斜率范围内,以确定每一潜在直线是否是水平线或垂直线,从而可以在潜在直线的直线斜率不在预设斜线斜率范围内的情况下,确定该潜在直线是水平线或垂直线,随后可删除该潜在直线,不将该潜在直线确定为目标斜线;而在潜在直线的直线斜率在预设斜线斜率范围内的情况下,可以确定该潜在直线既不是水平线,也不是垂直线,进而可以将潜在直线确定为目标斜线,即将直线斜率在斜线斜率范围内的潜在直线确定为目标斜线,达到过滤水平线和垂直线,仅保留有一定夹角的斜线作为目标斜线的目的。
例如,在潜在直线的两个点描述信息为(x1,y1)和(x2,y2)情况下,可以按照斜率计算公式k=(y2-y1)/(x2-x1),计算出每一条潜在直线的直线斜率k,并可通过判断直线斜率k是否存在,并在直线斜率k存在时判断直线斜率k是否为零,以判断直线斜率是否是在预设斜线斜率范围内,从而可以在某一潜在直线的直线斜率不存在时,确定该潜在直线的直线斜率不在斜线斜率范围内,并可确定该潜在直线是垂直线,随后可删除该垂直线,不将该垂直线确定为目标斜线;而在某一潜在直线的直线斜率存在,且该潜在直线的直线斜率为零时,确定该潜在直线是水平线,随后可删除该水平线,不将该水平线确定为目标斜线;进而可以在某一潜在直线的直线斜率存在,且该潜在直线的直线斜率不等于零时,确定该潜在直线的直线斜率在斜线斜率范围内,随后可将该潜在直线确定为目标斜线,达到将直线斜率在斜线斜率范围内的潜在直线确定为目标斜线的目的。
进一步而言,利用霍夫直线检测出来的斜线只是线段,而表格中的单元格斜线是需要边或者顶点的连线,因此本申请实施例在保留具有一定夹角的斜线作为目标斜线后,可以通过计算目标斜线与单元格的交点,确定每条目标斜线对应的候选交点信息,以利用该候选交点信息将交点连成线,从而可以将连成线作为单元格的候选斜线,进而可以利用单元格的候选斜线形成候选斜线集合。可选的,本申请实施例基于候选交点信息,生成候选斜线集合,具体可以包括:根据候选交点信息进行交点连线处理,得到候选交点信息对应的候选斜线;根据候选斜线生成候选斜线集合。其中,候选交点信息对应的候选斜线可以是指利用该候选交点信息进行交点连线处理得到的单元格的候选斜线。例如,结合上述例子,在计算斜率,过滤掉水平线和垂直线,仅保留目标斜线的情况下,考虑到这些目标斜线段的长度不一,为了得到完整的单元格斜线,可以根据目标单元格信息,确定目标斜线与单元格四条边的交点,即计算目标斜线与单元格交点,并可将交点连成线,如图6所示,随后可将这些连成线作为单元格的候选斜线,以利用单元格的候选斜线形成候选斜线集合。
步骤505、依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
在实际处理中,候选斜线集合可以包含很多条候选斜线,甚至可能包含重叠冗余的候选斜线。因此,本申请申实例在得到候选斜线集合后,可以利用预设的斜线后处理算法,依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,以过滤重叠冗余的候选斜线,得到最终的单元格斜线。
在一个可选实施方式中,上述依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,具体可以包括如下子步骤:
子步骤5051,确定候选斜线集合中的候选斜线的数量;
子步骤5052,在数量大于预设数量阈值的情况下,基于候选斜线集合中任意两条候选斜线之间的夹角,对候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合,并将候选斜线更新集合中的所有候选斜线确定为单元格斜线;
子步骤5053,在数量等于或小于预设数量阈值的情况下,将候选斜线集合中的候选斜线确定为单元格斜线。
具体而言,本申请实施例在确定候选斜线集合中的候选斜线的数量后,可以通过判断该候选斜线的数量是否大于预设数量阈值,以确定是否需要对该候选斜线进行斜线冗余过滤处理。在候选斜线的数量大于预设数量阈值的情况下,可以确定需要对该候选斜线进行斜线冗余过滤处理,随后可基于候选斜线集合中任意两条候选斜线之间的夹角,对候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合,以在候选斜线更新集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值时,将候选斜线更新集合中的所有候选斜线确定为单元格斜线。其中,冗余斜线可以是指在两条候选斜线之间的夹角小于预设夹角阈值的情况下这两条候选斜线中的任一条;预设夹角阈值可以根据斜线重叠冗余过滤需求进行设置,如可以是根据斜线重叠冗余过滤需求设置的一定阈值threshold,如该阈值threshold可以设置为1度等,本申请实施例对此不作限制。预设数量阈值可以根据斜线重叠冗余过滤需求进行设置,如可以是设置为1或2等正整数,本申请实施例对此也不作限制。
例如,在预设数量阈值设置为1的情况下,在确定候选斜线集合中的候选斜线的数量后,可以通过判断该候选斜线的数量是否为1,以确定该候选斜线集合中是否只存在一条候选直线,从而可以在候选斜线的数量等于1的情况下确定该候选斜线集合中只存在一条候选直线,即可确定该候选斜线集合不存在重复冗余斜线,进而可以将该候选斜线集合中的候选斜线确定为最终的单元格斜线;而在候选斜线的数量大于1的情况下,即在候选斜线集合非空集、且候选斜线集合中的候选斜线的数量大于1时,可以循环遍历候选斜线集合,计算候选斜线集合中任意两条候选斜线之间的夹角,以将小于预设夹角阈值的夹角对应的一条候选斜线确定为冗余斜线,并可将该冗余斜线从候选斜线集合中删除,直到候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值时,结束循环,将候选斜线集合中的候选斜线确定为最终的单元格斜线。
进一步而言,本申请实施例基于候选斜线集合中任意两条候选斜线之间的夹角,对候选斜线集合中的冗余斜线进行删除处理,具体可以包括:确定候选斜线集合中任意两条候选斜线之间的夹角;在两条候选斜线之间的夹角小于预设夹角阈值的情况下,将两条候选斜线中任一条候选斜线确定为冗余斜线,并从候选斜线集合中删除冗余斜线,直到候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。具体的,在候选斜线集合中的候选斜线的数量大于预设数量阈值的情况下,可以利用预设的斜线后处理算法,循环确定该候选斜线集合中任意两条候选斜线之间的夹角,从而可以在某两条候选斜线之间的夹角小于预设夹角阈值的情况下降这两条候选斜线确定为重复冗余斜线,并可将该夹角对应的一条候选斜线确定为冗余斜线,即将两条重复冗余斜线中的任意一条确定为冗余斜线,随后可将该冗余斜线从候选斜线集合中删除,实现重叠冗余斜线的过滤,直到候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。
例如,在候选斜线集合N非空时,即在候选斜线的数量大于零时,可以利用斜线后处理算法,如图6所示,按照候选斜线集合中各候选斜线对应的遍历顺序,循环遍历候选斜线集合N,计算该候选斜线集合N中的第i条候选斜线与第i+1条候选斜线的夹角,并可判断夹角是否小于一定阈值threshold,则可以将第i+1条斜线从斜线集合N中删除,以更新候选斜线集合N,直到候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值时,或者,在候选斜线集合中的斜线数量为1时,结束循环,将候选斜线集合中的候选斜线确定为最终的单元格斜线。
步骤506、根据单元格信息中的行参数和列参数,生成初始可编辑表格。
步骤507、基于初始可编辑表格和单元格斜线,生成图像表格对应的可编辑表格。
例如,结合上述例子,在利用斜线后处理算法进行重叠冗余斜线过滤后,可以准确地检测和还原单元格中一条或多条斜线,能够还原出一条或多条单元格斜线,如在有文字干扰的场景下,仍能准确还原出如图3所示的图像表格中的单元格斜线,以利用该单元格斜线和该图像表格对应的单元格信息生成对应的可编辑表格,如图7所示,进一步完善表格结构的还原效果。
综上,本申请实施例可以能够准确的检测和还原单元格中一条或多条斜线,如在有文字干扰的场景下,仍能准确还原斜线,并且利用斜线后处理算法,能够有效过滤了重复冗余的斜线,从而降低误检率,进一步完善表格结构的还原效果。
此外,本申请实施例中的算法计算耗时低,无需训练模型,即插即可用,方便应用。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置、设备、存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参见图8,为本发明实施例提供的一种表格斜线的处理装置的结构框图。如图8所示,本申请实施例提供的表格斜线的处理装置800可包括:
单元格信息获取模块810,用于获取图像表格对应的单元格信息;
直线检测处理模块820,用于根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合;
冗余过滤处理模块830,用于依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
在一可能的实施方式中,直线检测处理模块820包括:
二值化转换子模块,用于将图像表格转换为二值化图像信息;
直线检测子模块,用于根据单元格信息,对二值化图像信息进行直线检测,得到潜在直线集合;
直线过滤子模块,用于依据潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到候选斜线集合。
在一可能的实施方式中,直线检测子模块包括:
单元格遍历单元,用于基于单元格信息中的行参数和列参数,对二值化图像信息进行目标单元格遍历,得到目标单元格信息;
形状检测单元,用于利用目标单元格信息对目标单元格进行形状检测,得到潜在直线信息,潜在直线信息包含每条潜在直线的至少两个点描述信息;
潜在直线集合单元,用于基于每条潜在直线的至少两个点描述信息,生成潜在直线集合。
在一可能的实施方式中,直线过滤子模块包括:
直线斜率确定单元,用于确定潜在直线集合中的每一条潜在直线的直线斜率;
候选斜线确定单元,用于将直线斜率在斜线斜率范围内的潜在直线确定为目标斜线;
候选交点信息单元,用于依据每条目标斜线与单元格的交点,确定每条目标斜线对应的候选交点信息;
候选斜线集合单元,用于基于候选交点信息,生成候选斜线集合。
在一可能的实施方式中,候选斜线集合单元,具体用于根据候选交点信息进行交点连线处理,得到候选交点信息对应的候选斜线;并根据候选斜线生成候选斜线集合。
在一可能的实施方式中,冗余过滤处理模块830可以包括如下子模块:
候选斜线数量确定子模块,用于确定候选斜线集合中的候选斜线的数量;
冗余删除处理子模块,用于在数量大于预设数量阈值的情况下,基于候选斜线集合中任意两条候选斜线之间的夹角,对候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合;
单元格斜线确定子模块,用于将候选斜线更新集合中的所有候选斜线确定为单元格斜线;或者,用于在数量等于或小于预设数量阈值的情况下,将候选斜线集合中的候选斜线确定为单元格斜线。
在一可能的实施方式中,冗余删除处理子模块,具体用于:确定候选斜线集合中任意两条候选斜线之间的夹角;在两条候选斜线之间的夹角小于预设夹角阈值的情况下,将两条候选斜线中任一条候选斜线确定为冗余斜线,并从候选斜线集合中删除冗余斜线,直到候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。
在一可能的实施方式中,表格斜线的处理装置800还包括:初始可编辑表格模块和可编辑表格生成模块。初始可编辑表格模块可以用于根据单元格信息中的行参数和列参数,生成初始可编辑表格;可编辑表格生成模块,用于基于初始可编辑表格和单元格斜线,生成图像表格对应的可编辑表格。
需要说明的是,上述提供的表格斜线的处理装置可执行本申请任意实施例所提供的表格斜线的处理方法,具备执行方法相应的功能和有益效果。
在具体实现中,上述表格斜线的处理装置可以应用在电子设备中,使得电子设备可以准确地检测和还原图像表格中的一条或多条斜线,实现了自动还原图像表格中的单元格斜线,进一步完善表格结构的还原效果。进一步的,本申请实施例还提供一种电子设备,包括:处理器,以及用于存储处理器的可执行指令的存储器;其中,处理器被配置为执行如上述任意一个方法实施例的表格斜线的处理方法。
图9为本发明一个示例提供的一种电子设备的结构示意图,图9所示的电子设备900包括:至少一个处理器901、存储器902、至少一个网络接口904和其他用户接口903。电子设备900中的各个组件通过总线系统905耦合在一起。可理解,总线系统905用于实现这些组件之间的连接通信。总线系统905除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统905。
其中,用户接口903可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(Trackball))、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器902可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器902旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器902存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统9021和应用程序9022。
其中,操作系统9021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序9022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序9022中。
在本发明实施例中,通过调用存储器902存储的程序或指令,具体的,可以是应用程序9022中存储的程序或指令,处理器901用于执行各方法实施例所提供的方法步骤,例如包括:获取图像表格对应的单元格信息;根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合;依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
上述本发明实施例揭示的方法可以应用于处理器901中,或者由处理器901实现。处理器901可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器901中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器901可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器902,处理器901读取存储器902中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的表格斜线的处理方法。
处理器用于执行存储器中存储的单元格斜线还原程序,以实现以下在电子设备侧执行的表格斜线的处理方法的步骤,包括:获取图像表格对应的单元格信息;根据单元格信息,对图像表格进行直线检测处理,得到候选斜线集合;依据候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
需要说明的是,对于装置、设备、存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种表格斜线的处理方法,其特征在于,包括:
获取图像表格对应的单元格信息;
根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合;
依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
2.根据权利要求1所述的方法,其特征在于,所述根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合,包括:
将所述图像表格转换为二值化图像信息;
根据所述单元格信息,对所述二值化图像信息进行直线检测,得到潜在直线集合;
依据所述潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到所述候选斜线集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述单元格信息,对所述二值化图像信息进行直线检测,得到潜在直线集合,包括:
基于所述单元格信息中的行参数和列参数,对所述二值化图像信息进行目标单元格遍历,得到目标单元格信息;
利用所述目标单元格信息对目标单元格进行形状检测,得到潜在直线信息,所述潜在直线信息包含每条潜在直线的至少两个点描述信息;
基于所述每条潜在直线的至少两个点描述信息,生成所述潜在直线集合。
4.根据权利要求2所述的方法,其特征在于,所述依据所述潜在直线集合中各潜在直线的直线斜率进行直线过滤处理,得到所述候选斜线集合,包括:
确定所述潜在直线集合中的每一条潜在直线的直线斜率;
将所述直线斜率在斜线斜率范围内的潜在直线确定为目标斜线;
依据每条所述目标斜线与单元格的交点,确定每条目标斜线对应的候选交点信息;
基于所述候选交点信息,生成所述候选斜线集合。
5.根据权利要求4所述的方法,其特征在于,所述基于所述候选交点信息,生成所述候选斜线集合,包括:
根据所述候选交点信息进行交点连线处理,得到所述候选交点信息对应的候选斜线;
根据所述候选斜线生成所述候选斜线集合。
6.根据权利要求1所述的方法,其特征在于,所述依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线,包括:
确定所述候选斜线集合中的候选斜线的数量;
在所述数量大于预设数量阈值的情况下,基于所述候选斜线集合中任意两条候选斜线之间的夹角,对所述候选斜线集合中的冗余斜线进行删除处理,得到候选斜线更新集合,并将所述候选斜线更新集合中的所有候选斜线确定为所述单元格斜线;
在所述数量等于或小于所述预设数量阈值的情况下,将所述候选斜线集合中的候选斜线确定为所述单元格斜线。
7.根据权利要求6所述的方法,其特征在于,所述基于所述候选斜线集合中任意两条候选斜线之间的夹角,对所述候选斜线集合中的冗余斜线进行删除处理,包括:
确定所述候选斜线集合中任意两条候选斜线之间的夹角;
在两条候选斜线之间的夹角小于预设夹角阈值的情况下,将所述两条候选斜线中任一条候选斜线确定为冗余斜线,并从所述候选斜线集合中删除所述冗余斜线,直到所述候选斜线集合中任意两条候选斜线之间的夹角均大于或等于预设夹角阈值。
8.根据权利要求1至7任一所述的方法,其特征在于,还包括:
根据所述单元格信息中的行参数和列参数,生成初始可编辑表格;
基于所述初始可编辑表格和所述单元格斜线,生成所述图像表格对应的可编辑表格。
9.一种表格斜线的处理装置,其特征在于,包括:
单元格信息获取模块,用于获取图像表格对应的单元格信息;
直线检测处理模块,用于根据所述单元格信息,对所述图像表格进行直线检测处理,得到候选斜线集合;
冗余过滤处理模块,用于依据所述候选斜线集合中的候选斜线的数量进行斜线冗余过滤处理,得到单元格斜线。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1-8任一项所述的表格斜线的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210484167.4A CN117010351A (zh) | 2022-04-29 | 2022-04-29 | 表格斜线的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210484167.4A CN117010351A (zh) | 2022-04-29 | 2022-04-29 | 表格斜线的处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117010351A true CN117010351A (zh) | 2023-11-07 |
Family
ID=88564177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210484167.4A Pending CN117010351A (zh) | 2022-04-29 | 2022-04-29 | 表格斜线的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117010351A (zh) |
-
2022
- 2022-04-29 CN CN202210484167.4A patent/CN117010351A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210256253A1 (en) | Method and apparatus of image-to-document conversion based on ocr, device, and readable storage medium | |
CN110516577B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
JP4745830B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
CN110516665A (zh) | 识别图像叠加文字区域的神经网络模型构建方法与系统 | |
CN111460355B (zh) | 一种页面解析方法和装置 | |
CN111626145B (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
KR20160130769A (ko) | 화상을 프로세싱하기 위한 방법 및 디바이스 | |
CN111597845A (zh) | 一种二维码检测方法、装置、设备及可读存储介质 | |
CN111881659B (zh) | 表格图片的处理方法、系统、可读存储介质及计算机设备 | |
CN114529773A (zh) | 基于结构单元的表格识别方法、系统、终端及介质 | |
CN115908789A (zh) | 跨模态特征融合及渐近解码的显著性目标检测方法及装置 | |
CN111652266A (zh) | 用户界面组件的识别方法、装置、电子设备和存储介质 | |
CN110766068B (zh) | 一种验证码识别方法及计算设备 | |
CN112733855B (zh) | 表格结构化方法、表格恢复设备及具有存储功能的装置 | |
CN114359352A (zh) | 图像处理方法、装置、设备、存储介质及计算机程序产品 | |
CN117115840A (zh) | 信息提取方法、装置、电子设备和介质 | |
CN117994419A (zh) | 一种基于视觉的目标三维重建方法及系统 | |
CN112507938A (zh) | 一种文本图元的几何特征计算方法及识别方法、装置 | |
CN117010351A (zh) | 表格斜线的处理方法、装置、电子设备及存储介质 | |
CN112750065A (zh) | 载体对象处理和水印嵌入方法、装置及电子设备 | |
CN114936542B (zh) | 表格重建方法和装置、计算机可读存储介质和电子设备 | |
JP2010258627A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
CN116092105B (zh) | 表格结构的解析方法和装置 | |
CN113971770B (zh) | 针对包含边框的视频拷贝检测方法及装置 | |
CN103366340A (zh) | 图像处理设备和方法及使用其的电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |