CN112149506A - 结合rpa和ai的图像中的表格生成方法、设备及存储介质 - Google Patents

结合rpa和ai的图像中的表格生成方法、设备及存储介质 Download PDF

Info

Publication number
CN112149506A
CN112149506A CN202010863736.7A CN202010863736A CN112149506A CN 112149506 A CN112149506 A CN 112149506A CN 202010863736 A CN202010863736 A CN 202010863736A CN 112149506 A CN112149506 A CN 112149506A
Authority
CN
China
Prior art keywords
column
picture
cell
row
rendering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010863736.7A
Other languages
English (en)
Inventor
胡一川
汪冠春
褚瑞
李玮
刘晨阳
王培培
王建周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Original Assignee
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Benying Network Technology Co Ltd, Beijing Laiye Network Technology Co Ltd filed Critical Beijing Benying Network Technology Co Ltd
Priority to CN202010863736.7A priority Critical patent/CN112149506A/zh
Publication of CN112149506A publication Critical patent/CN112149506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Abstract

本申请公开了一种结合RPA和AI的图像中的表格生成方法、设备及存储介质。涉及图像识别技术领域,其中,方法包括:识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;根据行位置、列位置确定每个图片单元格的渲染位置;根据渲染位置渲染生成与每个图片单元格对应的表格单元格;在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。由此,实现了对图像中的表格的精确提取,提高对表格的编辑等场景的工作效率。

Description

结合RPA和AI的图像中的表格生成方法、设备及存储介质
技术领域
本申请涉及图像识别技术领域,具体涉及一种结合RPA(Robotic ProcessAutomation,机器人流程自动化)和AI(Artificial Intelligence,人工智能)的结合RPA和AI的的图像中的表格生成方法、设备及存储介质。
背景技术
机器人流程自动化(Robotic Process Automation,简称:RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
现有技术中,为了提高工作效率,通常会根据图像识别技术将图像中的文字信息提取出来,并将提取出的文字信息进行复制,然而,这种仅仅提取文字的方式,无法保留文字在图像上的位置关系,比如,当图像中包含表格信息时,无法得到图像中的表格,因此,需要用户手动比照图像构建表格,导致工作效率不高。
发明内容
本申请实施例申请一种结合RPA和AI的图像中的表格生成方法、设备及存储介质,实现了对图像中的表格的精确提取,提高对表格的编辑等场景的工作效率。
第一方面,本申请实施例提供一种结合RPA和AI的图像中的表格生成方法,包括:识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;根据所述行位置、列位置确定所述每个图片单元格的渲染位置;根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格;在所述表格单元格中填充对应图片单元格的内容信息,以生成与所述图片表格对应的表格。
可选的,所述识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,包括:识别所述图标表格的轮廓特征和内容特征;根据所述轮廓特征确定所述每个图片单元格的行位置、列位置;根据所述内容特征确定所述内容信息。
可选的,所述根据所述行位置、列位置确定所述每个图片单元格的渲染位置,包括:获取渲染起始点、单位行高和单位列高;根据所述渲染起始点、单位行高和单位列高,确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置。
可选的,在所述确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置之前,还包括:统计所述内容信息包含的字节数;判断所述字节数是否超过预设阈值;若超过所述预设阈值,则计算所述字节数和所述预设阈值的差值;确定与所述差值对应的行宽增长值,和/或,列高增长值,根据所述行宽增长值,和/或,列高增长值调整所述位行高和单位列高。
可选的,所述根据所述行位置、列位置确定所述每个图片单元格的渲染位置,包括:提取所述行位置的开始行编号和结束行编号,提取所述列位置中的开始列编号和结束列编号。
可选的,所述根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格,包括:根据所述开始行编号确定所述每个图片单元格对应的表格单元格的单元格行起始位置;根据所述结束行编号确定所述每个图片单元格对应的表格单元格的单元格行终止位置;根据所述开始列编号确定所述每个图片单元格对应的表格单元格的单元格列起始位置;根据所述结束列编号确定所述每个图片单元格对应的表格单元格的单元格列终止位置;根据所述单元格行起始位置、所述单元格行终止位置、所述单元格列起始位置和所述单元格列终止位置,渲染生成与所述每个图片单元格对应的表格单元格。
第二方面,本申请实施例还提供了一种结合RPA和AI的图像中的表格生成装置,包括:识别模块,用于识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;确定模块,用于根据所述行位置、列位置确定所述每个图片单元格的渲染位置;生成模块,用于根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格;填充模块,用于在所述表格单元格中填充对应图片单元格的内容信息,以生成与所述图片表格对应的表格。
可选的,所述确定模块,具体用于:获取渲染起始点、单位行高和单位列高;
根据所述渲染起始点、单位行高和单位列高,确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置。
第三方面,本申请实施例提供一种计算机设备,该计算机设备包括存储器和处理器;其中,所述存储器用于存储所述处理器的可执行指令,当所述指令被所述处理器执行时,所述处理器执行上述第一方面的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现上述第一方面所述的方法。
本申请实施例中的技术方案至少包括如下有益技术效果:
识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,根据行位置、列位置确定每个图片单元格的渲染位置,进而,根据渲染位置渲染生成与每个图片单元格对应的表格单元格,最后,在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。由此,实现了对图像中的表格的精确提取,提高对表格的编辑等场景的工作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一个实施例的结合RPA和AI的图像中的表格生成方法的流程图;
图2是根据本申请一个实施例的图片单元格示意图;
图3是根据本申请另一个实施例的结合RPA和AI的图像中的表格生成方法的流程图;
图4是根据本申请一个实施例的结合RPA和AI的图像中的表格生成场景示意图;
图5是根据本申请另一个实施例的结合RPA和AI的图像中的表格生成场景示意图;
图6是根据本申请又一个实施例的结合RPA和AI的图像中的表格生成方法的流程图;
图7是根据本申请又一个实施例的结合RPA和AI的图像中的表格生成场景示意图;
图8是根据本申请一个实施例的结合RPA和AI的图像中的表格生成装置的结构示意图;以及
图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面参考附图描述本申请实施例的结合RPA和AI的图像中的表格生成方法、设备及存储介质。
具体而言,图1是根据本申请一个实施例的结合RPA和AI的图像中的表格生成方法的流程图,如图1所示,该方法包括:
步骤101,识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息。
在本实施例中,可以使用OCR技术来识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,其中,行位置和列位置可以包括每个图片单元格的行编号和列标号等,也可以为单元格外框线的行坐标和列坐标等,其中,如图2所示,每个图片单元格为图像中每个单元格。
作为一种可能的实现方式,识别图标表格的轮廓特征和内容特征,其中,轮廓特征可以基于二值化等图像处理技术识别得到,轮廓特征包括单元格外部轮廓的坐标信息等,内容特征可以适是基于OCR技术识别得到的文字内容,以及文字内容的坐标信息等。
进而,根据轮廓特征确定每个图片单元格的行位置、列位置,行位置和列位置可以理解为识别得到的所有图片单元格中的轮廓特征对应的行轮廓线中,每个图片单元格的轮廓线对应的行的顺序编号,也可以为在行轮廓在图片中的坐标位置等,同样的,识别得到的所有图片单元格中的轮廓特征对应的列轮廓线中,每个图片单元格的列轮廓对应的列的顺序编号,也可以为在列轮廓在图片中的坐标位置等。
根据内容特征确定内容信息,该内容信息包括与内容的坐标信息对应的文字内容。
作为另一种可能的实现方式,可以预先训练得到表格识别模型,根据表格识别模型,提取出每个图片单元格的行位置、列位置和内容信息。
步骤102,根据行位置、列位置确定每个图片单元格的渲染位置。
应当理解的是,当行位置、列位置确定后,显然图片表格中的单元格布局清晰体现,从而,可以根据行位置、列位置确定每个图片单元格的渲染位置。
需要说明的是,在不同的应用场景中,根据行位置、列位置确定每个图片单元格的渲染位置的方式不同,示例如下:
作为可能的一种实现方式,如图3所示,根据行位置、列位置确定每个图片单元格的渲染位置,包括:
步骤201,获取渲染起始点、单位行高和单位列高。
其中,渲染起始点可以理解为在当前工作场景中,表格可以填入的坐标起始点,比如,当工作场景为在网页的前端绘制对应的表格,则渲染起始点为对应页面下与页面布局匹配的表格插入起始点,其中单位行高和单位列高为在当前工作场景下,默认的行高和列高。
上述渲染起始点对应于两个延伸方向,一个列的延伸方向,一个是行的延伸方向。
步骤202,根据渲染起始点、单位行高和单位列高,确定行位置对应的渲染行位置,以及列位置对应的渲染列位置。
在本实施例中,根据渲染起始点、单位行高和单位列高,确定行位置对应的渲染行位置,以及列位置对应的渲染列位置。
如图4所示,当行位置为行编号时,可以确定行位置对应的行数,比如,行位置为行编号,则对应的行编号为1,列位置为列编号,比如,列位置为1,则确定渲染行位置为第一行,渲染列位置为第一列。
当然,在本实施例中,行编号也可以为多行,比如行编号为1-2,列编号为1-3,渲染行位置和渲染列位置如图5所示。
在实际执行过程中,当内容信息较多时,显然若是以预先设置的单位行高和单位列高来绘制表格会导致内容信息显示不安全,因此,在本申请的一个事实中,还可以根据内容信息来调整对应单元格的单位行高和单位列高。
在本实施例中,如图6所示,在确定行位置对应的渲染行位置,以及列位置对应的渲染列位置之前,还包括:
步骤301,统计内容信息包含的字节数。
在本实施例中,当获取到内容信息后,确定内容信息包含的字节数。
步骤302,判断字节数是否超过预设阈值。
上述预设阈值可以理解是与一行一列的显示区域大小对应的,如当表格单元格不是一行一列,则根据所占面积与一行一列的显示区域的比值,将该比值与预设的一行一列的单位预设阈值的乘积获取的。
步骤303,若超过预设阈值,则计算字节数和预设阈值的差值。
在本实施例中,若是不超过预设阈值,则不调整行高和列高。
若是超过预设阈值,则计算字节数和预设阈值的差值,以便于根据该差值调整行高或者列高。
步骤304,确定与差值对应的行宽增长值,和/或,列高增长值,根据行宽增长值调整单位行高,和/或,根据列高增长值调整单位列高。
在本实施例中,确定与差值对应的行宽增长值,和/或,列高增长值,根据行宽增长值,和/或,列高增长值调整位行高和/或单位列高。
需要说明的是,在不同的应用场景中,确定与差值对应的行宽增长值,和/或,列高增长值的方式不同,示例如下:
示例一:
在本示例中,为了保证表格的显示效果,同时调整单位行宽和单位列高即预先构建差值范围与单位行宽和单位列高的增长值,其中,单位行宽的增长值和单位列高的增长值可以相同,也可以不同,可由用户自定义设置,进而,查询上述预先构建的关系,确定单位行宽和单位列高的增长值。
示例二:
在本示例中,为了满足个性化的表格需求,可以确定差值是属于预设的第一范围还是第二范围,要是属于第一范围,则查询预设的第一对应关系,确定与差值对应的行宽增长值,仅仅调节行宽,若是差值属于预设的第二范围,则查询预设的第二对应关系,确定与差值对应的列高增长值。
作为另一种可能的实现方式,提取行位置中的开始行编号和结束行编号,提取列位置中的开始列编号和结束列编号,其中,行编号、列编号的确定方式可参照上述实施例,在此不再赘述。行编号、列编号都是基于图像识别技术是被图片单元格的轮廓特征等得到的。
在本实施例中,识别每个图片单元格在对应表格下跨越的行和列,根据跨越的最小行编号和最大行编号,可以获知对应图片单元格的跨越行数,同理,根据跨越的最小列编号和最大列编号,可以获知对应图片单元格的跨越列数,其中,如图7所示,可以对于图片表格1而言,根据轮廓特征确定每个单元格的显示区域,将显示区域最小的单元格作为图片表格的单位单元格,将单位单元格的列高作为参考单位列高,将单位单元格的行宽作为参考单位行宽,确定每个图片单元格的实际行宽和实际列高,进而,对每个图片单元格的边界轮廓线和对应的参考单位列高和参考单位行宽确定开始行编号、结束行编号、开始列编号和结束列编号。
继续以图7为例,对于图片单元格A而言,其上边界1与图片表格上边界的跨越宽度为a,下边界2与图片表格的上边界的跨越宽度为b,左边界3与图片表格左边界的跨越宽度为c,右边界4与图片表格右边界的跨越宽度为d,则将a与参考单位行宽的比值作为开始行编号,将b与参考单位行宽的比值作为结束行编号,将c与参考单位列宽的比值作为开始列编号,将d与参考单位列宽的比值作为结束列编号。
步骤103,根据渲染位置渲染生成与每个图片单元格对应的表格单元格。
在确定渲染位置后,根据渲染位置渲染生成与每个图片单元格对应的表格单元格。
作为一种可能的实现方式,当渲染位置为上述提到的行编号和列编号时,则根据开始行编号确定每个图片单元格对应的表格单元格的单元格行起始位置,比如,预先标注行开始绘制位置,以及从第一行到底N行的起始位置,其中,N为图片表格的总行数,从而,根据预设标注的每一行的起始位置,确定与开始行编号对应的起始位置为单元格行起始位置。
进而,根据预设标注的每一行的起始位置,确定与结束行编号对应的起始位置为单元格行终止位置。
预先还标注了从第一列到底M列的起始位置,其中,M为图片表格的总列数,从而,根据预设标注的每一列的起始位置,确定与开始列编号对应的起始位置为单元格列起始位置。
进而,根据预设标注的每一列的起始位置,确定与结束列编号对应的起始位置为单元格列终止位置。
进而,根据单元格行起始位置、单元格行终止位置、单元格列起始位置和单元格列终止位置,渲染生成与每个图片单元格对应的表格单元格。
其中,为了进一步提高表格的渲染效率,还可以记录逐行渲染表格,判断当前渲染的表格单元的结束列编号是否为M,以及结束行编号是否为N等,若是为M,但是不为N,则切换行进行下一列表格的渲染等,其中,在渲染表格单元格时,对于跨越多行或者多列的表格单元格,进行合并操作仅仅保留单元格的最外围轮廓线条。
步骤104,在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。
正如以上提到的,内容信息与图片单元格对应,因此,在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。其中,该表格由于不再是图片格式,因此,可以满足对表格的编辑需求,大大提高了工作效率。
需要说明的是,本实施例中是在渲染出具体的表格单元后填充具体的内容信息,不会导致内容信息被覆盖,且在实际应用中,可将OCR数据转化成前端可视化页面中的表格,这种表格识别方法在代码中实现简单,对于员工只要掌握了方法,实现成本较低。且这种方法的通用于所有OCR识别数据,解决了之前对于某些特定形式的表格,前端无法生成的问题。企业可以通过这种表格识别技术去高效,通用的生成所有表格页面。
综上,本申请实施例的结合RPA和AI的图像中的表格生成方法,识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,根据行位置、列位置确定每个图片单元格的渲染位置,进而,根据渲染位置渲染生成与每个图片单元格对应的表格单元格,最后,在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。由此,实现了对图像中的表格的精确提取,提高对表格的编辑等场景的工作效率。
为了实现上述实施例,本申请还提出了一种结合RPA和AI的图像中的表格生成装置。图8是根据本申请一个实施例的结合RPA和AI的图像中的表格生成装置的结构示意图,如图8所示,该结合RPA和AI的图像中的表格生成装置包括:识别模块810、确定模块820、生成模块830和填充模块840,其中,
识别模块810,用于识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;
确定模块820,用于根据所述行位置、列位置确定所述每个图片单元格的渲染位置;
生成模块830,用于根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格;
填充模块840,用于在所述表格单元格中填充对应图片单元格的内容信息,以生成与所述图片表格对应的表格。
在本申请的一个实施例中,确定模块820,具体用于:
获取渲染起始点、单位行高和单位列高;
根据所述渲染起始点、单位行高和单位列高,确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置。
需要说明的是,前述对方法的解释说明书,也适用于对本申请实施例中对装置的解释说明,其实现原理类似,在此不再赘述。
综上,本申请实施例的结合RPA和AI的图像中的表格生成装置,识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,根据行位置、列位置确定每个图片单元格的渲染位置,进而,根据渲染位置渲染生成与每个图片单元格对应的表格单元格,最后,在表格单元格中填充对应图片单元格的内容信息,以生成与图片表格对应的表格。由此,实现了对图像中的表格的精确提取,提高对表格的编辑等场景的工作效率。
图9是本申请实施例提供的一种计算机设备的结构示意图。计算机设备90包括存储器91和处理器92;其中,所述存储器91用于存储所述处理器52的可执行指令,当所述指令被所述处理器92执行时,所述处理器92执行上述方法实施例提供的方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现上述方法实施例所述的方法。
需要说明的是,本申请上述的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本申请的上下文中,机器可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读存储介质可以是机器可读信号介质或机器可读储存介质。机器可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的申请范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
为了使得本实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

Claims (10)

1.一种结合RPA和AI的图像中的表格生成方法,其特征在于,包括:
识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;
根据所述行位置、列位置确定所述每个图片单元格的渲染位置;
根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格;
在所述表格单元格中填充对应图片单元格的内容信息,以生成与所述图片表格对应的表格。
2.如权利要求1所述的方法,其特征在于,所述识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息,包括:
识别所述图标表格的轮廓特征和内容特征;
根据所述轮廓特征确定所述每个图片单元格的行位置、列位置;
根据所述内容特征确定所述内容信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述行位置、列位置确定所述每个图片单元格的渲染位置,包括:
获取渲染起始点、单位行高和单位列高;
根据所述渲染起始点、单位行高和单位列高,确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置。
4.如权利要求3所述的方法,其特征在于,在所述确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置之前,还包括:
统计所述内容信息包含的字节数;
判断所述字节数是否超过预设阈值;
若超过所述预设阈值,则计算所述字节数和所述预设阈值的差值;
确定与所述差值对应的行宽增长值,和/或,列高增长值,根据所述行宽增长值调整所述单位行高,和/或,根据所述列高增长值调整所述单位列高。
5.如权利要求1所述的方法,其特征在于,所述根据所述行位置、列位置确定所述每个图片单元格的渲染位置,包括:
提取所述行位置的开始行编号和结束行编号,提取所述列位置中的开始列编号和结束列编号。
6.如权利要求5所述的方法,其特征在于,所述根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格,包括:
根据所述开始行编号确定所述每个图片单元格对应的表格单元格的单元格行起始位置;
根据所述结束行编号确定所述每个图片单元格对应的表格单元格的单元格行终止位置;
根据所述开始列编号确定所述每个图片单元格对应的表格单元格的单元格列起始位置;
根据所述结束列编号确定所述每个图片单元格对应的表格单元格的单元格列终止位置;
根据所述单元格行起始位置、所述单元格行终止位置、所述单元格列起始位置和所述单元格列终止位置,渲染生成与所述每个图片单元格对应的表格单元格。
7.一种结合RPA和AI的图像中的表格生成装置,其特征在于,包括:
识别模块,用于识别图像中图片表格的每个图片单元格的行位置、列位置和内容信息;
确定模块,用于根据所述行位置、列位置确定所述每个图片单元格的渲染位置;
生成模块,用于根据所述渲染位置渲染生成与所述每个图片单元格对应的表格单元格;
填充模块,用于在所述表格单元格中填充对应图片单元格的内容信息,以生成与所述图片表格对应的表格。
8.如权利要求7所述的装置,其特征在于,所述确定模块,具体用于:
获取渲染起始点、单位行高和单位列高;
根据所述渲染起始点、单位行高和单位列高,确定所述行位置对应的渲染行位置,以及所述列位置对应的渲染列位置。
9.一种计算机设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储所述处理器的可执行指令,当所述指令被所述处理器执行时,所述处理器执行权利要求1-6中任一项所述的结合RPA和AI的图像中的表格生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现如权利要求1至6中任一项所述的结合RPA和AI的图像中的表格生成方法。
CN202010863736.7A 2020-08-25 2020-08-25 结合rpa和ai的图像中的表格生成方法、设备及存储介质 Pending CN112149506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010863736.7A CN112149506A (zh) 2020-08-25 2020-08-25 结合rpa和ai的图像中的表格生成方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010863736.7A CN112149506A (zh) 2020-08-25 2020-08-25 结合rpa和ai的图像中的表格生成方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112149506A true CN112149506A (zh) 2020-12-29

Family

ID=73888175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010863736.7A Pending CN112149506A (zh) 2020-08-25 2020-08-25 结合rpa和ai的图像中的表格生成方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112149506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926286A (zh) * 2021-04-02 2021-06-08 方正国际软件(北京)有限公司 一种动态表格生成方法与系统
CN113191131A (zh) * 2021-05-10 2021-07-30 重庆中科云从科技有限公司 用于文本识别的表格模板建立方法、文本识别方法、系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110164813A1 (en) * 2010-01-06 2011-07-07 Canon Kabushiki Kaisha Apparatus and method for digitizing documents
CN109344831A (zh) * 2018-08-22 2019-02-15 中国平安人寿保险股份有限公司 一种数据表识别方法、装置及终端设备
CN109961008A (zh) * 2019-02-13 2019-07-02 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质
CN110390269A (zh) * 2019-06-26 2019-10-29 平安科技(深圳)有限公司 Pdf文档表格提取方法、装置、设备及计算机可读存储介质
US20190354720A1 (en) * 2017-06-30 2019-11-21 Accenture Global Solutions Limited Artificial intelligence based document processor
CN111368638A (zh) * 2020-02-10 2020-07-03 深圳追一科技有限公司 电子表格的创建方法、装置、计算机设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110164813A1 (en) * 2010-01-06 2011-07-07 Canon Kabushiki Kaisha Apparatus and method for digitizing documents
US20190354720A1 (en) * 2017-06-30 2019-11-21 Accenture Global Solutions Limited Artificial intelligence based document processor
CN109344831A (zh) * 2018-08-22 2019-02-15 中国平安人寿保险股份有限公司 一种数据表识别方法、装置及终端设备
CN109961008A (zh) * 2019-02-13 2019-07-02 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质
CN110390269A (zh) * 2019-06-26 2019-10-29 平安科技(深圳)有限公司 Pdf文档表格提取方法、装置、设备及计算机可读存储介质
CN111368638A (zh) * 2020-02-10 2020-07-03 深圳追一科技有限公司 电子表格的创建方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926286A (zh) * 2021-04-02 2021-06-08 方正国际软件(北京)有限公司 一种动态表格生成方法与系统
CN113191131A (zh) * 2021-05-10 2021-07-30 重庆中科云从科技有限公司 用于文本识别的表格模板建立方法、文本识别方法、系统

Similar Documents

Publication Publication Date Title
CN110163198A (zh) 一种表格识别重建方法、装置和存储介质
CN111240669B (zh) 界面生成方法、装置、电子设备及计算机存储介质
CN112149506A (zh) 结合rpa和ai的图像中的表格生成方法、设备及存储介质
CN110738200A (zh) 车道线3d点云地图构建方法、电子设备及存储介质
CN111860389A (zh) 数据处理方法、电子设备及计算机可读介质
CN111967449B (zh) 文本检测方法、电子设备及计算机可读介质
CN112966040A (zh) 一种转换数据结构的方法、装置、终端以及存储介质
CN116129126A (zh) 分割预测模型的构建方法、图片语义分割标注方法及装置
CN110059696B (zh) 一种图像标注方法、装置和计算机可读存储介质
CN116167910B (zh) 文本编辑方法、装置、计算机设备及计算机可读存储介质
CN111666954A (zh) 一种显著区域的联合学习提取方法及系统
CN116361502A (zh) 一种图像检索方法、装置、计算机设备及存储介质
CN111325212A (zh) 模型训练方法、装置、电子设备和计算机可读存储介质
CN116245052A (zh) 一种图纸迁移方法、装置、设备和存储介质
CN115937492A (zh) 一种基于特征识别的变电设备红外图像识别方法
CN113361462B (zh) 视频处理和字幕检测模型的方法及装置
CN111753108B (zh) 演示文稿生成方法、装置、设备及介质
CN115063478A (zh) 基于rgb-d相机和视觉定位的水果定位方法、系统、设备及介质
CN114494302A (zh) 图像处理方法、装置、设备及存储介质
CN114332599A (zh) 图像识别方法、装置、计算机设备、存储介质和产品
CN107452067A (zh) 基于增强现实的演示方法、装置及终端设备
CN112988932A (zh) 高精地图标注方法、装置、设备、可读存储介质及产品
CN114820885B (zh) 图像编辑方法及其模型训练方法、装置、设备和介质
CN117315406B (zh) 一种样本图像处理方法、装置及设备
CN113360712B (zh) 视频表示的生成方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination