CN111144081B - 表单生成方法、装置、存储介质及电子设备 - Google Patents

表单生成方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111144081B
CN111144081B CN201911261658.7A CN201911261658A CN111144081B CN 111144081 B CN111144081 B CN 111144081B CN 201911261658 A CN201911261658 A CN 201911261658A CN 111144081 B CN111144081 B CN 111144081B
Authority
CN
China
Prior art keywords
target
image
item
line segment
vertical line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911261658.7A
Other languages
English (en)
Other versions
CN111144081A (zh
Inventor
周学飞
赵振国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201911261658.7A priority Critical patent/CN111144081B/zh
Publication of CN111144081A publication Critical patent/CN111144081A/zh
Application granted granted Critical
Publication of CN111144081B publication Critical patent/CN111144081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开涉及一种表单生成方法、装置、存储介质及电子设备,以解决相关技术在生成表单的过程中耗费大量人力成本和时间成本的问题,提高表单生成效率。该方法包括:获取显示内容为待生成的目标表单的图像;在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;识别所述图像中表单项包括的文字信息,并识别所述图像中表单项对应的控件信息;将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。

Description

表单生成方法、装置、存储介质及电子设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种表单生成方法、装置、存储介质及电子设备。
背景技术
表单是实现无纸化办公的重要工具,主要用于接收用户输入的信息。比如,在提交请假申请的过程中,请假人员可以通过表单填写请假事由以及请假时间,等等。在设计表单的过程中,相关技术通常是先确定表单中需要填写的内容,然后根据表单中待填写的内容,手动绘制表单。在该过程中,需要较多的人为干预,若待生成的表单数量众多,则需要耗费大量的人力成本和时间成本进行表单的绘制。
发明内容
本公开的目的是提供一种表单生成方法、装置、存储介质及电子设备,以解决相关技术在生成表单的过程中耗费大量人力成本和时间成本的问题。
为了实现上述目的,第一方面,本公开提供一种表单生成方法,所述方法包括:
获取显示内容为待生成的目标表单的图像;
在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;
识别所述图像中表单项包括的文字信息,并识别所述图像中表单项对应的控件信息;
将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。
可选地,所述识别所述图像中表单项包括的文字信息,包括:
按行识别所述图像中包括的水平线段以及表单项包括的文字信息;
所述将所述文字信息添加到所述目标表单模板的对应表单项中,包括:
根据所述文字信息与所述水平线段的相对位置,在所述图像包括的目标表单中确定所述文字信息对应的表单项的坐标;
在所述目标表单模板中,确定所述坐标对应的表单项,并将所述文字信息添加到所述表单项中。
可选地,所述识别所述图像中表单项对应的控件信息,包括:
按列识别所述图像中的垂直线段以及所述垂直线段右侧的表单内容;
根据所述垂直线段右侧的表单内容的类型,对所述垂直线段右侧的表单项添加文字占位符或者空白占位符;
针对左侧包括文字占位符的垂直线段,根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息。
可选地,所述根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息,包括:
若所述垂直线段右侧的占位符为空白占位符,且所述空白占位符右侧不包括其他空白占位符,则确定所述垂直线段右侧的表单项对应的控件为用于输入文本信息的文本控件;
若所述垂直线段右侧的占位符为文字占位符,则确定所述垂直线段右侧的表单项对应的控件为用于进行选择的选择框控件。
可选地,所述方法还包括:
针对左侧包括空白占位符的垂直线段,若所述垂直线段右侧的占位符为空白占位符,且所述垂直线段周围包括多个空白占位符,则确定所述垂直线段两侧的表单项对应的控件为表格控件。
可选地,所述在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,包括:
针对多个预设表单模板中的每个预设表单模板,分别将所述预设表单模板的表单宽度以及表单高度进行等比例调整,以使所述预设表单模板的表单宽度与所述图像中目标表单的宽度相等、以及所述预设表单模板的表单高度与所述图像中目标表单的高度相等;
在所述多个预设表单模板中,确定与所述图像包括的目标表单具有相同列数和相同行数的目标表单模板。
可选地,所述在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,包括:
在多个预设表单模板中,确定与所述图像中目标表单的相似度达到预设相似度的初始表单模板;
在所述初始表单模板中,确定与所述图像包括的目标表单具有相同表单项坐标但表单项宽度和/或表单项高度不同的差异表单项;
对所述初始表单模板进行调整,以使所述差异表单项的表单项宽度和表单项高度与所述图像包括的目标表单中与所述差异表单项具有相同表单项坐标的表单项一致;
将调整后的初始表单模板确定为与所述图像中目标表单最相似的目标表单模板。
第二方面,本公开实施例提供一种表单生成装置,所述装置包括:
获取模块,用于获取显示内容为待生成的目标表单的图像;
确定模块,用于在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;
识别模块,用于识别所述图像中表单项包括的文字信息,并识别所述图像中表单项对应的控件信息;
生成模块,用于将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。
第三方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项所述方法的步骤。
第四方面,本公开实施例还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面中任一项所述方法的步骤。
通过上述技术方案,在获取到显示内容为待生成的目标表单的图像后,可以在多个预设表单模板中,确定与该图像中目标表单最相似的目标表单模板。然后可以识别该图像中表单项包括的文字信息,并识别该图像中表单项对应的控件信息。由于目标表单模板的各表单项可以与图像中目标表单的表单项一一对应,因此可以将识别出的文字信息添加到目标表单模板的对应表单项中,并根据识别得到的控件信息,对目标表单模板中的对应表单项添加表单控件,从而生成目标表单。通过这样的方式,可以基于图像而自动生成表单,减少了生成表单过程中的人为干预,从而可以避免生成表单过程中耗费大量人力成本和时间成本的问题,提高表单生成效率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种表单生成方法的流程图;
图2是根据本公开一示例性实施例示出的一种表单生成方法中的预设表单模板的示意图;
图3是根据本公开一示例性实施例示出的一种表单生成方法中获取到的显示内容为待生成的目标表单的图像;
图4是根据图3所示的图像按行识别得到的结果示意图;
图5是根据图3所示的图像按列识别得到的结果示意图;
图6是根据本公开另一示例性实施例示出的一种表单生成方法的流程图;
图7是根据本公开一示例性实施例示出的一种表单生成装置的框图;
图8是根据本公开一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
表单是实现无纸化办公的重要工具,主要用于接收用户输入的信息。比如,在提交请假申请的过程中,请假人员可以通过表单填写请假事由以及请假时间,等等。在设计表单的过程中,相关技术通常是先根据实际业务情况设计待生成表单的图像,然后人工根据该图像,在表单制作应用程序中手动绘制表单,比如通过用户手动输入的方式为表单添加文字信息,或者在表单制作应用程序中通过用户的拖拽、点击等操作为表单添加控件,等等。由此可见,相关技术的表单生成方式需要较多的人为干预,若待生成的表单数量众多,则需要耗费大量的人力成本和时间成本进行表单的绘制。
有鉴于此,本公开实施例提供一种表单生成方法、装置、存储介质及电子设备,以解决相关技术在生成表单的过程中耗费大量人力成本和时间成本的问题,提高表单生成效率。
首先应当理解的是,本公开实施例中的表单生成方法可以应用于电子设备,该电子设备可以是电脑、手机等不同类型的电子设备,本公开实施例对此不作限定。
图1是根据本公开一示例性实施例示出的一种表单生成方法的流程图。参照图1,该表单生成方法可以包括:
步骤101,获取显示内容为待生成的目标表单的图像。
步骤102,在多个预设表单模板中,确定与该图像中目标表单最相似的目标表单模板。其中,目标表单模板的各表单项与该图像中目标表单的表单项一一对应。
步骤103,识别该图像中表单项包括的文字信息,并识别该图像中表单项对应的控件信息。
步骤104,将文字信息添加到目标表单模板的对应表单项中,并根据控件信息,对目标表单模板中的对应表单项添加表单控件,生成目标表单。
通过上述方式,可以基于图像而自动生成表单,减少了生成表单过程中的人为干预,从而可以避免生成表单过程中耗费大量人力和时间的问题,提高表单的生成效率。
为了使得本领域技术人员更加理解本公开实施例中的表单生成方法,下面对上述各步骤进行详细举例说明。
示例地,步骤101中的图像可以是用户预先输入并存储到电子设备中的。在此种情况下,电子设备可以从内存中获取显示内容为待生成的目标表单的图像。或者,步骤101中的图像可以是用户实时输入到电子设备中的,在此种情况下,电子设备可以响应于用户的输入,接收显示内容为待生成的目标表单的图像,等等,本公开实施例对此不作限定。
在获取到显示内容为待生成的目标表单的图像后,可以在多个预设表单模板中,确定与该图像中目标表单最相似的目标表单模板。示例地,预设表单模板可以是根据不同的业务情况而预先设定的具有不同行数和不同列数的表单。比如,预设表单模板可以包括四行两列的表单、四行四列的表单、五行两列的表单等等,本公开实施例对此不作限定。应当理解的是,预设表单模板可以是具有M行N列(M与N均为正整数)、且包括M×N个表单项的标准化表单。
在一种可能的方式中,若图像中的目标表单为M行N列、且包括M×N个表单项的标准化表单,那么在多个预设表单模板中,确定与该图像中目标表单最相似的目标表单模板,可以是:先针对多个预设表单模板中的每个预设表单模板,分别将预设表单模板的表单宽度以及表单高度进行等比例调整,以使预设表单模板的表单宽度与图像中目标表单的宽度相等、以及预设表单模板的表单高度与图像中目标表单的高度相等。然后,可以在多个预设表单模板中,确定与图像包括的目标表单中具有相同列数和相同行数的目标表单模板。
也即是说,在将图像中的目标表单与预设表单模板进行比对之前,可以先将每个预设表单模板的表单宽度以及表单高度进行等比例调整,比如,可以在保持表单宽度与表单高度间的比例不变的情况下,将每个预设表单模板的表单宽度以及表单高度同时进行放大操作或者缩小操作,从而使得预设表单模板的表单宽度与图像中目标表单的宽度相等、以及预设表单模板的表单高度与图像中目标表单的高度相等。
在预设表单模板的表单高度与表单宽度均与图像中目标表单相同的情况下,可以分别将每个预设表单模板的行数和列数依次与图像中目标表单的行数和列数进行比对。具体地,可以先通过图像识别确定图像中目标表单包括的水平线段的数量以及竖直线段的数量,以确定图像中目标表单的行数和列数,然后根据该行数和列数在预设表单模板中进行匹配,从而确定具有相同行数和相同列数的目标表单模板。
在另一种可能的方式中,对于图像中具有M行×N列的目标表单,可能由于实际业务情况,对某些表单项进行了合并操作,那么目标表单中可能并未包括M×N个表单项,按照上述确定目标表单模板的方式则可能无法保证目标表单模板中的表单项与图像中目标表单的表单项一一对应。
为了解决该问题,可以在多个预设表单模板中,确定与图像中目标表单的相似度达到预设相似度的初始表单模板。然后在初始表单模板中,确定与该图像包括的目标表单具有相同表单项坐标但表单项宽度和/或表单项高度不同的差异表单项,并对初始表单模板进行调整,以使差异表单项的表单项宽度和表单项高度与图像包括的目标表单中与该差异表单项具有相同表单项坐标的表单项一致。最后可以将调整后的初始表单模板确定为与图像中目标表单最相似的目标表单模板。
示例地,预设相似度可以是根据实际情况而设定的,本公开实施例对此不作限定。在可能的方式中,预设相似度可以通过预设表单模板中与图像中目标表单具有相同表单项坐标、且表单项宽度以及表单项高度分别相同的目标表单项的比例进行表示。具体的,可以按照从左往右、从上到下的顺序,从第一行第一列的表单项开始,依次将预设表单模板的表单项与图像中目标表单的表单项进行比对,确定预设表单模板中与图像中目标表单具有相同表单项坐标、且表单项宽度以及表单项高度分别相同的目标表单项。若目标表单项的数量占预设表单模板中所有表单项的比例达到预设比例,则可以确定该预设表单模板为初始表单模板。
示例地,表单项坐标可以是用于表征表单项位于表单第几行第几列的位置信息。比如,表单项A的表单项坐标为(1行,3列),则可以确定表单项A位于表单的第1行第3列。另外,预设比例可以是根据实际情况设定的,比如可以将预设比例设定为80%,或者,可以将预设比例设定为70%,等等,本公开实施例对此不作限定。应当理解的是,如果存在多个预设表单模板中目标表单项的比例均达到预设比例,则可以随机确定一个预设表单模板为初始表单模板,或者响应于用户的选择确定一个预设表单模板为初始表单模板,等等,本公开实施例对此不作限定。
在确定初始表单模板之后,可以在初始表单模板中,确定与图像中目标表单具有相同表单项坐标但宽度和/或高度不同的差异表单项。示例地,如果是按照上述根据目标表单项所占比例而确定的初始表单模板,那么可以直接将初始表单模板中除目标表单项以外的其他表单项确定为差异表单项。
或者,如果是按照其他方式确定初始表单模板的,则可以按照从左往右、从上到下的顺序,从第一行第一列的表单项开始,依次将初始表单模板的表单项与图像中目标表单的表单项进行比对,从而确定初始表单模板中与图像包括的目标表单具有相同表单项坐标但宽度和/或高度不同的差异表单项。例如,初始表单模板如图2所示,图像中的目标表单如图3所示,对于第一行第二列表单项,在初始表单模板中,该表单项仅占据第一行的小部分宽度,而在图像包括的目标表单中,该表单项占据了第一行的大部分宽度,因此可以确定初始表单模板中的该表单项为差异表单项。
应当理解的是,针对只有初始表单模板具有的表单项坐标对应的表单项,由于图像中的目标表单不具有对应的表单项坐标,因此可以忽略比对。比如,针对图2所示的第一行第三列至第一行第六列的表单项,由于图像中目标表单没有对应表单项坐标的表单项,因此可以忽略比对,也即是说在比对完第一行第一列的表单项之后,下一次可以比对第二行第一列的表单项。
在确定差异表单项之后,可以对初始表单模板进行调整。比如,上述举例中差异表单项为第一行第二列表单项的情况,由于在图像包括的目标表单中该表单项占据了第一行中除第一列以外的宽度,因此可以针对初始表单模板中第一行第二列表单项至第一行第六列的表单项进行合并操作,以使得初始表单模板中的第一行第二列的表单项也占据第一行中除第一列以外的宽度。当然,在其他可能的方式中,也可以通过增加或减小差异表单项的宽度、或者增加或减小差异表单项的高度的方式,对初始表单模板进行调整,等等,本公开实施例对此不作限定。
通过上述方式,针对不同图像中目标表单的不同类型,可以采用不同的方式确定与图像中目标表单最相似的目标表单模板,从而根据该目标表单模板进行表单的自动生成,提高表单生成效率。
在确定目标表单模板之后,可以识别图像中表单项包括的文字信息,并识别图像中表单项对应的控件信息。然后,可以将文字信息添加到目标表单模板的对应表单项中,并根据控件信息,对目标表单模板中的对应表单项添加表单控件,从而生成目标表单。
在一种可能的方式中,可以按行识别图像中包括的水平线段以及表单项包括的文字信息。相应地,将文字信息添加到目标表单模板的对应表单项中可以是:根据文字信息与水平线段的相对位置,在图像包括的目标表单中确定文字信息对应的表单项的坐标。然后,在目标表单模板中,确定该坐标对应的表单项,并将文字信息添加到该表单项中。
示例地,根据文字信息与水平线段的相对位置,在图像包括的目标表单中确定文字信息对应的表单项的坐标,可以是:先确定位于文字信息上方的第一水平线段以及位于文字信息下方的第二水平线段,再根据第一水平线段以及第二水平线段在所有水平线段中的位置,确定该文字信息在表单中的行位置。然后,可以根据文字信息相对于第一水平线段的长度或第二水平线段的长度的比例位置以及表单的总列数,确定该文字信息在表单中的列位置。
例如,图像中的目标表单如图3所示,按行识别图像中包括的水平线段以及表单项包括的文字信息后,可以得到如图4所示的内容。参照图4,针对文字信息“申请单位”,可以确定该文字信息位于第一条(按照从上往下的顺序)水平线段和第二条水平线段之间,从而可以确定该文字信息位于表单的第一行。然后,由于该文字信息相对于第一条水平线段长度的比例位置为六分之一处,并且由于该图像中的目标表单最多包括六列,因此可以确定该文字信息位于表单的第一列,从而可以确定该文字信息对应的表单项的坐标为(1行,1列)。
应当理解的是,在本公开具体实施时,也可以通过其他可能的方式在图像包括的目标表单中确定文字信息对应的表单项的坐标,本公开实施例对此不作限定。
在确定文字信息对应的表单项的坐标之后,可以在目标表单模板中,确定该坐标对应的表单项,然后分别将文字信息添加到对应的表单项中,通过这样的方式,无需用户手动输入表单的文字信息,减少了表单生成过程中的人为干预,从而可以提高表单的生成效率。
在实际应用中,表单除了包括文字信息,还包括不同类型的表单控件,通过这些表单控件可以收集用户填写的信息。因此,在本公开实施例中,还可以识别图像中表单项对应的控件信息,然后根据控件信息,对目标表单模板中的对应表单项添加表单控件,从而生成目标表单。
应当理解的是,表单大多具有规则的列数,比如通常是两列、四列或者六列等偶数列,并且对于表单中的奇数列,比如第一列、第三列等,通常是用于提示用户输入内容的提示文字,而对于表单中的偶数列,比如第二列、第四列等,通常是用于收集用户填写的信息的表单控件。因此,在本公开施例中识别表单项对应的控件信息可以是:将表单分为两列一组,先识别表单中的垂直线段以及垂直线段右侧的内容,然后根据垂直线段以及垂直线段右侧的内容,确定垂直线段右侧的表单项待添加的控件。
具体地,可以按列识别图像中的垂直线段以及垂直线段右侧的表单内容,然后根据垂直线段右侧的表单内容的类型,对垂直线段右侧的表单项添加文字占位符或者空白占位符。最后,针对左侧包括文字占位符的垂直线段,根据垂直线段右侧的占位符类型,确定垂直线段右侧的表单项对应的控件信息。
示例地,按列识别图像中的垂直线段可以是:针对每一列表单项,从上往下识别每一个表单项包括的竖直线段,并为每个表单项对应的竖直线段添加用于表征该表单项坐标的标识信息,从而后续可以根据该标识信息确定垂直线段右侧的表单项的坐标,进而在目标表单模板中确定对应的表单项。应当理解的是,垂直线段右侧可以是该垂直线段以及与该垂直线段距离最近的右侧垂直线段之间的区域。同样的,垂直线段左侧可以是该垂直线段以及与该垂直线段距离最近的左侧垂直线段之间的区域。
例如,图像中的目标表单如图3所示,按列识别了该图像中的垂直线段以及垂直线段右侧的表单内容,并根据垂直线段右侧的表单内容的类型,对垂直线段右侧的表单项添加了文字占位符或者空白占位符,最终可以得到如图5所示的结果。参照图5,对于左侧包括文字占位符的垂直线段,可以根据该垂直线段右侧的占位符类型,确定该垂直线段右侧的表单项对应的控件信息。
在一种可能的方式中,若垂直线段右侧的占位符为空白占位符,且该空白占位符右侧不包括其他空白占位符,则可以确定该垂直线段右侧的表单项对应的控件为用于输入文本信息的文本控件。若垂直线段右侧的占位符为文字占位符,则可以确定垂直线段右侧的表单项对应的控件为用于进行选择的选择框控件。
例如,参照图5,对于垂直线段L1,其右侧为空白占位符,则可以确定垂直线段L1右侧的表单项对应的控件为文本控件,从而可以在目标表单模板中与该垂直线段L1右侧的表单项对应的表单项添加文本控件。
或者,若垂直线段右侧的占位符为文字占位符,则可以确定垂直线段右侧的表单项对应的控件为用于进行选择的选择框控件。示例地,选择框控件可以包括单选框控件或者多选框控件,在本公开具体实施的过程中,可以根据垂直线段右侧的表单项中的文字信息进一步确定该选择框控件的类型。
在另一种可能的方式中,针对左侧不包括文字占位符,即针对左侧包括空白占位符的垂直线段,若垂直线段右侧的占位符为空白占位符,且该垂直线段周围包括多个空白占位符,则可以确定垂直线段两侧的表单项对应的控件为表格控件。其中,垂直线段周围可以是以该垂直线段的中点为中心的预设范围,该预设范围可以根据实际情况设定,本公开实施例对此不作限定。
在实际应用中,可能存在需要在表单中以表格的形式输入信息的情况,比如在填写个人信息表时,可能需要填写家庭成员信息,该家庭成员信息可以包括每个家庭成员的姓名、年龄、职业等信息,为了方便填写与查看,可以通过表格控件收集用户填写的家庭成员信息。在此种情况下,向用户展示的表单中对应于家庭成员信息的部分可以包括多个空白表单项。
相应地,若图像中的目标表单包括表格控件,那么识别出的垂直线段两侧可能均为空白占位符,并且该垂直线段周围可以包括多个空白占位符,因此如果识别到的垂直线段满足上述条件,则可以确定该垂直线段两侧的表单项对应的控件均为表格控件。另外,针对左侧包括文字占位符的垂直线段,若该垂直线段右侧的占位符为空白占位符,且该垂直线段周围包括多个空白占位符,那么也可以确定该垂直线段右侧的表单项对应的控件为表格控件。
通过上述方式,可以按列识别图像中表单项对应的控件信息,从而可以根据该控件信息,对目标表单模板中的对应表单项添加表单控件,生成目标表单,无需用户通过拖拽等操作为表单添加控件,减少了生成表单过程中的人为干预,从而可以提高表单生成效率。
应当理解的是,为了提高识别的准确率和效率,还可以在识别图像中表单项包括的文字信息以及表单项对应的控件信息之前,对图像进行二值化预处理,即将图像转化为二值图像,去除图像中目标表单中表单项可能存在的背景颜色、填充图案等对后续识别过程的影响。
下面通过另一示例性实施例对本公开实施例中的表单生成方法进行说明。参照图6,该表单生成方法包括:
步骤601,获取显示内容为待生成的目标表单的图像。
步骤602,在多个预设表单模板中,确定与图像中目标表单的相似度达到预设相似度的初始表单模板。
步骤603,在初始表单模板中,确定与图像包括的目标表单具有相同表单项坐标但表单项宽度和/或表单项高度不同的差异表单项。
步骤604,对初始表单模板进行调整,以使差异表单项的表单项宽度和表单项高度与图像包括的目标表单中与差异表单项具有相同表单项坐标的表单项一致。
步骤605,将调整后的初始表单模板确定为与图像中目标表单最相似的目标表单模板。
步骤606,按行识别图像中包括的水平线段以及表单项包括的文字信息。
步骤607,根据文字信息与水平线段的相对位置,在图像包括的目标表单中确定文字信息对应的表单项的坐标。
步骤608,在目标表单模板中,确定坐标对应的表单项,并将文字信息添加到表单项中。
步骤609,按列识别图像中的垂直线段以及垂直线段右侧的表单内容。
步骤610,根据垂直线段右侧的表单内容的类型,对垂直线段右侧的表单项添加文字占位符或者空白占位符。
步骤611,针对左侧包括文字占位符的垂直线段,若垂直线段右侧的占位符为空白占位符,且空白占位符右侧不包括其他空白占位符,则确定垂直线段右侧的表单项对应的控件为用于输入文本信息的文本控件。
步骤612,针对左侧包括文字占位符的垂直线段,若垂直线段右侧的占位符为文字占位符,则确定垂直线段右侧的表单项对应的控件为用于进行选择的选择框控件。
步骤613,针对左侧包括空白占位符的垂直线段,若垂直线段右侧的占位符为空白占位符,且垂直线段周围包括多个空白占位符,则确定垂直线段两侧的表单项对应的控件为表格控件。
步骤614,根据识别到的控件信息,对目标表单模板中的对应表单项添加表单控件,生成目标表单。
上述各步骤的具体实施方式已在上文进行详细举例说明,这里不再赘述。另外应当理解的是,对于上述方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受上文所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,上文所描述的实施例属于优选实施例,所涉及的步骤并不一定是本公开所必须的。
通过上述方式,可以基于图像而自动生成表单,减少了生成表单过程中的人为干预,从而可以避免生成表单过程中耗费大量人力和时间的问题,提高表单的生成效率。
基于同一发明构思,本公开实施例还提供一种表单生成装置,该装置可以通过软件、硬件或者两者结合的方式成为电子设备的部分或全部。参照图7,该表单生成装置700可以包括:
获取模块701,用于获取显示内容为待生成的目标表单的图像;
确定模块702,用于在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;
识别模块703,用于识别所述图像中表单项包括的文字信息,并识别所述图像中表单项对应的控件信息;
生成模块704,用于将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。
可选地,所述识别模块703用于:
按行识别所述图像中包括的水平线段以及表单项包括的文字信息;
所述将所述文字信息添加到所述目标表单模板的对应表单项中,包括:
根据所述文字信息与所述水平线段的相对位置,在所述图像包括的目标表单中确定所述文字信息对应的表单项的坐标;
在所述目标表单模板中,确定所述坐标对应的表单项,并将所述文字信息添加到所述表单项中。
可选地,所述识别模块703用于:
按列识别所述图像中的垂直线段以及所述垂直线段右侧的表单内容;
根据所述垂直线段右侧的表单内容的类型,对所述垂直线段右侧的表单项添加文字占位符或者空白占位符;
针对左侧包括文字占位符的垂直线段,根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息。
可选地,所述识别模块703用于:
当所述垂直线段右侧的占位符为空白占位符,且所述空白占位符右侧不包括其他空白占位符时,确定所述垂直线段右侧的表单项对应的控件为用于输入文本信息的文本控件;
当所述垂直线段右侧的占位符为文字占位符时,确定所述垂直线段右侧的表单项对应的控件为用于进行选择的单选控件。
可选地,所述装置700还包括:
第一控件确定模块,用于针对左侧包括空白占位符的垂直线段,当所述垂直线段右侧的占位符为空白占位符,且所述垂直线段周围包括多个空白占位符时,确定所述垂直线段两侧的表单项对应的控件为表格控件。
可选地,所述确定模块702用于:
针对多个预设表单模板中的每个预设表单模板,分别将所述预设表单模板的表单宽度以及表单高度进行等比例调整,以使所述预设表单模板的表单宽度与所述图像中目标表单的宽度相等、以及所述预设表单模板的表单高度与所述图像中目标表单的高度相等;
在所述多个预设表单模板中,确定与所述图像包括的目标表单中具有相同列数和行数的目标表单模板。
可选地,所述确定模块702用于:
在多个预设表单模板中,确定与所述图像中目标表单的相似度达到预设相似度的初始表单模板;
在所述初始表单模板中,确定与所述图像包括的目标表单具有相同表单项坐标但表单项宽度和/或表单项高度不同的差异表单项;
对所述初始表单模板中的差异表单项进行调整;
将调整后的初始表单模板确定为与所述图像中目标表单最相似的目标表单模板。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本公开实施例还提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述任一表单生成方法的步骤。
在可能的方式中,该电子设备的框图可以如图8所示。参照图8,该电子设备可以包括:处理器801,存储器802。该电子设备800还可以包括多媒体组件803,输入/输出(I/O)接口804,以及通信组件805中的一者或多者。其中,处理器801用于控制该电子设备800的整体操作,以完成上述的表单生成方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该电子设备800的操作,这些数据例如可以包括用于在该电子设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如预设表单模板等等。
该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。
I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该电子设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(NearField Communication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的表单生成方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的表单生成方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由电子设备800的处理器801执行以完成上述的表单生成方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的表单生成方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (9)

1.一种表单生成方法,其特征在于,所述方法包括:
获取显示内容为待生成的目标表单的图像;
在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;
识别所述图像中表单项包括的文字信息,并按列识别所述图像中的垂直线段以及所述垂直线段右侧的表单内容;
根据所述垂直线段右侧的表单内容的类型,对所述垂直线段右侧的表单项添加文字占位符或者空白占位符;
针对左侧包括文字占位符的垂直线段,根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息;
将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。
2.根据权利要求1所述的方法,其特征在于,所述识别所述图像中表单项包括的文字信息,包括:
按行识别所述图像中包括的水平线段以及表单项包括的文字信息;
所述将所述文字信息添加到所述目标表单模板的对应表单项中,包括:
根据所述文字信息与所述水平线段的相对位置,在所述图像包括的目标表单中确定所述文字信息对应的表单项的坐标;
在所述目标表单模板中,确定所述坐标对应的表单项,并将所述文字信息添加到所述表单项中。
3.根据权利要求1所述的方法,其特征在于,所述根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息,包括:
若所述垂直线段右侧的占位符为空白占位符,且所述空白占位符右侧不包括其他空白占位符,则确定所述垂直线段右侧的表单项对应的控件为用于输入文本信息的文本控件;
若所述垂直线段右侧的占位符为文字占位符,则确定所述垂直线段右侧的表单项对应的控件为用于进行选择的选择框控件。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对左侧包括空白占位符的垂直线段,若所述垂直线段右侧的占位符为空白占位符,且所述垂直线段周围包括多个空白占位符,则确定所述垂直线段两侧的表单项对应的控件为表格控件。
5.根据权利要求1-4任一所述的方法,其特征在于,所述在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,包括:
针对多个预设表单模板中的每个预设表单模板,分别将所述预设表单模板的表单宽度以及表单高度进行等比例调整,以使所述预设表单模板的表单宽度与所述图像中目标表单的宽度相等、以及所述预设表单模板的表单高度与所述图像中目标表单的高度相等;
在所述多个预设表单模板中,确定与所述图像包括的目标表单具有相同列数和相同行数的目标表单模板。
6.根据权利要求1-4任一所述的方法,其特征在于,所述在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,包括:
在多个预设表单模板中,确定与所述图像中目标表单的相似度达到预设相似度的初始表单模板;
在所述初始表单模板中,确定与所述图像包括的目标表单具有相同表单项坐标但表单项宽度和/或表单项高度不同的差异表单项;
对所述初始表单模板进行调整,以使所述差异表单项的表单项宽度和表单项高度与所述图像包括的目标表单中与所述差异表单项具有相同表单项坐标的表单项一致;
将调整后的初始表单模板确定为与所述图像中目标表单最相似的目标表单模板。
7.一种表单生成装置,其特征在于,所述装置包括:
接收模块,用于获取显示内容为待生成的目标表单的图像;
确定模块,用于在多个预设表单模板中,确定与所述图像中目标表单最相似的目标表单模板,其中,所述目标表单模板的各表单项与所述图像中目标表单的表单项一一对应;
识别模块,用于识别所述图像中表单项包括的文字信息,并按列识别所述图像中的垂直线段以及所述垂直线段右侧的表单内容,根据所述垂直线段右侧的表单内容的类型,对所述垂直线段右侧的表单项添加文字占位符或者空白占位符,针对左侧包括文字占位符的垂直线段,根据所述垂直线段右侧的占位符类型,确定所述垂直线段右侧的表单项对应的控件信息;
生成模块,用于将所述文字信息添加到所述目标表单模板的对应表单项中,并根据所述控件信息,对所述目标表单模板中的对应表单项添加表单控件,生成所述目标表单。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
9.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-6中任一项所述方法的步骤。
CN201911261658.7A 2019-12-10 2019-12-10 表单生成方法、装置、存储介质及电子设备 Active CN111144081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911261658.7A CN111144081B (zh) 2019-12-10 2019-12-10 表单生成方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911261658.7A CN111144081B (zh) 2019-12-10 2019-12-10 表单生成方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111144081A CN111144081A (zh) 2020-05-12
CN111144081B true CN111144081B (zh) 2024-05-24

Family

ID=70517987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911261658.7A Active CN111144081B (zh) 2019-12-10 2019-12-10 表单生成方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111144081B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666520A (zh) * 2020-05-14 2020-09-15 深圳思为科技有限公司 基于表单图像生成电子表单的方法和装置
CN111931708A (zh) * 2020-09-16 2020-11-13 北京维数统计事务所有限公司 表单生成方法及装置
CN117454859B (zh) * 2023-12-19 2024-04-02 四川弘和数智集团有限公司 油气站数据自动录入方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161480A (ja) * 1997-11-28 1999-06-18 Nec Corp 画面、帳票レイアウトの自動作成方法及び方式
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及系统
CN109783555A (zh) * 2018-12-13 2019-05-21 东软集团股份有限公司 表单模板存储方法、装置、存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577817B (zh) * 2012-07-24 2017-03-01 阿里巴巴集团控股有限公司 表单识别方法与装置
US9785627B2 (en) * 2014-01-23 2017-10-10 Xerox Corporation Automated form fill-in via form retrieval

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161480A (ja) * 1997-11-28 1999-06-18 Nec Corp 画面、帳票レイアウトの自動作成方法及び方式
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及系统
CN109783555A (zh) * 2018-12-13 2019-05-21 东软集团股份有限公司 表单模板存储方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN111144081A (zh) 2020-05-12

Similar Documents

Publication Publication Date Title
CN111144081B (zh) 表单生成方法、装置、存储介质及电子设备
CN108762740B (zh) 页面数据的生成方法、装置及电子设备
CN107943363B (zh) 背景图像的配置方法及装置、交互智能平板及存储介质
CN111208998B (zh) 数据可视化大屏自动布局的方法、装置及存储介质
CN111291753A (zh) 基于图像的文本识别方法、装置及存储介质
CN104102734A (zh) 数据展示方法及系统
US10750036B1 (en) Rapid workflow design using machine learning
US10097724B2 (en) System, control method, and recording medium
US11875587B2 (en) Information processing system, information processing method, and non-transitory recording medium
US20200320291A1 (en) Techniques to determine document recognition errors
JP7185044B2 (ja) 要素レンダリング方法、装置、コンピュータプログラム及びコンピュータ装置
CN111931708A (zh) 表单生成方法及装置
CN113449732A (zh) 信息处理装置、图像读取装置、记录介质、信息处理方法
CN111008987A (zh) 基于灰色背景中边缘图像提取方法、装置及可读存储介质
CN1941984A (zh) 具有菜单显示功能的移动通信终端及菜单显示方法
CN115114481A (zh) 文档格式转换方法、装置、存储介质及设备
CN115457581A (zh) 表格提取方法、装置及计算机设备
CN106598315B (zh) 触控显示设备及其背景图置换方法
US11321832B2 (en) Image analysis device
CN110390323B (zh) 信息处理装置以及计算机可读介质
CN114116449A (zh) 一种自动化测试用例的参数化方法、装置及电子设备
CN108363525B (zh) 一种响应网页中用户手势操作的方法、装置和终端设备
CN106934814B (zh) 一种基于图像的背景信息识别方法及装置
JP6657799B2 (ja) 図形処理装置、図形処理方法、および、図形処理プログラム
US11671540B2 (en) Information processing apparatus and non-transitory computer readable medium for changing display order of recognition results based on previous checking order

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant