CN117131838A - 基于表单图像的表单页面生成方法、装置、电子设备和介质 - Google Patents

基于表单图像的表单页面生成方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN117131838A
CN117131838A CN202311378959.4A CN202311378959A CN117131838A CN 117131838 A CN117131838 A CN 117131838A CN 202311378959 A CN202311378959 A CN 202311378959A CN 117131838 A CN117131838 A CN 117131838A
Authority
CN
China
Prior art keywords
image
component
name
module
information collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311378959.4A
Other languages
English (en)
Other versions
CN117131838B (zh
Inventor
董继仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Yixianghaoju Network Technology Co ltd
Original Assignee
Tianjin Yixianghaoju Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Yixianghaoju Network Technology Co ltd filed Critical Tianjin Yixianghaoju Network Technology Co ltd
Priority to CN202311378959.4A priority Critical patent/CN117131838B/zh
Publication of CN117131838A publication Critical patent/CN117131838A/zh
Application granted granted Critical
Publication of CN117131838B publication Critical patent/CN117131838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请涉及一种基于表单图像的表单页面生成方法、装置、电子设备和介质,属于表单制作的技术领域,方法包括:获取表单图像;对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,每个所述组件图像中包括一条信息收集项;识别所述组件图像中信息收集项的名称;根据排布信息生成表单模板,所述表单模板中包括与各个所述信息收集项对应的子模板;在每个所述子模板中显示对应的信息收集项的名称;获取用户根据所述名称选用的组件模块,在对应的所述子模板中显示所述组件模块,取消显示所述信息收集项的名称,本申请具有提高生成表单页面的效率的效果。

Description

基于表单图像的表单页面生成方法、装置、电子设备和介质
技术领域
本申请涉及表单制作的技术领域,尤其是涉及一种基于表单图像的表单页面生成方法、装置、电子设备和介质。
背景技术
表单提交数据页面是一个重要的交互界面,用于收集和处理用户输入的数据。随着信息化产业的发展,表单页面应用于越来越多行业信息化建设中。
目前在创建表单的过程中,参照表单的UI图在页面编辑器里拖拽相关组件进行排版和配置,排版配置完成后生成代码或文件,调用代码或文件生成脚本输出。
然而,用户参照UI图进行开发,需要反复观察和对比UI图和页面编辑器,费时耗力,效率低。
发明内容
为了提高生成表单页面的效率,本申请提供一种基于表单图像的表单页面生成方法、装置、电子设备和介质。
第一方面,本申请提供一种基于表单图像的表单页面生成方法,采用如下的技术方案:
获取表单图像;
对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,每个所述组件图像中包括一条信息收集项;
识别所述组件图像中信息收集项的名称;
根据排布信息生成表单模板,所述表单模板中包括与各个所述信息收集项对应的子模板;
在每个所述子模板中显示对应的信息收集项的名称;
获取用户根据所述名称选用的组件模块,在对应的所述子模板中显示所述组件模块,取消显示所述信息收集项的名称。
通过采用上述技术方案,获取表单图像,然后根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而识别组件图像中信息收集项的名称,根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率。
进一步地,所述对表单图像进行分割,确定至少一个组件图像以及所述组件图像的排布信息,包括:
获取用户框选每条信息收集项的分割框;
根据所述分割框对表单图像进行切割,确定至少一个组件图像;
在所述表单图像上生成第一坐标系,在所述第一坐标系中确定每个所述组件图像的角点坐标;
根据每个所述组件图像的角点坐标确定排布信息。
通过采用上述技术方案,电子设备获取用户框选每条信息收集项的分割框,便于根据分割框对表单图像进行分割,得到组件图像,进而通过第一坐标系确定组件图像在表单图像上的坐标,坐标也能够代表组件图像的位置,即确定排布信息,因此能快速准确地确定表单相关设计信息。
进一步地,在获取用户框选的每个组件模块的分割框之前,还包括:
在所述表单图像中生成至少一个参考框,所述参考框包括至少一个框格;
获取用户对所述参考框的操作信息;
根据所述操作信息调节所述框格的大小和数量,每个所述参考框框格对应框选一条信息收集项。
通过采用上述技术方案,电子设备在获取用户输入的分割框之前,在表单图像中生成参考框,用户可以通过操作改变参考框的大小和数量,使每个参考框的框格框选一条信息收集项,操作便捷。
进一步地,所述识别所述组件图像中信息收集项的名称,包括:
将所述组件图像输入至训练好的文字识别模型,得到输出的文字;
获取文字中的空行或标点符号等分隔字符;
确定第一个分隔字符之前的文字为组件图像的模块名称。
通过采用上述技术方案,电子设备通过文字识别模型识别组件图像中的文字,进而根据文字获取模块名称。
进一步地,所述根据排布信息生成表单模板,包括:
在空白表单上建立第二坐标系;
将所述第二坐标系与所述第一坐标系统一并重叠;
根据所述排布信息中各个组件图像的坐标,在所述空白表单上生成表单模板。
通过采用上述技术方案,电子设备根据排布信息生成表单模板时,首先在空白的表单上建立第二坐标系,将第一坐标系与第二坐标系统一,进而根据组件图像在第一坐标系中的坐标,在第二坐标系中显示,进而在空白表单中生成与表单图像一致的模板。
进一步地,在获取用户根据所述名称选用的组件模块,之前,所述方法还包括:
将所述名称与预设的名称数据库对比,判断所述名称数据库中是否包括与所述名称对应的候选组件;
若是,则获取与所述名称对应的候选组件模块,生成关于所述候选组件模块的推荐页面;
根据所述名称和所述候选组件模块的类型生成每个候选组件模块对应的预览图;
否则,对名称进行分词处理,得到多个词语;
判断所述名称数据库中是否包括所述词语,或所述词语中是否包括关于类型的词语;
若包括,则在名称数据库中包括词语时,获取与所述名称对应的候选组件模块,生成关于所述候选组件模块的推荐页面;根据所述名称和所述候选组件模块的类型生成每个候选组件模块对应的预览图;
在词语中包括关于类型的词语时,获取对应类型的候选组件模块,生成关于所述候选组件模块的推荐页面。
通过采用上述技术方案,在用户选取组件模块之前,电子设备进行推荐,首先根据名称在名称数据库中选取候选组件,并根据候选组件生成推荐页面,若名称数据库中不包括名称,则把名称进行分词处理,得到多个词语,进而根据词语在名称数据库中对比选取候选组件,或者根据词语中关于类型的描述,获取候选组件模块,进而生成推荐页面,因此能够缩短用户选择组件模块的时间,提高生成表单页面的便捷性。
第二方面,本申请提供一种基于表单图像的表单页面生成装置,采用如下的技术方案:
表单图像获取模块,用于获取表单图像;
分割模块,用于对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,每个所述组件图像中包括一条信息收集项;
名称识别模块,用于识别所述组件图像中信息收集项的名称;
表单模板生成模块,用于根据排布信息生成表单模板,所述表单模板中包括与各个所述信息收集项对应的子模板;
名称显示模块,用于在每个所述子模板中显示对应的信息收集项的名称;
组件模块显示模块,用于获取用户根据所述名称选用的组件模块,在对应的所述子模板中显示所述组件模块,取消显示所述信息收集项的名称。
通过采用上述技术方案,表单图像获取模块获取表单图像,然后分割模块根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而名称识别模块识别组件图像中信息收集项的名称,名称显示模块根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,组件模块显示模块将用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率。
第三方面,本申请提供一种电子设备,采用如下的技术方案:
一种电子设备,包括:
至少一个处理器;
存储器;
至少一个计算机程序,其中所述至少一个计算机程序被存储在所述存储器中并被配置为由所述至少一个处理器执行,所述至少一个计算机程序配置用于:执行如第一方面中任一项所述的方法。
通过采用上述技术方案,处理器执行存储器中的计算机程序,获取表单图像,然后根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而识别组件图像中信息收集项的名称,根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率。
第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,存储有能够被处理器加载并执行如第一方面中任一项所述的方法的计算机程序。
通过采用上述技术方案,处理器执行计算机可读存储介质中的计算机程序,获取表单图像,然后根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而识别组件图像中信息收集项的名称,根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率。
综上所述,本申请包括以下至少一种有益技术效果:
1.获取表单图像,然后根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而识别组件图像中信息收集项的名称,根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率;
2.在用户选取组件模块之前,电子设备进行推荐,获取候选组件模块,进而生成推荐页面,因此能够缩短用户选择组件模块的时间,提高生成表单页面的便捷性。
附图说明
图1是本申请实施例中基于表单图像的表单页面生成方法的流程示意图。
图2是本申请实施例中基于表单图像的表单页面生成装置的结构框图。
图3是本申请实施例中电子设备的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
本申请实施例公开一种基于表单图像的表单页面生成方法。参照图1,由电子设备执行,该电子设备可以为服务器也可以为终端设备,其中该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、台式计算机等,但并不局限于此。包括(步骤S101~步骤S106):
步骤S101:获取表单图像。
具体地,用户在设计表单之前,应用UI设计软件先设计出想要的表单图像,然后参照表单图像设置表单。
在开始建立表单时,电子设备响应于用户的操作信息,部署一个vue-cli项目,将组件库文件存放于该项目下,项目启动后,打开页面编辑器,进而,用户输入表单图像,电子设备获取并保存表单图像。
步骤S102:对表单图像进行分割,确定至少一个组件图像及组件图像的排布信息,每个组件图像中包括一条信息收集项。
具体地,一个表单中包括至少一条信息收集项,每一条信息收集项由一个组件模块设计生成。组件模块包括选择项、文字填写项和图片填写项等多种类型。例如,需要设计的保单为新用户注册界面,需要用户输入用户名、密码、姓名、性别、手机号、验证码等信息,则每项信息均为一条信息收集项。
因此对表单进行分割后,每个组件图像对应每条信息收集项,进而便于根据每个组件图像确定对应的组件模块,进而完成每条信息收集项的设计。具体包括如下步骤(步骤S1021~步骤S1024):
步骤S1021:获取用户框选每条信息收集项的分割框。
具体地,用户可以在表单图像中输入分割框,可以通过鼠标点击屏幕后拖拽生成分割框,电子设备在表单图像上显示分割框。在输入分割框时,使分割框框选住每条信息收集项。
步骤S1022:根据分割框对表单图像进行切割,确定至少一个组件图像。
具体地,当用户设置完分割框后,点击开始切割虚拟按键,电子设备则以分割框为边界进行切割,保留分割框内的图像作为组件图像,因此,经过切割后,电子设备确定与分割框数量相同的组件图像。
步骤S1023:在表单图像上生成第一坐标系,在第一坐标系中确定每个组件图像的角点坐标。
具体地,电子设备在表单图像上生成第一坐标系,例如,以表单图像的左下角为第一坐标系的原点,进而可以将表单图像上的每一个点均用坐标来表示。进而,电子设备可以确定每个组件图像的四个角点的坐标。
步骤S1024:根据每个组件图像的角点坐标确定排布信息。
具体地,电子设备保存每个组件图像的四个角点坐标后,可以对四个角点之间的区域进行标记,确定组件图像对应的位置,进而能够确定各个组件图像在表单图像中的位置,因此确定排布信息。
在另一种可能的实现方式中,用户输入分割框时,为了统一分割框且便于快速设置,在表单图像中还可以生成参考框,用户可以参考框选取方法还包括(步骤Sa~步骤Sc):
步骤Sa:在表单图像中生成至少一个参考框,参考框包括至少一个框格。
具体地,电子设备在表单图像中生成初始参考框,初始参考框的大小和位置均可以响应于用户的操作进行改变,且框格的数量可以响应于用户的操作进行增减。
步骤Sb:获取用户对参考框的操作信息。
步骤Sc:根据操作信息调节框格的大小和数量,每个参考框框格对应框选一条信息收集项。
具体地,用户对参考框进行拖拽来调节框格的大小和位置,使每个框格框选住一条信息收集项。当信息收集项成行、列状排列时,自动在框格的下方或右方增添新框格,电子设备生成成行、列状排列的框格。
因此,用户可以将框格选为分割框,能够快速便捷地输入分割框,且分割框更为整齐。
步骤S103:识别组件图像中信息收集项的名称。包括如下流程(步骤S1031~步骤S1033):
步骤S1031:将组件图像输入至训练好的文字识别模型,得到输出的文字。
具体地,电子设备设置训练集和验证集,建立模型后,应用训练集对模型进行训练,并用验证集进行验证,进而得到训练好的文字识别模型。当输入带有文字的图像时,训练好的文字识别模型能够输出图片中的文字。
步骤S1032:获取文字中的空行或标点符号等分隔字符。
具体地,表单图像中展示信息收集项,可能包括名称以及对信息收集项的说明。例如:“用户名:请输入账号”或“用户名 请输入账号”。其中两个词组之间一般有空行或者标点符号,因此电子设备能够通过分隔字符识别出前后两个词组。
步骤S1033:确定第一个分隔字符之前的文字为组件图像的模块名称。
具体地,一般地,电子设备将第一个分隔字符之前的文字确定为模块名称。进一步地,电子设备将第一个分隔符之后的文字确定为附加文字。
步骤S104:根据排布信息生成表单模板,表单模板中包括与各个信息收集项对应的子模板,包括如下流程(步骤S1041~步骤S1043):
步骤S1041:在空白表单上建立第二坐标系。
具体地,电子设备在空白表单上建立第二坐标系,例如,使空白表单的左下角为第二坐标系的原点。进而,电子设备可以根据坐标找到空白表单上的任一点。
步骤S1042:将第二坐标系与第一坐标系统一并重叠。
具体地,若第一坐标和第二坐标的标度不同,那么可能难以在第二坐标系中确定与第一坐标系一致的点,因此需要将第二坐标系的标度调整为与第一坐标系一致。并且使第二坐标系和第二坐标系的(0,0)点都在同一点,例如表单图像或空白表单的左下角顶点。
步骤S1043:根据排布信息中各个组件图像的坐标,在空白表单上生成表单模板。
具体地,电子设备通过第一坐标系确定可表单图像中各个组件图像的坐标,进而将每个组件图像的坐标移动至第二坐标系中,并在第二坐标系中显示组件图像的分割框,进而在空白表单上能生成至少一个分割框,进而生成表单模板。用户能够在表单模板上添加对应的组件模块即可,简化排版步骤。
步骤S105:在每个子模板中显示对应的信息收集项的名称。
具体地,电子设备将信息收集项的名称显示在子模板中,因此,用户在设计表单时,无需经常参考表单图像中的文字来选择组件模块。
步骤S106:获取用户根据每个名称选用的组件模块,在对应的子模板中显示组件模块,取消显示信息收集项的名称。
具体地,用户参考名称,在设计界面选用适合的组件模块,当点击选择组件模块后,电子设备在子模板中显示组件模块,且组件模块的大小与子模板的大小自适应调节,使组件模块填满整个子模板。用户也可以调节组件模块的大小。
当用户设计完成子模板中的信息收集项后,输入完成操作,电子设备接收到完成操作后,取消显示名称。
在另一种可能的实现方式中,在用户根据名称选用组件模块之前,为了提高设计速度,提高便利性,电子设备生成推荐界面,根据名称为用户推荐合适的组件模块,包括如下流程(步骤S11~步骤S17):
步骤S11:将名称与预设的名称数据库对比,判断名称数据库中是否包括与名称对应的候选组件;若是,则执行步骤S12和步骤S13;否则,执行步骤S14~步骤S17。
具体地,每个组件模块能适用于多种输入要求,因此,电子设备预先建立名称数据库。电子设备根据调查数据和历史记录建立名称数据库,其中每个组件模块对应至少一个名称。
因此,电子设备将名称与名称数据库进行对比,判断名称数据库中是否包括与名称对应的候选组件。
步骤S12:获取与名称对应的候选组件模块,生成关于候选组件模块的推荐页面。
步骤S13:根据名称和候选组件模块的类型生成每个候选组件模块对应的预览图;
具体地,若名称数据库中包括名称,则电子设备筛选出名称对应的组件模块,并确定为候选组件模块,进而生成推荐页面,推荐页面中显示哥各个候选组件模块。当用户选择其中一个候选组件模块时,则将被选择的候选组件模块显示在对应的子模板中。
进一步地,为了能够更直观地给用户展示候选组件模块的应用效果,电子设备根据名称和候选组件模块的类型生成预览图。
例如,名称为性别,候选组件模块的类型包括输入、按键选择、列表选择,则电子设备生成对应的预览图。若候选组件模块的类型为输入,在性别后显示输入框;若候选组件模块的类型为按键选择,则在性别后显示“男”和“女”两个按键;若候选组件模块的类型为列表选择,则在性别后显示列表,列表中有“男”和“女”两个选项。
步骤S14:对名称进行分词处理,得到多个词语;
步骤S15:判断名称数据库中是否包括词语,或词语中是否包括关于类型的词语;若包括,则执行步骤S16或步骤S17。若不包括,则不生成推荐页面。
步骤S16:在名称数据库中包括词语时,获取与名称对应的候选组件模块,生成关于候选组件模块的推荐页面;根据名称和候选组件模块的类型生成每个候选组件模块对应的预览图。
步骤S17:在词语中包括关于类型的词语时,获取对应类型的候选组件模块,生成关于候选组件模块的推荐页面。
具体地,当名称数据库中不包括名称时,可能是由于表单的特殊性使名称冗长,难以在名称数据库中匹配一致。因此电子设备对名称进行分词处理,得到多个词语,词语可能在名称数据库中匹配一致。
当名称数据库中包括词语时,则电子设备重复步骤S12和步骤S13,采用相同的方法生成预览图和推荐页面。
当词语中包括关于类型的词语时,比如名称为“输入电话”,则分词后得到“输入”和“电话”两个词语,则电子设备以带有关于类型“输入”的词语为首,获取输入类型的候选组件模块,进而生成关于候选组件模块的推荐页面。
为了更好地执行上述方法,本申请实施例还提供一种基于表单图像的表单页面生成装置,参照图2,基于表单图像的表单页面生成装置200包括:
表单图像获取模块201,用于获取表单图像;
分割模块202,用于对表单图像进行分割,确定至少一个组件图像及组件图像的排布信息,每个组件图像中包括一条信息收集项;
名称识别模块203,用于识别组件图像中信息收集项的名称;
表单模板生成模块204,用于根据排布信息生成表单模板,表单模板中包括与各个信息收集项对应的子模板;
名称显示模块205,用于在每个子模板中显示对应的信息收集项的名称;
组件模块显示模块206,用于获取用户根据名称选用的组件模块,在对应的子模板中显示组件模块,取消显示信息收集项的名称。
进一步地,分割模块202,具体用于:
获取用户框选每条信息收集项的分割框;
根据分割框对表单图像进行切割,确定至少一个组件图像;
在表单图像上生成第一坐标系,在第一坐标系中确定每个组件图像的角点坐标;
根据每个组件图像的角点坐标确定排布信息。
在另一种可能的实现方式中,基于表单图像的表单页面生成装置200还包括:
参考框生成模块,用于在表单图像中生成至少一个参考框,参考框包括至少一个框格;
操作信息获取模块,用于获取用户对参考框的操作信息;
框格调节模块,用于根据操作信息调节框格的大小和数量,每个参考框框格对应框选一条信息收集项。
进一步地,名称识别模块203,具体用于:
将组件图像输入至训练好的文字识别模型,得到输出的文字;
获取文字中的空行或标点符号等分隔字符;
确定第一个分隔字符之前的文字为组件图像的模块名称。
进一步地,表单模板生成模块204,具体用于:
在空白表单上建立第二坐标系;
将第二坐标系与第一坐标系统一并重叠;
根据排布信息中各个组件图像的坐标,在空白表单上生成表单模板。
在另一种可能的实现方式中,基于表单图像的表单页面生成装置200还包括:
第一判断模块,用于将名称与预设的名称数据库对比,判断名称数据库中是否包括与名称对应的候选组件;
第一推荐页面生成模块,用于在第一判断模块判断为是时,获取与名称对应的候选组件模块,生成关于候选组件模块的推荐页面;
第一预览图生成模块,用于根据名称和候选组件模块的类型生成每个候选组件模块对应的预览图;
分词处理模块,用于在第一判断判断为否时,对名称进行分词处理,得到多个词语;
第二判断模块,用于判断名称数据库中是否包括词语,或词语中是否包括关于类型的词语;
第一执行模块,用于在第二判断模块判断为包括,且在名称数据库中包括词语时,获取与名称对应的候选组件模块,生成关于候选组件模块的推荐页面;根据名称和候选组件模块的类型生成每个候选组件模块对应的预览图;
第二执行模块,用于在第二判断模块判断为包括,且在词语中包括关于类型的词语时,获取对应类型的候选组件模块,生成关于候选组件模块的推荐页面。
前述实施例中的方法中的各种变化方式和具体实例同样适用于本实施例的基于表单图像的表单页面生成装置,通过前述对基于表单图像的表单页面生成方法的详细描述,本领域技术人员可以清楚的知道本实施例中的基于表单图像的表单页面生成装置的实施方法,所以为了说明书的简洁,在此不再详述。
为了更好地实施以上方法,本申请实施例提供一种电子设备,参照图3,电子设备300包括:处理器301、存储器303和显示屏305。其中,存储器303、显示屏305均与处理器301相连,如通过总线302相连。可选地,电子设备300还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一个,该电子设备300的结构并不构成对本申请实施例的限定。
处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。
存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现前述方法实施例所示的内容。
图3示出的电子设备300仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例还提供一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时实现上述实施例提供的基于表单图像的表单页面生成方法,处理器执行计算机可读存储介质中的计算机程序,获取表单图像,然后根据信息收集项将表单图像分割,确定至少一个组件图像,每个组件图像中包括一条信息收集项,进而根据分割后的组件图像确定排布信息,进而识别组件图像中信息收集项的名称,根据与排布信息生成表单模板,将名称显示在表单模板中,便于用户参考名称选取对应的组件模块,用户选取的组件模块显示在对应的子模板中,进而简化了表单页面的设计过程,用户能直接快速地根据表单需要的排版和内容进行进一步编辑,提高工作效率。
本实施例中,计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。具体的,计算机可读存储介质可以是便携式计算机盘、硬盘、U盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、讲台随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、光盘、磁碟、机械编码设备以及上述任意组合。
本实施例中的计算机程序包含用于执行前述所有的方法的程序代码,程序代码可包括对应执行上述实施例提供的方法步骤对应的指令。计算机程序可从计算机可读存储介质下载到各个计算/处理设备,或者通过网络(例如因特网、局域网、广域网和/或无线网)下载到外部计算机或外部存储设备。计算机程序可完全地在用户计算机上执行、作为一个独立的软件包执行。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
另外,需要理解的是,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

Claims (9)

1.一种基于表单图像的表单页面生成方法,其特征在于,包括:
获取表单图像;
对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,每个所述组件图像中包括一条信息收集项;
识别所述组件图像中信息收集项的名称;
根据所述排布信息生成表单模板,所述表单模板中包括与各个所述信息收集项对应的子模板;
在每个所述子模板中显示对应的信息收集项的名称;
获取用户根据所述名称选用的组件模块,在对应的所述子模板中显示所述组件模块,取消显示所述信息收集项的名称。
2.根据权利要求1所述的基于表单图像的表单页面生成方法,其特征在于,所述对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,包括:
获取用户框选每条信息收集项的分割框;
根据所述分割框对表单图像进行切割,确定至少一个组件图像;
在所述表单图像上生成第一坐标系,在所述第一坐标系中确定每个所述组件图像的角点坐标;
根据每个所述组件图像的角点坐标确定排布信息。
3.根据权利要求1所述的基于表单图像的表单页面生成方法,其特征在于,在获取用户框选的每个组件模块的分割框之前,还包括:
在所述表单图像中生成至少一个参考框,所述参考框包括至少一个框格;
获取用户对所述参考框的操作信息;
根据所述操作信息调节所述框格的大小和数量,每个所述参考框框格对应框选一条信息收集项。
4.根据权利要求1所述的基于表单图像的表单页面生成方法,其特征在于,所述识别所述组件图像中信息收集项的名称,包括:
将所述组件图像输入至训练好的文字识别模型,得到输出的文字;
获取文字中的分隔字符;
确定第一个分隔字符之前的文字为组件图像中信息收集项的名称。
5.根据权利要求2所述的基于表单图像的表单页面生成方法,其特征在于,所述根据所述排布信息生成表单模板,包括:
在空白表单上建立第二坐标系;
将所述第二坐标系与所述第一坐标系统一并重叠;
根据所述排布信息中各个组件图像的坐标,在所述空白表单上生成表单模板。
6.根据权利要求1所述的基于表单图像的表单页面生成方法,其特征在于,在获取用户根据所述名称选用的组件模块,之前,所述方法还包括:
将所述名称与预设的名称数据库对比,判断所述名称数据库中是否包括与所述名称对应的候选组件;
若是,则获取与所述名称对应的候选组件模块,生成关于所述候选组件模块的推荐页面;
根据所述名称和所述候选组件模块的类型生成每个候选组件模块对应的预览图;
否则,对所述名称进行分词处理,得到多个词语;
判断所述名称数据库中是否包括所述词语,或所述词语中是否包括关于类型的词语;
若包括,则在所述名称数据库中包括所述词语时,获取与所述名称对应的候选组件模块,生成关于所述候选组件模块的推荐页面;根据所述名称和所述候选组件模块的类型生成每个候选组件模块对应的预览图;
在词语中包括关于类型的词语时,获取对应类型的候选组件模块,生成关于所述候选组件模块的推荐页面。
7.一种基于表单图像的表单页面生成装置,其特征在于,包括:
表单图像获取模块,用于获取表单图像;
分割模块,用于对所述表单图像进行分割,确定至少一个组件图像及所述组件图像的排布信息,每个所述组件图像中包括一条信息收集项;
名称识别模块,用于识别所述组件图像中信息收集项的名称;
表单模板生成模块,用于根据所述排布信息生成表单模板,所述表单模板中包括与各个所述信息收集项对应的子模板;
名称显示模块,用于在每个所述子模板中显示对应的信息收集项的名称;
组件模块显示模块,用于获取用户根据所述名称选用的组件模块,在对应的所述子模板中显示所述组件模块,取消显示所述信息收集项的名称。
8.一种电子设备,其特征在于,包括:
至少一个处理器;
存储器;
至少一个计算机程序,其中所述至少一个计算机程序被存储在所述存储器中并被配置为由所述至少一个处理器执行,所述至少一个计算机程序配置用于:执行如权利要求1至6任一项所述的基于表单图像的表单页面生成方法。
9.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至6中任一项所述的基于表单图像的表单页面生成方法的计算机程序。
CN202311378959.4A 2023-10-24 2023-10-24 基于表单图像的表单页面生成方法、装置、电子设备和介质 Active CN117131838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311378959.4A CN117131838B (zh) 2023-10-24 2023-10-24 基于表单图像的表单页面生成方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311378959.4A CN117131838B (zh) 2023-10-24 2023-10-24 基于表单图像的表单页面生成方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN117131838A true CN117131838A (zh) 2023-11-28
CN117131838B CN117131838B (zh) 2024-02-09

Family

ID=88858488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311378959.4A Active CN117131838B (zh) 2023-10-24 2023-10-24 基于表单图像的表单页面生成方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN117131838B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661512A (zh) * 2009-09-25 2010-03-03 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
CN110069764A (zh) * 2019-03-22 2019-07-30 深圳壹账通智能科技有限公司 表单配置方法、装置、计算机设备和存储介质
CN110738185A (zh) * 2019-10-23 2020-01-31 腾讯科技(深圳)有限公司 表单对象的识别方法、装置及存储介质
CN112906543A (zh) * 2021-02-08 2021-06-04 中国工商银行股份有限公司 数据录入方法、装置、计算设备、介质和程序产品
CN114119139A (zh) * 2021-11-03 2022-03-01 北京三快在线科技有限公司 一种信息推荐方法、装置、存储介质及电子设备
CN114217795A (zh) * 2021-12-03 2022-03-22 北京达佳互联信息技术有限公司 页面生成方法、装置、电子设备及可读存储介质
CN114612921A (zh) * 2022-05-12 2022-06-10 中信证券股份有限公司 表单识别方法、装置、电子设备和计算机可读介质
CN115687672A (zh) * 2022-10-26 2023-02-03 中网华信科技股份有限公司 图表可视化智能推荐方法、装置、设备及可读存储介质
CN116758550A (zh) * 2023-06-25 2023-09-15 中国工商银行股份有限公司 表单图像的文本识别方法及其装置、电子设备、存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661512A (zh) * 2009-09-25 2010-03-03 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
CN110069764A (zh) * 2019-03-22 2019-07-30 深圳壹账通智能科技有限公司 表单配置方法、装置、计算机设备和存储介质
CN110738185A (zh) * 2019-10-23 2020-01-31 腾讯科技(深圳)有限公司 表单对象的识别方法、装置及存储介质
CN112906543A (zh) * 2021-02-08 2021-06-04 中国工商银行股份有限公司 数据录入方法、装置、计算设备、介质和程序产品
CN114119139A (zh) * 2021-11-03 2022-03-01 北京三快在线科技有限公司 一种信息推荐方法、装置、存储介质及电子设备
CN114217795A (zh) * 2021-12-03 2022-03-22 北京达佳互联信息技术有限公司 页面生成方法、装置、电子设备及可读存储介质
CN114612921A (zh) * 2022-05-12 2022-06-10 中信证券股份有限公司 表单识别方法、装置、电子设备和计算机可读介质
CN115687672A (zh) * 2022-10-26 2023-02-03 中网华信科技股份有限公司 图表可视化智能推荐方法、装置、设备及可读存储介质
CN116758550A (zh) * 2023-06-25 2023-09-15 中国工商银行股份有限公司 表单图像的文本识别方法及其装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN117131838B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN105893338B (zh) 用于输入公式的方法、装置和电子设备
US10943106B2 (en) Recognizing text in image data
US9886669B2 (en) Interactive visualization of machine-learning performance
US10528649B2 (en) Recognizing unseen fonts based on visual similarity
KR20160132842A (ko) 플로우 문서를 생성하기 위한 이미지 문서 컴포넌트 검출 및 추출 기법
CN105095166B (zh) 流式电子书产生的方法及网站系统
JP2016524229A (ja) 検索推奨方法及び装置
KR101549792B1 (ko) 문서 자동 작성 장치 및 방법
US12067351B2 (en) Systems and methods for extracting text from portable document format data
US11960864B2 (en) Creating applications and templates based on different types of input content
CN111209909B (zh) 资质识别模板构建方法、装置、设备和存储介质
US11055526B2 (en) Method, system and apparatus for processing a page of a document
CN117131838B (zh) 基于表单图像的表单页面生成方法、装置、电子设备和介质
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
US20220284724A1 (en) Systems and methods for extracting text from portable document format data
CN114004212B (zh) 数据处理方法、装置及存储介质
KR102300444B1 (ko) 문서에 적용되어 있는 글꼴이 지원되는 글꼴인지 확인이 가능한 문서 편집 장치 및 그 동작 방법
US11335108B2 (en) System and method to recognise characters from an image
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
US20230237262A1 (en) Classification device, classification method and classification program
JPWO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP2018036880A (ja) 情報処理装置及び情報処理プログラム
CN112232320B (zh) 印刷品文字的校对方法及相关设备
KR102446035B1 (ko) 딥 러닝 기반 웹 문서 생성 장치 및 방법
US20230154082A1 (en) Style-based dynamic content generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant