CN117744615A - 表单数据处理方法、装置、电子设备及可读存储介质 - Google Patents
表单数据处理方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN117744615A CN117744615A CN202211113490.7A CN202211113490A CN117744615A CN 117744615 A CN117744615 A CN 117744615A CN 202211113490 A CN202211113490 A CN 202211113490A CN 117744615 A CN117744615 A CN 117744615A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- unique identification
- storing
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 101100509468 Arabidopsis thaliana JASON gene Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明实施方式公开了表单数据处理方法、装置、电子设备及可读存储介质。方法包括:获取具有结构化视图的表单模板,其中表单模板包含关联有数据名称的指定单元格;基于表征结构化视图的结构信息,在页面中展示结构化视图;接收在页面中输入的数据;基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,从数据中确定出在指定单元格中输入的第一数据;以结构化存储方式存储第一数据,以非结构化存储方式存储页面中除第一数据之外的页面内容。结构化视图方便用户完成表单的查看、填充、编辑等操作。而且,用户在指定单元格中的输入数据被存储为结构化数据,便于后续的数据分析以探索数据的价值。
Description
技术领域
本发明涉及数据处理技术领域,特别是表单数据处理方法、装置、电子设备及可读存储介质。
背景技术
随着制造业数字化的深入,很多实体都在考虑如何使用和分析数字化结果带来的大量数据。目前,绝大多数的生产和测试过程仍然是手工进行的。在这些过程中,大量数据以结构化视图(比如,中国式报表)的形式被手动记录。用户可以轻松理解结构化视图中的数据之间的关系,并根据这些关系完成数据处理。
然而,结构化视图对于计算机来说过于复杂,存储在结构化视图中的数据难以使用计算机进行分析,例如统计、比较、趋势分析等。而且,如果采用简单视图来存储便于计算机分析的结构化数据,用户则难以轻松理解简单视图中的数据关系。
发明内容
本发明实施方式提出表单数据处理方法、装置、电子设备及可读存储介质。
一种表单数据处理方法,所述方法包括:
获取具有结构化视图的表单模板,其中所述表单模板包含关联有数据名称的指定单元格;
基于表征所述结构化视图的结构信息,在页面中展示所述结构化视图;
接收在所述页面中输入的数据;
基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据;
以结构化存储方式存储所述第一数据,以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容。
可见,在本发明实施方式中,结构化视图方便用户完成表单的查看、填充、编辑等操作。而且,用户在指定单元格中的输入数据被存储为结构化数据,便于后续的数据分析以探索数据的价值。
在示范性实施方式中,所述指定单元格的数目为N个,其中N为至少为1的正整数;在所述接收在所述页面中输入的数据之前,还包括:
解析所述表单模板以获取所述表单模板的唯一标识、所述结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;
在第一模型中存储所述表单模板的唯一标识和所述结构信息;
在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和所述表单模板的唯一标识。
因此,指定单元格可以为多个,可以存储对应于多个指定单元格的多个结构化数据,提高了数据的分析效率。
在示范性实施方式中,所述基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据包括:
基于所述表单模板的唯一标识,检索出所述N个第二模型;
在所述N个第二模型中检索出所述N个关联关系;
基于所述N个关联关系中的每一个关联关系,从所述数据中确定出在对应的指定单元格中输入的第一数据。
因此,基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,准确确定出在对应的指定单元格中输入的第一数据。
在示范性实施方式中,所述以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容包括:在第三模型中以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容;
所述以结构化存储方式存储所述第一数据包括:在N个第四模型中以结构化存储方式存储所述在对应的指定单元格中输入的第一数据;
其中所述第三模型包含用于存储所述页面的唯一标识的第一字段、用于存储所述表单模板的唯一标识的第二字段以及用于存储所述页面内容的第三字段;
所述N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储所述页面的唯一标识的第五字段以及用于存储在所述对应的指定单元格中输入的第一数据的第六字段,其中所述数据名称为结构化存储中的键,所述第一数据为结构化存储中对应于所述键的值。
可见,通过多个模型分别存储结构化数据和非结构化的页面内容,既便于前端的页面展示,也便于后端的数据分析。
在示范性实施方式中,还包括:
接收目标页面的唯一标识;
确定包含所述目标页面的唯一标识的第三模型和包含所述目标页面的唯一标识的第四模型;
从所述包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;
从所述包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于指定单元格的第二模型的唯一标识;
从包含所述第二模型的唯一标识的第二模型中确定关联于目标页面的指定单元格的数据名称;
基于所述数据名称,从所述第二模型中检索出目标页面的指定单元格在所述表单模板中的坐标位置;
基于所述目标页面中除指定单元格中输入的第一数据之外的页面内容、所述坐标位置以及所述目标页面的指定单元格中输入的第一数据,生成所述目标页面。
因此,本发明实施方式基于存储结构化数据和非结构化的页面内容的多个模型,可以重现具有结构化视图的页面。
在示范性实施方式中,还包括:
在所述指定单元格的注释信息中保存所述数据名称,以建立所述指定单元格与所述数据名称的关联;或
在所述指定单元格中保存预定字符与所述数据名称的结合,以建立所述指定单元格与所述数据名称的关联。
可见,可以通过多种方式建立指定单元格与数据名称的关联,便于用户的操作使用。
一种表单数据处理装置,所述装置包括:
获取模块,被配置为获取具有结构化视图的表单模板,其中所述表单模板包含关联有数据名称的指定单元格;
展示模块,被配置为基于表征所述结构化视图的结构信息,在页面中展示所述结构化视图;
接收模块,被配置为接收在所述页面中输入的数据;
确定模块,被配置为基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据;
存储模块,被配置为以结构化存储方式存储所述第一数据,以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容。
可见,在本发明实施方式中,结构化视图方便用户完成表单的查看、填充、编辑等操作。而且,用户在指定单元格中的输入数据被存储为结构化数据,便于后续的数据分析以探索数据的价值。
在示范性实施方式中,所述指定单元格的数目为N个,其中N为至少为1的正整数;
所述接收模块,被配置在接收在所述页面中输入的数据之前,解析所述表单模板以获取所述表单模板的唯一标识、所述结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;在第一模型中存储所述表单模板的唯一标识和所述结构信息;在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和所述表单模板的唯一标识。
因此,指定单元格可以为多个,可以存储对应于多个指定单元格的多个结构化数据,提高了数据的分析效率。
在示范性实施方式中,所述确定模块,被配置为基于所述表单模板的唯一标识,检索出所述N个第二模型;在所述N个第二模型中检索出所述N个关联关系;基于所述N个关联关系中的每一个关联关系,从所述数据中确定出在对应的指定单元格中输入的第一数据。
因此,基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,准确确定出在对应的指定单元格中输入的第一数据。
在示范性实施方式中,所述存储模块,被配置为在第三模型中以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容;在N个第四模型中以结构化存储方式存储所述在对应的指定单元格中输入的第一数据;其中所述第三模型包含用于存储所述页面的唯一标识的第一字段、用于存储所述表单模板的唯一标识的第二字段以及用于存储所述页面内容的第三字段;所述N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储所述页面的唯一标识的第五字段以及用于存储在所述对应的指定单元格中输入的第一数据的第六字段,其中所述数据名称为结构化存储中的键,所述第一数据为所述结构化存储中对应于所述键的值。
可见,通过多个模型分别存储结构化数据和非结构化的页面内容,既便于前端的页面展示,也便于后端的数据分析。
在示范性实施方式中,还包括:生成模块,被配置为接收目标页面的唯一标识;确定包含所述目标页面的唯一标识的第三模型和包含所述目标页面的唯一标识的第四模型;从所述包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;从所述包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于指定单元格的第二模型的唯一标识;从包含所述第二模型的唯一标识的第二模型中确定关联于目标页面的指定单元格的数据名称;基于所述数据名称,从所述第二模型中检索出目标页面的指定单元格在所述表单模板中的坐标位置;基于所述目标页面中除指定单元格中输入的第一数据之外的页面内容、所述坐标位置以及所述目标页面的指定单元格中输入的第一数据,生成所述目标页面。
因此,本发明实施方式基于存储结构化数据和非结构化的页面内容的多个模型,可以重现具有结构化视图的页面。
在示范性实施方式中,所述获取模块,被配置为在所述指定单元格的注释信息中保存所述数据名称,以建立所述指定单元格与所述数据名称的关联;或在所述指定单元格中保存预定字符与所述数据名称的结合,以建立所述指定单元格与所述数据名称的关联。
可见,可以通过多种方式建立指定单元格与数据名称的关联,便于用户的操作使用。
一种电子设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实施如上任一项所述的表单数据处理方法。
一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实施如上任一项所述的表单数据处理方法。
一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实施如上任一项所述的表单数据处理方法。
附图说明
下面将通过参照附图详细描述本发明的优选实施例,使本领域的普通技术人员更清楚本发明的上述及其它特征和优点,附图中:
图1是本发明实施方式的具有结构化视图的报表的示范性示意图。
图2是本发明实施方式的表单数据处理方法的流程图。
图3本发明实施方式以注释方式添加数据名称与指定单元格的关联关系的示意图。
图4是本发明实施方式的表单数据处理的示范性示意图。
图5是本发明实施方式的表单数据处理过程的示范性示意图。
图6是本发明实施方式的表单数据处理装置的示范性结构图。
图7是根据本发明实施方式电子设备的示范性结构图。
其中,附图标记如下:
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下举实施例对本发明进一步详细说明。
为了描述上的简洁和直观,下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显,本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案,一些实施方式没有进行细致地描述,而是仅给出了框架。下文中,“包括”是指“包括但不限于”,“根据……”是指“至少根据……,但不限于仅根据……”。由于汉语的语言习惯,下文中没有特别指出一个成分的数量时,意味着该成分可以是一个也可以是多个,或可理解为至少一个。
首先,对结构化数据和非结构化数据进行说明。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。与结构化数据相对应的是不适于由数据库二维表来表现的非结构化数据。非结构化数据包括各种格式的办公文档、XML、HTML、各类报表、图片和音频、视频信息等。支持非结构化数据的数据库采用多值字段和变长字段机制进行数据项的创建和管理,广泛应用于全文检索和各种多媒体信息处理领域。
另外,对结构化视图进行说明。结构化视图一般是指具有复杂结构的表格(比如多行表头,等等)视图。比如,结构化视图中通常包含不能够用二维表结构来逻辑表达的非结构化数据。举例,中国式报表是一种典型的结构化视图。中国式报表典型的特征包括:(1)表头复杂:存在行列表头,比如多层的大单元格嵌套小单元格,不同栏目层次根据需求的不同可以有不同的表头层级数。(2)、信息量大:展示的栏目多,报表紧凑。(3)、多数据来源:一个中国式表格中的数据,可能来自于不同的原始数据表。(4)、计算复杂:合计、小计、格子间的动态计算。(5)、结构随意:同一个表格中行列数可以不一致;无层次关系的数据可以任意摆放;除了展示统计数据外,通常会在底部添加自定义的备注说明,等等。
结构化视图对于计算机来说过于复杂,存储在结构化视图中的数据难以使用计算机进行分析。但是,用户可以轻松理解结构化视图中的数据之间的关系,并根据这些关系完成数据处理。
图1是本发明实施方式的具有结构化视图的报表的示范性示意图。基于图1,用户可以方便查看和填写表单,但是计算机却难以对用户在结构化视图的报表中填写的数据进行统计分析。可见,如何既为用户提供结构化视图以便于用户查看和填写表单,还同时便于计算机对用户填写的数据进行统计分析,是一项尚待解决的技术难题。
在本发明实施方式中,提供了一种表单数据处理方案,可以将基于Excel等制表工具所创建的表单转换为结构化视图的表单,还可以存储表单中指定单元格的结构化数据。基于结构化视图,可以自动生成结构化视图的前端页面,方便用户完成表单的查看、填充、编辑等操作。同时,用户在指定单元格中填写的数据也将存储为结构化数据,用户可以继续使用数据分析工具(如BI工具或AI工具,等等),轻松有效地分析结构化数据,并探索数据的价值。
图2是本发明实施方式的表单数据处理方法的流程图。
步骤101:获取具有结构化视图的表单模板,其中表单模板包含关联有数据名称的指定单元格。
比如,可以在多种类型的电子表格软件(比如,Excel软件)中生成具有结构化视图的表单模板。而且,用户可以在表单模板中指定出一或多个的单元格,称为指定单元格。表单模板中除了指定单元格之外的其它单元格,可以包含预定数据或为空白以便于用户填充数据。指定单元格中输入的数据,后续将作为结构化数据被存储。除了指定单元格之外的其它单元格中的内容(无论是预定数据或用户填充数据),将作为结构化视图的结构信息的组成内容(其它组成内容可以包括表单布局、字体、格式、单元格个数、单元格之间的定位关系,等等),以非结构化存储方式被存储。
在一个实施方式中,建立数据名称与指定单元格的关联关系包括:
(1)、在指定单元格的注释信息中保存数据名称,以建立指定单元格与数据名称的关联。
比如,可以为指定单元格设置注释,在注释中填充后续在指定单元格中被输入数据的数据名称。在这里,用户或开发人员确定表单模板中的哪些单元格将用于后续的数据分析,并使用电子表格软件(比如,Excel软件)中的注释工具或其他复杂表单工具对这些单元格进行注释。注释的内容是与这些指定单元格中的数据值相对应的数据名称。
图3本发明实施方式以注释方式添加数据名称与指定单元格的关联关系的示意图。如图3所示,针对第D列第11行的指定单元格,为其设置注释框10。在注释框10中填充有数据名称框11,数据名称框11中包含文本:“LowVolatge”。数据名称框11中的文本(“LowVolatge”),即为第D列第11行的单元格中输入数据的数据名称。
(2)、在指定单元格中保存预定字符与数据名称的结合,以建立指定单元格与数据名称的关联。
举例,在第D列第11行的单元格中保存字符串“$$LowVoltage”,其中“$$”为预定字符,数据名称为“LowVolatge”。后续在解析到指定单元格的内容时,当确定出“$$”,即可确定“$$”之后的内容为该指定单元格中输入数据的数据名称,即“LowVolatge”为第D列第11行的单元格中输入数据的数据名称。
可见,可以通过多种方式建立指定单元格与数据名称的关联,便于用户的操作使用。
以上示范性描述了建立数据名称与指定单元格的关联关系的示范性过程,本领域技术人员可以意识到,这种描述过程是示范性的,并不用于限定本发明实施方式的保护范围。
步骤102:基于表征结构化视图的结构信息,在页面中展示结构化视图。
在这里,可以在步骤102之前,解析表单模板以获取表单模板的唯一标识和表征结构化视图的结构信息,在第一模型中存储表单模板的唯一标识和结构信息,比如以JSON或XML存储结构在第一模型中存储表单模板的唯一标识和结构信息。比如,结构信息包括表单模板的下列信息中的至少一个:表单布局;字体;格式;单元格个数;单元格之间的定位关系;单元格之间的已有内容,等等。
当执行步骤102在页面中展示结构化视图时,从第一模型中调取表征结构化视图的结构信息,并以该结构信息在页面中展示结构化视图。在这里,在页面中展示的结构化视图,与表单模板具有相同或相似的视觉效果。比如,页面可以为网页、APP、小程序等前端界面。
步骤103:接收在页面中输入的数据。
在一个实施方式中,指定单元格的数目为N个,其中N为至少为1的正整数;在步骤103之前,还包括:解析表单模板以获取表单模板的唯一标识、结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;在第一模型中存储表单模板的唯一标识和结构信息;在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和表单模板的唯一标识。
表1为第一模型的存储示意图。
表1
除了上述主要参数外,第一模型中还可以根据应用场景添加存储其他参数,如工艺、产品特性等。
可以根据标准的Microsoft Excel数据结构,对表单模板进行解析,得到指定单元格坐标与数据名称(比如,数据名称包含在指定单元格的注释中)之间的关系。存储数据名称与指定单元格坐标之间的关联关系,建立结构化数据与结构化视图之间的属性关系。根据第二模型的定义,在第二模型中存储数据名称与指定单元格坐标之间的关联关系。表单模板中的指定单元格的数目可以为多个,因此相应的第二模型的数目可以为多个。
表2为第二模型的存储示意图。
表2
除了上面提到的主要参数之外,根据应用场景,还可以在第二模型中添加其他参数,如值类型和更新时间温度等。
因此,指定单元格可以为多个,可以存储对应于多个指定单元格的多个结构化数据,提高了数据的分析效率。
在一个实施方式中,步骤104包括:基于表单模板的唯一标识,检索出N个第二模型;在N个第二模型中检索出N个关联关系;基于N个关联关系中的每一个关联关系,从数据中确定出在对应的指定单元格中输入的第一数据。
因此,基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,准确确定出在对应的指定单元格中输入的第一数据。
步骤104:基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,从数据中确定出在指定单元格中输入的第一数据。
步骤105:以结构化存储方式存储第一数据,以非结构化存储方式存储页面中除第一数据之外的页面内容。其中,非结构化存储方式可以包括JSON存储方式或XML存储方式,本发明实施方式对此并无限定。
可见,在本发明实施方式中,结构化视图方便用户完成表单的查看、填充、编辑等操作。而且,用户在指定单元格中的输入数据被存储为结构化数据,便于后续的数据分析以探索数据的价值。
在一个实施方式中,以非结构化存储方式存储页面中除第一数据之外的页面内容包括:在第三模型中以非结构化存储方式存储页面中除所述第一数据之外的页面内容;以结构化存储方式存储第一数据包括:在N个第四模型中以结构化存储方式存储在对应的指定单元格中输入的第一数据;其中第三模型包含用于存储页面的唯一标识的第一字段、用于存储表单模板的唯一标识的第二字段以及用于存储页面内容的第三字段;N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储页面的唯一标识的第五字段以及用于存储在对应的指定单元格中输入的第一数据的第六字段,其中数据名称为结构化存储中的键,第一数据为结构化存储中对应于键的值。
表3为第三模型的存储示意图。
表3
除了上述主要参数外,还可以根据应用场景在第三模型中添加其他参数,如创建时间和更新日志等。
表4为第四模型的存储示意图。
/>
表4
除了上述主要参数外,还可以根据应用场景在第四模型中添加其他参数,如更新日志和启动数据等。
可见,基于存储为第一模型的表单模板,在需要填写数据时自动生成并启动具有结构化视图的前端页面。用户在前端页面中手动填写并保存数据后,基于第二模型所包含的指定单元格的坐标位置与数据名称之间的关联关系,区别地存储页面数据,其中在第三模型中存储结构化视图数据,在第四模型中存储指定单元格中的结构化数据。第三模型主要用于存储支持系统前端显示和数据编辑的结构化视图模型(即第一模型)的实例。第四模型主要用于将特定数据值存储在表单的标记单元格中,该数据可轻松用于支持数据分析。
在一个实施方式中,该方法还包括:接收目标页面的唯一标识;确定包含目标页面的唯一标识的第三模型和包含目标页面的唯一标识的第四模型;从包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;从包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于指定单元格的第二模型的唯一标识;从包含表单模板的唯一标识的第二模型中确定关联于指定单元格的数据名称;基于数据名称,从第二模型中检索出目标页面的指定单元格在表单模板中的坐标位置;基于目标页面中除指定单元格中输入的第一数据之外的页面内容、坐标位置以及目标页面的指定单元格中输入的第一数据,生成目标页面。
因此,本发明实施方式基于存储结构化数据和非结构化的页面内容的多个模型,可以重现具有结构化视图的页面。
图4是本发明实施方式的表单数据处理的示范性示意图。
在图4中,获取基于Excel等表格工具软件所生成的表格模板40,该表格模板40中包含结构化视图。将表格模板40输入到本发明实施方式的表单数据处理41中。在表单数据处理41中,首先在非关系型数据库的第一模型43中以非结构化存储方式存储表格模板40的结构信息42(包括表单布局、字体、格式、单元格个数、单元格之间的定位关系以及单元格中的内容等)。而且,执行结构信息的解析处理45,提取出指定单元格在表单模板中的坐标位置以及从注释中提取出关联于指定单元的数据名称,在第二模型47中存储指定单元格在表单模板中的坐标位置以及关联于指定单元的数据名称之间的关联关系46。利用在第一模型43中存储的结构信息42,在页面44中展示与表格模板40具有相同或相似视图的结构化视图。用户可以在浏览、填写和编辑处理53中,对页面44中的相应表格进行处理(即实例化表格模板40)。
接着,检测用户在页面44中的手动操作51,并存储输入数据48。基于第二模型47中保存的关联关系,从输入数据48中提取结构化数据49以及除了结构化数据49之外的页面内容52(包括表单布局、字体、格式、单元格个数、单元格之间的定位关系以及除了指定单元格之外的单元格中的内容(可能包含针对非指定单元格的输入数据))。可以对结构化数据49执行各种数据分析50,比如利用BI工具进行分析。
而且,当用户关闭页面44,并期望重现页面44时,可以将结构化数据49和页面内容52组合为页面44,其中基于第二模型47中保存的关联关系将对应的结构化数据49填写到页面内容52的各自的指定单元格中。
图5是本发明实施方式的表单数据处理过程的示范性示意图。图5中的表单数据处理过程包括:
步骤60:基于Excel等表格工具软件生成表格模板,该表格模板中包含结构化视图。
步骤61:在表格模板中确定指定单元格(即从表格模板中区分出其数据需要被存储为结构化数据的指定单元格),并以注释等方式为指定单元格建立数据名称与坐标之间的关联关系。
步骤62:将该表格模板(比如,包含注释)发送到本发明实施方式的表单数据处理中。
步骤63:将表格模板的结构信息(结构信息包括整个表格模板的全部视图结构),以非结构化存储方式(比如,将整个表格模板作为JASON文件或XML文件)存储到第一模型70中。
步骤64:解析表格模板。
步骤65:从表格模板(比如,从注释中)提取出每个指定单元格的坐标位置与对应的数据名称之间的关联关系,并在第二模型71中存储关联关系。其中,当指定单元格的数目为多个时,第二模型71为同样数目的多个,即第二模型71一一对应地存储对应的指定单元格的关联关系。
步骤66:从第一模型70中提取表格模板的结构信息,基于表格模板的结构信息在页面中展示表格模板的结构化视图。
步骤67:记录用户在页面中的输入数据。
步骤68:基于第二模型71中保存的关联关系,将用户输入操作后的整个页面中、在指定单元格中输入的输入数据以结构化存储方式存储到第四模型73中,而且将用户输入操作后的整个页面中、除指定单元格中输入的输入数据之外的其余全部内容,都以非结构化存储方式存储到第三模型72中。
在本发明实施方式中,提出一种标准系统,可以提供前端页面的结构化视图供用户轻松使用,以及用于统计分析的结构化数据存储。而且,基于在本发明实施方式,用户都可以对表单的定义进行调整,例如添加或删除新的填充项,并识别需要结构化数据存储的更多数据。这些调整不需要对系统进行二次开发,只需调整Excel中的描述并重新导入即可。此外,通过为用户在线发布新表单,节省了大量时间。另外,由于不需要任何二次开发,节省了系统开发人员的人力成本,避免了表单调整后开发过程中的错误。
图6是本发明实施方式的表单数据处理装置的示范性结构图。如图6所示,装置600包括:
获取模块601,被配置为获取具有结构化视图的表单模板,其中表单模板包含关联有数据名称的指定单元格;
展示模块602,被配置为基于表征结构化视图的结构信息,在页面中展示结构化视图;
接收模块603,被配置为接收在页面中输入的数据;
确定模块604,被配置为基于指定单元格在表单模板中的坐标位置与数据名称之间的关联关系,从数据中确定出在指定单元格中输入的第一数据;
存储模块605,被配置为以结构化存储方式存储第一数据,以非结构化存储方式存储页面中除第一数据之外的页面内容。
在一个实施方式中,指定单元格的数目为N个,其中N为至少为1的正整数;接收模块603,被配置为在接收在页面中输入的数据之前,解析表单模板以获取表单模板的唯一标识、结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;在第一模型中存储表单模板的唯一标识和结构信息;在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和表单模板的唯一标识。
在一个实施方式中,确定模块604,被配置为基于表单模板的唯一标识,检索出N个第二模型;在N个第二模型中检索出N个关联关系;基于N个关联关系中的每一个关联关系,从数据中确定出在对应的指定单元格中输入的第一数据。
在一个实施方式中,存储模块605,被配置为在第三模型中以非结构化存储方式存储页面中除第一数据之外的页面内容;在N个第四模型中以结构化存储方式存储在对应的指定单元格中输入的第一数据;其中第三模型包含用于存储页面的唯一标识的第一字段、用于存储表单模板的唯一标识的第二字段以及用于存储页面内容的第三字段;N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储页面的唯一标识的第五字段以及用于存储在对应的指定单元格中输入的第一数据的第六字段,其中数据名称为结构化存储中的键,第一数据为结构化存储中对应于所述键的值。
在一个实施方式中,还包括:生成模块606,被配置为接收目标页面的唯一标识;确定包含目标页面的唯一标识的第三模型和包含目标页面的唯一标识的第四模型;从包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;从包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于指定单元格的第二模型的唯一标识;从包含第二模型的唯一标识的第二模型中确定关联于目标页面的指定单元格的数据名称;基于数据名称,从第二模型中检索出目标页面的指定单元格在表单模板中的坐标位置;基于目标页面中除指定单元格中输入的第一数据之外的页面内容、坐标位置以及目标页面的指定单元格中输入的第一数据,生成目标页面。
在一个实施方式中,获取模块601,被配置为在指定单元格的注释信息中保存数据名称,以建立指定单元格与数据名称的关联;或在指定单元格中保存预定字符与数据名称的结合,以建立指定单元格与数据名称的关联。
本发明实施方式还提出了一种具有处理器-存储器架构的电子设备。图7是根据本发明实施方式电子设备的示范性结构图。
如图7所示,电子设备700包括处理器701、存储器702及存储在存储器702上并可在处理器701上运行的计算机程序,计算机程序被处理器701执行时实现如上任一种的表单数据处理方法。其中,存储器702具体可以实施为电可擦可编程只读存储器(EEPROM)、快闪存储器(Flash memory)、可编程程序只读存储器(PROM)等多种存储介质。处理器701可以实施为包括一或多个中央处理器或一或多个现场可编程门阵列,其中现场可编程门阵列集成一或多个中央处理器核。具体地,中央处理器或中央处理器核可以实施为CPU或MCU或DSP,等等。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分,实际实现时,一个模块可以分由多个模块实现,多个模块的功能也可以由同一个模块实现,这些模块可以位于同一个设备中,也可以位于不同的设备中。
各实施方式中的硬件模块可以以机械方式或电子方式实现。例如,一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式,或是采用专用的永久性电路,或是采用临时配置的电路(如由软件进行配置)来实现硬件模块,可以根据成本和时间上的考虑来决定。
以上所述,仅为本发明的较佳实施方式而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.一种表单数据处理方法(100),其特征在于,所述方法(100)包括:
获取具有结构化视图的表单模板,其中所述表单模板包含关联有数据名称的指定单元格(101);
基于表征所述结构化视图的结构信息,在页面中展示所述结构化视图(102);
接收在所述页面中输入的数据(103);
基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据(104);
以结构化存储方式存储所述第一数据,以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容(105)。
2.根据权利要求1所述的方法(100),其特征在于,所述指定单元格的数目为N个,其中N为至少为1的正整数;在所述接收在所述页面中输入的数据之前(103),还包括:
解析所述表单模板以获取所述表单模板的唯一标识、所述结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;
在第一模型中存储所述表单模板的唯一标识和所述结构信息;
在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和所述表单模板的唯一标识。
3.根据权利要求2所述的方法(100),其特征在于,所述基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据(104)包括:
基于所述表单模板的唯一标识,检索出所述N个第二模型;
在所述N个第二模型中检索出所述N个关联关系;
基于所述N个关联关系中的每一个关联关系,从所述数据中确定出在对应的指定单元格中输入的第一数据。
4.根据权利要求3所述的方法(100),其特征在于,
所述以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容包括:在第三模型中以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容;
所述以结构化存储方式存储所述第一数据包括:在N个第四模型中以结构化存储方式存储所述在对应的指定单元格中输入的第一数据;
其中所述第三模型包含用于存储所述页面的唯一标识的第一字段、用于存储所述表单模板的唯一标识的第二字段以及用于存储所述页面内容的第三字段;
所述N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储所述页面的唯一标识的第五字段以及用于存储在所述对应的指定单元格中输入的第一数据的第六字段,其中所述数据名称为结构化存储中的键,所述第一数据为结构化存储中对应于所述键的值。
5.根据权利要求4所述的方法(100),其特征在于,还包括:
接收目标页面的唯一标识;
确定包含所述目标页面的唯一标识的第三模型和包含所述目标页面的唯一标识的第四模型;
从所述包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;
从所述包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于目标页面的指定单元格的第二模型的唯一标识;
从包含所述第二模型的唯一标识的第二模型中确定关联于目标页面的指定单元格的数据名称;
基于所述数据名称,从所述第二模型中检索出目标页面的指定单元格在所述表单模板中的坐标位置;
基于所述目标页面中除指定单元格中输入的第一数据之外的页面内容、所述坐标位置以及所述目标页面的指定单元格中输入的第一数据,生成所述目标页面。
6.根据权利要求1-5中任一项所述的方法(100),其特征在于,还包括:
在所述指定单元格的注释信息中保存所述数据名称,以建立所述指定单元格与所述数据名称的关联;或
在所述指定单元格中保存预定字符与所述数据名称的结合,以建立所述指定单元格与所述数据名称的关联。
7.一种表单数据处理装置(600),其特征在于,所述装置(600)包括:
获取模块(601),被配置为获取具有结构化视图的表单模板,其中所述表单模板包含关联有数据名称的指定单元格;
展示模块(602),被配置为基于表征所述结构化视图的结构信息,在页面中展示所述结构化视图;
接收模块(603),被配置为接收在所述页面中输入的数据;
确定模块(604),被配置为基于所述指定单元格在所述表单模板中的坐标位置与所述数据名称之间的关联关系,从所述数据中确定出在所述指定单元格中输入的第一数据;
存储模块(605),被配置为以结构化存储方式存储所述第一数据,以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容。
8.根据权利要求7所述的装置(600),其特征在于,所述指定单元格的数目为N个,其中N为至少为1的正整数;
所述接收模块(603),被配置在接收在所述页面中输入的数据之前,解析所述表单模板以获取所述表单模板的唯一标识、所述结构信息及N个指定单元格的坐标位置与对应的数据名称之间的N个关联关系;在第一模型中存储所述表单模板的唯一标识和所述结构信息;在N个第二模型的每一个第二模型中,分别存储对应的第二模型的唯一标识、对应的关联关系和所述表单模板的唯一标识。
9.根据权利要求8所述的装置(600),其特征在于,
所述确定模块(604),被配置为基于所述表单模板的唯一标识,检索出所述N个第二模型;在所述N个第二模型中检索出所述N个关联关系;基于所述N个关联关系中的每一个关联关系,从所述数据中确定出在对应的指定单元格中输入的第一数据。
10.根据权利要求9所述的装置(600),其特征在于,
所述存储模块(605),被配置为在第三模型中以非结构化存储方式存储所述页面中除所述第一数据之外的页面内容;在N个第四模型中以结构化存储方式存储所述在对应的指定单元格中输入的第一数据;其中所述第三模型包含用于存储所述页面的唯一标识的第一字段、用于存储所述表单模板的唯一标识的第二字段以及用于存储所述页面内容的第三字段;所述N个第四模型中的每一个第四模型,包含用于存储关联于指定单元格的第二模型的唯一标识的第四字段、用于存储所述页面的唯一标识的第五字段以及用于存储在所述对应的指定单元格中输入的第一数据的第六字段,其中所述数据名称为结构化存储中的键,所述第一数据为所述结构化存储中对应于所述键的值。
11.根据权利要求10所述的装置(600),其特征在于,还包括:
生成模块(606),被配置为接收目标页面的唯一标识;确定包含所述目标页面的唯一标识的第三模型和包含所述目标页面的唯一标识的第四模型;从所述包含目标页面的唯一标识的第三模型的第三字段中,提取目标页面中除指定单元格中输入的第一数据之外的页面内容,从第二字段中提取表单模板的唯一标识;从所述包含目标页面的唯一标识的第四模型的第六字段中提取目标页面的指定单元格中输入的第一数据以及从第四字段中提取关联于指定单元格的第二模型的唯一标识;从包含所述第二模型的唯一标识的第二模型中确定关联于目标页面的指定单元格的数据名称;基于所述数据名称,从所述第二模型中检索出目标页面的指定单元格在所述表单模板中的坐标位置;基于所述目标页面中除指定单元格中输入的第一数据之外的页面内容、所述坐标位置以及所述目标页面的指定单元格中输入的第一数据,生成所述目标页面。
12.根据权利要求7-11中任一项所述的装置(600),其特征在于,
所述获取模块(601),被配置为在所述指定单元格的注释信息中保存所述数据名称,以建立所述指定单元格与所述数据名称的关联;或在所述指定单元格中保存预定字符与所述数据名称的结合,以建立所述指定单元格与所述数据名称的关联。
13.一种电子设备(700),其特征在于,包括:
处理器(701);
存储器(702),用于存储所述处理器(701)的可执行指令;
所述处理器(701),用于从所述存储器(702)中读取所述可执行指令,并执行所述可执行指令以实施权利要求1-6中任一项所述的表单数据处理方法(100)。
14.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实施权利要求1-6中任一项所述的表单数据处理方法(100)。
15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实施权利要求1-6中任一项所述的表单数据处理方法(100)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211113490.7A CN117744615A (zh) | 2022-09-13 | 2022-09-13 | 表单数据处理方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211113490.7A CN117744615A (zh) | 2022-09-13 | 2022-09-13 | 表单数据处理方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117744615A true CN117744615A (zh) | 2024-03-22 |
Family
ID=90255003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211113490.7A Pending CN117744615A (zh) | 2022-09-13 | 2022-09-13 | 表单数据处理方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117744615A (zh) |
-
2022
- 2022-09-13 CN CN202211113490.7A patent/CN117744615A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9495347B2 (en) | Systems and methods for extracting table information from documents | |
CN110292775B (zh) | 获取差异数据的方法及装置 | |
EP2041672B1 (en) | Methods and apparatus for reusing data access and presentation elements | |
US7673235B2 (en) | Method and apparatus for utilizing an object model to manage document parts for use in an electronic document | |
US9069831B2 (en) | Retrieving data objects | |
CN102651055B (zh) | 一种基于医学影像的文件生成方法及系统 | |
US7720885B2 (en) | Generating a word-processing document from database content | |
CN105138504A (zh) | 一种报表生成方法及报表引擎 | |
CN112528602B (zh) | 一种医药文档结构化内容分析方法、系统和存储介质 | |
CN116028653B (zh) | 一种可视化配置多源异构数据构建图谱的方法及系统 | |
US20150199346A1 (en) | Hierarchical database report generation with automated query generation for placeholders | |
CN105005592A (zh) | 数据字典生成方法和数据字典生成装置 | |
CN116468010A (zh) | 报表生成方法、装置、终端及存储介质 | |
CN110956029B (zh) | 一种技术文档处理方法和系统 | |
US11816770B2 (en) | System for ontological graph creation via a user interface | |
CN114207598A (zh) | 电子表单表转换 | |
US20070282804A1 (en) | Apparatus and method for extracting database information from a report | |
CN113238865A (zh) | 基于Excel一键导入的快速构建知识图谱的方法 | |
CN116090416B (zh) | 基于标准知识图谱的标准编写方法、系统、设备及介质 | |
CN110704635B (zh) | 一种知识图谱中三元组数据的转换方法及装置 | |
US20050171966A1 (en) | Relational to hierarchical tree data conversion technique | |
US11940964B2 (en) | System for annotating input data using graphs via a user interface | |
CN117744615A (zh) | 表单数据处理方法、装置、电子设备及可读存储介质 | |
CN116010439A (zh) | 一种可视化中文sql系统及构建查询方法 | |
CN113657080A (zh) | 一种基于xml的结构化系统及数据包创建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |