CN109815447A - 一种Word表单Schema处理系统 - Google Patents

一种Word表单Schema处理系统 Download PDF

Info

Publication number
CN109815447A
CN109815447A CN201910024758.1A CN201910024758A CN109815447A CN 109815447 A CN109815447 A CN 109815447A CN 201910024758 A CN201910024758 A CN 201910024758A CN 109815447 A CN109815447 A CN 109815447A
Authority
CN
China
Prior art keywords
schema
frame
word list
list
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910024758.1A
Other languages
English (en)
Other versions
CN109815447B (zh
Inventor
蒋震宇
葛佳兴
贾立锋
付银海
韩甲
丁亮
王如锵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Little Thai Technology Co Ltd
Original Assignee
Zhejiang Little Thai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Little Thai Technology Co Ltd filed Critical Zhejiang Little Thai Technology Co Ltd
Priority to CN201910024758.1A priority Critical patent/CN109815447B/zh
Publication of CN109815447A publication Critical patent/CN109815447A/zh
Application granted granted Critical
Publication of CN109815447B publication Critical patent/CN109815447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种Word表单Schema处理系统,包括以下模块:获取模块,用于接收信息采集人员上传的Word表单,其中,Word表单包括具有文字的文字框和不具有文字的编写框;生成模块,基于Word表单生成多个与编写框一一对应的Schema,其中,Schema包含字符名和编写区域。获取模块获取到Word表单,每个编写框对应生成一个Schema,从而生成了与编写框对应的Schema。Schema包含字符名和编写区域。便于将Word表单转变为多个Schema。

Description

一种Word表单Schema处理系统
技术领域
本发明涉及Word表单处理的技术领域,具体涉及一种Word表单Schema处理系统。
背景技术
Word作为大众化的文档编辑工具被各行业广泛地采用,用Word制作或填写电子表单成为了大家习以为常的事。Word等办公软件实现了去纸化办公,随着互联网及移动互联网地发展,在线办公蔚然成风,越来越多的信息录入都已在线化、移动化,但我们也看到相比之下Word以其使用简单、布局灵活等特点在办公自动化中仍有很大的市场。
Schema(表单结构)是一个XML文档,可以更直观地了解XML的结构。Schema支持命名空间,内置多种简单和复杂的数据类型,并支持自定义数据类型。Schema渐渐成为XML应用的统一规范。
Word表单是目前常用的表单,可以用作信息的收集录入等,现有的Word表单填写过程中,需要信息采集人员将表单分发给信息填写人员,信息填写人员填写Word表单后将Word表单回传给信息采集人员。
在Word表单的数据整理和填写的过程中,通常会用到与Word表单对应的Schema,Schema包括字符名(如姓名、年龄等)和编写区域,编写区域与字符名对应。现有技术中缺少将Word表单转变为Schema的方法。
发明内容
针对上述现有技术存在的缺少将Word表单转变为Schema的方法,本发明的目的在于提供一种Word表单Schema处理系统,可以将Word表单转变为Schema。
为实现上述目的,本发明提供了如下技术方案:
一种Word表单Schema处理系统,包括以下模块:
获取模块,用于接收信息采集人员上传的Word表单,其中,Word表单包括具有文字的文字框和不具有文字的编写框;
生成模块,基于Word表单生成多个与编写框一一对应的Schema,其中,Schema包含字符名和编写区域。
通过采用上述技术方案,获取模块获取到Word表单,通过判断单元格中是否含有文字,即可将Word表单分为文字框和编写框。每个编写框对应生成一个Schema,从而生成了与编写框对应的Schema。Schema包含字符名和编写区域。如对应姓名的Schema的字符名为姓名,编写区域为空白,编写区域用于供信息填写人员填写。通过寻找编写框,从而生成多个Schema,在字符名中填写对应的字符,字符名可选择自动生成或者人工填写的方式填入,从而将Word表单转变为多个Schema。
本发明的进一步设置为:还包括用于在生成模块之后执行的,
组合模块,基于多个Schema组合成组合表单;
采集模块,用于采集信息填写人员填写后的组合表单;
还原模块,用于将组合表单中填写在编写区域的数据还原至Word表单。
通过采用上述技术方案,组合模块将Schema组合成组合表单,信息采集人员将组合表单分发给信息填写人员填写,信息填写人员填写后的组合表单提交到采集模块中采集,还原模块根据组合表单中的数据自动还原成Word表单。本系统将Word表单转变为多个Schema,从而将整个Word表单分解,可将Schema用于数据的采集和数据的统计,例如:仅获取姓名和联系方式对应的Schema,即可获取列表,便于数据的整理。
本发明的进一步设置为:组合模块中的组合表单用于在线填写。
通过采用上述技术方案,本系统将Word表单转变为多个Schema,从而将整个Word表单分解,分解后的Schema可以组合为在线填写的组合表单,无需信息填写人员下载Word表单、删除Word表单的操作,实现了整个流程实现了在线化的填写。
本发明的进一步设置为:生成模块包括,
第一执行模块,用于获取编写框的数量并生成与编写框一一对应的Schema;
第二执行模块,用于判断所有文字框中的文字中含有输入提示符的数量并生成与含有输入提示符的文字框对应的Schema。
通过采用上述技术方案,第一执行模块用于生成与编写框数量对应的Schema。
第二执行模块中输入提示符采取枚举方式获得,如冒号,若是文字框中的文字中携带有冒号,则生成与具有输入提示符的文字框对应的Schema。部分文字框设置为“姓名:”通过识别其中的冒号,即可生成与输入提示符对应的Schema。通过对Word表单中文字框中的文字的进一步分析,从而获取对应的需要编写的Schema,便于信息采集人员将Word表单转换为Schema。
本发明的进一步设置为:第一执行模块具体包括,
获取部,获取编写框的数量;
生成部,生成与编写框数量对应的Schema,其中,Schema中的字符名为空白;
填写部,判断Schema对应的编写框是否为列表框;
若是,则获取编写框左侧的第一个文字框中的文字和编写框上方的第一个文字框的文字并合并后填写入Schema的字符名中;
若否,则获取编写框左侧第一个文字框的文字并写入到Schema的字符名中。
通过采用上述技术方案,在表格中可能存在有列表框,如:纵列为父亲、母亲两个单元格,横行为姓名、学历、工作、联系方式等多个单元格;横行与纵列对应的区域为列表框。在列表框中,单元格对应需要填写的为横行与纵列合并后的名称。如:纵列为父亲、横列为联系方式,则生成的字符名为父亲联系方式。若编写框不是列表框,通过获取左侧的第一个文字框,从而自动获取字符名并填写到Schema的字符名当中。将编写框分为普通编写框和列表框,从而对应生成字符名,从而生成了Schema。
本发明的进一步设置为:填写部通过判断编写框的左侧单元格和右侧单元格是否至少有一个为空来判断编写框是否为列表框。
通过采用上述技术方案,现有的列表框的左侧或者右侧有一个为空,则此单元格为列表框。
本发明的进一步设置为:Schema中还包含有对应字符名的字符类型,其中,字符类型包含有必填、只读、隐藏、自动生成、限制填写、条件显示。
通过采用上述技术方案,在将Schema组成之后,部分Schema根据字符类型对应的显示。如:姓名、身份证号码等字符名对应的Schema为必填项,即为必填的字符类型;年龄等字符名对应的Schema可以根据身份证号码自动识别生成,则对应的字符类型可为只读、隐藏或自动生成;性别的选项仅可为男或女,则性别的对应的字符类型可为限制填写。
在识别字符名的过程中,由于表单的字段内容比较固定,对于常用字段可通过枚举判定,如显示名称包含“出生、日期”等字符时可判定为BirthModel,如包含“身份证”字符时可判定为IdcardModel, 枚举内容可随着系统的运行逐渐积累完善。对于无法判定的字段可采用人工标注的方式进行,模型确定后使用各模型预设的参数进行填充。
本发明的进一步设置为:还包括可视化编辑模块,用于获取信息采集者在编写框和文字框中的操作并生成可编辑的Schema。
通过采用上述技术方案,信息采集者在Word表单进行转换操作时,信息采集者在Word表单上点击编辑区域从而生成可编辑的Schema。Schema的字符名、字符类型可选择自定义或者从Word表单中选取即可。通过自动化的生成Schema和人工编辑Schema,从而形成多个Schema,Schema产生错误的概率小。
本发明的进一步设置为:本系统使用docx4j或Apache POI基于OOXML格式解析。
通过采用上述技术方案,OOXML格式是主流Office软件共同遵守的格式规范,所以理论本系统也支持诸如OpenOffice、WPS等格式。
本发明具有以下优点:
1、将Word表单转换为多个Schema,便于数据的填写和整理;
2、通过将多个Schema组合为组合表单,便于信息填写人员在线填写数据;
3、信息采集者可通过可视化编辑模块手动编辑Schema,适用性强。
附图说明
图1为本系统的流程图。
具体实施方式
参照附图对本发明做进一步说明。
如图1所示:一种Word表单Schema处理系统,本系统存储在存储装置内并供处理器调用使用。本系统使用docx4j或Apache POI基于OOXML格式解析,OOXML格式是主流Office软件共同遵守的格式规范,所以理论本系统也支持诸如OpenOffice、WPS等格式。包括获取模块、生成模块、组合模块、采集模块、还原模块。
获取模块用于接收信息采集人员上传的Word表单,其中,Word表单包括具有文字的文字框和不具有文字的编写框。通过判断单元格中是否含有文字,即可将Word表单分为文字框和编写框。
生成模块基于Word表单生成多个与编写框一一对应的Schema,其中,Schema包含字符名、编写区域和与字符名对应的字符类型。如对应姓名的Schema的字符名为姓名,编写区域为空白,编写区域用于供信息填写人员填写。
字符类型包含有必填、只读、隐藏、自动生成、限制填写、条件显示。在将Schema组成之后,部分Schema根据字符类型对应的显示。如:姓名、身份证号码等字符名对应的Schema为必填项,即为必填的字符类型;年龄等字符名对应的Schema可以根据身份证号码自动识别生成,则对应的字符类型可为只读、隐藏或自动生成;性别的选项仅可为男或女,则性别的对应的字符类型可为限制填写。
在识别字符名的过程中,由于表单的字段内容比较固定,对于常用字段可通过枚举判定,如显示名称包含“出生、日期”等字符时可判定为BirthModel,如包含“身份证”字符时可判定为IdcardModel, 枚举内容可随着系统的运行逐渐积累完善。对于无法判定的字段可采用人工标注的方式进行,模型确定后使用各模型预设的参数进行填充。
生成模块具体包括第一执行模块和第二执行模块。
第一执行模块用于获取编写框的数量并生成与编写框一一对应的Schema。每个编写框对应生成一个Schema,从而生成了与编写框对应的Schema。
第一执行模块具体包括获取部、生成部、填写部,
获取部用于获取编写框的数量。
生成部生成与编写框数量对应的Schema,其中,Schema中的字符名为空白。
填写部用于判断Schema对应的编写框是否为列表框。填写部通过判断编写框的左侧单元格和右侧单元格是否至少有一个为空来判断编写框是否为列表框。在表格中可能存在有列表框,如:纵列为父亲、母亲两个单元格,横行为姓名、学历、工作、联系方式等多个单元格;横行与纵列对应的区域为列表框。
若是,则获取编写框左侧的第一个文字框中的文字和编写框上方的第一个文字框的文字并合并后填写入Schema的字符名中。在列表框中,单元格对应需要填写的为横行与纵列合并后的名称。如:纵列为父亲、横列为联系方式,则生成的字符名为父亲联系方式。
若否,则获取编写框左侧第一个文字框的文字并写入到Schema的字符名中。现有的Word表单通常在左侧为名称,右侧为填写区域,通过获取左侧的第一个文字框,从而自动获取字符名并填写到Schema的字符名当中。
将编写框分为普通编写框和列表框,从而对应生成字符名,从而生成了Schema。
第二执行模块用于判断所有文字框中的文字中含有输入提示符的数量并生成与含有输入提示符的文字框对应的Schema。输入提示符采取枚举方式获得,如冒号,若是文字框中的文字中携带有冒号,则生成与具有输入提示符的文字框对应的Schema。部分文字框设置为“姓名:”通过识别其中的冒号,即可生成与输入提示符对应的Schema。
组合模块基于多个Schema组合成组合表单。组合模块中的组合表单用于在线填写。通过将Schema组合形成组合表单,之后将组合表单发布到微信小程序或者网页链接。之后将微信小程序或者网页链接发送给信息填写人员,信息填写人员对应的在组合表单中进行填写即可完成填写。
采集模块用于采集信息填写人员填写后的组合表单。
还原模块,用于将组合表单中填写在编写区域的数据还原至Word表单。
信息填写人员将组合表单填写后,信息填写人员将组合表单提交,采集模块获取填写后的组合表单,还原模块具体分为以下步骤:
1.将组合表单分解为多个填写后的Schema;
2.获取Schema中编写区域填写的字符串;
3.将编写区域内的字符串还原至Word表单中。
在整个填写过程中,Word表单转换为Schema,并组合为组合表单供信息填写人员填写,之后又将填写后的Schema转换为Word表单,从而完成了整个流程。
该处理系统还包括可视化编辑模块,可视化编辑模块用于获取信息采集者在编写框和文字框中的操作并生成可编辑的Schema。信息采集者在Word表单进行转换操作时,信息采集者在Word表单上点击编辑区域从而生成可编辑的Schema。Schema的字符名、字符类型可选择自定义或者从Word表单中选取即可。通过自动化的生成Schema和人工编辑Schema,从而形成多个Schema,Schema产生错误的概率小。
本系统将Word表单转变为多个Schema,从而将整个Word表单分解,分解后的Schema可以组合为在线填写的组合表单,无需信息填写人员下载Word表单、删除Word表单的操作,实现了整个流程实现了在线化的填写。
Schema将Word表单分解为多个数据,可将Schema用于数据的采集和数据的统计,例如:仅获取姓名和联系方式对应的Schema,即可获取列表,便于数据的整理。
信息采集人员初始制作了Word表单,最后获取了Word表单。针对于一些政府文件,均需要使用Word表单来存档,将Schema还原成Word表单,便于数据的存档。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种Word表单Schema处理系统,其特征是,包括以下模块:
获取模块,用于接收信息采集人员上传的Word表单,其中,Word表单包括具有文字的文字框和不具有文字的编写框;
生成模块,基于Word表单生成多个与编写框一一对应的Schema,其中,Schema包含字符名和编写区域。
2.根据权利要求1所述的一种Word表单Schema处理系统,其特征是:还包括用于在生成模块之后执行的,
组合模块,基于多个Schema组合成组合表单;
采集模块,用于采集信息填写人员填写后的组合表单;
还原模块,用于将组合表单中填写在编写区域的数据还原至Word表单。
3.根据权利要求2所述的一种Word表单Schema处理系统,其特征是:组合模块中的组合表单用于在线填写。
4.根据权利要求3所述的一种Word表单Schema处理系统,其特征是:生成模块包括,
第一执行模块,用于获取编写框的数量并生成与编写框一一对应的Schema;
第二执行模块,用于判断所有文字框中的文字中含有输入提示符的数量并生成与含有输入提示符的文字框对应的Schema。
5.根据权利要求4所述的一种Word表单Schema处理系统,其特征是:第一执行模块具体包括,
获取部,获取编写框的数量;
生成部,生成与编写框数量对应的Schema,其中,Schema中的字符名为空白;
填写部,判断Schema对应的编写框是否为列表框;
若是,则获取编写框左侧的第一个文字框中的文字和编写框上方的第一个文字框的文字并合并后填写入Schema的字符名中;
若否,则获取编写框左侧第一个文字框的文字并写入到Schema的字符名中。
6.根据权利要求5所述的一种Word表单Schema处理系统,其特征是:填写部通过判断编写框的左侧单元格和右侧单元格是否至少有一个为空来判断编写框是否为列表框。
7.根据权利要求6所述的一种Word表单Schema处理系统,其特征是:Schema中还包含有对应字符名的字符类型,其中,字符类型包含有必填、只读、隐藏、自动生成、限制填写、条件显示。
8.根据权利要求1所述的一种Word表单Schema处理系统,其特征是:还包括可视化编辑模块,用于获取信息采集者在编写框和文字框中的操作并生成可编辑的Schema。
9.根据权利要求1-8任一所述的一种Word表单Schema处理系统,其特征是:本系统使用docx4j或Apache POI基于OOXML格式解析。
CN201910024758.1A 2019-01-10 2019-01-10 一种Word表单Schema处理系统 Active CN109815447B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910024758.1A CN109815447B (zh) 2019-01-10 2019-01-10 一种Word表单Schema处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910024758.1A CN109815447B (zh) 2019-01-10 2019-01-10 一种Word表单Schema处理系统

Publications (2)

Publication Number Publication Date
CN109815447A true CN109815447A (zh) 2019-05-28
CN109815447B CN109815447B (zh) 2023-05-12

Family

ID=66604430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910024758.1A Active CN109815447B (zh) 2019-01-10 2019-01-10 一种Word表单Schema处理系统

Country Status (1)

Country Link
CN (1) CN109815447B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016276A (zh) * 2020-10-29 2020-12-01 广州欧赛斯信息科技有限公司 一种图形化自定义表单数据采集系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103573A (zh) * 2009-12-17 2011-06-22 北大方正集团有限公司 一种快速生成开放格式文档的方法及系统
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN103294477A (zh) * 2013-06-14 2013-09-11 张昀 使用Office文档进行移动开发项目管理的方法
CN108009264A (zh) * 2017-12-14 2018-05-08 北京航天测控技术有限公司 一种用于Excel格式文档的数据版本的比较方法
CN108733638A (zh) * 2017-04-17 2018-11-02 北大方正集团有限公司 Word稿件的结构化方法及word稿件的结构化装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103573A (zh) * 2009-12-17 2011-06-22 北大方正集团有限公司 一种快速生成开放格式文档的方法及系统
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN103294477A (zh) * 2013-06-14 2013-09-11 张昀 使用Office文档进行移动开发项目管理的方法
CN108733638A (zh) * 2017-04-17 2018-11-02 北大方正集团有限公司 Word稿件的结构化方法及word稿件的结构化装置
CN108009264A (zh) * 2017-12-14 2018-05-08 北京航天测控技术有限公司 一种用于Excel格式文档的数据版本的比较方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016276A (zh) * 2020-10-29 2020-12-01 广州欧赛斯信息科技有限公司 一种图形化自定义表单数据采集系统
CN112016276B (zh) * 2020-10-29 2021-02-26 广州欧赛斯信息科技有限公司 一种图形化自定义表单数据采集系统

Also Published As

Publication number Publication date
CN109815447B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
US6192381B1 (en) Single-document active user interface, method and system for implementing same
JP5247983B2 (ja) アクション可能な電子メールドキュメント
US9043298B2 (en) Platform for generating, managing and sharing content clippings and associated citations
CN108037920A (zh) 客户端自定义表单生成方法、存储介质
US20050071752A1 (en) Forms management system
Mayernik Metadata realities for cyberinfrastructure: Data authors as metadata creators
US20090044095A1 (en) Automatically populating and/or generating tables using data extracted from files
US20170220858A1 (en) Optical recognition of tables
CN1664810A (zh) 辅助表格填充
EP3411800A1 (en) Parameterizing and working with math equations in a spreadsheet application
Loy et al. Supporting data science in the statistics curriculum
Skinner et al. Planetary Geologic Mapping Protocol-2018
CN109460227A (zh) 一种网站前端的开发方法、装置、设备及介质
CN109815447A (zh) 一种Word表单Schema处理系统
CN106227575A (zh) 一种生成与解析文本文件的方法
CN104598437B (zh) 电子病历中页眉信息的动态实现方法
CN108182236A (zh) 一种统一配置数据源的web页面下拉列表实现方法
CN112396395A (zh) 一种用于作业批改的系统及方法
CN115422902A (zh) 基于模板生成问卷的方法及系统
CN106296131A (zh) 所见即所得的单据审批系统及单据审批方法
CN115510834A (zh) 一种实验室数据数字化管理系统和方法
CN113448544A (zh) 一种程序开发中文档自动生成方法及系统
CN111444150A (zh) 一种sap hana多字段大数据量导入的方法
CN110210014B (zh) 智能表格系统
Eiamboonsert et al. dCollective: A Configurable Electronic Data Collection Form and Information Dashboard

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant