CN111767703B - 表单数据采集方法、装置和系统 - Google Patents

表单数据采集方法、装置和系统 Download PDF

Info

Publication number
CN111767703B
CN111767703B CN202010594619.5A CN202010594619A CN111767703B CN 111767703 B CN111767703 B CN 111767703B CN 202010594619 A CN202010594619 A CN 202010594619A CN 111767703 B CN111767703 B CN 111767703B
Authority
CN
China
Prior art keywords
data
target
field
matching
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010594619.5A
Other languages
English (en)
Other versions
CN111767703A (zh
Inventor
丁博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur General Software Co Ltd
Original Assignee
Inspur General Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur General Software Co Ltd filed Critical Inspur General Software Co Ltd
Priority to CN202010594619.5A priority Critical patent/CN111767703B/zh
Publication of CN111767703A publication Critical patent/CN111767703A/zh
Application granted granted Critical
Publication of CN111767703B publication Critical patent/CN111767703B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了表单数据采集方法、装置和系统,该方法包括:获取至少一个目标输入文件;分别从每个所述目标输入文件中采集所需要的目标数据,并生成包括有所采集到的所述目标数据的待处理数据集;针对目标表单所包括的每一个字段,均执行:根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据;将匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域。本方案能够提高数据采集的效率。

Description

表单数据采集方法、装置和系统
技术领域
本发明涉及计算机应用技术领域,特别涉及表单数据采集方法、装置和系统。
背景技术
随着移动互联网技术的发展,越来越多的企业通过互联网进行业务往来,企业信息化处理的数据量也越来越庞大,导致企业需要投入大量的人力和时间去录入和分析数据,提高了企业的运营成本。
申请号为201910569135.2的中国专利申请公开了基于表单的信息采集方法和装置,通过设置业务控件组的沉淀提高了表单的生成效率,减少了表单生成人员的设计工作量,进一步实现了信息采集的智能化。以通过业务
表单在网页中主要负责数据采集,以表单的方式采集文件的数据成为较为常用的一种方式。用户可以利用表单来填报数据,如果用户所填写的内容与字段约束不匹配,则系统会提示不匹配信息,以便用户修改。对于不同类型的数据,由于对应权限不同以及处理要求不同,用户需要手动填写,而且易出错,从而导致效率低,表单并不能有针对性的进行高效采集,导致数据采集的效率较低。
发明内容
本发明提供了表单数据采集方法、装置和系统,能够提高数据采集的效率。
第一方面,本发明实施例提供了表单数据采集方法,包括:
获取至少一个目标输入文件;
分别从每个所述目标输入文件中采集所需要的目标数据,并生成包括有所采集到的所述目标数据的待处理数据集;
针对所述目标表单所包括的每一个字段,均执行:
根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据;
将匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域。
可选地,在所述根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据之前,进一步包括:
确定所述待处理数据集中所述目标数据所属的至少一个第二字段,其中,所述目标数据所包括的每一项数据仅属于一个所述第二字段;
针对所确定出的每个所述第二字段,根据来自用户的字段匹配指令,将该第二字段与所述目标表单中的至少一个所述第一字段相匹配;
生成记录有各个所述第二字段与各个所述第一字段之间匹配关系的所述数据匹配规则。
可选地,所述根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据,包括:
根据所述数据匹配规则确定与该第一字段匹配的第二字段;
根据与该第一字段相匹配的所述第二字段,从所述待处理数据集中获取属于该第二字段的数据;
将获取到的数据确定为与该第一字段相对应的所述目标数据。
可选地,所述生成包括有所采集到的所述目标数据的待处理数据集后,包括:
将所述待处理数据集中所述目标数据的数据格式转化为符合所述目标表单的数据格式。
可选地,所述将匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域,包括:
将所匹配到的与该第一字段相对应的所述目标数据发送给Web服务器,以使所述Web服务器确定出所述目标数据在目标表单中的填充区域;
接收来自所述Web服务器的表单刷新数据,其中,所述表单刷新数据记录有所述Web服务器确定出的所述目标数据在目标表单中的填充区域;
根据所述表单刷新数据,显示填充有所述目标数据的所述目标表单。
第二方面,本发明实施例还提供了表单数据采集装置,包括:获取模块、采集模块、匹配模块和填充模块;
所述获取模块,用于获取至少一个目标输入文件;
所述采集模块,用于分别从所述获取模块获取的每一个所述目标输入文件中采集所需的目标数据,并生成包括有所采集到的所述目标数据的待处理数据集;
所述第一匹配模块,用于针对所述目标表单所包括的每一个第一字段,根据针对所述目标表单预先创建的数据匹配规则,从所述采集模块生成的所述待处理数据集中匹配与该第一字段相对应的所述目标数据;
所述填充模块,用于将所述第一匹配模块所匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域。
可选地,该表单数据采集装置进一步包括:确定模块、第二匹配模块和生成模块;
所述确定模块,用于确定所述采集模块生成的所述待处理数据集中所述目标数据所属的至少一个第二字段,其中,所述目标数据所包括的每一项数据仅属于一个所述第二字段;
所述第二匹配模块,用于针对所述确定模块所确定出的每一个所述第二字段,根据来自用户的字段匹配指令,将该第二字段与所述目标表单中的至少一个所述第一字段相匹配;
所述生成模块,用于生成记录有由所述第二匹配模块确定的各个所述第二字段与各个所述第一字段之间匹配关系的所述数据匹配规则。
可选地,所述第一匹配模块包括:第一确定单元、获取单元和第二确定单元;
所述第一确定单元,用于根据所述生成模块生成的所述数据匹配规则确定与该第一字段相匹配的所述第二字段;
所述获取单元,用于根据所述第一确定单元确定的与该第一字段相匹配的所述第二字段,从所述待处理数据集中获取属于该第二字段的数据;
所述第二确定单元,用于将由获取单元获取到的数据确定为与该第一字段相对应的所述目标数据。
可选地,所述填充模块包括:发送单元、接收单元和显示单元;
所述发送单元,用于将所述第一匹配模块所匹配到的与该第一字段相对应的所述目标数据发送给Web服务器;
所述接收单元,用于接收来自所述Web服务器的表单刷新数据,其中,所述表单刷新数据记录有所述Web服务器确定出的所述目标数据在目标表单中的填充区域;
所述显示单元,用于根据所述接收单元收到的所述表单刷新数据显示所述目标数据的所述目标表单。
第三方面,本发明实施例还提供了表单数据采集系统,包括:Web服务器和上述第二方面或第二方面的任一可能的实现方式所提供的表单数据采集装置;
所述Web服务器,用于确定由所述表单数据采集装置发送的所述目标数据在所述目标表单中的填充区域,并对表单数据进行刷新。
本发明实施例提供的表单数据采集方法、装置和系统,首先获取至少一个目标输入文件,分别从每个目标输入文件中采集所需要的目标数据,并生成包括有所采集到的目标数据的待处理数据集,针对目标表单所包括的每一个字段,均执行:根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据,将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域。由此可见,首先获取目标输入文件并采集所需要的目标数据,生成包括有该目标数据的待处理数据集,针对目标表单中的每一个字段,都要根据目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该字段相对应的目标数据,最后将该对应的目标数据填充到目标表单中对应的字段下的区域,进而实现对目标数据的导入,省去了用户手动填写数据的过程,同时避免了手动操作失误的问题,提高了数据采集的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种表单数据采集方法的流程图;
图2是本发明一个实施例提供的一种表单数据采集装置所在设备的示意图;
图3是本发明一个实施例提供的一种表单数据采集装置的示意图;
图4是本发明一个实施例提供的另一种表单数据采集装置的示意图;
图5是本发明一个实施例提供的又一种表单数据采集装置的示意图;
图6是本发明一个实施例提供的再一种表单数据采集装置的示意图;
图7是本发明一个实施例提供的一种表单数据采集系统的示意图;
图8是本发明一个实施例提供的另一种表单数据采集方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明一个实施例提供了一种冰箱断电反馈方法,该方法可以包括如下步骤:
步骤101:获取至少一个目标输入文件;
步骤102:分别从每个目标输入文件中采集所需要的目标数据,并生成包括有所采集到的目标数据的待处理数据集;
步骤103:针对目标表单所包括的每一个字段,均执行:根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据;
步骤104:将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域。
本发明实施例提供的表单数据采集方法,首先获取至少一个目标输入文件,再分别从每个目标输入文件中采集所需要的目标数据,并生成包括有所采集到的目标数据的待处理数据集,针对目标表单所包括的每一个字段,均执行:根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据,将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域。由此可见,首先获取目标输入文件并采集所需要的目标数据,生成包括有该目标数据的待处理数据集,针对目标表单中的每一个字段,都要根据目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该字段相对应的目标数据,最后将该对应的目标数据填充到目标表单中对应的字段下的区域,进而实现对目标数据的导入,省去了用户手动填写数据的过程,同时避免了手动操作失误的问题,提高了数据采集的效率。
在本发明的实施例中,在获取至少一个目标文件后,分别从每个目标输入文件中采集所需要的目标数据,这是对目标文件中所有数据的一个预先处理,通过初步筛选确定所需要采集的有效目标数据,降低了后期操作的复杂性,并生成包括有所采集到的目标数据的待处理数据集,更有利于后续直接针对由目标数据组成的该待处理数据集进行操作,进一步提高数据采集的效率。
在本发明的实施例中,针对每一个目标输入文件中需要采集的目标数据,都对应一个具有与之相匹配的目标表单,该目标表单具有与目标数据相对应的数据匹配规则,因此通过该数据匹配规则,可以迅速匹配与目标表单中的每一个字段相对应的目标数据,从而实现对目标数据的高效筛选与采集,提高数据采集的效率。
在本发明的实施例中,通过将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域,实现数据的导入,进一步将目标数据呈现在对应的表单中,能够使用户更直观地查看采集到的目标数据,同时省去用户手动输入数据的过程,既节省了时间又提高了数据采集的效率。
可选地,在图1所示表单数据采集方法中,步骤103在根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据之前,确定待处理数据集中目标数据所属的至少一个第二字段,再针对所确定出的每个第二字段,根据来自用户的字段匹配指令,将该第二字段与目标表单中的至少一个第一字段相匹配,并生成记录有各个第二字段与各个第一字段之间匹配关系的数据匹配规则。具体方式如下:
首先确定待处理数据集中目标数据中每一项数据所属的第二字段,其中每一项数据仅属于一个第二字段,再根据用户的字段匹配指令,将每一个第二字段与目标表单中的一个或多个第一字段相匹配,在所有的第二字段与第一字段匹配后,生成记录有每个第二字段与每个第一字段之间匹配关系的数据匹配规则。
可选地,在图1所示表单数据采集方法中,步骤103根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据,首先根据数据匹配规则确定与该第一字段匹配的第二字段,根据与该第一字段相匹配的第二字段,从待处理数据集中获取属于该第二字段的数据,将获取到的数据确定为与该第一字段相对应的目标数据。具体方式如下:
通过数据匹配规则确定与目标表单的第一字段相匹配的待处理数据集的第二字段,从而将从待处理数据集获取的属于该第二字段的数据确定为与表单第一字段对应的目标数据。
可选地,在图1所示表单数据采集方法中,步骤102生成包括有所采集到的目标数据的待处理数据集后,将待处理数据集中目标数据的数据格式转化为符合目标表单的数据格式。具体方式如下:
待处理数据集中的目标数据包括文字和数字,即其字段类型为字符型和数值型,则根据目标表单设计的字段约束、样式,需要对目标数据的数据格式进行转化,以使目标数据满足目标表单的字段约束、样式,避免因数据格式不同而漏掉目标数据的情况,从而提高数据采集的全面性和准确性。
可选地,在图1所示表单数据采集方法中,步骤104将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域,首先将所匹配到的与该第一字段相对应的目标数据发送给Web服务器,以使Web服务器确定出目标数据在目标表单中的填充区域,接收来自Web服务器的表单刷新数据,其中,表单刷新数据记录有Web服务器确定出的目标数据在目标表单中的填充区域,根据表单刷新数据,显示填充有目标数据的目标表单。具体方式如下:
首先将匹配到的与该目标表单的第一字段相对应的目标数据发送给Web服务器,以使Web服务器确定该目标数据在目标表单中的填充区域,随后Web服务器将目标数据填充在该第一字段下的对应填充区域,并采用不重载页面的方式刷新目标表单,因此用户能够直观看到显示填充有目标数据的目标表单。
如图2、图3所示,本发明实施例提供了表单数据采集装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的表单数据采集装置所在设备的一种硬件结构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的表单数据采集装置,包括:获取模块301、采集模块302、第一匹配模块303和填充模块304;
获取模块301,用于获取至少一个目标输入文件;
采集模块302,用于分别从获取模块301获取的每一个目标输入文件中采集所需的目标数据,并生成包括有所采集到的目标数据的待处理数据集;
第一匹配模块303,用于针对目标表单所包括的每一个第一字段,根据针对目标表单预先创建的数据匹配规则,从采集模块302生成的待处理数据集中匹配与该第一字段相对应的目标数据;
填充模块304,用于将第一匹配模块303所匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域。
可选地,在图3所示表单数据采集装置的基础上,如图4所示,该表单数据采集装置可以进一步包括:确定模块305、第二匹配模块306和生成模块307;
确定模块305,用于确定采集模块302生成的待处理数据集中目标数据所属的至少一个第二字段,其中,目标数据所包括的每一项数据仅属于一个第二字段;
第二匹配模块306,用于针对确定模块305所确定出的每一个第二字段,根据来自用户的字段匹配指令,将该第二字段与目标表单中的至少一个第一字段相匹配;
生成模块307,用于生成记录有由第二匹配模块306确定的各个第二字段与各个第一字段之间匹配关系的数据匹配规则。
可选地,在图4所示表单数据采集装置的基础上,如图5所示,第一匹配模块303包括:第一确定单元3031、获取单元3032和第二确定单元3033;
第一确定单元3031,用于根据生成模块307生成的数据匹配规则确定与该第一字段相匹配的第二字段;
获取单元3032,用于根据第一确定单元3031确定的与该第一字段相匹配的第二字段,从待处理数据集中获取属于该第二字段的数据;
第二确定单元3033,用于将由获取单元3032获取到的数据确定为与该第一字段相对应的目标数据。
可选地,在图4所示表单数据采集装置的基础上,如图6所示,填充模块304包括:发送单元3041、接收单元3042和显示单元3043;
发送单元3041,用于将第一匹配模块303所匹配到的与该第一字段相对应的目标数据发送给Web服务器;
接收单元3042,用于接收来自Web服务器的表单刷新数据,其中,表单刷新数据记录有Web服务器确定出的目标数据在目标表单中的填充区域;
显示单元3043,用于根据接收单元3042收到的表单刷新数据显示目标数据的目标表单。
可以理解的是,本发明实施例示意的结构并不构成对表单数据采集装置的具体限定。在本发明的另一些实施例中,表单数据采集装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
如图7所示,本发明一个实施例提供了表单数据采集系统,包括:Web服务器701和上述任一实施例提供的表单数据采集装置702;
Web服务器701,用于确定由表单数据采集装置702发送的目标数据在目标表单中的填充区域,并对表单数据进行刷新。
本发明实施例提供的表单数据采集系统,该表单数据采集系统包括Web服务器以及表单数据采集装置,首先表单数据采集装置获取目标输入文件并采集所需要的目标数据,生成包括有该目标数据的待处理数据集,针对目标表单中的每一个第一字段,都要根据目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据,然后通过Web服务器确定目标数据在目标表单中对应第一字段下的填充区域并对表单进行数据刷新,以使表单数据采集装置显示刷新后包括目标数据的目标表单,实现对目标数据的采集。由此可见,该数据采集过程由表单数据采集系统所包括的各个模块自动完成,用户无需手动输入数据,降低了操作时间,从而提高了数据采集的效率。
下面结合图7所示的表单数据采集系统,对本发明实施例提供的表单数据采集方法作进一步详细说明,如图8所示,该方法包括如下步骤:
步骤801:表单数据采集装置获取至少一个目标输入文件。
在本发明实施例中,表单数据采集装置可以根据用户需要获取一个或多个目标输入文件。
步骤802:表单数据采集装置分别从每个目标输入文件中采集所需要的目标数据,并生成包括有所采集到的目标数据的待处理数据集。
在本发明实施例中,表单数据采集装置在获取至少一个目标文件后,根据用户需要通过初步筛选分别从每个目标输入文件中采集所需要的目标数据,根据采集到的所需目标数据生成待处理数据集后,将待处理数据集中目标数据的数据格式转化为符合目标表单的数据格式。
例如,表单数据采集装置获取了一个输入文件,该输入文件中包括会员账号、会员昵称、商品名称、订货数量、发货日期、发货地址和联系电话等七项数据,根据用户需要初步筛选出目标数据项为会员账号、商品名称、订货数量、发货日期、发货地址和联系电话共六项数据,并根据这六项数据生成一个待处理数据集。如果目标表单设计的会员账号字段长度为10,字体样式分别为中文字体为宋体、西文字体为Times New Roman,字号为小四,则需要根据这一数据格式预先转化目标数据中该会员账号字段的数据格式,相应的该六项数据格式都需要转化成符合目标表单的数据格式。
步骤803:表单数据采集装置根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据。
在本发明实施例中,表单数据采集装置首先确定待处理数据集中目标数据中每一项数据所属的第二字段,其中每一项数据仅属于一个第二字段,再根据用户的字段匹配指令,将每一个第二字段与目标表单中的一个或多个第一字段相匹配,在所有的第二字段与第一字段匹配后,生成记录有每个第二字段与每个第一字段之间匹配关系的数据匹配规则。根据该数据匹配规则,确定与目标表单的第一字段相匹配的待处理数据集的第二字段,从而将从待处理数据集获取的属于该第二字段的数据确定为与表单第一字段对应的目标数据。
例如,目标数据中包括会员账号、商品名称、订货数量、发货日期、发货地址和联系电话共六项数据,则确定其所属第二字段分别为会员账号、商品名称、订货数量、发货日期、发货地址和联系电话,根据用户的字段匹配指令,目标表单中同样包括会员账号、商品名称、订货数量、发货日期、发货地址和联系电话共六个第一字段,因此将第二字段与第一字段对应匹配,可以生成关联目标数据与目标表单的数据匹配规则。
例如,通过数据匹配规则可以确定目标表单的会员账号字段与待处理数据集的会员账号字段相对应,则将待处理数据集中会员账号字段对应的所有数据确定为目标表单的会员账号字段下的数据,从而将待处理数据集中的目标数据对应导入到目标表单中,实现对目标数据的采集。
步骤804:表单数据采集装置将匹配到的与该第一字段相对应的目标数据通过Web服务器填充到目标表单中该第一字段下的数据填充区域。
在本发明实施例中,表单数据采集装置将匹配到的与该目标表单的第一字段相对应的目标数据发送给Web服务器,以使Web服务器确定该目标数据在目标表单中的填充区域,随后Web服务器将目标数据填充在该第一字段下的对应填充区域,并采用不重载页面的方式刷新目标表单,因此用户能够直观看到显示填充有目标数据的目标表单,若无法得到刷新后显示有目标数据的目标表单,则重复进行步骤804。
例如,表单数据采集装置将匹配到的与目标表单的会员账号字段相对应的所有会员账号数据发送给Web服务器,通过Web服务器确定所有会员账号数据在目标表单中的填充区域并进行数据填充,同时在该页面下刷新目标表单,最终使用户能够在表单中直接看到会员账号字段下填充的所有会员账号数据。
本发明实施例还提供了一种存储控制器,包括:处理器、存储器和总线;
所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行上述各个实施例提供的冰箱断电反馈方法。
本发明还提供了一种计算机可读介质,存储用于使一机器执行如本文所述的表单数据采集方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
综上所述,本发明各个所述所提供的表单数据采集方法、装置和系统,至少具有如下有益效果:
1、在本发明实施例中,首先获取至少一个目标输入文件,再分别从每个目标输入文件中采集所需要的目标数据,并生成包括有所采集到的目标数据的待处理数据集,针对目标表单所包括的每一个字段,均执行:根据针对目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该第一字段相对应的目标数据,将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域。由此可见,首先获取目标输入文件并采集所需要的目标数据,生成包括有该目标数据的待处理数据集,针对目标表单中的每一个字段,都要根据目标表单预先创建的数据匹配规则,从待处理数据集中匹配与该字段相对应的目标数据,最后将该对应的目标数据填充到目标表单中对应的字段下的区域,进而实现对目标数据的导入,省去了用户手动填写数据的过程,同时避免了手动操作失误的问题,提高了数据采集的效率。
2、在本发明的实施例中,在获取至少一个目标文件后,分别从每个目标输入文件中采集所需要的目标数据,这是对目标文件中所有数据的一个预先处理,通过初步筛选确定所需要采集的有效目标数据,降低了后期操作的复杂性,并生成包括有所采集到的目标数据的待处理数据集,更有利于后续直接针对由目标数据组成的该待处理数据集进行操作,进一步提高数据采集的效率。
3、在本发明的实施例中,针对每一个目标输入文件中需要采集的目标数据,都对应一个具有与之相匹配的目标表单,该目标表单具有与目标数据相对应的数据匹配规则,因此通过该数据匹配规则,可以迅速匹配与目标表单中的每一个字段相对应的目标数据,从而实现对目标数据的高效筛选与采集,提高数据采集的效率。
4、在本发明的实施例中,通过将匹配到的与该第一字段相对应的目标数据填充到目标表单中该第一字段下的数据填充区域,实现数据的导入,进一步将目标数据呈现在对应的表单中,能够使用户更直观地查看采集到的目标数据,同时省去用户手动输入数据的过程,既节省了时间又提高了数据采集的效率。
5、在本发明的实施例中,在生成包括有所采集到的目标数据的待处理数据集后,将待处理数据集中目标数据的数据格式转化为符合目标表单的数据格式,以使目标数据满足目标表单的字段约束、样式,避免因数据格式不同而漏掉目标数据的情况,从而提高数据采集的全面性和准确性。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (3)

1.表单数据采集方法,其特征在于,包括:
获取至少一个目标输入文件;
分别从每个所述目标输入文件中采集所需要的目标数据,并生成包括有所采集到的所述目标数据的待处理数据集;
针对目标表单所包括的每一个字段,均执行:
根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据;
将匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域;
在所述根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据之前,进一步包括:
确定所述待处理数据集中所述目标数据所属的至少一个第二字段,其中,所述目标数据所包括的每一项数据仅属于一个所述第二字段;
针对所确定出的每个所述第二字段,根据来自用户的字段匹配指令,将该第二字段与所述目标表单中的至少一个所述第一字段相匹配;
生成记录有各个所述第二字段与各个所述第一字段之间匹配关系的所述数据匹配规则;
所述根据针对所述目标表单预先创建的数据匹配规则,从所述待处理数据集中匹配与该第一字段相对应的所述目标数据,包括:
根据所述数据匹配规则确定与该第一字段匹配的第二字段;
根据与该第一字段相匹配的所述第二字段,从所述待处理数据集中获取属于该第二字段的数据;
将获取到的数据确定为与该第一字段相对应的所述目标数据;
所述生成包括有所采集到的所述目标数据的待处理数据集后,包括:
将所述待处理数据集中所述目标数据的数据格式转化为符合所述目标表单的数据格式;
所述将匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域,包括:
将所匹配到的与该第一字段相对应的所述目标数据发送给Web服务器,以使所述Web服务器确定出所述目标数据在目标表单中的填充区域;
接收来自所述Web服务器的表单刷新数据,其中,所述表单刷新数据记录有所述Web服务器确定出的所述目标数据在目标表单中的填充区域;
根据所述表单刷新数据,显示填充有所述目标数据的所述目标表单。
2.表单数据采集装置,其特征在于,包括:获取模块、采集模块、第一匹配模块和填充模块;
所述获取模块,用于获取至少一个目标输入文件;
所述采集模块,用于分别从所述获取模块获取的每一个所述目标输入文件中采集所需的目标数据,并生成包括有所采集到的所述目标数据的待处理数据集;
所述第一匹配模块,用于针对目标表单所包括的每一个第一字段,根据针对所述目标表单预先创建的数据匹配规则,从所述采集模块生成的所述待处理数据集中匹配与该第一字段相对应的所述目标数据;
所述填充模块,用于将所述第一匹配模块所匹配到的与该第一字段相对应的所述目标数据填充到所述目标表单中该第一字段下的数据填充区域;
进一步包括:确定模块、第二匹配模块和生成模块;
所述确定模块,用于确定所述采集模块生成的所述待处理数据集中所述目标数据所属的至少一个第二字段,其中,所述目标数据所包括的每一项数据仅属于一个所述第二字段;
所述第二匹配模块,用于针对所述确定模块所确定出的每一个所述第二字段,根据来自用户的字段匹配指令,将该第二字段与所述目标表单中的至少一个所述第一字段相匹配;
所述生成模块,用于生成记录有由所述第二匹配模块确定的各个所述第二字段与各个所述第一字段之间匹配关系的所述数据匹配规则;
所述第一匹配模块包括:第一确定单元、获取单元和第二确定单元;
所述第一确定单元,用于根据所述生成模块生成的所述数据匹配规则确定与该第一字段相匹配的所述第二字段;
所述获取单元,用于根据所述第一确定单元确定的与该第一字段相匹配的所述第二字段,从所述待处理数据集中获取属于该第二字段的数据;
所述第二确定单元,用于将由获取单元获取到的数据确定为与该第一字段相对应的所述目标数据;
所述填充模块包括:发送单元、接收单元和显示单元;
所述发送单元,用于将所述第一匹配模块所匹配到的与该第一字段相对应的所述目标数据发送给Web服务器;
所述接收单元,用于接收来自所述Web服务器的表单刷新数据,其中,所述表单刷新数据记录有所述Web服务器确定出的所述目标数据在目标表单中的填充区域;
所述显示单元,用于根据所述接收单元收到的所述表单刷新数据显示所述目标数据的所述目标表单。
3.表单数据采集系统,其特征在于,包括:Web服务器和权利要求2所述的表单数据采集装置;
所述Web服务器,用于确定由所述表单数据采集装置发送的所述目标数据在所述目标表单中的填充区域,并对表单数据进行刷新。
CN202010594619.5A 2020-06-28 2020-06-28 表单数据采集方法、装置和系统 Active CN111767703B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010594619.5A CN111767703B (zh) 2020-06-28 2020-06-28 表单数据采集方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010594619.5A CN111767703B (zh) 2020-06-28 2020-06-28 表单数据采集方法、装置和系统

Publications (2)

Publication Number Publication Date
CN111767703A CN111767703A (zh) 2020-10-13
CN111767703B true CN111767703B (zh) 2024-04-30

Family

ID=72721877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010594619.5A Active CN111767703B (zh) 2020-06-28 2020-06-28 表单数据采集方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111767703B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128187B (zh) * 2021-04-19 2023-05-05 宜员(上海)信息科技有限公司 一种表单生成方法、装置及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019486A (zh) * 2018-07-19 2019-07-16 平安科技(深圳)有限公司 数据采集方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9842097B2 (en) * 2007-01-30 2017-12-12 Oracle International Corporation Browser extension for web form fill

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019486A (zh) * 2018-07-19 2019-07-16 平安科技(深圳)有限公司 数据采集方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大数据时代下的动态可配置数据采集系统的研究与设计;丁俊;郑辉;;计算机应用与软件(03);全文 *

Also Published As

Publication number Publication date
CN111767703A (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
US9047346B2 (en) Reporting language filtering and mapping to dimensional concepts
CN107729475B (zh) 网页元素采集方法、装置、终端与计算机可读存储介质
CN108717437B (zh) 搜索结果展示方法、装置及存储介质
US20180232204A1 (en) Intelligent data extraction
US8117531B1 (en) Interpreted language translation system and method
CN107220274B (zh) 一种可视化数据接口集市实现方法
CN103823811A (zh) 用于处理日志的方法及其系统
CN103605502A (zh) 表单页面显示方法及服务器
CN112016290A (zh) 一种文档自动排版方法、装置、设备及存储介质
CN111913922B (zh) 二进制结构化日志的生成方法、装置、设备及存储介质
CN111767703B (zh) 表单数据采集方法、装置和系统
CN103885878A (zh) 一种生成浏览器测试脚本的方法及装置
CN113687825A (zh) 一种软件模块的构建方法、装置、设备及存储介质
CN113760894A (zh) 数据调取方法、装置、电子设备及存储介质
CN113792138B (zh) 报表生成方法、装置、电子设备及存储介质
CN114186958A (zh) 将列表数据导出为电子表格的方法、计算设备及存储介质
CN112181370B (zh) 数据交互关系的生成方法、计算机设备和存储介质
CN114741077A (zh) 基于字段粒度的页面效果预览方法、装置、设备及介质
CN113420042A (zh) 基于演示文稿的数据统计方法、装置、设备及存储介质
CN113032515A (zh) 基于多数据源生成图表的方法、系统、设备及存储介质
CN112559914A (zh) 指标数据显示方法及装置
CN111651696A (zh) 产品标签的定制方法及装置、计算机存储介质、电子设备
CN112347066A (zh) 日志处理方法、装置及服务器和计算机可读存储介质
CN111652747B (zh) 电子保单处理方法、装置、设备及计算机可读存储介质
CN112036130B (zh) Excel数据的导出方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240401

Address after: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong

Applicant after: Inspur Genersoft Co.,Ltd.

Country or region after: China

Address before: 250100 No. 2877 Kehang Road, Sun Village Town, Jinan High-tech District, Shandong Province

Applicant before: SHANDONG INSPUR GENESOFT INFORMATION TECHNOLOGY Co.,Ltd.

Country or region before: China

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant