CN102819532A - 一种网页表单数据获取及转存方法 - Google Patents

一种网页表单数据获取及转存方法 Download PDF

Info

Publication number
CN102819532A
CN102819532A CN 201110161626 CN201110161626A CN102819532A CN 102819532 A CN102819532 A CN 102819532A CN 201110161626 CN201110161626 CN 201110161626 CN 201110161626 A CN201110161626 A CN 201110161626A CN 102819532 A CN102819532 A CN 102819532A
Authority
CN
China
Prior art keywords
data
web
list
client
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110161626
Other languages
English (en)
Inventor
解玉麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 201110161626 priority Critical patent/CN102819532A/zh
Publication of CN102819532A publication Critical patent/CN102819532A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种网页表单数据获取及转存方法,它涉及网络技术领域和信息处理技术。它包含客户端计算机(2)、软件客户端(3)、互联网(4)、内嵌浏览器(5)、内容保存及编程接口模块(6)、网页表单解析模块(7)和网站Web服务器(8),软件客户端(3)分别与客户端计算机(2)、内嵌浏览器(5)、内容保存及编程接口模块(6)和网页表单解析模块(7)相连,客户端计算机(2)分别与互联网(4)和本地计算机文件(9)相连,互联网(4)与网站Web服务器(8)相连。它能实现普通使用者在不需要改变其实用习惯的前提下,在网页上一次输入数据,就可以既保存了数据到网站服务器上,同时又在本地保存了一份同样数据。

Description

一种网页表单数据获取及转存方法
技术领域:
本发明涉及网络技术领域和信息处理技术,尤其涉及一种网页表单数据获取及转存方法。
背景技术:
随着互联网的普及和发展,网络信息技术的不断进步,越来越多跨大范围地域的信息系统在数据录入、上报时,采用登录架设在互联网上的Web服务器中相对应网页,然后录入数据,进行网页提交。
例如药监局要求各药店经营户,登录药监局的网站,对各药店购入药品的相应信息进行录入登记,还有其他一些药监局需要通过网页进行登记提交的信息等。这些信息除了报给药监局之外,对于药店经营户来说,也是非常有价值的信息,必须要记录到药店自己的本地计算机中进行保存、查阅以及信息的再加工和再利用。当前的情况是药店对这部分数据进行了重复录入,一次是通过互联网在药监局指定的web页面上录入,另一次是录入到药店自己的本地计算机中进行保存。
这种同一份数据,在web网页上录入一次,在本地计算机上又录入一次的情况,不仅浪费了时间和人力,而且在整个两次录入的过程中,由于都是人工录入,很难保证数据的一致性(有可能看错数据或录入时手误)。随着信息系统和互联网的普及,不仅药店有这种“重复劳动”的情况,越来越多的类似系统也会出现这种——同一份数据网页提交一次,本地计算机上还要再录入一次的情况。
目前用于浏览网页的浏览器或信息系统,还没有一种简单易行并且较容易实现的方法可以达到在网页上一次录入数据,即可完成数据“两个流向”的输出(或保存):一、提交到网站服务器保存;二、同样的数据保存一份到本地计算机。
发明内容:
本发明的目的是提供一种网页表单数据获取及转存方法,它能实现普通使用者在不需要改变其实用习惯的前提下,在网页上一次输入数据,就可以既保存了数据到网站服务器上,同时又在本地保存了一份同样数据。
为了解决背景技术所存在的问题,本发明是采用以下技术方案:它包含客户端计算机2、软件客户端3、互联网4、内嵌浏览器5、内容保存及编程接口模块6、网页表单解析模块7和网站Web服务器8,软件客户端3分别与客户端计算机2、内嵌浏览器5、内容保存及编程接口模块6和网页表单解析模块7相连,客户端计算机2分别与互联网4和本地计算机文件9相连,互联网4与网站Web服务器8相连。
它的数据获取及转存的步骤为:A、用户通过本发明中客户端内嵌浏览器输入待访问的网址,访问网站;B、在网站里找到要提交数据的页面,点击进入该页面填写待提交数据;C、数据在页面表单中录入完毕后,触发数据提交事件(表单数据提交保存到网络服务器上的情况);若数据在页面表单中录入的过程中(表单数据处于录入过程中,还未提交到网络服务器),可根据需要任意触发数据保存事件;D、把内嵌浏览器中的网页文本赋值给JDOC对象,解析出JDOC中包含几个网页表单,每个网页表单名称是什么,每个网页表单都加到JForms中;E、根据每个网页表单名称遍历JForms中的网页表单,找到具体对应的网页表单,将其保存到JForm;F、遍历JForm中的各表单元素,把各元素的数据按“表单名.表单元素类型.表单元素名=表单内容”的格式保存到JListText对象中;G、把JListText对象中的内容以文件形式保存到本地计算机的指定文件中。
本发明中的直接用户1通过网页页面录入数据到软件客户端3,并以特定数据格式存入本地计算机文件9中,同时还可通过软件客户端3以存储表单数据方式存入网站Web服务器8中,使得一次录入数据,即可完成数据“两个流向”的输出(或保存)。
本发明采用解析本发明客户端内嵌浏览器中浏览的网页文本的方式,提取网页表单中录入的内容,不涉及web服务器端相关部分,最大限度降低了与网站端的耦合度;使用本发明,对于直接使用的用户而言,不需要改变其已有的网站浏览及相关操作的习惯,直接用户培训零成本,过渡到使用本发明,几乎零风险;实现“一次输入”,获得“远程和本地两份数据”,明显节约人力成本,降低数据录入错误率;实现过程清晰明了、原理简单,方便他人在本发明的基础上进行“二次开发”。
附图说明:
图1为本发明的构成及数据流向示意图;
图2为本发明实施例的步骤图。
具体实施方式:
具体实施方式一:参照图1-2,本具体实施方式采用以下技术方案:它包含客户端计算机2、软件客户端3、互联网4、内嵌浏览器5、内容保存及编程接口模块6、网页表单解析模块7和网站Web服务器8,软件客户端3分别与客户端计算机2、内嵌浏览器5、内容保存及编程接口模块6和网页表单解析模块7相连,客户端计算机2分别与互联网4和本地计算机文件9相连,互联网4与网站Web服务器8相连。
它的数据获取及转存的步骤为:A、用户通过本发明中客户端内嵌浏览器输入待访问的网址,访问网站;B、在网站里找到要提交数据的页面,点击进入该页面填写待提交数据;C、数据在页面表单中录入完毕后,触发数据提交事件(表单数据提交保存到网络服务器上的情况);若数据在页面表单中录入的过程中(表单数据处于录入过程中,还未提交到网络服务器),可根据需要任意触发数据保存事件;D、把内嵌浏览器中的网页文本赋值给JDOC对象,解析出JDOC中包含几个网页表单,每个网页表单名称是什么,每个网页表单都加到JForms中;E、根据每个网页表单名称遍历JForms中的网页表单,找到具体对应的网页表单,将其保存到JForm;F、遍历JForm中的各表单元素,把各元素的数据按“表单名.表单元素类型.表单元素名=表单内容”的格式保存到JListText对象中;G、把JListText对象中的内容以文件形式保存到本地计算机的指定文件中。
本具体实施方式是以文件形式保存到本地计算机的,它采用解析本发明客户端内嵌浏览器中浏览的网页文本的方式,提取网页表单中录入的内容,不涉及web服务器端相关部分,最大限度降低了与网站端的耦合度;使用本发明,对于直接使用的用户而言,不需要改变其已有的网站浏览及相关操作的习惯,直接用户培训零成本,过渡到使用本发明,几乎零风险;实现“一次输入”,获得“远程和本地两份数据”,明显节约人力成本,降低数据录入错误率;实现过程清晰明了、原理简单,方便他人在本发明的基础上进行“二次开发”。
具体实施方式二:它的数据获取及转存的步骤为:A、“客户端单元模块”供二次开发使用,使用者把“客户端单元模块”加入到自己的软件工程中;B、操作“客户端单元模块”中内嵌浏览器,并输入待访问的网址,访问网站;C、在网站里找到要提交数据的页面,在该页面填写待提交数据;D、向“客户端单元模块”发送形如:getFormList(″网页表单名″)的消息请求,“客户端单元模块”返回一个StringList对象,StringList对象其中包含一组形如“表单名.表单元素类型.表单元素名=表单内容”格式的数据集合。
本具体实施方式以“编程接口”的形式提供用户在网页表单上录入的数据,就可以既保存了数据到网站服务器上,同时又在本地保存了一份同样数据。
实施例:本发明有两个核心要点,一个是针对待提交网页“表单数据获取”,另一个是对“获取的数据”进行转存,而对于“数据转存”的实现,本发明分为两个方面来实现。
现先描述“表单数据获取”的实现:
1、开发出软件客户端框架。
2、把操作系统浏览器的封装组件嵌入到软件客户端中。
3、开发各个相关表单对象类。
4、把各个开发完毕的表单对象类,组装形成“网页表单解析模块”。
5、按数据格式,分别开发解析数据的格式构造、预定义格式数据转存为文件的模块。
6、按编程接口约定,开发编程接口适配对象类,并开发相关辅助类,经过组装形成“编程接口模块”。
7、把步骤5、6两个阶段形成的模块,组合起来,形成统一的数据输出模块——即图1中描述的“内容保存及编程接口模块”。
通过以上大致7个阶段步骤,即完成了本发明,形成了图1中表达的“软件客户端”。为了能更清晰的阐述本发明在实际应用中的情况,参考图2的实际运作过程,现描述应用场景如下:
一家药品销售门店,称它药店A。药店A平时进药(进货)之后,需要向药
监局网站用自己的ID登录后,输入相关的药品进货信息,
用户输入完一条记录后,点击web页面上的“添加”按钮之后,相关数据就提交到了药监局的网站服务器。这些数据其实不光是药监局需要进行监控,药店A的经营者在通过GSP认证,以及日常对药店的经营过程中也需要用到;比如把这些数据录入到专门的“药店经营管理软件”中,进行药品的进销存管理,以及根据药品的出厂日期和药品有效期等,进行药品促销和药品下架管理等。
以往药店A需要对同一份数据进行多次重复劳动:一、在药监局网站网页上录入一次;二、在类似于“进、销、存”系统上再录入一次;三、可能在被要求过GSP认证时,再次录入。
如果药店A使用本具体实施方式,只需要在“内嵌浏览器”中做类似“药品录入网页”的类似录入时,用户可以在点击了“添加”按钮后,不但网页数据提交到了药监局网站服务器,同时还有一份数据以预先约定的格式,保存到了用户指定路径下的文件中。或者用户也可以在网页数据的录入过程中,自主选择保存网页表单数据的时机,以达到部分保存网页表单数据的目的。对于在本地计算机中保存成文件的数据,药店A的经营者可以随时导入或复制到其他有用的系统中进行保存分析、进行再次利用。
就这个应用场景来说,另一种更有价值的应用本发明的方法是:利用本发明提供的“编程接口”直接获取需要提交到药监局网站的网页表单数据,存储到数据库中留待进一步的数据挖掘及再利用;或是通过“编程接口”获取数据后,直接导入到类似“进、销、存”的系统中,以减少数据的重复录入;再或者药店A的经营者可以联系他们已使用的管理软件的开发者,直接在该“管理软件”中调用本发明提供的“编程接口”来获取网页表单数据,以减少重复录入和减少录入数据出错的概率。
本具体实施方式实现了数据在网页上的“一次提交”,分别在网站服务器和用户终端计算机上进行同一份数据的“两次保存”。这种“转存方案”,有效降低了录入数据的错误率,有效提高劳动生产力,大大节约了人力资源投入。

Claims (3)

1.一种网页表单数据获取及转存方法,其特征在于它包含客户端计算机(2)、软件客户端(3)、互联网(4)、内嵌浏览器(5)、内容保存及编程接口模块(6)、网页表单解析模块(7)和网站Web服务器(8),软件客户端(3)分别与客户端计算机(2)、内嵌浏览器(5)、内容保存及编程接口模块(6)和网页表单解析模块(7)相连,客户端计算机(2)分别与互联网(4)和本地计算机文件(9)相连,互联网(4)与网站Web服务器(8)相连。
2.根据权利要求1所述的一种网页表单数据获取及转存方法,其特征在于它的数据获取及转存的步骤为:A、用户通过客户端内嵌浏览器输入待访问的网址,访问网站;B、在网站里找到要提交数据的页面,点击进入该页面填写待提交数据;C、数据在页面表单中录入完毕后,触发数据提交事件;若数据在页面表单中录入的过程中,可根据需要任意触发数据保存事件;D、把内嵌浏览器中的网页文本赋值给JDOC对象,解析出JDOC中包含几个网页表单,每个网页表单名称是什么,每个网页表单都加到JForms中;E、根据每个网页表单名称遍历JForms中的网页表单,找到具体对应的网页表单,将其保存到JForm;F、遍历JForm中的各表单元素,把各元素的数据按“表单名.表单元素类型.表单元素名=表单内容”的格式以文件形式保存到JListText对象中;G、把JListText对象中的内容以文件形式保存到本地计算机的指定文件中。
3.根据权利要求1所述的一种网页表单数据获取及转存方法,其特征在于它的数据获取及转存的步骤为:A、“客户端单元模块”供二次开发使用,使用者把“客户端单元模块”加入到自己的软件工程中;B、操作“客户端单元模块”中内嵌浏览器,并输入待访问的网址,访问网站;C、在网站里找到要提交数据的页面,在该页面填写待提交数据;D、向“客户端单元模块”发送形如:getFormList的消息请求,“客户端单元模块”返回一个StringList对象,StringList对象其中包含形如“表单名.表单元素类型.表单元素名=表单内容”格式的数据集合。
CN 201110161626 2011-06-07 2011-06-07 一种网页表单数据获取及转存方法 Pending CN102819532A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110161626 CN102819532A (zh) 2011-06-07 2011-06-07 一种网页表单数据获取及转存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110161626 CN102819532A (zh) 2011-06-07 2011-06-07 一种网页表单数据获取及转存方法

Publications (1)

Publication Number Publication Date
CN102819532A true CN102819532A (zh) 2012-12-12

Family

ID=47303646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110161626 Pending CN102819532A (zh) 2011-06-07 2011-06-07 一种网页表单数据获取及转存方法

Country Status (1)

Country Link
CN (1) CN102819532A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914284A (zh) * 2012-12-31 2014-07-09 北京神州泰岳软件股份有限公司 移动嵌入式平台中内嵌浏览器网页实现方法和装置
CN104008137A (zh) * 2014-05-08 2014-08-27 苏州中格软件有限公司 一种针对业务流程的跨系统数据耦合系统
CN104091124A (zh) * 2014-07-03 2014-10-08 利诚服装集团股份有限公司 一种数据安全处理方法
CN104123331A (zh) * 2013-09-26 2014-10-29 腾讯科技(深圳)有限公司 客户端应用的数据查询方法、装置及系统
CN106570054A (zh) * 2016-09-23 2017-04-19 浪潮电子信息产业股份有限公司 一种Web表单数据持久化的方法
CN110210455A (zh) * 2019-06-18 2019-09-06 石家庄捷弘科技有限公司 一种打印内容格式化提取方法
CN110795651A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 用于保存前端数据的方法、装置及电子设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914284A (zh) * 2012-12-31 2014-07-09 北京神州泰岳软件股份有限公司 移动嵌入式平台中内嵌浏览器网页实现方法和装置
CN103914284B (zh) * 2012-12-31 2017-12-12 北京神州泰岳软件股份有限公司 移动嵌入式平台中内嵌浏览器网页实现方法和装置
CN104123331A (zh) * 2013-09-26 2014-10-29 腾讯科技(深圳)有限公司 客户端应用的数据查询方法、装置及系统
CN104008137A (zh) * 2014-05-08 2014-08-27 苏州中格软件有限公司 一种针对业务流程的跨系统数据耦合系统
CN104008137B (zh) * 2014-05-08 2018-05-25 苏州中格软件有限公司 一种针对业务流程的跨系统数据耦合系统
CN104091124A (zh) * 2014-07-03 2014-10-08 利诚服装集团股份有限公司 一种数据安全处理方法
CN106570054A (zh) * 2016-09-23 2017-04-19 浪潮电子信息产业股份有限公司 一种Web表单数据持久化的方法
CN110210455A (zh) * 2019-06-18 2019-09-06 石家庄捷弘科技有限公司 一种打印内容格式化提取方法
CN110210455B (zh) * 2019-06-18 2022-03-01 石家庄捷弘科技有限公司 一种打印内容格式化提取方法
CN110795651A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 用于保存前端数据的方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US20200342511A1 (en) Bundling of automated work flow
CN102819532A (zh) 一种网页表单数据获取及转存方法
CN101217507B (zh) 提供及替换网页中数据的系统、方法及装置
US9589281B2 (en) Obtaining data from incomplete electronic forms
Jovanovik et al. Consolidating drug data on a global scale using linked data
CN103294781A (zh) 一种用于处理页面数据的方法与设备
CN106489165A (zh) 将来自应用的转化与所选内容项目匹配
CN104102577A (zh) 多版本网页访问测试方法
CN106570750A (zh) 基于浏览器插件的自动报税方法、系统及浏览器插件
US9846605B2 (en) Server-side minimal download and error failover
Garnett et al. Open metadata for research data discovery in Canada
CN104270443B (zh) 一种能够动态解析Web应用的云计算系统及方法
CN109063059B (zh) 行为日志处理方法、装置及电子设备
CN103347069A (zh) 网络访问的实现方法及装置
CN102571934A (zh) 一种web页面数据绑定的方法
KR20180047467A (ko) 사용자 프로필 제공 시스템 및 방법
CN103092574B (zh) 一种基于递归自主式复杂任务分解系统及方法
Swapna et al. Achieving higher ranking to webpages through search engine optimization
RU2597476C2 (ru) Система и способ выполнения поиска
Wheeler et al. Functional requirements specification for archival asset management: Identification and integration of essential properties of services-oriented architecture products
van Ballegooie Knowledgebases: The cornerstone of E-resource management and access
CN108388614A (zh) 新闻数据爬取处理方法、装置、计算机设备和存储介质
Ohuru A Method for Enhancing Shareability and Reproducibility of Geoprocessing Workflows
Doyle et al. Internet of Water: Research and Development Toward a Linked Data System and Foundational Knowledge Network for the Internet of Water
HAO Cloud based platform for food redistribution tracking and nutritional analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121212

WD01 Invention patent application deemed withdrawn after publication