发明内容
本发明所要解决的技术问题在于提供一种基于智能文档平台的多渠道信息采集交换方法。利用该方法可以在统一的平台下,以标准的信息存储格式实现多渠道信息采集,进而实现信息交换。
为了实现上述的发明目的,本发明采用下述的技术方案:
一种基于智能文档平台的多渠道信息采集交换方法,所述智能文档平台包括服务器和数据库,在所述服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备上安装有应用程序,其特征在于:
所述应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,所述接口为与终端设备无关的API函数的接口。
其中,所述智能文档平台采用XML作为数据存储格式。
终端设备将采集到的数据以XML格式传送到所述智能文档平台处理,所述智能文档平台上存储的信息以XML格式传送到终端设备上,并以表单方式在终端设备上显示。
所述智能文档包括模板和数据两部分,其中模板部分用来描述采集数据的界面,数据部分用来存储终端设备所采集的数据。
所述服务器中包括数据管理单元、数据校验单元和数据交换单元,其中数据校验单元作为多种信息采集渠道的公共数据接口,所述数据管理单元和所述数据交换单元分别与所述数据校验单元进行连接。
当需要添加扩展操作功能时,在所述应用服务和所述应用程序的接口指令集中增加相应的API函数,将所述API函数提供给终端设备进行调用。
用户调用智能文档平台的renderForm函数输入参数,智能文档平台通过网络获取参数后,将智能文档以表单的形式在网络浏览器中展现出来;用户填写完成后,在提交时调用processForm函数,将数据传送给智能文档平台。
所述renderForm函数和所述processForm函数中的各参数均为具体业务应用的链接地址,与具体设备无关。
本发明所提供的多渠道信息采集交换方法根据不同的终端设备和采集环境,为不同的采集渠道建立起公共的数据处理中心,从而提高了信息处理和转换的能力。本方法可以广泛地应用于各种信息采集系统。在采集方式日益繁多,数据量日益庞大,信息交换日益迫切的情况下,使用本方法进行信息采集,可以大大缩短信息采集和交换的时间,加速信息流转,减少信息采集处理的周期。
具体实施方式
本发明所提供的信息采集交换方法主要包括两方面的技术内容:智能文档平台和多渠道采集方式。下面分别进行详细的说明。
智能文档平台是一个信息处理中心。通过多种信息采集渠道(即终端设备或采集方式)获得的信息在智能文档平台下进行统一处理,而用以采集和展现信息的智能文档也通过该智能文档平台分发到不同的终端设备中。
该智能文档平台包括相互连接的服务器和数据库。其中,服务器用于启动应用服务,数据库用于存储智能文档和数据。各种应用服务部署在服务器上,根据其部署在服务器上的位置,决定服务器接口参数链接。智能文档平台可通过各种采集渠道从服务器的应用服务中获取智能文档,同时可以通过各种渠道传送参数给应用服务的提交指令,上传数据到服务器。
同时,该智能文档平台还提供了安装在各种终端设备上的应用程序(客户端软件),并提供相应的接口。依据信息采集环境的不同,各种终端设备只要安装了应用程序,就能够调用相应的接口与智能文档平台建立通信,将采集到的数据以XML格式传送到智能文档平台处理。智能文档平台上存储的信息也能够以XML格式调用相应接口连接,传送到终端设备,并以表单方式在终端设备上显示,同时能够显示智能文档中存储的数据信息,借此实现信息在不同终端设备之间的流转。
如图1所示,智能文档平台的服务器部分包括数据管理、数据校验和数据交换三个功能单元,其中数据校验单元作为多种信息采集渠道的公共数据接口,与各种终端设备建立连接。数据管理单元与数据校验单元进行连接,用于实现智能文档平台内部的数据管理。数据交换单元也与数据校验单元进行连接,用于指导智能文档平台与外部之间的数据交换。智能文档平台内的数据是以XML格式进行存储的,这些XML格式的智能文档以智能文档的形式展现。智能文档平台通过与各种终端设备建立连接,从终端设备处获取到提交的信息,即终端设备依靠智能文档平台提供的应用软件,根据智能文档提供的信息,展现智能文档。用户通过智能文档界面填写信息,填写完毕后点击提交,将智能文档连同数据发送到采集智能文档平台。同时,用户可通过设置查询条件,从智能文档平台查找对应的数据记录,智能文档平台将该记录返回给用户终端,依然以XML格式,通过智能文档界面展现,供用户查看、修改。
本发明中的智能文档包括模板和数据两部分。其中模板部分用来描述用于采集数据的界面,一般都是与纸质智能文档类似的表单格式。各终端设备能够根据模板部分的描述生成数据填写界面,展现给用户。数据部分用来存储终端设备所采集的数据。该数据存储在基于XML格式的智能文档中。智能文档平台对智能文档的解析、展现、存储等操作都通过相应的应用服务和客户端软件来完成的。
智能文档平台采用XML作为数据存储格式,通过智能文档展现数据采集界面、存储数据信息,能够与多种信息采集渠道建立通信连接,发送、获取信息;能够进行数据查询、校验、存储和入库等操作;同时能够进行加密和签名的安全性管理。由于XML是一种通用的标记语言,提供了识别、交换和处理各种数据的方法,产生的智能文档可用于各种应用程序,因此不仅为智能文档平台内信息的交换提供了便利,也为未来与其他应用软件系统的信息交换奠定了基础。数据部分可以在智能文档内部,同智能文档本身一起传输,也可以从智能文档中分离出来,形成独立的数据文件,用于信息存储、交换。
上述的数据查询、校验、存储和入库等操作是指对于已经传输到智能文档平台的数据,用户可通过设置查询条件进行检索。智能文档平台本身还提供了对数据的逻辑校验功能,能够检查收集到的数据是否符合填写要求。数据信息能够以数据文件的格式存储,同时能够调用接口,保存到数据库中。
上述加密和签名的安全性管理是指智能文档本身能够设置加密和数字签名的功能。在智能文档平台或其他终端、应用系统使用时,必须有相应的解密口令或证书,才能破解数据信息。如此便能够保证在安全级别要求高的应用场合中,所采集数据的安全性,可靠性和完整性。
如图2所示,智能文档平台和终端设备之间调用统一的接口进行通信。在具体实施过程中,各个终端设备通过统一的接口实现向智能文档的数据上传或者数据下载。智能文档平台对智能文档进行管理,并将暂时不使用的数据存储到数据库之中。
本发明的一个突出特点在于智能文档平台提供了统一的接口。这种接口中并不包含终端设备的参数信息,因此是与终端设备无关的,能够实现各种终端设备基于智能文档平台的数据采集。未来出现新的终端设备时,仍能够通过此接口加入到智能文档平台中,因此实现了很好的扩展性。
具体而言,考虑到智能文档平台能够处理智能文档是应用服务和客户端软件起到的作用。它们处理智能文档的方式,是提供API函数,不同的采集渠道调用应用服务或客户端软件的API函数,就能够实现对智能文档的处理。因此对于实现同样的功能,可以调用相同的API函数来实现对智能文档的操作,而与具体的信息采集方式无关。对智能文档能够执行的操作,由应用服务或客户端软件的接口指令集决定。当需要添加扩展操作功能时,只需要丰富应用服务和客户端软件的接口指令集,即增加API函数,将该API函数提供给终端设备进行调用即可完成对智能文档的处理,而各终端设备本身无需进行改动。
上述的接口指令集实际就是应用服务和客户端软件提供的API函数的集合,相应的接口就是API函数的接口。不同的采集渠道对智能文档进行相同操作时,其使用的接口是相同的,只是参数内容略有差异。下面的API函数以Java为例进行介绍,其他语言调用方式基本相同。
对于下载展现智能文档,其对应的API为renderForm:
Public java.io.Serializable renderForm(java.lang.String formurl,
java.lang.String dataurl,java.lang.String sTargetURL,
java.lang.String sServerURL)
参数说明:
参数 |
类型 |
默认值 |
说明 |
formurl |
String |
|
智能文档在应用服务中的链接地址 |
dataurl |
String |
|
与智能文档对应的数据文件在应用服务中的链接地址 |
sTargetURL |
String |
|
采集获取的数据信息需要提交到的应用服务中的链接地址 |
sServerURL |
String |
|
应用服务本身的链接地址 |
返回值说明:
返回值 |
类型 |
默认值 |
说明 |
Formcontent |
Serializable |
|
解析后的智能文档及数据信息流 |
调用时状态:打开智能文档
处理智能文档提交数据,其API为processForm:
Public java.io.Serializable processForm
(java.lang.String formsubmiturl,
java.lang.String datasubmiturl,
java.lang.String sOptions,
java.lang.String sServerURL)
参数说明:
参数 |
类型 |
默认值 |
说明 |
formsubmiturl |
String |
|
智能文档需要提交到的应用服务中的链接地址 |
datasubmiturl |
String |
|
填写信息组成的数据文件需要提交到的应用服务中的链接地址 |
sOptions |
String |
|
提交方式:1、只提交数据文件2、将数据文件、智能文档分别提交3、将数据保存在智能文档中,提交智能文档 |
sServerURL |
String |
|
应用服务本身的链接地址 |
返回值说明:
返回值 |
类型 |
默认值 |
说明 |
datacontent |
Serializable |
|
填写信息组成的数据文件信 |
调用时状态:提交智能文档
像上述这样的API函数还有很多,它们的具体实现是本领域一般技术人员能够掌握的常规技术,在此就不赘述了。
在本发明中,还可以扩展接口集合,完成终端设备对表单新的操作功能。例如根据业务需要增加校验功能,则各种采集渠道及终端设备无需做任何更改,而由智能文档平台扩展API函数来实现,如新增一个VerifyForm(form,data,rules,sTargetURL,sServerURL)。用户只要调用新的VerifyForm函数接口,就可以在不同终端设备上完成对数据的校验工作。
本发明中的多渠道采集包括如下的多种实现方式:
A.在线采集信息
在线采集信息,是指用户借助PC机、笔记本电脑等终端设备,通过计算机网络远端访问智能文档平台,下载智能文档,作为用户采集数据的界面;填写完毕后,上传智能文档到智能文档平台,完成信息采集过程。同时,对已经采集的数据,可通过查询界面进行查询,下载数据信息,在本地计算机展现出来,供查看、修改。
如图3所示,用户借助PC机、笔记本电脑等终端设备,在网络浏览器中输入URL链接地址,通过计算机网络,访问远端智能文档平台,下载智能文档,在网络浏览器中打开,填写完毕后,点击提交,自动上传智能文档到智能文档平台,完成信息采集过程。同时,对已经采集的数据,可在查询页面设置查询条件,点击搜索,对智能文档平台内存储的数据进行查询。智能文档平台将符合条件的数据下载到客户端,通过网络浏览器以智能文档形式展现出来,供用户查看,修改。例如,用户通过访问智能文档平台的智能文档列表,选择打开一个智能文档,该操作实质上是调用智能文档平台的renderForm函数,输入参数,智能文档平台通过网络获取参数后,返回智能文档内容经网络给用户,将智能文档以表单的形式在网络浏览器中展现出来,用户填写各个数据项。用户填写完成后,可以在智能文档提交设置界面内,设置如下参数,完成提交功能。如设置formsubmiturl为http;//ucap.com.cn/formserver/submit/file.jsp,设置datasubmiturl为http;//ucap.com.cn/formserver/submit/data.jsp,设置sOptions决定提交方式,完成后,智能文档和数据将被提交到智能文档平台的不同路径下,分别保存,若sOptions选择3,则只保存一个完整智能文档。设置sServerURL为http://ucap.com.cn/formserver,为用户指明智能文档平台的具体链接地址。提交时,后台调用processForm函数,将数据传送给智能文档平台,由智能文档平台对信息进行处理或保存。再次查询该条记录,依然可以将数据在网络浏览器中重新展现(依然是通过renderForm函数下载打开智能文档),此时可以进行修改数据的操作,再次提交后(依然是通过processForm函数提交数据),最新的信息保存到智能文档平台,替换了原有的记录信息。
在上述的在线采集过程中,所有的智能文档和数据文件均来自远端服务器,故renderForm函数中,formurl,dataurl,sTargetURL,sServerURL均为具体业务应用的链接地址,而与具体终端设备无关。如:将formurl设置为http://ucap.com.cn/formserver/files/sample.idf,获取服务器上名为sample.idf的智能文档打开,若无相关数据文件,可以设置dataurl为空,否则,可设置文件具体链接,如http://ucap.com.cn/formserver/datas/sample001.xml,获取服务器上名为sample001.xml的与sample.idf匹配的数据文件,设置sTargetURL为http;//ucap.com.cn/formserver/submit.jsp,用户填写的数据,将统一提交到智能文档平台的这个地址下,设置sServerURL为http://ucap.com.cn/formserver,为用户指明智能文档平台的具体链接地址。processForm函数也是类似的,在此不再赘述。用户登陆智能文档平台界面,直接完成这些参数的设置,服务器端智能文档平台根据该接口的信息,传递表单及数据,下载到客户网络浏览器中展现,填写,修改,最终将采集到的信息提交给智能文档平台处理。这些参数都与智能文档平台的应用部署链接相关,而与具体的采集方式无关。对其他采集方式,调用相同的接口,设置各自参数内容,完成相同的表单加载功能。
B.离线采集信息
如图4所示,离线采集信息是指在无法连接网络的情况下,用户利用本地的离线填写工具作为用户采集数据的界面,打开已下载保存到本地的智能文档,进行信息填报。填写完毕后,可暂存为本地数据文件,待能够重新连接网络时,直接提交到远端的智能文档平台,或通过移动存储设备保存后,将数据转存到智能文档平台。同时,可以通过连网,或移动存储设备,接收智能文档或单纯数据文件,在本地填写工具下加载数据信息,进行查看、修改数据的操作。
对离线采集方式而言,用户将参数传递给客户端软件,调用renderForm函数,打开本地智能文档展现,填写完成后,用户可将相关参数传递给客户端软件的processForm函数,将数据保存在本地,也可将相关参数通过网络传递给应用服务的processForm函数,应用将获取智能文档数据,并传输到指定位置保存。其中renderForm中的formurl和dataurl都是用户本地文件,如file:///d:/files/sample.idf,打开本地d盘files文件夹下的sample.idf文件,file:///d:/datas/sample001.xml,打开本地d盘datas文件夹下的sample001.xml文件,sTargetURL和sServerURL用于设置联网时的智能文档平台服务器地址,或者直接设置为空,用移动硬盘,独立提交网址等方式实现数据上传。
C.PDA采集信息
PDA是个人数字助理(Personal Digital Assistant)的缩写。这种手持设备集中了计算、电话、传真和网络等多种功能。它不仅可用来管理个人信息,更重要的是可以上网浏览,收发Email,可以发传真,甚至还可以当作手机来用。尤为重要的是,这些功能都可以通过无线方式实现。
如图5所示,PDA采集信息是指用户通过PDA客户端,借助无线方式,访问远端智能文档平台,下载智能文档,作为用户采集数据的界面,填写完毕后,上传智能文档到智能文档平台,完成信息采集过程。同时,对已经采集的数据,可通过查询界面进行查询,下载数据信息,在PDA上展现出来,供查看,修改。
在PDA信息采集方式中,PDA通过GPRS移动网络,传输参数,调用远程应用服务接口,完成智能文档下载展现和数据提交。PDA方式中调用renderForm和processForm的操作与在线填写十分类似,只是网络传输路径不同,一个通过互联网,另一个通过GPRS移动网络。
D.OCR扫描采集信息
OCR是光学字符识别的缩写,是通过扫描、传真等光学输入方式将各种票据、证件、填报表及其它印刷智能文档的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
如图6所示,OCR扫描采集信息是指利用OCR技术扫描印刷智能文档,借助智能文档平台应用程序,将信息转换为XML格式,上传到智能文档平台。该方式一般用于采集传统纸质智能文档信息,将其转化为电子智能文档保存处理,而不用于从智能文档平台下载智能文档,对数据进行查询和查看、修改等操作。
通过OCR识别设备进行信息采集,信息将通过网络,调用processForm函数上传给智能文档平台处理。而这些数据,可以通过网络或GPRS传输方式,提供给其他终端设备,如离线客户端、手机、PDA等使用。
E.二维条码采集信息
二维条码是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的;在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图像输入设备或光电扫描设备自动识读以实现信息自动处理。
如图7所示,二维条码采集信息是指通过条码枪从二维条码中读取数据信息,并自动转换为XML格式,保存到指定的智能文档中;由智能文档平台的校验功能核对无误后,将智能文档连同数据保存到智能文档平台中;采集智能文档平台根据需要,将数据交换到不同的终端设备,供用户查询、使用。
与OCR识别类似,通过条码枪进行信息采集,信息将通过网络调用processForm函数上传给智能文档平台处理。而这些数据,可以通过网络或GPRS传输方式,提供给其他终端设备,如离线客户端、手机、PDA等使用。
以上对本发明所提供的基于智能文档平台的多渠道信息采集交换方法进行了详细的说明。对本领域的技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。