CN101976272A - Web应用待办与企业门户零耦合集成方法 - Google Patents

Web应用待办与企业门户零耦合集成方法 Download PDF

Info

Publication number
CN101976272A
CN101976272A CN 201010574923 CN201010574923A CN101976272A CN 101976272 A CN101976272 A CN 101976272A CN 201010574923 CN201010574923 CN 201010574923 CN 201010574923 A CN201010574923 A CN 201010574923A CN 101976272 A CN101976272 A CN 101976272A
Authority
CN
China
Prior art keywords
pending
web application
information
backlog
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010574923
Other languages
English (en)
Inventor
马勇
王国欢
李凡
赵海峰
李庆尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INFORMATION COMMUNICATION CENTER OF JIANGXI ELECTRIC POWER CO Ltd
Original Assignee
INFORMATION COMMUNICATION CENTER OF JIANGXI ELECTRIC POWER CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INFORMATION COMMUNICATION CENTER OF JIANGXI ELECTRIC POWER CO Ltd filed Critical INFORMATION COMMUNICATION CENTER OF JIANGXI ELECTRIC POWER CO Ltd
Priority to CN 201010574923 priority Critical patent/CN101976272A/zh
Publication of CN101976272A publication Critical patent/CN101976272A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种Web应用待办与企业门户零耦合集成方法,区别于传统的主动式待办信息集成,这种方式通过对Web应用待办数据进行语法分析,将这些零散的半结构信息进行数据结构化处理后集成到企业门户待办库中,通过异步交互的方式,将新生成的待办信息高亮显示于企业门户网页中。本发明独立于系统开发,不需要对其他Web应用网站进行改造,实现了模块间的低耦合,这种零入侵的系统接入方式也具有较强的安全性,同时减少投入费用和设计开发周期。本发明还提供对网页结构过滤处理的有效策略,增加了系统的自动智能化;保存各系统不同的待办集成规则,可适应多变的Web应用系统环境。

Description

Web应用待办与企业门户零耦合集成方法
技术领域   
本发明涉及一种Web应用待办与企业门户零耦合集成方法。
技术背景
随着国内经济实力提升,企业的信息系统越来越多,而历史遗留下来的Web应用也随之增多,用户需要进入原网站才能查看到一些零散的待办消息,带来了诸多不便,故需要将多个Web应用待办集成到企业门户。
WEB应用系统待办集成分为主动和被动两种方式,待办主动集成是指当待办产生时候立刻反应到企业门户的待办集成库;待办被动集成是指企业门户分析Web应用中的待办后,将其集成到企业门户待办库中。
采用待办主动集成方式必须将对Web应用系统进行改造,待办主动集成方式分为两种:通过硬编码的方式,在数据库层通过触发器方式集成应用系统的待办;在应用层通过Web Service等远程过程调用方式集成应用系统的待办。若系统源代码或者数据库发生改动,都不可避免更新待办的集成方式。如果Web应用系统的代码和数据库无法更改,这些Web应用系统的待办就无法集成到企业门户中,例如历史遗留系统。
这些Web应用系统的待办集成只能采用被动的方式。像企业门户这样的外部系统无法获得C/S结构的Web应用系统的待办,而基于B/S结构的待办网页,可以通过对HTTP协议响应进行语法分析,将Web应用系统的待办集成到企业门户待办库中。
发明内容
本发明的目的就是提供一种投资少、安全性能高,可提高数据库的更新效率和降低服务器负载的Web应用待办与企业门户零耦合集成方法。
本发明的Web应用待办与企业门户零耦合集成方法,包括三个步骤:设置待办规则库,语法分析,待办信息同步,具体步骤如下:
步骤a:确定需要集成Web应用和企业门户待办库之间的对应关系;    
步骤b:语法分析引擎处理从Web应用上抓取到的原始待办信息,通过其特征将信息分别进行缓存,再通过抽取与原始数据接近且适合进一步挖掘的数据,将抽取后的数据信息再进行数据格式过滤转换,与待办规则库模板进行匹配,最后保存至现门户待办库内,而在各Web应用系统待办信息上所采用的分析规则也将保存到语法分析引擎规则库中;
步骤c:待办库内信息通过异步交互方式返回到门户页面上,并且那些未处理的待办信息将高亮显示,用户便可快速获取到有效信息。
本发明的Web应用待办与企业门户零耦合集成方法,简化并改进传统的办公待办信息集成方式,将原页面半结构数据保存至数据库表内,实现数据从半结构化向结构化转变,与原系统相比具有以下优点:
1、不需要单独的对历史遗留网站进行维护与改造,减少投入费用和设计开发周期;
2、独立于应用系统开发,减少系统的耦合度;
3、提供了一种对语句处理的有效策略,增加了办公系统的自动智能化;
4 、采用异步通信交互,提高数据库的更新效率和降低服务器的负载,不需要打断用户的操作,具有更加迅速的响应能力,也不需要下载插件;
5、 实际Web应用待办与语法分析结合更能有效的筛选出完整有效的数据信息,提高效率。
附图说明
图1为本发明总体架构图。
具体实施方式
一种Web应用待办与企业门户零耦合集成方法,具体步骤:
第一部分:设置待办规则库
待办规则库存储了集成到企业门户中所有Web应用待办集成规则。该数据库主要包含了Web应用特征值(Web应用系统URL)、待办特征值(Web应用系统待办字段串接散列值)、映射关系(Web应用系统待办字段和企业门户待办字段的对应关系)、以及待办标签名称(Web应用系统待办网页中包含待办信息的HTML标签名称)。待办规则库中待办标签名称将在语法分析部分根据分析结果产生,其他字段在此部分根据实际情况设置。
第二部分:语法分析
本部分主要完成从半结构化的待办网页中得到结构化的待办规则,并将该规则存储到待办信息抽取模板库内。该过程主要分为抽取、去噪、关键词分析、匹配和存储。
1)    抽取:创建抽取计划,逐个请求有待集成的待办网页,缓存响应后的待办网页至队列中。
2)    去噪:通过正则表达式对抽取到的内容进行格式匹配,去除与待办网页中待办信息不匹配的标签;
3)    关键词分析:利用文档对象分析方法逐个解析去噪后得到的标签,抽取并记录句法结构中各个关键词,将所有的关键词串接后的散列值(例如MD5)作为该标签的特征值;
4)    匹配:将该标签的特征值与模板库内的特征值进行匹配,如果找到相一致的特征值,说明该标签就是需要抽取的待办信息;否则抛弃该标签;
5)    存储:将相匹配的标签名称和字段对应关系存储在待办集成模板库内。
第三部分:待办信息同步
如果用户登录企业门户后浏览需要处理Web应用的待办,待办引擎将根据待办特征值查找待办集成的规则。待办引擎获取规则后,对待办网页的数据分析后获取相应的待办信息,并缓存至待办库内。待办引擎利用异步交互技术在企业门户中统一展示待办,通过对阅读标志判断,将未读的待办信息高亮显示。

Claims (1)

1.一种Web应用待办与企业门户零耦合集成方法,其特征在于:它包括:设置待办规则库、语法分析、待办信息同步三个步骤,具体如下:
步骤a:确定需要集成Web应用和企业门户待办库之间的对应关系;    
步骤b:语法分析引擎处理从Web应用上抓取到的原始待办信息,通过其特征将信息分别进行缓存,再通过抽取与原始数据接近且适合进一步挖掘的数据,将抽取后的数据信息再进行数据格式过滤转换,与待办规则库模板进行匹配,最后保存至现门户待办库内,而在各Web应用系统待办信息上所采用的分析规则也将保存到语法分析引擎规则库中;
步骤c:待办库内信息通过异步交互方式返回到门户页面上,并且那些未处理的待办信息将高亮显示,用户便可快速获取到有效信息。
CN 201010574923 2010-12-07 2010-12-07 Web应用待办与企业门户零耦合集成方法 Pending CN101976272A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010574923 CN101976272A (zh) 2010-12-07 2010-12-07 Web应用待办与企业门户零耦合集成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010574923 CN101976272A (zh) 2010-12-07 2010-12-07 Web应用待办与企业门户零耦合集成方法

Publications (1)

Publication Number Publication Date
CN101976272A true CN101976272A (zh) 2011-02-16

Family

ID=43576158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010574923 Pending CN101976272A (zh) 2010-12-07 2010-12-07 Web应用待办与企业门户零耦合集成方法

Country Status (1)

Country Link
CN (1) CN101976272A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299761A (zh) * 2008-06-02 2008-11-05 国网信息通信有限公司 一种业务统一待办方法及系统
CN101697161A (zh) * 2009-11-04 2010-04-21 江西省电力信息通讯有限公司 一种面向电网企业的语义Portlet库管理方法及装置
CN101771724A (zh) * 2010-01-05 2010-07-07 吉林大学 异构分布式信息集成方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299761A (zh) * 2008-06-02 2008-11-05 国网信息通信有限公司 一种业务统一待办方法及系统
CN101697161A (zh) * 2009-11-04 2010-04-21 江西省电力信息通讯有限公司 一种面向电网企业的语义Portlet库管理方法及装置
CN101771724A (zh) * 2010-01-05 2010-07-07 吉林大学 异构分布式信息集成方法、装置及系统

Similar Documents

Publication Publication Date Title
CN102279894B (zh) 基于语义的查找、集成和提供评论信息的方法及搜索系统
CN1955963B (zh) 用于搜索电子文档中的日期的系统和方法
CN109033406B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN109033403B (zh) 用于搜索区块链数据的方法、装置及存储介质
Yong-Gui et al. Research on semantic Web mining
CN110019267A (zh) 一种元数据更新方法、装置、系统、电子设备及存储介质
CN104516982A (zh) 一种基于Nutch的Web信息提取方法和系统
CN110716952A (zh) 一种多源异构数据处理方法、装置和存储介质
US20200142674A1 (en) Extracting web api endpoint data from source code
CN109101607B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN102043862A (zh) 网页数据定向抓取方法
CN102982118A (zh) 一种基于收藏夹的搜索方法和装置
US20160085875A1 (en) Method for configuring browser bookmarks, device and terminal thereof
CN203299613U (zh) 智能建筑控制系统
CN103838797A (zh) 一种移动搜索引擎优化方法
CN102982011A (zh) 一种用于识别失序文本的方法与设备
CN117111909A (zh) 代码自动化生成方法、系统、计算机设备及存储介质
CN103399746B (zh) 一种便于二次开发的信息管理系统及开发方法
CN101976272A (zh) Web应用待办与企业门户零耦合集成方法
CN104111942A (zh) 维吾尔医药古籍资源网络检索平台
CN104063506A (zh) 重复网页识别方法和装置
CN103077252A (zh) 图书馆读者业务的即时集成查询接口的制作与应用方法
Malik et al. Ontology and Web Usage Mining towards an Intelligent Web focusing web logs
CN105468752A (zh) 一种数据产品构建系统
CN104063453A (zh) 一种基于url分析的营销关键词提取的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20110216