CN100468406C - 一种自动更新信息数据的方法 - Google Patents

一种自动更新信息数据的方法 Download PDF

Info

Publication number
CN100468406C
CN100468406C CNB2006100072202A CN200610007220A CN100468406C CN 100468406 C CN100468406 C CN 100468406C CN B2006100072202 A CNB2006100072202 A CN B2006100072202A CN 200610007220 A CN200610007220 A CN 200610007220A CN 100468406 C CN100468406 C CN 100468406C
Authority
CN
China
Prior art keywords
data
message slot
template
information
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100072202A
Other languages
English (en)
Other versions
CN1808435A (zh
Inventor
周祖胜
刘文敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CNB2006100072202A priority Critical patent/CN100468406C/zh
Publication of CN1808435A publication Critical patent/CN1808435A/zh
Application granted granted Critical
Publication of CN100468406C publication Critical patent/CN100468406C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种自动更新信息数据的方法,属于信息处理技术领域。现有的网站信息发布系统大多采用直接从数据库中获取信息进行发布的方法,而网页需要更新的一般只是最新的信息,直接从大数据量中获取所需信息的查询效率较低,信息发布前需要预览,而预览与发布所使用的信息数据相同,每次重复从数据库中获取这些相同资料,造成数据库不必要的开销。本发明所述的方法是通过定义信息片、数据和信息片的对应关系,来实现更新数据时同时自动更新信息片,而用户从信息片中获取需要的数据,完成预览和发布从而避免直接从大数据量中提取所需信息。

Description

一种自动更新信息数据的方法
技术领域
本发明属于信息处理技术领域,具体涉及一种自动更新信息数据的方法。
背景技术
为了将网站管理人员从繁重的手工制作网页中解脱出来,而更多的关注于网站的内容管理和网站的样式设计,众多的大型网站都使用了网站内容发布系统。
由于网络媒体新闻实时性的要求,最新的信息要求准确及时地更新,这就提出两方面的要求,首先是对要发布的信息在发布前进行预览,及时发现错误并修改,才能保证发布出去的信息准确,其次是需要提高从大数据量中提取所需信息的效率。
现有的发布系统大多采用直接从数据库中获取信息进行发布的方法,随着时间推移数据库中数据量越来越大,网页需要更新的一般只是最新的信息,当数据量变得很大时,直接从大数据量获取所需信息的查询效率较低,直接影响了系统的响应时间;信息发布前需要预览,而预览与发布所使用的信息数据相同,预览和发布都直接从数据库中获取资料没能共享相同信息。
XML即Extensible Markup Language(可扩展标记语言)的缩写。
XML实际上是Web上表示结构化信息的一种标准文本格式,它没有复杂的语法和包罗万象的数据定义。XML同HTML一样,都来自SGML(标准通用标记语言)。SGML是一种在Web发明之前就早已存在的用标记来描述文档资料的通用语言。但SGML十分庞大且难于学习和使用。鉴于此,人们提出了HTML语言。但近年来,随着Web应用的不断深入,HTML在需求广泛的应用中已显得捉襟见肘,有人建议直接使用SGML作为Web语言。但SGML太庞大了,学用两难尚且不说,就是全面实现SGML的浏览器也非常困难。于是Web标准化组织W3C建议使用一种精简的SGML版本——XML。XML与SGML一样,是一个用来定义其他语言的元语言。与SGML相比,XML规范不到SGML规范的1/10,简单易懂,是一门既无标签集也无语法的新一代标记语言。
发明内容
针对直接查询数据库的缺陷,本发明的目的是提供一种自动更新信息数据的方法,该方法能够在网站信息发布时避免直接从网站服务器中的大数据量中获取数据,从而有效提高系统的响应时间;使用者在预览和发布时网站信息时,该方法还能够显著地减少了数据库的开销。
为了实现上述发明目的,本发明采用的技术方案是:一种自动更新信息数据的方法,包括以下步骤:
(1)将网站服务器内的数据按频道栏目进行分类,在模板中定义对栏目数据的使用方式,并将栏目数据的某一种使用方式定义为一个信息片,建立信息片与分类数据的对应关系,所述的信息片是指保存在XML文件中的满足发布要求所需数据的快照,是从大数据量中提取出来的实际需要用到的信息的集合;
(2)根据业务逻辑,建立一种触发机制,当某类数据发生变化时,根据步骤(1)中建立的对应关系,查找受到影响的信息片;
(3)根据变化的数据自动更新信息片;
(4)用户预览和发布网站信息时,是用户从信息片中获取需要的数据,完成预览和发布。
步骤(1)中,模板中规定的对数据的提取条数,提取数据的开始结束范围,能够由用户任意指定。
步骤(1)中,在整个系统中相同栏目的相同提取范围,作为同一个信息片保存。
进一步,步骤(4)中,用户在根据模板进行预览或发布时,按照模板中对栏目数据的使用方式,找到对应的信息片,解析信息片XML文件,取出模板中所需要的数据填充到模板中,完成预览和发布。
本发明的效果在于:采用本发明所述的方法,一方面由于信息片是满足发布要求的所需数据的快照(换句话说,快照信息片是指从大数据量中提取出来的实际需要用到的信息的集合),例如某个分类数据只需要用到最新的20条信息,就将这20条信息保存在一个xm1文件中,这个XML文件就是这个分类数据的快照,因而避免了直接从大数据量中获取数据,可以有效提高系统的响应时间;另一方面信息片的使用者在预览和发布时,可以多次重复从某一信息片中提取数据,而不必每次从数据库中获取资料,显著地减少了数据库的开销。
本发明之所以具有上述效果,其原因在于:本发明中所述的信息片是一次生成多处使用,由于每次数据的更新只会引起信息片生成一次,而在多种场合消费数据是都是重复利用已有的信息片,极大的减少了与数据库打交道的次数和开销;另一方面当数据库中数据量越来越大时,多次重复从大量数据中查找所需信息,效率势必不高,而采用生成信息片的方法,由于信息片的数据只是大量数据中所需数据的快照,且只查找一次,必然能提高信息的使用效率。
附图说明
图1是生成信息片的流程图,图中预览和发布模块都使用更新的信息片数据。
具体实施方式
下面结合附图及具体实施方式对本发明做进一步的描述:
本发明中所述的信息片是指一段最新信息的XML片段,供数据的使用者读取。本发明中所述的自动更新是指数据变动时更新对应的信息片。
如图1所示,一种自动更新信息数据的方法,包括以下步骤:
(1)将数据进行分类,建立信息片与分类数据的对应关系;
本实施例中,根据网站内容的特点将网站内的数据按频道栏目进行分类,在模板中定义对栏目数据的使用方式,例如模板中规定取栏目A下的第1条到第30条信息,对栏目A的这样一种使用数据的方式可定义为一个信息片,模板中规定的对数据的提取条数,提取数据的开始结束范围,可由用户任意指定,在整个系统中相同栏目,相同的提取范围,作为一个信息片保存。
(2)根据业务逻辑,建立一种触发机制,当某个分类数据发生变化时,根据步骤(1)中建立的对应关系,根据分类查找影响的信息片;
在某个分类栏目下发布一篇新稿时,这个栏目数据就发生了变化,就会影响到与这个栏目对应的多个信息片,与这个栏目有关的所有信息片都应作相应的变化。根据用户定义的模板对栏目数据的引用关系,一个栏目可能与多个信息片相联系,也可能不与任何信息片关联。
(3)根据变化的数据自动更新信息片;
将栏目中变化的数据新增或更新对应的信息片中;
本实施例中,当数据发生变化时,根据模板中设定的获取信息起始条数,获取相应栏目信息数据,形成XML文件,如:
<?xml version="1.0"encoding="UTF-8"?>
<data snip>
  <record>
    <ARTICLEID><![CDATA[5659]]></ARTICLEID>
    ······
  <record>
  ······
</datasnip>
其中record元素下的子元素与数据库中的字段名相同。
(4)用户预览和发布网站信息时,数据的使用者从信息片中获取数据,完成预览和发布。
用户在根据模板进行预览或发布时,按照模板中对栏目数据的使用方式,找到对应的信息片,解析信息片XML文件,取出模板中所需要的数据填充到模板中,完成预览和发布。
本发明所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。

Claims (4)

1.一种自动更新信息数据的方法,包括以下步骤:
(1)将网站服务器内的数据按频道栏目进行分类,在模板中定义对栏目数据的使用方式,并将栏目数据的某一种使用方式定义为一个信息片,建立信息片与分类数据的对应关系,所述的信息片是指保存在XML文件中的满足发布要求所需数据的快照,是从大数据量中提取出来的实际需要用到的信息的集合;
(2)根据业务逻辑,建立一种触发机制,当某类数据发生变化时,根据步骤(1)中建立的对应关系,查找受到影响的信息片;
(3)根据变化的数据自动更新信息片;
(4)用户预览和发布网站信息时,是从信息片中获取需要的数据,完成预览和发布。
2.如权利要求1所述的一种自动更新信息数据的方法,其特征在于:步骤(1)中,模板中规定的对数据的提取条数,提取数据的开始结束范围,能够由用户任意指定。
3.如权利要求2所述的一种自动更新信息数据的方法,其特征在于:步骤(1)中,在整个系统中相同栏目的相同提取范围,作为同一个信息片保存。
4.如权利要求3所述的一种自动更新信息数据的方法,其特征在于:步骤(4)中,用户在根据模板进行预览或发布时,按照模板中对栏目数据的使用方式,找到对应的信息片,解析信息片XML文件,取出模板中所需要的数据填充到模板中,完成预览和发布。
CNB2006100072202A 2006-02-14 2006-02-14 一种自动更新信息数据的方法 Expired - Fee Related CN100468406C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100072202A CN100468406C (zh) 2006-02-14 2006-02-14 一种自动更新信息数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100072202A CN100468406C (zh) 2006-02-14 2006-02-14 一种自动更新信息数据的方法

Publications (2)

Publication Number Publication Date
CN1808435A CN1808435A (zh) 2006-07-26
CN100468406C true CN100468406C (zh) 2009-03-11

Family

ID=36840335

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100072202A Expired - Fee Related CN100468406C (zh) 2006-02-14 2006-02-14 一种自动更新信息数据的方法

Country Status (1)

Country Link
CN (1) CN100468406C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894317A (zh) * 2010-06-08 2010-11-24 用友软件股份有限公司 数据变化驱动业务逻辑的方法和系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192218A (zh) 2006-11-23 2008-06-04 国际商业机器公司 提供和获取网络内容的方法、装置和系统
WO2010130083A1 (en) * 2009-05-12 2010-11-18 Shanghai Hewlett-Packard Co., Ltd Document key phrase extraction method
CN101930448B (zh) * 2009-06-23 2012-08-29 北京搜狗科技发展有限公司 一种网页信息的订阅方法和装置
CN101980204B (zh) * 2010-11-04 2013-07-10 上海银杏界信息科技有限公司 静态网页自动更新方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894317A (zh) * 2010-06-08 2010-11-24 用友软件股份有限公司 数据变化驱动业务逻辑的方法和系统

Also Published As

Publication number Publication date
CN1808435A (zh) 2006-07-26

Similar Documents

Publication Publication Date Title
CN101727461B (zh) 一种网页的正文抽取方法
Chen et al. Function-based object model towards website adaptation
CN100512181C (zh) 一种互联网内容信息的提取方法和提取系统
CN100468406C (zh) 一种自动更新信息数据的方法
CN101308495B (zh) 局数据核查制作方法
CN100444174C (zh) 网页微内容提取、聚合和自动更新系统的方法
CN101763423B (zh) 实现万维网页面树形结构数据展示的方法、系统及装置
CN101609399B (zh) 基于建模的智能化网站开发系统及方法
CN101136020A (zh) 自动扩展参考数据的系统和方法
US20120310868A1 (en) Method and system for extracting and managing information contained in electronic documents
CN100489862C (zh) 标记性语言文档的解析方法、解析模块和用户终端
CN104182911A (zh) 一种实现配电网系统cim模型一致性的校验方法
CN101346689A (zh) 压缩模式表示对象和用于元数据处理的方法
CN102662969A (zh) 一种基于网页结构语义的互联网信息对象定位方法
CN104624509A (zh) 一种快递自动分拣系统及自动分拣方法
CN102810097A (zh) 网页正文内容提取方法及装置
CN104933168B (zh) 一种网页内容自动采集方法
CN103020293A (zh) 一种移动应用的本体库的构建方法及系统
CN103258029A (zh) 信息检索方法及系统
CN103049536A (zh) 提取网页正文内容的方法和系统
CN106648917B (zh) 一种差异更新缓存数据的方法及系统
CN101000602A (zh) 字符转换方法与系统
CN101763419A (zh) 一种本地数据库同步更新远程rss数据的方法
CN103092973A (zh) 信息抽取方法和装置
WO2009021811A1 (en) A method, apparatus and software for processing data encoded as one or more data elements in a data format

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090311

Termination date: 20190214