CN101976261A - 网页数据存储与搜索方法 - Google Patents

网页数据存储与搜索方法 Download PDF

Info

Publication number
CN101976261A
CN101976261A CN 201010532528 CN201010532528A CN101976261A CN 101976261 A CN101976261 A CN 101976261A CN 201010532528 CN201010532528 CN 201010532528 CN 201010532528 A CN201010532528 A CN 201010532528A CN 101976261 A CN101976261 A CN 101976261A
Authority
CN
China
Prior art keywords
webpage
web page
web
template
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010532528
Other languages
English (en)
Other versions
CN101976261B (zh
Inventor
严洪涛
沈亦可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu comprehend information technology Co., Ltd.
Original Assignee
SHANGHAI YINXINGJIE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI YINXINGJIE INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI YINXINGJIE INFORMATION TECHNOLOGY Co Ltd
Priority to CN2010105325285A priority Critical patent/CN101976261B/zh
Publication of CN101976261A publication Critical patent/CN101976261A/zh
Application granted granted Critical
Publication of CN101976261B publication Critical patent/CN101976261B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种网站发布技术,特别涉及一种网页数据存储与搜索方法。一种网页数据存储与搜索方法,首先将不同类型的网页内容进行统一的数据库存储,对于通用网页属性按数据库字段进行单独存储,对于具有模板的网页,把网页内容按网页模板的所有组件打包存放在自定义组件内容字段,各组件名与组件值对应,将组件中需要搜索的内容抽取并单独存放在索引字段,索引字段包含组件名与组件值;网页内容发布解析时,生成静态的网页,发布WEB服务器上;网页上进行搜索时,根据索引字段,按对应的组件名和组件值进行匹配,找到所要搜索的目标静态页面,得到搜索结果。

Description

网页数据存储与搜索方法
技术领域
本发明涉及一种网站发布技术,特别涉及一种网页数据存储与搜索方法。
背景技术
目前的网站建设中,对于网站内容管理系统的要求,网站内容既要有动态网页的易管理,又要有静态网页的高性能和易搜索性,本发明主要涉及动态内容发布成静态网页的网站内容管理系统的网页数据存储与搜索。
采用静态网页的发布模式,网站内容管理系统采用管理端与访问端分离的分布式部署结构,有效地提高系统的完全性和稳定性。用户通过网站内容管理系统进行采编、制作的信息通过网站内容分发器安全地分发到WEB(网络)服务器,由前端的WEB服务器提供给客户访问,从而防止用户直接对系统服务器、数据库服务器造成的安全威胁。
一个网站内容管理系统通常有如下要素:网页模板,模板又由各种网页组件构成;脚本语言或标记语言;与数据库集成。
模板的目的是决定内容管理系统中录入的内容如何生成HTML(HyperText Mark-up Language即超文本标记语言或超文本链接标示语言)页面。模板类似一个普通的HTML页面,在其中固定的位置,插入网站内容管理系统中数据的字段信息,就生成了最终发布的HTML页面。模板对于整个网站只需要一次性只做,即可一直使用。
网站内容管理系统对站点管理和创造编辑最大的好处是能够使用模板和通用的设计元素以确保整个网站的协调。作者只需在他们的文档中采用少量的模板代码,然后即可把精力集中在设计之上的内容了。要改变网站的外观,管理员只需修改模板而不是一个个单独的页面。
网站内容管理系统也简化了网站的内容供给和内容管理的责任委托。很多网站内容管理系统允许对网站的不同层面人员赋予不同等级的访问权限,这使得他们不必研究操作系统级的权限设置,只需用浏览器接口即可完成。
但目前对于各式各样网页内容数据的存储,缺乏一种方法,能够提供网页内容统一通用的数据存储与搜索接口,并且无法实现对发布的静态网页内容高效率检索。
发明内容
本发明的目的在于提供一种网页数据存储与搜索方法,为动态内容发布成静态网页的网站内容管理系统的网页内容数据与数据库之间提供了一种统一通用的数据存储与搜索接口。
一种网页数据存储与搜索方法,首先将不同类型的网页内容进行统一的数据库存储,对于通用网页属性按数据库字段进行单独存储,对于具有模板的网页,各个模板对应不同的组件和发布内容,对这部分动态网页数据按以下规则进行打包存储,把网页内容按网页模板的所有组件打包存放在自定义组件内容字段,各组件名与组件值对应,将组件中需要搜索的内容抽取并单独存放在索引字段,索引字段包含组件名与组件值。
网页内容发布解析时,首先取出网页内容的数据库记录,得出网页内容所采用的网页模板,然后解析自定义组件内容,把网页模板对应的组件值用自定义组件内容字段解析出来的对应组件值替换,最后生成静态的网页,发布到所属站点、所属栏目以及网页发布URL(Uniform Resource Locator的缩写,统一资源定位符,也被称为网页地址)地址的对应的WEB服务器上;
网页上进行搜索时,根据索引字段,按对应的组件名和组件值进行匹配,找到所要查询的目标静态页面,得到搜索结果。
所述通用网页属性包括网页标题、网页所属栏目、网页使用模板。
本发明具有以下有益效果:
本发明网页数据存储与搜索方法,为网站内容管理系统的网页内容数据与数据库之间提供了一种统一通用的数据存储与搜索接口,解决了动态内容发布成静态网页的网站内容管理系统数据集成问题,并且能实现对发布的静态网页内容高效率检索。
附图说明
下面结合附图和具体实施方式对本发明作进一步说明。
图1为应用本发明网页数据存储与搜索方法进行网站网页内容发布的流程图;
具体实施方式
下面根据附图和具体实施例对本发明作进一步阐述。
如图1:应用本发明网页数据存储与搜索方法进行网站网页发布主要有下面五个步骤:
S1-1:网站内容发布系统进行动态网页内容发布操作。
S1-2:选择栏目,选择网页模板(栏目跟模板已设计完成)。
S1-3:根据网页模板填写所要发布的动态网页内容。
S1-4:网页内容数据存储。
将各式各样的网页内容进行统一的数据库存储,对于通用网页属性,比如:网页标题,网页所属栏目,网页使用模板等按数据库字段进行单独存储。而每个网页会选择不同的模板,各个模板对应不同的组件,发布内容也各不相同,对这部分动态网页数据按一定规则进行打包存储,同时对包含内容组件的名称与值进行打包存储用作索引,单独存放在索引字段。
S1-5:解析保存的网页数据内容,生成静态页面,发布到WEB服务器。
对打包的网页内容进行解析结合网页模板,生成静态页面,然后发布到对应网站的对应栏目。
网页内容数据的存储,主要涉及网页内容数据库表的设计以及网页数据以及索引的打包存储规则。
WebContent(网站内容)数据库表如下表1:
表1
 webContentId  主键Id
 webSiteId  所属站点
 webColumnId  所属栏目
 webTemplateId  使用模板
 compValue  自定义组件内容
 indexes  索引
 title  网页标题
 content  网页正文内容
 published  网页是否发布
 url  网页发布URL地址
 userId  发布人
 date  发布时间
其中:webContentId主键Id、webSiteId所属站点、webColumnId所属栏目、webTemplateId使用模板、title网页标题、content网页正文内容、published网页是否发布、url网页发布URL地址、userId发布人、date发布时间为网页内容通用属性字段,按数据库字段单独存储。
compValue自定义组件内容,indexes索引用来对动态网页内容以及索引打包存放。
因为不同网页内容所采用的网页模块,模板所包含的组件类型,组件数量,组件的值又各不相同,把网页内容按网页模板的所有组件(按<key=组件名1value=组件值1>,<key=组件名value=组件值2>...)打包存放在compValue(自定义组件内容)字段,而组件的索引(<组件名1><组件值1><组件名1><组件名2><组件值2><组件名2>...)存放在indexes(索引)字段。
网页内容解析:网页内容存储在数据库WebContent表以后,把网页内容发布到WEB服务器。
首先,取出网页内容的数据库记录,首先根据webTemplateId网页使用模板,得到网页内容所采用的网页模板,然后解析compValue(自定义组件内容),把网页模板对应的组件值用compValue(自定义组件内容)字段解析出来的对应组件值替换,最后生成静态的网页,发布到webSiteId(所属站点),webColumnId(所属栏目)以及url(网页发布URL地址)对应的WEB服务器上。
网页上进行搜索的时候,只要根据indexes字段,按对应的组件名-组件值进行匹配,就能很快找到所要查询的目标静态页面,得到搜索结果。
综上所述,采用本发明技术方案,为动态内容发布成静态网页的网站内容管理系统的网页内容数据与数据库之间提供了一种统一通用的数据存储与搜索接口,解决了网站内容管理系统数据集成问题,并且能实现对发布的静态网页内容高效率检索。

Claims (2)

1.一种网页数据存储与搜索方法,其特征在于,
首先将不同类型的网页内容进行统一的数据库存储,对于通用网页属性按数据库字段进行单独存储,对于具有模板的网页,各个模板对应不同的组件和发布内容,对这部分动态网页数据按以下规则进行打包存储,把网页内容按网页模板的所有组件打包存放在自定义组件内容字段,各组件名与组件值对应,将组件中需要搜索的内容抽取并单独存放在索引字段,索引字段包含组件名与组件值;
网页内容发布解析时,首先取出网页内容的数据库记录,得出网页内容所采用的网页模板,然后解析自定义组件内容,把网页模板对应的组件值用自定义组件内容字段解析出来的对应组件值替换,最后生成静态的网页,发布到所属站点、所属栏目以及网页发布URL地址的对应的WEB服务器上;
网页上进行搜索时,根据索引字段,按对应的组件名和组件值进行匹配,找到所要搜索的目标静态页面,得到搜索结果。
2.如权利要求1网页数据存储与搜索方法,其特征在于,所述通用网页属性包括主键Id、所属站点、所属栏目、使用模板、网页标题、网页正文内容、网页是否发布、网页发布URL地址、发布人和发布时间。
CN2010105325285A 2010-11-04 2010-11-04 网页数据存储与搜索方法 Expired - Fee Related CN101976261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105325285A CN101976261B (zh) 2010-11-04 2010-11-04 网页数据存储与搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105325285A CN101976261B (zh) 2010-11-04 2010-11-04 网页数据存储与搜索方法

Publications (2)

Publication Number Publication Date
CN101976261A true CN101976261A (zh) 2011-02-16
CN101976261B CN101976261B (zh) 2012-04-18

Family

ID=43576147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105325285A Expired - Fee Related CN101976261B (zh) 2010-11-04 2010-11-04 网页数据存储与搜索方法

Country Status (1)

Country Link
CN (1) CN101976261B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346785A (zh) * 2011-11-15 2012-02-08 北京创腾科技有限公司 一种用于直接对数据库实现自定义字段的方法和装置
CN102855255A (zh) * 2011-06-30 2013-01-02 北京新媒传信科技有限公司 内容管理发布方法及系统
CN103092895A (zh) * 2011-11-08 2013-05-08 北大方正集团有限公司 静态页面的处理方法及装置
CN104052737A (zh) * 2014-05-19 2014-09-17 北京网康科技有限公司 一种网络数据报文的处理方法及装置
WO2015117268A1 (en) * 2014-02-07 2015-08-13 Google Inc. Arbitrary size content item generation
CN105282189A (zh) * 2014-06-10 2016-01-27 江苏大泰信息技术有限公司 一种应用于大并发量数据环境下的安全数据存储方法
CN105389317A (zh) * 2014-09-09 2016-03-09 阿里巴巴集团控股有限公司 网页功能实现方法及系统
CN103092895B (zh) * 2011-11-08 2016-12-14 北大方正集团有限公司 静态页面的处理方法及装置
CN106446063A (zh) * 2016-09-06 2017-02-22 深圳市牛商网络股份有限公司 一种网页更新的系统
CN107239557A (zh) * 2017-06-08 2017-10-10 腾讯科技(深圳)有限公司 一种网页建立方法、电子设备及存储介质
CN107844493A (zh) * 2016-09-19 2018-03-27 上海泓智信息科技有限公司 一种文件关联方法及系统
CN108153798A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 页面信息处理方法、装置及系统
CN108376153A (zh) * 2018-02-07 2018-08-07 厦门集微科技有限公司 一种网络页面制作方法及装置
CN110516183A (zh) * 2019-08-30 2019-11-29 深圳点猫科技有限公司 静态网页的生成方法及装置
CN110555159A (zh) * 2018-03-30 2019-12-10 北大方正集团有限公司 网页检索方法、装置、设备及存储介质
CN110597856A (zh) * 2019-08-20 2019-12-20 华能四川水电有限公司 一种流量深度解析数据的快速检索系统和方法
CN112632633A (zh) * 2020-12-17 2021-04-09 西安博达软件股份有限公司 Cms系统中基于文件水印的静态资源防篡改方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10148790B2 (en) 2016-03-04 2018-12-04 Bank Of America Corporation Deployment of integrative HTML-based engine from an edge server

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183395A (zh) * 2007-12-25 2008-05-21 北京中企开源信息技术有限公司 一种实现动态页面静态化的方法和系统
CN101561802A (zh) * 2008-04-18 2009-10-21 上海复旦光华信息科技股份有限公司 网页结构化数据提取方法与系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183395A (zh) * 2007-12-25 2008-05-21 北京中企开源信息技术有限公司 一种实现动态页面静态化的方法和系统
CN101561802A (zh) * 2008-04-18 2009-10-21 上海复旦光华信息科技股份有限公司 网页结构化数据提取方法与系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855255A (zh) * 2011-06-30 2013-01-02 北京新媒传信科技有限公司 内容管理发布方法及系统
CN102855255B (zh) * 2011-06-30 2016-04-20 北京新媒传信科技有限公司 内容管理发布方法及系统
CN103092895A (zh) * 2011-11-08 2013-05-08 北大方正集团有限公司 静态页面的处理方法及装置
CN103092895B (zh) * 2011-11-08 2016-12-14 北大方正集团有限公司 静态页面的处理方法及装置
CN102346785A (zh) * 2011-11-15 2012-02-08 北京创腾科技有限公司 一种用于直接对数据库实现自定义字段的方法和装置
WO2015117268A1 (en) * 2014-02-07 2015-08-13 Google Inc. Arbitrary size content item generation
US11687707B2 (en) 2014-02-07 2023-06-27 Google Llc Arbitrary size content item generation
CN104052737A (zh) * 2014-05-19 2014-09-17 北京网康科技有限公司 一种网络数据报文的处理方法及装置
CN105282189A (zh) * 2014-06-10 2016-01-27 江苏大泰信息技术有限公司 一种应用于大并发量数据环境下的安全数据存储方法
CN105389317A (zh) * 2014-09-09 2016-03-09 阿里巴巴集团控股有限公司 网页功能实现方法及系统
CN106446063A (zh) * 2016-09-06 2017-02-22 深圳市牛商网络股份有限公司 一种网页更新的系统
CN107844493A (zh) * 2016-09-19 2018-03-27 上海泓智信息科技有限公司 一种文件关联方法及系统
CN107844493B (zh) * 2016-09-19 2020-12-29 博彦泓智科技(上海)有限公司 一种文件关联方法及系统
CN108153798A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 页面信息处理方法、装置及系统
CN107239557A (zh) * 2017-06-08 2017-10-10 腾讯科技(深圳)有限公司 一种网页建立方法、电子设备及存储介质
CN107239557B (zh) * 2017-06-08 2018-10-30 腾讯科技(深圳)有限公司 一种网页建立方法、电子设备及存储介质
CN108376153A (zh) * 2018-02-07 2018-08-07 厦门集微科技有限公司 一种网络页面制作方法及装置
CN110555159A (zh) * 2018-03-30 2019-12-10 北大方正集团有限公司 网页检索方法、装置、设备及存储介质
CN110597856A (zh) * 2019-08-20 2019-12-20 华能四川水电有限公司 一种流量深度解析数据的快速检索系统和方法
CN110597856B (zh) * 2019-08-20 2022-08-05 华能四川水电有限公司 一种流量深度解析数据的快速检索系统和方法
CN110516183A (zh) * 2019-08-30 2019-11-29 深圳点猫科技有限公司 静态网页的生成方法及装置
CN112632633A (zh) * 2020-12-17 2021-04-09 西安博达软件股份有限公司 Cms系统中基于文件水印的静态资源防篡改方法
CN112632633B (zh) * 2020-12-17 2021-11-09 西安博达软件股份有限公司 Cms系统中基于文件水印的静态资源防篡改方法

Also Published As

Publication number Publication date
CN101976261B (zh) 2012-04-18

Similar Documents

Publication Publication Date Title
CN101976261B (zh) 网页数据存储与搜索方法
Simon et al. Linked data annotation without the pointy brackets: Introducing Recogito 2
CN101984434A (zh) 基于可扩展语言查询的网页数据抽取方法
Baierer et al. DM2E: A linked data source of digitised manuscripts for the digital humanities
CN107748748B (zh) 水利水电技术标准全文检索系统
CN104090920A (zh) 一种实现数字内容跨终端出版的系统
CN101639840A (zh) 网络信息语义结构识别方法和装置
Sacks-Davis et al. Database systems for structured documents
Heese et al. One Click Annotation.
US20090265378A1 (en) Managing data systems to support semantic-independent schemas
Thuy et al. Exploiting XML schema for interpreting XML documents as RDF
Ensink et al. XML based adaptation of the composite approach for database integration
CN1326078C (zh) 包装器的生成方法
Kadam et al. A methodology for template extraction from heterogeneous web pages
Khan et al. Pipeline and deep learning approach for NLIDB: A comparative study
Kit et al. OLAP query processing for XML data in RDBMS
CN100338609C (zh) 包装器的维护方法
Shakya et al. StYLiD: Social Information Sharing with Free Creation of Structured Linked Data.
Horn et al. Hidden Markup–The Digital Work Environment of the Digital Dictionary of Surnames in Germany
CN106599265A (zh) 一种面向分片服务的多媒体书目数据组织系统与方法
Flesca et al. Schema-based Web wrapping
Gibson Using XSLT’s SQL Extension with Encyclopedia Virginia
Liu et al. Research and design on e-government information retrieval model
Guo The Construction of Buddhist History——Based on the General Buddhist Chronicles in Ancient China
Dudchuk et al. Ontos clip and share

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180822

Address after: 214437 room 1502, Xiangshan Road, Jiangyin, Wuxi, Jiangsu, 1502

Patentee after: Jiangsu comprehend information technology Co., Ltd.

Address before: 200120 room 1209, Zhang Yang Road, Pudong New Area, Shanghai, 1209

Patentee before: Shanghai Yinxingjie Information Technology Co., Ltd.

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Shanghai Yinxingjie Information Technology Co., Ltd.

Document name: Notification of Passing Examination on Formalities

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120418

Termination date: 20191104