CN108255865A - php网站模板链接静态处理方法 - Google Patents

php网站模板链接静态处理方法 Download PDF

Info

Publication number
CN108255865A
CN108255865A CN201611248317.2A CN201611248317A CN108255865A CN 108255865 A CN108255865 A CN 108255865A CN 201611248317 A CN201611248317 A CN 201611248317A CN 108255865 A CN108255865 A CN 108255865A
Authority
CN
China
Prior art keywords
php
function
link
pages
static
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611248317.2A
Other languages
English (en)
Other versions
CN108255865B (zh
Inventor
王晋年
郑杰
萧畅成
黄井优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy Of Remote Sensing (shenzhen) Satellite Application Innovation Research Institute Ltd
Zhongke Remote Sensing Science And Technology Group Co Ltd
GUANGDONG CHINARSGEOINORMATICS TECHNOLOGY Co Ltd
Original Assignee
China Academy Of Remote Sensing (shenzhen) Satellite Application Innovation Research Institute Ltd
Zhongke Remote Sensing Science And Technology Group Co Ltd
GUANGDONG CHINARSGEOINORMATICS TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy Of Remote Sensing (shenzhen) Satellite Application Innovation Research Institute Ltd, Zhongke Remote Sensing Science And Technology Group Co Ltd, GUANGDONG CHINARSGEOINORMATICS TECHNOLOGY Co Ltd filed Critical China Academy Of Remote Sensing (shenzhen) Satellite Application Innovation Research Institute Ltd
Priority to CN201611248317.2A priority Critical patent/CN108255865B/zh
Publication of CN108255865A publication Critical patent/CN108255865A/zh
Application granted granted Critical
Publication of CN108255865B publication Critical patent/CN108255865B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了php网站模板链接静态处理方法。该方法包括如下步骤:浏览器访问php网站;php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;若不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。本发明所述方法,可快速实现页面链接伪静态处理,且兼容各种php网站。

Description

php网站模板链接静态处理方法
技术领域
本发明涉及链接静态处理技术领域,具体涉及php网站模板链接静态处理方法。
背景技术
搜索引擎是互联网用户获取信息的一种占比非常大的工具。而搜索引擎收录的网站页面是通过百度爬虫进行抓取的,其抓取对象就是页面内的一个个静态链接。在网站页面链接不符合抓取规则时,网站就不会被收录,这在网站的营销推广方面就会是一个大大的阻碍。
目前,国内除了比较大型的网站外,其他很多中小型网站页面还是动态链接呈现的。这与繁多的开源框架以及程序员的技术水平有着很大的关系。特别是PHP语言开发网站,均追求快而忽略后期使用。这不仅仅给网站运营者带来推广的困扰,也让广大用户搜索信息时,存在局限。目前很多php开源框架都只针对自己的系统做模板链接静态处理,无法做到移植到其他不具备静态处理功能的网站系统上。
发明内容
基于此,本发明提供一种php网站模板链接静态处理方法,可快速实现页面链接伪静态处理,且兼容各种php网站。
为了实现本发明的目的,本发明采用以下技术方案:
一种php网站模板链接静态处理方法,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面;
浏览器访问php网站;
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
在其中一些实施例中,所述获取原页面内容的函数为php函数库里的file_get_contents()函数。
在其中一些实施例中,所述php网站系统的变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接。
在其中一些实施例中,所述伪静态重定向文件为.htaccess文件。
在其中一些实施例中,所述伪静态重定向文件根据正则替换链接函数进行编写。
在其中一些实施例中,所述正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换。
本发明所述php网站模板链接静态处理方法,利用,伪静态重定向规则通过php网站系统输出页面,截取网站内容,且获取完成链接,使用正则替换函数替换得到静态链接再输出,可快速地将动态链接替换成动态链接,方便搜索引擎抓取,有利于网站的营销推广;且针对php网站系统做静态处理,可兼容各种php网站,更加利于推广。
附图说明
图1是本发明实施例所述php网站模板链接静态处理方法的流程图。
具体实施方式
为了便于理解本发明,下面将结合附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例
请参照图1,本发明所述的php网站模板链接静态处理方法,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;获取原页面内容的函数为php函数库里的file_get_contents()函数。正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换。伪静态重定向文件为.htaccess文件,且伪静态重定向文件根据正则替换链接函数进行编写。
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面。
浏览器访问php网站。
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。其中,利用php网站系统的变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接。
以下将具体说明本发明所述的方案:
本方案共包含两个文件,将处理函数和逻辑业务集成在一个php文件中,此文件以下称静态处理文件;此外还需要一个伪静态重定向文件(.htaccess)。在静态处理文件中首先包含一个正则替换链接函数,此函数的实现主要是根据页面链接的规则写一套替换正则表达式,然后就是用php的替换函数予以替换;
在静态处理文件中需要一个获取原页面内容的函数,这里使用php函数库里的file_get_contents()函数;
file_get_contents()获取内容时,需要使用系统变量$_SERVER['HTTP_HOST']以及$_SERVER['REQUEST_URI']获取当前完整链接,而此时,还需要判断一下当前访问是浏览器访问的还是file_get_contents()函数访问的,以免访问进入死循环,此时,我的处理方法是在file_get_contents()访问内容时,在访问链接后面加上一个特殊参数。
用写好的正则替换函数替换file_get_contents()得到的内容,即可得到链接已经伪静态处理的页面。
.htaccess伪静态重定向规则编写时,根据正则替换函数编写即可。
使用时,将静态处理文件与伪静态重定向文件两个文件放在php网站系统入口文件的同级目录下,将静态处理文件用include()函数引入php网站系统入口文件的最前面。具体的实现流程如图1,浏览器访问php网站;php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;若不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
本发明所述php网站模板链接静态处理方法,利用伪静态重定向规则通过php网站系统输出页面,截取网站内容,且获取完成链接,使用正则替换函数替换得到静态链接再输出,可快速地将动态链接替换成动态链接,方便搜索引擎抓取,有利于网站的营销推广;且针对php网站系统做静态处理,可兼容各种php网站,更加利于推广。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种php网站模板链接静态处理方法,其特征在于,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面;
浏览器访问php网站;
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
2.根据权利要求1所述的php网站模板链接静态处理方法,其特征在于:所述获取原页面内容的函数为php函数库里的file_get_contents()函数。
3.根据权利要求2所述的php网站模板链接静态处理方法,其特征在于:所述php网站系统的变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接。
4.根据权利要求1所述的php网站模板链接静态处理方法,其特征在于:所述伪静态重定向文件为.htaccess文件。
5.根据权利要求1或4所述的php网站模板链接静态处理方法,其特征在于:所述伪静态重定向文件根据正则替换链接函数进行编写。
6.根据权利要求1所述的php网站模板链接静态处理方法,其特征在于:所述正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换。
CN201611248317.2A 2016-12-29 2016-12-29 php网站模板链接静态处理方法 Expired - Fee Related CN108255865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611248317.2A CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611248317.2A CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Publications (2)

Publication Number Publication Date
CN108255865A true CN108255865A (zh) 2018-07-06
CN108255865B CN108255865B (zh) 2020-10-16

Family

ID=62721314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611248317.2A Expired - Fee Related CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Country Status (1)

Country Link
CN (1) CN108255865B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
CN103064932A (zh) * 2012-12-24 2013-04-24 乐视网信息技术(北京)股份有限公司 一种静态化页面的处理系统和方法
CN104391868A (zh) * 2014-10-28 2015-03-04 用友优普信息技术有限公司 动态页面静态化的装置和方法
CN104866312A (zh) * 2015-05-22 2015-08-26 国云科技股份有限公司 一种基于asp点net的伪静态实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
CN103064932A (zh) * 2012-12-24 2013-04-24 乐视网信息技术(北京)股份有限公司 一种静态化页面的处理系统和方法
CN104391868A (zh) * 2014-10-28 2015-03-04 用友优普信息技术有限公司 动态页面静态化的装置和方法
CN104866312A (zh) * 2015-05-22 2015-08-26 国云科技股份有限公司 一种基于asp点net的伪静态实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PHP中文网: "三种实现PHP伪静态页面的方法_PHP教程", 《HTTPS://WWW.PHP.CN/PHP-WEIZIJIAOCHENG-302524.HTML》 *
SMILING: "动态地址rewrite伪静态,然后301跳转到伪静态时死循环解决办法", 《HTTP://WWW.PHPFENSI.COM/PHP/20131125/432.HTML》 *

Also Published As

Publication number Publication date
CN108255865B (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN101035128B (zh) 基于中文标点符号的三重网页文本内容识别及过滤方法
CN109033403B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN104750704B (zh) 一种网页url地址分类识别方法及装置
CN109033406B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN102710795B (zh) 热点聚合方法及装置
CN102662965A (zh) 一种自动发现互联网热点新闻主题的方法及系统
CN109101607B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN107590145A (zh) 一种页面静态资源的处理方法和装置
CN102486799A (zh) 一种环球信息网www页面处理方法和装置
CN103514189A (zh) 一种基于搜索引擎的网络爬虫的实现方法
CN107145497A (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
Ahvazi et al. Introduce some of the medicinal plants species with the most traditional usage in East Mazandaran region.
Devi et al. An efficient approach for web indexing of big data through hyperlinks in web crawling
CN110472165A (zh) Url提取方法、装置、设备及计算机可读存储介质
CN106933864A (zh) 一种搜索引擎系统及其搜索方法
CN102222095A (zh) 一种用于对待显示的页面进行转换处理的设备及其方法
CN101017490A (zh) 自动下载和过滤网页的系统及方法
CN104008213A (zh) 一种网页信息更新发现与统计的方法和装置
CN108255865A (zh) php网站模板链接静态处理方法
US20090182759A1 (en) Extracting entities from a web page
CN103383697B (zh) 确定对象标题的对象表征信息的方法与设备
CN106339381A (zh) 一种信息处理方法及装置
CN109299423A (zh) 一种获取网络数据的方法
Lei et al. Design and implementation of an automatic scanning tool of SQL injection vulnerability based on Web crawler
CN104636446B (zh) 一种基于云计算模式的遗产Web应用移动版转化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201016