CN108255865B - php网站模板链接静态处理方法 - Google Patents

php网站模板链接静态处理方法 Download PDF

Info

Publication number
CN108255865B
CN108255865B CN201611248317.2A CN201611248317A CN108255865B CN 108255865 B CN108255865 B CN 108255865B CN 201611248317 A CN201611248317 A CN 201611248317A CN 108255865 B CN108255865 B CN 108255865B
Authority
CN
China
Prior art keywords
function
php
file
original page
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611248317.2A
Other languages
English (en)
Other versions
CN108255865A (zh
Inventor
王晋年
郑杰
萧畅成
黄井优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinars Geo Informatics Co ltd
Chinars Shenzhen Satellite Application Innovation Research Institute Co ltd
Chinars Guangdong Co ltd
Original Assignee
Chinars Geo Informatics Co ltd
Chinars Shenzhen Satellite Application Innovation Research Institute Co ltd
Chinars Guangdong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinars Geo Informatics Co ltd, Chinars Shenzhen Satellite Application Innovation Research Institute Co ltd, Chinars Guangdong Co ltd filed Critical Chinars Geo Informatics Co ltd
Priority to CN201611248317.2A priority Critical patent/CN108255865B/zh
Publication of CN108255865A publication Critical patent/CN108255865A/zh
Application granted granted Critical
Publication of CN108255865B publication Critical patent/CN108255865B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了php网站模板链接静态处理方法。该方法包括如下步骤:浏览器访问php网站;php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;若不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。本发明所述方法,可快速实现页面链接伪静态处理,且兼容各种php网站。

Description

php网站模板链接静态处理方法
技术领域
本发明涉及链接静态处理技术领域,具体涉及php网站模板链接静态处理方法。
背景技术
搜索引擎是互联网用户获取信息的一种占比非常大的工具。而搜索引擎收录的网站页面是通过百度爬虫进行抓取的,其抓取对象就是页面内的一个个静态链接。在网站页面链接不符合抓取规则时,网站就不会被收录,这在网站的营销推广方面就会是一个大大的阻碍。
目前,国内除了比较大型的网站外,其他很多中小型网站页面还是动态链接呈现的。这与繁多的开源框架以及程序员的技术水平有着很大的关系。特别是PHP语言开发网站,均追求快而忽略后期使用。这不仅仅给网站运营者带来推广的困扰,也让广大用户搜索信息时,存在局限。目前很多php开源框架都只针对自己的系统做模板链接静态处理,无法做到移植到其他不具备静态处理功能的网站系统上。
发明内容
基于此,本发明提供一种php网站模板链接静态处理方法,可快速实现页面链接伪静态处理,且兼容各种php网站。
为了实现本发明的目的,本发明采用以下技术方案:
一种php网站模板链接静态处理方法,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面;
浏览器访问php网站;
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
在其中一些实施例中,所述获取原页面内容的函数为php函数库里的file_get_contents()函数。
在其中一些实施例中,所述php网站系统的变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接。
在其中一些实施例中,所述伪静态重定向文件为.htaccess文件。
在其中一些实施例中,所述伪静态重定向文件根据正则替换链接函数进行编写。
在其中一些实施例中,所述正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换。
本发明所述php网站模板链接静态处理方法,利用,伪静态重定向规则通过php网站系统输出页面,截取网站内容,且获取完成链接,使用正则替换函数替换得到静态链接再输出,可快速地将动态链接替换成动态链接,方便搜索引擎抓取,有利于网站的营销推广;且针对php网站系统做静态处理,可兼容各种php网站,更加利于推广。
附图说明
图1是本发明实施例所述php网站模板链接静态处理方法的流程图。
具体实施方式
为了便于理解本发明,下面将结合附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例
请参照图1,本发明所述的php网站模板链接静态处理方法,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;获取原页面内容的函数为php函数库里的file_get_contents()函数。正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换。伪静态重定向文件为.htaccess文件,且伪静态重定向文件根据正则替换链接函数进行编写。
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面。
浏览器访问php网站。
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。其中,利用php网站系统的变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接。
以下将具体说明本发明所述的方案:
本方案共包含两个文件,将处理函数和逻辑业务集成在一个php文件中,此文件以下称静态处理文件;此外还需要一个伪静态重定向文件(.htaccess)。在静态处理文件中首先包含一个正则替换链接函数,此函数的实现主要是根据页面链接的规则写一套替换正则表达式,然后就是用php的替换函数予以替换;
在静态处理文件中需要一个获取原页面内容的函数,这里使用php函数库里的file_get_contents()函数;
file_get_contents()获取内容时,需要使用系统变量$_SERVER['HTTP_HOST']以及$_SERVER['REQUEST_URI']获取当前完整链接,而此时,还需要判断一下当前访问是浏览器访问的还是file_get_contents()函数访问的,以免访问进入死循环,此时,我的处理方法是在file_get_contents()访问内容时,在访问链接后面加上一个特殊参数。
用写好的正则替换函数替换file_get_contents()得到的内容,即可得到链接已经伪静态处理的页面。
.htaccess伪静态重定向规则编写时,根据正则替换函数编写即可。
使用时,将静态处理文件与伪静态重定向文件两个文件放在php网站系统入口文件的同级目录下,将静态处理文件用include()函数引入php网站系统入口文件的最前面。具体的实现流程如图1,浏览器访问php网站;php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;若不含有该特定参数,则php网站系统运行至获取原页面内容的函数时,该获取原页面内容的函数获取原页面内容,php网站系统获取原页面的完整链接,然后正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
本发明所述php网站模板链接静态处理方法,利用伪静态重定向规则通过php网站系统输出页面,截取网站内容,且获取完成链接,使用正则替换函数替换得到静态链接再输出,可快速地将动态链接替换成动态链接,方便搜索引擎抓取,有利于网站的营销推广;且针对php网站系统做静态处理,可兼容各种php网站,更加利于推广。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种php网站模板链接静态处理方法,其特征在于,包括如下步骤:
编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;所述正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换;所述特定参数用于表征当前的访问是通过获取原页面内容的函数执行的;
将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面;
浏览器访问php网站;
php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数,并通过该获取原页面内容的函数获取原页面内容时,php网站系统通过变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接,然后基于所述原页面的完整链接以及所述原页面内容,通过正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
2.根据权利要求1所述的php网站模板链接静态处理方法,其特征在于:所述获取原页面内容的函数为php函数库里的file_get_contents()函数。
3.根据权利要求1所述的php网站模板链接静态处理方法,其特征在于:所述伪静态重定向文件为.htaccess文件。
4.根据权利要求1或3所述的php网站模板链接静态处理方法,其特征在于:所述伪静态重定向文件根据正则替换链接函数进行编写。
5.一种php网站模板链接静态处理装置,其特征在于,所述装置包括:
编写模块,用于编写静态处理文件以及伪静态重定向文件,静态处理文件是将处理函数和逻辑业务集成在一个php文件中形成,且包含获取原页面内容的函数以及正则替换链接函数,所述获取原页面内容的函数的网址参数加入特定参数;所述正则替换链接函数是根据页面链接的规则编写的替换正则表达式,然后用php的替换函数予以替换;所述特定参数用于表征当前的访问是通过获取原页面内容的函数执行的;
处理模块,用于将静态处理文件与伪静态重定向文件放在php网站系统入口文件的同级目录下,并将静态处理文件用include()函数引入php网站系统入口文件的最前面;
访问模块,用于浏览器访问php网站;
重定向模块,用于php网站系统的伪静态重定向文件将网址重定向至php网站系统入口文件;
所述处理模块还用于php网站系统判断静态处理文件内的获取原页面内容的函数的网址参数是否含有所述的特定参数;如含有该特定参数,则php网站系统运行至获取原页面内容的函数时,返回伪静态重定向文件进行重定向;如不含有该特定参数,则php网站系统运行至获取原页面内容的函数,并通过该获取原页面内容的函数获取原页面内容时,php网站系统通过变量$_SERVER['HTTP_HOST']与$_SERVER['REQUEST_URI']获取原页面的完整链接,然后基于所述原页面的完整链接以及所述原页面内容,通过正则替换链接函数将获取原页面内容的函数获取的原页面内容进行替换,即得到链接已静态处理的页面。
6.根据权利要求5所述的php网站模板链接静态处理装置,其特征在于,所述获取原页面内容的函数为php函数库里的file_get_contents()函数。
7.根据权利要求5所述的php网站模板链接静态处理装置,其特征在于,所述伪静态重定向文件为.htaccess文件。
8.根据权利要求5或7所述的php网站模板链接静态处理装置,其特征在于,所述伪静态重定向文件根据正则替换链接函数进行编写。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN201611248317.2A 2016-12-29 2016-12-29 php网站模板链接静态处理方法 Expired - Fee Related CN108255865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611248317.2A CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611248317.2A CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Publications (2)

Publication Number Publication Date
CN108255865A CN108255865A (zh) 2018-07-06
CN108255865B true CN108255865B (zh) 2020-10-16

Family

ID=62721314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611248317.2A Expired - Fee Related CN108255865B (zh) 2016-12-29 2016-12-29 php网站模板链接静态处理方法

Country Status (1)

Country Link
CN (1) CN108255865B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
CN103064932A (zh) * 2012-12-24 2013-04-24 乐视网信息技术(北京)股份有限公司 一种静态化页面的处理系统和方法
CN104391868A (zh) * 2014-10-28 2015-03-04 用友优普信息技术有限公司 动态页面静态化的装置和方法
CN104866312A (zh) * 2015-05-22 2015-08-26 国云科技股份有限公司 一种基于asp点net的伪静态实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760162A (zh) * 2012-06-11 2012-10-31 北京搜狗信息服务有限公司 展现和获取下载链接的方法及装置
CN103064932A (zh) * 2012-12-24 2013-04-24 乐视网信息技术(北京)股份有限公司 一种静态化页面的处理系统和方法
CN104391868A (zh) * 2014-10-28 2015-03-04 用友优普信息技术有限公司 动态页面静态化的装置和方法
CN104866312A (zh) * 2015-05-22 2015-08-26 国云科技股份有限公司 一种基于asp点net的伪静态实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
三种实现PHP伪静态页面的方法_PHP教程;php中文网;《https://www.php.cn/php-weizijiaocheng-302524.html》;20160713;第1-5页 *
动态地址rewrite伪静态,然后301跳转到伪静态时死循环解决办法;smiling;《http://www.phpfensi.com/php/20131125/432.html》;20131125;第1-2页 *

Also Published As

Publication number Publication date
CN108255865A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
US20160239504A1 (en) Method for entity enrichment of digital content to enable advanced search functionality in content management systems
US9811321B1 (en) Script compilation
WO2021017735A1 (zh) 一种智能合约的形式化验证方法、电子装置及存储介质
CN109033403B (zh) 用于搜索区块链数据的方法、装置及存储介质
US20200142674A1 (en) Extracting web api endpoint data from source code
CN102857572A (zh) 一种http访问请求处理方法、装置及网关设备
CN109600385B (zh) 一种访问控制方法及装置
US11263062B2 (en) API mashup exploration and recommendation
WO2017063596A1 (zh) 一种处理网站地图的方法、装置及设备
CN107015986B (zh) 一种爬虫爬取网页的方法及装置
CN106599270B (zh) 网络数据抓取方法和爬虫
CN103294717B (zh) 一种基于双内核浏览器的网页打开方法和装置
CN112307292A (zh) 基于高级持续性威胁攻击的信息处理方法及系统
US9336316B2 (en) Image URL-based junk detection
CN103390129A (zh) 检测统一资源定位符安全性的方法和装置
US9015682B1 (en) Computer code transformations to create synthetic global scopes
CN105354490A (zh) 一种处理被劫持浏览器的方法及设备
KR20120071827A (ko) 악성코드 경유-유포지 탐지를 위한 씨드 정보 수집 장치 및 수집 방법
Aranda-Corral et al. Reconciling knowledge in social tagging web services
CN108255865B (zh) php网站模板链接静态处理方法
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
CN116451271A (zh) 一种应用软件的隐私政策自动提取方法
CN107784054B (zh) 一种页面发布方法和装置
US11250084B2 (en) Method and system for generating content from search results rendered by a search engine
CN111221841A (zh) 基于大数据的实时处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201016

CF01 Termination of patent right due to non-payment of annual fee