CN114329158A - 基于内容生成的seo优化系统、方法、电子设备及存储介质 - Google Patents

基于内容生成的seo优化系统、方法、电子设备及存储介质 Download PDF

Info

Publication number
CN114329158A
CN114329158A CN202111488855.XA CN202111488855A CN114329158A CN 114329158 A CN114329158 A CN 114329158A CN 202111488855 A CN202111488855 A CN 202111488855A CN 114329158 A CN114329158 A CN 114329158A
Authority
CN
China
Prior art keywords
page
content
file
configuration
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111488855.XA
Other languages
English (en)
Inventor
范凌
王喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tezign Shanghai Information Technology Co Ltd
Original Assignee
Tezign Shanghai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tezign Shanghai Information Technology Co Ltd filed Critical Tezign Shanghai Information Technology Co Ltd
Priority to CN202111488855.XA priority Critical patent/CN114329158A/zh
Publication of CN114329158A publication Critical patent/CN114329158A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于内容生成的SEO优化系统、方法、电子设备及存储介质,所述基于内容生成的SEO优化方法包括:定期抓取页面内容,并根据页面路径将所述页面内容缓存至文件;判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。该基于内容生成的SEO优化方法改善了现有技术中单页面web应用内容无法被搜索引擎收录的问题。

Description

基于内容生成的SEO优化系统、方法、电子设备及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于内容生成的SEO优化系统、方法、电子设备及存储介质。
背景技术
对于互联网应用,进行适度的SEO(Search Engine Optimization,搜索引擎优化)优化非常重要,通过搜索引擎收录网站页面、关联关键词和提升网站搜索排名,从而使用户更容易发现该网站,增加产品的曝光率。
目前大多数前端项目使用单页面应用框架进行开发,需要在浏览器端运行完JS文件后才能完整展示出来,搜索引擎爬取页面只能得到一个空节点,无法收录页面内容。如果后期产品面临SEO搜索引擎优化的需求,常规的解决方案是改造成服务端渲染的方式,存在需要处理客户端和服务端不同的运行环境差异,项目改造难度大;请求页面时服务端需要动态拼接页面内容,增加了服务器压力。
发明内容
本发明的目的在于提供一种基于内容生成的SEO优化系统、方法、电子设备及存储介质,该基于内容生成的SEO优化方法能够解决现有技术中单页面web应用内容无法被搜索引擎收录的问题。
为了实现上述目的,本发明提供如下技术方案:
本发明实施例提供一种基于内容生成的SEO优化方法,所述方法具体包括:
定期抓取页面内容;
根据页面路径将所述页面内容缓存至文件;
判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步地,所述根据页面路径将所述页面内容缓存至以页面地址为名称的文件,包括:
读取配置文件并启动内容生成装置;
循环所述配置文件中的配置列表;
当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容,将所述页面内容同步写入以页面地址为名称的文件。
进一步地,所述循环所述配置文件中的配置列表,包括:
当所述配置列表中不存在配置项时,关闭所述内容生成装置。
进一步地,判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件,包括:
发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
进一步地,所述SEO优化方法还包括:
根据所述配置文件的更新频率,定期运行脚本获取最新的页面内容并更新对应路径下缓存的文件。
一种基于内容生成的SEO优化系统,包括;
抓取模块,用于定期抓取页面内容;
缓存模块,用于根据页面路径将所述页面内容缓存至文件;
控制模块,用于判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
进一步地,所述抓取模块进一步用于:
读取配置文件并启动内容生成装置;
循环所述配置文件中的配置列表;
当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容。
进一步地,所述控制模块进一步用于:
发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。
一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
本发明具有如下优点:
本发明中的基于内容生成的SEO优化方法,定期抓取页面内容,并根据页面路径将所述页面内容缓存至文件;判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。在不对原项目代码做任何改动的前提下,使用页面生成装置抓取完整的页面内容并缓存文件,在搜索引擎访问页面时返回对应的页面内容,在无需改造单页面应用的前提下满足对SEO的优化需求,缓存页面内容能显著减少服务器压力,同时设定合适的更新频率保证缓存页面内容的及时性;全程配置化且方案通用,可复用在不同的单页面应用项目中。在单页面web应用的前提下,低成本、低风险的满足搜索引擎收录网站内容;解决了现有技术中单页面web应用内容无法被搜索引擎收录的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于内容生成的SEO优化方法方法的流程图;
图2为本发明基于内容生成的SEO优化方法系统的框图;
图3为本发明提供的电子设备实体结构示意图。
附图标记说明
抓取模块10,缓存模块20,控制模块30,电子设备40,处理器401,存储器402,总线403。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
另外,术语“多个”的含义应为两个以及两个以上。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1为本发明基于内容生成的SEO优化方法方法实施例流程图,如图1所示,本发明实施例提供的一种基于内容生成的SEO优化方法方法,包括以下步骤:
S101,定期抓取页面内容;
具体的,在不对原项目代码做任何改动的前提下,定期抓取页面内容;
页面,是网站中的一页,通常是HTML格式(文件扩展名为.html或.htm或.asp或.aspx或.php或.jsp等)。页面通常用图像档来提供图画。页面要透过页面浏览器来阅读。
文字与图片是构成一个页面的两个最基本的元素。文字,就是页面的内容,图片,就是页面的美观。除此之外,页面的元素还包括动画、音乐、程序等等。
在页面上点击鼠标右键,选择菜单中的“查看源文件”,就可以通过记事本看到页面的实际内容。可以看到,页面实际上只是一个纯文本文件,它通过各式各样的标记对页面上的文字、图片、表格、声音等元素进行描述(例如字体、颜色、大小),而浏览器则对这些标记进行解释并生成页面,于是就得到你现在所看到的画面。为什么在源文件看不到任何图片?页面文件中存放的只是图片的链接位置,而图片文件与页面文件是互相独立存放的,甚至可以不在同一台计算机上。
通常我们看到的页面,都是以htm或html后缀结尾的文件,俗称HTML文件。不同的后缀,分别代表不同类型的页面文件,例如以CGI、ASP、PHP、JSP甚至其他更多。
设置定时任务,定期抓取页面并更新缓存文件。
S102,根据页面路径将所述页面内容缓存至文件;
具体的,读取配置文件并启动内容生成装置;用户配置文件就是在用户登录电脑时,或是用户在使用软件时,软件系统为用户所要加载所需环境的设置和文件的集合。它包括所有用户专用的配置设置,如程序项目、屏幕颜色、网络连接、打印机连接、鼠标设置及窗口的大小和位置等。
循环所述配置文件中的配置列表;
当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容,将所述页面内容同步写入以页面地址为名称的文件。
等待页面渲染完成的过程为:等待指定节点出现,用以判断页面是否已经渲染完成。
页面渲染都是浏览器的工作。浏览器有自己的渲染器,当浏览网页时,浏览器会加载HTML,CSS,JAVASCRIPT到本地,然后根据自己的渲染器渲染出页面效果,各个浏览器的渲染机制不完全相同,这也是同样的代码在不同浏览器有时会有不同的效果的原因。大致分为以下几步:
加载:根据请求的URL进行域名解析,向服务器发起请求,接收文件(HTML、JS、CSS、图象等)。
解析:对加载到的资源(HTML、JS、CSS等)进行语法解析,建议相应的内部数据结构(比如HTML的DOM树,JS的(对象)属性表,CSS的样式规则等等)。
渲染:构建渲染树,对各个元素进行位置计算、样式计算等等,然后根据渲染树对页面进行渲染(可以理解为“画”元素)。
这几个过程不是完全孤立的,会有交叉,比如HTML加载后就会进行解析,然后拉取HTML中指定的CSS、JS等。
当所述配置列表中不存在配置项时,关闭所述内容生成装置。
S103,判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件;
具体的,发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
所述SEO优化方法还包括:
根据所述配置文件的更新频率,定期运行脚本获取最新的页面内容并更新对应路径下缓存的文件。
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若否,返回单面应用的静态HTML文件。
该基于内容生成的SEO优化方法在无需改造单页面应用的前提下满足对SEO的优化需求,缓存页面内容能显著减少服务器压力,同时设定合适的更新频率保证缓存页面内容的及时性;全程配置化且方案通用,可复用在不同的单页面应用项目中。
图2为本发明基于内容生成的SEO优化系统实施例流程图,如图2所示,本发明实施例提供的一种基于内容生成的SEO优化方法系统,包括以下步骤:
抓取模块10,用于定期抓取页面内容;读取配置文件并启动内容生成装置;循环所述配置文件中的配置列表;当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容。
缓存模块20,用于根据页面路径将所述页面内容缓存至文件;将所述页面内容同步写入以页面地址为名称的文件。
控制模块30,用于判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
图3为本发明实施例提供的电子设备实体结构示意图,如图3所示,电子设备40包括:处理器401(processor)、存储器402(memory)和总线403;
其中,处理器401、存储器402通过总线403完成相互间的通信;
处理器401用于调用存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:定期抓取页面内容;根据页面路径将所述页面内容缓存至以页面地址为名称的文件;判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:定期抓取页面内容;根据页面路径将所述页面内容缓存至以页面地址为名称的文件;判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于内容生成的SEO优化方法,其特征在于,所述方法具体包括:
定期抓取页面内容;
根据页面路径将所述页面内容缓存至文件;
判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
2.根据权利要求1所述的基于内容生成的SEO优化方法,其特征在于,所述根据页面路径将所述页面内容缓存至以页面地址为名称的文件,包括:
读取配置文件并启动内容生成装置;
循环所述配置文件中的配置列表;
当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容,将所述页面内容同步写入以页面地址为名称的文件。
3.根据权利要求2所述的基于内容生成的SEO优化方法,其特征在于,所述循环所述配置文件中的配置列表,包括:
当所述配置列表中不存在配置项时,关闭所述内容生成装置。
4.根据权利要求1所述的基于内容生成的SEO优化方法,其特征在于,判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件,包括:
发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
5.根据权利要求2所述的基于内容生成的SEO优化方法,其特征在于,所述SEO优化方法还包括:
根据所述配置文件的更新频率,定期运行脚本获取最新的页面内容并更新对应路径下缓存的文件。
6.一种基于内容生成的SEO优化系统,其特征在于,包括;
抓取模块,用于定期抓取页面内容;
缓存模块,用于根据页面路径将所述页面内容缓存至文件;
控制模块,用于判断访问来源是否为搜索引擎,若是,返回对应页面路径下缓存的文件。
7.根据权利要求6所述的基于内容生成的SEO优化系统,其特征在于,所述抓取模块进一步用于:
读取配置文件并启动内容生成装置;
循环所述配置文件中的配置列表;
当所述配置列表中存在配置项时,访问配置项中指定的页面,等待页面渲染完成,读取所述页面内容。
8.根据权利要求6所述的基于内容生成的SEO优化系统,其特征在于,所述控制模块进一步用于:
发生页面请求;
根据所述页面请求头部中的用户代理字段信息判断访问来源是否为搜索引擎访问,若是,返回对应路径下缓存的文件。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中的任一项所述的方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中的任一项所述的方法的步骤。
CN202111488855.XA 2021-12-07 2021-12-07 基于内容生成的seo优化系统、方法、电子设备及存储介质 Pending CN114329158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111488855.XA CN114329158A (zh) 2021-12-07 2021-12-07 基于内容生成的seo优化系统、方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111488855.XA CN114329158A (zh) 2021-12-07 2021-12-07 基于内容生成的seo优化系统、方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114329158A true CN114329158A (zh) 2022-04-12

Family

ID=81047936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111488855.XA Pending CN114329158A (zh) 2021-12-07 2021-12-07 基于内容生成的seo优化系统、方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114329158A (zh)

Similar Documents

Publication Publication Date Title
CN100465956C (zh) 用于向网站添加个人化的值的系统、Web服务器和方法
CN106484383B (zh) 页面渲染方法、装置及设备
US8111944B2 (en) Method and system for optimizing web page images
US9436765B2 (en) System for deep linking and search engine support for web sites integrating third party application and components
EP2724251B1 (en) Methods for making ajax web applications bookmarkable and crawlable and devices thereof
US20130227398A1 (en) Page based navigation and presentation of web content
CN109684575A (zh) 网页数据的处理方法及装置、存储介质、计算机设备
US20080098300A1 (en) Method and system for extracting information from web pages
US20080244740A1 (en) Browser-independent editing of content
CN104426925B (zh) 网页资源获取方法及装置
CN107807937B (zh) 一种网站seo处理方法、装置及系统
JP2011003182A (ja) キーワード表示方法およびそのシステム
US20170270209A1 (en) User interface element for surfacing related results
EP3136656A1 (en) Information sharing method and device
CN102346738A (zh) 客制化网页处理装置及方法
CN106874271A (zh) 一种将pc网页转换为移动终端网页的方法及系统
WO2020082231A1 (en) Local secure rendering of web content
CN105528369B (zh) 网页转码方法、装置以及服务器
CN108595697A (zh) 网页集成方法、装置及系统
CN106886547A (zh) 一种脚本生成方法与装置
US20080065677A1 (en) Analyzing web site traffic
JP2011044116A (ja) 閲覧制御装置、閲覧制御方法および閲覧制御プログラム
CN111339456A (zh) 预加载方法和装置
CN113641924B (zh) 网页可交互时间点检测方法、装置、电子设备及存储介质
CN105183453B (zh) 基于网页的信息获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination