CN113835740A - 一种面向搜索引擎优化的前端代码自动修复方法 - Google Patents

一种面向搜索引擎优化的前端代码自动修复方法 Download PDF

Info

Publication number
CN113835740A
CN113835740A CN202111427350.2A CN202111427350A CN113835740A CN 113835740 A CN113835740 A CN 113835740A CN 202111427350 A CN202111427350 A CN 202111427350A CN 113835740 A CN113835740 A CN 113835740A
Authority
CN
China
Prior art keywords
file
search engine
files
optimization
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111427350.2A
Other languages
English (en)
Other versions
CN113835740B (zh
Inventor
王涛
朱春华
焦丽丽
李美洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jerei Digital Technology Co Ltd
Original Assignee
Shandong Jerei Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jerei Digital Technology Co Ltd filed Critical Shandong Jerei Digital Technology Co Ltd
Priority to CN202111427350.2A priority Critical patent/CN113835740B/zh
Publication of CN113835740A publication Critical patent/CN113835740A/zh
Application granted granted Critical
Publication of CN113835740B publication Critical patent/CN113835740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及新一代信息技术领域,具体是一种面向搜索引擎优化的前端代码自动修复方法,能够对网页地址中的静态资源进行分析,对HTML、CSS、JS不同语言的核心文件进行针对性修复、优化处理,使其满足搜索引擎优化标准,最终输出优化后的代码文件、修改记录以及预警日志。本发明可一站式解决前端三大语言的搜索引擎优化问题,将可通过编程语言解决的问题进行自动修复处理,减少人工成本的投入。

Description

一种面向搜索引擎优化的前端代码自动修复方法
技术领域
本发明涉及新一代信息技术领域,具体涉及一般编码、译码及代码转换。
背景技术
随着互联网的发展,网站数量数以亿计。面对互联网上急剧增加的信息,搜索引擎的出现为信息检索提供了极大的便利,所以,搜索引擎优化对网页的重要性不言而喻。
搜索引擎优化可以让网站被更多的用户搜索到,拥有更高的曝光率。尤其对于企业级网站来说,用户通过搜索相关关键字来访问站点,则此类用户是目标用户。只要加大网站建设力度,有利于用户的精准转化。
网页前端开发的三大基本语言包括:HTML、CSS和JavaScript。即,要完成网页的搜索引擎优化,核心便是完成这三大语言的优化。目前有不少线上工具可以完成上述三种语言的检测,修复语法错误、标签、属性、属性值错误,格式化,均是保证语言的正确、完整,简洁性,但并没有针对搜索引擎优化方面的处理,这部分可以提高网站整体质量的工作还是靠开发人员手动处理,所以最终网页的搜索引擎优化程度几乎取决于开发人员的优化意识和经验,巨大的代码量将不仅会增加很多人工成本,降低开发人员的工作效率,并且无法做到保证系统、全面的优化。
发明内容
为解决上述问题,本发明提供一种面向搜索引擎优化的前端代码自动修复方法,能够对网页地址中的静态资源进行分析,对HTML、CSS、JS不同语言的核心文件进行针对性修复、优化处理,使其满足搜索引擎优化标准,最终输出优化后的代码文件、修改记录以及预警日志。
为了实现上述发明目的,本发明采取如下技术方案:
一种面向搜索引擎优化的前端代码自动修复方法,适于在计算设备上运行,与现有技术不同的是,该方法包括:
步骤1:对需要优化的目标网页关联的所有静态资源进行访问,将HTML文件、CSS文件和JS文件记录到拟进行优化的数组中,将丢失或异常的资源记录到禁止引用的数组中并抛出丢失预警;
步骤2:对经过步骤1得到的拟进行优化的文件进行分类汇总,按照HTML文件、CSS层叠样式表、JS脚本文件的类别顺序进行分组,形成待处理队列,等待执行不同校验修复程序;
步骤3:对HTML文件进行校验修复,遍历解析HTML代码,补齐缺失的HTML标签,对存在层级关系的标签进行遍历校验,删除层级关系错误的节点,替换为基础容器标签,将未按照SEO优化标准的部分进行优化;
步骤4:对CSS层叠样式表文件进行校验,完成CSS浏览器私有属性的补充,将HTML中的CSS样式移植到CSS文件中,通过提高加载速度的方式,进一步提升搜索引擎优化程度;
步骤5:对JS脚本文件进行监听,添加容错及预警机制;
步骤6:将使用过程中的所有异常进行汇总,记录抛出异常的文件,行号,预警类别,建议处理方式,最终输出到本地;
步骤7:将修复后的文件替换原文件,并按照原始目录结构输出,方便开发人员进行复查和替换;
步骤8:将使用过程中的所有操作记录进行汇总,记录修复的文件、行号、修复内容、修复类别,最终输出到本地。
进一步地,步骤3中的将未按照SEO优化标准的部分进行优化具体是:
3-1、将非标准的标签进行替换,将淘汰的标签进行剔除,删除用于修改样式的标签,校验纯文本,使其包裹在文本标签中;
3-2、判断TDK的完整性,若缺失或不完整,抛出预警;
3-3、h1标签出现频率控制在1次,多余标签进行删除;
3-4、对图片、音频这类的资源型标签进行遍历,结合上下文,补充缺失的title属性,并抛出预警;
3-5、剔除与步骤1中的禁止引用数组重合的资源调用;
3-6、对a链接进行遍历,保证a链接的出现形式是http://域名/固定链接/,补充缺失的title属性,抛出预警;对无链接,指向本页面的链接添加nofollow属性。
进一步地,步骤6中的预警类别包括人工干预、预警和优化。
进一步地,步骤8中的修复类别包括标签替换、标签删除、属性添加、属性删除、兼容处理和监听容错。
与现有技术相比,本发明的有益效果在于:
本发明不局限于进行简单地代码标签修复,只保证代码正确的网页已无法在日渐繁荣的互联网领域中占据优势,本发明将核心功能放在能够显著提升网站质量的搜索引擎优化方面,整体提升网站质量。
本发明可一站式解决前端三大语言的搜索引擎优化问题,将可通过编程语言解决的问题进行自动修复处理,减少人工成本的投入。
本发明对非错误型问题进行提示,对需要人工处理的问题进行预警,分级别输出处理结果,给开发人员提供最直接的修改参考和指引建议;对修复的问题进行记录,优化点可视化展示,多维度展示代码修复过程。
处理后的文件下载到本机,仿原网址的目录结构,方便进行文件替换。
具体实施方式
下面通过具体实施例,对本发明进一步详细说明。以下实施例用于说明本发明,但不能用来限制本发明。
步骤1:对需要优化的目标网页关联的所有静态资源进行访问,将HTML文件,CSS文件,JS文件记录到可进行优化的数组中。
通过对资源进行请求response=requests.get(url,params=headers),获得请求状态:
若response.status_code!=200,说明静态文件可能存在丢失或异常的情况;
若response.status_code==404,说明存在异常的资源记录,将该资源记录到禁止引用的数组中,并抛出丢失预警。
步骤2:通过正则匹配文件类型:
html_name_model = '.*/(.*
Figure 161082DEST_PATH_IMAGE001
).html';
css_name_model = '.*/(.*
Figure 359982DEST_PATH_IMAGE001
).css';
js_name_model = '.*/(.*
Figure 91178DEST_PATH_IMAGE001
).js';
将HTML文件、CSS层叠样式表、JS脚本文件按照类别进行分组,形成待处理队列,等待执行不同校验修复程序。
步骤3:对HTML文件进行校验修复,遍历解析HTML代码,补齐缺失的HTML标签,基本规则为:
"<tag>内容</tag>"为正常标签;
"<tag/>"为正常标签;
"<tag>内容"为异常标签,缺失关闭标签;
"内容</tag>"为异常标签,缺失开始标签;
对存在层级关系的标签进行遍历校验,删除层级关系错误的节点,替换为基础容器标签。
将未按照SEO优化标准的部分进行优化。
3-1、将非标准的标签进行替换,删除用于修改样式的标签,例如已经淘汰的<br><hr><font><b><u><i><s>;校验纯文本,使其包裹在文本标签中,如<span></span>,<p></p>。
3-2、TDK完整性判断,TDK应包含:
<title>网站SEO标题</title>
<meta name="description" content="网站描述" />
<meta name="keywords" content="网站关键词" />
获取TDK信息:
title = PyQuery(req.text)('title').text();
keywords = PyQuery(req.text)('[name=keywords]').attr('content');
description = PyQuery(req.text)('[name=description]').attr('content');
若缺失或不完整,抛出预警。
3-3、获取H1标签信息:h1 = req('h1'),控制出现频率控制在1次,多余标签进行删除,并抛出预警。
3-4、对图片、音频类的资源型标签进行遍历,结合上下文,通过.attr(title,value)补充缺失的title属性,并抛出预警。
3-5、剔除与步骤1中的禁止引用数组重合的资源调用。
3-6、对a链接进行匹配遍历:preg_match_all('/href="(.*
Figure 84541DEST_PATH_IMAGE001
)"/', $html,$matches),保证a链接的出现形式应该是http://域名/固定链接/,补充缺失的title属性,抛出预警,对无链接,指向本页面的链接,跳出站外的链接(!strstr($matches[0][$i], 'rel='))添加rel="nofollow"属性;
$ori = $matches[0][$i];
$matches[0][$i] = str_replace('href', 'rel="nofollow" href', $matches[0][$i]);
$html = str_replace($ori, $matches[0][$i], $html)。
步骤4:对CSS层叠样式表文件进行校验,补充CSS浏览器私有属性,添加代表各个浏览器的私有前缀,如-moz代表firefox浏览器私有属性,-ms代表IE浏览器私有属性,-webkit代表chrome、safari私有属性,-o代表opera私有属性。并保证兼容写法在前,标准写法在后。通过PyQuery(req.text)('style')的方法将HTML中的CSS样式移植到CSS文件中,通过提高加载速度的方式,进一步提升搜索引擎优化程度。
步骤5:通过window的error事件,监听静态资源加载出错或者JS文件执行过程中的错误;使用unhandledrejection事件进行Promise异常捕获。
步骤6:创建异常问题汇总文件:
errorFile = xlwt.Workbook();
errorSheet = errorFile.add_sheet('异常问题汇总');
file_name = '{}.xls'.format('异常问题汇总'); save(file_name)。
将使用过程中的所有异常进行汇总,记录抛出异常的文件,行号,预警类别(人工干预、预警、优化),建议处理方式,最终输出到本地。
步骤7:将修复后的文件替换原文件,并通过urllib.request.urlretrieve方法将修复后的文件按照原始目录结构输出,方便开发人员进行复查和替换。
步骤8:同步骤6的操作,将使用过程中的所有操作记录进行汇总,记录修复的文件、行号、修复内容、修复类别(标签替换、标签删除、属性添加、属性删除、兼容处理、监听容错),最终输出到本地。
以上实施例仅为本发明的技术方案而非对其限制,应当指出,对于本技术领域的技术人员来说,在不脱离本发明技术原理的前提下,还可以对本发明的具体实施方式进行修改或等同替换,而未脱离本发明精神和范围的任何修改或等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种面向搜索引擎优化的前端代码自动修复方法,适于在计算设备上运行,其特征在于,该方法包括:
步骤1:对需要优化的目标网页关联的所有静态资源进行访问,将HTML文件、CSS文件和JS文件记录到拟进行优化的数组中,将丢失或异常的资源记录到禁止引用的数组中并抛出丢失预警;
步骤2:对经过步骤1得到的拟进行优化的文件进行分类汇总,按照HTML文件、CSS层叠样式表、JS脚本文件的类别顺序进行分组,形成待处理队列,等待执行不同校验修复程序;
步骤3:对HTML文件进行校验修复:遍历解析HTML代码,补齐缺失的HTML标签,对存在层级关系的标签进行遍历校验,删除层级关系错误的节点,替换为基础容器标签,将未按照SEO优化标准的部分进行优化;
步骤4:对CSS层叠样式表文件进行校验,完成CSS浏览器私有属性的补充,将HTML中的CSS样式移植到CSS文件中,通过提升加载速度的方式,提高用户体验,有利于搜索引擎优化;
步骤5:对JS脚本文件进行监听,添加容错及预警机制;
步骤6:将修复过程中的所有异常进行汇总,记录抛出异常的文件,行号,预警类别,建议处理方式,最终输出到本地;
步骤7:将修复后的文件替换原文件,并按照原始目录结构输出,方便开发人员进行复查和替换;
步骤8:将使用过程中的所有操作记录进行汇总,记录修复的文件、行号、修复内容、修复类别,最终输出到本地。
2.根据权利要求1所述的一种面向搜索引擎优化的前端代码自动修复方法,其特征在于,步骤3中的将未按照SEO优化标准的部分进行优化具体是:
3-1、将非标准的标签进行替换,将淘汰的标签进行剔除,删除用于修改样式的标签,校验纯文本,使其包裹在文本标签中;
3-2、判断TDK的完整性,若缺失或不完整,抛出预警;
3-3、H1标签出现频率控制在1次,多余标签进行删除;
3-4、对图片、音频类的资源型标签进行遍历,结合上下文,补充缺失的title属性,并抛出预警;
3-5、剔除与步骤1中的禁止引用数组重合的资源调用;
3-6、对a链接进行遍历,保证a链接的出现形式是http://域名/固定链接/,补充缺失的title属性,抛出预警;对无链接,指向本页面的链接添加nofollow属性。
3.根据权利要求1所述的一种面向搜索引擎优化的前端代码自动修复方法,其特征在于,步骤6中的预警类别包括人工干预、预警和优化。
4.根据权利要求1所述的一种面向搜索引擎优化的前端代码自动修复方法,其特征在于,步骤8中的修复类别包括标签替换、标签删除、属性添加、属性删除、兼容处理和监听容错。
CN202111427350.2A 2021-11-29 2021-11-29 一种面向搜索引擎优化的前端代码自动修复方法 Active CN113835740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111427350.2A CN113835740B (zh) 2021-11-29 2021-11-29 一种面向搜索引擎优化的前端代码自动修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111427350.2A CN113835740B (zh) 2021-11-29 2021-11-29 一种面向搜索引擎优化的前端代码自动修复方法

Publications (2)

Publication Number Publication Date
CN113835740A true CN113835740A (zh) 2021-12-24
CN113835740B CN113835740B (zh) 2022-02-22

Family

ID=78971807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111427350.2A Active CN113835740B (zh) 2021-11-29 2021-11-29 一种面向搜索引擎优化的前端代码自动修复方法

Country Status (1)

Country Link
CN (1) CN113835740B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117194410A (zh) * 2023-07-13 2023-12-08 广州白码科技有限公司 一种人工智能语言模型生成业务报表的方法及系统

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007076455A2 (en) * 2005-12-22 2007-07-05 Toppenberg Larry W Web page optimization systems
CN103838797A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种移动搜索引擎优化方法
CN105095260A (zh) * 2014-05-08 2015-11-25 广州爱九游信息技术有限公司 针对搜索引擎优化的网页处理方法及装置
CN105224314A (zh) * 2015-09-09 2016-01-06 北京思特奇信息技术股份有限公司 一种实现前端代码自动优化的方法及系统
US20160162596A1 (en) * 2014-09-05 2016-06-09 Hamlet Francisco Batista Reyes System and Method for Real-time Search Engine Optimization Issue Detection and Correction
CN105930442A (zh) * 2016-04-19 2016-09-07 广州天趣网络科技有限公司 一种基于统计计算的网站搜索引擎优化方法及系统
CN107577465A (zh) * 2017-09-21 2018-01-12 国云科技股份有限公司 一种网页代码的校正方法
CN107766532A (zh) * 2017-10-27 2018-03-06 深圳市行云易通科技有限公司 一种前端Node.js自动化正静态方法
US20180165364A1 (en) * 2016-12-08 2018-06-14 MetaSense Digital Marketing Management Inc. Content Validation And Coding For Search Engine Optimization
CN108491459A (zh) * 2018-03-05 2018-09-04 中国人民解放军国防科技大学 一种软件代码摘要自动生成模型的优化方法
CN108984801A (zh) * 2018-08-22 2018-12-11 百卓网络科技有限公司 一种基于html标签识别异步加载内容的搜索引擎优化方法
CN109032949A (zh) * 2018-08-02 2018-12-18 郑州悉知信息科技股份有限公司 一种前端代码质量检测方法及装置
CN109359253A (zh) * 2018-08-29 2019-02-19 浙江工业大学 一种Web前端性能优化方法
CN110045950A (zh) * 2019-02-26 2019-07-23 中科遥感(深圳)卫星应用创新研究院有限公司 基于nodejs的静态页面开发脚手架方法
CN110069736A (zh) * 2019-04-18 2019-07-30 中国联合网络通信集团有限公司 页面加载方法及设备
US20190340212A1 (en) * 2018-05-04 2019-11-07 Siteimprove A/S Dynamic content modifications
US20190370350A1 (en) * 2018-05-31 2019-12-05 Brightedge Technologies, Inc. Dynamic Configurability of Web Pages
WO2020014087A1 (en) * 2018-07-07 2020-01-16 Brightedge Technologies, Inc. System and method for taxonomic analysis of a website
CN112434240A (zh) * 2020-12-18 2021-03-02 苏州工业园区晨光科技有限公司 一种seo智能优化排名和查询算法

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007076455A2 (en) * 2005-12-22 2007-07-05 Toppenberg Larry W Web page optimization systems
US20070168465A1 (en) * 2005-12-22 2007-07-19 Toppenberg Larry W Web Page Optimization Systems
CN103838797A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种移动搜索引擎优化方法
CN105095260A (zh) * 2014-05-08 2015-11-25 广州爱九游信息技术有限公司 针对搜索引擎优化的网页处理方法及装置
US20160162596A1 (en) * 2014-09-05 2016-06-09 Hamlet Francisco Batista Reyes System and Method for Real-time Search Engine Optimization Issue Detection and Correction
CN105224314A (zh) * 2015-09-09 2016-01-06 北京思特奇信息技术股份有限公司 一种实现前端代码自动优化的方法及系统
CN105930442A (zh) * 2016-04-19 2016-09-07 广州天趣网络科技有限公司 一种基于统计计算的网站搜索引擎优化方法及系统
US20180165364A1 (en) * 2016-12-08 2018-06-14 MetaSense Digital Marketing Management Inc. Content Validation And Coding For Search Engine Optimization
CN107577465A (zh) * 2017-09-21 2018-01-12 国云科技股份有限公司 一种网页代码的校正方法
CN107766532A (zh) * 2017-10-27 2018-03-06 深圳市行云易通科技有限公司 一种前端Node.js自动化正静态方法
CN108491459A (zh) * 2018-03-05 2018-09-04 中国人民解放军国防科技大学 一种软件代码摘要自动生成模型的优化方法
US20190340212A1 (en) * 2018-05-04 2019-11-07 Siteimprove A/S Dynamic content modifications
US20190370350A1 (en) * 2018-05-31 2019-12-05 Brightedge Technologies, Inc. Dynamic Configurability of Web Pages
WO2020014087A1 (en) * 2018-07-07 2020-01-16 Brightedge Technologies, Inc. System and method for taxonomic analysis of a website
CN109032949A (zh) * 2018-08-02 2018-12-18 郑州悉知信息科技股份有限公司 一种前端代码质量检测方法及装置
CN108984801A (zh) * 2018-08-22 2018-12-11 百卓网络科技有限公司 一种基于html标签识别异步加载内容的搜索引擎优化方法
CN109359253A (zh) * 2018-08-29 2019-02-19 浙江工业大学 一种Web前端性能优化方法
CN110045950A (zh) * 2019-02-26 2019-07-23 中科遥感(深圳)卫星应用创新研究院有限公司 基于nodejs的静态页面开发脚手架方法
CN110069736A (zh) * 2019-04-18 2019-07-30 中国联合网络通信集团有限公司 页面加载方法及设备
CN112434240A (zh) * 2020-12-18 2021-03-02 苏州工业园区晨光科技有限公司 一种seo智能优化排名和查询算法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHENGLING ZHAO 等: "Application and Research of SEO in the Development of Web2.0 Site", 《2009 SECOND INTERNATIONAL SYMPOSIUM ON KNOWLEDGE ACQUISITION AND MODELING》 *
JING SHI 等: "Research on SEO strategies of university journal websites", 《THE 2ND INTERNATIONAL CONFERENCE ON INFORMATION SCIENCE AND ENGINEERING》 *
李观金: "基于SEO的代码优化策略", 《科技向导》 *
邹锋: "浅谈网站的优化", 《硅谷》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117194410A (zh) * 2023-07-13 2023-12-08 广州白码科技有限公司 一种人工智能语言模型生成业务报表的方法及系统
CN117194410B (zh) * 2023-07-13 2024-05-14 广州白码科技有限公司 一种人工智能语言模型生成业务报表的方法及系统

Also Published As

Publication number Publication date
CN113835740B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
US9858270B2 (en) Converting data into natural language form
US7694282B2 (en) Mapping breakpoints between web based documents
US7844899B2 (en) Citation processing system with multiple rule set engine
US9304993B2 (en) Methods and data structures for multiple combined improved searchable formatted documents including citation and corpus generation
US20050289446A1 (en) System and method for management of document cross-reference links
US10372792B2 (en) Document transformation performance via incremental fragment transformations
JP2011505605A (ja) ウェブドキュメントセット自動編集システム及びその方法
US20100325539A1 (en) Web based spell check
CN113835740B (zh) 一种面向搜索引擎优化的前端代码自动修复方法
CN111695076A (zh) 基于超文本5的跨浏览器网页兼容标准构建方法
Thomas et al. Mining unstructured software repositories
US20120173508A1 (en) Methods and Systems for a Semantic Search Engine for Finding, Aggregating and Providing Comments
CN103530430A (zh) 一种含格式的html富文本数据的跨标签处理方法及系统
US11861321B1 (en) Systems and methods for structure discovery and structure-based analysis in natural language processing models
CN111813443B (zh) 一种用JavaFX进行代码样例自动填充的方法和工具
CN110188291B (zh) 基于代理日志的文档处理
CN101630315A (zh) 一种快速检索方法及系统
CN114491206A (zh) 一种用于新闻博客类网站的通用低代码爬虫方法及系统
CN113032279A (zh) 一种基于语义路径搜索的Web应用测试修复方法
CN113448563B (zh) 一种LaTeX在线协作平台
US20220269706A1 (en) Methods and systems to parse a software component search query to enable multi entity search
CN113032280A (zh) 基于GUI元素相似度计算的Web应用测试修复方法
CN111966881A (zh) 一种网页信息提取方法及系统、电子设备
CN110837614A (zh) 一种高效地生成网页信息抽取规则的方法及系统
Kuć Solr Cookbook

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant