CN116389572B - 一种基于浏览器的网站下载重定向方法和系统 - Google Patents

一种基于浏览器的网站下载重定向方法和系统 Download PDF

Info

Publication number
CN116389572B
CN116389572B CN202310220066.0A CN202310220066A CN116389572B CN 116389572 B CN116389572 B CN 116389572B CN 202310220066 A CN202310220066 A CN 202310220066A CN 116389572 B CN116389572 B CN 116389572B
Authority
CN
China
Prior art keywords
user
browser
server
redirection
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310220066.0A
Other languages
English (en)
Other versions
CN116389572A (zh
Inventor
许祯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Star Hangzhou Technology Co ltd
Original Assignee
Digital Star Hangzhou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Star Hangzhou Technology Co ltd filed Critical Digital Star Hangzhou Technology Co ltd
Priority to CN202310220066.0A priority Critical patent/CN116389572B/zh
Publication of CN116389572A publication Critical patent/CN116389572A/zh
Application granted granted Critical
Publication of CN116389572B publication Critical patent/CN116389572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/148Migration or transfer of sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出了一种基于浏览器的网站下载重定向方法和系统。用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求。通过重定向技术可以统一网站的权重,避免网站的权重分散,规范URL网址,提高用户检索信息的快速性与准确度,保障数据获取过程的流畅性,减少延时,可以保障在网站改版完成后向将新版上线,在线上保持一段时间新旧内容共存,降低网站改版带来的流量损失。

Description

一种基于浏览器的网站下载重定向方法和系统
技术领域
本发明提出了一种基于浏览器的网站下载重定向方法和系统,属于互联网技术领域。
背景技术
重定向是一种技术,它可以将用户的请求从一个网页跳转到另一个网页。重定向可以使用户更快捷的找到所需的信息,也可以避免搜索引擎索引不到某些页面,从而使网站更加的高效。常用的重定向方式有:301redirect、302redirect与meta fresh。
301redirect
301代表永久性转移(Permanently Moved),301重定向是网页更改地址后对搜索引擎友好的最好方法,只要不是暂时搬移的情况,都建议使用301来做转址。
302redirect
302代表暂时性转移(Temporarily Moved),在前些年,不少Black Hat SEO(黑帽SEO)曾广泛应用这项技术作弊,目前,各大主要搜索引擎均加强了打击力度,像Google前些年对域名之王(Business)以及近来对BMW德国网站的惩罚。即使网站客观上不是spam,也很容易被搜寻引擎容易误判为spam而遭到惩罚。
当用户在搜索引擎上搜索某个关键词时,有时候会跳转到另一个页面。这是因为网站已经设置了重定向,搜索引擎根据重定向规则,将用户跳转到指定页面。重定向规则可以通过设置HTTP状态码、添加mete标签、添加js脚本或者使用.htaccess文件等方式实现。
发明内容
本发明提供了一种基于浏览器的网站下载重定向方法和系统,用以解决网站下载重定向过程中搜索不够高效的问题:
本发明提供一种基于浏览器的网站下载重定向方法,所述方法包括:
S1:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
S2:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
S3:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
S4:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
进一步的,所述用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容,包括:
S11:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
S12:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
S13:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
进一步的,所述服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求,包括:
S21:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
S22:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
S23:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
S24:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
进一步的,所述服务器根据是否需要判定重定向的结果,向浏览器返回网页内容,包括:
S31:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
S32:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
S33:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
S34:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
进一步的,服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载,包括:
S41:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;
S42:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;
S43:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
S44:用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
本发明提供一种基于浏览器的网站下载重定向系统,所述系统包括:
用户请求模块:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
服务器判定模块:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
结果反馈模块:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
用户下载模块:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
进一步的,所述用户请求模块包括:
搜索模块:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
请求发送模块:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
链接判定模块:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
进一步的,所述服务器判定模块包括:
请求检查模块:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
结果判定模块:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
分结果执行模块:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
URL请求模块:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
进一步的,所述结果反馈模块包括:
代码请求模块:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
网页转移模块:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
HTTP请求发送模块:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
HTTP响应生成模块:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
进一步的,所述用户下载模块包括:
信息搜集模块:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;
检索模块:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;
用户查看模块:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
网页内容下载模块:用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
本发明有益效果:本发明提供的一种基于浏览器的网站下载重定向方法和系统,通过重定向技术可以统一网站的权重,避免网站的权重分散,规范URL网址,提高用户检索信息的快速性与准确度,保障数据获取过程的流畅性,减少延时,可以保障在网站改版完成后向将新版上线,在线上保持一段时间新旧内容共存,降低网站改版带来的流量损失,提高用户体验度,同时有利于网站优化。
附图说明
图1为本发明所述基于浏览器的网站下载重定向方法图;
图2为本发明所述基于浏览器的网站下载重定向系统图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供了一个实施例,如图1所示,一种基于浏览器的网站下载重定向方法,所述方法包括:
S1:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
S2:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
S3:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
S4:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
上述技术方案的工作原理为:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
上述技术方案的工作效果为:用户根据需求选择向浏览器输入URL或者点击链接;通过向浏览器输入URL或者点击链接,对自己的需求有一个明确的了解,从而可以更准确快速的获取到想要的结果。浏览器接收到用户请求,将接收到的用户请求发送给服务器,请求网页内容;服务器接收到用户请求,对其第一时间进行处理,减少了用户的等待时间,增加了用户的体验度,服务器检查用户请求,判定是否需要重定向;通过判断第一时间发现最优解,并立即执行,大大提高了搜索效率以及搜索准确度,如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;减少了用户等待时间,提高了效率,服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;使用户可以快速获得想要的信息,提高了用户获取信息的效率。
本发明的一个实施例,所述用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容,包括:
S11:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
S12:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
S13:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
其中,所述非法链接判定步骤:1、通过技术手段获取链接的IP地址;2、判断该IP地址是否为国家及机构授权的正规网站;3、对获取的网站的安全证书进行审核,若未经过安全证书审核的网站,则可能存在安全隐患;4、对目标链接的域名进行判断,如不在正规顶级域名中,可能为非法链接;5、校验目标链接的内容,检查页面文字是否正确、排版是否合理、或是否存在报警关键字等;6、通过实际测试链接的响应状态,若为404等状态码,可视为非法链接。
上述技术方案的工作原理为:首先用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;接着用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;然后服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求;最后。
上述技术方案的工作效果为:首先用户确定自己需要获取下载的信息,这样有利于保障搜索的精确度,提高搜索效率,减少搜索等待时间;在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;通过在搜索框输入相关信息或者点击链接可以快速将用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;然后服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,用户根据看到提示立即停止访问,避免了用户进入非法网站造成损失,如果为合法链接,则直接执行用户请求。
本发明的一个实施例,所述服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求,包括:
S21:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
S22:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
S23:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
S24:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
上述技术方案的工作原理为:首先服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;接着服务器根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;最后浏览器根据服务器返回的重定向URL,向新的URL发送请求。
上述技术方案的工作效果为:服务器对用户的请求进行检查,有利于第一时间对用户的请求进行判定,确定用户输入的URL或者链接是否符合重定向的条件,如果网站改版以及有多域名指向同一站点,则需要重定向,反之则不需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,用户就可以第一时间查看网页内容,减少了等待时间,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;浏览器根据服务器返回的重定向URL,向新的URL发送请求,如此反复直到得到用户想要的信息,保障了用户获取信息的准确性。
本发明的一个实施例,所述服务器根据是否需要判定重定向的结果,向浏览器返回网页内容,包括:
S31:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
S32:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
S33:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
S34:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
上述技术方案的工作原理为:用户通过浏览器传入到服务器中的URL或者链接如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括但不限于302、301;浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
上述技术方案的工作效果为:通过判定用户请求是否需要重定向,将不同用户的不同请求分情况处理,可以提高搜索效率,缩短系统响应时间,有利于合理利用电脑资源,如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页,这样可以使搜索的信息更加的准确;请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,重定向代码包括302、301;浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。可以维护网站的组织结构,也可以提高SHO排名,增加用户体验。
本发明的一个实施例,服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载,包括:
S41:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;所述网页信息包括:文本、图像、超链接、导航栏、动画、表格、框架和表单。
S42:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;
S43:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
S44:用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
上述技术方案的工作原理为:首先服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;接着根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;然后将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;最后用户点击下载按钮对网页信息进行下载;
上述技术方案的工作效果为:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;便于用户在数万亿级别以上的原始网页数据库中快速便捷地找到搜索结果,减少了用户筛选时间,提高了效率,根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;用户可以根据排序结果快速的去筛选定位到自己想要的信息,将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;用户点击下载按钮对网页信息进行下载;
本发明的一个实施例,如图2所示,一种基于浏览器的网站下载重定向系统,其特征在于,所述系统包括:
用户请求模块:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
服务器判定模块:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
结果反馈模块:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
用户下载模块:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
上述技术方案的工作原理为:首先服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;接着根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;然后将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;最后用户点击下载按钮对网页信息进行下载;
上述技术方案的工作效果为:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;便于用户在数万亿级别以上的原始网页数据库中快速便捷地找到搜索结果,减少了用户筛选时间,提高了效率,根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;用户可以根据排序结果快速的去筛选定位到自己想要的信息,将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
用户点击下载按钮对网页信息进行下载;
本发明的一个实施例,所述用户请求模块包括:
搜索模块:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
请求发送模块:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
链接判定模块:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
其中,所述非法链接判定步骤:1、通过技术手段获取链接的IP地址;2、判断该IP地址是否为国家及机构授权的正规网站;3、对获取的网站的安全证书进行审核,若未经过安全证书审核的网站,则可能存在安全隐患;4、对目标链接的域名进行判断,如不在正规顶级域名中,可能为非法链接;5、校验目标链接的内容,检查页面文字是否正确、排版是否合理、或是否存在报警关键字等;6、通过实际测试链接的响应状态,若为404等状态码,可视为非法链接。
上述技术方案的工作原理为:首先用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;接着用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;然后服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求;最后。
上述技术方案的工作效果为:首先用户确定自己需要获取下载的信息,这样有利于保障搜索的精确度,提高搜索效率,减少搜索等待时间;在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;通过在搜索框输入相关信息或者点击链接可以快速将用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;然后服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,用户根据看到提示立即停止访问,避免了用户进入非法网站造成损失,如果为合法链接,则直接执行用户请求;最后。
本发明的一个实施例,所述服务器判定模块包括:
请求检查模块:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
结果判定模块:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
分结果执行模块:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
URL请求模块:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
上述技术方案的工作原理为:首先服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;接着服务器根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;最后浏览器根据服务器返回的重定向URL,向新的URL发送请求。
上述技术方案的工作效果为:服务器对用户的请求进行检查,有利于第一时间对用户的请求进行判定,确定用户输入的URL或者链接是否符合重定向的条件,如果网站改版以及有多域名指向同一站点,则需要重定向,反之则不需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,用户就可以第一时间查看网页内容,减少了等待时间,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;浏览器根据服务器返回的重定向URL,向新的URL发送请求,如此反复直到得到用户想要的信息,保障了用户获取信息的准确性。
本发明的一个实施例,所述结果反馈模块包括:
代码请求模块:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
网页转移模块:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
HTTP请求发送模块:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
HTTP响应生成模块:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
上述技术方案的工作原理为:用户通过浏览器传入到服务器中的URL或者链接如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括但不限于302、301;浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
上述技术方案的工作效果为:通过判定用户请求是否需要重定向,将不同用户的不同请求分情况处理,可以提高搜索效率,缩短系统响应时间,有利于合理利用电脑资源,如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页,这样可以使搜索的信息更加的准确;请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,重定向代码包括302、301;浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。可以维护网站的组织结构,也可以提高SHO排名,增加用户体验。
本发明的一个实施例,所述用户下载模块包括:
信息搜集模块:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;所述网页信息包括:文本、图像、超链接、导航栏、动画、表格、框架和表单;
检索模块:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;
用户查看模块:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
网页内容下载模块:用户点击下载按钮对网页信息进行下载;
上述技术方案的工作原理为:首先服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;接着根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;然后将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;最后用户点击下载按钮对网页信息进行下载;
上述技术方案的工作效果为:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;便于用户在数万亿级别以上的原始网页数据库中快速便捷地找到搜索结果,减少了用户筛选时间,提高了效率,根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;用户可以根据排序结果快速的去筛选定位到自己想要的信息,将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种基于浏览器的网站下载重定向方法,其特征在于,所述方法包括:
S1:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
S2:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
S3:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
S4:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
所述服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载,包括:
S41:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;
S42:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息在进行文档与查询的相似度评价,对将要输出的结果进行排序;
S43:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
S44:用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
所述服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求,包括:
S21:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
S22:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
S23:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
S24:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
2.根据权利要求1所述一种基于浏览器的网站下载重定向方法,其特征在于,所述用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容,包括:
S11:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
S12:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
S13:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
3.根据权利要求1所述一种基于浏览器的网站下载重定向方法,其特征在于,所述服务器根据是否需要判定重定向的结果,向浏览器返回网页内容,包括:
S31:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
S32:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
S33:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
S34:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
4.一种基于浏览器的网站下载重定向系统,其特征在于,所述系统包括:
用户请求模块:用户根据需求选择向浏览器输入URL或者点击链接;浏览器接收到用户请求,并将用户请求发送给服务器,请求网页内容;
服务器判定模块:服务器检查用户请求,判定是否需要重定向;如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器发送响应,浏览器根据服务器返回的重定向URL,向新的URL发送请求;
结果反馈模块:服务器根据是否需要判定重定向的结果,向浏览器返回网页内容;
用户下载模块:服务器对网页内容进行解析,并通过终端设备将浏览器界面显示给用户,用户点击下载按钮对网页信息进行下载;
所述用户下载模块包括:
信息搜集模块:服务器根据浏览器发送过来的用户请求在互联网中发现,搜集网页信息,同时对网页信息进行提取和组织建立索引库;所述网页信息包括文本、图像、音视频以及元数据;
检索模块:根据用户请求的URL或者链接,在索引库中按照匹配度由高到低的顺序进行检测待测网页信息与预设网页信息,在进行文档与查询的相似度评价,对将要输出的结果进行排序;
用户查看模块:将排序后的结果返回给用户,用户通过终端设备查看浏览器界面的排序结果;
网页内容下载模块:用户点击下载按钮对网页信息进行下载;
其中,所述相似度评价公式为,设置待测网页内容长度为L1,预设网页内容长度为L;待测网页与预设网页相似的内容长度为Z,相似度为T;若L>L1,则T=(Z+1)/(L+1),若L<L1,
所述服务器判定模块包括:
请求检查模块:服务器对用户的请求进行检查,检查网站是否改版以及是否有多域名指向同一站点;
结果判定模块:根据判定的结果,确定是否需要重定向,如果网站改版以及有多域名指向同一站点则需要进行重定向,否则不需要重定向;
分结果执行模块:如果不需要重定向,则服务器直接向浏览器返回网页内容,如果需要重定向,服务器向浏览器发送响应,所述响应包括状态代码,内容类型;
URL请求模块:浏览器根据服务器返回的重定向URL,向新的URL发送请求。
5.根据权利要求4所述一种基于浏览器的网站下载重定向系统,其特征在于,所述用户请求模块包括:
搜索模块:用户确定自己需要获取下载的信息,在浏览器搜索框输入需要获取的URL或者点击链接请求网页检索;
请求发送模块:用户请求网页检索的信息传入到浏览器,浏览器接收到用户请求,并发送HTTP请求到服务器;
链接判定模块:服务器对用户请求的URL或者链接进行判定,确定其是否为非法链接,如果为非法链接,则提示用户,如果为合法链接,则直接执行用户请求。
6.根据权利要求4所述一种基于浏览器的网站下载重定向系统,其特征在于,所述结果反馈模块包括:
代码请求模块:如果需要重定向,则服务器向浏览器返回重定向代码进行请求新的网页;
网页转移模块:请求的网页已经移动到了新的URL,服务器会在HTTP响应中包含重定向代码,所述重定向代码包括302、301;
HTTP请求发送模块:浏览器收到重定向代码后,会自动向新的URL发送HTTP请求;
HTTP响应生成模块:服务器收到请求后,会生成一个HTTP响应,其中包含重定向到的网页的内容。
CN202310220066.0A 2023-03-09 2023-03-09 一种基于浏览器的网站下载重定向方法和系统 Active CN116389572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310220066.0A CN116389572B (zh) 2023-03-09 2023-03-09 一种基于浏览器的网站下载重定向方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310220066.0A CN116389572B (zh) 2023-03-09 2023-03-09 一种基于浏览器的网站下载重定向方法和系统

Publications (2)

Publication Number Publication Date
CN116389572A CN116389572A (zh) 2023-07-04
CN116389572B true CN116389572B (zh) 2024-01-30

Family

ID=86974067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310220066.0A Active CN116389572B (zh) 2023-03-09 2023-03-09 一种基于浏览器的网站下载重定向方法和系统

Country Status (1)

Country Link
CN (1) CN116389572B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929984A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 失效网址搜索方法和装置
CN108205532A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 生成网页的方法和装置
CN110110251A (zh) * 2019-03-13 2019-08-09 北京和信创天科技股份有限公司 一种办公用虚拟机视频网站重定向技术方法
CN111464874A (zh) * 2020-04-15 2020-07-28 湖南麒麟信安科技有限公司 一种云桌面内播放网页视频的方法、系统及介质
CN113761425A (zh) * 2021-09-13 2021-12-07 深圳市共进电子股份有限公司 域名重定向方法、装置、智能网关和可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929984A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 失效网址搜索方法和装置
CN108205532A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 生成网页的方法和装置
CN110110251A (zh) * 2019-03-13 2019-08-09 北京和信创天科技股份有限公司 一种办公用虚拟机视频网站重定向技术方法
CN111464874A (zh) * 2020-04-15 2020-07-28 湖南麒麟信安科技有限公司 一种云桌面内播放网页视频的方法、系统及介质
CN113761425A (zh) * 2021-09-13 2021-12-07 深圳市共进电子股份有限公司 域名重定向方法、装置、智能网关和可读存储介质

Also Published As

Publication number Publication date
CN116389572A (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
US9613008B2 (en) Dynamic aggregation and display of contextually relevant content
CN107066529B (zh) 联合团体搜索
US6070157A (en) Method for providing more informative results in response to a search of electronic documents
US8745067B2 (en) Presenting comments from various sources
US7933917B2 (en) Personalized search method and system for enabling the method
US9223895B2 (en) System and method for contextual commands in a search results page
JP5015935B2 (ja) モバイルサイトマップ
US20090006388A1 (en) Search result ranking
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
US8140508B2 (en) System and method for contextual commands in a search results page
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
CN103425767B (zh) 一种提示数据的确定方法和系统
CN116389572B (zh) 一种基于浏览器的网站下载重定向方法和系统
CN104392000B (zh) 确定移动站点抓取配额的方法和装置
EP2662785A2 (en) A method and system for non-ephemeral search
US7890515B2 (en) Article distribution system and article distribution method used in this system
KR100458458B1 (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템
KR101048590B1 (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템
KR101021022B1 (ko) 맞춤형 검색서비스 제공장치 및 그 방법
JP5222691B2 (ja) 検索情報提供システム
JP2008171110A (ja) サイト検索システム、検索サーバ、プログラム
JP5108707B2 (ja) 検索サーバ装置、検索方法及びプログラム
JP2006221443A (ja) 地図情報システム連動サーチエンジンサーバーシステム。
KR20040103763A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법
KR20040086733A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant