WO2017107708A1

WO2017107708A1 - Procédé et dispositif d'extraction de préfixes de localisateur uniforme de ressource pour auto-adaptation de mandataire d'utilisateur

Info

Publication number: WO2017107708A1
Application number: PCT/CN2016/106250
Authority: WO
Inventors: 孙键; 李毅
Original assignee: 北京搜狗科技发展有限公司
Priority date: 2015-12-25
Filing date: 2016-11-17
Publication date: 2017-06-29
Also published as: CN105630987B; CN105630987A

Abstract

L'invention concerne un procédé et un dispositif d'extraction de préfixes de localisateur uniforme de ressource pour auto-adaptation de mandataire d'utilisateur. Le procédé comporte les étapes consistant à: recueillir une page d'accueil de site web capturée par un collecteur web d'un moteur de recherche du côté d'un ordinateur; juger si la page d'accueil du site web est une page web avec auto-adaptation d'UA; juger si chaque préfixe du premier ordre correspondant à une adresse web comprise dans un site web satisfait la condition d'auto-adaptation d'UA lorsque la page d'accueil du site web est une page web avec auto-adaptation d'UA; et déterminer que le préfixe du premier ordre satisfaisant la condition d'auto-adaptation d'UA est un préfixe d'URL pour auto-adaptation d'UA. Au moyen des modes de réalisation de la présente invention, des préfixes d'URL satisfaisant la condition d'auto-adaptation d'UA compris dans divers sites web courants peuvent être extraits. Sur cette base, des pages web avec auto-adaptation d'UA peuvent être éliminées efficacement pendant l'opération d'extraction de règles de transformation, et le défaut que constitue l'accroissement de la charge de travail ou l'obtention d'une règle de transformation erronée pendant l'extraction de règles de transformation d'URL d'auto-adaptation d'UA dans l'état antérieur de la technique est évité.