WO2017096777A1

WO2017096777A1 - Procédé de normalisation de document, procédé de recherche de document, appareils correspondants, dispositif et support de stockage

Info

Publication number: WO2017096777A1
Application number: PCT/CN2016/087058
Authority: WO
Inventors: 黄岳; 马晋; 张显; 张晓婧; 曹冰; 徐学睿; 李玉鹏; 杰艺
Original assignee: 百度在线网络技术（北京）有限公司
Priority date: 2015-12-07
Filing date: 2016-06-24
Publication date: 2017-06-15
Also published as: CN105447169B; CN105447169A

Abstract

L'invention concerne un procédé de normalisation de document, un procédé de recherche de document, des appareils correspondants, un dispositif et un support de stockage. Le procédé de normalisation de document comprend les étapes suivantes : acquérir des documents à partir d'une ou plusieurs sources de site Internet ; normaliser les documents acquis ; selon le degré de similarité entre les titres des documents normalisés, grouper les documents ayant des titres similaires pour obtenir une pluralité d'ensembles de documents ; calculer le degré de similarité entre les documents dans chaque ensemble de documents, et selon le degré de similarité calculé entre les documents, éliminer un ensemble de documents qui satisfait une exigence ; et grouper les mêmes documents dans l'ensemble de documents qui est éliminé et satisfait l'exigence, et rassembler des sources de publication des mêmes documents. Le procédé de recherche de document comprend les étapes suivantes : recevoir un mot-clé entré par un utilisateur ; selon le mot-clé, rechercher des documents associés au mot-clé ; et dans le résultat de recherche, afficher les mêmes documents au moyen d'une agrégation, et afficher la source de publication de chaque document. Par comparaison avec l'état de la technique, la normalisation des mêmes documents est mise en œuvre dans la présente invention, et une base pour améliorer l'efficacité de recherche de document est fournie.