WO2020024403A1

WO2020024403A1 - Dispositif et procédé d'exploration de données de corpus cible, et support d'informations

Info

Publication number: WO2020024403A1
Application number: PCT/CN2018/107489
Authority: WO
Inventors: 吴壮伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-08-03
Filing date: 2018-09-26
Publication date: 2020-02-06
Also published as: CN109190062B; CN109190062A

Abstract

La présente invention concerne un procédé d'exploration de données de corpus cible. Le procédé consiste : après la réception d'une demande d'exploration pour des informations cibles, à déterminer tout d'abord une règle d'exploration requise pour une exploration d'un corpus cible, et à invoquer la règle d'exploration pour explorer de façon séquentielle une première liste URL de page de titre, une première liste URL de page de liste et une première liste URL de page de contenu à partir d'un corpus initial ; et à explorer ensuite une deuxième liste URL de page de liste correspondant à la première liste URL de page de titre, à générer une troisième liste URL de page de liste, et à générer une troisième liste URL de page de contenu, de façon à acquérir des données de page de contenu, et enfin, à utiliser une règle d'exploration d'informations cibles pour explorer les informations cibles, de façon à générer des données de corpus cible. L'invention concerne également un dispositif électronique et un support d'informations informatique. Le procédé mentionné ci-dessus permet d'améliorer l'efficacité et la précision des données de corpus cible d'exploration.