WO2020140698A1

WO2020140698A1 - Procédé et appareil d'acquisition de données de tableau, et serveur associé

Info

Publication number: WO2020140698A1
Application number: PCT/CN2019/124101
Authority: WO
Inventors: 张林江
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2019-01-04
Filing date: 2019-12-09
Publication date: 2020-07-09
Also published as: CN110008809B; CN110008809A

Abstract

L'invention concerne un procédé et un appareil d'acquisition de données de tableau, ainsi qu'un serveur. Le procédé selon l'invention consiste : à obtenir des données d'image de texte à traiter ; à extraire un graphique combiné à partir des données d'image, le graphique combiné étant un graphique contenant des lignes verticales morphologiques et des lignes horizontales morphologiques se croisant ; à diviser le graphique combiné en une pluralité d'unités rectangulaires ; à effectuer une reconnaissance optique de caractères sur les unités rectangulaires, respectivement, et à déterminer des informations textuelles des unités rectangulaires ; et, en fonction des coordonnées de position des unités rectangulaires, à combiner les unités rectangulaires contenant les informations textuelles afin d'obtenir des données de tableau. Selon l'invention, les problèmes techniques liés aux erreurs et imprécisions importantes dans l'extraction de données de tableau dans un procédé existant peuvent être résolus par l'obtention de caractéristiques graphiques telles que des lignes verticales et des lignes horizontales morphologiques dans des données d'image et par l'obtention d'un graphique combiné, en fonction des caractéristiques graphiques, puis par la division du graphique combiné en une pluralité d'unités rectangulaires pour une reconnaissance optique de caractères afin d'obtenir des informations textuelles des unités rectangulaires, et par la réalisation d'une réduction de combinaison en fonction des coordonnées de position afin d'obtenir des données de tableau.