WO2022057707A1

WO2022057707A1 - Procédé de reconnaissance de texte, procédé de classification de reconnaissance d'image et procédé de traitement de reconnaissance de document

Info

Publication number: WO2022057707A1
Application number: PCT/CN2021/117222
Authority: WO
Inventors: 徐青松; 李青
Original assignee: 杭州睿琪软件有限公司
Priority date: 2020-09-15
Filing date: 2021-09-08
Publication date: 2022-03-24
Also published as: CN112101367A

Abstract

Procédé de reconnaissance de texte, procédé de classification de reconnaissance d'image et procédé de traitement de reconnaissance de document. Le procédé de reconnaissance de texte consiste : pendant une reconnaissance de texte, tout d'abord à étiqueter, à l'aide de blocs de ligne de texte universels, des lignes de texte dans un texte, devant être reconnu, dans une image de texte ; à reconnaître ensuite chaque ligne de texte à l'aide d'un modèle de reconnaissance de caractères, de façon à obtenir un résultat de reconnaissance préliminaire dudit texte ; puis à reconnaître des types de langue du résultat de reconnaissance préliminaire, et à appeler un modèle de reconnaissance de langue correspondant en fonction des types de langue reconnus, afin de reconnaître en outre une partie de caractère correspondant au type de langue, de façon à obtenir un résultat de reconnaissance de caractère optimisé. Grâce au procédé, après l'obtention du résultat de reconnaissance préliminaire dudit texte, un modèle de reconnaissance de langue séparé est en outre utilisé pour une reconnaissance de précision en fonction des types de langue impliqués dans le résultat de reconnaissance préliminaire, de telle sorte que la précision de la reconnaissance de texte est améliorée.