EP1917626A1

EP1917626A1 - Procede pour retrouver des blocs de texte dans des documents

Info

Publication number: EP1917626A1
Application number: EP06776758A
Authority: EP
Inventors: Katja Worm
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2005-08-26
Filing date: 2006-08-11
Publication date: 2008-05-07
Also published as: CN101263512A; CA2620180A1; DE102005040687A1; WO2007022877A1; US20090252415A1

Abstract

L'invention concerne un procédé pour retrouver des blocs de texte dans des documents, de préférence pour des envois postaux à trier, tels que des envois en nombre. L'objectif de cette invention est de retrouver ou d'identifier ces blocs de texte dans des documents de n'importe quel type à l'aide d'enregistrements de signes caractéristiques de blocs de texte de référence. A cet effet, des signes du bloc de texte liés à la structure sont extraits comme signes caractéristiques et comparés à des signes d'un enregistrement de signes d'un bloc de texte de référence, de sorte que des signes similaires peuvent être reconnus le plus simplement possible parmi plusieurs blocs de texte. Une première extraction de signes liés à la structure peut être effectuée p. ex. par une décomposition d'un bloc de texte en plusieurs lignes, dont la hauteur ou les interlignes sont mémorisés dans un enregistrement de signes d'un envoi. Ainsi, des similitudes peuvent être recherchées parmi différents blocs de texte par comparaison des enregistrements de signes.