WO2008130501A1

WO2008130501A1 - Traitement et recherche de documents non structurés ou semi-structurés et génération d'information en fonction de valeurs

Info

Publication number: WO2008130501A1
Application number: PCT/US2008/004545
Authority: WO
Inventors: Aditya Vailaya; Jiang Wu; Manish Rathi; Kirk Chen
Original assignee: Retrevo, Inc.
Priority date: 2007-04-16
Filing date: 2008-04-08
Publication date: 2008-10-30

Abstract

Selon un mode de réalisation, la présente invention concerne un procédé permettant d'analyser et d'indexer un document non structuré ou semi-structuré comprenant la réception d'un document non structuré ou semi-structuré ; la conversion du document en un ou des flux textuel ; l'analyse de l'un ou des flux textuel pour identifier un contenu textuel du document ; l'analyse de l'un ou des flux textuels pour identifier des sections logiques du document ; l'association du contenu textuel avec des sections logiques du document ; l'indexation du contenu textuel et de leur association avec les sections logiques ; la sauvegarde d'un résultat de l'indexation dans un dispositif de stockage. L'invention concerne également d'autres systèmes et procédés.