WO2015084757A1

WO2015084757A1 - Systèmes et procédés de traitement de données stockées dans une base de données

Info

Publication number: WO2015084757A1
Application number: PCT/US2014/067994
Authority: WO
Inventors: Rakesh Dave; Sanjay Boddhu; Scott Lightner; Robert Flagg
Original assignee: Qbase, LLC
Priority date: 2013-12-02
Filing date: 2014-12-02
Publication date: 2015-06-11

Abstract

L'invention concerne des systèmes et des procédés d'extraction de faits à partir de fichiers texte non structurés. Des modes de réalisation de l'invention consistent à recevoir des fichiers texte en entrée et à effectuer l'extraction et la désambiguïsation d'entités, de sujets et de faits. Les faits sont extraits par comparaison de caractéristiques, telles que des mots clés, avec des modèles de faits, et par association de faits à des événements ou à des sujets. Les faits extraits sont stockés dans un magasin de données. L'invention concerne également des procédés et des systèmes de découverte de "connaissances" dans des corpus stockés, ces procédés et systèmes consistant à appliquer une analyse en mémoire à des enregistrements de base de données en fonction d'une indication sélectionnée par l'utilisateur. L'invention concerne également des systèmes et des procédés de construction d'une base de connaissances au moyen de caractéristiques co-occurentes, telles que des mots clés, extraites de corpus. Des modes de réalisation concernent un logiciel d'extraction de caractéristiques qui extrait des caractéristiques de fichiers documents dans un corpus stocké. Des modes de réalisation peuvent également concerner un module logiciel agrégateur de base de connaissances qui compte le nombre de co-occurences de caractéristiques dans les divers documents d'un corpus et qui identifie les co-occurences de caractéristiques à stocker dans une base de connaissances.