WO2019232645A1

WO2019232645A1 - Classification non supervisée de documents grâce à un ensemble de données étiquetées d'autres documents

Info

Publication number: WO2019232645A1
Application number: PCT/CA2019/050806
Authority: WO
Inventors: Thomas Boquet; Francis Duplessis
Original assignee: Element Ai Inc.
Priority date: 2018-06-07
Filing date: 2019-06-07
Publication date: 2019-12-12

Abstract

L'invention concerne des systèmes et des procédés permettant d'associer un document sujet inconnu à d'autres documents en fonction de caractéristiques connues des autres documents. Le document sujet passe dans un module d'extraction de caractéristiques, qui représente les caractéristiques du document sujet sous la forme d'un vecteur numérique à n dimensions. Un module de mise en correspondance reçoit ce vecteur et des données de référence. Les données de référence sont prédivisées en n groupements, chaque groupement correspondant à au moins une caractéristique spécifique. Le module de mise en correspondance compare les caractéristiques du document sujet avec des caractéristiques des données de référence et détermine un groupement correspondant pour le document sujet. Le document sujet est ensuite associé à ce groupement correspondant.