WO2021223882A1

WO2021223882A1 - Explication de prédiction dans des classificateurs d'apprentissage automatique

Info

Publication number: WO2021223882A1
Application number: PCT/EP2020/062888
Authority: WO
Inventors: Suleiman Ali KHAN; Simone ROMANO; Mark VAN HEESWIJK; Muhammad AMMAD-UD-DIN; Jonathan Paul FERNANDEZ STRAHL; Adrian Flanagan; Kuan Eeik TAN
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2020-05-08
Filing date: 2020-05-08
Publication date: 2021-11-11

Abstract

Est ici divulgué un procédé de classification de données de texte d'entrée mettant en œuvre un classificateur d'apprentissage automatique. Le procédé comprend la réception de données de texte d'entrée, la réalisation d'opérations de classification de texte à l'aide du classificateur d'apprentissage automatique sur les données de texte d'entrée et la prédiction d'une classification pour les données de texte d'entrée, l'identification d'une caractéristique textuelle des données de texte d'entrée pertinente pour la prédiction de classification, la comparaison de la caractéristique textuelle identifiée des données de texte d'entrée à une représentation par graphe de connaissances de caractéristiques textuelles, une ou plusieurs caractéristiques textuelles du graphe de connaissances étant marquées par un descripteur de langage naturel de la caractéristique textuelle respective. Le procédé pourrait, par exemple, être utilisé pour modérer un contenu généré par l'utilisateur dans un forum de discussion en ligne pour éliminer les publications désagréables. L'utilisation d'une représentation par graphe de connaissances de caractéristiques textuelles, tels que des mots, permet avantageusement de définir les significations sémantiques respectives d'un grand ensemble de caractéristiques textuelles en utilisant uniquement des étiquettes sporadiques de descripteur de langage naturel par la définition de relations sémantiques entre caractéristiques textuelles dans le graphe de connaissances. L'étiquetage sporadique de caractéristiques textuelles dans une référence présente avantageusement un coût humain/de calcul moindre pour sa génération qu'un ensemble complet d'étiquettes, tout en facilitant de manière souhaitable l'explication des raisons pour une prédiction de classification, même si une raison pour la prédiction de classification concerne des caractéristiques textuelles non étiquetées du graphe de connaissances.