WO2010038017A1

WO2010038017A1 - Procédé d'analyse grammaticale partielle reposant sur l'évaluation d'appartenance de chaîne dans un fragment de grammaire floue

Info

Publication number: WO2010038017A1
Application number: PCT/GB2009/002328
Authority: WO
Inventors: Trevor Philip Martin; Behnam Azvine; Sachin Baban Karale
Original assignee: British Telecommunications Public Limited Company
Priority date: 2008-09-30
Filing date: 2009-09-30
Publication date: 2010-04-08

Abstract

L'invention concerne des procédés et un appareil correspondant, destinés à analyser du texte dans un document comprenant une pluralité d’unités textuelles, le procédé comportant les étapes consistant à : recevoir le document; partitionner le texte en séquences d’unités textuelles; comparer les séquences issues du document à des séquences prédéterminées provenant d’une réserve de séquences; déterminer des mesures de similitude dépendant des différences entre les séquences issues du document et les séquences issues de la réserve de séquences, les mesures de similitude étant fonction du nombre d’opérations unitaires nécessaires pour rendre les séquences issues du document identiques aux séquences issues de la réserve de séquences; mettre à jour une réserve de résultats par rapport à des séquences dont les mesures de similitude indiquent des degrés de similitude supérieurs à un seuil prédéterminé; et produire un document de sortie comportant des marques indicatives de ces similitudes.