WO2012143839A1

WO2012143839A1 - Système et procédé informatisés de traitement et de construction de chaînes de recherche

Info

Publication number: WO2012143839A1
Application number: PCT/IB2012/051870
Authority: WO
Inventors: Abraham Carel GREYLING
Original assignee: Greyling Abraham Carel
Priority date: 2011-04-19
Filing date: 2012-04-16
Publication date: 2012-10-26

Abstract

La présente invention concerne un procédé pour traiter une chaîne de recherche d'entrée et construire de multiples chaînes de recherche alternatives en vue d'améliorer la recherche informatisée. Le procédé consiste à extraire du texte de pages web, former une base de données relationnelle de mots dans laquelle chaque mot unique est associé à des champs qui représentent d'autres mots qui sont apparus adjacents à ce mot, traiter la base de données relationnelle de mots de manière à déterminer une signature avant et arrière pour chaque mot, et combiner les signatures avant et arrière pour former une base de données de signatures. Des groupes de deux mots dans la chaîne de recherche d'entrée sont liés et des signatures avant et arrière pour chaque groupe de deux mots sont obtenues. Ces signatures sont comparées à la base de données de signatures pour trouver des mots uniques qui ont des signatures qui correspondent sensiblement à la signature du groupe de deux mots, et les mots identifiés comme mots alternatifs qui sont sémantiquement similaires au groupe de deux mots, de manière à générer des chaînes de recherche alternatives.