FR3066300A1 - Recherche semantique d'hebergement, basee sur les images - Google Patents

Recherche semantique d'hebergement, basee sur les images Download PDF

Info

Publication number
FR3066300A1
FR3066300A1 FR1754093A FR1754093A FR3066300A1 FR 3066300 A1 FR3066300 A1 FR 3066300A1 FR 1754093 A FR1754093 A FR 1754093A FR 1754093 A FR1754093 A FR 1754093A FR 3066300 A1 FR3066300 A1 FR 3066300A1
Authority
FR
France
Prior art keywords
hotel
semantic
database
search
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1754093A
Other languages
English (en)
Inventor
Joel Cordesses
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amadeus SAS
Original Assignee
Amadeus SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amadeus SAS filed Critical Amadeus SAS
Priority to FR1754093A priority Critical patent/FR3066300A1/fr
Publication of FR3066300A1 publication Critical patent/FR3066300A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

L'appareil, procéder basé sur un réseau informatique et un programme informatique pour extraire les données des images liées à l'hébergement de voyage, et un système informatique, un procédé basé sur un réseau informatique et un programme informatique pour effectuer une recherche d'hébergement de voyage basée sur les critères saisis par un utilisateur. Le système informatique inclut l'appareil et une base de données. L'appareil collecte les images liées à l'hébergement de voyage en demandant des sources de données comprenant des images associées à l'hébergement de voyage, traite les images de sorte à extraire une caractéristique d'identification de l'hébergement de voyage, représente la caractéristique d'identification sous la forme de mots-clés textuels de recherche et stocke les mots-clés textuels de recherche dans la base de données. Le système informatique reçoit une demande d'utilisateur comprenant des critères spécifiques d'hébergement de voyage via une interface utilisateur, cherche dans la base de données des mots-clés textuels de recherche correspondant aux critères de la demande et affiche une liste d'hébergements de voyage représentés par les mots-clés textuels de recherche sur l'interface utilisateur.

Description

RECHERCHE SÉMANTIQUE D’HÉBERGEMENT, BASÉE SUR LES IMAGES
DOMAINE TECHNIQUE
La présente invention concerne de façon générale les ordinateurs et les logiciels informatiques, et notamment, un appareil qui fournit des mots-clés de recherche pour une plate-forme de réservation d’hôtel, et un système, un procédé et un produit-programme d’ordinateur associés à cet appareil.
CONTEXTE
La technologie informatique est de plus en plus utilisée pour rechercher des hébergements de voyage. Généralement, les voyageurs ou les agents de réservation tiers peuvent utiliser des dispositifs informatiques connectés à Internet pour rechercher des hôtels, par exemple via un système de réservation d’hôtel ou un outil de recherche en ligne tel que booking.com® ou TripAdvisor®. Un voyageur peut par exemple chercher un hôtel avec piscines ou vue sur les montagnes près d’un village historique. Le voyageur peut effectuer sa recherche en sélectionnant des critères prédéfinis sur la page de recherche d’un canal de distribution d’hôtel ou en saisissant des critères dans une zone de texte sur la page de recherche. Les résultats obtenus par cette recherche peuvent toutefois ne pas être pertinents. En effet, les critères prédéfinis sur la page de recherche du canal de distribution d’hôtel n’incluent pas chaque critère du voyageur. Typiquement, les canaux de distribution d’hôtel permettent uniquement des demandes de recherche standardisées, basées sur des critères de recherche simples tels que la catégorie d’hôtel, la chambre, les types de service et les disponibilités. La recherche via le texte libre sur le canal de distribution d’hôtel ne peut pas non plus obtenir des résultats pertinents, même si certains hôtels sur le canal de distribution d’hôtel correspondent aux critères saisis par l’utilisateur, parce que leur description textuelle dans les bases de données qui sont consultées peut être incomplète. Le voyageur peut avoir vu une image d’une galerie d’images d’un hôtel sur TripAdvisor®, avoir oublié le nom de l’hôtel et ne pas être capable de le trouver en saisissant les caractéristiques identifiées sur l’image. Le voyageur peut saisir les critères sous la forme d’une demande sur un moteur de recherche en ligne tel que Google®. Les résultats de recherche incluront des articles en texte et des sites Internet d’hôtel, et l’utilisateur peut les filtrer pour trouver ce qu’il veut. Cependant, les hôtels répertoriés par le moteur de recherche sont habituellement sélectionnés sur la base de la description textuelle, c.-à-d. un texte qui reprend les caractéristiques de l’hôtel qui peuvent être saisis par la personne qui a répertorié l’hôtel en ligne, par exemple propriétaire de l’hôtel ou un agent de promotion/attaché de presse d’une chaîne d’hôtels. Ceci est problématique pour plusieurs raisons. D’un côté, les hôtels trouvés peuvent avoir une description textuelle contenant les mots-clés correspondant à certains critères saisis par l’utilisateur mais pas tous les critères, et peuvent donc ne pas correspondre aux critères de la demande. D’un autre côté, les hôtels correspondant aux critères précisés par 1 utilisateur n apparaissent pas (ou les hôtels ne correspondant pas aux critères peuvent apparaître) dans la recherche parce que leurs descriptions textuelles ne sont pas précises. Le voyageur peut saisir ces critères dans le moteur d’achat Google qui est basé sur la reconnaissance des images. Les résultats peuvent inclure des éléments contenant un ou plusieurs critères saisis par le voyageur, par exemple des cartes postales représentant un hôtel avec une vue sur les montagnes mais le moteur d’achat n’identifie pas les hôtels physiques correspondant aux exigences du voyageur.
En raison des options de recherche limitées, le voyageur peut avoir passé beaucoup de temps à chercher un hôtel qu’il avait en tête et les résultats ne correspondent toujours pas à ses souhaits. Les voyageurs peuvent inspecter les galeries d’images pour déterminer si un hôtel répond à des critères spécifiques mais les agents de voyage manquent de temps pour le faire. Ainsi, des appareils améliorés, des procédés, des systèmes et des produits-programmes d’ordinateur sont souhaités pour permettre une recherche en ligne d’hébergement de voyage en tenant compte des critères précisés par l’utilisateur. RÉSUMÉ
La présente invention a pour objectif d’améliorer l'efficacité des recherches d’hébergement de voyage en ligne sur la base de la saisie sémantique, en capitalisant sur les données disponibles dans des images liées à l’hébergement de voyage.
Sont donc fournis un appareil pour extraire les données sémantiques des images liées à l’hébergement de voyage, un système pour effectuer une recherche d’hébergement de voyage sur la base de la saisie sémantique, un procédé et un programme informatique associé à cet appareil et au système.
Selon un premier aspect de l’invention, elle concerne un appareil pour extraire les données sémantiques des images liées à l’hébergement de voyage, ci-après appelé appareil d’alimentation sémantique. L’appareil d’alimentation sémantique comprend un module collecteur d’images, un module de traitement d’images et un module de sortie. Le module collecteur d’images est configuré, pour chaque hébergement de voyage, pour demander au moins une source de données comprenant des images associées à l’hébergement de voyage, et pour collecter au moins une image liée à l’hébergement de voyage. Le module de traitement d images est configuré pour traiter chacune d’au moins une image, de sorte à extraire une caractéristique d’identification de l’hébergement de voyage, pour convertir la caractéristique d identification extraite de l’image en texte et pour corréler le texte à au moins un mot-clé textuel de recherche en utilisant un dictionnaire des synonymes. Le module de sortie est configuré, pour ledit au moins mot-clé textuel de recherche extrait d’une image liée à un hébergement de voyage, pour stocker le lien ou l’association de l’hébergement de voyage, de 1 image et du texte dans une base de données. Cet appareil d’alimentation sémantique présente l’avantage d’exploiter une source riche et détaillée d’informations associée à l’hébergement de voyage, c.-à-d. des images liées à l’hébergement de voyage, pour compléter une description d’hébergement de voyage, puisque les images peuvent révéler des caractéristiques de l’hébergement de voyage qui ne sont pas présentes dans la description textuelle de l’hébergement de voyage.
Selon un second aspect de 1 invention, elle concerne un système informatique pour réaliser une recherche d hébergement de voyage basée sur des critères saisis par un utilisateur. Le système comprend l’appareil d’alimentation sémantique du premier aspect de l’invention, une base de données d’alimentation sémantique pour stocker la sortie de données par le module de sortie et peut inclure ou être connecté via un réseau à au moins un dispositif client comprenant une interface utilisateur. Le système est configuré pour recevoir une demande d’utilisateur comprenant des critères spécifiques d’hébergement de voyage via l’interface utilisateur, rechercher dans la base de données d’alimentation sémantique des mots-clés textuels de recherche correspondant aux critères de la demande et afficher une liste d’hébergements de voyage représentés par les mots-clés textuels de recherche sur l’interface utilisateur. L’association d’une plate-forme de recherche d’hébergement de voyage à un appareil d’alimentation sémantique présente l’avantage d’améliorer l’efficacité d’une recherche sur ordinateur. L appareil d alimentation sémantique enrichit la base de données de la plate-forme de recherche avec des mots-clés textuels de recherche correspondant aux informations détaillées extraites des images liées à l’hébergement de voyage. On comprend facilement qu une recherche sur ordinateur d’un type spécifique d’hébergement de voyage sera plus efficace dans un tel système. Le système peut comprendre un composant de rapport de recherche qui peut comprendre une base de données et un module configurés pour générer des rapports. La base de données peut être configurée pour stocker les critères spécifiques d hébergement de voyage précisés par un utilisateur pour rechercher dans une deuxième base de données de mots-clés textuels liés à des images et, pour chaque ensemble de critères de recherche, stocker un nombre de résultats de recherche. Le module peut être configuré pour générer des rapports comprenant les recherches réalisées sur une période prédéterminée. Au moins un rapport peut être basé sur le nombre de résultats de sortie à partir des recherches sur une période prédéterminée et peut concerner le contenu manquant sur les images liées à l’hébergement de voyage.
Les rapports générés peuvent révéler les préférences de recherche des utilisateurs, peuvent également révéler le contenu manquant sur les images liées à un hébergement de voyage donné et être utilisés à des fins d’apprentissage automatique dans le but d’auto-enrichir la base de données. Le système peut être configuré pour activer l’appareil d’alimentation sémantique au moins : (i) le temps de mise à disposition d’une nouvelle image dans une source de données, (ii) le temps d’une nouvelle demande d’utilisateur, et (iii) un temps prédéterminé. Le choix du moment pour activer l’appareil d’alimentation sémantique peut fournir une flexibilité supplémentaire au système. Le système peut être configuré pour effectuer une recherche d hôtels. La base de données d’alimentation sémantique peut stocker les données liées aux hôtels et 1 appareil d alimentation sémantique peut être configuré pour être en communication directe avec au moins un système de réservation d’hôtel. Le système peut être configuré, avant l’activation de l’appareil d’alimentation sémantique, pour mettre à jour les données d’hôtels stockées dans la base de données d’alimentation sémantique avec les données d’hôtels stockées dans au moins une base de données du système de réservation d’hôtel, et pour chaque hôtel, pour stocker un pointeur dans la base de données d’alimentation sémantique sur la description d’hôtel dans le système de réservation d’hôtel. Typiquement les systèmes de réservation d hôtels permettent uniquement des demandes de recherches standardisées basées sur des critères de recherche simples, tels que le lieu, la catégorie d’hôtel et le type de chambre. Une telle standardisation conduit habituellement un grand de résultats correspondant aux critères de recherche. L’association d’un appareil d’alimentation sémantique à un système de réservation d’hôtel optimise la recherche d’hôtels, puisque l’appareil d’alimentation sémantique fournit une source supplémentaire de données concernant les hôtels, c.-à-d. les informations extraites d’images liées aux hôtels. La description textuelle standard de l’hôtel, qui est habituellement saisie par un administrateur du système de réservation d’hôtel, lorsque l’hôtel est créé dans la base de données du système de réservation d’hôtel, peut même être vide, et le présent mode de réalisation peut être utilisé pour remplir la base de données du système de réservation d’hôtel. Le système peut par ailleurs comprendre un composant d’établissement de rapports sur la qualité des données comprenant des moyens de déterminer les champs de données qui sont communs à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, des moyens de comparer, pour chaque champ de données qui est commun à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, la valeur dans les deux bases de données, des moyens de quantifier la compatibilité desdites valeurs, et des moyens de générer des alertes en cas d’écarts entre lesdites valeurs. Il est ainsi possible de vérifier la précision de la compatibilité des données structurées disponibles dans le système de réservation d’hôtel et les données collectées par I’alimenteur sémantique. Pour les champs de données communs à la base de données du système de réservation d’hôtel et à la base de données de I’alimenteur sémantique, la correspondance des valeurs de données est mesurée et rapportée, et en cas d’écart important, des alertes sont générées et portées à la connaissance de l’administrateur du système. Le système peut par ailleurs comprendre des moyens de supprimer, pour un champ de données qui est commun à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, les données dans la base de données d’alimentation sémantique, si elles ne sont pas compatibles avec les données de la base de données de réservations d’hôtels. Les données générées par l’appareil d’alimentation sémantique peuvent être automatiquement supprimées de la base de données d’alimentation sémantique, si elles sont contradictoires avec les données disponibles dans le système de réservation d’hôtel, dans le but de conserver l’intégrité des données structurées dans le système de réservation d’hôtel. Le système peut par ailleurs comprendre des moyens de déterminer la priorité entre la base de données du système de réservation d’hôtel et la base de données d’alimentation sémantique concernant un champ de données commun aux deux bases de données et des moyens de diriger la demande utilisateur vers la base de données priorisée. Le système peut détecter des incohérences dans les données structurées du système de réservation d’hôtel, auquel cas les données collectées par I’alimenteur sémantique peuvent reprendre les données disponibles dans le système de réservation d’hôtel. Selon un troisième aspect de l’invention, elle concerne un procédé, basé sur un réseau informatique, d’extraction de données d’images liées à un hébergement de voyage. Le procédé comprend l’étape de demande, pour chaque hébergement de voyage, d’au moins une source de données comprenant des images associées à l’hébergement de voyage et la collecte d’au moins une image liée à l’hébergement de voyage ; de traitement de ladite au moins une image liée à l’hébergement de voyage, de sorte à extraire une caractéristique d’identification de l’hébergement de voyage, convertissant la caractéristique d’identification extraite de l’image en texte et corrélant le texte à au moins un mot-clé textuel de recherche en utilisant un dictionnaire des synonymes ; et de stockage dudit au moins un mot-clé textuel de recherche extrait d’une image liée à un hébergement de voyage, l’association de l’hébergement de voyage, de l’image et du texte, le stockage étant effectué dans une base de données d’alimentation sémantique associée à l’hébergement de voyage. En exploitant les images liées à un hébergement de voyage, le procédé enrichit et complète la description de l’hébergement de voyage, puisque les images peuvent révéler les caractéristiques de l’hébergement de voyage qui ne sont pas présentes dans sa description textuelle.
Le procédé peut par ailleurs comprendre les étapes de réception d’une demande d’utilisateur comprenant des critères spécifiques d’hébergement via une interface utilisateur, de recherche dans la base de données d’alimentation sémantique des mots-clés textuels de recherche correspondant aux critères de la demande et l’affichage d’une liste d’hébergements de voyage représentés par les mots-clés textuels de recherche sur l’interface utilisateur.
Il est très avantageux d’associer cette étape aux étapes précédentes, puisqu’une recherche d’hébergement de voyage sur ordinateur basée sur des critères libres sémantiques sera plus efficace après que les descriptions textuelles standards de l’hébergement de voyage ont été complétées par les mots-clés textuels de recherche extraits d’images liées à l’hébergement de voyage.
Le procédé comprend par ailleurs des étapes pour effectuer un rapport de recherche. Il peut comprendre le stockage, dans une première base de données, de critères spécifiques d’hébergement précisés par un utilisateur pour rechercher dans une deuxième base de données des mots-clés textuels liés à des images et, pour chaque ensemble de critères de recherche, le stockage d’un nombre de résultats de recherche. Il peut par ailleurs comprendre la génération de rapports concernant les recherches réalisées sur une période de temps prédéterminée, pendant laquelle au moins un rapport est basé sur le nombre de résultats de sortie dans les recherches sur la période de temps prédéterminée et concerne le contenu manquant sur les images liées à l’hébergement.
Les rapports générés peuvent révéler les préférences de recherche des utilisateurs, peuvent également révéler le contenu manquant sur les images liées à un hébergement donné et être utilisés à des fins d’apprentissage automatique afin que l’ordinateur auto-enrichisse la base de données.
Le procédé peut par ailleurs comprendre l’établissement de rapports sur la qualité des données. Il peut comprendre des étapes pour déterminer, pour un système de réservation d’hôtel donné, les champs de données qui sont communs à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, pour comparer, pour chaque champ de données qui est commun à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, la valeur dans les deux bases de données, pour quantifier la compatibilité desdites valeurs, pour générer des alertes en cas d’écarts entre lesdites valeurs. Il est ainsi possible de vérifier la précision de la compatibilité des données structurées disponibles dans le système de réservation d’hôtel et les données collectées par l’alimenteur sémantique. Pour les champs de données communs à la base de données du système de réservation d’hôtel et à la base de données de l’alimenteur sémantique, la correspondance des valeurs de données est mesurée et rapportée, et en cas d’écart important, des alertes sont générées et portées à la connaissance de 1 administrateur du système. Le procédé peut par ailleurs comprendre une étape pour supprimer, pour un champ de données qui est commun à la base de données d’alimentation sémantique et à la base de données du système de réservation d’hôtel, les données dans la base de données d’alimentation sémantique, si elles ne sont pas compatibles avec les données de la base de données de réservation d’hôtel. Les données générées par l’appareil d’alimentation sémantique peuvent être automatiquement supprimées de la base de données d’alimentation sémantique, si elles sont contradictoires avec les données disponibles dans le système de réservation d’hôtel, dans le but de conserver l’intégrité des données structurées dans le système de réservation d’hôtel. Le système comprend par ailleurs des étapes pour déterminer la priorité entre la base de données du système de réservation d’hôtel et la base de données d’alimentation sémantique concernant un champ de données commun aux deux bases de données et pour diriger la demande d’utilisateur vers la base de données priorisée. Le système peut détecter des incohérences dans les données structurées du système de réservation d’hôtel, auquel cas les données collectées par l’alimenteur sémantique peuvent reprendre les données disponibles dans le système de réservation d’hôtel.
Selon un autre aspect de l’invention, elle concerne un produit-programme d’ordinateur pour exécuter les procédés présentés ci-dessus.
BRÈVE DESCRIPTION DES DESSINS
Les dessins, qui font partie intégrante des spécifications, illustrent des modes de réalisation de l'invention exemplaires et variés et, avec la description générale de l'invention ci-dessus et la description détaillée des modes de réalisation donnée ci-après, servent à expliquer les modes de réalisation de l'invention.
La Fig. 1 est une vue schématique d’un environnement d’exploitation exemplaire pour effectuer une recherche d’hôtel, incluant un système de recherche sémantique d’hôtel.
La Fig. 2 est une vue schématique de composants d’un système de recherche sémantique d’hôtel.
La Fig. 3 est diagramme décrivant le processus réalisé par un appareil d’alimentation sémantique d’hôtel dans le cadre d’un système de recherche sémantique d’hôtel, comme illustré à la Fig. 2.
La Fig. 4 est un diagramme séquentiel illustrant la communication entre un appareil d’alimentation sémantique d’hôtel et les différents composants dans son environnement opérationnel, comme illustré à la Fig. 1 et à la Fig. 2, tout en exécutant le processus décrit à la Fig. 3.
La Fig. 5 est une vue schématique d’un composant d’établissement de rapports de recherche dans le cadre d’un système de recherche sémantique d’hôtel 30, comme illustré à la Fig. 2 et conformément au mode de réalisation de l’invention.
La Fig. 6 est diagramme décrivant le processus réalisé par un moteur de recherche sémantique d’hôtel dans le cadre d’un système de recherche sémantique d’hôtel, comme illustré à la Fig. 2. La Fig. 7 est un diagramme séquentiel illustrant la communication entre un moteur de recherche sémantique d’hôtel et les différents composants dans son environnement opérationnel, comme illustré à la Fig. 1 et à la Fig. 2, tout en exécutant le processus décrit à la Fig. 6.
La Fig. 8 est un dessin d’une image échantillon.
DESCRIPTION DÉTAILLÉE
Faisant maintenant référence à la Fig. 1, un environnement d’exploitation 1 conformément à un mode de réalisation de l’invention inclut un système de recherche d’hôtel 30, un système de réservation d’hôtel 40, une ou plusieurs sources de données d’hôtel 20, un système d’agence de voyages (TA) 10 et peut inclure ou être connecté à plusieurs dispositifs 5, en communication via un réseau 15. Un dispositif client 5 peut être un dispositif électronique ayant un écran, un accès réseau et une manière de saisir les données. Les dispositifs représentatifs peuvent inclure un système informatique tel qu’ordinateur de bureau ou un dispositif électronique mobile tel qu’un ordinateur portable, une tablette, un téléphone cellulaire, un smartphone, une montre connectée, etc. Un système TA 10 peut contenirMes données de voyage et être connecté à différents systèmes de réservation, par exemple un système de réservation d’hôtel 40. Le système de réservation d’hôtel 40 inclut une base de données de telle 44 contenant des données d’hôtel. Le système TA 10 peut fournir des agences de voyages avec une interface pour accéder au système de réservation d’hôtel 40 qui permet aux agents de chercher et de réserver des hôtels. Le système TA 10 peut inclure une application accessible par les dispositifs client 5permettant aux voyageurs de chercher et de réserver un hôtel sans être assisté par un agent de voyage. Cette application peut comprendre, par exemple un site Internet lié à l’hôtel, accessible via le réseau 15. Le système TA 10 peut être connecté à un système de recherche sémantique d’hôtel 30, qui est également connecté au système de réservation d’hôtel 40. Une source de données d’hôtel 20 peut-être toute source d’images d’hôtels, incluant un site Internet d’agences de voyages en ligne (OLTA), un site Internet TA, un site Internet fournisseur tel qu’un site Internet d un hôtel spécifique ou d’une chaîne d’hôtels, une plate-forme de réservation d’hôtel 40, un blog de voyage, un site Internet d’agrégateur de voyage ou une base de données d images privée. On peut egalement imaginer une configuration dans laquelle on accède directement à un système de réservation d’hôtel 40, sans passer par un système TA 10, via une application dédiée accessible par les dispositifs clients 5 permettant aux voyageurs de rechercher et de réserver un hôtel, et dans laquelle ce système de réservation d’hôtel 40 est connecté à un système de recherche sémantique d’hôtel 30. Dans un autre mode de réalisation, un système de recherche sémantique d’hôtel 30 peut être intégré dans un système de réservation d’hôtel 40.
Faisant maintenant référence à la Fig. 2, un système de recherche sémantique d’hôtel 30 inclut un appareil d’alimentation sémantique d’hôtel 31, un moteur de recherche sémantique d’hôtel 32 et une base de données d’alimentation sémantique d’hôtel 34. Le système de recherche sémantique d’hôtel 30 a accès à différentes sources de données d’hôtel 20 sur le réseau, comme illustré à la Fig. 1. Un appareil d’alimentation sémantique d’hôtel 31 comprend un module de collecte d’images 36, un module de traitement d’images 37 et un module de sortie 38. L’appareil d’alimentation sémantique d’hôtel 31 alimente la base de données d’alimentation sémantique d’hôtel 34 en temps réel ou sur une base régulière, par exemple une fois par semaine, avec des mots-clés textuels de recherche représentant des caractéristiques d’identification des hôtels résultant, comme expliqué plus en détail concernant la Fig. 3, d’une analyse sémantique d’images liées aux hôtels. La base de données d’alimentation sémantique d’hôtel 34 contient une table de référence avec une liste de sources de données d’hôtel 20 à faire défiler. Elles peuvent inclure des URL de sites Internet ou des adresses de bases de données privées. Le module de collecte d’images parcourra ses sources <fe données d’hôtel 20 à une fréquence définie dans l’appareil d’alimentation sémantique d’hôtel 31. La fréquence est déterminée par des règles aux critères suivants : le nombre estimatif de mises à jour depuis le dernier défilement, une fréquence forcée pour une source donnée, la zone géographique et la période de l’année. La fréquence peut être une fois par jour ou une fois par semaine pendant les périodes de vacances chargées ; ou une fois par mois au moins pendant les périodes creuses, par exemple. L’appareil d’alimentation sémantique d’hôtel 31 peut également être déclenché explicitement, par exemple par un administrateur du système de réservation d’hôtel 40 ou par une mise à jour sur la source de données d’hôtel 20, par exemple via un service Web. Pour chaque image qui est collectée, le module de collecte d’images 36 stockera une référence sur l’image et l’identifiant de l’hôtel lié dans le système d’alimentation sémantique d’hôtel 30 et appellera ensuite le module de traitement d’images 37. Le module de traitement d’images 37 mettra une légende à l’image, c.-à-d. qu’il extraira les mots-clés et les morceaux de phrases décrivant l’image et les éléments présents sur l’image (voir ci-dessous pour des exemples de la manière dont c’est réalisé), consultera un dictionnaire des synonymes dans la base de données d’alimentation sémantique d’hôtel 34 pour déterminer ou plusieurs catégories qui correspondent au contenu de l’image, puis appelera le module de sortie 38. Le module de sortie 38 stockera une liste de tous les mots qui ont été extraits de l’image par le module de traitement d’images 37 dans la base de données d’alimentation sémantique d’hôtel 34. A la Fig. 3, un exemple de travail d’appareil d’alimentation sémantique d’hôtel 31 elle décrit plus en détail au moyen d’un diagramme avec les étapes qui sont exécutées après qu’une image a été collectée dans une source de données d’hôtel 20. Supposons que l’image A, illustrée à la Fig. 8 soit collectée sur TripAdvisor® (S 10). Dans un premier temps, le module de collecte d’images 36 collecte les informations permettant l’identification de l’hôtel (S20) lié à l’image A, telles que le nom de l’hôtel, l’adresse, les coordonnées GPS, les numéros de téléphone, etc. L’identification de l’hôtel peut être présente dans la source de données d’hôtel 20, par exemple lorsque la source de données d’hôtel 20 est une base de données privée. Les informations d’hôtel peuvent également être collectées sur un site Internet où l’image a été trouvée. Si le nom de l’hôtel n’est pas trouvé sur la page, il peut être récupéré indirectement dans les informations collectées sur la page, telles que son adresse, numéro de téléphone ou coordonnées GPS. Dans ce cas, le processus d’identification peut être effectué par des modules externes. Sur TripAdvisor® par exemple, les données de nom et d’adresse sont présentes sur la page Web contenant l’image et peuvent être récupérées par grattage écran. Les techniques de grattage écran incluent la capture des données de table de bits sur l’écran et le passage dans un moteur de reconnaissance optique de caractères. Pour l’image A, la donnée d’hôtel récupérée est : Hôtel Cannero, Piazza Umberto Primo 2, 28821 Cannero Riviera, Italie. Avec les identifiants collectés, le module de collecte d’images 36 demande à la base de données d’alimentation sémantique d’hôtel 34 de déterminer si l’hôtel est connu par la base de données d’alimentation sémantique d’hôtel 34 (S30). Si tel est le cas, l’identifiant de l’hôtel (ID hôtel) est récupéré (S40) ; sinon un ID d’hôtel unique est créé (S50). A l’étape suivante, l’ID d’image unique est généré, par exemple sur la base du hachage d’images (S60) et avec cet ID d’image, la base de données d’alimentation sémantique d’hôtel 34 est interrogée (S70). Si l’image est connue (l’ID d’image ou le hachage d'image existe déjà dans la base de données), son horodatage est récupéré dans la base de données d’alimentation sémantique d’hôtel 34 (S80) et est vérifié (S90). Si l’horodatage est trop ancien, l’ancien horodatage est remplacé par le nouvel horodatage et le module de traitement d’images 37 est appelé (SI 10) ; si l’horodatage n’est pas trop ancien, le processus est terminé pour cette image (SO) et l’appareil d’alimentation sémantique d’hôtel 31 peut passer à une autre image. L’horodatage auquel une image collectée doit correspondre peut être configuré dans l’appareil d’alimentation sémantique d’hôtel 31. L’horodatage est utilisé pour déterminer si l’image devrait être retraitée. Les algorithmes utilisés par le module de traitement d’images 37 se basent principalement sur les réseaux neuronaux et d’apprentissage automatique, et leur précision s’améliore en continu, de sorte qu’il peut être utile de retraiter une même image, si le traitement précédent a lieu il y a longtemps. Supposons que l’hôtel Cannero soit connu dans la base de données d’alimentation sémantique d’hôtel 34. Le module de collecte d’images 36 récupère l’ID de l’hôtel ABC676A&amp;DD dans l’enregistrement d’hôtel dans la base de données d’alimentation sémantique d’hôtel 34 (S50) (qui contient également des données identifiant l’hôtel, telles que son nom et son adresse) et génère un ID d’image unique pour une image de l’hôtel (S60), par exemple basé sur le hachage d’image ainsi qu’un horodatage, et il les associe à l’ID de l’hôtel. Pour l’image A, il génère un ID d’image unique 12345678 (S60), et vérifie dans la base de données d’alimentation sémantique d’hôtel 34 si l’image est connue (S70). Si l’image n’est pas connue, ce qui est le cas de l’image A dans notre exemple, le module de collecte d’images 36 stocke les informations suivantes dans la base de données d’alimentation sémantique d’hôtel 34 (S100):
À des fins de réalisation, l’image elle-même peut également être stockée.
Ensuite, le module de traitement d’images 37 est appelé. Le module de traitement d’images 37 est en charge de mettre automatiquement une légende aux images collectées par module de collecte d’images 36 (SI 10). Mettre une légende à une image consiste à extraire les mots-clés et les morceaux de phrases décrivant l’image et les éléments présents sur l’image. Ceci est réalisé par un algorithme de reconnaissance de modèle basé sur des réseaux neuronaux. Dans la publication « Show and Tell » : A Neural Image Caption Generator » (Montrer et raconter : un générateur de légendes sur les images neuronales) par Oriol Vinyals, Alexander Toshev, Samy Bengio et Dumitri Erhan (https://arxiv.org/abs/1411.4555). une éventuelle mise en œuvre d’un tel algorithme est expliquée. Sur la base d’un ensemble d’images d’apprentissage indépendantes, l’algorithme apprend à reconnaître des caractéristiques telles que la mer, une piscine, une montagne, un château, une vieille ville, des bâtiments hauts, l’autoroute, etc. Pour une image donnée, l’algorithme recherche les modèles correspondant à ces caractéristiques. Il peut en trouver plusieurs, permettant de définir des relations telles que « près de », « au bord de », « avec vue sur », etc. Plus il y a d’images traitées, mieux l’algorithme travaille. Pour l’image A, les extraits pourraient inclure : lac, montagnes, bleu, vert, maison méridionale, style italien, toit rouge.
Des morceaux de phrases peuvent typiquement inclure : bâtiment méridional traditionnel au bord d’un lac avec montagnes en arrière-plan, maison méridionale traditionnelle dans les montagnes près d’un lac.
La légende d’images (de l’étape de légendage SI 10) et la liste de tous les mots et morceaux de phrases extraits de l’image. Les algorithmes de reconnaissance d’images utilisés par le module de traitement d’images 37 sont formés à se focaliser sur les mots orientés sur les voyages. Par exemple, dans un autre contexte, formés différemment, les mêmes algorithmes auraient également reconnu « ciel, arbres, bâtiments, eau » sur l’image A. Un second processus apparaît dans le module de traitement d’images 37 : la catégorisation (S 120). La catégorisation est basée sur des algorithmes avec une approche mixte d’apprentissage supervisé et non supervisé. Les images sont regroupées sur la base des couleurs et des légendes. Les images avec des couleurs froides et/ou une légende telle que « salon avec bureau d’ordinateur », par exemple, seront regroupées sous « voyage d’affaires », tandis que l’image donnée dans l’exemple ci-dessus sera plus susceptible d’être regroupée sous « voyage de loisirs ». Le regroupement repose sur un ensemble de catégories prédéfini (voyage d’affaires, voyage de loisirs, mer, lac, montagne, architecture traditionnelle, architecture moderne) faisant référence aux principales tendances en matière de voyage sur un marché. Ces catégories sont stockées dans un dictionnaire des synonymes dans la base de données d’alimentation sémantique d’hôtel 34, peuvent évoluer au fil du temps et peuvent être différentes selon la zone géographique, la langue, l’application client, etc. Cette partie est un aspect configurable permettant la personnalisation et la spécialisation de l’appareil d’alimentation sémantique d’hôtel 31. Pour chaque image, le module de sortie 38 stocke la légende et l’horodatage du légendage dans la base de données d’alimentation sémantique d’hôtel 34 ainsi que la catégorisation et l’horodatage de catégorisation (S 130), établissant ainsi une association des mots-clés textuels de recherche et d’un hôtel en particulier. Pour l’image A :
Le processus pour l’image A est à présent terminé et l’appareil d’alimentation sémantique d’hôtel 31 peut passer à une image suivante.
La Fig. 4 illustre la communication entre un appareil d’alimentation sémantique d’hôtel 31 et les différents composants dans son environnement opérationnel, comme illustré à la Fig. 1, tout en exécutant le processus décrit ci-dessus. Dans ce contexte, un administrateur est une personne ou un processus en charge de la mise à jour de la source de données d’hôtel 20 en ajoutant ou en supprimant des images. Un utilisateur de TripAdvisor® peut par exemple
ajouter une image d’un hôtel référencé par TripAdvisor® sur le site Internet de TripAdvisor® ou un propriétaire d’hôtel peut ajouter une photo à un site Internet d’hôtel existant. Dans un mode de réalisation de l’invention, le stockage d’une image par un administrateur dans une source de données d’hôtel 20 déclenche l’activation de l’appareil d’alimentation sémantique d’hôtel 31. L’appareil d’alimentation sémantique d’hôtel 31 peut également être configuré pour être activé à intervalles réguliers, par ex. tous les lundis à 10 h. Prenons un exemple dans lequel un appareil d’alimentation sémantique d’hôtel 31 est activé en temps réel. L’appareil d’alimentation sémantique d’hôtel 31 écoute au moyen d’une API telle qu’un service Web vers différentes sources de données d’hôtel 20, incluant, entre autres, TripAdvisor®. Sur TripAdvisor®, un voyageur télécharge l’image A. En découvrant qu’une image a été ajoutée sur TripAdvisor®, l’appareil d’alimentation sémantique d’hôtel 31 active le module de collecte d’images 36. Le module de collecte d’images 36 collecte l’image A et les données identifiant l’image d’hôtel A auxquelles elle est liée (comme le nom de l’hôtel et son adresse) et vérifie, sur la base des données identifiant l’hôtel, si l’hôtel existe dans la base de données d’alimentation sémantique d’hôtel 34. Dans notre exemple, l’hôtel Cannero existe dans la base de données d’alimentation sémantique d’hôtel 34 et son unique ID d’hôtel est trouvé et récupéré. Le module de collecte d’images 36 génère ensuite un ID d’image et un horodatage pour l’image A, et vérifie si l’image A est connue dans la base de données d’alimentation sémantique d’hôtel 34. Parce que l’image A n’est pas connue, le module de collecte d’images 36 stocke son ID, adresse et horodatage dans la base de données d’alimentation sémantique d’hôtel 34 et appelle le module de traitement d’images 37. Le module de traitement d’images 37 exécute des algorithmes de reconnaissance image sur l’image A, met une légende à l’image, c.-à-d génère des mots-clés définissant les caractéristiques visualisées sur l’image qui sont liés à l’hôtel et au secteur du voyage. La légende obtenue est une liste d’expression de mots et peut dans le cas de l’image A être : lac, montagnes, bleu, vert, maison méridionale, style italien, toit rouge, bâtiment méridional traditionnel au bord d’un lac avec montagnes en arrière-plan, maison méridionale traditionnelle dans les montagnes près d’un lac. Le module de traitement d’images 37 exécute également une catégorisation sur la base des légendes et des couleurs de l’image, comme expliqué précédemment. Le module de sortie 38 stocke la légende et l’horodatage du légendage dans la base de données d’alimentation sémantique d’hôtel 34 ainsi que la catégorisation et l’horodatage de catégorisation.
Dans un mode de réalisation de l’invention, l’appareil d’alimentation sémantique d’hôtel 31 communique avec un système de réservation d’hôtel 40. Avant d’être activé, l’appareil d’alimentation sémantique d’hôtel 31 peut dans un premier temps synchroniser la base de données d’alimentation sémantique d’hôtel 34 avec la base de données d’hôtel 44 du système de réservation d’hôtel 40 en vérifiant, si les biens contenus dans la base de données d’hôtel 44 correspondent à ceux contenus dans la base de données d’alimentation sémantique d’hôtel 34 et en créant et/ou supprimant les enregistrements dans la base de données d’alimentation sémantique d’hôtel 34, si nécessaire. Prenons encore l’exemple de l’hôtel Cannero. Nous pouvons envisager un scénario avec l’hôtel Cannero existant dans le système de réservation d’hôtel 40 et, indépendamment de ses données d’identification, décrit par les éléments suivants dans la base de données d’hôtel 44 : 4 étoiles - hôtel près du lac - 60 chambres - restaurant - tennis - piscine - Lago Maggiore - Italie. Supposons que l’hôtel Cannero n’existe pas dans la base de données d’alimentation sémantique d’hôtel 34. Au moment de la synchronisation, basée sur l’identification de données d’hôtel telles que le nom de de l’hôtel (« hôtel Cannero »), aucun ID d’hôtel n’a été trouvé dans la base de données d’alimentation sémantique d’hôtel 34. Un ID d’hôtel unique est créé dans la base de données d’alimentation sémantique d’hôtel 34 et les données identifiant l’hôtel Cannero (récupérées dans la base de données d’hôtel 44) sont stockées ainsi qu’un pointeur sur l’hôtel Cannero dans le système de réservation d’hôtel 40. Si l’appareil d’alimentation sémantique 31 est par la suite activé, il fera défiler les sources de données 20 pour les images liées à l’hôtel Cannero. Dans un mode de réalisation de l’invention, l’appareil d’alimentation sémantique d’hôtel 31 est intégré dans un système de réservation d’hôtel 40 ; la base de données d’alimentation sémantique d’hôtel 34 et la base de données d’hôtel 44 sont fusionnées.
Dans un mode de réalisation particulier, le système de recherche sémantique d’hôtel 30 complète les données existantes structurées disponibles dans le système de réservation d’hôtel 40. Il est connu que les données du système de réservation d’hôtel sont souvent saisies manuellement par l’administrateur gérant des catalogues de centaines d’hôtels ou par des processus automatiques transposant les données d’une catégorisation de système à une autre en mode de meilleur effort, menant à une perte significative de données. Par conséquent, la quantité d’informations disponibles pour chaque hôtel dans système de réservation d’hôtel 40 est souvent réduite à un ensemble minimum de données communes. Les données collectées par l’appareil d’alimentation sémantique 31 peuvent automatiquement ajouter des informations qui sont spécifiques à un seul hôtel ou un nombre limité d’hôtels, dans le cas de l’hôtel Cannero : « situé dans un village traditionnel au bord d’un lac avec montagnes en arrière-plan ».
Dans un mode de réalisation particulier, le système de recherche sémantique d’hôtel 30 fournit des rapports sur la qualité des données entre les données structurelles disponibles dans le système de réservation d’hôtel 40 et les données collectées par l’appareil d’alimentation sémantique 31. Pour chaque type de champ de donnée qui est commun à la base de données d’hôtel 44 et la base de données d’alimentation sémantique d’hôtel 34, les rapports peuvent être générés périodiquement et mesurer la correspondance des valeurs de données. La compatibilité des valeurs de données peut être quantifiée. Dans ce mode de réalisation particulier, la base de données d’alimentation sémantique a des champs particuliers, c.-à-d. les mêmes champs de données que la base de données d’hôtel et elle essaye de les remplir avec la légende et les catégories des images liées à l’hôtel. Les champs communs peuvent être comparés, par exemple en utilisant le dictionnaire des synonymes qui associe le texte aux mots-clés et à un tableau de référence qui donne une valeur de compatibilité entre les différents mots-clés. La valeur de compatibilité correspond à un résultat entre 0 et 10.
En considérant un champ « lieu », les cas d’utilisation suivants peuvent apparaître :
Exemple 1
(*) lago signifie lac en italien
Le terme plus spécifique Lago Maggiore correspond au mot-clé « lac » dans le dictionnaire des synonymes et ensuite, la valeur de la base de données d’alimentation sémantique « au bord du lac » est comparée à « lac » en utilisant une table de référence. La valeur de compatibilité (telle qu’extraite de la table de référence) est 10.
Exemple 2
_,ago Maggiore correspond au mot-clé « lac » dans le dictionnaire des synonymes et ensuite, la valeur de la base de données d’alimentation sémantique « eau » est comparée à « lac ». La valeur de compatibilité (telle qu’extraite de la table de référence) est 8.
Exemple 3
Lago Maggiore correspond au mot-clé « lac » dans le dictionnaire des synonymes et ensuite, la valeur de la base de données d’alimentation sémantique « désert» est comparée à « lac ». La valeur de compatibilité (telle qu’extraite de la table de référence) est 0. C’est un mode de réalisation possible de la quantification de compatibilité des valeurs de données et la personne du métier comprendra que divers autres modes de réalisation sont possibles.
Un rapport peut être généré et répertorier les champs de données avec de mauvaises valeurs de compatibilité. L’administrateur peut être capable de fixer un seuil de compatibilité, c.-à-d. le niveau maximum permis pour les différences, par exemple la valeur de compatibilité 5. Si le seuil de compatibilité est franchi, une alerte (telle qu’un e-mail ou une autre alerte électronique) peut être générée et portée à la connaissance de l’administrateur du système, de sorte qu’il puisse entreprendre une action immédiate, par exemple en adaptant les données structurées, en supprimant les images dans la galerie d’images du système de réservation d’hôtel 40 ou en répertoriant une source de données spécifique 20 qui fournit des images trompeuses sur une liste noire.
Dans un mode de réalisation particulier, les données dans la base de données de recherche sémantique d’hôtel 34 peuvent remplacer les données structurées disponibles dans la base de données d’hôtel 44. Un algorithme modère la priorité de chaque champ dans la base de données d’hôtel 44 par rapport à une valeur calculée après chaque recherche réussie dans les données collectées par l’appareil d’alimentation sémantique d’hôtel 31 et stockées dans la base de données d’alimentation sémantique d’hôtel 34. Par exemple, si la base de données d’hôtel 44 ne contient pas d’informations sur la piscine concernant l’hôtel A, les informations collectées dans l’appareil d’alimentation sémantique 31 « il y a une piscine dans cet hôtel » remplaceront les informations stockées dans le système de réservation d’hôtel 40 et l’hôtel A sera affiché comme un hôtel avec piscine. Le changement de priorité pour la donnée « piscine » de la base de données d’hôtel 44 à la base de données d’alimentation sémantique d’hôtel 34 est fait après plusieurs recherches réussies de « hôtel avec piscine » parmi les images d’hôtel menant à l’hôtel A comme résultat et après plusieurs réservations de l’hôtel A dans le système de réservation d’hôtel 40.
Dans un mode de réalisation particulier, l’appareil d’alimentation sémantique d’hôtel 31 supprimera automatiquement les données générées si elles sont en contradiction avec les données disponibles dans le système de réservation d’hôtel 4®, l’objectif étant de conserver l’intégrité des données structurées du système de réservation d’hôtel 40. L’appareil d’alimentation sémantique d’hôtel 31 peut également dresser une liste noire de quelques sources d’images qui génèrent trop de différences avec le système de réservation d’hôtel 40. La liste noire s’appliquera non seulement aux hôtels où les différences ont été détectées mais aussi à un ensemble d’hôtels, par exemple sur la base de critères géographiques où les données collectées par l’appareil d’alimentation sémantique 31 seront considérées comme indignes de confiance ou non fiables.
Les comportements décrits ci-dessus peuvent être configurés et réglés séparément en fonction de la source des images utilisées par l’appareil d’alimentation sémantique 31. L’appareil d’alimentation sémantique 31 peut calculer les recommandations sur la fiabilité de chaque source de données 20 en fonction du niveau de qualité des données agrégées à la source de données 20 dans le temps.
Faisant maintenant référence à la Fig. 5, un système de recherche sémantique d’hôtel 30 contenant un composant d’établissement de rapports de recherche sémantique 33 est illustré dans son environnement d’exploitation. D’autres parties de l’image qui sont décrites ci-dessus sont étiquetées avec les mêmes numéros de référence. La manière dont ce composant fonctionne est expliquée plus en détail ci-dessous. A la Fig. 6, un exemple de travail de moteur de recherche sémantique d’hôtel 32 comme illustré à la Fig. 1 est décrit plus en détail au moyen d’un diagramme avec les étapes qui sont exécutées après qu’une demande d’utilisateur pour des options d’hôtel basées sur un texte libre a été reçue. Ce dessin présente également les actions exécutées par un composant d’établissement de rapports de recherche sémantique 33, lorsqu’une demande d’utilisateur est reçue par le moteur de recherche sémantique d’hôtel 32. Typiquement, un système de réservation d’hôtel 40 permet uniquement des demandes de recherches standardisées basées sur des critères de recherche simples, tels que le lieu, la catégorie d’hôtel, les types de chambre et les disponibilités. Une telle standardisation conduit habituellement un grand nombre de résultats correspondant aux critères de recherche. Par exemple : « hôtel 4* à Paris » retournera de nombreux résultats. Grâce aux données collectées par l’appareil d’alimentation sémantique 31, les critères non standards, non disponibles dans les systèmes de réservation d’hôtel 40, peuvent conduire l’agent voyage ou le futur voyageur à trouver un hôtel convenable, par exemple en cherchant dans les éléments proches de l’hôtel, visibles sur les photos de l’hôtel tels que « hôtel 4* à Paris avec lui sur la Seine, le Louvre et la tour Eiffel ». Supposons qu’un voyageur cherche un hôtel avec piscines ou vue sur les montagnes, près d’un village historique. Nous pouvons d’abord envisager un scénario où l’utilisateur saisit ces critères dans une boîte de recherche d’un système de réservation d’hôtel conventionnel 40. Cette base de données d’hôtel 44 contient l’hotel Cannero, décrit par les éléments suivants : 4 étoiles - hôtel près du lac - 60 chambres - restaurant - tennis - piscine - Lago Maggiore - Italie. Avec les mots-clés « natation », « vue sur les montagnes » et « près du village historique », la base de données d’hôtel 44 est interrogée. L’hôtel Cannero n’a pas trouvé, dans la mesure où un critère « natation » seulement correspond à un élément dans la description d’hôtel (« piscine »). Nous pouvons à présent envisager un environnement opérationnel conformément à l’invention. Le voyageur saisit « natation, vue sur les montagnes, près du village historique » (S200) dans une boîte de recherche sur un site Internet TA connecté à un système de recherche sémantique d’hôtel 30. La demande est reçue par le moteur de recherche sémantique d’hôtel 32 qui effectue une analyse sémantique sur les critères précisés par l’utilisateur. En utilisant les techniques de traitement du langage naturel, le moteur de recherche sémantique d’hôtel 32 mappe les critères saisis par l’utilisateur à des catégories de mots-clés prédéfinis qui sont stockés dans un dictionnaire des synonymes dans la base de données d’alimentation sémantique d’hôtel 34, par exemple : • natation —> eau • vue des montagnes —> montagnes • près du village historique —> architecture traditionnelle
Le composant d’établissement de rapports de recherche sémantique 33 génère un ID pour la demande d’utilisateur et sauvegarde l’ID et les mots-clés associés à la demande d’utilisateur dans sa base de données (S220). Avec les mots-clés générés sur la base de la demande d’utilisateur, le moteur de recherche sémantique d’hôtel 32 interroge la base de données d’alimentation sémantique d’hôtel 34 à la recherche d’hôtels avec des catégories correspondantes (S230). Si aucune correspondance n’est trouvée, un message correspondant s’affiche sur l’interface utilisateur (UI) et l’utilisateur peut être invité à effectuer une nouvelle recherche (S240). Dans cet exemple, au moins une correspondance est trouvée, puisque l’image A a été téléchargée par un voyageur et fait maintenant partie de la base de données d’alimentation sémantique d’hôtel 34. Sur la base des catégories de mots-clés « eau, montagne, architecture traditionnelle » auxquelles la demande de l’utilisateur a été mappée, la base de données d’alimentation sémantique d’hôtel 34 est interrogée. On trouve que les catégories de mots-clés font partie des catégories liées à l’ID d’image 12345678. L’hôtel Cannero, l’hôtel associé à l’ID d’image 12345678, est récupéré dans la base de données d’alimentation sémantique d’hôtel 34 (S260). Plus généralement, tous les hôtels dans la base de données d’alimentation sémantique d’hôtel 34 avec des images dont les catégories correspondent aux catégories auxquelles les critères de l’utilisateur ont été mappés sont récupérés dans la base de données d’alimentation sémantique d’hôtel 34 (S260). Une liste des hôtels est dressée sur l’interface utilisateur (UI) (S270).
Dans un mode de réalisation de l’invention, le système de rechercher sémantique 30 est associé un système de réservation d’hôtel 40 et dans la base de données d’alimentation sémantique d’hôtel 34, un pointeur est stocké avec chaque ID d’hôtel pointant l’hôtel correspondant dans la base de données d’hôtel 44. En cliquant sur un hôtel répertorié sur l’UI, l’utilisateur peut être redirigé vers le système de réservation d’hôtel 40 et être invité à faire une réservation (S280).
Dans un autre mode de réalisation, un système de mappage avec des catégories plus détaillées pour les critères d’utilisateur et/ou les légendes d’images peut être utilisé.
Toujours dans un autre mode de réalisation, le moteur de recherche sémantique d’hôtel 32 peut comparer les catégories de mots-clés avec légendes des images d’hôtel. Pour chaque demande d’utilisateur qui est faite, le composant d’établissement de rapports de recherche sémantique 33 sauvegarde le nombre d’hôtels trouvés et leur ID dans sa base de données (S250). Les données collectées par le composant d’établissement de rapports de recherche sémantique 33 peuvent être utilisées pour générer des rapports révélant le contenu manquant sur les images liées à l’hébergement de voyage. Un rapport décrivant les demandes populaires pour une région géographique particulière peut être généré et distribué aux administrateurs d’hôtels situés dans la région géographique dans laquelle ils n’ont pas été trouvés sur la base des demandes populaires. Cependant, les hôtels peuvent être ajustés aux critères d’utilisateur mais leur description ne peut pas contenir les critères d’utilisateur et les images liées aux hôtels ne peuvent pas représenter les critères. Dans ce cas, les administrateurs peuvent être incités à compléter la description des hôtels ou à ajouter des images présentant les critères populaires sur les galeries d’images des hôtels. Il se peut aussi qu’un hôtel sur une zone géographique particulière ne remplisse pas les critères populaires de l’utilisateur. Si tel est le cas, les rapports générés par le composant d’établissement de rapports de recherche sémantique 33 peut permettre au propriétaire d’hôtel dévalué les revenus supplémentaires, s’il décide d’entreprendre des travaux, de sorte que l’hôtel remplisse les critères d’utilisateur populaires. Les rapports générés peuvent également être utilisés pour auto-enrichir le dictionnaire des synonymes. Si plusieurs critères sont mappés au même mot-clé, alors l’algorithme d’apprentissage automatique peut créer un ensemble de nouveaux mots-clés qui sont des sous-catégories dudit mot-clé. Cela permet de rendre les catégories plus subtiles et plus précises dans la recherche. Par exemple, « eau » peut avoir les sous-catégories « lac », « piscine », « bassin », « océan » et « mer ».
La Fig. 7 est un diagramme séquentiel illustrant la communication entre un moteur de recherche d’alimentation sémantique d’hôtel 32 et les différents composants dans son environnement opérationnel, comme illustré à la Fig. 1, tout en exécutant le processus décrit ci-dessus. Conformément au mode de réalisation illustré, un utilisateur, un agent de réservation tiers ou un voyageur, peut utiliser un dispositif client 5 pour accéder à l’interface Web d’un système TA 10 et chercher un hôtel. L’utilisateur peut choisir de ne pas sélectionner les critères prédéterminés mais de saisir une demande de recherche avec texte libre, en saisissant le texte dans un panneau de recherche ou en enregistrant un message vocal. Le système TA 10 envoie la demande d’utilisateur à un système de recherche sémantique d’hôtel 30 où il est reçu par un moteur de recherche sémantique d’hôtel 32. Le moteur de recherche sémantique d’hôtel 32 effectue une analyse sémantique de la demande d’utilisateur mappant le texte libre tel que par l’utilisateur avec les mots-clés. Le moteur de recherche sémantique d’hôtel 32 interroge alors la base de données d’alimentation sémantique d’hôtel 34 avec ces mots-clés. Les hôtels avec des catégories d’images ou des légendes correspondantes sont retournés au moteur de recherche sémantique d’hôtel 32 comme expliqué plus en détail ci-dessus. Le moteur de recherche sémantique d’hôtel 32 collecte les noms d’hôtels et les pointeurs sur ces hôtels dans le système de réservation d’hôtel 40 dans la base de données d’alimentation sémantique d’hôtel 34, regroupe les informations collectées dans une liste et les envoie via le réseau 15 au système TA 10, pour les afficher sur le dispositif client 5. L’utilisateur voit plusieurs options d’hôtel fourni par le système de recherche sémantique d’hôtel 30 au système TA 10 et peut choisir un hôtel et effectuer une demande de disponibilité, en saisissant une date d’arrivée et une date de départ dans le système TA 10. La demande de disponibilité est envoyée au système de réservation d’hôtel 40 pour l’hôtel particulier sélectionné. La base de données d’hôtel 44 est interrogée et retourne un statut de disponibilité pour l’hôtel particulier qui est converti en un message et envoyé au système TA. Si l’hôtel demandé par l’utilisateur est disponible aux dates choisies, l’utilisateur peut réserver l’hôtel. La demande de réservation est envoyée au système de réservation d’hôtel 40 et est traitée.
Les modes de réalisation décrit ci-dessus sont donnés à titre d’exemple uniquement et d’autres modes de réalisation peuvent être imaginés par les personnes de métier tout en restant dans la portée des revendications suivantes.

Claims (9)

  1. REVENDICATIONS
    1. Un appareil d’alimentation sémantique (31 ) pour extraire les données d’images liées à un hébergement de voyage comprenant : - un module de collecte d’images (36) configuré, pour chaque hébergement de voyage, pour demander au moins une source de données (20) comprenant des images associées à l’hébergement de voyage, et pour collecter au moins une image liée à l’hébergement de voyage ; - un module de traitement d’images (37) configuré pour traiter chacune d’au moins une image en utilisant des algorithmes basés principalement sur les réseaux neuronaux et d’apprentissage automatique de sorte à: o extraire une caractéristique d’identification de l’hébergement de voyage par un algorithme de reconnaissance de modèle extrayant les mots-clés et les morceaux de phrases décrivant l’image et les éléments présents sur 1 image sur la base d’un ensemble d’images d’apprentissage indépendantes; o convertir la caractéristique d’identification en texte et o correler le texte à au moins un mot-clé textuel de recherche en utilisant un dictionnaire des synonymes ; et - un module de sortie (38) configuré pour ledit au moins mot-clé textuel de recherche, pour stocker une association de l’hébergement de voyage, de ladite au moins une image liée à l’hébergement de voyage et du texte converti à partir de la caractéristique d’identification de l’hébergement de voyage dans une base de données.
  2. 2. Un système informatique (30) pour effectuer une recherche d’hébergement de voyage basé sur des critères saisis par un utilisateur, comprenant : - un appareil d’alimentation sémantique (31) selon la revendication 1 ; - une base de données d’alimentation sémantique (34) pour stocker la sortie de données par le module de sortie (38) ; et - les moyens de connecter la base de données d’alimentation sémantique (34) via un réseau (15) a au moins un dispositif client (5) comprenant une interface utilisateur, dans lesquels le système est configuré pour recevoir une demande d’utilisateur comprenant des critères spécifiques d’hébergement de voyage via l’interface utilisateur, rechercher dans la base de données d’alimentation sémantique des mots-clés textuels de recherche coirespondant aux critères de la demande et afficher une liste d’hébergements de voyage représentés par les mots-clés textuels de recherche sur l’interface utilisateur.
  3. 3. Le système (30) selon la revendication 2 comprenant un composant d’établissement de rapports de recherche (33), le composant d’établissement de recherche comprenant : - une première base de données configurée pour stocker les critères spécifiques d’hebergement de voyage précisés par un utilisateur pour rechercher dans une seconde base de données de mots-elés textuels liés à des images et, pour chaque ensemble de critères de recherche, pour stocker un nombre de résultats de recherche ; et - un module configuré pour générer des rapports comprenant les recherches réalisées sur une période de temps prédéterminée, pendant laquelle au moins un rapport est basé sur le nombre de résultats de sortie dans les recherches sur la période de temps prédéterminée et concerne le contenu manquant sur les images liées à l’hébergement de voyage.
  4. 4. Le système (30) selon l’une quelconque des revendications 2 à 3, dans lequel le système est configuré pour activer l’appareil d'alimentation sémantique (31) au moins : (i) le temps de mise à disposition d’une nouvelle image dans une source de données(20); (ii) le temps d’une nouvelle demande d’utilisateur ; et (iii) un temps prédéterminé.
  5. 5. Le système (30) selon l’une quelconque des revendications 2 à 4, dans lequel la base de données d’alimentation sémantique (34) est configurée pour stocker les données hees aux hôtels et l’appareil d’alimentation sémantique (31) est configuré pour être en communication directe avec au moins un système de réservation d’hôtel (40).
  6. 6. Le système (30) selon la revendication 5, dans lequel le système est configuré, avant l’activation de l’appareil d’alimentation sémantique (31), pour mettre à jour les données d’hotel stockées dans la base de données d’alimentation sémantique (34) avec les données d’hôtel stockées dans une base de données du système de réservation d’hôtel (44) au moins, et pour chaque hôtel, pour stocker un pointeur dans la base de données d’alimentation sémantique sur la description d’hôtel dans le système de réservation d’hôtel.
  7. 7. Le système (30) selon l’une quelconque des revendications 5 à 6, comprenant par ailleurs un composant d’établissement de rapports sur la qualité des données, le composant d’établissement de rapports sur qualité des données comprenant : - les moyens de déterminer les champs de données qui sont communs à la base de données d’alimentation sémantique (34) et à la base de données du système de réservation d’hôtel (44) ; - les moyens de comparer, pour chaque champ de données qui est commun à la base de données d’alimentation sémantique et à 1a base de données du système de réservation d’hôtel, la valeur dans les deux bases de données ; - les moyens de quantifier la compatibilité desdites valeurs ; - les moyens de générer un rapport sur la compatibilité entre lesdites valeurs ; - les moyens de générer des alertes en cas de différences entre lesdites valeurs.
  8. 8. Le système (30) selon la revendication 7, comprenant : - les moyens de supprimer, pour un champ de données qui est commun à la base de données d’alimentation sémantique (34) et à la base de données du système de réservation d’hôtel (44), les données dans la base de données d’alimentation sémantique, s’il est déterminé qu’elles ne sont pas compatibles avec les données dans la base de données de réservation d’hôtel.
  9. 9. Le système (30) selon la revendication 7, comprenant : - les moyens de déterminer la priorité de la base de données du système de réservation d’hôtel (44) ou de la base de données d’alimentation sémantique (34) concernant un champ de données commun à la base de données du système de réservation d’hôtel et à la base de données d’alimentation sémantique ; - les moyens de diriger la demande d’utilisateur vers la base de données priorisée.
FR1754093A 2017-05-10 2017-05-10 Recherche semantique d'hebergement, basee sur les images Pending FR3066300A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1754093A FR3066300A1 (fr) 2017-05-10 2017-05-10 Recherche semantique d'hebergement, basee sur les images

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1754093A FR3066300A1 (fr) 2017-05-10 2017-05-10 Recherche semantique d'hebergement, basee sur les images
FR1754093 2017-05-10

Publications (1)

Publication Number Publication Date
FR3066300A1 true FR3066300A1 (fr) 2018-11-16

Family

ID=60923541

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1754093A Pending FR3066300A1 (fr) 2017-05-10 2017-05-10 Recherche semantique d'hebergement, basee sur les images

Country Status (1)

Country Link
FR (1) FR3066300A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229899A1 (en) * 2005-03-11 2006-10-12 Adam Hyder Job seeking system and method for managing job listings

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229899A1 (en) * 2005-03-11 2006-10-12 Adam Hyder Job seeking system and method for managing job listings

Similar Documents

Publication Publication Date Title
CA2804230C (fr) Procede mis en oeuvre par ordinateur, produit programme informatique et systeme informatique pour traiter une image
JP6930041B1 (ja) 検索/作成されたデジタルメディアファイルに基づく潜在的関連のあるトピックの予測
EP1364316A2 (fr) Dispositif d&#39;extraction d&#39;informations d&#39;un texte a base de connaissances
Liu et al. Finding media illustrating events
FR2750519A1 (fr) Procede d&#39;extraction de documents de bases de donnees
FR2973134A1 (fr) Procede pour affiner les resultats d&#39;une recherche dans une base de donnees
CN110633406B (zh) 事件专题的生成方法、装置、存储介质和终端设备
CN111191133B (zh) 业务搜索处理方法、装置及设备
US20160012078A1 (en) Intelligent media management system
WO2019200040A1 (fr) Système et procédé de recherche assistée par ia
CN112069326A (zh) 知识图谱的构建方法、装置、电子设备及存储介质
US10114891B2 (en) Method and system of audio retrieval and source separation
US11216894B2 (en) Image-based semantic accommodation search
EP1763790A1 (fr) Procede et dispositif de recherche avec conservation personnalisee des resultats
FR3066300A1 (fr) Recherche semantique d&#39;hebergement, basee sur les images
CN112328813A (zh) 基于ai的推荐信息生成方法、装置及计算机设备
US11816147B2 (en) Enhanced image-search using contextual tags
CN109284364A (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
FR2891071A1 (fr) Procede et systeme pour generer une animation visuelle a partir d&#39;informations stockees dans une base de donnees multimedia.
FR2864856A1 (fr) Systeme automatique de traitement des informations portees par des textes courts
CN110309408B (zh) 一种自动化搜索的方法
FR2897500A1 (fr) Procede, systeme et terminal de communication pour proposer un ecran d&#39;accueil a un utilisateur
EP2902927B1 (fr) Procédé et dispositif d&#39;étiquetage d&#39;au moins un objet multimédia
EP4155967A1 (fr) Procédé d&#39;échanges d&#39;informations sur un objet d&#39;intérêt entre une première et une deuxième entités, dispositif électronique d&#39;échange d&#39;informations et produit programme d&#39;ordinateur associés
WO2022129760A2 (fr) Procede de collecte de donnees, procede d&#39;exploitation de donnees collectees, dispositif electronique et produits programme d&#39;ordinateur et support correspondants

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20181116

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7