FR2946773A1 - Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique. - Google Patents

Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique. Download PDF

Info

Publication number
FR2946773A1
FR2946773A1 FR0953954A FR0953954A FR2946773A1 FR 2946773 A1 FR2946773 A1 FR 2946773A1 FR 0953954 A FR0953954 A FR 0953954A FR 0953954 A FR0953954 A FR 0953954A FR 2946773 A1 FR2946773 A1 FR 2946773A1
Authority
FR
France
Prior art keywords
information
recognition
database
beacon
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0953954A
Other languages
English (en)
Inventor
Bertrand Labaye
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR0953954A priority Critical patent/FR2946773A1/fr
Publication of FR2946773A1 publication Critical patent/FR2946773A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

L'invention concerne un procédé de reconnaissance d'informations, comprenant une étape de marquage d'une zone comprenant des informations à reconnaître au moyen d'au moins une balise graphique, laquelle présente au moins une caractéristique prédéfinie, une étape d'acquisition d'au moins une image de cette zone, une étape de détection, dans cette image acquise, d'une caractéristique prédéfinie, et si une caractéristique prédéfinie est détectée, une étape de reconnaissance des informations appartenant à la zone marquée par la balise graphique. L'invention concerne également un dispositif de reconnaissance d'informations apte à réaliser le procédé ci-avant, ainsi qu'un programme informatique correspondant.

Description

Procédé et dispositif de reconnaissance d'informations au moyen d'une balise graphique DOMAINE TECHNIQUE DE L'INVENTION L'invention concerne le domaine de la reconnaissance d'informations, notamment à usage d'utilisateurs malvoyants. ETAT DE LA TECHNIQUE ANTERIEURE Le besoin de reconnaître des informations liées à des objets existe depuis longtemps, dans différents contextes comme par exemple celui de l'identification d'objets, et diverses solutions techniques ont été développées afin de répondre en partie à ce besoin. Dans un premier exemple courant, l'identification d'un objet par une machine peut s'effectuer en utilisant un code barre. De tels codes barres sont placés sur l'objet à identifier et contiennent des données d'identification nécessitant un codage spécifique de l'information. Un scanner est alors nécessaire pour lire le code barre afin d'identifier l'objet. Les inconvénients de ces codes barres consistent, entre autres, en un manque de lisibilité (le codage particulier le rendant illisible pour un être humain), un manque d'esthétisme (l'aspect de l'objet sur lequel est imprimé le code barre est dégradé), une mauvaise ergonomie de positionnement du lecteur de code barre, qui doit être placé à proximité et face au code barre pour opérer correctement, un risque d'endommagement même léger du code barre le rendant illisible par un lecteur. Enfin, les lecteurs de code barre ne permettent pas de lire ou d'identifier les données qui se trouvent à proximité du code barre. Ces lecteurs ne sont pas capables de lire un texte ou de reconnaître un objet. Dans un deuxième exemple courant, on utilise un système dit RFID (Radio Frequency Identification) permettant de récupérer des données à distance en utilisant des marqueurs appelés radio-étiquettes . De tels systèmes RFID, bien que permettant de diminuer les contraintes de positionnements liées aux systèmes à codes barres, présentent des inconvénients quasiment identiques à ceux de ces systèmes à code barre. En outre, l'utilisation de telles radios étiquettes RFID entraîne un coût non négligeable, puisqu'une étiquette particulière est nécessaire sur chacun des objets à identifier. Il existe en outre des systèmes de vision utilisant des mires permettant de se positionner dans l'environnement. Ces mires permettent de calibrer une caméra destinée à les détecter, mais ne fournissent pas d'informations sur le type d'objets à reconnaître. Leur mise en oeuvre n'est pas simple, car il est nécessaire de régler et de calibrer précisément les mires dans l'environnement. Les systèmes de reconnaissance existants sont spécialisés pour une tâche précise, soit pour la reconnaissance de quelques objets ou d'un type de forme appris pendant des phases d'apprentissage, soit pour la reconnaissance de certains caractères uniquement. Dans le premier cas évoqué, l'apprentissage ne peut être effectué que lors de la mise au point du logiciel, ce qui limite les possibilités d'évolution de tels systèmes.
De tels systèmes de reconnaissance de formes sont connus et utilisés, mais leur conception complexe rend leur implémentation dans des systèmes portables difficile du fait des performances matérielles nécessaires à leur bon fonctionnement.
Dans le monde réel, une simple image ne fournit pas les informations suffisantes permettant à un système de reconnaissance optique d'améliorer ses performances en termes de rapidité et de fiabilité. L'analyse d'une image est très coûteuse en temps de calculs et la qualité des informations reconnues par les systèmes est incertaine. Les risques de confusion et de non reconnaissance sont difficilement maîtrisables. En outre, dans le domaine du traitement d'image, il existe des logiciels de reconnaissance de caractères ou de formes quelconques. Cependant, les logiciels de reconnaissance d'objets dits OOR (pour Optical Object Recognition) ou de reconnaissance de caractère dits OCR (pour Optical Character Recognition) connus actuellement présentent des inconvénients de plusieurs ordres. D'une part, les algorithmes de reconnaissance OOR ou OCR sont spécifiques à une application donnée, ils sont spécialisés dans la reconnaissance de caractères ou d'un nombre d'objets limités. L'identification d'un objet ne peut donc s'effectuer que si on utilise l'OCR ou l'OOR adapté. Ceci impose à l'application de reconnaissance d'essayer les différents algorithmes les uns après les autres.
D'autre part, les algorithmes de reconnaissance OOR ou OCR ne peuvent pas être embarqués sur des processeurs de faible puissance pour des raisons de faible performance en rapidité et nécessitent une mise en oeuvre complexe. De plus l'apprentissage de ces algorithmes n'est utilisé que pendant la mise au point du logiciel. EXPOSE DE L'INVENTION Un objet de l'invention consiste à proposer un système portable, pouvant être embarqué dans un appareil à bas coût comme un appareil photo numérique grand public par exemple, fiable et dont la qualité des informations reconnues doit pouvoir être mesurée. Le temps de réponse d'un tel système doit pouvoir satisfaire les besoins de l'utilisateur final. De plus, le nombre de formes reconnues doit pouvoir être facilement enrichi. Enfin, les informations à destination du système de reconnaissance doivent être facile à traiter et sans impact pour l'utilisateur final. La présente invention propose à cet effet un procédé de reconnaissance d'informations, comprenant une étape de marquage d'une zone comprenant les informations à reconnaître au moyen d'au moins une balise graphique, laquelle présente au moins une caractéristique prédéfinie, une étape d'acquisition d'au moins une image de ladite zone, et si la au moins une caractéristique prédéfinie est détectée lors d'une étape de détection, une étape de reconnaissance des informations appartenant à la zone marquée par la balise graphique. Avantageusement, l'étape de détection de la caractéristique prédéfinie est suivie par une étape d'identification de la balise en fonction de la caractéristique détectée, ce qui permet de connaître la nature des informations à reconnaître. De préférence, le procédé comporte une étape de configuration de l'algorithme de reconnaissance à utiliser pour reconnaitre les informations en fonction de la balise identifiée. Ceci permet d'adapter l'algorithme de reconnaissance au type d'informations à reconnaître. Avantageusement, l'étape de reconnaissance des informations est suivie par au moins une étape d'apprentissage des informations si les informations ne sont pas reconnues lors de l'étape de reconnaissance. Cela permet d'améliorer la connaissance des informations. Préférentiellement, l'étape d'apprentissage comprend une étape d'association d'au moins une caractéristique à associer aux informations non reconnues et une étape de sauvegarde des informations non reconnues et de la caractéristique associée dans une base de données. Dans un mode préféré, l'étape d'association comprend la saisie par un utilisateur d'au moins une des caractéristiques à associer aux informations non reconnues. Cela permet à ce dernier de contrôler s'il veut ou non que le dispositif apprenne de nouvelles formes ou de nouveaux caractères. Dans un autre mode préféré, l'étape d'association comprend la génération d'au moins une des caractéristiques à associer à la forme non reconnue en fonction de la balise détectée. Cela permet l'apprentissage automatique de nouvelles formes, sans intervention de l'utilisateur. De préférence, la base de données est une base de données d'apprentissage (BDa), et le procédé comporte par une étape de lancement d'un algorithme d'apprentissage (418,436) au moyen de la base de données d'apprentissage (BDa). Dans un mode préféré, le procédé comprend une étape ultérieure d'interfaçage des informations reconnues à destination d'un utilisateur. En particulier, cette étape ultérieure d'interfaçage peut comporter la conversion des informations en un message audio, ce qui permet l'utilisation du dispositif par des malvoyants. La présente invention vise aussi un dispositif de reconnaissance d'informations comportant des moyens pour mettre en oeuvre le procédé ci-avant. La présente invention vise par ailleurs un programme informatique comprenant des instructions pour la mise en oeuvre du procédé ci-avant.
DESCRIPTION DES DESSINS D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels : - la figure 1 illustre les étapes d'un procédé de reconnaissance d'informations selon la présente invention ; - la figure 2A est un schéma synoptique illustrant un dispositif de reconnaissance selon la présente invention ; - les figures 2B et 2C illustrent deux modes de réalisation du dispositif de reconnaissance selon la présente invention ; - la figure 3A illustre les étapes d'un procédé de repérage et d'identification de balise graphique selon la présente invention ; - la figure 3B illustre les étapes d'un procédé de reconnaissance d'informations dans un mode de réalisation de la présente invention ; - la figure 4A illustre un premier mode de réalisation d'un procédé d'apprentissage selon la présente invention ; - la figure 4B illustre un deuxième mode de réalisation d'un procédé d'apprentissage selon la présente invention ; - la figure 4C illustre un procédé de lancement de l'algorithme d'apprentissage selon la présente invention ; - la figure 4D illustre un troisième mode de réalisation d'un procédé d'apprentissage selon la présente invention ; - la figure 5A illustre un premier exemple de dispositif de reconnaissance associé à une balise graphique sur une chaîne industrielle ; - la figure 5B illustre un deuxième exemple d'un dispositif de reconnaissance optique associé à une balise graphique dans une caméra embarquée ; - la figure 5C illustre un troisième exemple de dispositif de reconnaissance optique associé à une balise graphique principale et un ensemble de balises graphiques secondaires selon la présente invention ; et - les figures 6A-6D illustrent un quatrième exemple de reconnaissance d'informations selon la présente invention. EXPOSE DETAILLE DES MODES DE REALISATION DE L'INVENTION On se réfère tout d'abord à la figure 1, laquelle illustre les étapes d'un procédé de reconnaissance d'informations selon la présente invention.
Lors de la première étape 101 d'un tel procédé consiste, une ou plusieurs balises graphiques sont associées à un certain nombre d'informations à reconnaître. Le terme informations est entendu ici dans son sens large et recouvre tout type d'informations, que ce soit sous une forme textuelle avec des caractères d'un certain type ou sous la forme d'un objet particulier. Dans le cas où une seule balise graphique est employée, celle-ci permet de repérer rapidement les informations à reconnaître dans un périmètre donné. La balise graphique employée va présenter une ou plusieurs caractéristiques permettant sa détection rapide.
Une telle caractéristique peut consister par exemple en une couleur particulière, ou en une forme particulière. Plus ces caractéristiques seront simples (par exemple, dans le cas d'une caractéristique de forme, si l'on choisit une forme élémentaire comme par exemple un carré ou un triangle), plus la détection de la balise graphique sera aisée. La balise graphique, du fait qu'elle ne contient aucun codage particulier, peut être implémentée sous différentes formes en fonction de l'application finale. La balise graphique peut être un voyant lumineux, un logo publicitaire, un panneau, une affiche, un dessin, représenter une marque, etc... Une telle balises graphique, servant au repérage des informations à reconnaître, permet d'accélérer et de fiabiliser le processus de reconnaissance par rapport aux systèmes déjà connus évoqués précédemment. La seule contrainte de définition de la balise graphique est qu'elle soit connue du système de reconnaissance et qu'elle soit facilement identifiable dans l'environnement ambiant. Une telle balise graphique peut donc être facilement intégrable à un produit existant. Une balise graphique telle qu'introduite ci-avant et correctement conçue peut être rendue agréable au regard et représenter une marque, un logo ou un dessin quelconque leur conférant ainsi une double efficacité . rôle de balise graphique et de publicité par exemple. Ceci est un avantage propre à l'invention puisque les codes barres ou RFID ne peuvent en aucun cas mutualiser les deux aspects. Par ailleurs, les codes barres peuvent être facilement endommagés alors que la balise graphique de l'invention est plus robuste dans le sens ou le système de reconnaissance est plus tolérant qu'un lecteur de code barre en cas de rayures, taches ou autres. De plus, les codes barres ou les RFID ne peuvent pas, non plus, être placés à plusieurs mètres du scanner ou du lecteur radio, alors que la balise graphique, si elle est correctement dimensionnée, peut être placée à plusieurs mètres du système optique. La balise graphique peut être facilement implémentée sur un objet ou dans l'environnement ambiant. En effet, la balise graphique peut être, par exemple, une étiquette que l'on colle directement sur l'objet à reconnaître, etc...
La balise graphique ne nécessite pas un positionnement précis sur l'objet, il faut qu'elle soit simplement positionnée à proximité des informations à reconnaître. La balise graphique permet de fournir une indication sur le niveau de qualité avec lequel les informations seront reconnues. La zone à reconnaître sera donc reconnue avec une maîtrise du taux d'erreur. Dans le cas où plusieurs balises graphiques seraient utilisées conjointement, on peut définir une balise graphique principale permettant de détecter rapidement les informations dans un environnement donné et des balises graphiques secondaires pour fournir des informations complémentaires indiquant, par exemple, la fin des informations à reconnaitre ou indiquant un changement de type d'informations à reconnaitre. La balise graphique, de par une caractéristique prédéfinie telle que sa forme, sa taille ou sa couleur, indique à un éventuel dispositif de reconnaissance qu'il est bien dans une zone qui est reconnaissable par le sous- système. Cette identification de périmètre permet au dispositif, d'une part, d'éviter toute confusion avec des données qui ne sont pas à reconnaître et qui pourraient induire en erreur l'utilisateur final. D'autre part, cette identification permet de garantir que les formes utilisées dans le périmètre sont connues par le dispositif, par exemple qu'elles sont déjà apprises grâce à l'algorithme de reconnaissance de formes.
Quand la balise graphique est représentée par une forme simple et ne comporte pas d'informations codées (comme un code barre par exemple), l'identification de celle-ci peut être effectuée à des distances importantes. Lors d'une deuxième étape 103, une image est acquise grâce à un dispositif de reconnaissance d'informations. Lors d'une troisième étape 105, on effectue la détection, dans l'image acquise, d'un certains nombres de caractéristiques prédéfinies correspondant à un certain type de balise graphique. Si cette détection s'avère négative, c'est-à-dire si aucune des caractéristiques prédéfinies n'est trouvée dans l'image acquise, aucune balise n'est présente dans l'image, qui ne contient donc aucune information à reconnaître. A l'inverse, si la détection s'avère positive, c'est-à-dire si au moins une des caractéristiques prédéfinies est présente dans l'image, celle-ci contient au moins une information à reconnaître. Dans ce dernier cas, une étape 107 de reconnaissance d'informations est alors effectuée. Dans un mode de réalisation avantageux, le type de balise graphique peut servir à distinguer le type de données à reconnaître. Par exemple, une balise graphique de forme carrée peut être associée à un texte, tandis qu'une balise graphique ronde ou en ellipse peut être associée à un objet. On peut aussi imaginer utiliser une information supplémentaire dans la balise graphique pour indiquer, par exemple, le type de police de caractère utilisé dans le texte à reconnaître. Avec ce mode de réalisation, le procédé de reconnaissance adapté au type d'informations peut être utilisé. Ainsi, si une balise graphique associée à du texte est détectée, on peut utiliser un algorithme de reconnaissance de caractères au cours de l'étape 107. A l'inverse, si une balise graphique associée à un type d'objet particulier est détectée, on utilise alors un algorithme de reconnaissance d'objet. Afin d'assurer la bonne reconnaissance des informations lors de l'étape 107, ces informations respectent avantageusement un certain nombre de critères de reconnaissance. Tout d'abord, ces informations à reconnaitre se situent de préférence dans un périmètre défini autour de la balise graphique. De plus, un seul type d'informations à reconnaitre est associé à une balise graphique précise. Ces caractères ou objets sont alors spécifiques à cette balise. Par ailleurs, le type d'informations à reconnaitre est préalablement connu du dispositif de reconnaissance, par exemple grâce à un algorithme d'apprentissage utilisé préalablement. Le résultat de cet apprentissage est stocké dans des bases de données de l'algorithme de reconnaissance, dans le dispositif de reconnaissance. Les critères énoncés ci-dessus garantissent la reconnaissance des informations extraites par l'algorithme de reconnaissance avec le niveau de fiabilité et de qualité adapté aux besoins de l'utilisateur. Les informations d'aide à la vision extraites précédemment (caractérisées par leur type ) permettent de sélectionner la base de données qui permettra de configurer dynamiquement l'algorithme de reconnaissance d'informations. Une fois configuré, l'algorithme de reconnaissance d'informations utilise en entrée les données acquises lors de l'étape 103, par exemple sous format numérique. Ces données peuvent être préalablement formatées de manière à être compatibles avec un algorithme de reconnaissance de formes ou de caractères.
Pour effectuer la reconnaissance de données, on peut employer des algorithmes de reconnaissance de forme existants, comme ceux appliqués aux méthodes de reconnaissance d'objets (OOR) ou de caractères (OCR). L'algorithme qui est utilisé dans l'invention fait appel aux réseaux neuronaux, ce qui permet d'avoir un système complètement embarqué et portable. Suite à cette étape 107, les informations reconnues sont fournies en sortie, par exemple sous forme numérique. Ces informations, transférées à l'utilisateur final, peuvent alors être converties, lors d'une étape 109, en un signal audio ou affichées sur un écran, entre autres, afin d'être compréhensibles par l'utilisateur final. Une information sur la qualité et la fiabilité des informations venant d'être reconnues pourra aussi être communiquée à l'utilisateur final s'il le désire. Le mode opératoire d'un dispositif de reconnaissance conforme à l'objet de l'invention sera maintenant décrit en liaison avec la figure 2A, laquelle constitue un schéma synoptique illustrant un dispositif de reconnaissance d'informations selon la présente invention. Sur cette figure 2A, un dispositif de reconnaissance 200 comprend des moyens d'acquisition d'images 201 aptes à prendre une image d'une zone d'informations comprenant une balise graphique. Un tel module d'acquisition 201 peut consister en un capteur numérique, par exemple. Le dispositif de reconnaissance 200 comporte par ailleurs des moyens de mémorisation 203 aptes à mémoriser un certain nombre de bases de données d'informations telles que la base de données de balises BDb et un nombre n de bases de données d'informations BD1,...,BDn. De tels moyens de mémorisations peuvent consister en une mémoire ROM, RAM, Flash, SD, ou tout autre type de mémoire couramment employé. Les moyens de mémorisation 203 peuvent aussi contenir une base de données d'apprentissage BDa. Le dispositif de reconnaissance 200 comporte en outre des moyens de traitement 205 connectés aux moyens d'acquisition 201 et aux moyens de mémorisation 203.
Ces moyens de traitement 205 vont recevoir l'image sous forme numérique reçue par les moyens 201 et la traiter grâce à des algorithmes de reconnaissance de forme utilisant l'une ou l'autre des bases de données stockées dans les moyens de mémorisation 203.
Ainsi, les moyens de traitement 305 peuvent appliquer à l'image numérique reçue un algorithme de reconnaissance de forme utilisant la base de données de balises Bdb selon un procédé de reconnaissance connu de l'homme du métier. Cet algorithme fournit comme résultat une ou plusieurs balises graphiques détectée(s) dans l'image. De même, les moyens de traitement 205 peuvent appliquer à l'image numérique reçue un algorithme de reconnaissance de forme utilisant l'une des bases de données d'informations Bdl,...,BDn selon un procédé de reconnaissance connu de l'homme du métier. La sélection de la base de données d'informations à utiliser peut être effectuée grâce à l'analyse de la balise graphique détectée. Dans ce cas, l'algorithme fournit comme résultat des informations reconnues dans l'image. De tels moyens de traitement 205 peuvent consister en un micro-processeur, par exemple d'appareil photo numérique ou de téléphone portable.
Le dispositif de reconnaissance 200 comporte avantageusement des moyens de transfert de données 207 permettant d'enrichir les bases de données des moyens de mémorisation 203. Cet enrichissement s'effectue par le chargement de bases de données de reconnaissance d'objets, de caractères ou de nouvelles balises graphiques. Ce module de chargement de données peut consister, par exemple en un lecteur de cartes SD ou MMC, en un port de liaison série, en une interface radio, ou tout autre moyen capable de recevoir des données numériques destinées à être mémorisées dans l'une des bases de données stockées dans les moyens de mémorisation 203. Lorsque ces moyens 207 consistent en une interface permettant la connexion à un système externe comme par exemple un ordinateur ou un réseau informatique, l'utilisateur peut transférer d'éventuelles nouvelles balises graphiques acquises à un système externe chargé de générer de nouvelles bases de données de reconnaissance. Une fois ces nouvelles bases de données régénérées, elles pourront être à nouveau téléchargées dans le dispositif de reconnaissance 200 afin que celui-ci puisse reconnaître des balises qu'il ne connaissait pas avant la mise en oeuvre du procédé. Une telle remise à jour des bases de données des algorithmes de reconnaissance peut s'effectuer de la manière suivante: Lors d'une première étape, le dispositif de reconnaissance transfère, grâce aux moyens de transfert 207, les bases de données de reconnaissance ainsi que les nouvelles formes que l'utilisateur souhaiterait voir apprise par le système vers un équipement distant. - Lors d'une deuxième étape, les bases de données de reconnaissance sont alors remises à jour sur l'équipement distant grâce à un algorithme d'apprentissage installé sur cet équipement. Lorsque les formes à apprendre ont été apprises, l'équipement distant met à disposition du dispositif de reconnaissance d'informations une base de données à jour. - Lors d'une troisième étape, la base de données mise à jour sur l'équipement distant peut être chargée sur dispositif de reconnaissance via les moyens de transfert 207. Afin de restituer les informations reconnues à l'utilisateur, le dispositif de reconnaissance 200 peut comprendre des moyens d'affichage 209, tels qu'un écran ou tout autres moyens de transmission d'information. Dans un mode de réalisation avantageux, le dispositif de reconnaissance 200 comprend une interface audio 211 capable de synthétiser les informations reconnues en sons audibles par l'être humain. Ce dernier mode est particulièrement utile lorsque l'utilisateur est malvoyant, car il peut alors avoir accès à des informations qu'il ne pourrait pas voir autrement.
Enfin, le dispositif de reconnaissance 200 peut comprendre une interface homme-machine 213 permettant à l'utilisateur d'intervenir au cours du procédé de reconnaissance, notamment lors de l'apprentissage de nouvelles balises ou formes comme illustré par la suite.
On se réfère maintenant à la figure 2B, laquelle constitue un schéma synoptique illustrant une zone d'informations 210 marquée par une balise graphique et un dispositif de reconnaissance 220 selon un premier mode de réalisation de la présente invention.
Sur cette figure 2 est représentée d'une part une zone d'informations 210 dans laquelle se situe une information textuelle 211 à reconnaître. Une balise graphique 213, présentant une ou plusieurs caractéristiques prédéfinies telles qu'introduites ci-avant, est insérée à proximité de ce texte 211 afin de définir un périmètre 215 comprenant ce texte. Une telle zone d'informations 210 est apte à être reconnue par un dispositif de reconnaissance 220 grâce à cette balise graphique 213. Le dispositif de reconnaissance 220 est décrit sur la figure 2B avec des blocs fonctionnels ne correspondant pas nécessairement à l'implémentation physique du dispositif dans la mesure où les fonctions décrites peuvent être implémentés séparément ou de façon rassemblée dans divers modules structurels qui seront explicités par la suite.
Le dispositif de reconnaissance 220 présente d'une part un bloc fonctionnel d'acquisition d'images 221, servant à acquérir une image contenant la zone d'informations 210 et fournissant en sortie une image numérique, sous forme, par exemple, d'un fichier numérique (comme par exemple un fichier .jpg, .tif, .bmp ou tout autre type de données). Le bloc fonctionnel 221 est lié, d'une part, à un bloc fonctionnel de détection de balise graphique 223, dont la fonction est de reconnaître, au sein de l'image acquise sous forme numérique, une ou plusieurs balises graphiques prédéterminées et chacune associées à une catégorie particulière d'informations. Pour permettre cette détection, un certain nombre de caractéristiques peuvent être associées à chaque balise graphique, et la détection peut se faire par la reconnaissance de l'une de ces caractéristiques. Si par exemple une balise graphique destinée à marquer une information textuelle est caractérisée par une forme ronde, le bloc fonctionnel 223 doit être capable de détecter une forme ronde dans l'image reçue par le bloc fonctionnel 221, par exemple au moyen d'un filtre numérique appliqué sur l'image, et fournit en sortie une information identifiant la balise graphique détectée.
Pour ce faire, le bloc fonctionnel 223 utilise une base de données de balises BDb, dans laquelle est stockée un certain nombre de balises graphiques avec la catégorie d'informations et les éventuelles caractéristiques qui leur sont associées. Le bloc fonctionnel 223 implique en outre un algorithme de reconnaissance qui va utiliser cette base de données BDb pour reconnaître une balise par le biais de l'une de ses caractéristiques. La base de données BDb peut contenir les informations suivantes . - Couleurs et dimensions des balises graphiques pour la phase de détection. - Formes des balises graphiques, afin de permettre à l'algorithme de reconnaissance d'identifier la balise. - la position des données à reconnaitre par rapport à la balise ou le périmètre des données à reconnaitre. Le dispositif de reconnaissance 220 présente par ailleurs un bloc fonctionnel d'analyse 225 de balise graphique. Ce bloc fonctionnel 225 reçoit l'information identifiant la (ou les) balise graphique détectée par le bloc fonctionnel 223 et doit être capable de reconnaître la catégorie d'informations marquées par cette balise graphique afin de choisir le type de reconnaissance le plus adapté par la suite. Par exemple, si le bloc fonctionnel de détection de balises 223 permet de distinguer une première balise indiquant une information textuelle d'une deuxième balise indiquant une information non-textuelle, le bloc fonctionnel d'analyse 225 analyse quelle balise graphique a été détectée et peut sélectionner la reconnaissance de caractères dans le premier cas, ou d'objets dans le deuxième cas. Le dispositif de reconnaissance 220 présente ensuite un bloc fonctionnel de reconnaissance d'informations 227, lequel peut permettre par exemple la reconnaissance d'une ou plusieurs catégories d'informations à partir de l'image reçue par le bloc fonctionnel d'acquisition 221. Ainsi, pour en revenir à l'exemple où une première balise identifie des informations de nature textuelle tandis qu'une deuxième balise identifie des informations de nature non-textuelle, le bloc fonctionnel de reconnaissance 227 peut comprendre un premier sous-bloc fonctionnel servant à la reconnaissance d'informations textuelles et un deuxième sous-bloc fonctionnel servant à la reconnaissance d'informations non-textuelles. Dans un tel cas, le bloc fonctionnel 227 va recevoir une indication du bloc d'analyse 225 quant au sous-bloc fonctionnel à utiliser en fonction de la balise graphique détectée. Cette caractéristique permet d'optimiser la reconnaissance d'informations et d'alléger le traitement dans la mesure où il n'est plus nécessaire de chercher systématiquement, sur chaque image, à la fois la reconnaissance d'objets ou la reconnaissance de caractères adaptée aux informations qui se trouvent sur l'image comme c'est le cas dans l'état de la technique. Ceci permet de gagner un temps considérable pendant la phase de reconnaissance. Pour ce faire, le bloc fonctionnel de reconnaissance utilise un nombre de bases de données BD1,BD2,... correspondant au nombre de catégories d'informations à reconnaître (deux catégories textuelles et non-textuelles par exemple), dans lesquelles sont mémorisées des informations utilisables par un algorithme de reconnaissance d'informations. Chacune des base de données BD1,BD2... est constituée des données nécessaires à la configuration de l'algorithme de reconnaissance d'informations. Il peut s'agir de coefficients synaptiques dans le cas où l'algorithme utilisé est un réseau de neurones. Ces coefficients sont préalablement calculés pendant une phase d'apprentissage du réseau de neurones qui sera développée par la suite.
On se réfère maintenant à la figure 2C, laquelle constitue un schéma synoptique illustrant une zone d'informations 210 marquée par une balise graphique et un dispositif de reconnaissance 230 selon un deuxième mode de réalisation de la présente invention.
Le dispositif 230 se distingue du dispositif 220 par la présence d'un module d'apprentissage 239 permettant d'enrichir les bases de données de reconnaissance, et ainsi d'apprendre et de reconnaître de nouveaux objets, balises ou caractères.
Le dispositif 230 peut comporter en outre une interface homme-machine 236 permettant de piloter l'apprentissage, ainsi que des moyens 238 de chargement des nouvelles données, dont l'utilisation sera décrite ultérieurement dans la présente description.
On se réfère maintenant à la figure 3A, laquelle illustre un procédé de repérage et d'identification d'une balise graphique utilisée dans la présente invention.
Dans ce procédé de repérage et d'identification, une image est acquise lors d'une étape 301. S'ensuit une étape 302 de recherche des caractéristiques principales (comme la couleur par exemple) d'une balise dans cette image. Si aucune caractéristique n'a été trouvée (étape 303), on recommence le procédé en acquérant une autre image. Si une caractéristique a été trouvée (étape 303), alors on procède à une étape 304 de reconnaissance de forme de la balise, en collaboration avec une base de données de balises BDb, afin d'identifier la balise. Si la balise n'est pas identifiée (étape 305), on recommence le procédé en acquérant une autre image. Si, par contre, la balise est identifiée (étape 305), on mémorise le type de balise et on calcule le périmètre et la localisation des informations à reconnaître, lors d'une étape 306. On calcule éventuellement aussi les informations d'aide à la reconnaissance des formes. A l'issue de l'étape 306, le type des informations à reconnaître a été repéré grâce à la balise graphique. Il est alors possible d'effectuer, au cours d'une étape 307, la reconnaissance des informations au moyen d'un algorithme adapté. On se réfère maintenant à la figure 3B, laquelle illustre un procédé de reconnaissance d'informations selon un premier mode de réalisation de la présente invention, utilisant le procédé de repérage et d'identification tel que décrit ci-avant. Dans ce procédé, une zone à reconnaître (contenant de l'information) est marquée à l'aide d'une balise graphique lors d'une étape 311. La balise est ensuite détectée et identifiée au cours d'une étape 313, par exemple en utilisant le procédé de repérage tel qu'illustré à la figure 3A. S'ensuit une étape 313 au cours de laquelle les paramètres d'aide à la vision sont déterminés, ainsi que le type de formes à reconnaître. L'algorithme de reconnaissance est alors configuré, au cours de l'étape 314, en fonction des paramètres d'aide à la vision. La base de données (par exemple de formes ou de caractères) correspondant au type de formes reconnu est sélectionnée. Une fois la base de données adéquate sélectionnée, la reconnaissance est effectuée, au moyen de cette base de données et de l'algorithme de reconnaissance correspondant, sur tous les objets inclus dans le périmètre défini par la balise graphique (étape 315). Si des formes non reconnues sont détectées (étape 316), on peut alors appliquer un algorithme d'apprentissage tel que décrit ultérieurement aux figures 4B ou 4D. Si tel n'est pas le cas, les informations reconnues sont alors transmises à l'utilisateur (étape 317).
Lorsqu'un objet ou un caractère n'est pas reconnu à l'étape 316, le procédé de reconnaissance peut le signaler à l'utilisateur et sauvegarde dans une base de données (par exemple liée spécifiquement à l'apprentissage) l'image de l'objet ou du caractère, ainsi que l'identifiant associé à la forme. Un tel identifiant peut être demandé à l'utilisateur au travers de l'interface homme/machine. L'image de l'objet ou du caractère non reconnu ainsi que l'identifiant sont donc sauvegardés dans la base de données d'apprentissage qui peut être utilisée, dans un deuxième temps, pour enrichir l'apprentissage des réseaux de neurones. L'invention propose trois modes d'apprentissage distincts : - l'apprentissage à distance, - l'apprentissage en local sur l'équipement portable, - l'apprentissage automatique. On se réfère maintenant à la figure 4A, laquelle illustre le premier mode d'apprentissage à distance. Les informations non reconnues peuvent être envoyées, par le biais de l'interface homme-machine 236 du dispositif portable, vers un système externe comme une machine distante qui peut générer de nouvelles bases de données de reconnaissance. Une fois régénérées, ces bases de données peuvent être à nouveau téléchargées dans le dispositif de reconnaissance, ce qui permet à celui-ci de reconnaître les formes qu'il ne connaissait pas avant la mise en oeuvre du procédé. La remise à jour des bases de données des algorithmes de reconnaissance s'effectue de la manière suivante: Etape 1 : le dispositif portable permet, grâce à l'interface 236, de transférer dans un équipement distant les bases de données de reconnaissance ainsi que les nouvelles formes que l'utilisateur souhaiterait voir apprise par le système.
Etape 2 : les bases de données de reconnaissance sont alors remises à jour sur la machine distante grâce à un algorithme d'apprentissage installé sur cette machine. Lorsque les formes à apprendre ont été apprises, la machine distante met à disposition du dispositif de reconnaissance une base de données à jour. Etape 3 : La base de données mise à jour sur la machine distante peut être rechargée sur le dispositif de reconnaissance via l'interface 236. Un deuxième mode d'apprentissage consiste en l'apprentissage en local sur l'équipement portable. En effet, l'algorithme de reconnaissance utilisé dans l'invention est un algorithme susceptible d'apprentissage (par utilisation de réseaux neuronaux, par exemple). Le dispositif est capable d'apprendre tous les types de formes, sans aide extérieure de l'utilisateur à condition que l'on soit dans une zone définie par une balise graphique. Dans ces conditions, l'apprentissage de nouvelles formes peut être embarqué dans l'invention. Comme pour l'apprentissage d'un être humain, une seule information est nécessaire : A quoi correspond cette forme ? Dans le cadre de l'invention c'est cette unique information qui peut être demandée à l'utilisateur (grâce à un identifiant de la forme). Par exemple, si la forme correspondant à une voiture a été détectée dans la zone à reconnaître et que cette forme n'est pas connue par le dispositif portable, le dispositif portable affiche la forme est demande à l'utilisateur à quoi correspond cet objet. L'utilisateur répond alors, grâce à l'interface homme machine, qu'il s'agit d'une voiture. Le dispositif portable sauvegarde ces données et lance l'algorithme d'apprentissage pendant les périodes ou le processeur n'est pas utilisé. Un tel deuxième mode d'apprentissage dit local peut s'effectuer, grâce à un algorithme embarqué dans l'équipement portable et à une interface homme/machine 236, selon le procédé illustré dans la figure 4B. Le procédé d'apprentissage local de la figure 4B comporte les étapes suivantes : - la détection (étape 411) d'une forme non reconnue, par exemple au cours du procédé illustré à la figure 3B, - l'affichage de la forme non reconnue sur l'interface homme-machine (étape 412), - Il est alors demandé à l'utilisateur si la forme non reconnue est à apprendre (étape 413) ou non. En l'absence de réponse, ou avec une réponse négative, on revient au début du procédé, - Si l'utilisateur a répondu positivement, on lui demande ensuite à quel type de forme appartient la forme non reconnue (étape 414) et quel est son identifiant, Si le type et l'identifiant indiqués ne sont pas gérés par le système de reconnaissance (étape 415), on revient au début du procédé. - Si le type et l'identifiant indiqués sont gérés par le système de reconnaissance, la base de données adéquates correspondant au type de la forme non reconnue est sélectionnée (étape 416). le type, la forme et l'identifiant associé sont alors sauvegardés dans cette base de données sélectionnée (étape 417). - un algorithme d'apprentissage utilisant la base de données sélectionnée est alors lancé en fonction du type de la forme (étape 418), avant de terminer le processus d'apprentissage local (étape 419). Un tel apprentissage est lancé en tache de fond de préférence. On se réfère maintenant à la figure 4C, laquelle illustre le procédé de lancement d'un algorithme d'apprentissage correspondant à l'étape 418 de la figure 4B.
Le procédé de lancement de l'algorithme d'apprentissage comporte les étapes suivantes : on vérifie d'abord si le micro-processeur du dispositif de reconnaissance est occupé ou non (étape 421). Si tel est le cas, on attend que celui-ci ne le soit plus. - Une fois que le micro-processeur est disponible, l'algorithme d'apprentissage de la nouvelle forme (correspondant à la forme non reconnue lors du procédé de la figure 4B) est lancé, en collaboration avec la base de données d'apprentissage (étape 422). - On effectue ensuite un test de convergence de l'algorithme d'apprentissage (étape 423). Si ce test est négatif, on reprend le procédé de lancement depuis le début. - Si le test de convergence est positif, les données de l'algorithme de reconnaissance après apprentissage sont sauvegardées dans la base de données d'apprentissage (étape 424) et le procédé de lancement s'achève (étape 425). Ce mode d'apprentissage local peut être utilisé pour tous les types de formes, ce qui comprend les caractères, les formes ou objets quelconques mais aussi de nouvelle balise graphiques, ce qui permet de définir de nouveaux types. La question sur le type de la forme à l'étape 414 est une question optionnelle car en fonctionnement nominal le type est donné par la balise.
L'algorithme de reconnaissance de formes (caractères, objets ou formes quelconques) utilisé dans l'invention est un réseau de neurones de type feed-forward mais d'autres algorithmes susceptibles d'apprentissage peuvent être utilisés tels que les Support Vectors Machines Convolutional Networks , etc... Ces algorithmes sont bien connus de l'homme du métier et ne seront pas détaillés plus avant. Une particularité des algorithmes susceptibles d'apprentissage, notamment des réseaux de neurones, est que la taille de la base des données (des synapses) reste de fixe durant la phase d'apprentissage. Et ce quelque soit le nombre N de données à apprendre. De plus, l'algorithme du réseau de neurones est le même pour toutes les formes. Cette particularité garantit que le système aura des performances absolument identiques avant et après apprentissage ce qui est essentiel dans le cas d'un dispositif portable aux faibles performances de calcul. Le nombre N de données apprises est limité par la capacité de l'algorithme à converger. Dans le contexte d'un dispositif de reconnaissance portable, l'apprentissage initial peut être effectué en usine sur une station de travail. La base de données de l'algorithme de reconnaissance est ensuite chargée sur le dispositif de reconnaissance portable en usine. De plus, le procédé d'apprentissage combiné au procédé de balise graphique définissant une zone des données à reconnaître permet d'enrichir la base de données de reconnaissance du réseau de neurones. Ce procédé, spécifique à l'invention, permet de repérer sans erreur possible les images qui ne sont pas connues par le dispositif et de proposer ainsi à l'utilisateur de les apprendre. On se réfère maintenant à la figure 4C, laquelle illustre un troisième mode d'apprentissage dit automatique . Le procédé d'apprentissage selon ce troisième mode automatique comporte les étapes suivantes : - la détection (étape 431) d'une forme non reconnue, par exemple au cours du procédé illustré à la figure 3B, la génération automatique d'un identifiant pour la forme non reconnue, le type de forme étant déduit de la balise graphique reconnue au cours du procédé de détection (étape 432), - Si le type de forme n'est pas géré par le système de reconnaissance (étape 433), on revient au début du procédé, - Si le type de forme est géré par le système de reconnaissance, la base de données adéquates correspondant au type de la forme non reconnue est sélectionnée (étape 434). - la forme et l'identifiant associé sont alors sauvegardés dans cette base de données sélectionnée (étape 435). un algorithme d'apprentissage, similaire à celui décrit à la figure 4C et utilisant la base de données sélectionnée, est alors lancé en fonction du type de la forme (étape 436), avant de terminer le processus d'apprentissage automatique (étape 437). Un tel apprentissage est lancé en tache de fond de préférence. Avec un tel mode d'apprentissage automatique, dans le cas illustratif où le dispositif serait intégré à une application de tri automatique, le dispositif portable peut générer lui-même un identifiant correspondant à une forme non reconnue, dans ce cas le dispositif peut lancer l'apprentissage et s'enrichir de manière automatique de nouvelles formes tout au long de la vie du dispositif. Dans un tel mode de fonctionnement, aucune intervention ni de l'utilisateur, ni du constructeur n'est nécessaire, et le dispositif est autonome. Dans le cas d'une application de tri automatique, une seule balise graphique est nécessaire à l'initialisation du dispositif, le reste (i.e. les formes ou les caractères) sera appris au fur et à mesure du passage des objets devant le dispositif. Dans ce cas, l'apprentissage s'effectue de manière totalement automatique. Les bases de données utilisées dans l'invention sont composées d'une base de données dédiée à la reconnaissance des balises, et de N bases de données dédiées à la reconnaissance des formes . • La base de données de l'algorithme de reconnaissance des balises peut être constituée des informations suivantes . o Couleurs et dimensions des balises graphiques pour la phase de repérage. o Une base de données à destination de l'algorithme de reconnaissance de formes pour identifier les balises. Une telle base de données est constituée de coefficients synaptiques dans le cas où l'algorithme utilisé est un réseau de neurones. Ces coefficients sont préalablement calculés pendant la phase d'apprentissage du réseau de neurones. o En fonction du type de balise les informations suivantes sont disponibles pour l'algorithme de reconnaissance des formes à reconnaître : ^ Type de forme à reconnaître. ^ Position des données à reconnaître par rapport à la balise. ^ Périmètre des données à reconnaître. • La base de données de l'algorithme de reconnaissance des formes est constituée de N bases de données. o N est défini par le nombre de type de forme à reconnaître par le système. o Chacune des bases de données correspond à un type de forme (objets, caractères etc...) o Une base de données est constituée des données nécessaires à la configuration de l'algorithme de reconnaissance. Une telle base de données est constituée de coefficients synaptiques dans le cas où l'algorithme utilisé est un réseau de neurones. Ces coefficients sont préalablement calculés pendant la phase d'apprentissage du réseau de neurones. En ce qui concerne la base de données spécifique à l'option d'apprentissage, celle-ci est constituée des informations suivantes . • Couples Photo/Identifiant ayant servi à l'apprentissage initial. • Afin d'enrichir les bases de données existantes avec des données qui n'ont pas été reconnues précédemment, il faut stocker les informations suivantes qui seront nécessaires à l'algorithme d'apprentissage : o Photo de la forme non reconnue. o Identifiant de la forme, L'identifiant peut correspondre au nom de la forme. Cette valeur peut être saisie manuellement via l'IHM l'utilisateur. On va maintenant s'attacher à décrire divers exemples de mise en oeuvre de la présente invention. Pour cela, on se réfère tout d'abord à la figure 5A, laquelle illustre un premier exemple d'application au travers d'un schéma de principe d'un dispositif de reconnaissance optique associé à une balise graphique sur une chaîne industrielle, permettant de trier des flacons par exemple. Dans cet exemple, les données à reconnaître concernent un objet (en l'occurrence un flacon de crème 501) et un texte. La balise graphique 503, en forme de croix, constitue ici à la fois une balise et un logo publicitaire. Une telle balise graphique permet d'indiquer que les informations à proximité correspondent à un objet particulier, à savoir le flacon de crème dans le cas présent. Un dispositif de reconnaissance 505, semblable au dispositif de reconnaissance selon la présente invention introduit ci-avant, peut alors acquérir une image du flacon, détecter la balise graphique 503 et reconnaître l'information 501 grâce à celle-ci. On se réfère à présent à la figure 5B, laquelle illustre un deuxième exemple d'application selon l'invention dans lequel un dispositif de reconnaissance optique est associé à une balise graphique dans une caméra embarquée. Dans ce deuxième exemple, la balise graphique 511 de forme carrée est placée sur une plaque de rue 513 et sert à indiquer un texte, à savoir le nom de la rue. Un utilisateur portant un dispositif de reconnaissance 515 va pouvoir, en acquérant une image grâce au dispositif dans le champ de laquelle se situe la plaque de rue, avoir accès à l'information 513 du nom de la rue. Un tel dispositif présente un intérêt particulier dans le cas d'un utilisateur malvoyant. Le dispositif peut alors comprendre, en sortie, un moyen de conversion audio permettant de transformer l'information numérique reconnue à partir de la plaque de rue en un signal vocal où cette rue est prononcée. L'utilisateur malvoyant sait alors dans quelle rue il se trouve.
On se réfère maintenant à la figure 5C, laquelle illustre un troisième exemple d'application dans lequel un dispositif de reconnaissance optique selon l'invention est associé à une balise graphique principale et un ensemble de balises graphiques secondaires.
Sur cette figure 5C, outre un dispositif de reconnaissance 520, un panneau 521 d'indication d'horaires de bus est représenté, avec différentes informations telles que les arrêts de bus, l'horaire du premier départ, l'horaire du dernier départ.
Une balise graphique principale 523, consistant en un carré bleu aux bords arrondis dans lequel un bus est affiché, est insérée pour définir le périmètre de lecture principal 525 dans lequel se trouvent les informations à reconnaître.
Des balises graphiques secondaires 527a-527e sont insérées à proximité des arrêts de bus afin de définir des périmètres de lecture 529a-529e plus précis au sein du périmètre de lecture principal 525.
Un tel dispositif est avantageusement utilisé dans un système d'aide à la lecture d'horaires de bus pour utilisateurs malvoyants. Grâce à la balise principale 521, l'utilisateur malvoyant peut détecter le panneau d'horaires des bus, puis, grâce aux balises secondaires 527a-527e, il peut connaître des informations spécifiques aux différents arrêts, comme par exemple l'horaire du premier ou du dernier bus. Une telle information peut être fournie par synthèse vocale, comme indiquée ci-avant.
Dans un exemple particulier, les mêmes balises graphiques peuvent être utilisées pour différents horaires de bus. Les horaires de départ et d'arrivée sont alors, eux, à chaque fois différents. La figure 5C illustre le fait qu'il est ainsi possible d'imaginer un procédé permettant d'augmenter le nombre et le type d'informations à reconnaître dans une zone déjà définie par une balise principale, en insérant des balises dites secondaires qui permettent de redéfinir une zone dans la zone définie par la balise principale.
On se réfère maintenant aux figures 6A-6C qui illustrent un quatrième exemple de mise en oeuvre du procédé de reconnaissance optique selon la présente invention. Dans une image prise avec le même dispositif portable de reconnaissance, il est possible d'obtenir, en Europe par exemple, une image du type de celle de la figure 6A, alors qu'en Egypte, il est possible d'obtenir une image du type de celle de la figure 6B. 5 10 15 20 Le procédé de reconnaissance, dans ce quatrième exemple, comporte alors les étapes suivantes : • Etape 1 : Les zones à reconnaître sont marquées par une balise graphique, dans cet exemple : des carrés rouges pour des caractères Européens, des ronds rouges pour des hiéroglyphes de l'Egypte antique. • Etape 2 : Le dispositif de l'invention est initialisé avec les données suivantes . 1) La base de données d'apprentissage, servant à l'apprentissage initial des balises graphiques, est initialisée avec les paramètres suivants : ^ 2 images correspondant au rond rouge et au carré rouge. ^ 2 identifiants : • Identifiant pour le rond : 0 = hiéroglyphes Egypte antique • Identifiant pour le carré : 1 = caractères Européens ^ Des informations identifiant les zones à reconnaître, par exemple les coordonnées de la zone à reconnaître : P0, P1 et P2, tailles des balises. 2) La base de données de l'algorithme de reconnaissance des balises graphiques est générée après la convergence de l'algorithme d'apprentissage de reconnaissance de formes. Cet apprentissage est effectué avec les données des balises graphiques de la base d'apprentissage. 3) La base de données de l'algorithme de reconnaissance de formes, comprenant 2 bases secondaires de données dans l'exemple présent, est initialisée de la façon suivante : ^ La première base de données secondaire, spécialisée pour la reconnaissance des caractères Européen, comporte une base de données d'apprentissage des formes de type caractères Européen où sont stockés les paramètres suivants . o 7 images correspondants aux caractères A, B, C, D, E, F, G. o 7 identifiants associés aux images : 0 pour le A ,1 pour le B , etc... ^ La première base de données secondaire, spécialisée pour la reconnaissance des caractères Européen, comporte en outre une base de données de reconnaissance des formes de type caractères Européen .
Cette base de donnée est générée après que de l'algorithme d'apprentissage de reconnaissance de formes ait convergé. Cet apprentissage est effectué avec les données 5 10 15 20 25 de la base de la base d'apprentissage des formes de type caractères Européen . ^ La deuxième base de données secondaire, spécialisée pour la reconnaissance des hiéroglyphes Egyptiens antique, comporte une base de données d'apprentissage des formes de type hiéroglyphes Egyptiens où sont stockés les paramètres suivants : o 7 images correspondant aux hiéroglyphes suivant :
o 7 identifiants associés aux images : 0 pour le ,1 pour leJ etc... ^ La deuxième base de données secondaire, spécialisée pour la reconnaissance des hiéroglyphes Egyptiens antique, comporte en outre une base de données de reconnaissance des formes de type hiéroglyphes Egyptiens . Cette base de donnée est générée après que de l'algorithme d'apprentissage de reconnaissance de formes ait convergé. Cet apprentissage est effectué avec les données de la base de la base d'apprentissage des formes de type hiéroglyphes Egyptiens . • Etape 3 : La balise graphique est recherchée dans l'image fournie par le capteur. Cette recherche peut s'effectuer en recherchant d'abord une couleur (ici du rouge) dans l'image, puis en cherchant une forme, grâce à l'algorithme de reconnaissance de formes et la base de données des synapses entraînées pour les balises. Dans l'exemple présent, on recherche des carrés et des ronds. • Etape 4 : Si par exemple la balise identifiée est un carré, ce qui implique que l'identifiant soit caractères Européens . L'identification de la balise indique alors d'une part que les formes à reconnaître sont des caractères Européens.
De plus, l'identification de la balise donne alors les informations suivantes . - Des informations de périmètre (sur la zone à reconnaître) : Les points P0, P1 et P2 tels qu'illustrés sur la figure 6C. - La largeur et la hauteur de la balise mesurée par le dispositif donne l'échelle. - Les dimensions des informations à reconnaître sont connues. La zone des données à reconnaître est définie, par exemple, par le point origine PO et le rectangle (P1,P2), comme illustré à la figure 6C. • Etape 5 : Les formes présentes dans la zone définie par la balise sont reconnues. Cette étape est illustrée sur la figure 6D. Le carré creux, dans cette figure 6D, représente l'image qui est passée à l'algorithme de reconnaissance. Cette image est de taille fixe dans l'exemple. L'image est ensuite fournie à l'algorithme de reconnaissance qui fournit en réponse l'identifiant de la forme reconnue.
Cet identifiant est ensuite converti en un signal de sortie, vers une interface audio par exemple. On peut noter ici que le nombre de base de données peut être étendu de 1 à N pour les balises graphiques. Pour chacun des types de balises, il y a donc là N types de formes. Pour chacun de ces types, il peut y avoir 1 à N bases de données spécialisées dans un type de forme donné (type Caractères Européen, type Hiéroglyphes...) Le rectangle défini par P1 et P2 n'est pas nécessairement à coté de la balise (cas de l'Egypte dans l'exemple). La zone à reconnaître qui est définie par le rectangle défini par P1 et P2 peut contenir des balises secondaires celle-ci définissant des sous ensembles de données à reconnaître. Ce procédé permet notamment d'augmenter le nombre et le type d'information à reconnaître dans une zone donnée. Ce procédé permet également d'assurer que les performances du système, pour une zone donnée, sont maîtrisées. De plus le procédé de balise graphique secondaire peut permettre de définir un langage ou codage codant, par exemple, un changement de type d'information dans la zone, la fin des informations à reconnaître, un changement de Zone en redéfinissant une nouvelle zone plus loin, etc De plus, les balises graphiques ou les formes à reconnaître peuvent être tachées ou rayées : le dispositif, grâce aux caractéristiques des réseaux de neurones, est capable de reconnaître la balise graphiques ainsi que les formes associées. Enfin, que l'on soit avec des Hiéroglyphes de l'Egypte antique ou des caractères Européens, le temps d'exécution et de reconnaissance des formes est égal. (7 formes reconnues dans l'exemple présent). Cette caractéristique est primordiale pour un dispositif portable aux performances hardware limitées. • Etape 6 : Un procédé d'apprentissage peut être lancé si, au cours de la phase de reconnaissance, il est possible de repérer une forme qui n'est pas connue par le dispositif. Par exemple, si le dispositif détecte un H qui n'est pas connu, on demande à l'utilisateur s'il veut que le dispositif apprenne cette forme.
Si la réponse est non , ou en l'absence de réponse dans un certain délai, alors le procédé d'apprentissage se termine et la forme est ignorée. Si la réponse est oui , le dispositif demande à l'utilisateur quel est l'identifiant pour cette forme et sauvegarde l'image de la forme ainsi que l'identifiant qui lui est associé dans la base de donnée d'apprentissage de formes. L'algorithme d'apprentissage est alors lancé avec la base de données contenant les 8 images. Cet apprentissage fonctionne lorsque le processeur n'est pas dédié à d'autres taches, ce qui permet de finir l'étape de reconnaissance. Dans ce cas l'utilisateur aura sur son interface homme/machine A , non reconnu (apprentissage en cours du H ) , B , C , D , E , F , G . Lorsque l'apprentissage est terminé, la base de données de reconnaissance de caractères européens est sauvegardée et sera utilisée pour une prochaine étape de reconnaissance. Si l'apprentissage se passe mal, une erreur peut être remontée à l'utilisateur. La base de données de reconnaissance de caractères européens, après apprentissage, contiendra les données suivantes : • Une base de données servant à l'apprentissage comprenant : - 8 images . A , B , C , D , E , F , G , H - 8 identifiants associés aux images : 0 pour le A , 1 pour le B ,"., x pour le H . • Une base de données servant à la reconnaissance des formes de type caractères Européens. Cette base de données est générée après que l'algorithme d'apprentissage de reconnaissance de formes ait convergé. La taille de la base de données de reconnaissance n'a pas changée car, après l'apprentissage, seuls les coefficients contenus dans la base de données de reconnaissance auront changés. C'est une des caractéristiques des algorithmes susceptibles d'apprentissage et des réseaux neuronaux.
Bien entendu, l'invention n'est pas limitée aux exemples de réalisation ci-dessus décrits et représentés, à partir desquels on pourra prévoir d'autres modes et d'autres formes de réalisation, sans pour autant sortir du cadre de l'invention.
L'invention n'est pas spécifique à un hardware particulier, ni à une implémentation logicielle particulière. L'invention est un concept que l'on peut porter sur différentes plateforme logicielles ou hardware. 45

Claims (17)

  1. Revendications1. Procédé de reconnaissance d'informations, comprenant les étapes suivantes . - Marquage (101) d'une zone (215) comprenant les informations à reconnaître (211) au moyen d'au moins une balise graphique (213) présentant au moins une caractéristique prédéfinie; - Acquisition (103) d'au moins une image de ladite zone marquée; - Si la au moins une caractéristique prédéfinie est détectée (105) dans l'image acquise, reconnaissance (107) des informations appartenant à la zone marquée par la balise graphique.
  2. 2. Procédé de reconnaissance selon la revendication 1, caractérisé en ce que l'étape de détection de la caractéristique prédéfinie est suivie par une étape d'identification (305) de la balise en fonction de la caractéristique détectée.
  3. 3. Procédé de reconnaissance selon la revendication 2, caractérisé par une étape de configuration (314) de l'algorithme de reconnaissance à utiliser pour reconnaitre les informations en fonction de la balise identifiée.
  4. 4. Procédé de reconnaissance selon l'une des revendications 1 à 3, caractérisé en ce que l'étape de reconnaissance des informations est suivie par au moinsune étape d'apprentissage des informations (418) si les informations ne sont pas reconnues lors de l'étape de reconnaissance (107).
  5. 5. Procédé de reconnaissance selon la revendication 4, caractérisé en ce que l'étape d'apprentissage comprend une étape d'association (414,432) d'au moins une caractéristique à associer aux informations non reconnues et une étape de sauvegarde (417,435) des informations non reconnues et de la caractéristique associée dans une base de données (BDa).
  6. 6. Procédé de reconnaissance selon la revendication 5, caractérisé en ce que l'étape d'association (414) comprend la saisie d'au moins une des caractéristiques à associer aux informations non reconnues par un utilisateur.
  7. 7. Procédé de reconnaissance selon la revendication 5 ou 6, caractérisé en ce que l'étape d'association comprend la génération (432) d'au moins une des caractéristiques à associer aux informations non reconnues en fonction de la balise détectée.
  8. 8. Procédé de reconnaissance selon l'une des revendications 5 à 7, dans lequel la base de données est une base de données d'apprentissage (BDa), caractérisé par une étape de lancement d'un algorithme d'apprentissage (418,436) au moyen de la base de données d'apprentissage (BDa) .
  9. 9. Procédé de reconnaissance selon l'une des revendications 1 à 8, caractérisé en ce qu'il comprend uneétape ultérieure d'interfaçage (109) des informations reconnues à destination d'un utilisateur.
  10. 10. Procédé de reconnaissance selon la revendication 9, caractérisé en ce que l'étape ultérieure d'interfaçage (109) comporte la conversion des informations en un message audio.
  11. 11. Dispositif de reconnaissance (220) d'informations marquées par une balise graphique (210) présentant au moins une caractéristique prédéfinie comprenant des moyens de traitement (205) et des moyens de mémorisation (203), caractérisé en ce que : - les moyens de mémorisation (203) hébergent une base de données de balises (BDb) dans laquelle est stockée au moins une première balise graphique associée à une première catégorie d'informations et présentant au moins une caractéristique, ainsi qu'au moins une première base de données d'informations (BD1) dans laquelle est stockée une première pluralité d'informations appartenant à la première catégorie d'informations, et - les moyens de traitement (205) sont en outre adaptés pour recevoir une image sous forme numérique, pour détecter une balise graphique dans l'image reçue au moyen de la base de données de balises (BDb) et pour analyser l'image au moyen de la première base de données d'informations (BD1).
  12. 12. Dispositif de reconnaissance selon la revendication 11 dans lequel une deuxième balise graphique associée àune deuxième catégorie d'informations est stockée dans la base de données de balises (BDb), caractérisé en ce que : - les moyens de mémorisation (203) hébergent une deuxième base de données d'informations (BD2) dans laquelle est stockée une deuxième pluralité d'informations appartenant à la deuxième catégorie d'informations, et - les moyens de traitement (205) sont adaptés pour analyser l'image au moyen de la deuxième base de données d'informations (BD2).
  13. 13. Dispositif de reconnaissance selon l'une des revendications 11 ou 12, caractérisé en ce que la base de données de balises (BDb) et/ou la première base de données d'informations (BD1) et/ou la deuxième base de données d'informations (BD2) comporte un réseau de neurones.
  14. 14. Dispositif de reconnaissance selon l'une des revendications 11 à 13, caractérisé en ce que les moyens de mémorisation (203) hébergent au moins une base de données d'apprentissage (BDa) adaptée pour être enrichie avec des nouveaux éléments et pour entraîner la base de données de balises (BDb) et/ou la première base de données d'informations (BD1) et/ou la deuxième base de données d'informations (BD2).
  15. 15. Dispositif de reconnaissance selon l'une des revendications 11 à 14, caractérisé en ce qu'il comporte une interface audio (211) apte à transformer les informations reconnues en un signal audio audible par un utilisateur.
  16. 16. Programme informatique, téléchargeable via un réseau de télécommunication et/ou stocké dans une mémoire d'un dispositif selon l'une des revendications 11 à 13, caractérisé en ce qu'il comporte des instructions pour la mise en oeuvre des étapes d'un procédé selon l'une des revendications 1 à 10.
  17. 17. Procédé pour augmenter le nombre et le type d'informations à reconnaître dans une zone déjà marquée par une balise graphique principale suivant un procédé selon l'une des revendications 1 à 10, caractérisé par l'insertion d'une pluralité de balises secondaires arrangées pour redéfinir une zone secondaire dans la zone définie par la balise graphique principale.
FR0953954A 2009-06-12 2009-06-12 Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique. Withdrawn FR2946773A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0953954A FR2946773A1 (fr) 2009-06-12 2009-06-12 Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0953954A FR2946773A1 (fr) 2009-06-12 2009-06-12 Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.

Publications (1)

Publication Number Publication Date
FR2946773A1 true FR2946773A1 (fr) 2010-12-17

Family

ID=41625160

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0953954A Withdrawn FR2946773A1 (fr) 2009-06-12 2009-06-12 Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.

Country Status (1)

Country Link
FR (1) FR2946773A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612157A (zh) * 2020-05-22 2020-09-01 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070047781A1 (en) * 2005-08-23 2007-03-01 Hull Jonathan J Authoring Tools Using A Mixed Media Environment
US20070172122A1 (en) * 2006-01-24 2007-07-26 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and program
EP1833022A1 (fr) * 2004-12-28 2007-09-12 Fujitsu Ltd. Dispositif de traitement d'image detectant la position d'un objet de traitement dans une image
US20070228168A1 (en) * 2006-04-03 2007-10-04 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
WO2008006999A1 (fr) * 2006-07-13 2008-01-17 Yooget Systeme et procede de gestion d'informations
US20080037904A1 (en) * 2006-08-14 2008-02-14 Oki Electric Industry Co., Ltd. Apparatus, method and program storage medium for image interpretation
EP2023266A1 (fr) * 2007-08-01 2009-02-11 Ricoh Company, Ltd. Recherche de contenu de média pour des objets spécifiés utilisant des identificateurs
US20090100334A1 (en) * 2006-07-31 2009-04-16 Hull Jonathan J Capturing Symbolic Information From Documents Upon Printing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1833022A1 (fr) * 2004-12-28 2007-09-12 Fujitsu Ltd. Dispositif de traitement d'image detectant la position d'un objet de traitement dans une image
US20070047781A1 (en) * 2005-08-23 2007-03-01 Hull Jonathan J Authoring Tools Using A Mixed Media Environment
US20070172122A1 (en) * 2006-01-24 2007-07-26 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and program
US20070228168A1 (en) * 2006-04-03 2007-10-04 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
WO2008006999A1 (fr) * 2006-07-13 2008-01-17 Yooget Systeme et procede de gestion d'informations
US20090100334A1 (en) * 2006-07-31 2009-04-16 Hull Jonathan J Capturing Symbolic Information From Documents Upon Printing
US20080037904A1 (en) * 2006-08-14 2008-02-14 Oki Electric Industry Co., Ltd. Apparatus, method and program storage medium for image interpretation
EP2023266A1 (fr) * 2007-08-01 2009-02-11 Ricoh Company, Ltd. Recherche de contenu de média pour des objets spécifiés utilisant des identificateurs

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612157A (zh) * 2020-05-22 2020-09-01 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备
CN111612157B (zh) * 2020-05-22 2023-06-30 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US20210217129A1 (en) Detection of encoded signals and icons
FR2969916A1 (fr) Systeme et procede pour detecter la sensibilite d'une personne a une ou plusieurs substances possiblement allergisantes
US10803272B1 (en) Detection of encoded signals and icons
CN107133578B (zh) 一种基于文件传输的人脸表情识别方法及系统
FR3023948A1 (fr) Procede d'aide a la maintenance d'un aeronef par realite augmentee.
EP3291141B1 (fr) Procédé de reconnaissance de caractères en reliefs, produit programme d' ordinateur et dispositif correspondants
EP3382605A1 (fr) Procédé d'analyse d'un document structuré susceptible d'être déformé
CN109409428A (zh) 木板识别及木板识别模型的训练方法、装置及电子设备
EP3726334A1 (fr) Affichage sur un écran de smartphone d'un motif de positionnement d'une carte sans contact pour améliorer la communication en champ proche
CA2908210A1 (fr) Procede d'identification d'un signe sur un document deforme
EP3712807A1 (fr) Procédé d'identification de bagages
CN113012054A (zh) 基于抠图的样本增强方法和训练方法及其系统和电子设备
EP3663971B1 (fr) Procede de reconnaissance faciale
FR3081355A1 (fr) Procede de tri de bagages en aeroport avec videocodage optimise
EP2517152B1 (fr) Procede de classification d'objets dans un systeme de veille par imagerie
US20200019776A1 (en) Currency verification and transaction validation system
Peng et al. Product barcode and expiry date detection for the visually impaired using a smartphone
EP3937071A1 (fr) Procédé d'assistance au suivi en temps réel d'au moins une personne sur des séquences d'images
FR2946773A1 (fr) Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.
CA3161385A1 (fr) Procede de segmentation d'une image d'entree representant un document comportant des informations structurees
CN113255766B (zh) 一种图像分类方法、装置、设备和存储介质
CN114140427A (zh) 一种物体检测方法及装置
FR2852422A1 (fr) Procede d'identification automatique d'entites dans une image numerique
EP3929809A1 (fr) Procédé de détection d'au moins un trait biométrique visible sur une image d entrée au moyen d'un réseau de neurones à convolution
CN109643425B (zh) 用于标识产品的系统和方法

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20120229