FR2709361A1 - Reconnaissance de forme par réseau de neurones. - Google Patents

Reconnaissance de forme par réseau de neurones. Download PDF

Info

Publication number
FR2709361A1
FR2709361A1 FR9310280A FR9310280A FR2709361A1 FR 2709361 A1 FR2709361 A1 FR 2709361A1 FR 9310280 A FR9310280 A FR 9310280A FR 9310280 A FR9310280 A FR 9310280A FR 2709361 A1 FR2709361 A1 FR 2709361A1
Authority
FR
France
Prior art keywords
vsp
vectors
vsc
neural network
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9310280A
Other languages
English (en)
Other versions
FR2709361B1 (fr
Inventor
Thepaut Andre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR9310280A priority Critical patent/FR2709361B1/fr
Publication of FR2709361A1 publication Critical patent/FR2709361A1/fr
Application granted granted Critical
Publication of FR2709361B1 publication Critical patent/FR2709361B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

L'invention fournit un procédé de reconnaissance d'une forme (8) par réseau de neurones comprenant: - N codages (I) différents de la forme (8) en N vecteurs d'entrée (VEp, VEc) qui sont appliqués à des réseaux de neurones respectifs distincts (2p, 2c) produisant en réponse N vecteurs de sortie (VSp; VSc) identifiant chacun l'une des formes d'un dictionnaire de référence, et - la multiplication entr'elles de chacune des composantes de rang égal dans ces N vecteurs de sortie (VSp, VSc) en un vecteur d'identification (ID) identifiant l'une reconnue des formes du dictionnaire de référence. Par exemple, N=2 codages de la forme sont utilisés et sont un codage par contours et un codage par pixels. Selon une variante de l'invention, l'étape de multiplication peut être remplacée par un traitement dans un réseau de neurones additionnel.

Description

Reconnaissance de forme par réseau de neurones
La présente invention concerne de manière générale la reconnaissance de forme par réseau de neurones. L'invention s'applique par exemple à la reconnaissance de caractères alphanumériques manuscrits tels que des chiffres de code postal pour la distribution automatique de courrier.
La technique antérieure, telle qu'elle est rappelée en détail dans la demande de brevet français
FR-A-2686175 (THEPAUT et OWRADOU), définit un modèle connexionniste, dit modèle de Mc CULLOCH et PITTS, pour la reconnaissance de forme qui est basé sur la structure et les fonctions élémentaires du cerveau humain et couramment désigné par "réseau de neurones formels". Un exemple d'une structure de réseau de neurones découlant de ce modèle est présenté à la figure 1. Le réseau de neurones comprend K couches de neurones COUCHE 1,..., COUCHE k,..., et COUCHE K constituées de pluralités respectives de neurones, N10 à Nlp-1,,.., Nkg à NkJ~1,...., et NKo à NKLl. La couche COUCHE 1 constitue une couche d'entrée du réseau, les couches COUCHE 2 à COUCHE (K-l) forment (K-2) couches cachées et la couche COUCHE K constitue une couche de sortie du réseau. Chaque neurone Nkj comporte un élément de mémorisation destiné à mémoriser un "potentiel" Vkj. Chaque neurone d'une couche donnée COUCHE k, avec k compris entre 2 et K, est connecté à tous les neurones de la couche inférieure immédiatement adjacente COUCHE (k-l) par des liaisons synaptiques respectives. Ces liaisons synaptiques sont associées à des coefficients synaptiques respectifs Wu 10 à WI-1,J-1, où I et J désignent respectivement le nombre de neurones dans les couches COUCHE (k-l) et COUCHE k.
Le potentiel Vkj d'un neurone Nkj de la couche
COUCHE k est donné par la relation matricielle suivante:
Figure img00020001
où les termes Wij désignent les coefficients synaptiques des liaisons synaptiques établies entre le neurone Nkj de la couche COUCHE k et tous les neurones de la couche inférieure immédiatement adjacente COUCHE (k-1), et chaque terme S(k-l)i dénote un niveau de sortie du neurone N(k-l)i de la couche COUCHE (k-l) déduit de la relation S(k-l)i = f(V(k-l)i), f étant une fonction non linéaire par exemple de type sigmoïde.
Ce réseau de neurones reçoit un vecteur d'entrée dont P composantes représentatives d'une forme à reconnaître sont appliquées respectivement aux P neurones N10 à Nlp1 de la première couche COUCHE 1.
Un vecteur de sortie est produit par les neurones de la couche de sortie COUCHE K et identifie la forme reconnue.
Comme montré à une dernière ligne de la figure 2, le vecteur d'entrée résulte par exemple d'un codage par pixels d'un chiffre manuscrit, ici 0, en un bloc d'entrée carré ayant (28 x 28) pixels. Le réseau consiste en six couches dont chacune des six lignes de la figure 2 représentent respectivement les sorties des neurones ou images de caractéristiques des six couches. La première couche cachée COUCHE 2 est divisée en quatre sous-couches de (24 x 24) neurones. Chaque neurone de chaque sous-couche de la couche COUCHE 2 reçoit (5 x 5) pixels voisins du vecteur d'entrée après multiplication par une matrice ligne de coefficients synaptiques dans la couche
COUCHE 1 conformément à l'équation matricielle donnée ci-dessus.
Les autres couches du réseau ne seront pas détaillées. Il est seulement précisé que la couche de sortie (première ligne) produit un vecteur de sortie à dix pixels, dont le rang de l'unique pixel de niveau blanc "1" identifie le chiffre reconnu. Dans l'exemple de la figure 2, le pixel de rang 0 identifie le chiffre "0" comme chiffre reconnu.
Ainsi par des multiplications matricielles successives d'un vecteur d'entrée avec des matrices de coefficients synaptiques associées aux différentes couches, un vecteur de sortie identifiant le chiffre reconnu est produit. Les coefficients synaptiques sont obtenus au moyen d'un algorithme, dit algorithme de rétropropagation du gradient, qui fait converger les valeurs de coefficients synaptiques vers des valeurs optimales de reconnaissance lors d'une phase d'apprentissage préalable à toute reconnaissance. Les réseaux de neurones sont mis en oeuvre généralement au moyen de systèmes de traitement informatique.
La technique antérieure prévoit, en outre, deux types de codage d'un chiffre manuscrit à reconnaître en un vecteur d'entrée à appliquer à une couche d'entrée d'un réseau de neurones. Ces deux codages consistent respectivement en un codage par pixels et un codage par contour. Le codage par pixels résulte de la numérisation d'une forme, tel que chiffre, en un bloc de pixels. Le codage par contour, décrit dans le document intitulé "CONTOUR CODING FOR IMAGE
MANIPULATION AND COMPRESSION" de Ehoud AHRONOVITZ et al., paru dans "Eight International Conference, Paris 1986, IEEE Computer Society Order Number 742, volume 2, pages 1032-1035", prévoit le codage de la forme à reconnaître en un bloc de pixels de dimension donnée, chaque pixel étant défini par l'un de deux niveaux de gris "noir" ou "blanc", puis l'identification des contours intérieur et extérieur de la forme dans le bloc et enfin le codage de chaque contour en associant un code à chaque couple de pixels constitué d'un pixel donné du contour et d'un pixel voisin pris selon un sens de parcours prédéterminé du contour.
Les contours intérieur et extérieur sont caractérisés respectivement en ce qu'ils ne sont entourés que de pixels de niveau blanc et en ce qu'ils ne comprennent que des pixels de niveau blanc.
Le code associé à chaque couple de pixels dans le codage par contour est par exemple l'un de quatre codes N, S, E et O, représentatif respectivement des points cardinaux Nord, Sud, Est et Ouest, choisi en dépendance du positionnement relatifs de deux pixels de chaque couple relativement au sens de parcours du contour.
Ces deux codages selon la technique antérieure sont toujours mis en oeuvre séparément et toute application de reconnaissance utilise un unique réseau de neurones avec codage préalable de la forme à reconnaître, ou bien par pixels, ou bien par contour. L'utilisation d'un unique réseau de neurones avec codage préalable de la forme à reconnaître par pixels ou par contour conduit à des taux de reconnaissance correcte pour les chiffres manuscrits sensiblement compris entre 90% et 95%. Bien que ces résultats soient satisfaisants, ils apparaissent insuffisants pour certaines applications nécessitant une fiabilité de reconnaissance supérieure.
La demande de brevet français FR-A-2 682 207 décrit un procédé de reconnaissance automatique de caractères alphanumériques par réseau de neurones à plusieurs couches dans lequel des caractéristiques métriques, statistiques et morphologiques d'un caractère à reconnaître sont extraites par des prétraitements d'image connus. Trois vecteurs d'entrée relatifs respectivement au traitement métrique, statistique et morphologique du caractère sont appliqués à des entrées d'un unique réseau de neurones qui produit en réponse un vecteur de sortie identifiant un caractère reconnu. Ce procédé nécessite une phase d'apprentissage relativement longue du réseau de neurones due à la taille du réseau résultant du nombre de vecteurs d'entrée à chacun desquels sont associées des caractéristiques respectives du caractère à reconnaître. Ce procédé augmente ainsi la finesse de description d'un caractère à reconnaître en combinant trois types de caractéristiques préalablement au traitement de ces caractéristiques dans un unique réseau de neurones.
L'invention vise principalement à améliorer le taux de reconnaissance de forme, telles que des caractères, lettres et chiffres manuscrits, par rapport à ceux obtenus selon la technique antérieure.
A cette fin, un procédé de reconnaissance d'une forme par réseau de neurones, la forme étant associée à une forme de référence d'un dictionnaire de référence, est caractérisé en ce qu'il comprend les étapes suivantes
- N codages différents de la forme en N vecteurs d'entrée appliqués respectivement en entrée de N réseaux de neurones distincts produisant en réponse N vecteurs de sortie susceptibles d'identifier chacun l'une de formes de référence du dictionnaire de référence, N étant un entier supérieur à 1,
- multiplication des N vecteurs de sortie respectivement par N coefficients en N vecteurs corrigés, et
- multiplication entr'elles de chacune de composantes de rang égal respectivement dans les N vecteurs corrigés, en un vecteur d'identification de forme identifiant l'une reconnue des formes de référence du dictionnaire.
Selon une seconde variante de l'invention de procédé de reconnaissance de forme par réseau de neurones, les deux étapes de multiplication précédentes sont remplacées par l'application des N vecteurs de sortie à un réseau de neurones additionnel qui produit en réponse un vecteur de forme reconnue identifiant l'une reconnue des formes de référence du dictionnaire.
Comme on le verra dans la suite, l'invention concerne également des dispositifs de reconnaissance de forme pour la mise en oeuvre des deux variantes du procédé selon l'invention. En particulier, les N codages avec reconnaissance par réseau de neurones sont de préférence effectués par N systèmes de traitement de données multiprocesseur selon les deux variantes, tandis qu'un système de traitement de données additionnel est prévu pour la dernière étape selon la seconde variante.
D'autres caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture de la description suivante de plusieurs réalisations préférées de l'invention en référence aux dessins annexés correspondants dans lesquels
- la figure 1, déjà commentée, montre un diagramme schématique d'un réseau de neurones à structure en couche selon la technique antérieure;
- la figure 2, également déjà commentée, est un diagramme d'images de caractéristiques résultant de traitements successifs dans les couches d'un réseau de neurones
- les figures 3A, 3B et 3C montrent respectivement des tableaux résultant de la reconnaissance de chiffres manuscrits au moyen d'un réseau de neurones à codage par pixels, d'un réseau de neurones à codage par contours et de deux réseaux de neurones à codage par pixels et à codage par contours combinés selon l'invention;
- la figure 4 montre un bloc-diagramme schématisant les différentes étapes de la première variante de procédé selon l'invention; et
- la figure 5 montre un bloc-diagramme schématisant les différentes étapes de la seconde variante de procédé selon l'invention
Chacun des trois tableaux dans les figures 3A, 3B et 3C est obtenu à partir de 5000 essais de reconnaissance de chiffres manuscrits écrits par différentes personnes répartis en 500 sous-essais de reconnaissance pour chacun de 10 chiffres d'un dictionnaire de formes de référence qui est ici l'ensemble des chiffres (0,1,2,3,4,5,6,7,8,9).
Dans la figure 3A, la première colonne à gauche du tableau est relative à tous les chiffres du dictionnaire qui sont appliqués chacun successivement en entrée d'un réseau de neurones sous la forme d'un bloc de pixels résultant d'un codage numérique des pixels du chiffre manuscrit écrit par des personnes différentes. Chaque case de la première ligne, en haut du tableau, est relative à l'un des dix chiffres du dictionnaire qui est reconnu par le réseau de neurones en réponse à l'application d'un bloc de pixels à l'entrée du réseau de neurones. A titre d'exemple, pour faciliter la lecture du tableau, le chiffre "0" appliqué 500 fois sous la forme de blocs de pixels correspondant respectivement à des chiffres manuscrits écrits par des personnes différentes, n'est reconnu en le chiffre "0" que 490 fois. Le réseau de neurones le reconnaît quatre fois par erreur en le chiffre "1". Comme le montre la dernière colonne à droite du tableau, des chiffres tels que "3" et "9" induisent des taux d'erreur en reconnaissance particulièrement élevés ou des taux de reconnaissance particulièrement faibles, dus notamment à leur similitude de forme avec les chiffres "9" et "7". La moyenne des taux de reconnaissance indiqués dans la colonne de droite du tableau donne un taux moyen de reconnaissance pour tous les chiffres du dictionnaire de 94,5%.
Le tableau de la figure 3B est établi d'une manière analogue pour un réseau de neurones à codage par contours. Les résultats de reconnaissance sont encore plus faibles, puisque le taux moyen de reconnaissance est de 90,8%. Cette différence notable avec les résultats du codage par pixels est due au nombre sensiblement plus faible des pixels sur lesquels est basée la reconnaissance par contours d'un chiffre. Par exemple le réseau de neurones à codage par pixels présente un taux de reconnaissance de 94,8% pour le chiffre "7", contre 86,6% pour le réseau à codage par contours.
Ainsi, les erreurs en reconnaissance sont réparties de façon différente selon le type de codage retenu.
L'invention se propose d'utiliser la complémentarité de N=2 méthodes de reconnaissance de chiffres manuscrits par réseau de neurones uniquement différenciées par le type de codage utilisé. Il est intéressant de noter que la combinaison des deux procédés de reconnaissance que propose l'invention est cohérente avec les études menées sur le cerveau humain. En effet, selon les neuropsychologues, l'hémisphère droit et l'hémisphère gauche dans un cerveau humain sont respectivement affectés au traitement des informations qualifiées de spatiale, par analogie avec le codage par pixels, et au traitement des informations dites de type langage, par analogie avec le codage par contours. En pratique, un corps calleux lie ces deux hémisphères probablement à des fins d'échange d'informations entr'eux, et l'invention propose de simuler cette liaison. Les résultats de reconnaissance obtenus pour la première variante de procédé selon l'invention et donnés à la figure 3C sont supérieurs à ceux résultant d'un codage par contours ou d'un codage par pixels. Un taux moyen de reconnaissance de 97,7% est obtenu dans le cadre de l'invention.
Le bloc-diagramme de la figure 4 présente les différentes étapes de la première variante de procédé selon l'invention. L'invention est ici décrite dans le cadre de la reconnaissance de chiffres manuscrits appartenant au dictionnaire de référence {0,...,9}.
Néanmoins l'invention peut concerner tout type de formes à reconnaître, telles que lettres, ensembles de caractères tels que mots et nombres, signatures, symboles, ou idéogrammes, appartenant à un dictionnaire de référence donné.
Dans une première étape (I) de cette première variante de procédé, un chiffre manuscrit écrit par une personne quelconque est codé selon deux codages distincts.
Un premier codage par pixels associe à un chiffre manuscrit, par exemple "8", un bloc de pixels de dimension donnée, typiquement égale à (16x16) pixels, qui est établi en numérisant en deux niveaux logiques "1" et "o", ou en 16 niveaux de gris, l'intensité de luminosité de portions élémentaires d'une surface sur laquelle est écrite le chiffre manuscrit.
Un second codage par contours associe au chiffre manuscrit "8" une suite de mots de codage par contour. Ce second codage résulte par exemple, comme décrit précédemment:
du codage du chiffre manuscrit "8" en un bloc de pixels associés chacun à l'un des deux niveaux de luminosité "noir" et "blanc", représentés par les niveaux logiques "1" et "0", puis
de l'identification des contours intérieur(s) et extérieur(s) du chiffre dans le bloc de pixels, et enfin
du codage de chaque contour en associant à chaque couple de pixels du contour, constitué d'un pixel donné et d'un pixel voisin pris selon un sens prédéterminé du contour, un code.
Ce code est par exemple l'un de quatre mots de codage à deux bits N, S, E et O respectivement associés aux points cardinaux Nord, Sud, Est et
Ouest, choisi en dépendance du positionnement relatif des deux pixels du couple relativement au sens de parcours du contour.
De ces premier et second codages sont extraits respectivement deux vecteurs d'entrée VEp et VEc qui sont appliqués à deux réseaux de neurones respectifs 2p et 2c, comme montré à l'étape II. Ces deux réseaux de neurones 2p et 2c possèdent des entrées en nombres égaux respectivement au nombre de pixels numérisés et au nombre de mots de codage par contours. Les réseaux 2p et 2c produisent en réponse respectivement deux vecteurs de sortie VSp et VSc qui identifient chacun une forme du dictionnaire de référence {0,...,9}. Ces deux vecteurs de sortie VSp et VSc sont multipliés par deux coefficients respectifs Fp et Fc à priori différents (étape III). Les deux coefficients Fp et Fc scnt fonction par exemple des taux d'erreurs de reconnaissance obtenus expérimentalement et indiqués dans les colonnes de droite des tableaux des figures 3A et 3B, relativement aux deux chiffres respectifs identifiés par les vecteurs VSp et VSc. Chacun des deux vecteurs de sortie VSp et VSc comprend dix composantes qui sont des nombres réels compris entre 0 et 1. Chaque composante d'un vecteur de sortie VSp ou VSc est associée à un chiffre du dictionnaire de référence et la composante ayant la valeur la plus élevée identifie un chiffre du dictionnaire {ot 9}. La multiplication du vecteur de sortie
VSp, respectivement VSc, par le coefficient Fp, respectivement Fc, a pour fonction d'atténuer la valeur de la composante identifiant un chiffre du dictionnaire {0,...,9} en proportion du taux d'erreur expérimental obtenu par le réseau concerné 2p respectivement 2c, pour le chiffre identifié par le vecteur VSp, respectivement VSc
Deux vecteurs corrigés Fp. VSp et Fc.VSc sont obtenus par multiplication des vecteurs VSp et VSc respectivement par les coefficients Fp et Fc. En pratique, cette étape III de multiplication des vecteurs de sortie peut être omise.
La dernière étape IV consiste en la multiplication de chacune des composantes de l'un des vecteurs Fp.VSp ou Fc.VSc avec la composante de l'autre vecteur ayant le même rang en un vecteur d'identification ID à 10 composantes dont la composante R ayant la valeur la plus élevée identifie l'un reconnu, ici 8, des 10 chiffres du dictionnaire de référence.
Cette dernière étape est cohérente avec la complémentarité des deux méthodes de reconnaissance par réseau de neurones à codage par pixels et à codage par contours. Les résultats de reconnaissance étant différents pour les deux méthodes, la multiplication composante par composante des deux vecteurs corrigés Fp.VSp et Fc.VSc tend à inhiber une erreur en reconnaissance d'un chiffre par l'un des deux réseaux lorsque l'autre réseau n'identifie pas ce chiffre, et ainsi produire une composante de vecteur d'identification associée à ce chiffre qui est voisine de 0. Un chiffre est ainsi reconnu lorsque des composantes ayant des rangs égaux dans les deux vecteurs de sortie Fp.VSp et Fc.VSc et associées audit chiffre ont des valeurs nettement différentes de zéro, tandis que n'est pas reconnu un chiffre associé à l'une des composantes dans les vecteurs corrigés Fp.VSp et Fc.VSc qui à une valeur très proche de zéro même si l'autre des composantes dans les vecteurs corrigés a une valeur élevée.
En référence à la figure 5, l'autre variante du procédé selon l'invention est maintenant présentée.
Cette seconde variante comprend deux premières étapes I' et II' identiques aux étapes I et II décrites précédemment en référence à la figure 4, savoir le codage d'un chiffre manuscrit par pixels en un premier vecteur d'entrée VSp et le codage de ce chiffre manuscrit par contours en un second vecteur d'entrée VEc, et l'application de ces deux vecteurs d'entrée en entrée des deux réseaux de neurones respectifs 2p et 2c. Les deux réseaux 2p et 2c produisent en réponse deux vecteurs de sortie VSp et
VSc respectifs. Ces deux vecteurs de sortie VSp et
VSc à 10 composantes identifient chacun un chiffre du dictionnaire de référence {0,...,9}.
Ces deux vecteurs de sortie VSp et VSc sont appliqués à vingt entrées d'un réseau de neurones additionnel 3a au cours d'une troisième étape III' de cette seconde variante. L'apprentissage de ce réseau de neurones 3a est destiné notamment à résoudre les cas difficiles de reconnaissance pour lesquels les deux réseaux de neurones 2p et 2c identifient deux chiffres distincts. Le réseau de neurones additionnel produit un vecteur d'identification de chiffre reconnu ID' identifiant l'un reconnu R' des dix chiffres du dictionnaire de référence {0,...,9}.
En pratique, dans un dispositif de reconnaissance de forme, le codage et la reconnaissance d'un chiffre manuscrit pour produire successivement les vecteurs VEp et VSp et le codage et la reconnaissance d'un chiffre manuscrit pour produire les vecteurs VEp et VSp peuvent être effectués respectivement par deux systèmes de traitement de données multiprocesseur qui fonctionnent en parallèle. Cette architecture parallèle est avantageuse par rapport à l'utilisation d'un seul système de traitement de données multiprocesseur effectuant pour chaque chiffre, d'abord l'un des codages par pixels et contours puis l'autre de ces codages, lorsque le débit du chiffre ou de tout autre caractère ou forme à reconnaître est élevé.
Selon la première variante, les quatres blocs illustrés aux étapes III et IV dans la figure 4 peuvent être constitués par deux circuits multiplieurs programmables de vecteur par un coefficient, un circuit multiplieur de deux vecteurs comparant par composante, et un circuit comparant les composantes d'un vecteur ID entr'elles pour déterminer la plus élevée R des composantes.
Pour la mise en oeuvre de la seconde variante illustrée à la figure 5, un dispositif de reconnaissance de forme est du type de celui décrit ci-dessus, en remplaçant les deux circuits multiplieur de vecteur par un troisième et additionnel système de traitement de données multiprocesseur jouant le rôle du réseau de neurones 3a, bien que les trois systèmes de traitement de données multiprocesseur peuvent être confondus en un seul jouant les rôles successifs des trois réseaux de neurones 2p, 2c et 3a pour chaque forme ou chiffre à reconnaître.

Claims (7)

REVENDICATIONS
1 - Procédé de reconnaissance d'une forme (0,...,9) par réseau de neurones, la forme étant associée à une forme de référence d'un dictionnaire de référence, caractérisé en ce qu'il comprend les étapes suivantes
- N codages différents de ladite forme en N vecteurs d'entrée (VEp ; VEc) appliqués respectivement en entrée de N réseaux de neurones distincts (2p,2c) produisant en réponse N vecteurs de sortie (VSp,VSc) susceptibles d'identifier chacun l'une de formes de référence du dictionnaire de référence, N étant un entier supérieur à 1,
- multiplication desdits N vecteurs de sortie (VSp,VSc) respectivement par N coefficients respectifs (Fp,Fc) en N vecteurs corrigés (Fp.VSp,Fc.VSc), et
- multiplication entr'elles de chacune de composantes de rang égal respectivement dans les N vecteurs corrigés (Fp.VSp,Fc.VSc), en un vecteur d'identification de forme (ID) identifiant l'une reconnue (R) desdites formes de référence du dictionnaire.
2 - Procédé conforme à la revendication 1, caractérisé en ce que lesdits N coefficients (Fp
Fc) sont fonction de taux d'erreurs établis expérimentalement relativement respectivement aux formes de référence identifiées séparemment par lesdits N réseaux de neurones.
3 - Procédé de reconnaissance d'une forme (0,...,9) par réseau de neurones, la forme étant associée à une forme de référence d'un dictionnaire de référence, caractérisé en ce qu'il comprend les étapes suivantes
- N codages différents de ladite forme en N vecteurs d'entrée (VEp;VEc) appliqués respectivement en entrée de N réseaux de neurones distincts (2p;2c) produisant en réponse N vecteurs de sortie (VSp,VSc) susceptibles d'identifier chacun l'une de formes de référence du dictionnaire de référence, N étant un entier supérieur à 1, et
- application desdits N vecteurs de sortie (VSp,VSc) à un réseau de neurones additionnel qui produit un vecteur d'identification de forme (ID') identifiant l'une reconnue (R') desdites formes de référence du dictionnaire.
4 - Procédé conforme à l'une quelconque des revendications 1 à 3, caractérisé en ce que le dictionnaire de référence contient des caractères alphanumériques et ladite forme est un caractère manuscrit.
5 - Procédé conforme à l'une quelconque des revendications 1 à 4, caractérisé en ce que l'entier
N est égal à 2 et les N=2 codages de ladite forme sont un codage par pixels de la forme et un codage par contours de la forme.
6.- Dispositif de reconnaissance de forme pour la mise en oeuvre du procédé conforme à la revendication 1 ou 2, comprenant N systèmes parallèles de traitement de données multiprocesseur (I', II') pour effectuer chacun l'un des N codages et produire l'un des N vecteurs de sortie (VSp;VSc) par réseau de neurones, des moyens (III) pour multiplier chacun des N vecteurs de sortie par les N coefficients (Fp;Fc) en les N vecteurs corrigés (Fp.Vp;Fc.Vc), des moyens (IV) pour multiplier une à une les composantes de rang égal des N vecteurs corrigés en le vecteur d'identification de forme (ID) et des moyens pour comparer les composantes du vecteur d'identification (ID) entr'elles afin de déterminer la plus élevée (R) des composantes.
7. - Dispositif de reconnaissance de forme pour la mise en oeuvre du procédé conforme à la revendication 3, comprenant N systèmes parallèles de traitement de données multiprocesseur (I', II') pour effectuer chacun l'un des N codages et produire l'un des N vecteurs de sortie (VSp;VSc) par réseau de neurones, un système additionnel de traitement de données multiprocesseur (3a) recevant en parallèle les N vecteurs de sortie (VSp, VSc) pour produire le vecteur d'identification de forme (ID') par réseau de neurones, et des moyens pour comparer les composantes du vecteur d'identification (ID') entr'elles afin de déterminer la plus élevée (R) des composantes.
FR9310280A 1993-08-26 1993-08-26 Reconnaissance de forme par réseau de neurones. Expired - Fee Related FR2709361B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9310280A FR2709361B1 (fr) 1993-08-26 1993-08-26 Reconnaissance de forme par réseau de neurones.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9310280A FR2709361B1 (fr) 1993-08-26 1993-08-26 Reconnaissance de forme par réseau de neurones.

Publications (2)

Publication Number Publication Date
FR2709361A1 true FR2709361A1 (fr) 1995-03-03
FR2709361B1 FR2709361B1 (fr) 1995-09-22

Family

ID=9450402

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9310280A Expired - Fee Related FR2709361B1 (fr) 1993-08-26 1993-08-26 Reconnaissance de forme par réseau de neurones.

Country Status (1)

Country Link
FR (1) FR2709361B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1190371B1 (fr) * 1999-06-15 2003-09-10 Solystic Procede de binarisation d'image

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0516316A2 (fr) * 1991-05-29 1992-12-02 Canon Kabushiki Kaisha Agent de sélection pour un système de détermination de symboles avec une pluralité de processeurs de reconnaissance de caractères

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0516316A2 (fr) * 1991-05-29 1992-12-02 Canon Kabushiki Kaisha Agent de sélection pour un système de détermination de symboles avec une pluralité de processeurs de reconnaissance de caractères

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A. J. R. HEADING ET AL: "Data fusion for object classification", 1991 IEEE INT. CONF. ON SYSTEMS, MAN, AND CYBERNETICS, vol. 2, 13 October 1991 (1991-10-13), CHARLOTTESVILLE, VA, XP000238034 *
B. C. HEYMANS ET AL: "A modular approach to character recognition by neural networks", 1991 IEEE INT. JOINT CONF. ON NEURAL NETWORKS, vol. 2/3, 18 November 1991 (1991-11-18), SINGAPORE, pages 1309 - 12, XP000282323 *
D. W. FINCHER ET AL: "Multiple-sensor data fusion using neural networks", 1990 IEEE INT. CONF. ON SYSTEMS, MAN, AND CYBERNETICS, 4 November 1990 (1990-11-04), LOS ANGELES, CA, pages 835 - 8, XP000215462 *
J. S. LEE ET AL: "Integration of neural networks and decision tree classifiers for automated cytology training", INT. JOINT CONF. ON NEURAL NETWORKS, vol. I, 8 July 1991 (1991-07-08), SEATTLE, WA, pages 257 - 62, XP000238302 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1190371B1 (fr) * 1999-06-15 2003-09-10 Solystic Procede de binarisation d'image

Also Published As

Publication number Publication date
FR2709361B1 (fr) 1995-09-22

Similar Documents

Publication Publication Date Title
CN110992275B (zh) 一种基于生成对抗网络的细化单幅图像去雨方法
CA2646635C (fr) Traitement de donnees biometriques dans un referentiel multi dimensionnel
FR2561011A1 (fr) Processeur de calcul d'une transformee discrete inverse du cosinus
WO2013092916A1 (fr) Identification biometrique utilisant des filtres et par calcul multi partiesecurise
FR3087558A1 (fr) Procede d'extraction de caracteristiques d'une empreinte digitale representee par une image d'entree
FR3058542A1 (fr) Procede pour l'authentification d'une illustration.
EP3832535A1 (fr) Procédé de détection d'au moins un élément d'intérêt visible dans une image d'entrée au moyen d'un réseau de neurones à convolution
US11087106B2 (en) Method of extracting features from a fingerprint represented by an input image
FR3088467A1 (fr) Procede de classification d'une image d'entree representative d'un trait biometrique au moyen d'un reseau de neurones a convolution
Long et al. Bishift networks for thick cloud removal with multitemporal remote sensing images
EP3582141A1 (fr) Procédé d'apprentissage de paramètres d'un réseau de neurones à convolution
CN114648787A (zh) 人脸图像的处理方法及相关设备
CN112889084B (zh) 提高图像的颜色质量的方法、系统和计算机可读介质
CN111951175A (zh) 一种基于自编码网络的人脸图像规范化方法
Mun et al. Texture preserving photo style transfer network
FR2795205A1 (fr) Procede pour binariser des images numeriques a plusieurs niveaux de gris
FR2630277A1 (fr) Procede de codage et de decodage d'informations, par blocs, et dispositifs de codage et de decodage, pour la mise en oeuvre de ce procede
FR2709361A1 (fr) Reconnaissance de forme par réseau de neurones.
FR2684829A1 (fr) Methodes de synthese de signaux de texture et de transmission et/ou stockage de tels signaux, ainsi que dispositifs et systemes pour leur mise en óoeuvre.
CN116681621A (zh) 一种基于特征融合及复用的人脸图像修复方法
CN110569763A (zh) 一种用于细粒度人脸识别的眼镜去除方法
EP0447306B1 (fr) Dispositif de reconnaissance de séquences dans un signal multidimensionnel
CN114913516A (zh) 一种烟草零售许可证的识别方法及系统
EP0456804B1 (fr) Procede de compression d'images par auto-organisation d'un reseau neuronal
FR3095286A1 (fr) Procédé de traitement d’image d’un document d’identité.

Legal Events

Date Code Title Description
ST Notification of lapse