BE1025502A1

BE1025502A1 - Système et procédé de reconnaissance de formes utilisant des fonctions de gabor

Info

Publication number: BE1025502A1
Application number: BE20155241A
Authority: BE
Inventors: Frédéric Collet; Jordi Hautot; Michel Dauw; Meulenaere Pierre De; Olivier Dupont; Günter Hensges
Original assignee: Iris Sa
Priority date: 2014-04-16
Filing date: 2015-04-15
Publication date: 2019-03-20
Also published as: JP6609267B2; CN106462773A; WO2015158778A1; CN106462773B; JP2017515221A; BE1025502B1; US9058517B1; KR20160148563A; KR102268174B1

Abstract

Un système et un procédé de reconnaissance de formes qui génèrent un vecteur de caractéristiques en multipliant un vecteur d'image avec une matrice creuse. La matrice creuse est générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne. La fonction de Gabor est une fonction d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale. La longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.

Description

SYSTÈME ET PROCÉDÉ DE RECONNAISSANCE DE FORMES

UTILISANT DES FONCTIONS DE GABOR

DOMAINE DE L'INVENTION

La présente invention concerne un système de reconnaissance de formes. Plus spécifiquement, la présente invention concerne un système de reconnaissance de formes utilisant une fonction de Gabor.

CONTEXTE DE L'INVENTION

Un système de reconnaissance de formes peut être un système de reconnaissance optique de caractères (ROC). Les systèmes ROC sont connus. Ils convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système ROC, les images de ce qui pourrait être des caractères sont isolées et un processus de reconnaissance de caractères est utilisé pour identifier le caractère.

Les processus connus de reconnaissance optique de caractères comprennent en général:

• une étape de normalisation qui génère une matrice normalisée à partir d'une image d'entrée;

• une étape d'extraction de caractéristiques; et • une étape de classification pour identifier le caractère.

L'étape d'extraction de caractéristiques génère un vecteur de caractéristiques qui caractérise l'image d'entrée et l'étape de classification identifie le caractère en partant de ce vecteur de caractéristiques. Dans certains processus de ROC, l'étape d'extraction de caractéristiques comprend un filtrage avec un filtre de Gabor. Le choix du filtre de Gabor est déterminant pour le processus de ROC parce que le filtre de Gabor

BE2015/5241 détermine le vecteur de caractéristiques pour identifier le caractère. Le vecteur de caractéristiques doit contenir l'information nécessaire pour identifier le caractère avec grande exactitude. Un vecteur de caractéristiques trop grand rend les calculs lents et un vecteur de caractéristiques trop petit diminue l'exactitude de l'identification du caractère. Les procédés de ROC connus utilisant des filtres de Gabor sont trop lents ou ont une exactitude trop faible. Cela est particulièrement important pour l'identification des caractères asiatiques à cause du nombre extrêmement élevé de caractères asiatiques. Un autre inconvénient des filtres de Gabor connus réside dans le fait qu'ils ne fonctionnent pas de manière adéquate avec l'étape de classification subséquente.

US 7174044 B2 divulgue un procédé connu de reconnaissance de caractères basé sur des filtres de Gabor qui extraient l'information des directions spécifiques des caractères. Ce procédé utilise une moyenne sur des régions de filtres de Gabor et comprend de nombreux calculs et un grand vecteur de caractéristiques. Cela rend les processus de ROC utilisant ce procédé trop lent.

Le document “High performance Chinese OCR based on Gabor features, discriminative feature extraction and model training” de Qiang Huo, Yong Ge et Zhi-Dan Feng in the Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, 2001, Volume 3, décrit un processus de ROC connu pour des caractères chinois. Ce procédé est rapide mais l'exactitude de la reconnaissance n'est pas extrêmement élevée. .

La dissertation intitulée “Chinese OCR System Based on Gabor Features and SVM” de Dai Wei à l'université Shanghai Jiaotong décrit un autre processus de ROC. SVM signifie Support Vector Machine (machine à vecteurs de support ou séparateurs à vaste marge) un modèle d'apprentissage supervisé qui utilise des algorithmes d'apprentissage

BE2015/5241 associés pour l'analyse de données et des algorithmes de reconnaissance. Un tel système SVM requiert un très grand ensemble d'apprentissage qui le rend impraticable ou inexact.

RÉSUMÉ DE L'INVENTION

Un but de cette invention est de fournir un procédé de reconnaissance de formes qui permet une identification rapide et exacte de la forme.

Un autre but de cette invention est de fournir un produit de programme informatique pour mettre en œuvre ledit système de reconnaissance de formes.

Ces buts sont atteints selon les modes de réalisation de l'invention.

Dans un mode de réalisation, le procédé d'identification d'une forme dans une image d'entrée comprend les étapes consistant à:

a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,

b) générer un vecteur d'image à partir de la matrice normalisée,

c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,

BE2015/5241

e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, et

f) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.

On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, parce que le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix de deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un compromis avantageux pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant. Cette redondance du vecteur de caractéristiques a pour résultat qu'un caractère peut quand même être reconnu même si la valeur d'un élément donné du vecteur de caractéristiques est corrompue.

Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes, la densité de probabilité étant calculée par la formule:

BE2015/5241 [ΪΟμΓΪΣΟμα ρ Q □ □ - exp m-------------□ □ Ε2π^|Σ| ² où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques.

Dans un autre mode de réalisation, la matrice de covariance est approximée. Dans un mode de réalisation, les traces des matrices de covariance de tous les modèles sont égales.

Dans un mode de réalisation, tous les éléments non diagonaux de la matrice de covariance sont réglés sur zéro. On a constaté que la 10 caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.

Dans un mode de réalisation selon la présente invention, le 15 paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.

Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle. Dans un autre mode de 20 réalisation, la somme de la plus haute valeur de l'angle et de la plus basse valeur de l'angle est égale à n radians. Dans un mode de réalisation, l'angle prend six valeurs.

Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage 25 angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.

BE2015/5241

Dans un autre mode de réalisation selon l'invention, la fonction de Gabor est une fonction d'au moins deux paramètres relatifs à un centre de la fonction de Gabor. Dans un mode de réalisation, les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de 5 Gabor sont régulièrement espacés.

Dans un mode de réalisation de l'invention, un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice 10 normalisée. Dans un mode de réalisation, la distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.

Ce choix des centres de la fonction de Gabor donne un bon 15 échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour avoir des calculs rapides du procédé.

Dans un autre mode de réalisation selon l'invention, la fonction de Gabor comprend un paramètre relatif à la largeur de la fonction gaussienne, 20 qui peut être l'écart type de la fonction gaussienne. Dans un mode de réalisation, l'écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage 25 de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.

Dans un mode de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un

BE2015/5241

Ί logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.

Dans un autre mode de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.

Dans un mode de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.

Dans des modes de réalisation selon l'invention, les éléments du vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.

BE2015/5241

Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, la longueur d'onde plus courte est plus courte que la distance entre deux centres adjacents et la longueur d'onde plus longue est plus longue que la distance entre deux centres adjacents.

Dans un mode de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.

Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et

2,61799 radians, les centres de la fonction de Gabor sont situés aux positions (6,6), (6,18), (6,30), (6,42), (6,54), (18,6), (18,18), (18,30), (18,42), (18,54), (30,6), (30,18), (30,30), (30,42), (30,54), (42,6), (42,18), (42,30), (42,42), (42,54), (54,6), (54,18), (54,30), (54,42), (54,54), la première valeur de longueur d'onde est égale à 11, la deuxième valeur de longueur d'onde est égale à 22 et l'écart type de la fonction gaussienne est égal à 8. On a constaté que ce mode de réalisation donne une très bonne exactitude et les calculs correspondants sont rapides.

Dans un autre mode de réalisation la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans

BE2015/5241 lequel est stockée une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:

a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,

b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,

c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,

e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, et

BE2015/5241

f) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.

Dans un mode de réalisation de la présente invention, le procédé pour identifier une forme dans une image d'entrée comprend les étapes consistant à

b) créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

c) générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles 108 une densité de probabilité de chaque modèle,

d) identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée,

BE2015/5241 dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec

a. le premier ensemble d'au moins une valeur inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et

b. le premier ensemble d'au moins une valeur supérieure ou sensiblement égale à la moitié des valeurs dans le deuxième ensemble d'au moins une valeur.

On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, premièrement, le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un bon compromis pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant.

Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes. La densité de probabilité peut être calculée par la formule □’□pffZCÏDpD pQ-DD ..... Axp ΠΠ---— ----—□ □ C2ttS|Z| ² où le symbole r représente le vecteur de caractéristiques, le symbole Z représente la matrice de covariance, le symbole μ représente le vecteur de

BE2015/5241 moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques. Dans des modes de réalisation, tous les éléments non diagonaux de la matrice de covariance peuvent être réglés sur zéro, la matrice de covariance peut être approximée, les traces des matrices de covariance de tous les modèles peuvent être égales. On a constaté que la caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.

Dans des modes de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.

Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle et la somme de sa plus haute valeur et de sa plus basse valeur est égale à n radians. Cet angle peut prendre six valeurs. Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.

Dans des modes de réalisation selon l'invention, au moins deux paramètres se rapportent à un centre de la fonction de Gabor et peuvent être tels que les centres de la fonction de Gabor sont régulièrement espacés. Un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice normalisée. La distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres

BE2015/5241 adjacents de la fonction de Gabor. Ce choix des centres de la fonction de Gabor donne un bon échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.

Dans des modes de réalisation selon l'invention, un paramètre se rapporte à la largeur de la fonction gaussienne, qui peut être l'écart type de la fonction gaussienne. Cet écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et peut être supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage de l'image normalisée, rend le vecteur de caractéristiques légèrement redondant et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.

Dans des modes de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.

Dans des modes de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.

Dans des modes de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image

BE2015/5241 normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.

Dans des modes de réalisation selon l'invention, les éléments d'un vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement établis égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation de la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.

Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres adjacents.

Dans des modes de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.

BE2015/5241

Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse utilisée dans l'étape de création du vecteur de caractéristiques est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et

Dans un autre mode de réalisation de la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:

b) des deuxièmes moyens de code de programme lisible par ordinateur pour créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres

BE2015/5241 comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

c) des troisièmes moyens de code de programme lisible par ordinateur pour générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles une densité de probabilité de chaque modèle pour identifier un meilleur modèle comme la forme dans une image d'entrée,

d) des quatrièmes moyens de code de programme lisible par ordinateur pour identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec

BRÈVE DESCRIPTION DES DESSINS

Pour une meilleure compréhension de la présente invention, il sera maintenant fait référence, à titre d'exemple, aux dessins joints dans lesquels:

BE2015/5241

La figure 1 montre un organigramme d'un processus de reconnaissance de caractères selon l'invention.

La figure 2 montre une illustration schématique d'une étape de normalisation dans un processus de reconnaissance optique de caractères selon l'invention.

La figure 3 montre un organigramme d'une étape d'extraction dans un processus de reconnaissance optique de caractères selon l'invention.

La figure 4 montre un organigramme qui décrit comment les éléments de la matrice creuse sont générés dans un processus de reconnaissance optique de caractères selon l'invention.

La figure 5 a montre une illustration d'une multiplication de matrice entre une matrice creuse et un vecteur d'image utilisée dans un processus de reconnaissance optique de caractères selon l'invention.

La figure 5 b montre une illustration d'une matrice de seuil utilisée dans un processus de reconnaissance optique de caractères selon l'invention.

La figure 6 montre un organigramme d'une étape de classification dans un processus de reconnaissance optique de caractères selon l'invention.

DESCRIPTION DE L'INVENTION

La présente invention sera décrite en rapport avec des modes de réalisation particuliers et en référence à certains dessins mais l'invention n'y est toutefois pas limitée. Les dessins décrits ne sont que schématiques et sont non limitatifs. Dans les dessins, la taille de certains des éléments peut être exagérée et non dessinée à l'échelle à des fins illustratives.

En outre, les termes premier, deuxième, troisième et similaire dans la description et dans les revendications sont utilisés pour faire la

BE2015/5241 distinction entre éléments similaires et pas nécessairement pour décrire un ordre séquentiel ou chronologique. Les termes sont interchangeables dans les circonstances appropriées et les modes de réalisation de l'invention peuvent fonctionner dans d'autres séquences que celles décrites ou illustrées dans le présent document.

De plus, les divers modes de réalisation, bien que qualifiés de préférés, doivent être interprétés comme des façons exemplaires dont l'invention peut être mise en œuvre plutôt que comme limitant la portée de l'invention.

Le terme comprenant, utilisé dans les revendications, ne doit pas être interprété comme étant limité aux moyens ou étapes énumérés cidessous; il n'exclut pas d'autres éléments ou étapes. Il doit être interprété comme spécifiant la présence des éléments, nombres entiers, étapes ou composants cités auxquels il est fait référence mais n'exclut pas la présence ou l'ajout d'un ou plusieurs autres éléments, nombres entiers, étapes ou composants ou groupes de ceux-ci. Donc, la portée de l'expression un dispositif comprenant A et B ne devrait pas être limitée à des dispositifs comprenant uniquement les composants A et B, au contraire, en ce qui concerne la présente invention, les seuls composants énumérés du dispositif sont A et B, et la revendication devrait également être interprétée comme incluant des équivalents de ces composants.

Les nombres binaires, vecteurs et matrices sont censés être écrits ici avec 0 et 1 mais il est clair pour une personne de métier qu'ils pourraient être écrits comme vrai et faux, noir et blanc ou tout autre moyen pour indiquer un état binaire.

Dans un mode de réalisation de la présente invention, des images binaires sont traitées. Les images binaires sont des images numériques avec uniquement deux couleurs possibles pour chaque pixel. Ces deux couleurs, en général noir et blanc, peuvent être représentées comme des

BE2015/5241 valeurs vraies et fausses ou des valeurs 1 et 0. Une représentation avec 1 et 0 est spécialement utile pour effectuer un traitement mathématique d'image. Le traitement d'images binaires comprend souvent des étapes de filtrage afin, par exemple, d'améliorer certaines caractéristiques de l'image, ou pour effectuer des opérations morphologiques sur l'image. Les filtres sont en général décrits mathématiquement par des matrices et l'application d'un filtre sur une image binaire est décrite par la multiplication de la matrice de filtre et de la matrice d'image binaire. Ce type d'opération peut être utilisé, par exemple dans la reconnaissance optique de caractères, comme une étape dans le traitement de l'image pour extraire les caractéristiques de l'image en vue de reconnaître un caractère optique.

Les systèmes de reconnaissance optique de caractères convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système de ROC, les images de ce qui pourrait être des caractères sont isolées et un procédé de reconnaissance de caractères est utilisé pour identifier le caractère.

Un mode de réalisation de la présente invention concerne la reconnaissance optique de caractères en partant d'une image d'entrée représentant un caractère ou une autre forme. Dans un mode de réalisation préféré de la présente invention, la reconnaissance optique de caractères part d'une image d'entrée représentant un caractère asiatique. L'image d'entrée est, dans un mode de réalisation de l'invention, une image bicolore. Dans un mode de réalisation préféré de la présente invention, l'image d'entrée est une image en noir et blanc. Dans un mode de réalisation de la présente invention, l'image d'entrée est une image bidimensionnelle. Dans un mode de réalisation de la présente invention, l'image d'entrée représente une forme comprenant un caractère, un logo, une image ou un dessin, à reconnaître par le système de reconnaissance. Dans un autre mode de réalisation de la présente invention, la forme est une séquence sonore, une

BE2015/5241 séquence de film ou une forme tridimensionnelle, à reconnaître par le système de reconnaissance.

Un processus de reconnaissance optique de caractères 101 selon un mode de réalisation de l'invention représenté sur la figure 1 comprend:

• une étape de normalisation 103 qui génère une matrice normalisée 104 à partir d'une image d'entrée 102;

• une étape d'extraction 105 qui génère un vecteur de caractéristiques 106 à partir de la matrice normalisée 104; et • une étape de classification 107 qui calcule un meilleur modèle 109 pour l'image d'entrée 102 parmi une série de modèles 108 possibles. L'étape de classification 107 rend également une densité de probabilité 110 de chaque modèle, laquelle fournit une mesure de l'exactitude de l'étape de classification 107.

Dans l'étape de normalisation 103, l'image d'entrée 102 est subdivisée en pixels 201. Chaque pixel 201 de l'image d'entrée 102 est représenté par un élément 202 d'une matrice intermédiaire 203, comme illustré sur la figure 2. La matrice intermédiaire 203 est, dans un mode de réalisation de l'invention, une matrice binaire. La matrice intermédiaire 203 est soumise à une combinaison d'étapes qui peuvent comprendre une mise à l'échelle, un seuillage, un lissage, une interpolation, un filtrage,... Le produit de cette combinaison d'étapes est une matrice normalisée 104 qui correspond à une image normalisée 206. Dans un mode de réalisation de la présente invention, l'image normalisée 206 a un format prédéterminé et est centrée.

Chaque élément 207 de la matrice normalisée 104 correspond à un pixel 208 du format prédéterminé dans l'image normalisée 206.

BE2015/5241 .

Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice binaire qui correspond à une image normalisée 206 bicolore. Chaque élément de la matrice normalisée 104 est caractérisé par sa ligne x 204 et sa colonne y 205, ce qui correspond à un emplacement sur l'image normalisée 206. Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice de 64x64. Dans un mode de réalisation de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant. Dans un mode de réalisation préféré de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est égal à 16 pixels. Dans un mode de réalisation de la présente invention, le rapport d'aspect hauteur / largeur de la forme ou du caractère est conservé pendant l'étape de normalisation 103.

L'étape d'extraction de caractéristiques 105 qui génère le vecteur de caractéristiques 106 à partir de la matrice normalisée 104 comprend une multiplication matrice - vecteur 304. Cela peut être expliqué en détails à l'aide de la figure 3. La matrice normalisée 104 de dimensions AxB est transformée en un vecteur d'image 301 de longueur A*B. Pendant cette transformation, chaque élément du vecteur d'image 301 est établi égal à un élément de la matrice normalisée 104 de sorte que tous les éléments de la matrice normalisée 104 sont copiés une fois seulement dans le vecteur d'image 301. Dans un mode de réalisation de la présente invention, le vecteur d'image 301 est un vecteur binaire. Le vecteur d'image 301 contient l'information de l'image normalisée 206. L'emplacement d'un élément de la ligne x 204 et de la colonne y 205 dans la matrice normalisée 104, c'est-àdire qui correspond à un emplacement dans l'image normalisée 206, correspond aussi à une valeur spécifique de l'indice j 302 qui indique le j^èmeélément du vecteur d'image 301. Dans un mode de réalisation de la

BE2015/5241 présente invention, le vecteur d'image 301 a 4096 éléments et l'indice j peut prendre toutes les valeurs de nombre entier entre 1 et 4096. Cela correspond à une matrice normalisée 104 de 64x64 (64*64=4096).

Dans un mode de réalisation de la présente invention, la multiplication matrice - vecteur 304 est approximative et le vecteur de caractéristiques 106 est une approximation du résultat mathématique exact de la multiplication de matrice entre une matrice creuse 303 et le vecteur d'image 301. Un indice i 401 est utilisé pour spécifier le i^ème élément du vecteur de caractéristiques 106. L'adjectif creuse indique que la matrice est peuplée principalement de zéros dans un mode de réalisation de la présente invention.

La figure 4 décrit la génération, avec une fonction de Gabor 404, d'un élément 406 situé à la ligne i 401 et la colonne j 302 de la matrice creuse 303. Tous les éléments 406 de la matrice creuse 303 sont générés de la même façon. La fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne. La fonction de Gabor 404 a des paramètres 402, qui correspondent à l'indice i, et des variables x 204 et y 205, qui correspondent à l'indice j, comme entrées.

L'indice de ligne i 401 de l'élément 406 de matrice creuse à calculer spécifie les valeurs prises par les paramètres 402 utilisés dans la fonction de Gabor 404. Dans un mode de réalisation de la présente invention, les paramètres 402 sont représentés par les symboles a,, Oj, λ,, Cx et Cy:

• a, est un angle relatif à la direction de l'onde sinusoïdale plane de la fonction de Gabor 404;

• o, est l'écart type de la fonction gaussienne de la fonction de Gabor 404;

• λ, est la longueur d'onde de l'onde sinusoïdale plane de la fonction de Gabor 404;

BE2015/5241 • Οχ, est le centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction verticale; et • Gy, est Je centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction horizontale.

Dans un mode de réalisation de l'invention, les paramètres sont choisis comme suit:

• Les valeurs Cxj sont régulièrement espacées.

• Si la distance entre deux valeurs Cx, est appelée dCx, le premier Cx,, Cxi est égal à dCx/2.

• Les valeurs Cy, sont régulièrement espacées.

• Si la distance entre deux valeurs Cy, est appelée dCy, le premier Cy_b Cyi est égal à dCy/2.

• Les angles «i sontrégulièrement-espacés.

• La somme de la plus haute valeur de a, et de la plus basse valeur de a, est égale à n radians.

• Les valeurs de o, sont inférieures à dCx.

• Les valeurs de σ, sont supérieures à dCx/2.

• Les valeurs de o, sont inférieures à dCy.

• Les valeurs de oi sont supérieures à dCy/2.

• Dans un premier ensemble de valeurs d'au moins une valeur, les valeurs de λ, sont inférieures à dCx et à dCy.

• Les valeurs de λ, dans un deuxième ensemble d'au moins une valeur sont telles que les valeurs dans le premier ensemble de valeurs sont supérieures ou sensiblement égales à la moitié des valeurs dans le deuxième ensemble de valeurs.

Dans des modes de réalisation supplémentaires de l'invention, les paramètres remplissent une ou plusieurs des conditions suivantes:

• dCx et dCy sont égales entre elles.

BE2015/5241 • ex, prend cinq valeurs.

• Cy, prend cinq valeurs.

• ar prend six valeurs.

• ûj prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et 2,61799 radians.

• a, prend une valeur.

• λ, prend deux valeurs: Ai et A2· • λ! est inférieure à dCx.

• A-ι est inférieure à dCy.

• λ₂ est supérieure à A₁ et inférieure ou égale à 2*Ai.

Dans un mode de réalisation préféré d'une matrice normalisée 104 de 64x64, les positions Cx, sont 6, 18, 30, 42 et 54, les positions Cy, sont 6, 18, 30i ‘42>et 54, l'écart type σ, est 8_; les longueurs d'onde A, sont 11 et 22. Les valeurs des paramètres dans un mode de réalisation de la présente invention sont repris dans le Tableau 1.

Le nombre d'ensembles de valeurs pour les paramètres 402 est égal à (nombre de valeur de Cx*nombre de valeurs de Cy*nombre de valeurs de a*nombre de valeurs de o*nombre de valeurs de A,). Dans un mode de réalisation préféré, le nombre d'ensembles de paramètres est égal à 300=5*5*6*1*2 et l'indice de ligne i 401 prend des valeurs de nombre entier de 1 à 300.

, L'indice de colonne j 302 de l'élément 406 de matrice creuse à calculer spécifie les valeurs des variables x 204 et y 205 utilisées par la fonction de Gabor 404.

La fonction de Gabor 404 est exprimée par:

BE2015/5241

2 π g[i,7x,y ] □ - _α βχρ{λ/αϊ— [cosa_L:x CXL+ sinaTy. Cy ; ] z π o_n ^u Λ_α □< □ Qa? + y □ cVrPP □--- j 7——}

2σ_αα le produit de la fonction de Gabor 404 calculée • à partir d'un ensemble donné de valeurs des paramètres 402 qui correspond à l'indice i 401, · à un endroit donné de la ligne x 204 et de la colonne y 205 de l'image normalisée 206 qui correspond à l'indice j 302 est l'élément 406 de la ligne i 401 et de la colonne j 302 dans la matrice creuse 303. Le nombre de colonnes de la matrice creuse 303 est égal au nombre d'éléments du vecteur d'image 301. Dans un mode de réalisation de la présente invention, la matrice creuse 303 est une matrice de 300x4096.

Dans un mode de réalisation de la présente invention, l'élément (i,j) 406 de la matrice creuse est donné par

-ν'^--? 2 π ^MÜ ^D ô---Fi ^exP(---;---[cosatjnj □ Wo64 □ CXi π o_n ^u Λ_α + sinttijllj □ 1U/64 □ Cy^f] _π Œj □ 1 _%64 □ + Œj □ 1Û/64 □ Cÿjî

O }

Le symbole % représente l'opération modulo et a le pas sur les opérations * et /, et le symbole H donne la partie entière du résultat d'une division entre nombres entiers et prend le pas sur les opérations * et /. Les paramètres ont les valeurs suivantes π

α_αα □ □ 1c%nb_a * —— nb_n

2⁽^^)%m_n φ_ΠΠ----------maxWavelength

BE2015/5241 i □ 1

CÿnO stepSze//2 + stepSze * (—----—) % nbSteps

HDq * HDq

Qk □ stepSze/ / 2 + stepSze * □----—----%nbFeatures nb_a □ 6 nb_D □ 2 maxWavelength □ 22 stepSize -12 nbSteps □ 5 nbFeatures = 300 σ □ 8.

nbSteps est tel que Cx, et Cy, sont inférieures ou égales à 64.

Une multiplication matrice - vecteur 304 est effectuée pour multiplier la matrice creuse 303 et le vecteur d'image 301, la matrice creuse 303 étant le premier facteur de la multiplication et le vecteur d'image 301 étant le deuxième facteur de la multiplication comme illustré sur la figure 5. Le vecteur résultant de la multiplication dé la matrice creuse 303 et du vecteur d'image 301 est le vecteur de caractéristiques 106. Le nombre d'éléments du vecteur de caractéristiques 106 est égal au nombre de lignes de la matrice creuse 303. Dans un mode de réalisation préféré de la présente invention, le nombre d'éléments du vecteur de caractéristiques 106 est égal à 300.

Dans un mode de réalisation de la présente invention, le vecteur de caractéristiques 106 contient des informations spécifiques à propos de l'image d'entrée 102, ces informations spécifiques concernant les caractéristiques d'image importantes en vue de la reconnaissance de formes. Le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres

BE2015/5241 adjacents rend l'information contenue dans le vecteur de caractéristiques 106 légèrement redondante. La redondance de l'information dans le vecteur de caractéristiques 106 augmente l'exactitude de l'étape de classification 107.

La multiplication de matrice entre la matrice creuse 303 et le vecteur d'image 301 ayant pour résultat le vecteur de caractéristiques 106 est montrée sur la figure 5a. Les éléments de la matrice creuse 303 sont appelés Mij. i est l'indice qui donne le numéro de ligne et prend toutes les valeurs de nombre entier entre 1 et m. j est l'indice qui donne le numéro de colonne et prend toutes les valeurs de nombre entier entre 1 et n. Le vecteur d'image 301 a une colonne de n éléments appelés vj. Le vecteur de caractéristiques 106 a une colonne de m éléments appelés ri. La multiplication de matrice est telle que les éléments ri du vecteur de caractéristiques 106 sont calculés comme ri □ Zr= Mijvj (Équation 1)

Certains termes peuvent être négligés dans la somme de l'Équation 1. Par exemple, les termes Mij vj où vj est égal à zéro sont également égaux à 0. En outre, dans le cas où vj est égal à 1, et où l'élément Mij de la matrice creuse 303 est petit, le terme Mij vj peut également être négligé. Pour contrôler petit, une matrice de seuil 501 avec des éléments Tij, montrée sur la figure 5b, est utilisée dans un mode de réalisation de la présente invention. Dans un mode de réalisation de la présente invention, un terme Mij vj peut être négligé si Mij est inférieur à Tij. Dans un mode de réalisation supplémentaire de la présente invention, tous les éléments Tij de la matrice de seuil 501 ont la même valeur. Étant donné que la fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne, de nombreux éléments de la matrice creuse 303 sont très petits.

BE2015/5241

L'étape de classification 107 du processus de ROC 101 peut être décrite à l'aide de la figure 6. Dans un mode de réalisation de la présente invention, l'étape de classification 107 est une variation de la méthode de classifieur des plus proches voisins qui utilise la distance euclidienne pondérée où les poids sont différents pour chaque classe. L'étape de classification 107 utilise le vecteur de caractéristiques 106 et les modèles 108 comme entrées. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères, des groupes de caractères ou des caractères dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères asiatiques, des groupes de caractères asiatiques ou des caractères asiatiques dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des séquences sonores, des séquences de film ou des formes tridimensionnelles.

Dans un mode de réalisation de la présente invention, un modèle 108 est défini par une matrice de covariance Σ et un vecteur de moyennes μ. Dans un mode de réalisation de la présente invention, tous les éléments non diagonaux de Σ sont réglés sur zéro. Dans un mode de réalisation de la présente invention, les matrices de covariance Σ sont multipliées par une constante (constante différente pour chaque modèle) de sorte que les traces des matrices de covariance Σ de tous les modèles sont égales. Dans un mode de réalisation de la présente invention, la matrice de covariance est approximée. Dans un mode de réalisation de la présente invention, Σ est une matrice de 300x300 et μ un vecteur de 300 éléments.

Pour sélectionner le modèle qui correspond le mieux à l'image d'entrée 102 correspondant au vecteur de caractéristiques 106, une densité de probabilité 110 est calculée, pour chaque modèle 108, comme

BE2015/5241 ptjDD exp OD □Do où le symbole r représente le vecteur de caractéristiques 106.

Le symbole | Σ| représente le déterminant de la matrice Σ et le t dans [J □ pff indique la transposition du vecteur U □ pD k est égal au nombre d'éléments du vecteur de caractéristiques 106. Dans un mode de réalisation de la présente invention, k est égal à 300. Le produit [J □ pdFΣΠ □ μΠ est une multiplication de matrice suivant les conventions mathématiques usuelles.

Une fois que la densité de probabilité 601 de chaque modèle 108 est calculée dans une étape de calcul 601, le meilleur modèle 109 est sélectionné dans une étape de sélection 602. Le meilleur modèle 109 est le modèle avec la plus haute densité de probabilité 110. Dans un mode de réalisation de la présente invention, l'étape de classification 107 rend le meilleur modèle 109 et la densité de probabilité 110 de chaque modèle, pour fournir une mesure de l'exactitude de l'étape de classification. Dans une variante de réalisation, l'étape de classification 107 rend seulement le meilleur modèle 109. Dans une variante de réalisation, l'étape de classification 107 rend seulement la densité de probabilité de chaque modèle 110.

Un mode de réalisation de la présente invention comprend la combinaison de

- l'étape d'extraction de caractéristiques 105 avec les paramètres 402 comme décrit ci-dessus, et

- l'étape de classification 107 basée sur des distances euclidiennes pondérées avec tous les éléments non diagonaux de la matrice de covariance Σ réglés sur zéro et les traces des matrices de covariance Σ de tous les modèles égales.

BE2015/5241

Un tel système de ROC permet la reconstruction d'image, peut être calculé efficacement et rend l'exactitude de la ROC extrêmement élevée.

BE2015/5241

Tableau 1

indice	Έ5		%	CX	Cÿi
1	8	0,0454545	0	6	6
2	8	0,0454545	0,523598	6	6
3	8	0,0454545	1,0472	6	6
4	8	0,0454545	1,5708	6	6
5	8	0,0454545	2,09439	6	6
6	8	0,0454545	2,61799	6	6
7	8	0,0909091	0	6	6
8	8	0,0909091	0,523598	6	6
9	8	0,0909091	1,0472	6	6
10	8	0,0909091	1,5708	6	6
11	8	0,0909091	2,09439	6	6
12	8	0,0909091	2,61799	6	6
13	8	0,0454545	0	6	18
14	8	0,0454545	0,523598	6	18
15	8	0,0454545	1,0472	6	18
16	8	0,0454545	1,5708	6	18
17	8	0,0454545	2,09439	6	18
18	8	0,0454545	2,61799	6	18
19	8	0,0909091	0	6	18
20	8	0,0909091	0,523598	6	18
21	8	0,0909091	1,0472	6	18
22	8	0,0909091	1,5708	6	18
23	8	0,0909091	2,09439	6	18
24	8	0,0909091	2,61799	6	18
25	8	0,0454545	0	6	30
26	8	0,0454545	0,523598	6	30
27	8	0,0454545	1,0472	6	30
28	8	0,0454545	1,5708	6	30
29	8	0,0454545	2,09439	6	30
30	8	0,0454545	2,61799	6	30
31	8	0,0909091	0	6	30
32	8	0,0909091	0,523598	6	30
33	8	0,0909091	1,0472	6	30
34	8	0,0909091	1,5708	6	30

BE2015/5241

35	8	0,0909091	2,09439	6	30
36	8	0,0909091	2,61799	6	30
37	8	0,0454545	0	6	42
38	8	0,0454545	0,523598	6	42
39	8	0,0454545	1,0472	6	42
40	8	0,0454545	1,5708	6	42
41	8	0,0454545	2,09439	6	42
42	8	0,0454545	2,61799	6	42
43	8	0,0909091	0	6	42
44	8	0,0909091	0,523598	6	42
45	8	0,0909091	1,0472	6	42
46	8	0,0909091	1,5708	6	42
47	8	0,0909091	2,09439	6	42
48	8	0,0909091	2,61799	6	42
49	8	0,0454545	0	6	54
50	8	0,0454545	0,523598	6	54
51	8	0,0454545	1,0472	6	54
52	8	0,0454545	1,5708	6	54
53	8	0,0454545	2,09439	6	54
54	8	0,0454545	2,61799	6	54
55	8	0,0909091	0	6	54
56	8	0,0909091	0,523598	6	54
57	8	0,0909091	1,0472	6	54
58	8	0,0909091	1,5708	6	54
59	8	0,0909091	2,09439	6	54
60	8	0,0909091	2,61799	6	54
61	8	0,0454545	0	18	6
62	8	0,0454545	0,523598	18	6
63	8	0,0454545	1,0472	18	6
64	8	0,0454545	1,5708	18	6
65	8	0,0454545	2,09439	18	6
66	8	0,0454545	2,61799	18	6
67	8	0,0909091	0	18	6
68	8	0,0909091	0,523598	18	6
69	8	0,0909091	1,0472	18	6
70	8	0,0909091	1,5708	18	6
71	8	0,0909091	2,09439	18	6
72	8	0,0909091	2,61799	18	6

BE2015/5241

73	8	0,0454545	0	18	18
74	8	0,0454545	0,523598	18	18
75	8	0,0454545	1,0472	18	18
76	8	0,0454545	1,5708	18	18
77	8	0,0454545	2,09439	18	18
78	8	0,0454545	2,61799	18	18
79	8	0,0909091	0	18	18
80	8	0,0909091	0,523598	18	18
81	8	0,0909091	1,0472	18	18
82	8	0,0909091	1,5708	18	18
83	8	0,0909091	2,09439	18	18
84	8	0,0909091	2,61799	18	18
85	8	0,0454545	0	18	30
86	8	0,0454545	0,523598	18	30
87	8	0,0454545	1,0472	18	30
88	8	0,0454545	1,5708	18	30
89	8	0,0454545	2,09439	18	30
90	8	0,0454545	2,61799	18	30
91	8	0,0909091	0	18	30
92	8	0,0909091	0,523598	18	30
93	8	0,0909091	1,0472	18	30
94	8	0,0909091	1,5708	18	30
95	8	0,0909091	2,09439	18	30
96	8	0,0909091	2,61799	18	30
97	8	0,0454545	0	18	42
98	8	0,0454545	0,523598	18	42
99	8	0,0454545	1,0472	18	42
100	8	0,0454545	1,5708	18	42
101	8	0,0454545	2,09439	18	42
102	8	0,0454545	2,61799	18	42
103	8	0,0909091	0	18	42
104	8	0,0909091	0,523598	18	42
105	8	0,0909091	1,0472	18	42
106	8	0,0909091	1,5708	18	42
107	8	0,0909091	2,09439	18	42
108	8	0,0909091	2,61799	18	42
109	8	0,0454545	0	18	54
110	8	0,0454545	0,523598	18	54

BE2015/5241

111	8	0,0454545	1,0472	18	54
112	8	0,0454545	1,5708	18	54
113	8	0,0454545	2,09439	18	54
114	8	0,0454545	2,61799	18	54
115	8	0,0909091	0	18	54
116	8	0,0909091	0,523598	18	54
117	8	0,0909091	1,0472	18	54
118	8	0,0909091	1,5708	18	54
119	8	0,0909091	2,09439	18	54
120	8	0,0909091	2,61799	18	54
121	8	0,0454545	0	30	6
122	8	0,0454545	0,523598	30	6
123	8	0,0454545	1,0472	30	6
124	8	0,0454545	1,5708	30	6
125	8	0,0454545	2,09439	30	6
126	8	0,0454545	2,61799	30	6
127	8	0,0909091	0	30	6
128	8	0,0909091	0,523598	30	6
129	8	0,0909091	1,0472	30	6
130	8	0,0909091	1,5708	30	6
131	8	0,0909091	2,09439	30	6
132	8	0,0909091	2,61799	30	6
133	8	0,0454545	0	30	18
134	8	0,0454545	0,523598	30	18
135	8	0,0454545	1,0472	30	18
136	8	0,0454545	1,5708	30	18
137	8	0,0454545	2,09439	30	18
138	8	0,0454545	2,61799	30	18
139	8	0,0909091	0	30	18
140	8	0,0909091	0,523598	30	18
141	8	0,0909091	1,0472	30	18
142	8	0,0909091	1,5708	30	18
143	8	0,0909091	2,09439	30	18
144	8	0,0909091	2,61799	30	18
145	8	0,0454545	0	30	30
146	8	0,0454545	0,523598	30	30
147	8	0,0454545	1,0472	30	30
148	8	0,0454545	1,5708	30	30

BE2015/5241

149	8	0,0454545	2,09439	30	30
150	8	0,0454545	2,61799	30	30
151	8	0,0909091	0	30	30
152	8	0,0909091	0,523598	30	30
153	8	0,0909091	1,0472	30	30
154	8	0,0909091	1,5708	30	30
155	8	0,0909091	2,09439	30	30
156	8	0,0909091	2,61799	30	30
157	8	0,0454545	0	30	42
158	8	0,0454545	0,523598	30	42
159	8	0,0454545	1,0472	30	42
160	8	0,0454545	1,5708	30	42
161	8	0,0454545	2,09439	30	42
162	8	0,0454545	2,61799	30	42
163	8	0,0909091	0	30	42
164	8	0,0909091	0,523598	30	42
165	8	0,0909091	1,0472	30	42
166	8	0,0909091	1,5708	30	42
167	8	0,0909091	2,09439	30	42
168	8	0,0909091	2,61799	30	42
169	8	0,0454545	0	30	54
170	8	0,0454545	0,523598	30	54
171	8	0,0454545	1,0472	30	54
172	8	0,0454545	1,5708	30	54
173	8	0,0454545	2,09439	30	54
174	8	0,0454545	2,61799	30	54
175	8	0,0909091	0	30	54
176	8	0,0909091	0,523598	30	54
177	8	0,0909091	1,0472	30	54
178	8	0,0909091	1,5708	30	54
179	8	0,0909091	2,09439	30	54
180	8	0,0909091	2,61799	30	54
181	8	0,0454545	0	42	6
182	8	0,0454545	0,523598	42	6
183	8	0,0454545	1,0472	42	6
184	8	0,0454545	1,5708	42	6
185	8	0,0454545	2,09439	42	6
186	8	0,0454545	2,61799	42	6

BE2015/5241

187	8	0,0909091	0	42	6
188	8	0,0909091	0,523598	42	6
189	8	0,0909091	1,0472	42	6
190	8	0,0909091	1,5708	42	6
191	8	0,0909091	2,09439	42	6
192	8	0,0909091	2,61799	42	6
193	8	0,0454545	0	42	18
194	8	0,0454545	0,523598	42	18
195	8	0,0454545	1,0472	42	18
196	8	0,0454545	1,5708	42	18
197	8	0,0454545	2,09439	42	18
198	8	0,0454545	2,61799	42	18
199	8	0,0909091	0	42	18
200	8	0,0909091	0,523598	42	18
201	8	0,0909091	1,0472	42	18
202	8	0,0909091	1,5708	42	18
203	8	0,0909091	2,09439	42	18
204	8	0,0909091	2,61799	42	18
205	8	0,0454545	0	42	30
206	8	0,0454545	0,523598	42	30
207	8	0,0454545	1,0472	42	30
208	8	0,0454545	1,5708	42	30
209	8	0,0454545	2,09439	42	30
210	8	0,0454545	2,61799	42	30
211	8	0,0909091	0	42	30
212	8	0,0909091	0,523598	42	30
213	8	0,0909091	1,0472	42	30
214	8	0,0909091	1,5708	42	30
215	8	0,0909091	2,09439	42	30
216	8	0,0909091	2,61799	42	30
217	8	0,0454545	0	42	42
218	8	0,0454545	0,523598	42	42
219	8	0,0454545	1,0472	42	42
220	8	0,0454545	1,5708	42	42
221	8	0,0454545	2,09439	42	42
222	8	0,0454545	2,61799	42	42
223	8	0,0909091	0	42	42
224	8	0,0909091	0,523598	42	42

BE2015/5241

225	8	0,0909091	1,0472	42	42
226	8	0,0909091	1,5708	42	42
227	8	0,0909091	2,09439	42	42
228	8	0,0909091	2,61799	42	42
229	8	0,0454545	0	42	54
230	8	0,0454545	0,523598	42	54
231	8	0,0454545	1,0472	42	54
232	8	0,0454545	1,5708	42	54
233	8	0,0454545	2,09439	42	54
234	8	0,0454545	2,61799	42	54
235	8	0,0909091	0	42	54
236	8	0,0909091	0,523598	42	54
237	8	0,0909091	1,0472	42	54
238	8	0,0909091	1,5708	42	54
239	8	0,0909091	2,09439	42	54
240	8	0,0909091	2,61799	42	54
241	8	0,0454545	0	54	6
242	8	0,0454545	0,523598	54	6
243	8	0,0454545	1,0472	54	6 .
244	8	0,0454545	1,5708	54	6
245	8	0,0454545	2,09439	54	6
246	8	0,0454545	2,61799	54	6
247	8	0,0909091	0	54	6
248	8	0,0909091	0,523598	54	6
249	8	0,0909091	1,0472	54	6
250	8	0,0909091	1,5708	54	6
251	8	0,0909091	2,09439	54	6
252	8	0,0909091	2,61799	54	6
253	8	0,0454545	0	54	18
254	8	0,0454545	0,523598	54	18
255	8	0,0454545	1,0472	54	18
256	8	0,0454545	1,5708	54	18
257	8	0,0454545	2,09439	54	18
258	8	0,0454545	2,61799	54	18
259	8	0,0909091	0	54	18
260	8	0,0909091	0,523598	54	18
261	8	0,0909091	1,0472	54	18
262	8	0,0909091	1,5708	54	18

BE2015/5241

263	8	0,0909091	2,09439	54	18
264	8	0,0909091	2,61799	54	18
265	8	0,0454545	0	54	30
266	8	0,0454545	0,523598	54	30
267	8	0,0454545	1,0472	54	30
268	8	0,0454545	1,5708	54	30
269	8	0,0454545	2,09439	54	30
270	8	0,0454545	2,61799	54	30
271	8	0,0909091	0	54	30
272	8	0,0909091	0,523598	54	30
273	8	0,0909091	1,0472	54	30
274	8	0,0909091	1,5708	54	30
275	8	0,0909091	2,09439	54	30
276	8	0,0909091	2,61799	54	30
277	8	0,0454545	0	54	42
278	8	0,0454545	0,523598	54	42
279	8	0,0454545	1,0472	54	42
280	8	0,0454545	1,5708	54	42
281	8	0,0454545	2,09439	54	42
282	8	0,0454545	2,61799	54	42
283	8	0,0909091	0	54	42
284	8	0,0909091	0,523598	54	42
285	8	0,0909091	1,0472	54	42
286	8	0,0909091	1,5708	54	42
287	8	0,0909091	2,09439	54	42
288	8	0,0909091	2,61799	54	42
289	8	0,0454545	0	54	54
290	8	0,0454545	0,523598	54	54
291	8	0,0454545	1,0472	54	54
292	8	0,0454545	1,5708	54	54
293	8	0,0454545	2,09439	54	54
294	8	0,0454545	2,61799	54	54
295	8	0,0909091	0	54	54
296	8	0,0909091	0,523598	54	54
297	8	0,0909091	1,0472	54	54
298	8	0,0909091	1,5708	54	54
299	8	0,0909091	2,09439	54	54
300	8	0,0909091	2,61799	54	54

BE2015/5241

Claims

REVENDICATIONS:

1. Procédé pour identifier une forme dans une image d'entrée, comprenant les étapes consistant à

a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,

b) générer un vecteur d'image à partir de la matrice normalisée,

c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,

e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, et

f) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde

BE2015/5241 dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
2. Procédé selon la revendication 1, dans lequel tous les éléments non diagonaux sont zéro.
3. Procédé selon la revendication 1, dans lequel le paramètre relatif à la direction de l'onde sinusoïdale est un angle.
4. Procédé selon la revendication 1, avec au moins deux paramètres relatifs à un centre de la fonction de Gabor, dans lequel les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de Gabor sont régulièrement espacés.

BE2015/5241
5. Procédé selon la revendication 1, dans lequel le vecteur de caractéristiques est approximé.
6. Produit de programme informatique comprenant un support non transitoire lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée, la logique de commande comprenant:

a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,

b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,

c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse (303) étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,

d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,

BE2015/5241

e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, et

f) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, et dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.