BE1025502A1 - Système et procédé de reconnaissance de formes utilisant des fonctions de gabor - Google Patents
Système et procédé de reconnaissance de formes utilisant des fonctions de gabor Download PDFInfo
- Publication number
- BE1025502A1 BE1025502A1 BE20155241A BE201505241A BE1025502A1 BE 1025502 A1 BE1025502 A1 BE 1025502A1 BE 20155241 A BE20155241 A BE 20155241A BE 201505241 A BE201505241 A BE 201505241A BE 1025502 A1 BE1025502 A1 BE 1025502A1
- Authority
- BE
- Belgium
- Prior art keywords
- vector
- matrix
- function
- image
- gabor function
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18038—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2136—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/446—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19127—Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
Un système et un procédé de reconnaissance de formes qui génèrent un vecteur de caractéristiques en multipliant un vecteur d'image avec une matrice creuse. La matrice creuse est générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne. La fonction de Gabor est une fonction d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale. La longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.
Description
SYSTÈME ET PROCÉDÉ DE RECONNAISSANCE DE FORMES
UTILISANT DES FONCTIONS DE GABOR
DOMAINE DE L'INVENTION
La présente invention concerne un système de reconnaissance de formes. Plus spécifiquement, la présente invention concerne un système de reconnaissance de formes utilisant une fonction de Gabor.
CONTEXTE DE L'INVENTION
Un système de reconnaissance de formes peut être un système de reconnaissance optique de caractères (ROC). Les systèmes ROC sont connus. Ils convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système ROC, les images de ce qui pourrait être des caractères sont isolées et un processus de reconnaissance de caractères est utilisé pour identifier le caractère.
Les processus connus de reconnaissance optique de caractères comprennent en général:
• une étape de normalisation qui génère une matrice normalisée à partir d'une image d'entrée;
• une étape d'extraction de caractéristiques; et • une étape de classification pour identifier le caractère.
L'étape d'extraction de caractéristiques génère un vecteur de caractéristiques qui caractérise l'image d'entrée et l'étape de classification identifie le caractère en partant de ce vecteur de caractéristiques. Dans certains processus de ROC, l'étape d'extraction de caractéristiques comprend un filtrage avec un filtre de Gabor. Le choix du filtre de Gabor est déterminant pour le processus de ROC parce que le filtre de Gabor
BE2015/5241 détermine le vecteur de caractéristiques pour identifier le caractère. Le vecteur de caractéristiques doit contenir l'information nécessaire pour identifier le caractère avec grande exactitude. Un vecteur de caractéristiques trop grand rend les calculs lents et un vecteur de caractéristiques trop petit diminue l'exactitude de l'identification du caractère. Les procédés de ROC connus utilisant des filtres de Gabor sont trop lents ou ont une exactitude trop faible. Cela est particulièrement important pour l'identification des caractères asiatiques à cause du nombre extrêmement élevé de caractères asiatiques. Un autre inconvénient des filtres de Gabor connus réside dans le fait qu'ils ne fonctionnent pas de manière adéquate avec l'étape de classification subséquente.
US 7174044 B2 divulgue un procédé connu de reconnaissance de caractères basé sur des filtres de Gabor qui extraient l'information des directions spécifiques des caractères. Ce procédé utilise une moyenne sur des régions de filtres de Gabor et comprend de nombreux calculs et un grand vecteur de caractéristiques. Cela rend les processus de ROC utilisant ce procédé trop lent.
Le document “High performance Chinese OCR based on Gabor features, discriminative feature extraction and model training” de Qiang Huo, Yong Ge et Zhi-Dan Feng in the Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, 2001, Volume 3, décrit un processus de ROC connu pour des caractères chinois. Ce procédé est rapide mais l'exactitude de la reconnaissance n'est pas extrêmement élevée. .
La dissertation intitulée “Chinese OCR System Based on Gabor Features and SVM” de Dai Wei à l'université Shanghai Jiaotong décrit un autre processus de ROC. SVM signifie Support Vector Machine (machine à vecteurs de support ou séparateurs à vaste marge) un modèle d'apprentissage supervisé qui utilise des algorithmes d'apprentissage
BE2015/5241 associés pour l'analyse de données et des algorithmes de reconnaissance. Un tel système SVM requiert un très grand ensemble d'apprentissage qui le rend impraticable ou inexact.
RÉSUMÉ DE L'INVENTION
Un but de cette invention est de fournir un procédé de reconnaissance de formes qui permet une identification rapide et exacte de la forme.
Un autre but de cette invention est de fournir un produit de programme informatique pour mettre en œuvre ledit système de reconnaissance de formes.
Ces buts sont atteints selon les modes de réalisation de l'invention.
Dans un mode de réalisation, le procédé d'identification d'une forme dans une image d'entrée comprend les étapes consistant à:
a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) générer un vecteur d'image à partir de la matrice normalisée,
c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
BE2015/5241
e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, et
f) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.
On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, parce que le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix de deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un compromis avantageux pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant. Cette redondance du vecteur de caractéristiques a pour résultat qu'un caractère peut quand même être reconnu même si la valeur d'un élément donné du vecteur de caractéristiques est corrompue.
Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes, la densité de probabilité étant calculée par la formule:
BE2015/5241 [ΪΟμΓΪΣΟμα ρ Q □ □ - exp m-------------□ □ Ε2π^|Σ| 2 où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques.
Dans un autre mode de réalisation, la matrice de covariance est approximée. Dans un mode de réalisation, les traces des matrices de covariance de tous les modèles sont égales.
Dans un mode de réalisation, tous les éléments non diagonaux de la matrice de covariance sont réglés sur zéro. On a constaté que la 10 caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.
Dans un mode de réalisation selon la présente invention, le 15 paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.
Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle. Dans un autre mode de 20 réalisation, la somme de la plus haute valeur de l'angle et de la plus basse valeur de l'angle est égale à n radians. Dans un mode de réalisation, l'angle prend six valeurs.
Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage 25 angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
BE2015/5241
Dans un autre mode de réalisation selon l'invention, la fonction de Gabor est une fonction d'au moins deux paramètres relatifs à un centre de la fonction de Gabor. Dans un mode de réalisation, les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de 5 Gabor sont régulièrement espacés.
Dans un mode de réalisation de l'invention, un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice 10 normalisée. Dans un mode de réalisation, la distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
Ce choix des centres de la fonction de Gabor donne un bon 15 échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour avoir des calculs rapides du procédé.
Dans un autre mode de réalisation selon l'invention, la fonction de Gabor comprend un paramètre relatif à la largeur de la fonction gaussienne, 20 qui peut être l'écart type de la fonction gaussienne. Dans un mode de réalisation, l'écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage 25 de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans un mode de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un
BE2015/5241
Ί logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.
Dans un autre mode de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.
Dans un mode de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.
Dans des modes de réalisation selon l'invention, les éléments du vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.
BE2015/5241
Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, la longueur d'onde plus courte est plus courte que la distance entre deux centres adjacents et la longueur d'onde plus longue est plus longue que la distance entre deux centres adjacents.
Dans un mode de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.
Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et
2,61799 radians, les centres de la fonction de Gabor sont situés aux positions (6,6), (6,18), (6,30), (6,42), (6,54), (18,6), (18,18), (18,30), (18,42), (18,54), (30,6), (30,18), (30,30), (30,42), (30,54), (42,6), (42,18), (42,30), (42,42), (42,54), (54,6), (54,18), (54,30), (54,42), (54,54), la première valeur de longueur d'onde est égale à 11, la deuxième valeur de longueur d'onde est égale à 22 et l'écart type de la fonction gaussienne est égal à 8. On a constaté que ce mode de réalisation donne une très bonne exactitude et les calculs correspondants sont rapides.
Dans un autre mode de réalisation la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans
BE2015/5241 lequel est stockée une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:
a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,
c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, et
BE2015/5241
f) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.
Dans un mode de réalisation de la présente invention, le procédé pour identifier une forme dans une image d'entrée comprend les étapes consistant à
a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
c) générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles 108 une densité de probabilité de chaque modèle,
d) identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée,
BE2015/5241 dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec
a. le premier ensemble d'au moins une valeur inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et
b. le premier ensemble d'au moins une valeur supérieure ou sensiblement égale à la moitié des valeurs dans le deuxième ensemble d'au moins une valeur.
On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, premièrement, le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un bon compromis pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant.
Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes. La densité de probabilité peut être calculée par la formule □’□pffZCÏDpD pQ-DD ..... Axp ΠΠ---— ----—□ □ C2ttS|Z| 2 où le symbole r représente le vecteur de caractéristiques, le symbole Z représente la matrice de covariance, le symbole μ représente le vecteur de
BE2015/5241 moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques. Dans des modes de réalisation, tous les éléments non diagonaux de la matrice de covariance peuvent être réglés sur zéro, la matrice de covariance peut être approximée, les traces des matrices de covariance de tous les modèles peuvent être égales. On a constaté que la caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.
Dans des modes de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.
Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle et la somme de sa plus haute valeur et de sa plus basse valeur est égale à n radians. Cet angle peut prendre six valeurs. Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, au moins deux paramètres se rapportent à un centre de la fonction de Gabor et peuvent être tels que les centres de la fonction de Gabor sont régulièrement espacés. Un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice normalisée. La distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres
BE2015/5241 adjacents de la fonction de Gabor. Ce choix des centres de la fonction de Gabor donne un bon échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, un paramètre se rapporte à la largeur de la fonction gaussienne, qui peut être l'écart type de la fonction gaussienne. Cet écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et peut être supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage de l'image normalisée, rend le vecteur de caractéristiques légèrement redondant et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.
Dans des modes de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.
Dans des modes de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image
BE2015/5241 normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.
Dans des modes de réalisation selon l'invention, les éléments d'un vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement établis égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation de la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.
Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres adjacents.
Dans des modes de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.
BE2015/5241
Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse utilisée dans l'étape de création du vecteur de caractéristiques est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et
2,61799 radians, les centres de la fonction de Gabor sont situés aux positions (6,6), (6,18), (6,30), (6,42), (6,54), (18,6), (18,18), (18,30), (18,42), (18,54), (30,6), (30,18), (30,30), (30,42), (30,54), (42,6), (42,18), (42,30), (42,42), (42,54), (54,6), (54,18), (54,30), (54,42), (54,54), la première valeur de longueur d'onde est égale à 11, la deuxième valeur de longueur d'onde est égale à 22 et l'écart type de la fonction gaussienne est égal à 8. On a constaté que ce mode de réalisation donne une très bonne exactitude et les calculs correspondants sont rapides.
Dans un autre mode de réalisation de la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:
a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) des deuxièmes moyens de code de programme lisible par ordinateur pour créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres
BE2015/5241 comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
c) des troisièmes moyens de code de programme lisible par ordinateur pour générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles une densité de probabilité de chaque modèle pour identifier un meilleur modèle comme la forme dans une image d'entrée,
d) des quatrièmes moyens de code de programme lisible par ordinateur pour identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec
a. le premier ensemble d'au moins une valeur inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et
b. le premier ensemble d'au moins une valeur supérieure ou sensiblement égale à la moitié des valeurs dans le deuxième ensemble d'au moins une valeur.
BRÈVE DESCRIPTION DES DESSINS
Pour une meilleure compréhension de la présente invention, il sera maintenant fait référence, à titre d'exemple, aux dessins joints dans lesquels:
BE2015/5241
La figure 1 montre un organigramme d'un processus de reconnaissance de caractères selon l'invention.
La figure 2 montre une illustration schématique d'une étape de normalisation dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 3 montre un organigramme d'une étape d'extraction dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 4 montre un organigramme qui décrit comment les éléments de la matrice creuse sont générés dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 5 a montre une illustration d'une multiplication de matrice entre une matrice creuse et un vecteur d'image utilisée dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 5 b montre une illustration d'une matrice de seuil utilisée dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 6 montre un organigramme d'une étape de classification dans un processus de reconnaissance optique de caractères selon l'invention.
DESCRIPTION DE L'INVENTION
La présente invention sera décrite en rapport avec des modes de réalisation particuliers et en référence à certains dessins mais l'invention n'y est toutefois pas limitée. Les dessins décrits ne sont que schématiques et sont non limitatifs. Dans les dessins, la taille de certains des éléments peut être exagérée et non dessinée à l'échelle à des fins illustratives.
En outre, les termes premier, deuxième, troisième et similaire dans la description et dans les revendications sont utilisés pour faire la
BE2015/5241 distinction entre éléments similaires et pas nécessairement pour décrire un ordre séquentiel ou chronologique. Les termes sont interchangeables dans les circonstances appropriées et les modes de réalisation de l'invention peuvent fonctionner dans d'autres séquences que celles décrites ou illustrées dans le présent document.
De plus, les divers modes de réalisation, bien que qualifiés de préférés, doivent être interprétés comme des façons exemplaires dont l'invention peut être mise en œuvre plutôt que comme limitant la portée de l'invention.
Le terme comprenant, utilisé dans les revendications, ne doit pas être interprété comme étant limité aux moyens ou étapes énumérés cidessous; il n'exclut pas d'autres éléments ou étapes. Il doit être interprété comme spécifiant la présence des éléments, nombres entiers, étapes ou composants cités auxquels il est fait référence mais n'exclut pas la présence ou l'ajout d'un ou plusieurs autres éléments, nombres entiers, étapes ou composants ou groupes de ceux-ci. Donc, la portée de l'expression un dispositif comprenant A et B ne devrait pas être limitée à des dispositifs comprenant uniquement les composants A et B, au contraire, en ce qui concerne la présente invention, les seuls composants énumérés du dispositif sont A et B, et la revendication devrait également être interprétée comme incluant des équivalents de ces composants.
Les nombres binaires, vecteurs et matrices sont censés être écrits ici avec 0 et 1 mais il est clair pour une personne de métier qu'ils pourraient être écrits comme vrai et faux, noir et blanc ou tout autre moyen pour indiquer un état binaire.
Dans un mode de réalisation de la présente invention, des images binaires sont traitées. Les images binaires sont des images numériques avec uniquement deux couleurs possibles pour chaque pixel. Ces deux couleurs, en général noir et blanc, peuvent être représentées comme des
BE2015/5241 valeurs vraies et fausses ou des valeurs 1 et 0. Une représentation avec 1 et 0 est spécialement utile pour effectuer un traitement mathématique d'image. Le traitement d'images binaires comprend souvent des étapes de filtrage afin, par exemple, d'améliorer certaines caractéristiques de l'image, ou pour effectuer des opérations morphologiques sur l'image. Les filtres sont en général décrits mathématiquement par des matrices et l'application d'un filtre sur une image binaire est décrite par la multiplication de la matrice de filtre et de la matrice d'image binaire. Ce type d'opération peut être utilisé, par exemple dans la reconnaissance optique de caractères, comme une étape dans le traitement de l'image pour extraire les caractéristiques de l'image en vue de reconnaître un caractère optique.
Les systèmes de reconnaissance optique de caractères convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système de ROC, les images de ce qui pourrait être des caractères sont isolées et un procédé de reconnaissance de caractères est utilisé pour identifier le caractère.
Un mode de réalisation de la présente invention concerne la reconnaissance optique de caractères en partant d'une image d'entrée représentant un caractère ou une autre forme. Dans un mode de réalisation préféré de la présente invention, la reconnaissance optique de caractères part d'une image d'entrée représentant un caractère asiatique. L'image d'entrée est, dans un mode de réalisation de l'invention, une image bicolore. Dans un mode de réalisation préféré de la présente invention, l'image d'entrée est une image en noir et blanc. Dans un mode de réalisation de la présente invention, l'image d'entrée est une image bidimensionnelle. Dans un mode de réalisation de la présente invention, l'image d'entrée représente une forme comprenant un caractère, un logo, une image ou un dessin, à reconnaître par le système de reconnaissance. Dans un autre mode de réalisation de la présente invention, la forme est une séquence sonore, une
BE2015/5241 séquence de film ou une forme tridimensionnelle, à reconnaître par le système de reconnaissance.
Un processus de reconnaissance optique de caractères 101 selon un mode de réalisation de l'invention représenté sur la figure 1 comprend:
• une étape de normalisation 103 qui génère une matrice normalisée 104 à partir d'une image d'entrée 102;
• une étape d'extraction 105 qui génère un vecteur de caractéristiques 106 à partir de la matrice normalisée 104; et • une étape de classification 107 qui calcule un meilleur modèle 109 pour l'image d'entrée 102 parmi une série de modèles 108 possibles. L'étape de classification 107 rend également une densité de probabilité 110 de chaque modèle, laquelle fournit une mesure de l'exactitude de l'étape de classification 107.
Dans l'étape de normalisation 103, l'image d'entrée 102 est subdivisée en pixels 201. Chaque pixel 201 de l'image d'entrée 102 est représenté par un élément 202 d'une matrice intermédiaire 203, comme illustré sur la figure 2. La matrice intermédiaire 203 est, dans un mode de réalisation de l'invention, une matrice binaire. La matrice intermédiaire 203 est soumise à une combinaison d'étapes qui peuvent comprendre une mise à l'échelle, un seuillage, un lissage, une interpolation, un filtrage,... Le produit de cette combinaison d'étapes est une matrice normalisée 104 qui correspond à une image normalisée 206. Dans un mode de réalisation de la présente invention, l'image normalisée 206 a un format prédéterminé et est centrée.
Chaque élément 207 de la matrice normalisée 104 correspond à un pixel 208 du format prédéterminé dans l'image normalisée 206.
BE2015/5241 .
Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice binaire qui correspond à une image normalisée 206 bicolore. Chaque élément de la matrice normalisée 104 est caractérisé par sa ligne x 204 et sa colonne y 205, ce qui correspond à un emplacement sur l'image normalisée 206. Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice de 64x64. Dans un mode de réalisation de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant. Dans un mode de réalisation préféré de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est égal à 16 pixels. Dans un mode de réalisation de la présente invention, le rapport d'aspect hauteur / largeur de la forme ou du caractère est conservé pendant l'étape de normalisation 103.
L'étape d'extraction de caractéristiques 105 qui génère le vecteur de caractéristiques 106 à partir de la matrice normalisée 104 comprend une multiplication matrice - vecteur 304. Cela peut être expliqué en détails à l'aide de la figure 3. La matrice normalisée 104 de dimensions AxB est transformée en un vecteur d'image 301 de longueur A*B. Pendant cette transformation, chaque élément du vecteur d'image 301 est établi égal à un élément de la matrice normalisée 104 de sorte que tous les éléments de la matrice normalisée 104 sont copiés une fois seulement dans le vecteur d'image 301. Dans un mode de réalisation de la présente invention, le vecteur d'image 301 est un vecteur binaire. Le vecteur d'image 301 contient l'information de l'image normalisée 206. L'emplacement d'un élément de la ligne x 204 et de la colonne y 205 dans la matrice normalisée 104, c'est-àdire qui correspond à un emplacement dans l'image normalisée 206, correspond aussi à une valeur spécifique de l'indice j 302 qui indique le jème élément du vecteur d'image 301. Dans un mode de réalisation de la
BE2015/5241 présente invention, le vecteur d'image 301 a 4096 éléments et l'indice j peut prendre toutes les valeurs de nombre entier entre 1 et 4096. Cela correspond à une matrice normalisée 104 de 64x64 (64*64=4096).
Dans un mode de réalisation de la présente invention, la multiplication matrice - vecteur 304 est approximative et le vecteur de caractéristiques 106 est une approximation du résultat mathématique exact de la multiplication de matrice entre une matrice creuse 303 et le vecteur d'image 301. Un indice i 401 est utilisé pour spécifier le ième élément du vecteur de caractéristiques 106. L'adjectif creuse indique que la matrice est peuplée principalement de zéros dans un mode de réalisation de la présente invention.
La figure 4 décrit la génération, avec une fonction de Gabor 404, d'un élément 406 situé à la ligne i 401 et la colonne j 302 de la matrice creuse 303. Tous les éléments 406 de la matrice creuse 303 sont générés de la même façon. La fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne. La fonction de Gabor 404 a des paramètres 402, qui correspondent à l'indice i, et des variables x 204 et y 205, qui correspondent à l'indice j, comme entrées.
L'indice de ligne i 401 de l'élément 406 de matrice creuse à calculer spécifie les valeurs prises par les paramètres 402 utilisés dans la fonction de Gabor 404. Dans un mode de réalisation de la présente invention, les paramètres 402 sont représentés par les symboles a,, Oj, λ,, Cx et Cy:
• a, est un angle relatif à la direction de l'onde sinusoïdale plane de la fonction de Gabor 404;
• o, est l'écart type de la fonction gaussienne de la fonction de Gabor 404;
• λ, est la longueur d'onde de l'onde sinusoïdale plane de la fonction de Gabor 404;
BE2015/5241 • Οχ, est le centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction verticale; et • Gy, est Je centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction horizontale.
Dans un mode de réalisation de l'invention, les paramètres sont choisis comme suit:
• Les valeurs Cxj sont régulièrement espacées.
• Si la distance entre deux valeurs Cx, est appelée dCx, le premier Cx,, Cxi est égal à dCx/2.
• Les valeurs Cy, sont régulièrement espacées.
• Si la distance entre deux valeurs Cy, est appelée dCy, le premier Cyb Cyi est égal à dCy/2.
• Les angles «i sontrégulièrement-espacés.
• La somme de la plus haute valeur de a, et de la plus basse valeur de a, est égale à n radians.
• Les valeurs de o, sont inférieures à dCx.
• Les valeurs de σ, sont supérieures à dCx/2.
• Les valeurs de o, sont inférieures à dCy.
• Les valeurs de oi sont supérieures à dCy/2.
• Dans un premier ensemble de valeurs d'au moins une valeur, les valeurs de λ, sont inférieures à dCx et à dCy.
• Les valeurs de λ, dans un deuxième ensemble d'au moins une valeur sont telles que les valeurs dans le premier ensemble de valeurs sont supérieures ou sensiblement égales à la moitié des valeurs dans le deuxième ensemble de valeurs.
Dans des modes de réalisation supplémentaires de l'invention, les paramètres remplissent une ou plusieurs des conditions suivantes:
• dCx et dCy sont égales entre elles.
BE2015/5241 • ex, prend cinq valeurs.
• Cy, prend cinq valeurs.
• ar prend six valeurs.
• ûj prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et 2,61799 radians.
• a, prend une valeur.
• λ, prend deux valeurs: Ai et A2· • λ! est inférieure à dCx.
• A-ι est inférieure à dCy.
• λ2 est supérieure à A1 et inférieure ou égale à 2*Ai.
Dans un mode de réalisation préféré d'une matrice normalisée 104 de 64x64, les positions Cx, sont 6, 18, 30, 42 et 54, les positions Cy, sont 6, 18, 30i ‘42>et 54, l'écart type σ, est 8; les longueurs d'onde A, sont 11 et 22. Les valeurs des paramètres dans un mode de réalisation de la présente invention sont repris dans le Tableau 1.
Le nombre d'ensembles de valeurs pour les paramètres 402 est égal à (nombre de valeur de Cx*nombre de valeurs de Cy*nombre de valeurs de a*nombre de valeurs de o*nombre de valeurs de A,). Dans un mode de réalisation préféré, le nombre d'ensembles de paramètres est égal à 300=5*5*6*1*2 et l'indice de ligne i 401 prend des valeurs de nombre entier de 1 à 300.
, L'indice de colonne j 302 de l'élément 406 de matrice creuse à calculer spécifie les valeurs des variables x 204 et y 205 utilisées par la fonction de Gabor 404.
La fonction de Gabor 404 est exprimée par:
BE2015/5241
2 π g[i,7x,y ] □ - α βχρ{λ/αϊ— [cosaL:x CXL+ sinaTy. Cy ; ] z π on u Λα □< □ Qa? + y □ cVrPP □--- j 7——}
2σαα le produit de la fonction de Gabor 404 calculée • à partir d'un ensemble donné de valeurs des paramètres 402 qui correspond à l'indice i 401, · à un endroit donné de la ligne x 204 et de la colonne y 205 de l'image normalisée 206 qui correspond à l'indice j 302 est l'élément 406 de la ligne i 401 et de la colonne j 302 dans la matrice creuse 303. Le nombre de colonnes de la matrice creuse 303 est égal au nombre d'éléments du vecteur d'image 301. Dans un mode de réalisation de la présente invention, la matrice creuse 303 est une matrice de 300x4096.
Dans un mode de réalisation de la présente invention, l'élément (i,j) 406 de la matrice creuse est donné par
-ν'--? 2 π MÜ D ô---Fi exP(---;---[cosatjnj □ Wo64 □ CXi π on u Λα + sinttijllj □ 1U/64 □ Cy^f] π Œj □ 1 _%64 □ + Œj □ 1Û/64 □ Cÿjî
O }
Le symbole % représente l'opération modulo et a le pas sur les opérations * et /, et le symbole H donne la partie entière du résultat d'une division entre nombres entiers et prend le pas sur les opérations * et /. Les paramètres ont les valeurs suivantes π
ααα □ □ 1c%nba * —— nbn
2(^)%mn φΠΠ----------maxWavelength
BE2015/5241 i □ 1
CÿnO stepSze//2 + stepSze * (—----—) % nbSteps
HDq * HDq
Qk □ stepSze/ / 2 + stepSze * □----—----%nbFeatures nba □ 6 nbD □ 2 maxWavelength □ 22 stepSize -12 nbSteps □ 5 nbFeatures = 300 σ □ 8.
nbSteps est tel que Cx, et Cy, sont inférieures ou égales à 64.
Une multiplication matrice - vecteur 304 est effectuée pour multiplier la matrice creuse 303 et le vecteur d'image 301, la matrice creuse 303 étant le premier facteur de la multiplication et le vecteur d'image 301 étant le deuxième facteur de la multiplication comme illustré sur la figure 5. Le vecteur résultant de la multiplication dé la matrice creuse 303 et du vecteur d'image 301 est le vecteur de caractéristiques 106. Le nombre d'éléments du vecteur de caractéristiques 106 est égal au nombre de lignes de la matrice creuse 303. Dans un mode de réalisation préféré de la présente invention, le nombre d'éléments du vecteur de caractéristiques 106 est égal à 300.
Dans un mode de réalisation de la présente invention, le vecteur de caractéristiques 106 contient des informations spécifiques à propos de l'image d'entrée 102, ces informations spécifiques concernant les caractéristiques d'image importantes en vue de la reconnaissance de formes. Le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres
BE2015/5241 adjacents rend l'information contenue dans le vecteur de caractéristiques 106 légèrement redondante. La redondance de l'information dans le vecteur de caractéristiques 106 augmente l'exactitude de l'étape de classification 107.
La multiplication de matrice entre la matrice creuse 303 et le vecteur d'image 301 ayant pour résultat le vecteur de caractéristiques 106 est montrée sur la figure 5a. Les éléments de la matrice creuse 303 sont appelés Mij. i est l'indice qui donne le numéro de ligne et prend toutes les valeurs de nombre entier entre 1 et m. j est l'indice qui donne le numéro de colonne et prend toutes les valeurs de nombre entier entre 1 et n. Le vecteur d'image 301 a une colonne de n éléments appelés vj. Le vecteur de caractéristiques 106 a une colonne de m éléments appelés ri. La multiplication de matrice est telle que les éléments ri du vecteur de caractéristiques 106 sont calculés comme ri □ Zr= Mijvj (Équation 1)
Certains termes peuvent être négligés dans la somme de l'Équation 1. Par exemple, les termes Mij vj où vj est égal à zéro sont également égaux à 0. En outre, dans le cas où vj est égal à 1, et où l'élément Mij de la matrice creuse 303 est petit, le terme Mij vj peut également être négligé. Pour contrôler petit, une matrice de seuil 501 avec des éléments Tij, montrée sur la figure 5b, est utilisée dans un mode de réalisation de la présente invention. Dans un mode de réalisation de la présente invention, un terme Mij vj peut être négligé si Mij est inférieur à Tij. Dans un mode de réalisation supplémentaire de la présente invention, tous les éléments Tij de la matrice de seuil 501 ont la même valeur. Étant donné que la fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne, de nombreux éléments de la matrice creuse 303 sont très petits.
BE2015/5241
L'étape de classification 107 du processus de ROC 101 peut être décrite à l'aide de la figure 6. Dans un mode de réalisation de la présente invention, l'étape de classification 107 est une variation de la méthode de classifieur des plus proches voisins qui utilise la distance euclidienne pondérée où les poids sont différents pour chaque classe. L'étape de classification 107 utilise le vecteur de caractéristiques 106 et les modèles 108 comme entrées. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères, des groupes de caractères ou des caractères dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères asiatiques, des groupes de caractères asiatiques ou des caractères asiatiques dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des séquences sonores, des séquences de film ou des formes tridimensionnelles.
Dans un mode de réalisation de la présente invention, un modèle 108 est défini par une matrice de covariance Σ et un vecteur de moyennes μ. Dans un mode de réalisation de la présente invention, tous les éléments non diagonaux de Σ sont réglés sur zéro. Dans un mode de réalisation de la présente invention, les matrices de covariance Σ sont multipliées par une constante (constante différente pour chaque modèle) de sorte que les traces des matrices de covariance Σ de tous les modèles sont égales. Dans un mode de réalisation de la présente invention, la matrice de covariance est approximée. Dans un mode de réalisation de la présente invention, Σ est une matrice de 300x300 et μ un vecteur de 300 éléments.
Pour sélectionner le modèle qui correspond le mieux à l'image d'entrée 102 correspondant au vecteur de caractéristiques 106, une densité de probabilité 110 est calculée, pour chaque modèle 108, comme
BE2015/5241 ptjDD exp OD □Do où le symbole r représente le vecteur de caractéristiques 106.
Le symbole | Σ| représente le déterminant de la matrice Σ et le t dans [J □ pff indique la transposition du vecteur U □ pD k est égal au nombre d'éléments du vecteur de caractéristiques 106. Dans un mode de réalisation de la présente invention, k est égal à 300. Le produit [J □ pdFΣΠ □ μΠ est une multiplication de matrice suivant les conventions mathématiques usuelles.
Une fois que la densité de probabilité 601 de chaque modèle 108 est calculée dans une étape de calcul 601, le meilleur modèle 109 est sélectionné dans une étape de sélection 602. Le meilleur modèle 109 est le modèle avec la plus haute densité de probabilité 110. Dans un mode de réalisation de la présente invention, l'étape de classification 107 rend le meilleur modèle 109 et la densité de probabilité 110 de chaque modèle, pour fournir une mesure de l'exactitude de l'étape de classification. Dans une variante de réalisation, l'étape de classification 107 rend seulement le meilleur modèle 109. Dans une variante de réalisation, l'étape de classification 107 rend seulement la densité de probabilité de chaque modèle 110.
Un mode de réalisation de la présente invention comprend la combinaison de
- l'étape d'extraction de caractéristiques 105 avec les paramètres 402 comme décrit ci-dessus, et
- l'étape de classification 107 basée sur des distances euclidiennes pondérées avec tous les éléments non diagonaux de la matrice de covariance Σ réglés sur zéro et les traces des matrices de covariance Σ de tous les modèles égales.
BE2015/5241
Un tel système de ROC permet la reconstruction d'image, peut être calculé efficacement et rend l'exactitude de la ROC extrêmement élevée.
BE2015/5241
Tableau 1
indice | Έ5 | % | CX | Cÿi | |
1 | 8 | 0,0454545 | 0 | 6 | 6 |
2 | 8 | 0,0454545 | 0,523598 | 6 | 6 |
3 | 8 | 0,0454545 | 1,0472 | 6 | 6 |
4 | 8 | 0,0454545 | 1,5708 | 6 | 6 |
5 | 8 | 0,0454545 | 2,09439 | 6 | 6 |
6 | 8 | 0,0454545 | 2,61799 | 6 | 6 |
7 | 8 | 0,0909091 | 0 | 6 | 6 |
8 | 8 | 0,0909091 | 0,523598 | 6 | 6 |
9 | 8 | 0,0909091 | 1,0472 | 6 | 6 |
10 | 8 | 0,0909091 | 1,5708 | 6 | 6 |
11 | 8 | 0,0909091 | 2,09439 | 6 | 6 |
12 | 8 | 0,0909091 | 2,61799 | 6 | 6 |
13 | 8 | 0,0454545 | 0 | 6 | 18 |
14 | 8 | 0,0454545 | 0,523598 | 6 | 18 |
15 | 8 | 0,0454545 | 1,0472 | 6 | 18 |
16 | 8 | 0,0454545 | 1,5708 | 6 | 18 |
17 | 8 | 0,0454545 | 2,09439 | 6 | 18 |
18 | 8 | 0,0454545 | 2,61799 | 6 | 18 |
19 | 8 | 0,0909091 | 0 | 6 | 18 |
20 | 8 | 0,0909091 | 0,523598 | 6 | 18 |
21 | 8 | 0,0909091 | 1,0472 | 6 | 18 |
22 | 8 | 0,0909091 | 1,5708 | 6 | 18 |
23 | 8 | 0,0909091 | 2,09439 | 6 | 18 |
24 | 8 | 0,0909091 | 2,61799 | 6 | 18 |
25 | 8 | 0,0454545 | 0 | 6 | 30 |
26 | 8 | 0,0454545 | 0,523598 | 6 | 30 |
27 | 8 | 0,0454545 | 1,0472 | 6 | 30 |
28 | 8 | 0,0454545 | 1,5708 | 6 | 30 |
29 | 8 | 0,0454545 | 2,09439 | 6 | 30 |
30 | 8 | 0,0454545 | 2,61799 | 6 | 30 |
31 | 8 | 0,0909091 | 0 | 6 | 30 |
32 | 8 | 0,0909091 | 0,523598 | 6 | 30 |
33 | 8 | 0,0909091 | 1,0472 | 6 | 30 |
34 | 8 | 0,0909091 | 1,5708 | 6 | 30 |
BE2015/5241
35 | 8 | 0,0909091 | 2,09439 | 6 | 30 |
36 | 8 | 0,0909091 | 2,61799 | 6 | 30 |
37 | 8 | 0,0454545 | 0 | 6 | 42 |
38 | 8 | 0,0454545 | 0,523598 | 6 | 42 |
39 | 8 | 0,0454545 | 1,0472 | 6 | 42 |
40 | 8 | 0,0454545 | 1,5708 | 6 | 42 |
41 | 8 | 0,0454545 | 2,09439 | 6 | 42 |
42 | 8 | 0,0454545 | 2,61799 | 6 | 42 |
43 | 8 | 0,0909091 | 0 | 6 | 42 |
44 | 8 | 0,0909091 | 0,523598 | 6 | 42 |
45 | 8 | 0,0909091 | 1,0472 | 6 | 42 |
46 | 8 | 0,0909091 | 1,5708 | 6 | 42 |
47 | 8 | 0,0909091 | 2,09439 | 6 | 42 |
48 | 8 | 0,0909091 | 2,61799 | 6 | 42 |
49 | 8 | 0,0454545 | 0 | 6 | 54 |
50 | 8 | 0,0454545 | 0,523598 | 6 | 54 |
51 | 8 | 0,0454545 | 1,0472 | 6 | 54 |
52 | 8 | 0,0454545 | 1,5708 | 6 | 54 |
53 | 8 | 0,0454545 | 2,09439 | 6 | 54 |
54 | 8 | 0,0454545 | 2,61799 | 6 | 54 |
55 | 8 | 0,0909091 | 0 | 6 | 54 |
56 | 8 | 0,0909091 | 0,523598 | 6 | 54 |
57 | 8 | 0,0909091 | 1,0472 | 6 | 54 |
58 | 8 | 0,0909091 | 1,5708 | 6 | 54 |
59 | 8 | 0,0909091 | 2,09439 | 6 | 54 |
60 | 8 | 0,0909091 | 2,61799 | 6 | 54 |
61 | 8 | 0,0454545 | 0 | 18 | 6 |
62 | 8 | 0,0454545 | 0,523598 | 18 | 6 |
63 | 8 | 0,0454545 | 1,0472 | 18 | 6 |
64 | 8 | 0,0454545 | 1,5708 | 18 | 6 |
65 | 8 | 0,0454545 | 2,09439 | 18 | 6 |
66 | 8 | 0,0454545 | 2,61799 | 18 | 6 |
67 | 8 | 0,0909091 | 0 | 18 | 6 |
68 | 8 | 0,0909091 | 0,523598 | 18 | 6 |
69 | 8 | 0,0909091 | 1,0472 | 18 | 6 |
70 | 8 | 0,0909091 | 1,5708 | 18 | 6 |
71 | 8 | 0,0909091 | 2,09439 | 18 | 6 |
72 | 8 | 0,0909091 | 2,61799 | 18 | 6 |
BE2015/5241
73 | 8 | 0,0454545 | 0 | 18 | 18 |
74 | 8 | 0,0454545 | 0,523598 | 18 | 18 |
75 | 8 | 0,0454545 | 1,0472 | 18 | 18 |
76 | 8 | 0,0454545 | 1,5708 | 18 | 18 |
77 | 8 | 0,0454545 | 2,09439 | 18 | 18 |
78 | 8 | 0,0454545 | 2,61799 | 18 | 18 |
79 | 8 | 0,0909091 | 0 | 18 | 18 |
80 | 8 | 0,0909091 | 0,523598 | 18 | 18 |
81 | 8 | 0,0909091 | 1,0472 | 18 | 18 |
82 | 8 | 0,0909091 | 1,5708 | 18 | 18 |
83 | 8 | 0,0909091 | 2,09439 | 18 | 18 |
84 | 8 | 0,0909091 | 2,61799 | 18 | 18 |
85 | 8 | 0,0454545 | 0 | 18 | 30 |
86 | 8 | 0,0454545 | 0,523598 | 18 | 30 |
87 | 8 | 0,0454545 | 1,0472 | 18 | 30 |
88 | 8 | 0,0454545 | 1,5708 | 18 | 30 |
89 | 8 | 0,0454545 | 2,09439 | 18 | 30 |
90 | 8 | 0,0454545 | 2,61799 | 18 | 30 |
91 | 8 | 0,0909091 | 0 | 18 | 30 |
92 | 8 | 0,0909091 | 0,523598 | 18 | 30 |
93 | 8 | 0,0909091 | 1,0472 | 18 | 30 |
94 | 8 | 0,0909091 | 1,5708 | 18 | 30 |
95 | 8 | 0,0909091 | 2,09439 | 18 | 30 |
96 | 8 | 0,0909091 | 2,61799 | 18 | 30 |
97 | 8 | 0,0454545 | 0 | 18 | 42 |
98 | 8 | 0,0454545 | 0,523598 | 18 | 42 |
99 | 8 | 0,0454545 | 1,0472 | 18 | 42 |
100 | 8 | 0,0454545 | 1,5708 | 18 | 42 |
101 | 8 | 0,0454545 | 2,09439 | 18 | 42 |
102 | 8 | 0,0454545 | 2,61799 | 18 | 42 |
103 | 8 | 0,0909091 | 0 | 18 | 42 |
104 | 8 | 0,0909091 | 0,523598 | 18 | 42 |
105 | 8 | 0,0909091 | 1,0472 | 18 | 42 |
106 | 8 | 0,0909091 | 1,5708 | 18 | 42 |
107 | 8 | 0,0909091 | 2,09439 | 18 | 42 |
108 | 8 | 0,0909091 | 2,61799 | 18 | 42 |
109 | 8 | 0,0454545 | 0 | 18 | 54 |
110 | 8 | 0,0454545 | 0,523598 | 18 | 54 |
BE2015/5241
111 | 8 | 0,0454545 | 1,0472 | 18 | 54 |
112 | 8 | 0,0454545 | 1,5708 | 18 | 54 |
113 | 8 | 0,0454545 | 2,09439 | 18 | 54 |
114 | 8 | 0,0454545 | 2,61799 | 18 | 54 |
115 | 8 | 0,0909091 | 0 | 18 | 54 |
116 | 8 | 0,0909091 | 0,523598 | 18 | 54 |
117 | 8 | 0,0909091 | 1,0472 | 18 | 54 |
118 | 8 | 0,0909091 | 1,5708 | 18 | 54 |
119 | 8 | 0,0909091 | 2,09439 | 18 | 54 |
120 | 8 | 0,0909091 | 2,61799 | 18 | 54 |
121 | 8 | 0,0454545 | 0 | 30 | 6 |
122 | 8 | 0,0454545 | 0,523598 | 30 | 6 |
123 | 8 | 0,0454545 | 1,0472 | 30 | 6 |
124 | 8 | 0,0454545 | 1,5708 | 30 | 6 |
125 | 8 | 0,0454545 | 2,09439 | 30 | 6 |
126 | 8 | 0,0454545 | 2,61799 | 30 | 6 |
127 | 8 | 0,0909091 | 0 | 30 | 6 |
128 | 8 | 0,0909091 | 0,523598 | 30 | 6 |
129 | 8 | 0,0909091 | 1,0472 | 30 | 6 |
130 | 8 | 0,0909091 | 1,5708 | 30 | 6 |
131 | 8 | 0,0909091 | 2,09439 | 30 | 6 |
132 | 8 | 0,0909091 | 2,61799 | 30 | 6 |
133 | 8 | 0,0454545 | 0 | 30 | 18 |
134 | 8 | 0,0454545 | 0,523598 | 30 | 18 |
135 | 8 | 0,0454545 | 1,0472 | 30 | 18 |
136 | 8 | 0,0454545 | 1,5708 | 30 | 18 |
137 | 8 | 0,0454545 | 2,09439 | 30 | 18 |
138 | 8 | 0,0454545 | 2,61799 | 30 | 18 |
139 | 8 | 0,0909091 | 0 | 30 | 18 |
140 | 8 | 0,0909091 | 0,523598 | 30 | 18 |
141 | 8 | 0,0909091 | 1,0472 | 30 | 18 |
142 | 8 | 0,0909091 | 1,5708 | 30 | 18 |
143 | 8 | 0,0909091 | 2,09439 | 30 | 18 |
144 | 8 | 0,0909091 | 2,61799 | 30 | 18 |
145 | 8 | 0,0454545 | 0 | 30 | 30 |
146 | 8 | 0,0454545 | 0,523598 | 30 | 30 |
147 | 8 | 0,0454545 | 1,0472 | 30 | 30 |
148 | 8 | 0,0454545 | 1,5708 | 30 | 30 |
BE2015/5241
149 | 8 | 0,0454545 | 2,09439 | 30 | 30 |
150 | 8 | 0,0454545 | 2,61799 | 30 | 30 |
151 | 8 | 0,0909091 | 0 | 30 | 30 |
152 | 8 | 0,0909091 | 0,523598 | 30 | 30 |
153 | 8 | 0,0909091 | 1,0472 | 30 | 30 |
154 | 8 | 0,0909091 | 1,5708 | 30 | 30 |
155 | 8 | 0,0909091 | 2,09439 | 30 | 30 |
156 | 8 | 0,0909091 | 2,61799 | 30 | 30 |
157 | 8 | 0,0454545 | 0 | 30 | 42 |
158 | 8 | 0,0454545 | 0,523598 | 30 | 42 |
159 | 8 | 0,0454545 | 1,0472 | 30 | 42 |
160 | 8 | 0,0454545 | 1,5708 | 30 | 42 |
161 | 8 | 0,0454545 | 2,09439 | 30 | 42 |
162 | 8 | 0,0454545 | 2,61799 | 30 | 42 |
163 | 8 | 0,0909091 | 0 | 30 | 42 |
164 | 8 | 0,0909091 | 0,523598 | 30 | 42 |
165 | 8 | 0,0909091 | 1,0472 | 30 | 42 |
166 | 8 | 0,0909091 | 1,5708 | 30 | 42 |
167 | 8 | 0,0909091 | 2,09439 | 30 | 42 |
168 | 8 | 0,0909091 | 2,61799 | 30 | 42 |
169 | 8 | 0,0454545 | 0 | 30 | 54 |
170 | 8 | 0,0454545 | 0,523598 | 30 | 54 |
171 | 8 | 0,0454545 | 1,0472 | 30 | 54 |
172 | 8 | 0,0454545 | 1,5708 | 30 | 54 |
173 | 8 | 0,0454545 | 2,09439 | 30 | 54 |
174 | 8 | 0,0454545 | 2,61799 | 30 | 54 |
175 | 8 | 0,0909091 | 0 | 30 | 54 |
176 | 8 | 0,0909091 | 0,523598 | 30 | 54 |
177 | 8 | 0,0909091 | 1,0472 | 30 | 54 |
178 | 8 | 0,0909091 | 1,5708 | 30 | 54 |
179 | 8 | 0,0909091 | 2,09439 | 30 | 54 |
180 | 8 | 0,0909091 | 2,61799 | 30 | 54 |
181 | 8 | 0,0454545 | 0 | 42 | 6 |
182 | 8 | 0,0454545 | 0,523598 | 42 | 6 |
183 | 8 | 0,0454545 | 1,0472 | 42 | 6 |
184 | 8 | 0,0454545 | 1,5708 | 42 | 6 |
185 | 8 | 0,0454545 | 2,09439 | 42 | 6 |
186 | 8 | 0,0454545 | 2,61799 | 42 | 6 |
BE2015/5241
187 | 8 | 0,0909091 | 0 | 42 | 6 |
188 | 8 | 0,0909091 | 0,523598 | 42 | 6 |
189 | 8 | 0,0909091 | 1,0472 | 42 | 6 |
190 | 8 | 0,0909091 | 1,5708 | 42 | 6 |
191 | 8 | 0,0909091 | 2,09439 | 42 | 6 |
192 | 8 | 0,0909091 | 2,61799 | 42 | 6 |
193 | 8 | 0,0454545 | 0 | 42 | 18 |
194 | 8 | 0,0454545 | 0,523598 | 42 | 18 |
195 | 8 | 0,0454545 | 1,0472 | 42 | 18 |
196 | 8 | 0,0454545 | 1,5708 | 42 | 18 |
197 | 8 | 0,0454545 | 2,09439 | 42 | 18 |
198 | 8 | 0,0454545 | 2,61799 | 42 | 18 |
199 | 8 | 0,0909091 | 0 | 42 | 18 |
200 | 8 | 0,0909091 | 0,523598 | 42 | 18 |
201 | 8 | 0,0909091 | 1,0472 | 42 | 18 |
202 | 8 | 0,0909091 | 1,5708 | 42 | 18 |
203 | 8 | 0,0909091 | 2,09439 | 42 | 18 |
204 | 8 | 0,0909091 | 2,61799 | 42 | 18 |
205 | 8 | 0,0454545 | 0 | 42 | 30 |
206 | 8 | 0,0454545 | 0,523598 | 42 | 30 |
207 | 8 | 0,0454545 | 1,0472 | 42 | 30 |
208 | 8 | 0,0454545 | 1,5708 | 42 | 30 |
209 | 8 | 0,0454545 | 2,09439 | 42 | 30 |
210 | 8 | 0,0454545 | 2,61799 | 42 | 30 |
211 | 8 | 0,0909091 | 0 | 42 | 30 |
212 | 8 | 0,0909091 | 0,523598 | 42 | 30 |
213 | 8 | 0,0909091 | 1,0472 | 42 | 30 |
214 | 8 | 0,0909091 | 1,5708 | 42 | 30 |
215 | 8 | 0,0909091 | 2,09439 | 42 | 30 |
216 | 8 | 0,0909091 | 2,61799 | 42 | 30 |
217 | 8 | 0,0454545 | 0 | 42 | 42 |
218 | 8 | 0,0454545 | 0,523598 | 42 | 42 |
219 | 8 | 0,0454545 | 1,0472 | 42 | 42 |
220 | 8 | 0,0454545 | 1,5708 | 42 | 42 |
221 | 8 | 0,0454545 | 2,09439 | 42 | 42 |
222 | 8 | 0,0454545 | 2,61799 | 42 | 42 |
223 | 8 | 0,0909091 | 0 | 42 | 42 |
224 | 8 | 0,0909091 | 0,523598 | 42 | 42 |
BE2015/5241
225 | 8 | 0,0909091 | 1,0472 | 42 | 42 |
226 | 8 | 0,0909091 | 1,5708 | 42 | 42 |
227 | 8 | 0,0909091 | 2,09439 | 42 | 42 |
228 | 8 | 0,0909091 | 2,61799 | 42 | 42 |
229 | 8 | 0,0454545 | 0 | 42 | 54 |
230 | 8 | 0,0454545 | 0,523598 | 42 | 54 |
231 | 8 | 0,0454545 | 1,0472 | 42 | 54 |
232 | 8 | 0,0454545 | 1,5708 | 42 | 54 |
233 | 8 | 0,0454545 | 2,09439 | 42 | 54 |
234 | 8 | 0,0454545 | 2,61799 | 42 | 54 |
235 | 8 | 0,0909091 | 0 | 42 | 54 |
236 | 8 | 0,0909091 | 0,523598 | 42 | 54 |
237 | 8 | 0,0909091 | 1,0472 | 42 | 54 |
238 | 8 | 0,0909091 | 1,5708 | 42 | 54 |
239 | 8 | 0,0909091 | 2,09439 | 42 | 54 |
240 | 8 | 0,0909091 | 2,61799 | 42 | 54 |
241 | 8 | 0,0454545 | 0 | 54 | 6 |
242 | 8 | 0,0454545 | 0,523598 | 54 | 6 |
243 | 8 | 0,0454545 | 1,0472 | 54 | 6 . |
244 | 8 | 0,0454545 | 1,5708 | 54 | 6 |
245 | 8 | 0,0454545 | 2,09439 | 54 | 6 |
246 | 8 | 0,0454545 | 2,61799 | 54 | 6 |
247 | 8 | 0,0909091 | 0 | 54 | 6 |
248 | 8 | 0,0909091 | 0,523598 | 54 | 6 |
249 | 8 | 0,0909091 | 1,0472 | 54 | 6 |
250 | 8 | 0,0909091 | 1,5708 | 54 | 6 |
251 | 8 | 0,0909091 | 2,09439 | 54 | 6 |
252 | 8 | 0,0909091 | 2,61799 | 54 | 6 |
253 | 8 | 0,0454545 | 0 | 54 | 18 |
254 | 8 | 0,0454545 | 0,523598 | 54 | 18 |
255 | 8 | 0,0454545 | 1,0472 | 54 | 18 |
256 | 8 | 0,0454545 | 1,5708 | 54 | 18 |
257 | 8 | 0,0454545 | 2,09439 | 54 | 18 |
258 | 8 | 0,0454545 | 2,61799 | 54 | 18 |
259 | 8 | 0,0909091 | 0 | 54 | 18 |
260 | 8 | 0,0909091 | 0,523598 | 54 | 18 |
261 | 8 | 0,0909091 | 1,0472 | 54 | 18 |
262 | 8 | 0,0909091 | 1,5708 | 54 | 18 |
BE2015/5241
263 | 8 | 0,0909091 | 2,09439 | 54 | 18 |
264 | 8 | 0,0909091 | 2,61799 | 54 | 18 |
265 | 8 | 0,0454545 | 0 | 54 | 30 |
266 | 8 | 0,0454545 | 0,523598 | 54 | 30 |
267 | 8 | 0,0454545 | 1,0472 | 54 | 30 |
268 | 8 | 0,0454545 | 1,5708 | 54 | 30 |
269 | 8 | 0,0454545 | 2,09439 | 54 | 30 |
270 | 8 | 0,0454545 | 2,61799 | 54 | 30 |
271 | 8 | 0,0909091 | 0 | 54 | 30 |
272 | 8 | 0,0909091 | 0,523598 | 54 | 30 |
273 | 8 | 0,0909091 | 1,0472 | 54 | 30 |
274 | 8 | 0,0909091 | 1,5708 | 54 | 30 |
275 | 8 | 0,0909091 | 2,09439 | 54 | 30 |
276 | 8 | 0,0909091 | 2,61799 | 54 | 30 |
277 | 8 | 0,0454545 | 0 | 54 | 42 |
278 | 8 | 0,0454545 | 0,523598 | 54 | 42 |
279 | 8 | 0,0454545 | 1,0472 | 54 | 42 |
280 | 8 | 0,0454545 | 1,5708 | 54 | 42 |
281 | 8 | 0,0454545 | 2,09439 | 54 | 42 |
282 | 8 | 0,0454545 | 2,61799 | 54 | 42 |
283 | 8 | 0,0909091 | 0 | 54 | 42 |
284 | 8 | 0,0909091 | 0,523598 | 54 | 42 |
285 | 8 | 0,0909091 | 1,0472 | 54 | 42 |
286 | 8 | 0,0909091 | 1,5708 | 54 | 42 |
287 | 8 | 0,0909091 | 2,09439 | 54 | 42 |
288 | 8 | 0,0909091 | 2,61799 | 54 | 42 |
289 | 8 | 0,0454545 | 0 | 54 | 54 |
290 | 8 | 0,0454545 | 0,523598 | 54 | 54 |
291 | 8 | 0,0454545 | 1,0472 | 54 | 54 |
292 | 8 | 0,0454545 | 1,5708 | 54 | 54 |
293 | 8 | 0,0454545 | 2,09439 | 54 | 54 |
294 | 8 | 0,0454545 | 2,61799 | 54 | 54 |
295 | 8 | 0,0909091 | 0 | 54 | 54 |
296 | 8 | 0,0909091 | 0,523598 | 54 | 54 |
297 | 8 | 0,0909091 | 1,0472 | 54 | 54 |
298 | 8 | 0,0909091 | 1,5708 | 54 | 54 |
299 | 8 | 0,0909091 | 2,09439 | 54 | 54 |
300 | 8 | 0,0909091 | 2,61799 | 54 | 54 |
BE2015/5241
Claims (6)
- REVENDICATIONS:1. Procédé pour identifier une forme dans une image d'entrée, comprenant les étapes consistant àa) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,b) générer un vecteur d'image à partir de la matrice normalisée,c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, etf) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'ondeBE2015/5241 dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
- 2. Procédé selon la revendication 1, dans lequel tous les éléments non diagonaux sont zéro.
- 3. Procédé selon la revendication 1, dans lequel le paramètre relatif à la direction de l'onde sinusoïdale est un angle.
- 4. Procédé selon la revendication 1, avec au moins deux paramètres relatifs à un centre de la fonction de Gabor, dans lequel les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de Gabor sont régulièrement espacés.BE2015/5241
- 5. Procédé selon la revendication 1, dans lequel le vecteur de caractéristiques est approximé.
- 6. Produit de programme informatique comprenant un support non transitoire lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée, la logique de commande comprenant:a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse (303) étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,BE2015/5241e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, etf) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, et dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/254,039 US9058517B1 (en) | 2014-04-16 | 2014-04-16 | Pattern recognition system and method using Gabor functions |
US14254039 | 2014-04-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
BE1025502A1 true BE1025502A1 (fr) | 2019-03-20 |
BE1025502B1 BE1025502B1 (fr) | 2019-03-27 |
Family
ID=53039857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BE2015/5241A BE1025502B1 (fr) | 2014-04-16 | 2015-04-15 | Système et procédé de reconnaissance de formes utilisant des fonctions de gabor |
Country Status (6)
Country | Link |
---|---|
US (1) | US9058517B1 (fr) |
JP (1) | JP6609267B2 (fr) |
KR (1) | KR102268174B1 (fr) |
CN (1) | CN106462773B (fr) |
BE (1) | BE1025502B1 (fr) |
WO (1) | WO2015158778A1 (fr) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102055355B1 (ko) * | 2015-01-28 | 2019-12-12 | 구글 엘엘씨 | 배치 정규화 레이어들 |
CN107133622B (zh) * | 2016-02-29 | 2022-08-26 | 阿里巴巴集团控股有限公司 | 一种单词的分割方法和装置 |
JP6545740B2 (ja) * | 2017-03-08 | 2019-07-17 | 株式会社東芝 | 生成装置、プログラム、認識システムおよび生成方法 |
CN108304885A (zh) * | 2018-02-28 | 2018-07-20 | 宜宾学院 | 一种Gabor小波CNN图像分类方法 |
CN108629297A (zh) * | 2018-04-19 | 2018-10-09 | 北京理工大学 | 一种基于空域自然场景统计的遥感图像云检测方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4159794B2 (ja) * | 2001-05-02 | 2008-10-01 | 本田技研工業株式会社 | 画像処理装置及び方法 |
JP4161659B2 (ja) * | 2002-02-27 | 2008-10-08 | 日本電気株式会社 | 画像認識システム及びその認識方法並びにプログラム |
CN1459761B (zh) * | 2002-05-24 | 2010-04-21 | 清华大学 | 基于Gabor滤波器组的字符识别技术 |
JP2005044330A (ja) * | 2003-07-24 | 2005-02-17 | Univ Of California San Diego | 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置 |
SG121783A1 (en) * | 2003-07-29 | 2006-05-26 | Sony Corp | Techniques and systems for embedding and detectingwatermarks in digital data |
US8509538B2 (en) * | 2007-12-20 | 2013-08-13 | Intel Corporation | Method and apparatus for obtaining and processing Gabor image features |
US8391613B2 (en) * | 2009-06-30 | 2013-03-05 | Oracle America, Inc. | Statistical online character recognition |
CN101866421B (zh) * | 2010-01-08 | 2013-05-01 | 苏州市职业大学 | 基于离散度约束非负稀疏编码的自然图像特征提取方法 |
CN102915436B (zh) * | 2012-10-25 | 2015-04-15 | 北京邮电大学 | 基于类内变化字典和训练图像的稀疏表示人脸识别方法 |
-
2014
- 2014-04-16 US US14/254,039 patent/US9058517B1/en active Active
-
2015
- 2015-04-15 CN CN201580021728.5A patent/CN106462773B/zh active Active
- 2015-04-15 BE BE2015/5241A patent/BE1025502B1/fr active IP Right Grant
- 2015-04-15 JP JP2016562481A patent/JP6609267B2/ja active Active
- 2015-04-15 KR KR1020167030903A patent/KR102268174B1/ko active IP Right Grant
- 2015-04-15 WO PCT/EP2015/058177 patent/WO2015158778A1/fr active Application Filing
Also Published As
Publication number | Publication date |
---|---|
KR102268174B1 (ko) | 2021-06-24 |
KR20160148563A (ko) | 2016-12-26 |
CN106462773A (zh) | 2017-02-22 |
JP2017515221A (ja) | 2017-06-08 |
CN106462773B (zh) | 2019-07-12 |
JP6609267B2 (ja) | 2019-11-20 |
US9058517B1 (en) | 2015-06-16 |
BE1025502B1 (fr) | 2019-03-27 |
WO2015158778A1 (fr) | 2015-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BE1025504B1 (fr) | Système de reconnaissance de formes | |
US11657602B2 (en) | Font identification from imagery | |
BE1025502B1 (fr) | Système et procédé de reconnaissance de formes utilisant des fonctions de gabor | |
Marra et al. | Blind PRNU-based image clustering for source identification | |
BE1022562A9 (fr) | Procédé de reconnaissance optique de caractères | |
BE1022636B1 (fr) | Procede et methode de correction de distorsions projectives avec des etapes d'elimination a des multiples niveaux | |
BE1022630B1 (fr) | Procédé et système pour déterminer des candidats points de fuite pour la correction projective | |
BE1024194B1 (fr) | Procédé d'indentification d'un caractère dans une image numérique | |
BE1025503B1 (fr) | Procede de segmentation de ligne | |
FR3016066A1 (fr) | Systeme et procede de ponderation pour une mise en commun de descripteurs d'image | |
FR2884007A1 (fr) | Procede d'identification de visages a partir d'images de visage, dispositif et programme d'ordinateur correspondants | |
CN112597918B (zh) | 文本检测方法及装置、电子设备、存储介质 | |
BE1022635B1 (fr) | Procede et systeme de correction de distorsions projectives utilisant des points propres | |
FR3081244A1 (fr) | Procede de reconnaissance de caracteres | |
EP2839410B1 (fr) | Procédé de reconnaissance d'un contexte visuel d'une image et dispositif correspondant | |
FR3081245A1 (fr) | Procede de reconnaissance de caracteres | |
Pan et al. | A two-stage network for image deblurring | |
FR3069087B1 (fr) | Procede de traitement d'une image | |
BE1021013B1 (fr) | Procede et systeme pour ameliorer la qualite d'images en couleur. | |
BE1020588A5 (fr) | Procede de reconnaissance de formes, produit de programme d'ordinateur et terminal mobile. | |
Abdelaziz et al. | Enhancement for License Plate Recognition using Image Super Resolution technique | |
WO2012107696A1 (fr) | Procédés, dispositif et programmes d'ordinateur pour la reconnaissance de formes, en temps réel, à l'aide d'un appareil comprenant des ressources limitées | |
WO2019115324A1 (fr) | Procede de synthese d'images | |
FR3112228A1 (fr) | Dispositif et procédé pour générer un masque de la silhouette du profil d’une structure | |
EP2856391B1 (fr) | Procédé de détection d'ombres portées sur une image initiale |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Effective date: 20190327 |