BE1025502A1 - Système et procédé de reconnaissance de formes utilisant des fonctions de gabor - Google Patents

Système et procédé de reconnaissance de formes utilisant des fonctions de gabor Download PDF

Info

Publication number
BE1025502A1
BE1025502A1 BE20155241A BE201505241A BE1025502A1 BE 1025502 A1 BE1025502 A1 BE 1025502A1 BE 20155241 A BE20155241 A BE 20155241A BE 201505241 A BE201505241 A BE 201505241A BE 1025502 A1 BE1025502 A1 BE 1025502A1
Authority
BE
Belgium
Prior art keywords
vector
matrix
function
image
gabor function
Prior art date
Application number
BE20155241A
Other languages
English (en)
Other versions
BE1025502B1 (fr
Inventor
Frédéric Collet
Jordi Hautot
Michel Dauw
Meulenaere Pierre De
Olivier Dupont
Günter Hensges
Original Assignee
Iris Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iris Sa filed Critical Iris Sa
Publication of BE1025502A1 publication Critical patent/BE1025502A1/fr
Application granted granted Critical
Publication of BE1025502B1 publication Critical patent/BE1025502B1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • G06V30/18038Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19127Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

Un système et un procédé de reconnaissance de formes qui génèrent un vecteur de caractéristiques en multipliant un vecteur d'image avec une matrice creuse. La matrice creuse est générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne. La fonction de Gabor est une fonction d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale. La longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.

Description

SYSTÈME ET PROCÉDÉ DE RECONNAISSANCE DE FORMES
UTILISANT DES FONCTIONS DE GABOR
DOMAINE DE L'INVENTION
La présente invention concerne un système de reconnaissance de formes. Plus spécifiquement, la présente invention concerne un système de reconnaissance de formes utilisant une fonction de Gabor.
CONTEXTE DE L'INVENTION
Un système de reconnaissance de formes peut être un système de reconnaissance optique de caractères (ROC). Les systèmes ROC sont connus. Ils convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système ROC, les images de ce qui pourrait être des caractères sont isolées et un processus de reconnaissance de caractères est utilisé pour identifier le caractère.
Les processus connus de reconnaissance optique de caractères comprennent en général:
• une étape de normalisation qui génère une matrice normalisée à partir d'une image d'entrée;
• une étape d'extraction de caractéristiques; et • une étape de classification pour identifier le caractère.
L'étape d'extraction de caractéristiques génère un vecteur de caractéristiques qui caractérise l'image d'entrée et l'étape de classification identifie le caractère en partant de ce vecteur de caractéristiques. Dans certains processus de ROC, l'étape d'extraction de caractéristiques comprend un filtrage avec un filtre de Gabor. Le choix du filtre de Gabor est déterminant pour le processus de ROC parce que le filtre de Gabor
BE2015/5241 détermine le vecteur de caractéristiques pour identifier le caractère. Le vecteur de caractéristiques doit contenir l'information nécessaire pour identifier le caractère avec grande exactitude. Un vecteur de caractéristiques trop grand rend les calculs lents et un vecteur de caractéristiques trop petit diminue l'exactitude de l'identification du caractère. Les procédés de ROC connus utilisant des filtres de Gabor sont trop lents ou ont une exactitude trop faible. Cela est particulièrement important pour l'identification des caractères asiatiques à cause du nombre extrêmement élevé de caractères asiatiques. Un autre inconvénient des filtres de Gabor connus réside dans le fait qu'ils ne fonctionnent pas de manière adéquate avec l'étape de classification subséquente.
US 7174044 B2 divulgue un procédé connu de reconnaissance de caractères basé sur des filtres de Gabor qui extraient l'information des directions spécifiques des caractères. Ce procédé utilise une moyenne sur des régions de filtres de Gabor et comprend de nombreux calculs et un grand vecteur de caractéristiques. Cela rend les processus de ROC utilisant ce procédé trop lent.
Le document “High performance Chinese OCR based on Gabor features, discriminative feature extraction and model training” de Qiang Huo, Yong Ge et Zhi-Dan Feng in the Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, 2001, Volume 3, décrit un processus de ROC connu pour des caractères chinois. Ce procédé est rapide mais l'exactitude de la reconnaissance n'est pas extrêmement élevée. .
La dissertation intitulée “Chinese OCR System Based on Gabor Features and SVM” de Dai Wei à l'université Shanghai Jiaotong décrit un autre processus de ROC. SVM signifie Support Vector Machine (machine à vecteurs de support ou séparateurs à vaste marge) un modèle d'apprentissage supervisé qui utilise des algorithmes d'apprentissage
BE2015/5241 associés pour l'analyse de données et des algorithmes de reconnaissance. Un tel système SVM requiert un très grand ensemble d'apprentissage qui le rend impraticable ou inexact.
RÉSUMÉ DE L'INVENTION
Un but de cette invention est de fournir un procédé de reconnaissance de formes qui permet une identification rapide et exacte de la forme.
Un autre but de cette invention est de fournir un produit de programme informatique pour mettre en œuvre ledit système de reconnaissance de formes.
Ces buts sont atteints selon les modes de réalisation de l'invention.
Dans un mode de réalisation, le procédé d'identification d'une forme dans une image d'entrée comprend les étapes consistant à:
a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) générer un vecteur d'image à partir de la matrice normalisée,
c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
BE2015/5241
e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, et
f) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.
On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, parce que le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix de deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un compromis avantageux pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant. Cette redondance du vecteur de caractéristiques a pour résultat qu'un caractère peut quand même être reconnu même si la valeur d'un élément donné du vecteur de caractéristiques est corrompue.
Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes, la densité de probabilité étant calculée par la formule:
BE2015/5241 [ΪΟμΓΪΣΟμα ρ Q □ □ - exp m-------------□ □ Ε2π^|Σ| 2 où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques.
Dans un autre mode de réalisation, la matrice de covariance est approximée. Dans un mode de réalisation, les traces des matrices de covariance de tous les modèles sont égales.
Dans un mode de réalisation, tous les éléments non diagonaux de la matrice de covariance sont réglés sur zéro. On a constaté que la 10 caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.
Dans un mode de réalisation selon la présente invention, le 15 paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.
Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle. Dans un autre mode de 20 réalisation, la somme de la plus haute valeur de l'angle et de la plus basse valeur de l'angle est égale à n radians. Dans un mode de réalisation, l'angle prend six valeurs.
Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage 25 angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
BE2015/5241
Dans un autre mode de réalisation selon l'invention, la fonction de Gabor est une fonction d'au moins deux paramètres relatifs à un centre de la fonction de Gabor. Dans un mode de réalisation, les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de 5 Gabor sont régulièrement espacés.
Dans un mode de réalisation de l'invention, un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice 10 normalisée. Dans un mode de réalisation, la distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
Ce choix des centres de la fonction de Gabor donne un bon 15 échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour avoir des calculs rapides du procédé.
Dans un autre mode de réalisation selon l'invention, la fonction de Gabor comprend un paramètre relatif à la largeur de la fonction gaussienne, 20 qui peut être l'écart type de la fonction gaussienne. Dans un mode de réalisation, l'écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage 25 de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans un mode de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un
BE2015/5241
Ί logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.
Dans un autre mode de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.
Dans un mode de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.
Dans des modes de réalisation selon l'invention, les éléments du vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.
BE2015/5241
Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, la longueur d'onde plus courte est plus courte que la distance entre deux centres adjacents et la longueur d'onde plus longue est plus longue que la distance entre deux centres adjacents.
Dans un mode de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.
Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et
2,61799 radians, les centres de la fonction de Gabor sont situés aux positions (6,6), (6,18), (6,30), (6,42), (6,54), (18,6), (18,18), (18,30), (18,42), (18,54), (30,6), (30,18), (30,30), (30,42), (30,54), (42,6), (42,18), (42,30), (42,42), (42,54), (54,6), (54,18), (54,30), (54,42), (54,54), la première valeur de longueur d'onde est égale à 11, la deuxième valeur de longueur d'onde est égale à 22 et l'écart type de la fonction gaussienne est égal à 8. On a constaté que ce mode de réalisation donne une très bonne exactitude et les calculs correspondants sont rapides.
Dans un autre mode de réalisation la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans
BE2015/5241 lequel est stockée une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:
a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,
c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, et
BE2015/5241
f) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde.
Dans un mode de réalisation de la présente invention, le procédé pour identifier une forme dans une image d'entrée comprend les étapes consistant à
a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
c) générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles 108 une densité de probabilité de chaque modèle,
d) identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée,
BE2015/5241 dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec
a. le premier ensemble d'au moins une valeur inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et
b. le premier ensemble d'au moins une valeur supérieure ou sensiblement égale à la moitié des valeurs dans le deuxième ensemble d'au moins une valeur.
On a constaté que par une combinaison de ces étapes, on obtient un procédé de reconnaissance de formes rapide et exact. En particulier, premièrement, le vecteur de caractéristiques généré à l'étape c) est suffisamment grand pour rendre la reconnaissance exacte et est suffisamment petit pour rendre les calculs du procédé de reconnaissance de formes rapides. En outre, le choix deux longueurs d'onde dont la plus courte est supérieure ou égale à la moitié de la plus longue et inférieure ou égale à la distance entre deux centres de la fonction de Gabor est un bon compromis pour maintenir le nombre de longueurs d'onde (et donc la taille du vecteur de caractéristiques) à un bas niveau et néanmoins rendre le vecteur de caractéristiques légèrement redondant.
Dans un mode de réalisation de l'invention, les modèles sont caractérisés par une matrice de covariance et un vecteur de moyennes. La densité de probabilité peut être calculée par la formule □’□pffZCÏDpD pQ-DD ..... Axp ΠΠ---— ----—□ □ C2ttS|Z| 2 où le symbole r représente le vecteur de caractéristiques, le symbole Z représente la matrice de covariance, le symbole μ représente le vecteur de
BE2015/5241 moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques. Dans des modes de réalisation, tous les éléments non diagonaux de la matrice de covariance peuvent être réglés sur zéro, la matrice de covariance peut être approximée, les traces des matrices de covariance de tous les modèles peuvent être égales. On a constaté que la caractérisation des modèles par une telle matrice de covariance et un tel vecteur de moyennes et le calcul de la densité de probabilité par cette formule, en combinaison avec le procédé décrit ci-dessus, rend la reconnaissance exacte et particulièrement rapide.
Dans des modes de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est tel que les angles entre les directions possibles de l'onde sinusoïdale sont sensiblement égaux.
Dans un mode de réalisation selon l'invention, le paramètre relatif à la direction de l'onde sinusoïdale est un angle et la somme de sa plus haute valeur et de sa plus basse valeur est égale à n radians. Cet angle peut prendre six valeurs. Ce choix de valeurs pour le paramètre relatif à la direction de l'onde sinusoïdale donne un bon compromis pour obtenir un échantillonnage angulaire suffisant de l'image normalisée et pour maintenir la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, au moins deux paramètres se rapportent à un centre de la fonction de Gabor et peuvent être tels que les centres de la fonction de Gabor sont régulièrement espacés. Un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction verticale dans la matrice normalisée et un paramètre relatif à un centre de la fonction de Gabor peut correspondre à une direction horizontale dans la matrice normalisée. La distance d'un premier centre de la fonction de Gabor à un bord de la matrice normalisée peut être sensiblement égale à la moitié de la distance entre deux centres
BE2015/5241 adjacents de la fonction de Gabor. Ce choix des centres de la fonction de Gabor donne un bon échantillonnage de l'image normalisée et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, un paramètre se rapporte à la largeur de la fonction gaussienne, qui peut être l'écart type de la fonction gaussienne. Cet écart type de la fonction gaussienne est inférieur à la distance entre deux centres adjacents de la fonction de Gabor et peut être supérieur à la moitié de la distance entre deux centres adjacents de la fonction de Gabor. Ce choix de la largeur de la fonction gaussienne donne un bon échantillonnage de l'image normalisée, rend le vecteur de caractéristiques légèrement redondant et maintient la taille du vecteur de caractéristiques suffisamment petite pour obtenir des calculs rapides du procédé.
Dans des modes de réalisation selon l'invention, la forme est une forme bicolore, un caractère, un caractère asiatique, un groupe de caractères, un logo, une image, un dessin, une séquence de sons, une séquence de film ou une forme tridimensionnelle.
Dans des modes de réalisation selon l'invention, la matrice normalisée représente une image normalisée avec chaque élément de la matrice normalisée correspondant à un emplacement sur l'image normalisée. L'image normalisée comprend la forme à identifier et la matrice normalisée est l'objet mathématique qui représente l'image normalisée. La matrice normalisée peut être traitée par des méthodes mathématiques afin d'extraire les caractéristiques de l'image normalisée qui permettent l'identification de la forme.
Dans des modes de réalisation selon l'invention, l'étape de normalisation de l'image d'entrée en une matrice normalisée comprend la mise à l'échelle, le seuillage, le lissage, l'interpolation et le filtrage, et l'image
BE2015/5241 normalisée qui correspond à la matrice normalisée a un format prédéterminé. L'étape de normalisation de l'image d'entrée en une matrice normalisée convertit l'image d'entrée avec la forme à identifier en un format exploitable. Ce format exploitable est une matrice avec des caractéristiques spécifiques. Ces caractéristiques spécifiques peuvent être que la matrice normalisée est binaire, que dans l'image normalisée, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant.
Dans des modes de réalisation selon l'invention, les éléments d'un vecteur d'image sont égaux aux éléments de la matrice normalisée. Dans l'étape de transformation de la matrice normalisée en un vecteur d'image, les éléments du vecteur d'image sont typiquement établis égaux aux éléments de la matrice normalisée. Étant donné que dans un mode de réalisation de la présente invention, les éléments de la matrice normalisée sont des nombres binaires, les éléments du vecteur d'image peuvent être des nombres binaires.
Dans des modes de réalisation selon l'invention, l'information à propos d'éléments de la matrice normalisée est redondante dans le vecteur de caractéristiques. Cette redondance améliore l'exactitude de l'identification de la forme et peut être obtenue par le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres adjacents.
Dans des modes de réalisation selon l'invention, le vecteur de caractéristiques est approximé. Cela peut augmenter la vitesse des calculs du procédé d'identification de la forme. Le point important est l'exactitude de l'identification de la forme, l'exactitude du vecteur de caractéristiques est de moindre importance.
BE2015/5241
Dans un mode de réalisation selon l'invention, la matrice normalisée est une matrice de 64x64, le vecteur d'image a 4096 éléments, la matrice creuse utilisée dans l'étape de création du vecteur de caractéristiques est une matrice de 300x4096, la matrice de covariance est une matrice de 300x300, le vecteur de moyennes a 300 éléments, le vecteur de caractéristiques a 300 éléments, l'angle relatif à la direction de l'onde sinusoïdale prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et
2,61799 radians, les centres de la fonction de Gabor sont situés aux positions (6,6), (6,18), (6,30), (6,42), (6,54), (18,6), (18,18), (18,30), (18,42), (18,54), (30,6), (30,18), (30,30), (30,42), (30,54), (42,6), (42,18), (42,30), (42,42), (42,54), (54,6), (54,18), (54,30), (54,42), (54,54), la première valeur de longueur d'onde est égale à 11, la deuxième valeur de longueur d'onde est égale à 22 et l'écart type de la fonction gaussienne est égal à 8. On a constaté que ce mode de réalisation donne une très bonne exactitude et les calculs correspondants sont rapides.
Dans un autre mode de réalisation de la présente invention, un produit de programme informatique comprend un support lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée. La logique de commande comprend:
a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
b) des deuxièmes moyens de code de programme lisible par ordinateur pour créer un vecteur de caractéristiques à partir de la matrice normalisée avec une fonction de Gabor, la fonction de Gabor étant une onde sinusoïdale multipliée par une fonction gaussienne et dépendant d'au moins une variable relative à une position sur l'image normalisée et d'un ensemble de paramètres
BE2015/5241 comprenant un paramètre relatif à la direction de l'onde sinusoïdale, au moins un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
c) des troisièmes moyens de code de programme lisible par ordinateur pour générer à partir du vecteur de caractéristiques et d'une liste prédéterminée de modèles une densité de probabilité de chaque modèle pour identifier un meilleur modèle comme la forme dans une image d'entrée,
d) des quatrièmes moyens de code de programme lisible par ordinateur pour identifier le modèle avec la plus haute densité de probabilité comme la forme dans une image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et la longueur d'onde prend des valeurs dans un premier ensemble d'au moins une valeur et dans un deuxième ensemble d'au moins une valeur avec
a. le premier ensemble d'au moins une valeur inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et
b. le premier ensemble d'au moins une valeur supérieure ou sensiblement égale à la moitié des valeurs dans le deuxième ensemble d'au moins une valeur.
BRÈVE DESCRIPTION DES DESSINS
Pour une meilleure compréhension de la présente invention, il sera maintenant fait référence, à titre d'exemple, aux dessins joints dans lesquels:
BE2015/5241
La figure 1 montre un organigramme d'un processus de reconnaissance de caractères selon l'invention.
La figure 2 montre une illustration schématique d'une étape de normalisation dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 3 montre un organigramme d'une étape d'extraction dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 4 montre un organigramme qui décrit comment les éléments de la matrice creuse sont générés dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 5 a montre une illustration d'une multiplication de matrice entre une matrice creuse et un vecteur d'image utilisée dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 5 b montre une illustration d'une matrice de seuil utilisée dans un processus de reconnaissance optique de caractères selon l'invention.
La figure 6 montre un organigramme d'une étape de classification dans un processus de reconnaissance optique de caractères selon l'invention.
DESCRIPTION DE L'INVENTION
La présente invention sera décrite en rapport avec des modes de réalisation particuliers et en référence à certains dessins mais l'invention n'y est toutefois pas limitée. Les dessins décrits ne sont que schématiques et sont non limitatifs. Dans les dessins, la taille de certains des éléments peut être exagérée et non dessinée à l'échelle à des fins illustratives.
En outre, les termes premier, deuxième, troisième et similaire dans la description et dans les revendications sont utilisés pour faire la
BE2015/5241 distinction entre éléments similaires et pas nécessairement pour décrire un ordre séquentiel ou chronologique. Les termes sont interchangeables dans les circonstances appropriées et les modes de réalisation de l'invention peuvent fonctionner dans d'autres séquences que celles décrites ou illustrées dans le présent document.
De plus, les divers modes de réalisation, bien que qualifiés de préférés, doivent être interprétés comme des façons exemplaires dont l'invention peut être mise en œuvre plutôt que comme limitant la portée de l'invention.
Le terme comprenant, utilisé dans les revendications, ne doit pas être interprété comme étant limité aux moyens ou étapes énumérés cidessous; il n'exclut pas d'autres éléments ou étapes. Il doit être interprété comme spécifiant la présence des éléments, nombres entiers, étapes ou composants cités auxquels il est fait référence mais n'exclut pas la présence ou l'ajout d'un ou plusieurs autres éléments, nombres entiers, étapes ou composants ou groupes de ceux-ci. Donc, la portée de l'expression un dispositif comprenant A et B ne devrait pas être limitée à des dispositifs comprenant uniquement les composants A et B, au contraire, en ce qui concerne la présente invention, les seuls composants énumérés du dispositif sont A et B, et la revendication devrait également être interprétée comme incluant des équivalents de ces composants.
Les nombres binaires, vecteurs et matrices sont censés être écrits ici avec 0 et 1 mais il est clair pour une personne de métier qu'ils pourraient être écrits comme vrai et faux, noir et blanc ou tout autre moyen pour indiquer un état binaire.
Dans un mode de réalisation de la présente invention, des images binaires sont traitées. Les images binaires sont des images numériques avec uniquement deux couleurs possibles pour chaque pixel. Ces deux couleurs, en général noir et blanc, peuvent être représentées comme des
BE2015/5241 valeurs vraies et fausses ou des valeurs 1 et 0. Une représentation avec 1 et 0 est spécialement utile pour effectuer un traitement mathématique d'image. Le traitement d'images binaires comprend souvent des étapes de filtrage afin, par exemple, d'améliorer certaines caractéristiques de l'image, ou pour effectuer des opérations morphologiques sur l'image. Les filtres sont en général décrits mathématiquement par des matrices et l'application d'un filtre sur une image binaire est décrite par la multiplication de la matrice de filtre et de la matrice d'image binaire. Ce type d'opération peut être utilisé, par exemple dans la reconnaissance optique de caractères, comme une étape dans le traitement de l'image pour extraire les caractéristiques de l'image en vue de reconnaître un caractère optique.
Les systèmes de reconnaissance optique de caractères convertissent l'image du texte en code lisible par machine en utilisant un procédé de reconnaissance de caractères. Dans un système de ROC, les images de ce qui pourrait être des caractères sont isolées et un procédé de reconnaissance de caractères est utilisé pour identifier le caractère.
Un mode de réalisation de la présente invention concerne la reconnaissance optique de caractères en partant d'une image d'entrée représentant un caractère ou une autre forme. Dans un mode de réalisation préféré de la présente invention, la reconnaissance optique de caractères part d'une image d'entrée représentant un caractère asiatique. L'image d'entrée est, dans un mode de réalisation de l'invention, une image bicolore. Dans un mode de réalisation préféré de la présente invention, l'image d'entrée est une image en noir et blanc. Dans un mode de réalisation de la présente invention, l'image d'entrée est une image bidimensionnelle. Dans un mode de réalisation de la présente invention, l'image d'entrée représente une forme comprenant un caractère, un logo, une image ou un dessin, à reconnaître par le système de reconnaissance. Dans un autre mode de réalisation de la présente invention, la forme est une séquence sonore, une
BE2015/5241 séquence de film ou une forme tridimensionnelle, à reconnaître par le système de reconnaissance.
Un processus de reconnaissance optique de caractères 101 selon un mode de réalisation de l'invention représenté sur la figure 1 comprend:
• une étape de normalisation 103 qui génère une matrice normalisée 104 à partir d'une image d'entrée 102;
• une étape d'extraction 105 qui génère un vecteur de caractéristiques 106 à partir de la matrice normalisée 104; et • une étape de classification 107 qui calcule un meilleur modèle 109 pour l'image d'entrée 102 parmi une série de modèles 108 possibles. L'étape de classification 107 rend également une densité de probabilité 110 de chaque modèle, laquelle fournit une mesure de l'exactitude de l'étape de classification 107.
Dans l'étape de normalisation 103, l'image d'entrée 102 est subdivisée en pixels 201. Chaque pixel 201 de l'image d'entrée 102 est représenté par un élément 202 d'une matrice intermédiaire 203, comme illustré sur la figure 2. La matrice intermédiaire 203 est, dans un mode de réalisation de l'invention, une matrice binaire. La matrice intermédiaire 203 est soumise à une combinaison d'étapes qui peuvent comprendre une mise à l'échelle, un seuillage, un lissage, une interpolation, un filtrage,... Le produit de cette combinaison d'étapes est une matrice normalisée 104 qui correspond à une image normalisée 206. Dans un mode de réalisation de la présente invention, l'image normalisée 206 a un format prédéterminé et est centrée.
Chaque élément 207 de la matrice normalisée 104 correspond à un pixel 208 du format prédéterminé dans l'image normalisée 206.
BE2015/5241 .
Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice binaire qui correspond à une image normalisée 206 bicolore. Chaque élément de la matrice normalisée 104 est caractérisé par sa ligne x 204 et sa colonne y 205, ce qui correspond à un emplacement sur l'image normalisée 206. Dans un mode de réalisation de la présente invention, la matrice normalisée 104 est une matrice de 64x64. Dans un mode de réalisation de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est constant. Dans un mode de réalisation préféré de la présente invention, dans l'image normalisée 206, l'écart type de la distance par rapport au centre de la valeur représentant les pixels d'une couleur donnée est égal à 16 pixels. Dans un mode de réalisation de la présente invention, le rapport d'aspect hauteur / largeur de la forme ou du caractère est conservé pendant l'étape de normalisation 103.
L'étape d'extraction de caractéristiques 105 qui génère le vecteur de caractéristiques 106 à partir de la matrice normalisée 104 comprend une multiplication matrice - vecteur 304. Cela peut être expliqué en détails à l'aide de la figure 3. La matrice normalisée 104 de dimensions AxB est transformée en un vecteur d'image 301 de longueur A*B. Pendant cette transformation, chaque élément du vecteur d'image 301 est établi égal à un élément de la matrice normalisée 104 de sorte que tous les éléments de la matrice normalisée 104 sont copiés une fois seulement dans le vecteur d'image 301. Dans un mode de réalisation de la présente invention, le vecteur d'image 301 est un vecteur binaire. Le vecteur d'image 301 contient l'information de l'image normalisée 206. L'emplacement d'un élément de la ligne x 204 et de la colonne y 205 dans la matrice normalisée 104, c'est-àdire qui correspond à un emplacement dans l'image normalisée 206, correspond aussi à une valeur spécifique de l'indice j 302 qui indique le jème élément du vecteur d'image 301. Dans un mode de réalisation de la
BE2015/5241 présente invention, le vecteur d'image 301 a 4096 éléments et l'indice j peut prendre toutes les valeurs de nombre entier entre 1 et 4096. Cela correspond à une matrice normalisée 104 de 64x64 (64*64=4096).
Dans un mode de réalisation de la présente invention, la multiplication matrice - vecteur 304 est approximative et le vecteur de caractéristiques 106 est une approximation du résultat mathématique exact de la multiplication de matrice entre une matrice creuse 303 et le vecteur d'image 301. Un indice i 401 est utilisé pour spécifier le ième élément du vecteur de caractéristiques 106. L'adjectif creuse indique que la matrice est peuplée principalement de zéros dans un mode de réalisation de la présente invention.
La figure 4 décrit la génération, avec une fonction de Gabor 404, d'un élément 406 situé à la ligne i 401 et la colonne j 302 de la matrice creuse 303. Tous les éléments 406 de la matrice creuse 303 sont générés de la même façon. La fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne. La fonction de Gabor 404 a des paramètres 402, qui correspondent à l'indice i, et des variables x 204 et y 205, qui correspondent à l'indice j, comme entrées.
L'indice de ligne i 401 de l'élément 406 de matrice creuse à calculer spécifie les valeurs prises par les paramètres 402 utilisés dans la fonction de Gabor 404. Dans un mode de réalisation de la présente invention, les paramètres 402 sont représentés par les symboles a,, Oj, λ,, Cx et Cy:
• a, est un angle relatif à la direction de l'onde sinusoïdale plane de la fonction de Gabor 404;
• o, est l'écart type de la fonction gaussienne de la fonction de Gabor 404;
• λ, est la longueur d'onde de l'onde sinusoïdale plane de la fonction de Gabor 404;
BE2015/5241 • Οχ, est le centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction verticale; et • Gy, est Je centre de la fonction de Gabor 404 sur l'image normalisée 206, dans la direction horizontale.
Dans un mode de réalisation de l'invention, les paramètres sont choisis comme suit:
• Les valeurs Cxj sont régulièrement espacées.
• Si la distance entre deux valeurs Cx, est appelée dCx, le premier Cx,, Cxi est égal à dCx/2.
• Les valeurs Cy, sont régulièrement espacées.
• Si la distance entre deux valeurs Cy, est appelée dCy, le premier Cyb Cyi est égal à dCy/2.
• Les angles «i sontrégulièrement-espacés.
• La somme de la plus haute valeur de a, et de la plus basse valeur de a, est égale à n radians.
• Les valeurs de o, sont inférieures à dCx.
• Les valeurs de σ, sont supérieures à dCx/2.
• Les valeurs de o, sont inférieures à dCy.
• Les valeurs de oi sont supérieures à dCy/2.
• Dans un premier ensemble de valeurs d'au moins une valeur, les valeurs de λ, sont inférieures à dCx et à dCy.
• Les valeurs de λ, dans un deuxième ensemble d'au moins une valeur sont telles que les valeurs dans le premier ensemble de valeurs sont supérieures ou sensiblement égales à la moitié des valeurs dans le deuxième ensemble de valeurs.
Dans des modes de réalisation supplémentaires de l'invention, les paramètres remplissent une ou plusieurs des conditions suivantes:
• dCx et dCy sont égales entre elles.
BE2015/5241 • ex, prend cinq valeurs.
• Cy, prend cinq valeurs.
• ar prend six valeurs.
• ûj prend les valeurs 0, 0,523598, 1,0472, 1,5708, 2,09439 et 2,61799 radians.
• a, prend une valeur.
• λ, prend deux valeurs: Ai et A2· • λ! est inférieure à dCx.
• A-ι est inférieure à dCy.
• λ2 est supérieure à A1 et inférieure ou égale à 2*Ai.
Dans un mode de réalisation préféré d'une matrice normalisée 104 de 64x64, les positions Cx, sont 6, 18, 30, 42 et 54, les positions Cy, sont 6, 18, 30i ‘42>et 54, l'écart type σ, est 8; les longueurs d'onde A, sont 11 et 22. Les valeurs des paramètres dans un mode de réalisation de la présente invention sont repris dans le Tableau 1.
Le nombre d'ensembles de valeurs pour les paramètres 402 est égal à (nombre de valeur de Cx*nombre de valeurs de Cy*nombre de valeurs de a*nombre de valeurs de o*nombre de valeurs de A,). Dans un mode de réalisation préféré, le nombre d'ensembles de paramètres est égal à 300=5*5*6*1*2 et l'indice de ligne i 401 prend des valeurs de nombre entier de 1 à 300.
, L'indice de colonne j 302 de l'élément 406 de matrice creuse à calculer spécifie les valeurs des variables x 204 et y 205 utilisées par la fonction de Gabor 404.
La fonction de Gabor 404 est exprimée par:
BE2015/5241
2 π g[i,7x,y ] □ - α βχρ{λ/αϊ— [cosaL:x CXL+ sinaTy. Cy ; ] z π on u Λα □< □ Qa? + y □ cVrPP □--- j 7——}
αα le produit de la fonction de Gabor 404 calculée • à partir d'un ensemble donné de valeurs des paramètres 402 qui correspond à l'indice i 401, · à un endroit donné de la ligne x 204 et de la colonne y 205 de l'image normalisée 206 qui correspond à l'indice j 302 est l'élément 406 de la ligne i 401 et de la colonne j 302 dans la matrice creuse 303. Le nombre de colonnes de la matrice creuse 303 est égal au nombre d'éléments du vecteur d'image 301. Dans un mode de réalisation de la présente invention, la matrice creuse 303 est une matrice de 300x4096.
Dans un mode de réalisation de la présente invention, l'élément (i,j) 406 de la matrice creuse est donné par
-ν'--? 2 π MÜ D ô---Fi exP(---;---[cosatjnj □ Wo64 □ CXi π on u Λα + sinttijllj □ 1U/64 □ Cy^f] π Œj □ 1 _%64 □ + Œj □ 1Û/64 □ Cÿjî
O }
Le symbole % représente l'opération modulo et a le pas sur les opérations * et /, et le symbole H donne la partie entière du résultat d'une division entre nombres entiers et prend le pas sur les opérations * et /. Les paramètres ont les valeurs suivantes π
ααα □ □ 1c%nba * —— nbn
2(^)%mn φΠΠ----------maxWavelength
BE2015/5241 i □ 1
CÿnO stepSze//2 + stepSze * (—----—) % nbSteps
HDq * HDq
Qk □ stepSze/ / 2 + stepSze * □----—----%nbFeatures nba □ 6 nbD □ 2 maxWavelength □ 22 stepSize -12 nbSteps □ 5 nbFeatures = 300 σ □ 8.
nbSteps est tel que Cx, et Cy, sont inférieures ou égales à 64.
Une multiplication matrice - vecteur 304 est effectuée pour multiplier la matrice creuse 303 et le vecteur d'image 301, la matrice creuse 303 étant le premier facteur de la multiplication et le vecteur d'image 301 étant le deuxième facteur de la multiplication comme illustré sur la figure 5. Le vecteur résultant de la multiplication dé la matrice creuse 303 et du vecteur d'image 301 est le vecteur de caractéristiques 106. Le nombre d'éléments du vecteur de caractéristiques 106 est égal au nombre de lignes de la matrice creuse 303. Dans un mode de réalisation préféré de la présente invention, le nombre d'éléments du vecteur de caractéristiques 106 est égal à 300.
Dans un mode de réalisation de la présente invention, le vecteur de caractéristiques 106 contient des informations spécifiques à propos de l'image d'entrée 102, ces informations spécifiques concernant les caractéristiques d'image importantes en vue de la reconnaissance de formes. Le choix de paramètres, et en particulier le fait que, dans un mode de réalisation de la présente invention, l'écart type de la fonction gaussienne de la fonction de Gabor est inférieur à la distance entre deux centres adjacents mais supérieur à la moitié de la distance entre deux centres
BE2015/5241 adjacents rend l'information contenue dans le vecteur de caractéristiques 106 légèrement redondante. La redondance de l'information dans le vecteur de caractéristiques 106 augmente l'exactitude de l'étape de classification 107.
La multiplication de matrice entre la matrice creuse 303 et le vecteur d'image 301 ayant pour résultat le vecteur de caractéristiques 106 est montrée sur la figure 5a. Les éléments de la matrice creuse 303 sont appelés Mij. i est l'indice qui donne le numéro de ligne et prend toutes les valeurs de nombre entier entre 1 et m. j est l'indice qui donne le numéro de colonne et prend toutes les valeurs de nombre entier entre 1 et n. Le vecteur d'image 301 a une colonne de n éléments appelés vj. Le vecteur de caractéristiques 106 a une colonne de m éléments appelés ri. La multiplication de matrice est telle que les éléments ri du vecteur de caractéristiques 106 sont calculés comme ri □ Zr= Mijvj (Équation 1)
Certains termes peuvent être négligés dans la somme de l'Équation 1. Par exemple, les termes Mij vj où vj est égal à zéro sont également égaux à 0. En outre, dans le cas où vj est égal à 1, et où l'élément Mij de la matrice creuse 303 est petit, le terme Mij vj peut également être négligé. Pour contrôler petit, une matrice de seuil 501 avec des éléments Tij, montrée sur la figure 5b, est utilisée dans un mode de réalisation de la présente invention. Dans un mode de réalisation de la présente invention, un terme Mij vj peut être négligé si Mij est inférieur à Tij. Dans un mode de réalisation supplémentaire de la présente invention, tous les éléments Tij de la matrice de seuil 501 ont la même valeur. Étant donné que la fonction de Gabor 404 est une onde sinusoïdale plane multipliée par une fonction gaussienne, de nombreux éléments de la matrice creuse 303 sont très petits.
BE2015/5241
L'étape de classification 107 du processus de ROC 101 peut être décrite à l'aide de la figure 6. Dans un mode de réalisation de la présente invention, l'étape de classification 107 est une variation de la méthode de classifieur des plus proches voisins qui utilise la distance euclidienne pondérée où les poids sont différents pour chaque classe. L'étape de classification 107 utilise le vecteur de caractéristiques 106 et les modèles 108 comme entrées. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères, des groupes de caractères ou des caractères dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des caractères asiatiques, des groupes de caractères asiatiques ou des caractères asiatiques dans une famille de polices de caractères donnée. Dans un mode de réalisation de la présente invention, les modèles 108 correspondent à des séquences sonores, des séquences de film ou des formes tridimensionnelles.
Dans un mode de réalisation de la présente invention, un modèle 108 est défini par une matrice de covariance Σ et un vecteur de moyennes μ. Dans un mode de réalisation de la présente invention, tous les éléments non diagonaux de Σ sont réglés sur zéro. Dans un mode de réalisation de la présente invention, les matrices de covariance Σ sont multipliées par une constante (constante différente pour chaque modèle) de sorte que les traces des matrices de covariance Σ de tous les modèles sont égales. Dans un mode de réalisation de la présente invention, la matrice de covariance est approximée. Dans un mode de réalisation de la présente invention, Σ est une matrice de 300x300 et μ un vecteur de 300 éléments.
Pour sélectionner le modèle qui correspond le mieux à l'image d'entrée 102 correspondant au vecteur de caractéristiques 106, une densité de probabilité 110 est calculée, pour chaque modèle 108, comme
BE2015/5241 ptjDD exp OD □Do où le symbole r représente le vecteur de caractéristiques 106.
Le symbole | Σ| représente le déterminant de la matrice Σ et le t dans [J □ pff indique la transposition du vecteur U □ pD k est égal au nombre d'éléments du vecteur de caractéristiques 106. Dans un mode de réalisation de la présente invention, k est égal à 300. Le produit [J □ pdFΣΠ □ μΠ est une multiplication de matrice suivant les conventions mathématiques usuelles.
Une fois que la densité de probabilité 601 de chaque modèle 108 est calculée dans une étape de calcul 601, le meilleur modèle 109 est sélectionné dans une étape de sélection 602. Le meilleur modèle 109 est le modèle avec la plus haute densité de probabilité 110. Dans un mode de réalisation de la présente invention, l'étape de classification 107 rend le meilleur modèle 109 et la densité de probabilité 110 de chaque modèle, pour fournir une mesure de l'exactitude de l'étape de classification. Dans une variante de réalisation, l'étape de classification 107 rend seulement le meilleur modèle 109. Dans une variante de réalisation, l'étape de classification 107 rend seulement la densité de probabilité de chaque modèle 110.
Un mode de réalisation de la présente invention comprend la combinaison de
- l'étape d'extraction de caractéristiques 105 avec les paramètres 402 comme décrit ci-dessus, et
- l'étape de classification 107 basée sur des distances euclidiennes pondérées avec tous les éléments non diagonaux de la matrice de covariance Σ réglés sur zéro et les traces des matrices de covariance Σ de tous les modèles égales.
BE2015/5241
Un tel système de ROC permet la reconstruction d'image, peut être calculé efficacement et rend l'exactitude de la ROC extrêmement élevée.
BE2015/5241
Tableau 1
indice Έ5 % CX Cÿi
1 8 0,0454545 0 6 6
2 8 0,0454545 0,523598 6 6
3 8 0,0454545 1,0472 6 6
4 8 0,0454545 1,5708 6 6
5 8 0,0454545 2,09439 6 6
6 8 0,0454545 2,61799 6 6
7 8 0,0909091 0 6 6
8 8 0,0909091 0,523598 6 6
9 8 0,0909091 1,0472 6 6
10 8 0,0909091 1,5708 6 6
11 8 0,0909091 2,09439 6 6
12 8 0,0909091 2,61799 6 6
13 8 0,0454545 0 6 18
14 8 0,0454545 0,523598 6 18
15 8 0,0454545 1,0472 6 18
16 8 0,0454545 1,5708 6 18
17 8 0,0454545 2,09439 6 18
18 8 0,0454545 2,61799 6 18
19 8 0,0909091 0 6 18
20 8 0,0909091 0,523598 6 18
21 8 0,0909091 1,0472 6 18
22 8 0,0909091 1,5708 6 18
23 8 0,0909091 2,09439 6 18
24 8 0,0909091 2,61799 6 18
25 8 0,0454545 0 6 30
26 8 0,0454545 0,523598 6 30
27 8 0,0454545 1,0472 6 30
28 8 0,0454545 1,5708 6 30
29 8 0,0454545 2,09439 6 30
30 8 0,0454545 2,61799 6 30
31 8 0,0909091 0 6 30
32 8 0,0909091 0,523598 6 30
33 8 0,0909091 1,0472 6 30
34 8 0,0909091 1,5708 6 30
BE2015/5241
35 8 0,0909091 2,09439 6 30
36 8 0,0909091 2,61799 6 30
37 8 0,0454545 0 6 42
38 8 0,0454545 0,523598 6 42
39 8 0,0454545 1,0472 6 42
40 8 0,0454545 1,5708 6 42
41 8 0,0454545 2,09439 6 42
42 8 0,0454545 2,61799 6 42
43 8 0,0909091 0 6 42
44 8 0,0909091 0,523598 6 42
45 8 0,0909091 1,0472 6 42
46 8 0,0909091 1,5708 6 42
47 8 0,0909091 2,09439 6 42
48 8 0,0909091 2,61799 6 42
49 8 0,0454545 0 6 54
50 8 0,0454545 0,523598 6 54
51 8 0,0454545 1,0472 6 54
52 8 0,0454545 1,5708 6 54
53 8 0,0454545 2,09439 6 54
54 8 0,0454545 2,61799 6 54
55 8 0,0909091 0 6 54
56 8 0,0909091 0,523598 6 54
57 8 0,0909091 1,0472 6 54
58 8 0,0909091 1,5708 6 54
59 8 0,0909091 2,09439 6 54
60 8 0,0909091 2,61799 6 54
61 8 0,0454545 0 18 6
62 8 0,0454545 0,523598 18 6
63 8 0,0454545 1,0472 18 6
64 8 0,0454545 1,5708 18 6
65 8 0,0454545 2,09439 18 6
66 8 0,0454545 2,61799 18 6
67 8 0,0909091 0 18 6
68 8 0,0909091 0,523598 18 6
69 8 0,0909091 1,0472 18 6
70 8 0,0909091 1,5708 18 6
71 8 0,0909091 2,09439 18 6
72 8 0,0909091 2,61799 18 6
BE2015/5241
73 8 0,0454545 0 18 18
74 8 0,0454545 0,523598 18 18
75 8 0,0454545 1,0472 18 18
76 8 0,0454545 1,5708 18 18
77 8 0,0454545 2,09439 18 18
78 8 0,0454545 2,61799 18 18
79 8 0,0909091 0 18 18
80 8 0,0909091 0,523598 18 18
81 8 0,0909091 1,0472 18 18
82 8 0,0909091 1,5708 18 18
83 8 0,0909091 2,09439 18 18
84 8 0,0909091 2,61799 18 18
85 8 0,0454545 0 18 30
86 8 0,0454545 0,523598 18 30
87 8 0,0454545 1,0472 18 30
88 8 0,0454545 1,5708 18 30
89 8 0,0454545 2,09439 18 30
90 8 0,0454545 2,61799 18 30
91 8 0,0909091 0 18 30
92 8 0,0909091 0,523598 18 30
93 8 0,0909091 1,0472 18 30
94 8 0,0909091 1,5708 18 30
95 8 0,0909091 2,09439 18 30
96 8 0,0909091 2,61799 18 30
97 8 0,0454545 0 18 42
98 8 0,0454545 0,523598 18 42
99 8 0,0454545 1,0472 18 42
100 8 0,0454545 1,5708 18 42
101 8 0,0454545 2,09439 18 42
102 8 0,0454545 2,61799 18 42
103 8 0,0909091 0 18 42
104 8 0,0909091 0,523598 18 42
105 8 0,0909091 1,0472 18 42
106 8 0,0909091 1,5708 18 42
107 8 0,0909091 2,09439 18 42
108 8 0,0909091 2,61799 18 42
109 8 0,0454545 0 18 54
110 8 0,0454545 0,523598 18 54
BE2015/5241
111 8 0,0454545 1,0472 18 54
112 8 0,0454545 1,5708 18 54
113 8 0,0454545 2,09439 18 54
114 8 0,0454545 2,61799 18 54
115 8 0,0909091 0 18 54
116 8 0,0909091 0,523598 18 54
117 8 0,0909091 1,0472 18 54
118 8 0,0909091 1,5708 18 54
119 8 0,0909091 2,09439 18 54
120 8 0,0909091 2,61799 18 54
121 8 0,0454545 0 30 6
122 8 0,0454545 0,523598 30 6
123 8 0,0454545 1,0472 30 6
124 8 0,0454545 1,5708 30 6
125 8 0,0454545 2,09439 30 6
126 8 0,0454545 2,61799 30 6
127 8 0,0909091 0 30 6
128 8 0,0909091 0,523598 30 6
129 8 0,0909091 1,0472 30 6
130 8 0,0909091 1,5708 30 6
131 8 0,0909091 2,09439 30 6
132 8 0,0909091 2,61799 30 6
133 8 0,0454545 0 30 18
134 8 0,0454545 0,523598 30 18
135 8 0,0454545 1,0472 30 18
136 8 0,0454545 1,5708 30 18
137 8 0,0454545 2,09439 30 18
138 8 0,0454545 2,61799 30 18
139 8 0,0909091 0 30 18
140 8 0,0909091 0,523598 30 18
141 8 0,0909091 1,0472 30 18
142 8 0,0909091 1,5708 30 18
143 8 0,0909091 2,09439 30 18
144 8 0,0909091 2,61799 30 18
145 8 0,0454545 0 30 30
146 8 0,0454545 0,523598 30 30
147 8 0,0454545 1,0472 30 30
148 8 0,0454545 1,5708 30 30
BE2015/5241
149 8 0,0454545 2,09439 30 30
150 8 0,0454545 2,61799 30 30
151 8 0,0909091 0 30 30
152 8 0,0909091 0,523598 30 30
153 8 0,0909091 1,0472 30 30
154 8 0,0909091 1,5708 30 30
155 8 0,0909091 2,09439 30 30
156 8 0,0909091 2,61799 30 30
157 8 0,0454545 0 30 42
158 8 0,0454545 0,523598 30 42
159 8 0,0454545 1,0472 30 42
160 8 0,0454545 1,5708 30 42
161 8 0,0454545 2,09439 30 42
162 8 0,0454545 2,61799 30 42
163 8 0,0909091 0 30 42
164 8 0,0909091 0,523598 30 42
165 8 0,0909091 1,0472 30 42
166 8 0,0909091 1,5708 30 42
167 8 0,0909091 2,09439 30 42
168 8 0,0909091 2,61799 30 42
169 8 0,0454545 0 30 54
170 8 0,0454545 0,523598 30 54
171 8 0,0454545 1,0472 30 54
172 8 0,0454545 1,5708 30 54
173 8 0,0454545 2,09439 30 54
174 8 0,0454545 2,61799 30 54
175 8 0,0909091 0 30 54
176 8 0,0909091 0,523598 30 54
177 8 0,0909091 1,0472 30 54
178 8 0,0909091 1,5708 30 54
179 8 0,0909091 2,09439 30 54
180 8 0,0909091 2,61799 30 54
181 8 0,0454545 0 42 6
182 8 0,0454545 0,523598 42 6
183 8 0,0454545 1,0472 42 6
184 8 0,0454545 1,5708 42 6
185 8 0,0454545 2,09439 42 6
186 8 0,0454545 2,61799 42 6
BE2015/5241
187 8 0,0909091 0 42 6
188 8 0,0909091 0,523598 42 6
189 8 0,0909091 1,0472 42 6
190 8 0,0909091 1,5708 42 6
191 8 0,0909091 2,09439 42 6
192 8 0,0909091 2,61799 42 6
193 8 0,0454545 0 42 18
194 8 0,0454545 0,523598 42 18
195 8 0,0454545 1,0472 42 18
196 8 0,0454545 1,5708 42 18
197 8 0,0454545 2,09439 42 18
198 8 0,0454545 2,61799 42 18
199 8 0,0909091 0 42 18
200 8 0,0909091 0,523598 42 18
201 8 0,0909091 1,0472 42 18
202 8 0,0909091 1,5708 42 18
203 8 0,0909091 2,09439 42 18
204 8 0,0909091 2,61799 42 18
205 8 0,0454545 0 42 30
206 8 0,0454545 0,523598 42 30
207 8 0,0454545 1,0472 42 30
208 8 0,0454545 1,5708 42 30
209 8 0,0454545 2,09439 42 30
210 8 0,0454545 2,61799 42 30
211 8 0,0909091 0 42 30
212 8 0,0909091 0,523598 42 30
213 8 0,0909091 1,0472 42 30
214 8 0,0909091 1,5708 42 30
215 8 0,0909091 2,09439 42 30
216 8 0,0909091 2,61799 42 30
217 8 0,0454545 0 42 42
218 8 0,0454545 0,523598 42 42
219 8 0,0454545 1,0472 42 42
220 8 0,0454545 1,5708 42 42
221 8 0,0454545 2,09439 42 42
222 8 0,0454545 2,61799 42 42
223 8 0,0909091 0 42 42
224 8 0,0909091 0,523598 42 42
BE2015/5241
225 8 0,0909091 1,0472 42 42
226 8 0,0909091 1,5708 42 42
227 8 0,0909091 2,09439 42 42
228 8 0,0909091 2,61799 42 42
229 8 0,0454545 0 42 54
230 8 0,0454545 0,523598 42 54
231 8 0,0454545 1,0472 42 54
232 8 0,0454545 1,5708 42 54
233 8 0,0454545 2,09439 42 54
234 8 0,0454545 2,61799 42 54
235 8 0,0909091 0 42 54
236 8 0,0909091 0,523598 42 54
237 8 0,0909091 1,0472 42 54
238 8 0,0909091 1,5708 42 54
239 8 0,0909091 2,09439 42 54
240 8 0,0909091 2,61799 42 54
241 8 0,0454545 0 54 6
242 8 0,0454545 0,523598 54 6
243 8 0,0454545 1,0472 54 6 .
244 8 0,0454545 1,5708 54 6
245 8 0,0454545 2,09439 54 6
246 8 0,0454545 2,61799 54 6
247 8 0,0909091 0 54 6
248 8 0,0909091 0,523598 54 6
249 8 0,0909091 1,0472 54 6
250 8 0,0909091 1,5708 54 6
251 8 0,0909091 2,09439 54 6
252 8 0,0909091 2,61799 54 6
253 8 0,0454545 0 54 18
254 8 0,0454545 0,523598 54 18
255 8 0,0454545 1,0472 54 18
256 8 0,0454545 1,5708 54 18
257 8 0,0454545 2,09439 54 18
258 8 0,0454545 2,61799 54 18
259 8 0,0909091 0 54 18
260 8 0,0909091 0,523598 54 18
261 8 0,0909091 1,0472 54 18
262 8 0,0909091 1,5708 54 18
BE2015/5241
263 8 0,0909091 2,09439 54 18
264 8 0,0909091 2,61799 54 18
265 8 0,0454545 0 54 30
266 8 0,0454545 0,523598 54 30
267 8 0,0454545 1,0472 54 30
268 8 0,0454545 1,5708 54 30
269 8 0,0454545 2,09439 54 30
270 8 0,0454545 2,61799 54 30
271 8 0,0909091 0 54 30
272 8 0,0909091 0,523598 54 30
273 8 0,0909091 1,0472 54 30
274 8 0,0909091 1,5708 54 30
275 8 0,0909091 2,09439 54 30
276 8 0,0909091 2,61799 54 30
277 8 0,0454545 0 54 42
278 8 0,0454545 0,523598 54 42
279 8 0,0454545 1,0472 54 42
280 8 0,0454545 1,5708 54 42
281 8 0,0454545 2,09439 54 42
282 8 0,0454545 2,61799 54 42
283 8 0,0909091 0 54 42
284 8 0,0909091 0,523598 54 42
285 8 0,0909091 1,0472 54 42
286 8 0,0909091 1,5708 54 42
287 8 0,0909091 2,09439 54 42
288 8 0,0909091 2,61799 54 42
289 8 0,0454545 0 54 54
290 8 0,0454545 0,523598 54 54
291 8 0,0454545 1,0472 54 54
292 8 0,0454545 1,5708 54 54
293 8 0,0454545 2,09439 54 54
294 8 0,0454545 2,61799 54 54
295 8 0,0909091 0 54 54
296 8 0,0909091 0,523598 54 54
297 8 0,0909091 1,0472 54 54
298 8 0,0909091 1,5708 54 54
299 8 0,0909091 2,09439 54 54
300 8 0,0909091 2,61799 54 54
BE2015/5241

Claims (6)

  1. REVENDICATIONS:
    1. Procédé pour identifier une forme dans une image d'entrée, comprenant les étapes consistant à
    a) normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
    b) générer un vecteur d'image à partir de la matrice normalisée,
    c) multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
    d) créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
    e) sélectionner le modèle avec la densité de probabilité la plus élevée comme le meilleur modèle, et
    f) classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde
    BE2015/5241 dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
  2. 2. Procédé selon la revendication 1, dans lequel tous les éléments non diagonaux sont zéro.
  3. 3. Procédé selon la revendication 1, dans lequel le paramètre relatif à la direction de l'onde sinusoïdale est un angle.
  4. 4. Procédé selon la revendication 1, avec au moins deux paramètres relatifs à un centre de la fonction de Gabor, dans lequel les paramètres relatifs à un centre de la fonction de Gabor sont tels que les centres de la fonction de Gabor sont régulièrement espacés.
    BE2015/5241
  5. 5. Procédé selon la revendication 1, dans lequel le vecteur de caractéristiques est approximé.
  6. 6. Produit de programme informatique comprenant un support non transitoire lisible par ordinateur dans lequel est stocké une logique de commande pour amener un dispositif informatique à identifier une forme dans une image d'entrée, la logique de commande comprenant:
    a) des premiers moyens de code de programme lisible par ordinateur pour normaliser l'image d'entrée en une matrice normalisée représentant une image normalisée,
    b) des deuxièmes moyens de code de programme lisible par ordinateur pour générer un vecteur d'image à partir de la matrice normalisée,
    c) des troisièmes moyens de code de programme lisible par ordinateur pour multiplier le vecteur d'image avec une matrice creuse en utilisant une multiplication matrice - vecteur pour générer un vecteur de caractéristiques, la matrice creuse (303) étant générée à partir d'une fonction de Gabor qui est une onde sinusoïdale multipliée par une fonction gaussienne et la fonction de Gabor étant une fonction d'au moins une variable indiquant une position dans la matrice normalisée et d'un ensemble de paramètres comprenant un paramètre relatif la direction de l'onde sinusoïdale, un paramètre relatif à un centre de la fonction de Gabor et un paramètre relatif à une longueur d'onde de l'onde sinusoïdale,
    d) des quatrièmes moyens de code de programme lisible par ordinateur pour créer avec le vecteur de caractéristiques une densité de probabilité pour une liste prédéterminée de modèles,
    BE2015/5241
    e) des cinquièmes moyens de code de programme lisible par ordinateur pour sélectionner le modèle avec la plus haute densité de probabilité comme le meilleur modèle, et
    f) des sixièmes moyens de code de programme lisible par ordinateur pour classifier le meilleur modèle comme la forme de l'image d'entrée, dans lequel il y a au moins deux centres de la fonction de Gabor, et dans lequel la longueur d'onde prend au moins deux valeurs, avec une première valeur de longueur d'onde inférieure ou sensiblement égale à la distance entre deux centres adjacents de la fonction de Gabor, et la première valeur de longueur d'onde est inférieure à une deuxième valeur de longueur d'onde et supérieure ou sensiblement égale à la moitié de la deuxième valeur de longueur d'onde dans lequel les modèles sont caractérisés par une matrice de covariance et par un vecteur de moyennes, et dans lequel la densité de probabilité est calculée par la formule où le symbole r représente le vecteur de caractéristiques, le symbole Σ représente la matrice de covariance, le symbole μ représente le vecteur de moyennes et k est égal au nombre d'éléments du vecteur de caractéristiques, dans lequel l'ensemble de paramètres de la fonction de Gabor comprend l'écart type de la fonction gaussienne qui prend des valeurs inférieures à la distance entre deux centres adjacents de la fonction de Gabor et supérieures à la moitié de la distance entre deux centres adjacents de la fonction de Gabor.
BE2015/5241A 2014-04-16 2015-04-15 Système et procédé de reconnaissance de formes utilisant des fonctions de gabor BE1025502B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/254,039 US9058517B1 (en) 2014-04-16 2014-04-16 Pattern recognition system and method using Gabor functions
US14254039 2014-04-16

Publications (2)

Publication Number Publication Date
BE1025502A1 true BE1025502A1 (fr) 2019-03-20
BE1025502B1 BE1025502B1 (fr) 2019-03-27

Family

ID=53039857

Family Applications (1)

Application Number Title Priority Date Filing Date
BE2015/5241A BE1025502B1 (fr) 2014-04-16 2015-04-15 Système et procédé de reconnaissance de formes utilisant des fonctions de gabor

Country Status (6)

Country Link
US (1) US9058517B1 (fr)
JP (1) JP6609267B2 (fr)
KR (1) KR102268174B1 (fr)
CN (1) CN106462773B (fr)
BE (1) BE1025502B1 (fr)
WO (1) WO2015158778A1 (fr)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102055355B1 (ko) * 2015-01-28 2019-12-12 구글 엘엘씨 배치 정규화 레이어들
CN107133622B (zh) * 2016-02-29 2022-08-26 阿里巴巴集团控股有限公司 一种单词的分割方法和装置
JP6545740B2 (ja) * 2017-03-08 2019-07-17 株式会社東芝 生成装置、プログラム、認識システムおよび生成方法
CN108304885A (zh) * 2018-02-28 2018-07-20 宜宾学院 一种Gabor小波CNN图像分类方法
CN108629297A (zh) * 2018-04-19 2018-10-09 北京理工大学 一种基于空域自然场景统计的遥感图像云检测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4159794B2 (ja) * 2001-05-02 2008-10-01 本田技研工業株式会社 画像処理装置及び方法
JP4161659B2 (ja) * 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
CN1459761B (zh) * 2002-05-24 2010-04-21 清华大学 基于Gabor滤波器组的字符识别技术
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置
SG121783A1 (en) * 2003-07-29 2006-05-26 Sony Corp Techniques and systems for embedding and detectingwatermarks in digital data
US8509538B2 (en) * 2007-12-20 2013-08-13 Intel Corporation Method and apparatus for obtaining and processing Gabor image features
US8391613B2 (en) * 2009-06-30 2013-03-05 Oracle America, Inc. Statistical online character recognition
CN101866421B (zh) * 2010-01-08 2013-05-01 苏州市职业大学 基于离散度约束非负稀疏编码的自然图像特征提取方法
CN102915436B (zh) * 2012-10-25 2015-04-15 北京邮电大学 基于类内变化字典和训练图像的稀疏表示人脸识别方法

Also Published As

Publication number Publication date
KR102268174B1 (ko) 2021-06-24
KR20160148563A (ko) 2016-12-26
CN106462773A (zh) 2017-02-22
JP2017515221A (ja) 2017-06-08
CN106462773B (zh) 2019-07-12
JP6609267B2 (ja) 2019-11-20
US9058517B1 (en) 2015-06-16
BE1025502B1 (fr) 2019-03-27
WO2015158778A1 (fr) 2015-10-22

Similar Documents

Publication Publication Date Title
BE1025504B1 (fr) Système de reconnaissance de formes
US11657602B2 (en) Font identification from imagery
BE1025502B1 (fr) Système et procédé de reconnaissance de formes utilisant des fonctions de gabor
Marra et al. Blind PRNU-based image clustering for source identification
BE1022562A9 (fr) Procédé de reconnaissance optique de caractères
BE1022636B1 (fr) Procede et methode de correction de distorsions projectives avec des etapes d&#39;elimination a des multiples niveaux
BE1022630B1 (fr) Procédé et système pour déterminer des candidats points de fuite pour la correction projective
BE1024194B1 (fr) Procédé d&#39;indentification d&#39;un caractère dans une image numérique
BE1025503B1 (fr) Procede de segmentation de ligne
FR3016066A1 (fr) Systeme et procede de ponderation pour une mise en commun de descripteurs d&#39;image
FR2884007A1 (fr) Procede d&#39;identification de visages a partir d&#39;images de visage, dispositif et programme d&#39;ordinateur correspondants
CN112597918B (zh) 文本检测方法及装置、电子设备、存储介质
BE1022635B1 (fr) Procede et systeme de correction de distorsions projectives utilisant des points propres
FR3081244A1 (fr) Procede de reconnaissance de caracteres
EP2839410B1 (fr) Procédé de reconnaissance d&#39;un contexte visuel d&#39;une image et dispositif correspondant
FR3081245A1 (fr) Procede de reconnaissance de caracteres
Pan et al. A two-stage network for image deblurring
FR3069087B1 (fr) Procede de traitement d&#39;une image
BE1021013B1 (fr) Procede et systeme pour ameliorer la qualite d&#39;images en couleur.
BE1020588A5 (fr) Procede de reconnaissance de formes, produit de programme d&#39;ordinateur et terminal mobile.
Abdelaziz et al. Enhancement for License Plate Recognition using Image Super Resolution technique
WO2012107696A1 (fr) Procédés, dispositif et programmes d&#39;ordinateur pour la reconnaissance de formes, en temps réel, à l&#39;aide d&#39;un appareil comprenant des ressources limitées
WO2019115324A1 (fr) Procede de synthese d&#39;images
FR3112228A1 (fr) Dispositif et procédé pour générer un masque de la silhouette du profil d’une structure
EP2856391B1 (fr) Procédé de détection d&#39;ombres portées sur une image initiale

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20190327