FR2794560A1 - Procede d'aide a la lecture notamment pour malvoyant - Google Patents

Procede d'aide a la lecture notamment pour malvoyant Download PDF

Info

Publication number
FR2794560A1
FR2794560A1 FR9906880A FR9906880A FR2794560A1 FR 2794560 A1 FR2794560 A1 FR 2794560A1 FR 9906880 A FR9906880 A FR 9906880A FR 9906880 A FR9906880 A FR 9906880A FR 2794560 A1 FR2794560 A1 FR 2794560A1
Authority
FR
France
Prior art keywords
image
block
blocks
text
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9906880A
Other languages
English (en)
Other versions
FR2794560B1 (fr
Inventor
Eric Cosson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Priority to FR9906880A priority Critical patent/FR2794560B1/fr
Publication of FR2794560A1 publication Critical patent/FR2794560A1/fr
Application granted granted Critical
Publication of FR2794560B1 publication Critical patent/FR2794560B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/001Teaching or communicating with blind persons
    • G09B21/008Teaching or communicating with blind persons using visual presentation of the information for the partially sighted
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

La présente invention concerne les procédés d'aide à la vision. Elle s'applique notamment à l'aide à la lecture pour malvoyant.L'invention propose un procédé d'assistance à la lecture utilisant un écran de visualisation et un capteur d'image haute résolution faisant une acquisition d'une image numérisée haute résolution d'une image réelle affichée sur un support, réalisant une image synthétique correspondant à une découpe de l'image numérisée en blocs de texte et/ ou graphique, réalisant un traitement de l'image numérisée corrigeant les éventuels défauts de l'image et les éventuels défauts dus à la forme du support, affichant sur l'écran l'image numérisée et/ ou l'image synthétique. En cas de sélection par l'utilisateur d'un bloc de texte de l'image synthétique, le procédé augmente la taille des caractères du texte du bloc sélectionné, et/ ou gère le retour ligne et le défilement automatique pour la lecture. En cas de sélection d'un bloc graphique, le procédé agrandit la zone graphique du bloc sélectionné, et/ ou permet à l'utilisateur de se déplacer dans la zone graphique du bloc sélectionné.

Description

La présente invention concerne les procédés d'aide<B>à</B> la vision. L'utilisateur de l'invention est notamment et non exclusivement un amblyope. L'invention permet une aide<B>à</B> la vision de près. Elle s'applique notamment<B>à</B> l'aide<B>à</B> la lecture pour malvoyant.
Les dispositifs d'aide<B>à</B> la lecture connus peuvent être classés en deux familles<B>:</B> les télé agrandisseurs et les machines<B>à</B> lire.
Un télé agrandisseur ou vidéo agrandisseur comporte une caméra analogique et un écran. Le zoom optique de la caméra permet d'afficher sur l'écran une partie d'un document sous un format supérieur<B>à</B> celui de l'original. Cette visualisation agrandie peut permettre<B>à</B> un malvoyant de lire la partie affichée sur l'écran. Un tel dispositif nécessite de déplacer le document<B>à</B> lire ou<B>à</B> visualiser sous le capteur d'acquisition d'image, pour poursuivre la lecture le long de la ligne imprimée ou manuscrite, puis le long de la ligne suivante. La recherche du début de la ligne suivante est difficile et demande une attention soutenue et un geste précis, notamment lorsque l'agrandissement est fort. Ce dispositif présente l'inconvénient de fatiguer l'utilisateur.
Une machine<B>à</B> lire permet d'éviter le déplacement physique du texte<B>à</B> lire. Elle comporte un scanner pour l'acquisition de texte qui est asssocié <B>à</B> une synthèse vocale restituant le texte<B>à</B> lire. La restitution peut également s'effectuer sur un périphérique pour non voyant comme une cellule braille. La machine traite du texte affiché sur un support plan, généralement une feuille de dimensions standard. Elle ne permet pas la lecture de livres, ni celle d'indications portées sur des objets de surface quelconque.
L'invention propose une autre aide<B>à</B> la lecture assurant une restitution agrandie et corrigée d'un document original en supprimant la manipulation du document. Son but est de réduire la fatigue de l'utilisateur.
L'invention propose un procédé d'assistance<B>à</B> la lecture, utilisant un écran de visualisation et un capteur d'image haute résolution caractérisé en ce qu'il consiste<B>à</B> acquérir une image numérisée haute résolution d'une image réelle affichée sur un support, <B>-</B> former une image synthétique correspondant<B>à</B> une découpe de l'image numérisée en blocs de texte et/ou graphique, <B>-</B> réaliser un traitement de l'image numérisée corrigeant les éventuels défauts de l'image et les éventuels défauts dus<B>à</B> la forme du support de l'image réelle, <B>-</B> afficher sur l'écran l'image numérisée et/ou l'image synthétique, <B>-</B> en cas de sélection par un utilisateur d'un bloc de texte de l'image synthétique: <B>-</B> augmenter la taille des caractères du texte du bloc sélectionné, <B>-</B> et/ou gérer le retour ligne et le défilement automatique pour la lecture, <B>-</B> en cas de sélection par un utilisateur d'un bloc graphique <B>-</B> agrandir la zone graphique du bloc sélectionné, <B>-</B> et/ou permettre<B>à</B> l'utilisateur de se déplacer dans la zone graphique du bloc s électionné.
L'invention analyse la structure de l'image réelle affichée sur son support, elle assure une découpe automatique de l'image en blocs et classifie chaque bloc en un bloc de texte ou un bloc graphique.
Le procédé réalise de préférence un traitement de l'image numérisée corrigeant les éventuels défauts de l'image et les éventuels défauts dus<B>à</B> la forme du support de l'image réelle.<B>Il</B> permet par exemple de lire des pages reliées en livre ou des indications portées sur des emballages, L'invention permet une utilisation efficace d'un outil de reconnaissance de caractères sur un bloc de texte. L'outil est de préférence un logiciel d'OCR (abréviation de l'expression anglo-saxonne<B> </B> Optical Character Recognition <B> </B> signifiant reconnaissance de caractères) vendu dans le commerce. Un tel outil ne fonctionne pas correctement s'il est appliqué directement sur l'image numérisée, même si celle-ci présente une haute définition, il demande une intervention importante de l'utilisateur l'invention permet d'éviter cette intervention de l'utilisateur.
L'invention présente l'avantage d'aider<B>à</B> la lecture d'un texte par agrandissement et remise en forme automatique d'un bloc de texte sélectionné. Le procédé peut également comporter une étape optionnelle de synthèse vocale pour réaliser une lecture automatique d'un bloc de texte sélectionné.
Le procédé selon l'invention présente aussi l'avantage de permettre la connexion<B>à</B> un système bureautique dont l'affichage n'est généralement pas adapté<B>à</B> une exploitation par un utilisateur malvoyant. La mise en #uvre du procédé de l'invention permet<B>à</B> l'utilisateur malvoyant de lire mais également de valider un choix ou de saisir des données sur un tel système bureautique.
La présentation d'un bloc de texte ou graphique classifié par le procédé peut être modifiée pour en faciliter la perception par l'utilisateur malvoyant, ainsi<B>à</B> titre d'exemples non limitatifs, la couleur peut être adaptée aux défauts de vision de l'utilisateur, les contours peuvent être renforcés, le contraste peut être amélioré.
D'autres caractéristiques et avantages de l'invention apparaîtront <B>à</B> la lecture de la description détaillée suivante présentée<B>à</B> titre d'illustration non limitative et faite en référence aux figures annexées suivantes dans les quelles une même référence correspond<B>à</B> un même élément de la description<B>:</B> <B>-</B> la figure<B>1</B> illustre les étapes principales du procédé selon l'invention<B>;</B> <B>-</B> la figure 2 représente des histogrammes d'une image numérisée, la figure 2.a est un histogramme d'origine, la figure<B>2.b</B> est un histogramme lissé et la figure 2.c est un histogramme lissé d'une image avec une courbure <B>-</B> la figure <B>3</B> représente un ruban et son profil <B>,</B> <B>-</B> la figure 4 illustre la fusion de deux blocs<B>;</B> <B>-</B> la figure<B>5</B> représente des recollements dans une page; <B>-</B> la figure<B>6</B> représente trois cas de recollement, 6.a, <B>6.b</B> et 6.c, avec des entêtes de page<B>-,</B> <B>-</B> la figure<B>7</B> représente en Ta une découpe en blocs sur une page et en<B>7.b</B> son arbre associé<B>;</B> <B>-</B> la figure<B>8</B> représente des points voisins du filtrage spécial.
La figure<B>1</B> représente les étapes principales du procédé selon l'invention. La première étape principale du procédé consiste<B>à</B> acquérir une image numérisée haute définition d'un objet comme par exemple une ou plusieurs pages d'un livre, une page d'une revue, une image pouvant comporter du texte sur un support non plan.
Pour réaliser cette étape, on utilise de préférence un scanner haute définition. La résolution est d'au moins<B>150</B> ppp (pixel par pouce) pour la découpe en blocs et de plus de<B>300</B> ppp, avec de préférence une valeur supérieure<B>à 600</B> ppp pour les autres traitements. L'utilisation d'une même résolution élevée pour tous les traitements est possible. L'utilisation d'une résolution réduite pour la découpe en bloc présente l'avantage de réduire le temps global de calcul lors de l'exécution du procédé sans dégrader les performances.
Le procédé peut aussi utiliser un capteur matriciel comme un appareil photographique numérique ou une caméra numérique, situé<B>à</B> une distance inférieure<B>à</B> un mètre du support de l'image réelle, L'image numérisée est acquise une seule fois<B>à</B> partir de l'image réelle, quelle que soit la zone de l'image explorée ultérieurement par l'utilisateur. Après numérisation le support de l'image réelle n'est plus nécessaire, il n'est pas manipulé lors des lectures.
Cette première étape principale peut être réalisée de manière anticipée. On peut appliquer les étapes suivantes du procédé sur une image <B>déjà</B> numérisée avec une définition suffisante.
L'image est par exemple numérisée en niveaux de gris.
De préférence, le procédé réalise une détection de l'inclinaison de l'image et effectue un redressement de l'image.
Une seconde étape principale du procédé consiste<B>à</B> réaliser une image synthétique.
<B>A</B> partir d'une image numérisée, par exemple en niveaux de gris, le procédé réalise une image binaire par seuillage, avec recherche automatique du seuil puis une découpe en blocs complétée par une classification des blocs trouvés afin de permettre la séparation des zones contenant du texte des zones d'image contenant des informations graphiques, ou assimilées<B>à</B> des informations graphiques.
Dans cette classification, les titres sont assimilés<B>à</B> des zones graphiques, les libellés d'un schéma sont considérés globalement avec le schéma comme une zone graphique. Une zone de texte correspond<B>à</B> une partie de colonne ne contenant que du texte.
L'image synthétique correspond<B>à</B> l'ensemble des blocs classifiés. Dans une troisième étape principale du procédé, l'image numérisée subit un traitement numérique visant<B>à</B> corriger les éventuels défauts de l'image et notamment des défauts dus<B>à</B> la forme du support de l'image réelle originale.
De préférence, une rebinarisation de l'image numérisée de la première étape principale est effectuée<B>à</B> l'aide de l'image synthétique<B>:</B> un nouveau seuillage automatique est effectué de façon indépendante sur chaque bloc texte.
Si un mode spécial livre est activé, la troisième étape principale effectue un filtrage spécial de préférence sur les zones d'ombres dues au support. Le mode spécial livre est de préférence activé<B>à</B> la demande de l'utilisateur<B>;</B> cela permet de n'effectuer les traitements de ce mode que sur un document pour lesquels ils sont vraiment utiles En particulier l'activation<B>à</B> la demande permet de traiter une photocopie d'une page de livre épais comportant effectivement une ombre due<B>à</B> la courbure du livre près de la reliure, alors que la photocopie elle-même est un document plan. Dans une variante, le procédé peut comporter des capteurs de planéité du document<B>à</B> lire, et activer le mode spécial livre en fonction des mesures de ces capteurs.
Dans une quatrième étape, l'image synthétique est par exemple représentée sur un écran de visualisation par les contours des différents blocs. Chaque contour peut être rempli par une surface de couleur uniforme, ou par un graphisme particulier permettant<B>à</B> l'utilisateur malvoyant de percevoir facilement sur l'écran de visualisation où se situent les différents blocs sur l'image réelle, et leur classification (texte ou graphique).
Le procédé d'aide<B>à</B> la lecture utilise un support de visualisation, de préférence un écran de visualisation. L'écran de visualisation est connecté<B>à</B> des moyens pour sélectionner des zones affichées sur l'écran. Dans une cinquième étape du procédé, ces moyens de sélection permettent <B>à</B> l'utilisateur de déplacer un curseur (visible ou invisible) sur l'écran et de désigner la zone de l'écran correspondant<B>à</B> la position du curseur. Ces moyens de sélection peuvent notamment comporter une souris de micro-ordinateur, un écran tactile, une boule roulante avec bouton de validation. Lorsque l'utilisateur désigne un bloc de texte, une sixième étape du procédé s'exécute, elle présente<B>à</B> l'utilisateur le résultat de la mise en #uvre d'un logiciel de reconnaissance de caractères. Le procédé peut effectuer cette mise en #uvre sur la désignation du bloc mais le procédé l'effectue de préférence en tâche de fond dès la réalisation de la troisième étape sur un bloc de texte. Le logiciel est de préférence un logiciel OCR du commerce.
Les étapes précédentes du procédé selon l'invention permettent de fournir en entrée du logiciel OCR des données adaptées<B>à</B> un fonctionnement performant<B>-</B> et notamment lorsque le support de l'image réelle originale n'est pas plan. Le logiciel OCR ainsi alimenté fonctionne automatiquement et fournit un texte ne nécessitant pas de corrections fastidieuses pour l'utilisateur. L'utilisateur malvoyant peut exploiter directement le texte obtenu en sortie du logiciel de reconnaissance de caractères.
Cette exploitation dans la sixième étape consiste par exemple en une présentation du texte sur l'écran de visualisation<B>à</B> l'aide d'une police<B>à</B> gros caractères dont la taille est adaptée<B>à</B> la déficience visuelle de l'utilisateur. De préférence, le défilement du texte<B>à</B> la ligne suivante est géré automatiquement ce qui permet de limiter la fatigue de l'utilisateur<B>à</B> la stricte lecture des mots. En option, le procédé peut comporter une étape de synthèse vocale supprimant l'effort de lecture, L'utilisateur peut,<B>à</B> la demande, revenir<B>à</B> la présentation de l'image synthétique.
Lorsque l'utilisateur désigne un bloc classifié comme un bloc graphique, un zoom sur la partie de l'image numérisée correspondant<B>à</B> ce bloc est réalisé dans une septième étape du procédé. Le zoom permet de présenter sur l'écran de visualisation un grossissement de bonne définition de l'image originale. De préférence, ce zoom est complété par un curseur manipulé par l'utilisateur pour se déplacer dans le bloc graphique désigné. Un exemple de réalisation des étapes principales du procédé est décrit ci-dessous.<B>Il</B> comprend quatre grandes parties.
<B>e</B> Une recherche du seuil optimal pour convertir l'image numérisée d'origine de la page en une image binaire<B>à</B> l'aide de la technique du seuillage global.
,@ Un traitement de découpe en bloc de l'image de la page et classifications des blocs trouvés<B>:</B> les différentes zones de la page sont détectées et séparées en blocs, puis classées suivant qu'il s'agit d'un bloc texte ou d'un bloc graphique.
<B>e</B> Un nouveau seuillage des zones de l'image numérisée d'origine qui correspondent aux blocs de texte trouvés par la découpe en blocs. Ce seuillage est plus adapté pour l'OCR que le seuillage global, et si une zone<B>à</B> l'intérieur d'un bloc de type texte est perturbée<B>à</B> cause de la courbure du support, un filtrage spécial adapté au problème de la courbure est appliqué sur cette dernière, <B>e</B> Un filtrage spécial adapté au problème de la courbure, afin de compenser les zones sombres dues<B>à</B> celle-ci, lorsque le document a été scanné alors qu'il n'était pas parfaitement en contact avec la vitre du scanner. C'est notamment le cas pour les livres, au niveau de la tranche.
Ces procédures s'effectuent soit sur des images numérisées en niveaux de gris<B>;</B> soit sur des images binaires.
Dans l'exemple ci-dessous, les valeurs numériques préférées correspondent<B>à</B> une réalisation particulièrement bien adaptée au traitement d'une page contenant du texte avec une police de caractères entre<B>8</B> et 12, avec une résolution de scanner de<B>150</B> ppp pour la découpe en blocs et de <B>600</B> ppp pour les autres traitements. Le procédé peut être optimisé pour une autre plage de police etlou une autre résolution en adaptant les valeurs prédéterminées.
L'image numérique initiale est filtrée par un filtre médian sur une matrice de quelques pixels, de préférence une matrice 3x3. En supprimant des pixels de bruit, cette étape permet de limiter l'influence du bruit.
En préliminaire, la méthode classique de seuillage par seuil global d'une image en niveaux de gris est rappelée ci-dessous. Si<B>f</B> est une image en niveaux de gris,<B>b</B> est l'image binaire<B>à</B> extraire de<B>f</B><I>et</I> T est le niveau de seuillage, alors l'image binaire<B>b</B> est calculée comme suit<B>:</B> Pour tout point P de coordonnées (x,y), si le niveau de grisf (x,y) du point P est supérieur au niveau de seuillage T, le point P est blanc dans l'image binaire, soit b(x,y) <B><I≥</I> 1 ;</B> si par contre le niveau de grisf (x,<B>y)</B> du point P est inférieur au niveau de seuillage T, le point P est noir dans l'image binaire, soit b(x,y) <B><I≥</I> 0.</B>
Dans l'étape de recherche automatique du seuil, le procédé détermine une valeur adéquate de seuil T pour extraire une image binaire de l'image numérisée en niveaux de gris par la méthode classique de seuillage par seuil global.
L'histogramme d'origine de l'image numérisée est représenté par exemple sur la figure 2.a avec les niveaux de gris en abscisse et le nombre de pixels de l'image numérisée correspondant<B>à</B> chaque niveau de gris en ordonnée. Dans cet exemple les niveaux de gris sont compris entre<B>0</B> pour le noir et<B>255</B> pour le blanc.
Une simple recherche de maximum global sur l'histogramme pour déterminer le seuil T conduirait généralement<B>à</B> un pic<B>28</B> dans la zone des pixels sombres qui correspond aux caractères imprimés en noir. Et le seuillage avec un tel seuil conduirait<B>à</B> supprimer toute l'information en fournissant une image binaire blanche. Sur l'exemple présenté sur la figure 2.a, le seuil adéquat Test aux environs du niveau<B>160.</B>
De préférence le procédé effectue d'abord une sous-étape consistant<B>à</B> lisser l'histogramme.<B>Il</B> remplace chaque valeur<B>à</B> l'indice n de l'histogramme par la valeur moyenne calculés sur les<B>11</B> indices autour de l'indice n.<I>Si</I> h est l'histoqramme d'origine et<B>1</B> l'histogramme lissé, alors
Figure img00080013

Cette sous-étape permet de supprimer des éventuelles irrégularités provenant de la conversion d'une image en couleur en niveaux de gris.
L'histogramme lissé<B>1</B> correspondant<B>à</B> l'histogramme de la figure 2.a est représenté sur la figure<B>2.b.</B> On<B>y</B> remarque un pic<B>30</B> dans les faibles niveaux de gris représentant une quantité de pixels très sombres, ce pic correspond aux pixels de l'image formant des caractères de texte. Une zone <B>31</B> assez stable de l'histogramme lissé correspond<B>à</B> des pixels sombres représentant des zones graphiques. Un pic<B>32</B> dans les niveaux de gris moyens, environ 140 sur l'exemple de la figure<B>2.b,</B> correspond<B>à</B> un fond moyennement clair. Ce pic<B>32</B> correspond par exemple<B>à</B> une zone graphique de l'image. Un pic<B>33</B> plus important dans les niveaux de gris plus élevés d'environ<B>190</B> sur la figure<B>2.b,</B> c'est-à-dire représentant des pixels plus clairs, correspond<B>à</B> la surface du fond clair prédominant sur l'image numérisée. Enfin un petit pic 34 représentant des pixels très clairs, dans des niveaux de gris d'environ 240 sur la figure<B>2.b,</B> correspond<B>à</B> une zone blanche sur l'image numérisée.
Pour déterminer le seuil adéquat T, le procédé exploite l'histogramme lissé, En partant des niveaux de gris élevés sur l'histogramme lissé, c'est-à-dire de la partie de l'histogramme correspondant aux pixels les plus clairs, le procédé explore les niveaux de gris décroissants jusqu'à trouver sur la courbe un point dont le nombre de pixels sur l'axe des ordonnées n, est supérieur<B>à</B> un nombre de pixels no dépendant de la résolution de scan et correspondant de préférence<B>à</B> un nombre moyen de pixels par niveau de gris. Une estimation du nombre moyen no est par exemple le nombre total de pixels de l'image numérique divisé par le nombre total de niveaux. Sur l'exemple de la figure<B>2.b</B> réalisé avec un scanner de résolution<B>300</B> ppp sur une page de format A4, la hauteur de la page correspond environ<B>à 1700</B> pixels, la largeur<B>à 1500</B> pixels, la numérisation étant effectuée avec environ<B>250</B> niveaux de gris, la valeur de no est d'environ 40000.
Ce premier test permet d'éliminer les éventuels petits pics vers le haut de l'histogramme, correspondant<B>à</B> des fonds plus clairs mais peu présents sur l'image comme par exemple le pic 34 de la figure 2.b.
Le procédé cherche ensuite le maximum en continuant<B>à</B> descendre les niveaux de gris tant que la pente sur la courbe de l'histogramme lissé est négative, il recule jusqu'à obtenir une pente nulle. Le procédé a alors trouvé un maximum local correspondant<B>à</B> un nombre de pixels<I>mi,</I> représenté sur la figure<B>2.b.</B> <B>A</B> partir du maximum local<I>mi,</I> le procédé préfère reculer sur la courbe de l'histogramme tant que le nombre de pixels est supérieur par exemple au tiers de la valeur ni,, représenté par<I>ni,<B>/</B></I><B> 3</B> sur la figure 2.b. Ensuite il cherche le pied, du côté des faibles niveaux de gris, du gros pic<B>33</B> supportant le maximum local<I>ml</I> en calculant la pente et en continuant<B>à</B> descendre la courbe suivant les niveaux de gris décroissants, jusqu'à que la pente soit faible, sa valeur est par exemple inférieure<B>à</B> l'unité<B>à 10 %</B> près. Le procédé détermine alors la valeur du seuil désiré T, égal au niveau de gris atteint dans la recherche par exploration décroissante. La valeur de niveau de gris sur l'exemple de la figure<B>2.b</B> est d'environ<B>160</B> sur l'axe des abscisses.
Le traitement ci-dessus permet au procédé de fournir un seuil dont la valeur n'est pas sensible<B>à</B> la présence éventuelle de maxima locaux rapprochés du maximal local ml détecté. Le procédé est robuste.
Si pendant la recherche, le procédé atteint un niveau de gris faible, inférieur<B>à</B> une valeur prédéterminée de seuil minimal, il considère que le seuil T n'est pas trouvé. La valeur prédéterminée de seuil minimal est de quelques pourcent du nombre total de niveaux de gris, de préférence entre<B>3</B> et<B>5 %.</B> Pour une numérisation en<B>256</B> niveaux de gris, la valeur est située entre<B>8</B> et 12, et de préférence égale<B>à 10.</B> Si le seuil n'est pas trouvé, le procédé fournit alors un seuil T de valeur prédéterminée Tp. La valeur Tp correspond de préférence<B>à</B> un niveau de gris moyen. Elle est par exemple égale<B>à 125</B> sur l'échelle niveaux de<B>0 à 255.</B>
Si le mode spécial livre est activé, la valeur de seuil prédéterminée est T., <B>.</B> Cette dernière valeur est de préférence entre<B>50</B> et<B>60</B> sur l'échelle de<B>0 à 255.</B> La valeur de Tpi permet au procédé lors de la binarisation d'éliminer la bosse due<B>à</B> la zone d'ombre de la courbure d'un livre, en limitant la perte d'information sur les zones graphiques. T., est de préférence égal<B>à 52.</B> La figure 2.c représente un exemple d'histogramme lissé d'une image avec courbure due au livre, la bosse due<B>à</B> la courbure<B>y</B> est représentée par le pic35, les zones graphiques<B>y</B> sont représentées par la zone<B>31.</B> Après la détermination automatique d'un seuil, le procédé effectue une binarisation par seuil global de l'image numérisée d'origine. Lors de la recherche automatique de seuil, le procédé estime le seuil Tjuste avant le pic le plus élevé dans la zone des pixels clairs. Ce seuil automatique T permet au procédé d'extraire une image binaire en éliminant le fond le plus clair qu'il considère comme blanc et en gardant le reste de l'information qu'il considère comme noire. Le fond clair est éliminé par le procédé même s'il n'est pas blanc, et notamment s'il est légèrement grisâtre après la numérisation.
La prise en compte par le procédé d'une valeur prédéterminée Tp respectivement Tpi de seuil minimal permet d'obtenir une image binaire de bonne qualité lorsqu'il<B>y</B> a des zones graphiques de surface importante sur l'image sans courbure, respectivement avec courbure du support.
Sur l'image binaire, les photos et dessins sont des blocs quasiment entièrement noirs.
Dans le cas où le mode spécial livre est activé, une contrainte supplémentaire est imposée par le procédé<B>à</B> la valeur de seuil automatique. Dans ce cas, le procédé continue la recherche du seuil si la valeur est trop élevée<B>;</B> c'est-à-dire<B>à</B> une valeur supérieure<B>à</B> un niveau de gris moyen, par exemple<B>125.</B>
Le procédé cherche, dans le sens des niveaux de gris décroissants, un niveau T,,,, correspondant<B>à</B> un maximum local suivi d'un niveau Tj,, correspondant<B>à</B> un minimum local, avec une contrainte sur les valeurs relatives de ces deux niveaux T,,,,-,, <I>et</I> T,,,,,,. La contrainte est de préférence la suivante: le niveau de gris du maximum est au moins deux fois plus élevé que celui du minimum.
Le procédé permet la détection d'un pic correspondant<B>à</B> la zone sombre due<B>à</B> la courbure du livre. La contrainte permet d'éviter des perturbations dues<B>à</B> d'éventuels petits extréma négligeables.
Le procédé détermine une valeur de seuil dans l'intervalle entre les deux niveaux T,,,,,, <I>et</I> T,,,,. Par exemple il calcule la valeur située aux 2/5' de l'intervalle<B>:</B> <I>T<B≥</B></I> T.i,, <B><I>+</I></B> (T,,,#,, <B><I>-</I></B> T.j.) La valeur choisie est inférieure au niveau T,,,,, avec lequel l'image binaire obtenue par seuillage serait dégradée et comporterait des pixels noirs sur quasiment toute la zone d'ombre due<B>à</B> la courbure. La valeur choisie est supérieure au niveau T,,,, avec lequel le seuillage ferait disparaître en blanc presque entièrement la zone d'ombre, ce qui présenterait l'inconvénient de faire également disparaître l'information de texte dans cette zone.
Si une zone graphique est présente sur la page, le pic du maximum risque d'être relativement inexistant. Si les seuils T,,,,., <I>et</I> T,,,,,. ne sont pas trouvés, la valeur du seuil automatique est fixée par le procédé<B>à</B> une valeur prédéterminée T., qui permet de réduire les phénomènes de bordure et de courbure tout en gardant le texte et les images. Cette valeur vaut par exemple<B>52.</B>
Après la détermination du seuil automatique dans le cas du mode spécial livre, le procédé, comme dans le cas normal, effectue une binarisation par seuil global de l'image numérisée d'origine.
La méthode spécial livre permet de conserver du texte présent sur la zone d'ombre due<B>à</B> la courbure du support dans l'image d'origine.
La recherche automatique permet au procédé de réaliser une seuillage automatique efficace sur des histogrammes qui varient, le procédé est robuste, il fournit une aide<B>à</B> la lecture de documents divers.<B>Il</B> permet une aide<B>à</B> la lecture qui n'est pas limitée<B>à</B> un format précis de texte imprimé.
Après la recherche automatique de seuil, le procédé effectue une découpe en blocs. Cette découpe en bloc, aussi appelée segmentation, s'applique sur une image binaire, de préférence celle obtenue<B>à</B> l'aide du seuil automatique. Cette segmentation a lieu en plusieurs sous-étapes. Une détermination des blocs dans des rubans est suivie d'un recollement des blocs rubans comportant une sous-étape de classification.
L'image binaire est d'abord découpée en rubans horizontaux réguliers, chacun d'une hauteur prédéterminée, valant environ l'espace entre deux paragraphes de texte. Cette hauteur correspond<B>à</B> quelques dizaines de pixels, elle vaut de préférence<B>60</B> pixels, ce qui correspond pour la définition de<B>150</B> ppp <B>à</B> environ une hauteur de<B>1</B> centimètre.
En projetant chaque ruban dans le sens de la verticale, le procédé détermine une courbe indiquant le profil du ruban. La figure<B>3</B> représente un ruban 40 et le profil 41 dans le sens vertical. Le ruban correspond<B>à</B> une bande horizontale de l'image binaire d'axe des abscisses horizontal qui et par exemple parallèle<B>à</B> la ligne supérieure de pixels de l'image binaire. La construction du profil, 41 sur la figure<B>3,</B> consiste<B>à</B> associer<B>à</B> chaque point de l'axe des abscisses 42, une ordonnée égale<B>à</B> la somme des valeurs des pixels du ruban de l'image binaire ayant cette abscisse. Sur une zone de texte ou de graphique, où il<B>y</B> a des points noirs, le niveau du profil est plus bas, par exemple la partie 43 sur la figure<B>3,</B> que sur une zone blanche entre deux zones foncées, par exemple la zone 44 de la figure<B>3.</B> Le procédé recherche sur le profil les zones suffisamment larges de hauts et de bas niveaux, et les changements trouvés correspondent<B>à</B> des changements de colonnes sur le ruban en question.
Pour cela le procédé utilise différents seuils de la manière suivante: <B>e</B> une zone blanche est retenue par le procédé si elle est plus large qu'une largeur prédéfinie correspondant<B>à</B> un premier seuil Lbl,,, <B><I>.</I></B> La valeur du seuil est supérieure<B>à</B> l'espacement moyen attendu entre deux mots. La valeur est par exemple de quelques dizaines de pixels et de préférence d'une vingtaine de pixels. Ce seuil permet d'éviter de pertuber la recherche des sauts de colonnes par les espaces blancs entre deux mots.
<B>e</B> une zone noire est retenue par le procédé si elle est plus large qu'une largeur donnée définissant un deuxième seuil L,,,i, <B>.</B> Ce seuil est de préférence de quelques pixels pour une résolution de<B>150</B> ppp. Ce seuil permet d'éviter des zones de bruit et des points solitaires.
<B>e</B> enfin un troisième seuil, Tb, détermine la proportion de points blancs existant sur une colonne de pixels extraite du ruban pour qu'au moment de la projection, le procédé considère cette colonne en majorité comme blanche ou comme noire. Par exemple la zone 45 de la figure<B>3</B> est une colonne noire et la zone 43 est une colonne blanche.
Si le mode spécial livre est activé, alors Tb est légèrement relevé car l'image binarisée dans ce mode avec un seuil bas est moins bruitée et il<B>y</B> a moins de pixels parasites sur les rubans. Cette augmentation du seuil permet de réduire les pertes d'information.
Ainsi, pour chaque ruban extrait de l'image, le procédé effectue les sous-étapes suivantes suivantes -. <B>e</B> le ruban est projeté verticalement afin d'obtenir la courbe du profil, <B>e à</B> l'aide du troisième seuil Tb, le procédé repère les colonnes du ruban qui sont considérées comme blanches et celles qui contiennent de l'information (texte ou graphique), e avec les deux premiers seuils, Lbl,,, <I>et</I> le procédé répertorie les zones blanches suffisamment larges qui sont considérées comme des vraies colonnes de séparation entre 2 entités.
Ce procédé permet de repérer les colonnes blanches servant de séparation entre les différentes entités de la page, en supposant que la couleur du fond de cette dernière est effectivement blanche. Ces colonnes blanches, supposées être suffisamment larges, sont distinguées des autres espaces blancs comme des espaces entre les mots.
Une fois que toute la page a été traitée, une liste de blocs est déterminée. Ces blocs ont tous la même hauteur, égale<B>à</B> celle d'un ruban, et ils indiquent où sont les zones contenant de l'information sur les différents rubans. Ce sont des blocs noirs.
Ensuite le procédé recolle les différents morceaux de rubans afin d'obtenir des vraies colonnes<B>:</B> en effet une colonne de texte par exemple est <B>à</B> ce stade segmentée en tranches superposées. Le recollement s'effectue en comparant les différents blocs trouvés.<B>Il</B> s'effectue en plusieurs sous- étapes, qui permettent au procédé de tenir compte de la structure du document.
Lorsque le procédé fusionne deux blocs, il fournit un bloc dont les dimensions correspondent aux limites les plus extérieures des deux blocs. La figure 4 illustre la fusion, rattachement ou rassemblement d'un premier bloc 46 et d'un second bloc 47 disjoint qui conduit au bloc 48 de surface rectangulaire minimale contenant les premier et second blocs 46, 47. Sur la figure 4, l'écart entre le contour du bloc fusion 48 et les limites des deux autres blocs n'est pas significatif.
Dans une étape préliminaire au recollement, le procédé parcourt la liste préalablement déterminée et élimine les blocs considérés comme petits. Le critère de sélection est la largeur du bloc, qui est inférieure<B>à</B> un seuil<B>c6</B> prédéterminé. Ce seuil<B>c6</B> est de préférence égal<B>à</B> une vingtaine de pixels pour la résolution de<B>150</B> ppp.
Les blocs éliminés correspondent<B>à</B> de l'information parasite comme par exemple des bouts de caractères, notamment venant des gros titres, des tous petits mots, comme par exemple un numéro de page ou un sigle isolé, des morceaux de bordures ou de cadres de tableaux<B>...</B>
Cette étape préliminaire conserve de préférence les blocs les plus larges, elle permet l'élimination de blocs dont la largeur est considérée comme faible, elle permet de réduire les perturbations lors des étapes ultérieures de recollement des blocs noirs des rubans. La liste de blocs<B>à</B> recoller en sortie de cette étape préliminaire est plus restreinte que celle en entrée.
L'étape préliminaire est suivie par une étape<B>1</B> du recollement. Dans cette étape<B>1</B> du recollement, chaque bloc est caractérisé par quatre coordonnées indiquant les limites extérieures<B>,</B> ce sont par exemple les abscisses des cotés gauche Xglllh, et droit X & Oit, et les ordonnées des côtés supérieur Yt,,,t et inférieur Yb,,.
Des constantes<B>El,</B> & -,, <B>c3</B> sont des paramètres prédéfinis. Les valeurs de el et -2 dépendent de préférence de la résolution utilisée au moment de l'acquisition de l'image par le scanner. Pour une résolution de <B>150</B> ppp, <B>ci</B> et c2 ont une valeur de quelques pixels, ils sont de préférence égaux<B>à</B> deux pixels.
Dans cette étape<B>1</B> du recollement, un bloc<B>Q</B> est recollé en dessous d'un bloc P, si les deux blocs P et<B>Q</B> vérifient simultanément les trois conditions suivantes<B>:</B> les deux blocs sont proches dans le sens vertical QY,.. <B><I>-</I></B> py#- <B>1 < </B> --, la projection horizontale d'un des deux blocs inclut l'autre <B><I>Q</I> -</B> p <B>></B> -E <I>et</I><B> < +</B> C, VÎ-I. x8-1. 2 <B>ou</B> QX'. <B><I>-</I></B> Px,,, <B> < </B> +c, <I>et</I><B>></B> -E, <B>"</B> la largeur du bloc le moins large des deux représente un pourcentage<B>-3</B> de la largeur du bloc le plus large, le pourcentage est par exemple supérieur<B>à 90 %,</B> et de préférence d'environ<B>98 %,</B> cette condition permet de limiter le recollement<B>à</B> deux blocs dont les valeurs de largeurs sont proches min(Qx,.. P,.. <B>></B> En sortie de cette étape la liste des blocs est réduite, deux blocs recollés ne forment plus qu'un seul bloc issu de leur fusion.
L'étape<B>1</B> deu recollement permet de détecter l'angle d'inclinaison de la page lors de la numérisation.
Une étape<B>Il</B> du recollement suit l'étape précédente, elle permet de poursuivre le recollement. Elle s'applique sur la liste des blocs obtenue en sortie de l'étape précédente.
Contrairement<B>à</B> l'étape précédente, le procédé exploite l'abscisse du centre de gravité de chaque bloc, et non plus seulement ses limites extérieures.
Dans cette étape<B>Il</B> du recollement, un bloc<B>Q</B> est rassemblé en dessous d'un bloc P, si les deux blocs P et<B>Q</B> vérifient simultanément les trois conditions suivantes, en utilisant des notations de l'étape<B>1</B> du recollement<B>-.</B>
Des constantes ul, u3, u4 sont des paramètres prédéfinis, les valeurs de p, <I>et</I> u4 dépendent de préférence de la résolution utilisée au moment de l'acquisition de l'image par le scanner. Pour une résolution de <B>150</B> ppp, p, <I>et</I> u4 ont des valeurs de quelques dizaines de pixels, de préférence ui <I>et</I> u4 valent respectivement une vingtaine de pixels et une trentaine de pixels.
<B>e</B> les deux blocs sont proches dans le sens vertical Qy.,. <B><I>-</I></B> py#,_ <B>1 < </B> 'u, <B>0</B> l'abscisse du centre de gravité d'un des blocs n'est pas très éloignée de celle de l'autre<B>:</B> QX,#, <B><U>+0</U></B> Xg-F. p Xw#î1 <B>+</B> p vg.#W <B> < </B> u4 2 2 la largeur du bloc le moins large des deux représente une fraction<B>p3</B> de la largeur du bloc le plus large, la valeur de la fraction est par exemple supérieure<B>à</B> deux tiers, et de préférence d'environ trois-quarts, cette condition permet de limiter le recollement<B>à</B> deux blocs dont les valeurs de largeurs sont proches avec des exigences moins strictes que la troisième condition de l'éjape <B>1</B> du recollement <B>-</B> Ov 'p1# P, min #0_ <B>A > P3</B> max(Qx Ces conditions permettent de rassembler des blocs légèrement décalés dans le sens horizontal<B>.</B> Une fois toute la liste des blocs traitée en entier, le procédé vérifie que des blocs entièrement recouverts par d'autres ne restent pas dans la liste. Le cas échéant, ils sont éliminés. S'il<B>y</B> a recouvrement entier, le bloc recouvert est éliminé de la liste et les blocs du rassemblement sont recollés. Si le recouvrement est partiel, le rassemblement est annulé, il n'y a pas de recollement. Ce procédé permet d'éviter d'obtenir après le recollement un gros bloc recouvrant partiellement ou entièrement d'autres blocs.
Une étape<B>111</B> du recollement rattache ensuite les blocs dit étroits qui correspondent par exemple<B>à</B> une fin de paragraphe<B>-</B> soit B un tel bloc. Sa hauteur correspond exactement<B>à</B> celle d'un ruban et il est moins large que le bloc<B>C</B> juste au-dessus (ou au-dessous). Dans cette étape, le procédé projette le bloc B dans le sens horizontal et analyse le profil ainsi obtenu, l'axe des abscisses du profil est une verticale.
Le procédé recherche s'il existe une zone blanche qui fasse de préférence au moins le tiers de la hauteur de B<B>-</B> il considère alors que le bloc B est effectivement étroit dans le sens vertical et il le rassemble au bloc du dessus si la zone blanche est en bas ou bien au bloc du dessus si la zone blanche est en haut.
Ce rattachement est confirmé lorsque les deux blocs rattachés respectent les conditions suivantes<B>:</B> <B>e</B> les deux premières conditions sont les conditions<B>1</B> et 2 utilisées<B>à</B> l'étape<B>1</B> du recollement, mais avec des paramètres i7j <I>et</I> 172 moins stricts que el et & ,, de préférence<B>il,</B> vaut une vingtaine de pixels et 17.? vaut tois ou quatre pixels.
<B>0</B> la troisième condition précise l'épaisseur du bloc<B>C</B> auquel se rattache le bloc étroit<B>,</B> le bloc<B>C</B> a de préférence au moins deux rubans de haut.
Lorsque ces conditions ne sont pas respectées, le procédé annule ce rattachement.
Une fois toute la liste des blocs traitée en entier, le procédé vérifie que des blocs entièrement recouverts par d'autres ne restent pas dans la liste. Le cas échéant, ils sont éliminés. S'il<B>y</B> a recouvrement entier<B>à</B> l'issue du rattachement, le bloc recouvert est éliminé de la liste et les blocs du rattachement sont recollés<B>-</B> si le recouvrement est partiel, le rattachement est annulé, il n'y a pas de recollement. Ce procédé permet d'éviter d'obtenir après le recollement un gros bloc recouvrant partiellement ou entièrement d'autres blocs. Ce procédé permet d'éviter un mauvais recollement dans lequel une zone de l'image appartient<B>à</B> deux blocs différents. Un maintien du nombre de blocs est préféré<B>à</B> un mauvais recollement.
Un exemple est représenté sur la figure<B>5. Il</B> comporte trois gros blocs,<B>51, 52, 53</B> et trois petits blocs 54,<B>55</B> et<B>56 à</B> éventuellement fusionner avec d'autres. Le bloc<B>56</B> se rattache sans problème au bloc<B>52,</B> il semble n'en faire que le prolongement en formant le bloc<B>57</B> en pointillés du bas, Par contre la fusion du bloc 54 avec le bloc<B>52</B> conduit au bloc<B>58</B> en pointillés du haut, qui englobe le bloc<B>55,</B> lequel est alors éliminé, et qui recouvre en partie le bloc<B>53,</B> ce qui est gênant car alors une zone est répertoriée dans deux blocs et de plus, une zone de graphique est ajoutée<B>à</B> du texte. Le procédé ne valide pas la fusion de bloc 54, ou du bloc<B>55</B> dans le bloc<B>51.</B>
Dans une étape IV du recollement, le procédé regroupe les blocs dits fins. De tels blocs ne font qu'un seul ruban de haut. Le procédé parcourt toute la liste<B>:</B> si un bloc BI ne fait qu'un ruban de haut, le procédé examine son voisin de droite B2. Si ce voisin ne fait aussi qu'un ruban de haut, il est recollé au bloc BI et le recollement a exactement<B>à</B> la même hauteur que B2. Le procédé recommence ensuite avec le bloc nouvellement formé pour continuer le recollement horizontal, si cela est possible. Sinon le procédé regarde le bloc suivant de la liste.
Une étape V du recollement suit, elle est comparable<B>à</B> l'étape<B>111</B> du recollement, le procédé<B>y</B> traite également les blocs dits étroits mais cette fois-ci, le procédé ne comporte pas la condition supplémentaire sur l'épaisseur du bloc auquel se rattache le bloc étroit. Le procédé distingue l'étape<B>111</B> du recollement de l'étape V, cela permet de rassembler des zones divisées en plusieurs petits blocs ne faisant qu'un ruban de haut lors de l'étape IV intermédiaire avant de poursuivre les tentatives de recollement.
Une étape VI du recollement est une option du procédé, elle permet d'enlever les éventuels blocs qui correspondent aux entêtes et pieds de page de l'image d'origine. L'option est de préférence levée par l'utilisateur.
Pour la recherche des entêtes, le procédé recherche les blocs les plus hauts placés sur la page.<B>Il</B> prend l'ordonnée<B>y,,<I≥</I> ..</B> du côté haut du premier bloc, et recherche, parmi les blocs Qo qui ont la même ordonnée, la hauteur H,,,,,., du bloc le plus haut. Formellement, si<B>0</B> représente l'ensemble des blocs, B, le i-ème bloc de<B>n,</B> et H,,,b,,,, la hauteur d'un ruban élémentaire Yo <B><I≥</I></B> B'Yi..
no <B><I≥</I></B> k,Ie1squeB,#,, <B><I≥</I></B> y.eiB, C= ni H,,,,,,, <B≥</B> max ky,. <B><I>-</I></B> BI'y,^ >BI no Soit alors iio <B><I≥</I></B> H.#,, <B><I>/</I></B> Hmb#, la hauteur en nombre de rubans. Le procédé réalise ensuite les trois tests suivants<B>:</B> <B>0</B> si 110 <B>></B> 2, le procédé ne fait rien, il considère qu'un bloc important monte jusqu'en haut de la page.
<B>0</B> si<B>Il() =</B> 2, le procédé élimine l'ensemble Ç20 des blocs qui ont la même ordonnée ainsi que ceux de l'ensemble<B>ni</B> des blocs dont le point haut est dans la zone horizontale des blocs de l'ensemble Ç20, n, est défini comme suit -.
Yi Yo <B><I>+</I></B> H,,,,ban <B>ni</B> #, telsqiteB, Ei Q,B,,y,# <B><I≥ y,</I></B> el(B,,y, <B><I>-</I></B> B,),A#) <B><I≥</I></B> Hri4ban <B>0</B> si 110 <B≥ 1 ,</B> le procédé élimine l'ensemble des blocs de ÇIO ainsi que ceux de n2, défini comme suit<B>-,</B> <B><I>y,</I></B> min #,.Y,-.,B, <B><I>r=</I></B> ÇI <B>\</B> ÇIO <B>n,</B> #,,teIsqueB, <I>c:</I> ÇI,B,.,,.# <B><I≥</I></B> Y2et(B,, <B><I>Y,,. -</I></B> B,r,# Pour les pieds de page, le mécanisme est sensiblement le même, le procédé examine les blocs les plus bas placés, et travaille avec les ordonnées du côté inférieur des blocs. Le procédé trie alors de préférence la liste des blocs suivant l'ordonnée du côté inférieur des blocs, cela permet de faciliter et d'accélérer les recherches dans la liste.
Quelques exemples sont présentés sur les figures 6a,<B>6b</B> et 6c. Chacune des ces figures représente le haut d'une page, sur lequel les blocs les plus hauts sont schématisés.
Dans l'exemple de la figure 6a, un bloc<B>61</B> et un bloc<B>62</B> ont chacun une hauteur d'un ruban, le procédé élimine les deux blocs.
Dans l'exemple de la figure<B>6b,</B> la hauteur d'un bloc<B>63</B> correspond <B>à</B> celle de deux rubans, l'ordonnée de son côté inférieur est égale<B>à</B> celle d'un bloc 64<B>-</B> le procédé élimine les deux blocs.
Dans l'exemple de la figure 6c, la hauteur d'un bloc<B>65</B> n'est que d'un ruban, il est<B>à</B> côté d'un bloc<B>66</B> dont la hauteur est supérieure<B>à</B> celle de deux rubans le procédé n'élimine aucun bloc, La situation pour les pieds de page est semblable mais dans l'autre sens.
Dans des étapes VII et VIII du recollement, le procédé ne traite que les blocs d'un certain type, la détermination du type est préalablement effectuée par la classification décrite plus loin.
Dans l'étape VII du recollement, le procédé ne recolle que des blocs graphiques.
Dans cette étape, le procédé assure un recollement horizontal (voir étape IV du recollement) restreint aux blocs de type graphique dont la hauteur est limitée, par exemple<B>à 1</B> ou deux rubans de haut, Le recollement est effectué lorsque les deux blocs ont la même ordonnée pour le côté inférieur. Cette étape est particulièrement adaptée aux gros titres, qui sont habituellement séparés en plusieurs petits blocs.
Cette étape VII privilégie la direction horizontale.
Dans l'étape VIII du recollement, le procédé ne recolle que des blocs graphiques.
Le procédé prend un bloc graphique P, le fusionne avec le bloc graphique<B><U>0</U></B> le plus proche placé juste au dessous et forme un gros bloc B, puis il examine si un éventuel bloc R est recouvert par<B>B. Si</B> R est un bloc texte alors le procédé annule la fusion. Si R est un bloc graphique, on intègre <I>R<B>à</B> B</I> et on recommence les tests de recouvrements jusqu'à ce que plus aucun bloc ne soit recouvert par B. Si aucun bloc texte n'a été rencontré, la fusion est validée en un recollement.
La recherche s'effectue de préférence avec une table contenant la liste des voisins les plus proches de chaque bloc, la liste est remise<B>à</B> jour, de préférence partiellement, après chaque validation, elle permet de tenir compte de la suppression de blocs lors du recollement.
Le procédé est itéré avec le nouveau bloc B, puis avec tous les blocs graphiques suivants non encore traités.
Cette étape VIII du recollement permet de regrouper tous les blocs qui sont directement voisins, pour ne former qu'un seul gros bloc graphique. Cette étape ne recolle pas de blocs de type texte ce qui permet d'éviter le regroupement de deux colonnes côte<B>à</B> côte de texte, qui pénaliserait les performances de l'étape ultérieure de reconnaissance de caractères.
Cette étape VIII de recollement privilégie la direction verticale. Dans une étape IX du recollement, le procédé examine le nombre de blocs restants et il rassemble tous les blocs en un seul bloc graphique si leur nombre est supérieur<B>à</B> un nombre de blocs maximal, Le nombre maximal est prédéterminé, il est de préférence choisit en fonction de la taille de l'écran de visualisation et des capacités visuelles de l'utilisateur du procédé d'aide<B>à</B> la lecture<B>:</B> il permet de limiter le nombre de blocs présentés <B>à</B> l'utilisateur. Le nombre maximal vaut par exemple entre quinze et vingt cinq<B>;</B> de préférence vingt.
Jusqu'à la fin de l'étape IX du recollement, la liste des blocs est ordonnée par le procédé suivant les coordonnées du coin supérieur gauche<B>-</B> le classement suit l'ordre classique de lecture, de gauche<B>à</B> droite et de haut en bas. Dans une étape X du recollement le procédé ordonne<B>à</B> nouveau la liste des blocs, il parcourt toute la liste pour former un arbre représentant la structure de la page. Cette structure correspond<B>à</B> l'ordre de lecture par le procédé des blocs de la page.
Le procédé parcourt tous les blocs dans l'ordre de la liste précédente, il insère dans l'arbre chaque bloc B de numéro n dans l'ancien classement de la façon suivante<B>:</B> Le procédé teste si le bloc B est en dessous d'un autre bloc<B>C.</B> Les critères pour que B soit considéré être en dessous sont<B>:</B> le côté supérieur de B est au-dessous du côté inférieur de<B><I>C,</I></B> en projetant les deux blocs suivant le sens vertical, la partie commune entre la projection de B et celle de<B>C</B> représente au moins un pourcentage significatif de la largeur de<B><I>C.</I></B> Ce pourcentage est d'au moins 314, par exemple<B>80 %.</B> Cela permet de s'assurer que la majorité de B est au dessous de<B><I>C.</I></B>
Si ces critères sont satisfaits, le procédé forme une branche entre ces deux blocs La liste des blocs est classée avant la création de l'arbre suivant le coin supérieur gauche, le procédé insère ensuite les blocs les uns après les autres en respectant cet ordre. Lors de l'insertion, le procédé privilégie les blocs les plus récemment insérés dans l'arbre. Par exemple, si le procédé insère le bloc B ayant pour numéro n, il tente de le placer sous le bloc 11-1, si ce n'est pas possible il tente sous le bloc n-2, puis sous le bloc n-3,<B><I>_</I></B> jusqu'au bloc<B>0,</B> bloc fictif représentant la racine. En parcourant les blocs dans l'ordre de la liste précédente, les blocs<B>1,....</B> n-1 sont<B>déjà</B> dans l'arbre.
Le procédé permet ainsi l'insertion d'un bloc B sous une colonne composée par exemple de trois blocs empilés de haut en bas<B>CI, C.?,</B> et C_?, en le rattachant au bloc le plus bas<B><I>C3.</I></B>
La figure Ta représente un exemple d'une découpe en blocs d'une page, leur numérotation de<B>71 à 77</B> ne reflète pas la structure logique de la page. La figure<B>7.b</B> représente un arbre<B>à</B> l'envers associé<B>à</B> la découpe de la figure Ta dans lequel chaque branche Bl <B>à</B> B3 correspond<B>à</B> une tête de colonne, une branche présente des feuilles lorsqu'en descendant la page une colonne se divise. L'ordre des feuilles 74<B>à 77</B> d'une branche B2 correspond<B>à</B> l'ordre de lecture dans la branche.
Cette structure permet au procédé de lire par exemple un article sur deux colonnes en lisant intégralement la première colonne avant de commencer la deuxième. Le procédé se poursuit par une étape XI du recollement. Dans cette étape les blocs sont tous agrandis- Pour les blocs graphiques et les côtés gauche et droits des blocs textes, ces agrandissements sont arbitraires, fixé<B>à</B> quelques pixels.
Pour les côtés supérieur et inférieur des blocs textes, l'agrandissement est un peu plus élaboré. Le procédé recherche si des mots n'ont pas malencontreusement été coupés en deux dans le sens horizontal, et si oui il agrandit jusqu'à inclure complètement le haut (ou le bas) des mots coupés. Cette recherche se fait en projetant horizontalement la zone autour du changement de bloc pour savoir précisément où se trouve une ligne blanche séparant correctement deux lignes de texte.
Cette étape permet de limiter les problèmes aux bords des blocs. Dans la sous-étape de classification, le procédé estime le pourcentage r de pixels noirs N,, par rapport au nombre de pixel total, ce dernier étant égal<B>à</B> la somme des nombres de pixels noirs et de pixels blancs ATbt,,,, Le pourcentage r vérifie la relation suivante r N.r, - Almanc <B><I>+</I></B> Nnair Ce rapport r est comparé par le procédé<B>à</B> un seuil ro prédéterminé. Le procédé effectue le test suivant<B>:</B> <B>e</B> si r<B><I>></I></B> r., le bloc est considéré comme étant une zone graphique.
si r:g <I>r.</I> le bloc est considéré comme étant une zone texte. e test permet au procédé de différencier une zone graphique d'une zone de texte. La valeur du seuil prédéterminé est de préférence d'environ<B>25 à 30 %.</B> Une telle valeur permet au procédé de classifier les gros titres en blocs graphiques, et non en blocs de texte, ce qui lui permet d'éviter d'effectuer une reconnaissance de caractères sur des polices de grosse taille, supérieure par exemple<B>à</B> 14, laquelle n'est pas toujours aussi bonne que pour des textes en polices de taille plus petite.
Avec la découpe en blocs, cette classification présente l'avantage de séparer les zones de texte des zones graphiques et de limiter les blocs de texte<B>à</B> des zones sur lesquelles la reconnaissance de caractère est performante.
L'étape suivante de rebinarisation consiste<B>à</B> extraire une image binaire pour chaque bloc obtenu par la décou pe-cl a ssifi cation.
Afin d'obtenir une meilleure image binaire pour effectuer la reconnaissance de caractères, le procédé n'utilise pas directement l'image binaire générée pour la découpe en blocs. En effet, le seuil<B>y</B> a volontairement été choisi très bas pour limiter au maximum l'influence du bruit, notamment lorsque le mode spécial livre est activé. L'image est alors généralement parfois trop dégradée pour donner de bons résultats après la reconnaissance de caractères. Pour résoudre ce problème, le procédé de l'invention effectue, après la découpe en blocs, une binarisation par zones de l'image numérisée d'origine en niveaux de gris. Cette binarisation n'est pas globale sur l'image, elle s'effectue de façon indépendante sur chaque bloc.
Seuls les blocs textes sont concernés par cette procédure.
La binarisation, dite rebinarisation, se fait par seuillage, comme dans le cas de l'image entière. Le calcul du seuil se fait sur chaque bloc de texte de la même façon que pour la recherche automatique du seuil dans le cas normal (Cest-à-dire lorsque le mode spécial livre est désactivé) pour l'image entière. Si le mode spécial livre a été demandé, le procédé élimine les zones sombres dues<B>à</B> la courbure. Dans ce cas, une fois que les blocs texte ont été rebinarisés, le procédé recherche sur toute l'image binaire, blocs texte et graphique, les zones qui ont été entièrement converties en noir,<B>à</B> cause de cette courbure. Pour chaque bloc texte ou graphique, le procédé projette verticalement l'ensemble du bloc, calcule un histogramme de projection, comme lors de la recherche des blocs rubans pendant la découpe en blocs, et il procède<B>à</B> une détection d'un domaine entièrement noir de cet histogramme. Si le procédé détecte une telle zone,<B>il</B> isole la partie correspondante du bloc et applique un algorithme de filtrage spécial (décrit ci-dessous) sur cette zone. Après ce filtrage de la zone détectée, le procédé remplace la zone perturbée,<B>à</B> cause de la courbure de l'image dans l'image binaire du bloc, par le résultat du filtrage spécial, De préférence, la zone où le procédé applique le filtre est agrandie. Cela permet de limiter les effets de bords.
Dans l'étape de filtrage spécial, ou filtrage adapté pour la correction de la courbure d'un livre, le procédé extrait une image binaire d'une image scannée en niveaux de gris. Le noir correspond au niveau de gris minimal, le blanc correspond au niveau maximal. Le procédé suppose que le texte est plus noir que le fond. Cela permet de limiter les traitements et le temps d'exécution du procédé. En option, le procédé détecte les zones en inverse vidéo et il les réinverse.
La première sous-étape du filtrage spécial consiste<B>à</B> appliquer un filtre de lissage surf, l'image numérisée d'origine en niveaux de gris qui est obtenue en sortie de la première étape principale du procédé. Le filtre est un simple filtre de lissage moyennant, avec un masque de dimension W par exemple égal<B>à 5</B> pixels.<B>Si f</B> est l'image numérisée d'origine, l'image filtrée<B>g</B> est calculée comme suit pour chaque point de l'image dont les coordonnées sont par exemple une abscisse x et une ordonnée<B>y</B> 9(x, <B>y) =<U>1</U></B> 1: lf(X+i,y+j) <B>52</B> En utilisant une convolution,<B>g<I≥ f</I></B> *h avec
Figure img00250000

L'effet de ce filtrage est de ne garder que les principales variations de niveaux de gris et d'éliminer du bruit existant sur la page, par exemple si la couleur du fond du papier n'est pas uniforme, si le verso de la page apparaît par transparence, ou d'éliminer du bruit ajouté lors de la numérisation par le scanner, par exemple si le papier n'est pas parfaitement plat, si la vitre n'est pas propre.
L'algorithme principal de ce procédé compare la valeur en niveaux de gris du pixel en cours de traitement avec les pixels voisins et détermine si ce pixel est entouré de zones noires. La comparaison ne se fait pas directement avec les valeurs des pixels voisins de l'image filtrée<B>g,</B> mais avec des valeurs moyennes calculées sur un petit voisinage autour de chaque pixel de l'image filtrée<B>g.</B>
Cette sous-étape permet de limiter l'influence du bruit introduit par exemple lors de la numérisation et correspondant<B>à</B> l'écart de niveau de gris sur des pixels voisins qui devraient avoir un niveau identique.
Dans une seconde sous-étape du filtrage spécial, le procédé calcule les moyennes sur un voisinage local pour chaque point de l'image filtrée<B>g,</B> ce qui équivaut<B>à</B> appliquer un filtre de lissage moyennant avec un masque de taille V par exemple égale<B>à 3.</B>
Le niveau de gris moyen d'un point de coordonnées x et<B>y</B> en abscisse et en ordonnée est estimé par la valeur de la fonction M en ce point (X,Y) <B>où -</B>
Figure img00250004

Ensuite dans une troisième sous-étape du filtrage spécial, le procédé recherche pour chaque pixel P de l'image filtrée<B>g,</B> un nombre minimal N,de points voisins dont la valeur moyenne sur un voisinage local, estimée par la fonction M, est supérieure d'au moins un seuil T au niveau de gris du pixel P en question. Si ce nombre minimal<B>N,</B> est atteint, le procédé binarise ce point en noir, sinon le point est binarisé en blanc. Les points voisins sont cherchés de préférence sur un carré centré sur P et de demi-côté de taille<I>V.</I> Un exemple est représenté sur la figure<B>8.</B>
De préférence, les points voisins sont au nombre<B>N,</B> égal<B>à</B> quatre. Le procédé effectue de préférence la recherche dans deux directions privilégiées adjacentes passant par le point P. Le procédé définit par exemple huit points voisins autour du point P de coordonnées (x,y), nommés<I>Pi, i</I> allant de<B>1 à 8,</B> de coordonnées respectives (x,,y, , placés par exemple aux quatre coins du carré centré sur P et de demi côté de taille V et au milieu de chacun des côtés du carré. Les points sont numérotés successivement sur le périmètre du carré. Le procédé définit 4 directions privilégiées joignant des points deux par deux, formant par exemple des angles multiples de 45 degrés<B>:</B> P# < -> <I>P,, P,<B> < --* P5,</B></I> P2 <B><I> < --></I></B><I> P,</I> et P3 < --> <B>P7 .</B>
Puis le procédé effectue une batterie de<B>8</B> tests, chaque test, i allant de<B>1 à 8,</B> compare la valeur moyenne sur un voisinage autour du point voisin Pi avec la valeur de P Le résultat du test du point voisin Pi est par exemple égal<B>à</B> la variable booléenne Lffl suivante<B>:</B> Lffl <B><I≥</I></B> [M(x,,y,) <B><I>-</I></B> g(x,y) <B><I>></I></B> TI Le procédé combine ensuite les tests Lffl, il convertit le point P en un point noir sur l'image binaire finale si les tests Lffl sont vrais pour 4 points (au moins) décrivant simultanément une direction horizontale ou verticale (premier crochet ci-dessous), et une direction en diagonale (deuxième crochet), c'est-à-dire si l'expression suivante est vraie<B>:</B> I(L(O)I\L(4 V (L(2)1\L(6 <B>A</B> (L <B><I>(1)</I></B> /\ <I>L</I><B>(5 </B> V<I>(L<B>(3) /\</B> L</I><B>(7 </B> <B>0 ù</B> représente l'opérateur booléen<B> </B> et<B> </B> et V représente l'opérateur<B> </B> ou<B> .</B> En élargissant la taille V du masque et donc en élargissant en même temps l'écartement entre le point en cours de traitement et les voisins, la taille des caractères prise en compte par le procédé est augmentée. Prendre une taille plus grande,<B>5</B> au lieu de<B>3</B> par exemple, favorise les caractères dont la police est de taille plus grande, par exemple de taille<B>15</B> ou plus. Dans la mesure où l'essentiel du texte est presque toujours dans des tailles de polices allant de<B>8 à</B> 12, il est préférable de paramétrer le procédé avec un masque de taille V égale<B>à 3.</B>
En appliquant ce traitement sur toute la page, le procédé atteint des temps d'exécution prohibitifs pour l'utilisateur qui peuvent dépasser<B>30</B> secondes avec un ordinateur récent du commerce. En appelant<I>ni</I> la hauteur et n la largeur de l'image, dans la version actuelle, le calcul de la première convolution demande, en ne tenant pas compte des problèmes aux bords de l'image, 26-nin appels mémoire, 25-nin additions et nin divisions. Pour la deuxième convolution, il convient de remplacer<B>26</B> par<B>10,</B> car le masque est plus petit. Pour la boucle principale, le calcul de M nécessite nin appels mémoire, mii additions et nin comparaisons. Enfin, les tests finaux nécessitent dans le pire des cas 7-nin opérations logiques élémentaires (OR et<B>AND).</B>
De préférence, les deux convolutions sont calculées par le procédé en tenant compte du fait que la somme calculée au point Por,y) pour estimer la moyenne est en partie commune avec celle calculée au point précédentP(x <B>-<I>1,y),</I></B> le procédé calcule l'une par rapport<B>à</B> l'autre, ce qui limite le nombre d'additions et d'appels mémoire et conduit<B>à</B> un calcul plus efficace et<B>à</B> une amélioration du temps de traitement.
Le filtrage spécial n'est pas appliqué sur la page entière mais seulement sur les zones effectivement impactées par la courbure du support. où il est réellement indispensable. De préférence, il n'est appliqué que sur les zones de texte. Sur les zones texte, le filtrage spécial érode les caractères mais il permet de récupérer de l'information utile, et notamment l'application d'un OCR sur les caractères obtenus après filtrage fournit du texte exploitable par l'utilisateur. Sur des zones non perturbées par la courbure du support, l'absence de filtrage spécial permet d'éviter toute perte d'information.
Le traitement de filtrage spécial permet d'extraire une image binaire d'une image scannée en niveaux de gris.<B>Il</B> est adapté pour éliminer dans du texte les zones sombres dues<B>à</B> la courbure du livre lorsqu'on scanne un livre, ou de manière plus générale, un document dont la page n'était pas parfaitement en contact avec la surface du scanner au moment de l'acquisition.

Claims (1)

  1. <B>REVENDICATIONS</B> <B>1.</B> Procédé d'assistance<B>à</B> la lecture pour malvoyant utilisant un support de visualisation et un capteur d'image haute résolution, le procédé est caractérisé en ce qu'il consiste<B>à</B> acquérir une image numérisée haute résolution d'une image réelle située sur un support, former une image synthétique correspondant<B>à</B> un découpage de l'image en blocs de texte ettou graphique, afficher sur le support de visualisation l'image numérisée et/ou l'image synthétique, réaliser un traitement de l'image numérisée corrigeant les éventuels défauts de l'image et les éventuels défauts dus<B>à</B> la forme du support de l'image réelle, en cas de sélection par un utilisateur d'un bloc de texte de l'image synthétique: augmenter la taille des caractères du bloc de texte sélectionné, et/ou gérer le retour<B>à</B> la ligne et le défilement automatique du texte, en cas de sélection par un utilisateur d'un bloc graphique agrandir la zone graphique du bloc sélectionné et/ou permettre<B>à</B> l'utilisateur de se déplacer dans la zone graphique du bloc sélectionné. 2. Procédé selon la revendication<B>1,</B> caractérisé en ce qu'en cas de sélection d'un bloc de texte, celui-ci est transmis<B>à</B> une synthèse vocale. <B>3.</B> Procédé selon la revendication<B>1,</B> caractérisé en ce que le procédé de réalisation de l'image synthétique consiste<B>à</B> former une première image binaire par seuillage de l'image numérisée,<B>à</B> déterminer des blocs rubans,<B>à</B> recoller et classifier les blocs en blocs de texte et/ou blocs graphiques. 4. Procédé selon la revendication<B>1,</B> caractérisé en ce que le traitement de l'image numérisée consiste<B>à</B> former une seconde image binaire par seuillage indépendant de l'image numérisée sur chaque bloc de texte. <B>5.</B> Procédé selon la revendication 4, caractérisé en ce que le traitement de l'image numérisée consiste<B>à</B> effectuer un filtrage spécial sur des zones de la seconde image binaire. <B>6.</B> Procédé selon la revendication<B>5,</B> caractérisé en ce que le traitement de l'image numérisée consiste<B>à</B> effectuer un filtrage spécial sur les blocs de texte de la seconde image binaire. <B>7.</B> Procédé selon l'une des revendications<B>3</B> et 4, caractérisé en ce que le seuillage est automatique. <B>8.</B> Procédé selon la revendication<B>1,</B> caractérisé en ce qu'il applique un OCR sur l'image binaire d'une zone de texte. <B>9.</B> Procédé selon l'une des revendications précédentes, caractérisé en ce que le traitement de correction des événtuels défauts dus<B>à</B> la forme du support de l'image réelle est activé par l'utilisateur.
FR9906880A 1999-06-01 1999-06-01 Procede d'aide a la lecture notamment pour malvoyant Expired - Fee Related FR2794560B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9906880A FR2794560B1 (fr) 1999-06-01 1999-06-01 Procede d'aide a la lecture notamment pour malvoyant

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9906880A FR2794560B1 (fr) 1999-06-01 1999-06-01 Procede d'aide a la lecture notamment pour malvoyant

Publications (2)

Publication Number Publication Date
FR2794560A1 true FR2794560A1 (fr) 2000-12-08
FR2794560B1 FR2794560B1 (fr) 2001-09-21

Family

ID=9546217

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9906880A Expired - Fee Related FR2794560B1 (fr) 1999-06-01 1999-06-01 Procede d'aide a la lecture notamment pour malvoyant

Country Status (1)

Country Link
FR (1) FR2794560B1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2834632A1 (fr) * 2002-01-15 2003-07-18 Oleg Tretiakoff Machine a lire portative pour les aveugles
US8896633B2 (en) 2010-08-17 2014-11-25 Apple Inc. Adjusting a display size of text

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2513780A1 (fr) * 1981-09-29 1983-04-01 Siemens Ag Procede pour saisir des extraits de textes d'un modele, et dispositif pour la mise en oeuvre de ce procede
US4941195A (en) * 1986-10-27 1990-07-10 Sharp Kabushiki Kaisha Optical character reader
EP0720114A2 (fr) * 1994-12-28 1996-07-03 Siemens Corporate Research, Inc. Méthode et appareil pour détecter et interpréter des sous-titres dans des signaux vidéo digitaux
WO1999021122A1 (fr) * 1997-10-22 1999-04-29 Ascent Technology, Inc. Systeme de lecture a sortie vocale avec navigation gestuelle

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2513780A1 (fr) * 1981-09-29 1983-04-01 Siemens Ag Procede pour saisir des extraits de textes d'un modele, et dispositif pour la mise en oeuvre de ce procede
US4941195A (en) * 1986-10-27 1990-07-10 Sharp Kabushiki Kaisha Optical character reader
EP0720114A2 (fr) * 1994-12-28 1996-07-03 Siemens Corporate Research, Inc. Méthode et appareil pour détecter et interpréter des sous-titres dans des signaux vidéo digitaux
WO1999021122A1 (fr) * 1997-10-22 1999-04-29 Ascent Technology, Inc. Systeme de lecture a sortie vocale avec navigation gestuelle

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2834632A1 (fr) * 2002-01-15 2003-07-18 Oleg Tretiakoff Machine a lire portative pour les aveugles
US8896633B2 (en) 2010-08-17 2014-11-25 Apple Inc. Adjusting a display size of text
US9817796B2 (en) 2010-08-17 2017-11-14 Apple Inc. Adjusting a display size of text

Also Published As

Publication number Publication date
FR2794560B1 (fr) 2001-09-21

Similar Documents

Publication Publication Date Title
BE1017547A6 (fr) Compression d&#39;images numeriques de documents scannes.
US8990672B1 (en) Flexible design architecture for designing media-based projects in a network-based platform
CN100591100C (zh) 图像处理装置、图像处理方法和计算机程序
US8271871B2 (en) Automated method for alignment of document objects
JP6798752B2 (ja) 補正画像を生成する方法、ノートブック又はアジェンダの1ページ又は2つの隣接するページに描かれた書込み又は図の選択画像を生成する方法、pc用のコンピュータプログラム、又は、スマートフォン若しくはタブレットコンピュータ用のモバイルアプリケーション
US20110194770A1 (en) Document editing apparatus and method
EP1477020A1 (fr) Detection et correction d&#39;elements yeux rouges dans les images numeriques
US20140198981A1 (en) Document unbending systems and methods
FR2977692A1 (fr) Enrichissement de document electronique
EP1330786A1 (fr) Systeme d&#39;affinage d&#39;images numeriques
BE1026095B1 (fr) Dispositif de traitement d’images
EP2476244B1 (fr) Procédé de détection de pages blanches et machine multifonction correspondante
JP5229328B2 (ja) 文字領域抽出装置,文字領域抽出機能を備えた撮像装置,および文字領域抽出プログラム
US20130021498A1 (en) Image processing apparatus, image processing method, and program
FR2905188A1 (fr) Procede et dispositif de conversion de densites d&#39;image
CN102737240A (zh) 分析数字文档图像的方法
BE1026159B1 (fr) Système de traitement d’image et procede de traitement d’image
FR2870969A1 (fr) Dispositif, procede et programme d&#39;elimination de pores
FR2794560A1 (fr) Procede d&#39;aide a la lecture notamment pour malvoyant
JP4085580B2 (ja) 画像処理装置
US8531482B2 (en) Use of handwritten notations from photographs
Ventzas et al. Digital restoration by denoising and binarization of historical manuscripts images
Cheatle Automatic image cropping for republishing
FR2825173A1 (fr) Procede de detection de zones de texte dans une image video
CA2888869A1 (fr) Procede de segmentation de doigts

Legal Events

Date Code Title Description
CD Change of name or company name
ST Notification of lapse