FR2845236A1 - Systemes et procedes pour inserer une etiquette de metadonnees dans un document - Google Patents

Systemes et procedes pour inserer une etiquette de metadonnees dans un document Download PDF

Info

Publication number
FR2845236A1
FR2845236A1 FR0310128A FR0310128A FR2845236A1 FR 2845236 A1 FR2845236 A1 FR 2845236A1 FR 0310128 A FR0310128 A FR 0310128A FR 0310128 A FR0310128 A FR 0310128A FR 2845236 A1 FR2845236 A1 FR 2845236A1
Authority
FR
France
Prior art keywords
document
metadata
electronic document
label
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0310128A
Other languages
English (en)
Inventor
John P Wolf
James Steven Campbell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of FR2845236A1 publication Critical patent/FR2845236A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Les systèmes et méthodes décrits ici concernent un scanner de documents-papier (304) créant un document électronique (320), affiché pour permettre l'insertion d'une ou de plusieurs étiquettes de métadonnées dans le document électronique (320). Chaque étiquette de métadonnées (334) contient des métadonnées qui décrivent le contenu du document (320). De grandes quantités de documents (320) peuvent être archivées de façon à ce qu'une recherche rapide portant sur les documents (320) puisse se faire par un recherche portant sur les étiquettes de métadonnées (334) inséréees dans les documents (320). Les systèmes et méthodes décrits offrent un moyen rapide et efficace d'insérer des étiquettes de métadonnées (334) dans les documents (320) issus du scannage des documents papier (304). Dans l'une au moins des mises en oeuvre, des agorithmes de calcul peuvent être mis à profit pour identifier des portions spécifiques d'un document, en vue de traitements et d'archivages sélectifs.

Description

Domaine technique L'invention concerne le traitement de documents au
moyen d'étiquettes de métadonnées. Plus précisément, 5 l'invention concerne l'insertion d'étiquettes de métadonnées dans des documents pendant leur traitement.
Contexte technique Quotidiennement, un nombre gigantesque de documents sont produits de par le monde, dont la préservation doit être assurée pour permettre leur consultation ultérieure. Ces documents peuvent être des documents-papier ou des fichiers électroniques. En 15 fait, comme la culture moderne devient de plus en plus dépendantes des moyens de traitement informatique, la majorité des documents actuellement produits le sont sous forme de fichiers informatiques. Les documentspapier sont donc scannés pour archivage électronique. 20 La quantité gigantesque d'informations stockées sous
forme électronique dans les bases de données informatiques devient facilement accessible à tout un chacun, alors que le grand public se familiarise avec l'Internet et les techniques de recherche d'information 25 sur ordinateur.
Pour aider les recherches portant sur une quasiinfinité de documents, des étiquettes de métadonnées sont parfois incorporés dans les documents électroniques. Ces métadonnées sont des données dites 30 de haut niveau qui décrivent des données dites de niveau inférieur. En d'autres termes, une étiquette de métadonnées qui décrit un document électronique peut être insérée dans un document électronique avant de le stocker. Une étiquette de métadonnées ainsi insérée 35 dans un document électronique comporte habituellement -2 des mots clés ou des phrases clés du document susceptibles d'être invoqués en tant que clés de recherche par une personne qui désire obtenir de la documentation sur un sujet donné. Par exemple, une 5 étiquette de métadonnées peut contenir le titre du document ainsi que plusieurs mots relatifs au sujet
et/ou à l'auteur du document.
De cette manière, lorsque le moteur de recherche d'un ordinateur est orienté vers une catégorie de 10 documents répondant à certains critères, le moteur de recherche peut effectuer ladite recherche de façon plus efficace en ne prenant en compte que les étiquettes de métadonnées de chaque document consulté au lieu de
parcourir la totalité du document.
De plus, les documents examinés sont typiquement
stockés sous forme de fichiers images qui ne comportent pas de texte analysable. L'ajout d'étiquettes de métadonnées à des documents qui sont uniquement sous un format de fichiers images fournit un moyen d'étendre la 20 recherche à la multitude des documents de ce genre.
C'est ainsi que les mots clés, les profils documentaires et autres moyens d'identification peuvent avantageusement accompagner le fichier image du document pour faciliter les recherches et n'en 25 n'atteindre que son contenu pertinent.
Les grandes entreprises qui utilisent des bases de
données électroniques pour archiver leurs documents et des moteurs de recherche informatiques pour y accéder font appel aux étiquettes de métadonnées pour organiser 30 à grande échelle les données concernant leur activité.
La plupart du temps, sinon toujours, les étiquettes de métadonnées sont entrées manuellement, ce qui peut s'avérer coteux en temps et comme en argent. Des méthodes et systèmes efficaces susceptibles de réduire 35 le temps et la main d'oeuvre nécessaire à insérer des -3 étiquettes de métadonnées dans les documents seraient donc appréciés par nombre d'entreprises en raison des
économies qui en résulteraient.
Résumé de l'invention Les systèmes et méthodes décrits dans ce qui suit ont pour but l'insertion d'étiquettes de métadonnées dans des documents sous forme électronique. S'il s'agit 10 de documents-papier à convertir sous forme
électronique, ils doivent auparavant être scannés.
Lorsqu'un document-papier est scanné et converti en document électronique, une analyse d'image multipassage est effectuée sur la représentation électronique du 15 document scanné. Le document est alors affiché - au
moins partiellement - à l'attention de l'utilisateur.
Ce dernier a alors la possibilité d'entrer des étiquettes de métadonnées. Selon une façon de faire, l'étiquette de métadonnées est définie et introduite 20 par l'utilisateur alors que le document est affiché.
Selon une autre façon de faire, une liste d'étiquettes de métadonnées prédéfinies est mise à disposition de l'utilisateur. Lorsque ce dernier sélectionne une étiquette de métadonnées dans la liste, ladite
étiquette est insérée dans le document électronique.
Une fois insérée dans le document électronique, celuici est stocké sur un support accessible en lecture pour
tout système informatique.
Selon une autre façon de faire, le document est 30 déjà sous forme électronique (il n'y a pas besoin de scanner un support papier). Dans ce cas, le document est directement affiché à l'attention de l'utilisateur qui peut alors introduire des métadonnées dans ledit document. -4 Selon une ou plusieurs façons de faire, des algorithmes de traitement sont utilisés pour localiser dans un document des portions présentant un intérêt particulier. De telles portions sont automatiquement 5 détectées, délimitées et marquées d'une étiquette pour exploitation ultérieure par les traitement spécialisés susceptibles d'être appliqués aux portions du document en question. Cela économise du temps CPU et des ressources mémoire du fait que les diverse portions 10 d'un document se présentent sous des fontes de caractères OCR (Optical Character Recognition) diverses, requièrent des moyens de stockage différents et présentent des significations différentes pour le destinataire ou le lieu de dépôt visé. A titre 15 d'exemple d'algorithme de traitement, on peut citer la détection de la couleur d'arrière-plan, la localisation de zones de textes par oppositions aux zones d'images, la localisation de symboles ou de formes de signification pré-établie, de codes à barres, de motifs 20 invisibles à l'oeil nu, etc.
Brève description des dessins
La présente invention est illustrée à titre d'exemple 25 non limitatif par les figures qui suivent. Les numéros repères désignant sur toutes les figures les éléments ou composants analogues ont les mêmes premier et
deuxième chiffres en partant de la droite.
La Fig. 1 est un bloc-diagramme d'un système de 30 traitement de documents suivant la présente invention.
La Fig. 2 est un bloc-diagramme illustrant la mise en oeuvre de la méthode par le système de traitement de
documents apparaissant en Fig. 1.
La Fig. 3 est un bloc diagramme de scanner donné à 35 titre d'exemple.
La Fig. 4 est un bloc-diagramme illustrant la méthode de mise en oeuvre du scanner représenté sur la
Fig. 3.
Description détaillée de l'invention
La description qui suit concerne une ou plusieurs
mises en òuvre et/ou modes de réalisations spécifiques permettant l'insertion d'étiquettes de métadonnées dans 10 des documents électroniques. Les systèmes et méthodes
décrits comportent des éléments et composants auxquels il est fait numériquement référence dans les revendications jointes. Les mises en oeuvre sont décrites de façon à satisfaire aux exigences 15 statutaires d'une description écrite susceptible
d'habiliter l'homme de métier à accéder au meilleur
mode de réalisation possible de l'invention.
Seront aussi décrites dans ce qui suit, à titre d'exemple, une ou plusieurs mises en òuvre de systèmes 20 et méthodes d'insertion dans les documents électroniques d'étiquettes de métadonnées. Il est entendu que les demandeurs ne considèrent ces mises en oeuvre que comme des exemples, ne limitant en aucune façon la portée de l'invention revendiquée. Les 25 demandeurs considèrent, plutôt, que la présente invention peut impliquer des modes de réalisation et des mises en oeuvre de genres divers, utilisant tant les
technologies actuelles que futures.
Instructions exécutables sur ordinateur La mise en òuvre d'un système et/ou d'une méthode pour insérer dans un document électronique des étiquettes de métadonnées peut être présentée et 35 décrite dans le contexte général d'instructions -6
exécutables sur ordinateur, comme en comportent les modules de programmes. Ces modules de programmes comprennent habituellement des routines, des programmes, des objets, des composants, des structures 5 de données, etc. qui effectuent des tâches et exploitent des types particuliers de données abstraites. Typiquement, les fonctionnalités des modules de programmes peuvent être combinées ou réparties à loisir selon les divers modes de 10 réalisation envisageables pour l'invention.
Support de données accessibles en lecture par un ordinateur. La mise en oeuvre d'un système et/ou d'une méthode d'insertion dans un document électronique d'étiquettes de métadonnées peut être stockée ou transmise sur un support de données accessibles en lecture par un ordinateur. Un tel support peut être de type 20 quelconque, pourvu qu'un ordinateur puisse accéder à son contenu. A titre d'exemple non limitatif, ledit support peut comporter des moyens de stockage
informatique et des moyens de communication.
Le terme moyens de stockage informatique recouvre 25 les supports volatils et non volatils, amovibles ou fixes réalisés suivant une méthode ou une technologie quelconque permettant de stocker des informations telles que les instructions exécutables par un ordinateur, des structures de données, des modules de 30 programmes et autres données. Les moyens de stockage informatique peuvent être - sans se limiter à - des RAM, ROM, EEPROM, mémoires flash ou autres, des CD-ROM, DVD ou autres moyens de stockage optique, des cassettes à bande magnétique, ou tout autre support capable de -7 stocker des informations utiles pour qu'elles soient
accessibles à un ordinateur.
Le terme moyens de communication recouvre typiquement les instructions interprétables par un 5 ordinateur, les structures de données, les modules de
programmes ou autres données se présentant sous forme d'un signal modulant une porteuse ou tout autre support de transport. Le terme moyen de communication sousentend également tout moyen de fourniture 10 d'information.
Exemple de système de traitement de documents La Fig. 1 est un bloc diagramme d'un exemple de 15 système de traitement de documents 100 conforme à une mise en oeuvre de la présente invention. Le système de traitement de documents 100 est montré associé à une base de données 102 et un scanner 104, bien que le système de traitement 100 puisse être intégré au 20 scanner suivant d'autres mises en oeuvre qui seront
décrites dans la suite.
Le système de traitement de documents 100 comporte un microprocesseur 106 et un module d'entrée/sortie (E/S) 108 qui gère les échanges de données 25 électroniques avec le système de traitement de documents 100. Le système de traitement de documents 100 comporte également un module de communication 110 qui permet au système de traitement de documents 100 de communiquer avec d'autres dispositifs électroniques via 30 un réseau, l'Internet, etc., un ensemble de touches 112 au moyen duquel on peut entrer des données alphanumériques à destination du système de traitement de
documents 100, et un dispositif d'affichage 114.
Le système de traitement de documents 100 comporte 35 une mémoire 116, qui stocke des données électroniques, -8 équipé d'un système d'exploitation 117, qui contrôle le fonctionnement du système de traitement de documents 100. Un module d'entrée de document 118 réside dans la mémoire 116; il est configuré pour recevoir un 5 document électronique 120 du scanner 104 ou de toute autre origine. Un module d'interface 122 réside dans la mémoire 116 et assure la présentation du document
électronique 120 sur l'affichage 114.
La mémoire 116 héberge aussi un gestionnaire de 10 pointeur 124 qui gère les commandes et les données en provenance et à destination d'un dispositif de pointage 126. Ce dispositif de pointage 126 peut être d'un type connu quelconque utilisé pour pointer une position telle la position d'un curseur - sur le document 15 électronique, qu'il s'agisse d'une souris, d'un crayon, d'une manette à boule, d'un pavé tactile, etc. Si le système de pointage est un crayon, l'affichage 114 doit être un écran tactile répondant aux indications
pointées par le crayon.
La mémoire 116 héberge aussi un module 127 d'algorithme de calcul que l'on peut utiliser pour déterminer automatiquement des portions d'un ou plusieurs des documents scannés qui sont munis d'étiquettes en vue de traitements ultérieurs 25 spécifiques. L'algorithme de calcul 127 peut aussi être programmé pour appliquer un algorithme sensible au contexte à un document scanné ou à un ensemble de documents scannés. Citons quelques exemples de tels
algorithmes, sans être pour autant restrictif.
Un algorithme de reconnaissance d'arrière-plan identifie une ou plusieurs portion(s) d'un document présentant le même arrière-plan et ne scanne que ces portions. Un algorithme d'identification des zones de textes ne scanne que ces zones à l'exclusion des 35 figures ou des images qui les accompagnent. Un algorithme de localisation de symboles ou de formes significatifs ne scanne que les zones du document qui comportent de tels symboles ou formes. Un algorithme d'identification de codes à barres portés par un 5 document localise et scanne lesdits codes à barres, ignorant le reste du document. Un algorithme peut aussi localiser des motifs invisibles à l'oeil nu et ne scanne que les zones du document qui comportent de tels motifs. Un module de sortie de document 128 réside dans la mémoire 116; il est configuré pour délivrer les portions sélectionnées du document électronique 120 à la base de données 102. Notons que, dans l'exemple présent, la base de données 102 et/ou le scanner 104 15 sont (est) optionnel(s). Le scanner 104 est inutile dans le cas o le document électronique 120 est reçu sous forme électronique. De même, la base de données 102 est inutile dans le cas o le document 120 a une autre destination, tel un support magnétique, un 20 réseau, etc. Dans ce qui suit, l'homme de métier verra que des modes de réalisation différents de l'invention peuvent être mis en oeuvre en fonction du traitement
qu'il désire appliquer aux documents.
Un module d'insertion d'étiquettes de métadonnées 25 130 est résident dans la mémoire 116; il est configuré pour insérer des étiquettes de métadonnées dans le document électronique 120. Une liste d'étiquettes de métadonnées 132 est stockée dans le module d'insertion d'étiquettes de métadonnées 130; elle comprend une ou 30 plusieurs étiquette(s) de métadonnées prédéfinie(s) 134 destinée(s) à être sélectionnée(s) lors du processus d'insertion d'étiquettes de métadonnées dans le document traité. Les étiquettes de métadonnées prédéfinies peuvent être configurées comme descripteurs 35 de divers types de documents standards. Par exemple, si 10
plusieurs documents sont supposés traiter d'un même sujet, une étiquette de métadonnées peut être créée pour le sujet en question sans qu'il soit besoin de la créer à nouveau chaque fois qu' il est nécessaire de 5 l'insérer dans un document électronique 120.
L'utilisateur n'a plus qu'à appeler l'étiquette prédéfinie 134 de la liste d'étiquettes prédéfinies 130
pour l'insérer dans le document électronique 120.
Un document papier (non montré) est traité par le 10 scanner 104 pour créer le document électronique 120.
Alternativement, le document 120 peut tout aussi bien être fourni au système de traitement de documents 100 sous un format électronique via le module de communication 110 ou le module d'entrée/sortie 108. Une 15 fois le document électronique 120 reçu par le système
de traitement de documents 100, le module d'interface 122 affiche au moins une portion du document électronique 120 sur le dispositif d'affichage 114.
Typiquement, la portion affichée du document 20 électronique 120 est une page du document électronique , la dimension de la page dépendant de la taille du dispositif d'affichage. Il se peut qu'une portion seulement du document soit sélectivement affichée,
comme on l'a expliqué plus haut.
Le dispositif de pointage 126 sert à sélectionner une position sur le document électronique 120, par exemple l'emplacement d'un curseur. La mise en oeuvre d'une indication de position peut faire appel à toute méthode utilisée dans l'art actuel, telle qu'un crayon 30 et un écran tactile, une souris, etc. Pour les besoins de la discussion, on supposera que l'on utilise comme moyen de pointage d'une position sur le document
électronique 120 un crayon associé à un écran tactile.
Une fois identifiée la position d'insertion d'une 35 étiquette de métadonnées, il s'agit d'insérer une - il étiquette dans le document électronique. Cela peut s'effectuer d'une ou de plusieurs façons. Lorsque la position d'insertion est retenue, un menu déroulant affichant la liste des étiquettes prédéterminées 5 apparaît pour que l'utilisateur choisisse l'étiquette adéquate. Une invite peut tout aussi bien apparaître, conviant l'utilisateur à entrer le texte associé à l'étiquette. Une fois l'étiquette de métadonnées 134 insérée 10 dans le document électronique 120, cette dernière peut être stockée séparément en tant que document électronique 136 pourvu d'une étiquette. Le document muni d'une étiquette 136 aura typiquement la forme d'un document électronique 120 avec des métadonnées 15 additionnelles contenues dans l'étiquette de
métadonnées 134.
Lorsque le processus d'insertion d'étiquettes de métadonnées est terminé, le document muni d'une étiquette 136 peut être transféré en un autre endroit. 20 Dans l'exemple présent, le module de sortie de document 128 prépare le document muni d'une étiquette 136 pour qu'il soit transmis. Comme on l'a dit plus haut, le document électronique 120 peut être stocké dans la base de données 102 ou envoyé ailleurs, sur un réseau, 25 stocké sur un support magnétique amovible, etc. Mise en òuvre méthodologique système de traitement de documents. La Fig. 2 est un diagramme montrant une mise en
oeuvre méthodologique du système de traitement de documents 100 montré à titre d'exemple sur la Fig. 1.
Il sera fait référence aux éléments et numéros de référence apparaissant sur la Fig. 1 pour la discussion 35 relative à la Fig. 2.
-12 En 200, un document est scanné pour obtenir un document électronique. Alternativement, le document électronique 120 peut tout aussi bien être fourni au système de traitement 100 sous forme électronique via 5 le module de communication 110 ou le module d'entrée/sortie 108. En 201, une analyse d'image multipassage est effectuée au cours de laquelle une ou plusieurs portions du document sont sélectionnées. La ou les portion(s) sélectionnée(s) peut ou peuvent 10 l'être soit au moyen du module algorithme de calcul
127, soit manuellement, ou bien le document complet peut être retenu pour l'analyse d'image multipassage.
En plus des tâches que l'on vient de mentionner, l'analyse d'image multipassage peut effectuer 15 automatiquement la tâche d'ajouter ou d'enrichir des
étiquettes de métadonnées qui seraient susceptibles d'être manuellement éditées, effacées ou laissées ultérieurement telles quelles par un utilisateur, au cours du processus, c'est-à-dire lors des étapes 20 décrites ci-après.
Une fois le document électronique 120 reçu par le système de traitement de document 100, le module d'interface 122 affiche, en 202, au moins une portion du document électronique 120 - un aperçu du document 25 sur le dispositif d'affichage 114. Typiquement, la portion du document électronique 120 qui est affichée est une page du document électronique 120, la dimension de la page dépendant de la dimension du dispositif d'affichage. En 204, on décide s'il faut insérer une étiquette
de métadonnées 134 dans le document électronique 120.
Si ce n'est pas le cas, (branche " non ", en 204), le document est stocké ou transféré, en 212. Si c'est le cas (branche " oui ", en 204), alors le processus 35 continue, en 206.
-13 La liste d'étiquettes de métadonnées 132 est affichée, en 206; elle comporte l'étiquette 134. Le dispositif de pointage 126 sert à sélectionner l'étiquette de métadonnées 134 ainsi qu'à désigner, en 5 208, sur le document électronique 120, l'emplacement o doit être insérée l'étiquette 134. Les étiquettes de métadonnées 134 peuvent être insérées dans le document scanné d'origine de façon à ne pas interférer avec la présentation du document, ou bien elles peuvent être 10 stockées dans un fichier séparé du - mais associé au fichier du document électronique 120. En 210, l'étiquette de métadonnées 134 est insérée dans le document électronique 120 pour créer le document
électronique muni d'une étiquette 136.
Selon une mise en oeuvre, la liste 132 d'étiquettes de métadonnées n'est pas nécessaire. L'utilisateur définit alors l'étiquette à insérer dans le document électronique 120 juste avant son insertion au moyen de
l'ensemble de touches 112.
Une fois le document électronique 120 muni d'étiquettes de métadonnées, comme on l'a vu plus haut, au lieu de stocker le document électronique muni d'une étiquette 136 dans la base de données 102, il peut être transféré en un autre endroit. 25 Exemple de mise en oeuvre de l'invention sur un scanner La Fig.3 est le bloc-diagramme d'un scanner 300 réalisé pour mettre en òuvre la présente invention. Le 30 scanner 300 fonctionne en association avec une base de données 302, bien que cette base de données 302 soit optionnelle. Un document papier 304 est montré, destiné
à être introduit dans le scanner 300.
Le scanner 300 comporte un processeur 306 et un 35 module d'entrée/sortie 308 qui gère les échanges de - 14 données électroniques avec le scanner 300. Le scanner 300 comporte aussi un écran tactile 310 sensible au commandes de l'utilisateur, un ensemble de touches 312 destiné à entrer des données alphanumériques dans le 5 système de traitement de document 300 et un mécanisme de scannage 314 qui sert à scanner le document papier 304. Le scanner 300 comporte une mémoire 316 qui stocke les données électroniques, celle-ci comportant un 10 système d'exploitation 317 qui gère le fonctionnement du scanner 300. Un module d'entrée de document 318 est résident dans la mémoire 316 et configuré de façon à réceptionner un document électronique 320 en provenance du mécanisme de scannage 314. Un module d'interface 322 15 est résident dans la mémoire 316 et délivre le document
électronique 320 au dispositif d'affichage 310.
La mémoire 316 comporte aussi un gestionnaire de crayon 324 qui commande les échanges de données avec un crayon 326. Le crayon 326 est utilisé en association 20 avec un écran tactile 310, sensible aux indications
générées par le crayon 326.
Un module d'algorithme de calcul 327 est aussi résident dans la mémoire 316. Ce module d'algorithme de calcul 327 peut servir à déterminer automatiquement les 25 portions d'un ou plusieurs documents à scanner. Le module d'algorithme de calcul 327 peut être programmé pour appliquer un algorithme sensible au contexte à un document ou un ensemble de documents scannés. A titre d'exemple de tels algorithmes, citons, de façon non 30 limitative, la détection et la sélection d'une couleur particulière d'arrière-plan, la localisation de zones ne comportant que du texte, par opposition aux images, la localisation et la sélection de symboles ou formes significatifs, la localisation et la sélection de codes - 15 à barres, la localisation et la sélection de motifs invisibles à l'oeil nu, etc. Un module de sortie de documents 328 est résident dans la mémoire 316 et configuré pour délivrer des 5 portions sélectionnées du document 320 à la base de données 302. On aura noté que, dans le présent exemple, la base de données 302 est optionnelle. La base de données 302 peut ne pas être nécessaire si le document 320 doit être envoyé vers une autre destination, telle 10 qu'un support magnétique amovible, un réseau, etc. Dans la suite de l'exposé, l'homme de métier comprendra que divers modes de réalisation de l'invention puissent être mis en oeuvre suivant le traitement de document requis. Un module d'insertion d'étiquettes de métadonnées 330 est résident dans la mémoire 316 et configuré pour insérer une étiquette de métadonnées 332 dans le document électronique 320 de façon à obtenir un document électronique muni d'une étiquette 336, en 20 prenant en compte une position pointée avec le crayon 326 ainsi que les entrées de l'ensemble de touches 312
définissant l'étiquette de métadonnées 332.
Le document papier 304 est traité par le scanner 300 pour produire un document électronique 320. Le 25 document électronique 320 peut tout aussi bien être fourni au scanner 300 sous un format électronique via le module de communication 308. Une fois le document électronique 320 reçu par le module d'entrée de document 318, le module d'interface 322 affiche au 30 moins une portion du document électronique 320 sur l'écran tactile 310. Typiquement, la portion du document électronique 320 affichée sera une page du document électronique 320, la dimension de la page
dépendant de celle de l'affichage.
- 16 Le crayon 326 sert à indiquer une position sur le
document électronique 320, par exemple l'emplacement d'un curseur. Une fois l'étiquette de métadonnée 334 définie et insérée dans le document électronique 320, 5 ce dernier peut être stocké en tant que document électronique muni d'une étiquette 336. Ce document électronique muni d'une étiquette 336 aura la forme du document électronique 320 avec des métadonnées additionnelles contenues dans l'étiquette de 10 métadonnées 334.
Lorsque le processus d'insertion d'une étiquette
est terminé, le document muni d'une étiquette de métadonnées 336 peut être transmis en un autre endroit.
Dans l'exemple présent, le module de sortie de document 15 328 prépare le document électronique muni d'une étiquette 336 pour une transmission. Comme dit plus haut, le document électronique 320 peut être stocké dans la base de données 302 ou envoyé ailleurs via un réseau, stocké sur un support magnétique amovible, etc. 20 Méthode d'exploitation de l'invention sur un scanner La Fig.4 est un organigramme décrivant un mise en oeuvre méthodologique selon l'invention du scanner 25 décrit à titre d'exemple 300 illustré sur la Fig.3. Il sera fait référence aux éléments et repères de
référence de la Fig.3 dans l'exposé qui suit.
En 400, un document est scanné pour créer un document électronique. Le document électronique 320 30 peut être fourni au scanner 300 sous forme électronique via le module d'entrée/sortie 308. En 401, une analyse d'image multipassage est effectuée au cours de laquelle une (ou plusieurs) portion(s) du document électronique 320 est (sont) sélectionnée(s). L'analyse d'image 35 multipassage, en 401, au moyen du module d'algorithme - 17 de calcul 327, identifie et sélectionne une ou plusieurs portions du document pour enrichissement des étiquettes de métadonnées existantes ou augmentation de leur nombre. Ce processus peut être appliqué en 402, 5 affichage et aperçu du document, ou bien le document entier peut êtretraité sans qu'aucun algorithme de ce
type ne soit invoqué.
Une fois le document électronique 320 reçu par le scanner 300, le module d'interface 322 affiche au moins 10 une portion du document électronique 320 - un aperçu du
document - sur l'écran tactile 310, en 402.
Typiquement, la portion affichée du document 320 est une page du document électronique 320, la dimension de
la page dépendant de la dimension de l'affichage.
En 404, la décision est prise d'insérer ou non une étiquette de métadonnées 334 dans le document électronique 320. Si aucune étiquette de métadonnées 334 n'est requise (branche " non " en 404), le document est stocké, ou transféré, en 412. Si l'on a besoin 20 d'insérer une étiquette de métadonnées 334 dans le document électronique 320 (branche " oui " en 404), le
processus continue en 406.
En 406, on désigne un emplacement pour l'insertion d'une étiquette de métadonnées au moyen du crayon 326. 25 L'ensemble de touches 312 sert à entrer, en 408, les données de définition de l'étiquette de métadonnées 334. En 410, l'étiquette de métadonnées 334 est insérée dans le document électronique 320 pour créer le document électronique muni d'une étiquette 336. 30 Une fois le document électronique 320 muni d'une étiquette, il peut être stocké dans la base de données 302. Comme expliqué précédemment, au lieu de stocker le document électronique muni d'une étiquette 336 dans la 35 base de données 302, on peut le transmettre en un autre - 18 point, pour être pris en charge par un déroulement séquentiel de tâches ou par tout autre type de
traitement pseudo-parallèle.
Conclusion La mise en oeuvre des systèmes et méthodes décrits dans ce qui précède offre des moyens efficaces d'insertion d'étiquettes de métadonnées dans des 10 documents électroniques. Les documents papier sont scannés pour être archivés, après que des étiquettes de métadonnées qui en décrivent le contenu ont été insérées dans le document électronique obtenu. La recherche de documents, ainsi que d'autres traitements 15 de documents, sont grandement facilités par
l'utilisation de ces étiquettes de métadonnées.
Bien que l'invention ait été décrite dans un
langage de caractère structurel et méthodologique, il est entendu que l'invention définie par les 20 revendications qui suivent ne se limite nullement aux
caractères structurels ou méthodologiques décrits. Bien au contraire, ces caractères structurels et méthodologiques spécifiques sont proposés en tant que modes de mise en oeuvre préférés de l'invention 25 revendiquée.
Légendes des figures
(les corrections de numéros-références sont faites sur la base du texte de la description)
Fig.l. Systéme de traitement de documents 102 Base de données 104 Scanner 106 Processeur 108 E/S
COMM.
112 Touches 114 Affichage 116 Mémoire 117 Système d'exploitation 118 Module d'entrée document 120 Document électronique 122 Module d'interface 124 Gestionnaire de pointage 126 Dispositif de pointage 127 Module d'algorithme de calcul 128 Module de sortie document (référencé aussi 126 par erreur, au dessus de Database) Module d'insertion d'étiquettes 132 Liste d'étiquettes 134 Etiquette de métadonnées 136 Document électronique étiqueté (référencé aussi 130 par erreur, au dessus de Document output module) Fig. 2 Scannage document 201 Analyse d'image multipassage 202 Affichage aperçu document 204 Insertion étiquette ? Yes = Oui No = Non 206 Affichage liste d'étiquettes 208 Choix étiquette 210 Insertion étiquette 212 Stockage document Fig. 3 300 Scanner 302 Base de données 304 Document papier 306 Processeur
308 E/S
310 Ecran tactile 312 Touches 314 Mécanisme de scannage 316 Mémoire 317 Système d'exploitation 318 Module d'entrée document 320 Document électronique 322 Module d'interface 324 Gestionnaire de crayon 326 Crayon 327 Module algorithme de calcul 328 Module de sortie document (référencé aussi 326 par erreur, au dessus de Database) 330 Module d'insertion d'étiquettes 334 Etiquette de métadonnées 336 Document électronique étiqueté Fig.
4 400 Scannage document 401 Analyse d'image multipassage 402 Affichage aperçu document 404 Insertion étiquette ? Yes = Oui No = Non 406 Choix emplacement pour étiquette 408 Définition étiquette 410 Insertion étiquette 412 Stockage document

Claims (10)

REVENDICATI ONS
1. Un scanner (300) comprenant: un convertisseur (308) de document (304) en un document électronique (320); un affichage (310); un module d'interface (322) configuré pour afficher au moins une portion du document électronique (320) sur l'affichage (310); un dispositif de pointage (326) configuré pour désigner le lieu d'insertion d'une étiquette de métadonnées dans le document électronique affiché (320); un module (330) d'insertion d'étiquettes de 15 métadonnées configuré pour insérer une étiquette de métadonnées (334) dans le document électronique (320) à l'emplacement désigné pour créer un document électronique (336) muni d'une étiquette et un module (327) de sortie configuré pour fournir le document électronique (336) muni d'une
étiquette de métadonnées.
2. Scanner (300) selon la revendication 1, dans 25 lequel: le module (330) d'insertion de étiquette de métadonnées comporte en outre une liste (334) d'un ou de plusieurs étiquettes de métadonnées; et une étiquette de métadonnées (334) est choisie dans la liste d'étiquettes de métadonnées pour insertion dans le document
électronique (320).
3. Scanner selon la revendication 1, dans lequel -23 le module (330) d'insertion d'étiquettes de métadonnées est de plus configuré pour recevoir des entrées de l'utilisateur de façon à définir une étiquette de métadonnées (334) à positionner à l'emplacement du curseur.
4. Une méthode, comprenant les étapes consistant à: recevoir un document électronique (320) afficher une portion au moins du document électronique (320); insérer une étiquette de métadonnées (334) dans le document électronique (320) pour créer un document électronique (336) muni d'une étiquette 15 et
délivrer le document muni d'une étiquette.
5. Méthode selon la revendication 4, comprenant de plus l'étape consistant à sélectionner une ou 20 plusieurs portions du document électronique (320); et dans laquelle seules les portions sélectionnées sont subséquemment affichées, munies d'une
étiquette et délivrées.
6. Méthode selon la revendication 4, dans laquelle l'étape de réception d'un document électronique (320) comporte en outre: la réception d'un document papier (304); et le scannage du document papier (304) pour 30 créer un document électronique (320) lui correspondant.
7. Méthode selon la revendication 4, comprenant de plus les étapes consistant à: -24 afficher une liste d'étiquettes de métadonnées (334) contenant une ou plusieurs étiquette(s) de métadonnées (334); identifier une étiquette de métadonnés (334) dans la liste d'étiquettes de métadonnées; et dans laquelle l'étiquette de métadonnées (334) sélectionnée est l'étiquette de métadonnées
insérée dans le document électronique (320).
8. Un système (100) comprenant: un module d'entrée (118) configuré pour réceptionner un document électronique (120); un affichage (114); un module d'interface d'affichage (122) 15 configuré pour afficher une portion au moins du document électronique (120) sur l'affichage
(114);
un module d'insertion d'étiquettes de métadonnées (130) configuré pour placer une 20 étiquette de métadonnées (134) en un ou plusieurs emplacements du document électronique (120): et un module de sortie (126) configuré pour
délivrer le document électronique (120).
9. Système (100) selon la revendication 8,
comprenant de plus un module d'insertion d'étiquettes de métadonnées (130) configuré pour permettre à l'utilisateur d'identifier ladite une position ou lesdites plusieurs positions sur le 30 document électronique (120).
10. Système (100) selon la revendication 8, dans lequel: le module (130) d'insertion d'étiquettes de 35 métadonnées comporte en outre une liste d'étiquettes de métadonnées (132) contenant une ou plusieurs étiquettes de métadonnées (134); et dans lequel: une étiquette de métadonnées (134) est 5 choisie dans le liste d'étiquettes de métadonnées (132) pour insertion en ladite une position ou lesdites plusieurs positions sur le document
électronique (120).
FR0310128A 2002-08-27 2003-08-25 Systemes et procedes pour inserer une etiquette de metadonnees dans un document Pending FR2845236A1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/229,756 US20040044958A1 (en) 2002-08-27 2002-08-27 Systems and methods for inserting a metadata tag in a document

Publications (1)

Publication Number Publication Date
FR2845236A1 true FR2845236A1 (fr) 2004-04-02

Family

ID=31976309

Family Applications (2)

Application Number Title Priority Date Filing Date
FR0310128A Pending FR2845236A1 (fr) 2002-08-27 2003-08-25 Systemes et procedes pour inserer une etiquette de metadonnees dans un document
FR0310167A Pending FR2845237A1 (fr) 2002-08-27 2003-08-26 Systemes et procedes pour inserer une etiquette metadonnees dans un document

Family Applications After (1)

Application Number Title Priority Date Filing Date
FR0310167A Pending FR2845237A1 (fr) 2002-08-27 2003-08-26 Systemes et procedes pour inserer une etiquette metadonnees dans un document

Country Status (2)

Country Link
US (1) US20040044958A1 (fr)
FR (2) FR2845236A1 (fr)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050210416A1 (en) * 2004-03-16 2005-09-22 Maclaurin Matthew B Interactive preview of group contents via axial controller
US7689037B2 (en) * 2004-10-22 2010-03-30 Xerox Corporation System and method for identifying and labeling fields of text associated with scanned business documents
US7877420B2 (en) * 2005-06-24 2011-01-25 Microsoft Corporation Methods and systems for incorporating meta-data in document content
US8171394B2 (en) * 2005-06-24 2012-05-01 Microsoft Corporation Methods and systems for providing a customized user interface for viewing and editing meta-data
KR100648926B1 (ko) * 2005-07-11 2006-11-27 삼성전자주식회사 사용자 식별 정보 부가기능을 갖는 복합기 및 그 방법
US7831913B2 (en) * 2005-07-29 2010-11-09 Microsoft Corporation Selection-based item tagging
US20090070200A1 (en) * 2006-02-03 2009-03-12 August Steven H Online qualitative research system
US8488146B2 (en) * 2006-05-12 2013-07-16 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus and computer-readable storage medium
JP4980691B2 (ja) * 2006-10-18 2012-07-18 株式会社リコー 画像形成システム、グループウェアサーバ、画像形成装置、画像形成方法、画像形成プログラム
US10380231B2 (en) * 2006-05-24 2019-08-13 International Business Machines Corporation System and method for dynamic organization of information sets
US8026929B2 (en) * 2006-06-26 2011-09-27 University Of Southern California Seamlessly overlaying 2D images in 3D model
US10157368B2 (en) * 2006-09-25 2018-12-18 International Business Machines Corporation Rapid access to data oriented workflows
US7788247B2 (en) 2007-01-12 2010-08-31 Microsoft Corporation Characteristic tagging
US20080207007A1 (en) 2007-02-27 2008-08-28 Air Products And Chemicals, Inc. Plasma Enhanced Cyclic Chemical Vapor Deposition of Silicon-Containing Films
US20080218808A1 (en) * 2007-03-07 2008-09-11 Altep, Inc. Method and System For Universal File Types in a Document Review System
US7933889B2 (en) * 2007-05-15 2011-04-26 Palo Alto Research Center Incorporated Method and system for metadata-driven document management and access control
US20090245691A1 (en) * 2008-03-31 2009-10-01 University Of Southern California Estimating pose of photographic images in 3d earth model using human assistance
US8925822B2 (en) * 2008-09-24 2015-01-06 Microsoft Corporation Encoding, updating, and decoding barcodes in a document
US8370628B2 (en) * 2009-07-16 2013-02-05 Oracle International Corporation Document collaboration system with alternative views
US20120324345A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Transitioning between an Editing View and a Backstage View of an Electronic Document
US10043022B2 (en) 2012-03-05 2018-08-07 R.R. Donnelley & Sons Company Systems and methods for digital content delivery
US9952742B2 (en) * 2013-03-14 2018-04-24 Google Llc Providing trending information to users
US9323447B2 (en) 2013-10-15 2016-04-26 Sharp Laboratories Of America, Inc. Electronic whiteboard and touch screen method for configuring and applying metadata tags thereon
US10013411B2 (en) * 2014-04-30 2018-07-03 Adobe Systems Incorporated Automating data entry for fields in electronic documents
US20150347352A1 (en) * 2014-06-02 2015-12-03 Microsoft Technology Licensing, Llc Form preview in a development environment
US9858349B2 (en) 2015-02-10 2018-01-02 Researchgate Gmbh Online publication system and method
US9753922B2 (en) 2015-05-19 2017-09-05 Researchgate Gmbh Enhanced online user-interaction tracking
US10997362B2 (en) * 2016-09-01 2021-05-04 Wacom Co., Ltd. Method and system for input areas in documents for handwriting devices
US11099716B2 (en) * 2016-12-23 2021-08-24 Realwear, Inc. Context based content navigation for wearable display
US11507216B2 (en) 2016-12-23 2022-11-22 Realwear, Inc. Customizing user interfaces of binary applications
JP2022137608A (ja) * 2021-03-09 2022-09-22 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US11797750B2 (en) * 2022-03-24 2023-10-24 Global Graphics Software Limited Methods and systems for identifying and tagging outlined or converted text

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6003048A (en) * 1995-04-27 1999-12-14 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
GB2312973B (en) * 1996-05-08 2000-05-03 Ibm Programming aid
JP3270351B2 (ja) * 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
JP3182362B2 (ja) * 1997-02-07 2001-07-03 松下電器産業株式会社 簡易ファイリング装置
US20010029513A1 (en) * 1997-03-05 2001-10-11 Hideyuki Kuwano Integrated apparatus and system for storing, retrieving, and transmitting documents using document IDs and document ID marks
AUPO710597A0 (en) * 1997-06-02 1997-06-26 Knowledge Horizons Pty. Ltd. Methods and systems for knowledge management
US5996893A (en) * 1997-10-28 1999-12-07 Eastman Kodak Company Method and apparatus for visually identifying an area on a photograph or image where digital data is stored
WO2000068830A2 (fr) * 1999-05-07 2000-11-16 Argo Interactive Limited Modification d'un fichier de donnees representant un document dans une hierarchie liee de documents
JP2002202975A (ja) * 2000-11-02 2002-07-19 Canon Inc データ検索装置及び方法
WO2003038660A2 (fr) * 2001-10-31 2003-05-08 Essibuy.Com Systemes et procedes de generation de references electroniques interactives

Also Published As

Publication number Publication date
US20040044958A1 (en) 2004-03-04
FR2845237A1 (fr) 2004-04-02

Similar Documents

Publication Publication Date Title
FR2845236A1 (fr) Systemes et procedes pour inserer une etiquette de metadonnees dans un document
US8867779B2 (en) Image tagging user interface
US9020183B2 (en) Tagging images with labels
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
KR101319742B1 (ko) 메타데이터의 문서 적용 방법 및 컴퓨터 판독가능 매체
JP4746136B2 (ja) ランク・グラフ
CN100382096C (zh) 文档扫描设备及方法
US9928242B2 (en) Managing the content of shared slide presentations
US20040216057A1 (en) System and method for grouping and organizing pages of an electronic document into pre-defined catagories
US20150277686A1 (en) Systems and Methods for the Real-Time Modification of Videos and Images Within a Social Network Format
US11989244B2 (en) Shared user driven clipping of multiple web pages
FR2822973A1 (fr) Procede, systeme et produit logiciel pour creer et visualiser un fichier graphique intelligent comprenant des informations relatives a des pieces
US20090327226A1 (en) Library description of the user interface for federated search results
CA2668306A1 (fr) Methode et systeme d'application de metadonnees a des jeux de donnees ou a des objets de fichiers
FR3069075A1 (fr) Systeme et procede pour integrer du contenu de message dans un dispositif cible de traitement de donnees
JP2009200699A (ja) 画像処理装置および画像処理方法
CN108921016B (zh) 一种基于图像识别的图书评分获取方法、电子设备及存储介质
US20230244359A1 (en) Display of data in images as data structures
EP1242911B1 (fr) Dispositif informatique, procede et produit logiciel pour le remplissage d'imprimes par ordinateur
US20140101191A1 (en) Performing a Search for a document
JP7501255B2 (ja) 文書検索システム、文書検索方法およびプログラム
KR101886182B1 (ko) 내용 기반 이미지 검색을 위한 질의 이미지 생성 방법 및 시스템
WO2008006999A1 (fr) Systeme et procede de gestion d'informations
CN117743686A (zh) 目标推送方法、装置和计算机可读存储介质
Denoue et al. FormCracker: interactive web-based form filling