FR2922338A1 - Procede et systeme d'annotation de documents multimedia - Google Patents
Procede et systeme d'annotation de documents multimedia Download PDFInfo
- Publication number
- FR2922338A1 FR2922338A1 FR0707100A FR0707100A FR2922338A1 FR 2922338 A1 FR2922338 A1 FR 2922338A1 FR 0707100 A FR0707100 A FR 0707100A FR 0707100 A FR0707100 A FR 0707100A FR 2922338 A1 FR2922338 A1 FR 2922338A1
- Authority
- FR
- France
- Prior art keywords
- sections
- annotation
- automatic
- section
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000006870 function Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 235000019580 granularity Nutrition 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 101100409463 Rattus norvegicus Prpf18 gene Proteins 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Un procédé d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comporte les étapes de :. annotation manuelle (11) d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation,. création automatique (15) d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, ladite création automatique étant réalisée par un apprentissage itératif basé sur la sélection de sections pertinentes,. annotation automatique (23) d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation
Description
PROCEDE ET SYSTEME D'ANNOTATION DE DOCUMENTS MULTIMEDIA.
La présente invention concerne un procédé et un système d'annotation de documents multimédia ainsi qu'un produit programme d'ordinateur pour mettre en oeuvre le procédé.
Un système d'annotation est un système qui permet d'ajouter de l'information de haut niveau appelée métadonnées sur un document multimédia, c'est-à-dire un document textuel, d'image, audio et/ou vidéo. Les annotations sont de granularités diverses et s'appliquent à un document complet comme à une section quelconque d'un document. Elles sont aussi de nature variée. Par exemple, les annotations sont de type temporel, spatial, sémantique, etc. et s'appliquent soit à une section de document, soit à plusieurs sections dans le cas de l'extraction de relation. L'annotation permet ensuite des traitements avancés sur les documents. Par exemple, elle permet le filtrage par rapport aux annotations, des raisonnements, ou des recherches avancées sur les annotations. L'annotation est généralement réalisée de façon manuelle par une personne chargée de la lecture des documents. L'annotation manuelle de documents est cependant une tâche particulièrement chronophage. Aussi, dans certains cas, l'annotation est réalisée de façon complètement automatique mais alors aucune amélioration du système au cours du temps n'est possible, sauf à changer de version du moteur d'annotation. Tous les systèmes automatiques sont basés sur un modèle d'annotation qui contient les relations entre les annotations et les caractéristiques du document, ou d'une partie/section du document. Ainsi quand un nouveau document est à annoter, le système recherche des caractéristiques identiques à celles contenues dans le modèle pour appliquer au document les annotations correspondantes. De façon générale, une plateforme d'annotation sémantique se base sur la mise en relation (en anglais matching ) des instances d'une ontologie de domaine avec le contenu d'un document, avec généralement une étape de désambiguïsation sémantique permettant de trouver la meilleure instance de l'ontologie en fonction du contexte de la section à annoter.
Certaines plateformes d'annotation permettent l'apprentissage d'un modèle d'annotation à partir d'exemples. Dans ce cas, les modèles générés sont souvent peu compréhensibles d'un utilisateur non expert et ne peuvent pas être validés facilement par lui.
II serait ainsi souhaitable de définir un procédé et un système d'annotation qui combinent l'efficacité des systèmes automatiques avec la souplesse et la versatilité des systèmes manuels. Pour résoudre un ou plusieurs des inconvénients cités précédemment, un procédé d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comporte les étapes de : • annotation manuelle d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, ladite création automatique étant réalisée par un apprentissage itératif basé sur la sélection de sections pertinentes, • annotation automatique d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation. Ainsi, le procédé d'annotation crée avantageusement un modèle basé sur un ensemble d'annotations fournies par l'utilisateur. On comprend donc que, par une sélection adaptée des documents annotés manuellement, l'utilisateur a une influence déterminante sur la qualité de ce modèle.
Des caractéristiques ou des modes de réalisation particuliers de ce procédé sont : • il comporte en outre une étape de validation manuelle de l'annotation automatique, suivi d'une itération d'au moins l'étape de création automatique de modèle afin de remplacer le modèle d'annotation pour tenir compte des annotations validées, les étapes de création automatique, d'annotation automatique et de validation manuelle formant ainsi une boucle itérative d'amélioration du modèle d'annotation. • l'étape de création automatique comporte les sous-étapes : • sélection de la section de document la plus représentative de l'ensemble des sections annotées et la plus éloignée des sections précédemment sélectionnées, • ajustement de pondérations associées aux différentes sections, • suppression des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées. • une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations. • la minimisation du coût comporte les étapes itératives suivantes : • création d'un ensemble de sections actives initialisé à vide, • itération tant que la fonction de coût diminue des sous-étapes : • génération de l'ensemble des sections possibles sur les documents annotés, • calcul, pour chaque section sélectionnée, d'un gradient de la fonction de coût pour une pondération nulle, • ajout à l'ensemble des sections actives, de la ou les sections dont le gradient est maximum, • itération tant que les pondérations des sections de l'ensemble des sections actives évoluent des sous-étapes : o calcul de la fonction de coût et des gradients associés, o calcul des pondérations des sections de l'ensemble des sections actives par une méthode de descente de gradient.
Ainsi, le procédé permet avantageusement de créer une boucle itérative d'amélioration du modèle d'annotation car la validation et la correction éventuelle des annotations générées automatiquement permet d'une part de fournir de nouvelles données en entrée de la création automatique du modèle et d'autre part de valider la qualité du modèle par le nombre de corrections à apporter. Le procédé de création automatique du modèle permet également avantageusement de limiter au maximum le nombre de sections utilisées par celui-ci en ne conservant que celles qui sont les plus représentatives des liaisons du modèle. Il se base sur les modèles CRF décrits dans John Lafferty, Andrew McCallum et Fernando Pereira, "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data", Proceedings of the International Conference on Machine Learning (ICML-2001), 2001. Il se base également sur les modèles KCRF décrits dans John Lafferty, Xiaojin Zhu et Yan Liu, Kernel conditional random fields: representation and clique selection", ICML '04: Proceedings of the twenty-first international conference on Machine learning.
Cependant le procédé permet avantageusement de rendre ces modèles itératifs et incrémentaux. Dans un deuxième aspect de l'invention, un produit programme d'ordinateur comprend des instructions de code de programme enregistrées sur un support lisible par un ordinateur, pour mettre en oeuvre les étapes du procédé précédent lorsque ledit programme fonctionne sur un ordinateur. Dans un troisième aspect de l'invention, un système d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comporte : • des moyens d'interface avec un utilisateur adaptés pour annoter manuellement d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • des moyens de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, lesdits moyens de création automatique comportant des moyens d'apprentissage itératif basé sur la sélection de sections pertinentes, • des moyens d'annotation automatique d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation. Des caractéristiques ou des modes de réalisation particuliers de ce 5 système sont : • les moyens d'interface sont adaptés en outre pour valider manuellement l'annotation automatique, et en ce que les moyens de création automatique de modèle sont adaptés pour tenir compte des annotations validées. 10 • les moyens de création automatique comporte des moyens de : • sélection de la section de document la plus représentative de l'ensemble des sections existantes et la plus éloignée des sections précédemment sélectionnées, • ajustement de pondérations associées aux différentes sections, 15 • suppression des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées. • une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie 20 comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations. 25 L'invention sera mieux comprise à la lecture de la description qui suit, faite uniquement à titre d'exemple, et en référence aux figures en annexe dans lesquelles : - la figure 1 est une vue schématique d'un système d'annotation selon un mode de réalisation de l'invention ; et 30 - la figure 2 est un ordinogramme d'un procédé d'annotation selon un mode de réalisation de l'invention. En référence à la figure 1, un système d'annotation comporte un terminal 1 ayant une interface homme/machine 3. Cette interface 3 est adaptée pour annoter manuellement un document. Il est basé classiquement sur une interface matérielle de présentation d'information composée, par exemple, d'un écran, et sur des moyens de saisie d'information composés, par exemple, d'un clavier et d'une souris.
Cette interface 3 permet différentes opérations élémentaires liées à l'annotation manuelle de document. Elle permet ainsi de découper le document en une ou plusieurs sections homogènes sur lesquelles seront basées les annotations. Suivant le type de document, une section correspond à une granularité variable représentant une certaine homogénéité. Par exemple, une section correspond à un mot dans un texte ou à une séquence d'images dans une vidéo. Le découpage en sections est soit automatique, c'est-à-dire que le système effectue seul celui-ci, soit manuel et donc réalisé par l'opérateur au moyen de l'interface, soit semi-automatique permettant à l'opérateur de modifier un découpage préparé par le système. Une fois le document découpé en sections, l'interface 3 permet à l'utilisateur d'affecter à chaque section au moins une classe, ou type, d'annotation. Par exemple, l'utilisateur affecte des annotations syntaxiques à un texte et/ou des annotations sémantiques sous forme de classe d'une ontologie. Pour aider à cette affectation, l'interface comporte des outils d'aide à la sélection. Dans une forme relativement simple, ces outils peuvent n'être que des formulaires de liste permettant un choix d'annotation parmi une liste prédéfinie. Dans des formes plus sophistiquées, ces outils peuvent proposer des annotations en se basant sur une première analyse automatique du document ou de la section concernée, par exemple en utilisant un modèle d'annotation préexistant. L'interface homme/machine 3 comporte ainsi un éditeur spécialisé permettant d'ajouter, modifier ou supprimer des annotations à un document multimédia.
Le terminal 1 est connecté à un serveur d'apprentissage 5 par une liaison de données 6. Le serveur d'apprentissage 5 comporte des moyens 7 de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections.
Les moyens 7 de création automatique utilisent les documents annotés manuellement en provenance du terminal 1 comme paramètres d'entrée. Le serveur d'apprentissage 5 comporte également des moyens 9 d'annotation automatique d'un document non annoté par application du modèle d'annotation créé. Le fonctionnement du système va maintenant être décrit en relation avec la figure 2. Dans une étape 11, un utilisateur annote un document multimédia en utilisant le terminal 1 et l'interface homme-machine 3 adaptée. Le document annoté est envoyé en 13 au serveur d'apprentissage 5. Le serveur d'apprentissage 5 lance alors, étape 15, l'exécution des moyens 7 de création automatique de modèle. Ceux-ci exécutent de façon itérative les étapes suivantes : • sélection, étape 17, de la section du document la plus représentative de l'ensemble et la plus éloignée des sections ayant déjà été éventuellement sélectionnées. Par section éloignée, ou proche, d'une autre section, il faut entendre une distance au sens mathématique du terme définie dans une métrique des sections.
Ainsi, une section proche est une section qui comporte pratiquement les mêmes caractéristiques ou des caractéristiques très similaires d'autres sections. • ajustement, étape 19, des pondérations associées aux différentes sections sélectionnées, • suppression, étape 21, éventuelle des sections les moins représentatives de l'ensemble des documents ou des sections les plus proches des sections sélectionnées. Ces trois étapes 17, 19 et 21 de sélection, ajustement et suppression sont itérées jusqu'à obtenir un modèle satisfaisant, ce qui correspond, par exemple, à une minimisation d'une fonction de coût comme expliqué ci-dessous. Le modèle étant créé, un nouveau document est annoté, étape 23, automatiquement soit à la demande de l'utilisateur, soit dans le cadre d'un traitement par lots.
A l'étape 25, le document annoté automatiquement est envoyé sur le terminal 1 pour que l'utilisateur puisse étudier, et éventuellement modifier, à l'étape 27, les annotations proposées par le système. En particulier dans le cas où l'utilisateur modifie les annotations, l'étape 15 de lancement de la création de modèle est de nouveau exécutée en intégrant dans les données d'entrée de cette création le nouveau document avec ses annotations modifiées par l'utilisateur. Ainsi, par itérations successives alternant étape automatique de création de modèle, application du modèle sur un nouveau document et correction des annotations proposées par le modèle, le modèle est raffiné pour atteindre un niveau de qualité tel qu'aucune intervention de l'utilisateur n'est plus nécessaire. Un algorithme de création de modèle, ou d'apprentissage, particulièrement bien adapté au système d'annotation décrit ci-dessus va 15 maintenant être décrit. Mathématiquement, on considère un modèle comme exprimant la loi conditionnelle d'un graphe d'étiquettes Y (les annotations) en fonction d'un graphe d'observation X (les caractéristiques des documents multimédia). Cette loi conditionnelle s'exprime comme le produit de familles exponentielles 20 faisant intervenir des noyaux ou distances entre graphes, soit : 1 K P(YIX) = Z-exp E akK((x,}= k=1 La création du modèle consiste alors à minimiser la log vraisemblance d'un échantillon tout en limitant le nombre de noyaux à utiliser. Cette log vraisemblance, qui apparaît comme une fonction de coût, T K K f - 1og[Pä(vr,xr)]+ /2LLaiail . ,xj)tS(yi, r=1 i=1 j
La sélection des noyaux et le réglage des pondérations a; se fait selon l'algorithme itératif ci-dessous. Les noyaux sélectionnés sont alors ceux qui minimisent le gradient : 25 s'écrit : `eK(Y,x) = aiK(xi,xk)S(y1.yk)+ K(xt,xk)(f)(y'kIxt) ù 5(y}t,Yk)) .i= L'algorithme itératif de sélection des noyaux et de réglage des pondérations s'exprime en pseudo-langage :
• générer l'ensemble des noyaux possibles sur l'ensemble des documents annotés,
• initialiser l'ensemble A des noyaux actifs à vide,
• tant que le coût C continue à diminuer faire :
o sélectionner R noyaux aléatoirement parmi les M noyaux existants, R pouvant être égale à m ce qui correspond à la sélection de l'ensemble des noyaux, o calculer le gradient aC au point a; = 0 de chacun des R aa, noyaux sélectionnés, o ajouter le ou les noyaux dont le gradient aC est aa, maximum à l'ensemble des noyaux actifs A, o tant que les pondérations a; des noyaux de l'ensemble des noyaux actifs A continuent à évoluer faire ^ calculer le coût C et les gradients DC aa, ^ recalculer les valeurs des pondérations a; pour
k E [A] par une méthode de descente de gradient, telle que, par exemple, la méthode de quasi-
newton,
o fin tant que
• fin tant que
II est à noter que les noyaux correspondent aux sections de 25 documents annotés et constituent donc le modèle d'annotation.
L'invention a été illustrée et décrite en détail dans les dessins et la description précédente. Celle-ci doit être considérée comme illustrative et donnée à titre d'exemple et non comme limitant l'invention à cette seule description. 9 k 2.
De nombreuses variantes de réalisation sont possibles. Par exemple, la répartition entre terminal et serveur d'apprentissage peut correspondre en fait à une répartition fonctionnelle, toutes les fonctions du système se réalisant sur une station de travail programmée en conséquence.
On comprend également qu'un mode de réalisation correspond à une implémentation logicielle du procédé d'annotation et qu'ainsi un produit programme d'ordinateur comprend des instructions telles que, exécutées sur un ordinateur, le procédé d'annotation est mis en oeuvre. Cependant, il peut apparaître que pour des raisons techniques, telles que, par exemple, une recherche de rapidité d'exécution, le procédé peut également être mis en oeuvre sous forme matérielle, par exemple, par programmation d'un réseau de portes de type FPGA ( réseau de portes programmable par l'utilisateur) ou sous une forme combinée matérielle-logicielle selon les règles de conception bien connues de l'homme du métier.
Dans les revendications, le mot comprenant n'exclue pas d'autres éléments et l'article indéfini un/une n'exclut pas une pluralité.
Claims (10)
1. Procédé d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, caractérisé en ce qu'il comporte les étapes de : • annotation manuelle (11) d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • création automatique (15) d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, ladite création automatique étant réalisée par un apprentissage itératif basé sur la sélection de sections pertinentes, • annotation automatique (23) d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation.
2. Procédé selon la revendication 1, caractérisé en ce qu'il comporte en outre une étape de validation manuelle (27) de l'annotation automatique, suivi d'une itération d'au moins l'étape de création automatique de modèle afin de remplacer le modèle d'annotation pour tenir compte des annotations validées, les étapes de création automatique, d'annotation automatique et de validation manuelle formant ainsi une boucle itérative d'amélioration du modèle d'annotation.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'étape de création automatique (15) comporte les sous-étapes : • sélection (17) de la section de document la plus représentative de l'ensemble des sections annotées et la plus éloignée des sections précédemment sélectionnées, • ajustement (19) de pondérations associées aux différentes sections, • suppression (21) des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées.
4. Procédé selon la revendication 3, caractérisé en ce qu'une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations.
5. Procédé selon la revendication 4, caractérisé en ce que la minimisation du coût comporte les étapes itératives suivantes : • création d'un ensemble de sections actives initialisé à vide, • itération tant que la fonction de coût diminue des sous-étapes : • génération de l'ensemble des sections possibles sur les documents annotés, • calcul, pour chaque section sélectionnée, d'un gradient de la fonction de coût pour une pondération nulle, • ajout à l'ensemble des sections actives, de la ou les sections dont le 20 gradient est maximum, • itération tant que les pondérations des sections de l'ensemble des sections actives évoluent des sous-étapes : o calcul de la fonction de coût et des gradients associés, o calcul des pondérations des sections de l'ensemble des 25 sections actives par une méthode de descente de gradient.
6. Produit programme d'ordinateur comprenant des instructions de code de programme enregistrées sur un support lisible par un ordinateur, pour 30 mettre en oeuvre les étapes du procédé selon l'une quelconque des revendications 1 à 5 lorsque ledit programme fonctionne sur un ordinateur.
7. Système d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, caractérisé en ce qu'il comporte : • des moyens (3) d'interface avec un utilisateur adaptés pour annoter manuellement d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • des moyens (7) de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, lesdits moyens de création automatique comportant des moyens d'apprentissage itératif basé sur la sélection de sections pertinentes, • des moyens (9) d'annotation automatique d'un document non annoté de 15 la pluralité de documents multimédia par application du modèle d'annotation.
8. Système selon la revendication 7, caractérisé en ce que les moyens d'interface sont adaptés en outre pour valider manuellement l'annotation 20 automatique, et en ce que les moyens de création automatique de modèle sont adaptés pour tenir compte des annotations validées.
9. Système selon la revendication 7 ou 8, caractérisé en ce que les moyens de création automatique comporte des moyens de : 25 • sélection de la section de document la plus représentative de l'ensemble des sections existantes et la plus éloignée des sections précédemment sélectionnées, • ajustement de pondérations associées aux différentes sections, • suppression des sections ayant des pondérations inférieures à une 30 valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées.
10. Système selon la revendication 9, caractérisé en qu'une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0707100A FR2922338A1 (fr) | 2007-10-10 | 2007-10-10 | Procede et systeme d'annotation de documents multimedia |
PCT/FR2008/051823 WO2009053613A1 (fr) | 2007-10-10 | 2008-10-08 | Procede et systeme d'annotation de documents multimedia |
DE112008002713T DE112008002713T8 (de) | 2007-10-10 | 2008-10-08 | Annotations-Verfahren und Annotations-System für Multimedia-Dokumente |
GB1007180A GB2466752A (en) | 2007-10-10 | 2008-10-08 | Method and system for annotating multimedia documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0707100A FR2922338A1 (fr) | 2007-10-10 | 2007-10-10 | Procede et systeme d'annotation de documents multimedia |
Publications (1)
Publication Number | Publication Date |
---|---|
FR2922338A1 true FR2922338A1 (fr) | 2009-04-17 |
Family
ID=39276102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0707100A Pending FR2922338A1 (fr) | 2007-10-10 | 2007-10-10 | Procede et systeme d'annotation de documents multimedia |
Country Status (4)
Country | Link |
---|---|
DE (1) | DE112008002713T8 (fr) |
FR (1) | FR2922338A1 (fr) |
GB (1) | GB2466752A (fr) |
WO (1) | WO2009053613A1 (fr) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110880021B (zh) * | 2019-11-06 | 2021-03-16 | 创新奇智(北京)科技有限公司 | 模型辅助式数据标注系统及标注方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040205482A1 (en) * | 2002-01-24 | 2004-10-14 | International Business Machines Corporation | Method and apparatus for active annotation of multimedia content |
-
2007
- 2007-10-10 FR FR0707100A patent/FR2922338A1/fr active Pending
-
2008
- 2008-10-08 DE DE112008002713T patent/DE112008002713T8/de not_active Ceased
- 2008-10-08 GB GB1007180A patent/GB2466752A/en not_active Withdrawn
- 2008-10-08 WO PCT/FR2008/051823 patent/WO2009053613A1/fr active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040205482A1 (en) * | 2002-01-24 | 2004-10-14 | International Business Machines Corporation | Method and apparatus for active annotation of multimedia content |
Non-Patent Citations (4)
Title |
---|
DENOYER L ET AL ASSOCIATION FOR COMPUTING MACHINERY: "Structured Multimedia Document Classification", PROCEEDINGS OF THE 2003 ACM SYMPOSIUM ON DOCUMENT ENGINEERING. DOCENG 2003. GRENOBLE, FRANCE, NOV. 20 - 22, 2003, ACM SYMPOSIUM ON DOCUMENT ENGINEERING, NEW YORK, NY : ACM, US, 20 November 2003 (2003-11-20), pages 153 - 160, XP002382731, ISBN: 1-58113-724-9 * |
GRILHERES B ET AL: "A Platform for Semantic Annotations and Ontology Population Using Conditional Random Fields", WEB INTELLIGENCE, 2005. PROCEEDINGS. THE 2005 IEEE/WIC/ACM INTERNATIONAL CONFERENCE ON COMPIEGNE, FRANCE 19-22 SEPT. 2005, PISCATAWAY, NJ, USA,IEEE, 19 September 2005 (2005-09-19), pages 790 - 793, XP010841825, ISBN: 0-7695-2415-X * |
HANNA WALLACH: "Efficient Training of Conditional Random Fields", MASTER OF SCIENCE THESIS, 2002, University of Edinburgh, UK, XP002476899, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/wallach02efficient.html> [retrieved on 20080416] * |
JOHN LAFFERTY, ANDREW MCCALLUM, FERNANDO PEREIRA: "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data", PROC. 18TH INTERNATIONAL CONF. ON MACHINE LEARNING, 28 June 2001 (2001-06-28) - 1 July 2001 (2001-07-01), Williamstown, MA, USA, XP002476900, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/lafferty01conditional.html> [retrieved on 20080416] * |
Also Published As
Publication number | Publication date |
---|---|
GB2466752A (en) | 2010-07-07 |
GB201007180D0 (en) | 2010-06-09 |
DE112008002713T5 (de) | 2010-11-11 |
DE112008002713T8 (de) | 2011-03-24 |
WO2009053613A1 (fr) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11263250B2 (en) | Method and system for analyzing entities | |
CN110688553A (zh) | 基于数据分析的信息推送方法、装置、计算机设备及存储介质 | |
FR2966618A1 (fr) | Traduction automatique utilisant un echantillonnage et des alignements de biphrases qui se recoupent | |
WO2002067142A2 (fr) | Dispositif d'extraction d'informations d'un texte a base de connaissances | |
FR2698977A1 (fr) | Système d'information multimédia. | |
FR2914081A1 (fr) | Procede de protection de documents numeriques contre des utilisations non autorisees. | |
EP2996040A1 (fr) | Procédé de détermination par optimisation d'une architecture multi-coeurs | |
FR2922338A1 (fr) | Procede et systeme d'annotation de documents multimedia | |
FR2901037A1 (fr) | Procede et dispositif de generation de motifs structurels de reference aptes a representer des donnees hierarchisees | |
WO2021257195A1 (fr) | Génération de commentaire sur la base d'un graphique thématique | |
CN112559680A (zh) | 基于多层次特征提取的文本分类方法、模型及存储介质 | |
WO2020165519A1 (fr) | Procédé de construction de signatures comportementales de logiciels | |
WO2015197924A1 (fr) | Procédé de copier-coller relationnel d´entités d´un système modélisé | |
FR2986882A1 (fr) | Procede d'identification d'un ensemble de phrases d'un document numerique, procede de generation d'un document numerique, dispositif associe | |
Samii et al. | Iterative learning: Leveraging the computer as an on-demand expert artist | |
EP1713243A1 (fr) | Procédé et système de génération automatique de composants logiciels pour la conception de services vocaux | |
WO2024133050A1 (fr) | Procédé d'analyse non supervisée d'un ensemble de données textuelles lié à l'exécution de processus métiers | |
WO2007036654A1 (fr) | Structure de donnees et procede de creation d'une documentation de logiciel | |
FR3132155A3 (fr) | Procédé de sélection automatique et d’affichage de la sélection d’un condensé significatif dans un contenu textuel | |
FR3137472A1 (fr) | Procédé d’appariement d’un ensemble à évaluer et d’une liste de référence, moteur d’appariement et programme d’ordinateur correspondants. | |
EP3114597A1 (fr) | Procédé d'analyse d'une pluralité de messages, produit programme d'ordinateur et dispositif associés | |
CN116306676A (zh) | 在线业务应用的信息处理方法及人工智能服务系统 | |
WO2020136264A1 (fr) | Procédé de génération d'un exemple adversaire pour un modèle d'apprentissage automatique, procédé de robustification, dispositif de génération et programme produit ordinateur associés | |
FR2880714A1 (fr) | Procede et systeme de codage sous forme d'un treillis d'une hierarchie de concepts appartenant a une ontologie | |
FR2914453A1 (fr) | Procedes et dispositifs de gestion de version de traitements de documents de type xml |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
CD | Change of name or company name | ||
CD | Change of name or company name |
Owner name: AIRBUS DS SAS, FR Effective date: 20150106 |
|
PLFP | Fee payment |
Year of fee payment: 9 |
|
PLFP | Fee payment |
Year of fee payment: 10 |
|
PLFP | Fee payment |
Year of fee payment: 11 |
|
TP | Transmission of property |
Owner name: AIRBUS DEFENCE AND SPACE SAS, FR Effective date: 20180123 |
|
PLFP | Fee payment |
Year of fee payment: 12 |
|
RX | Complete rejection |
Effective date: 20200123 |