FR3051936A1

FR3051936A1 - METHOD AND DEVICE FOR CLASSIFYING MULTIMEDIA CONTENT, TERMINAL AND CORRESPONDING COMPUTER PROGRAM

Info

Publication number: FR3051936A1
Application number: FR1654884A
Authority: FR
Inventors: Youssef Meguebli; Ahmad Chami
Original assignee: Orange SA
Current assignee: Orange SA
Priority date: 2016-05-31
Filing date: 2016-05-31
Publication date: 2017-12-01

Abstract

L'invention concerne un procédé de classement d'un contenu multimédia (210, 220, 230) mettant en œuvre une taxonomie de classification de contenus. Un tel procédé comprend les étapes suivantes : - personnalisation de la taxonomie de classification comprenant une sélection par l'utilisateur (20) d'au moins deux catégories d'intérêt (21, 22, 23) parmi les catégories de classification de la taxonomie ; - classification (19) du contenu multimédia dans la taxonomie personnalisée (18) comprenant : ○ une restitution à l'utilisateur, en association, d'au moins une catégorie dans laquelle classer ledit contenu multimédia, et d'un score d'appartenance du contenu multimédia à la catégorie associée ; ○ un classement du contenu multimédia.The invention relates to a method for classifying a multimedia content (210, 220, 230) implementing a content classification taxonomy. Such a method comprises the following steps: - customizing the classification taxonomy comprising a selection by the user (20) of at least two categories of interest (21, 22, 23) among the classification categories of the taxonomy; - classification (19) of the multimedia content in the personalized taxonomy (18) comprising: ○ a reproduction to the user, in association, of at least one category in which to classify said multimedia content, and a membership score of the multimedia content to the associated category; ○ a ranking of the multimedia content.

Description

Procédé et dispositif de classement de contenus multimédia, terminal et programme d'ordinateur correspondants. 1. Domaine de l'inventionMethod and device for classifying multimedia contents, terminal and corresponding computer program. 1. Field of the invention

Le domaine de l'invention est celui de la navigation multimédia, et plus particulièrement celui de la classification de contenus multimédia. De tels contenus peuvent être du texte (factures, articles scientifiques, ...), du son (ou de l'audio), des images, des vidéos, des applications/services ou encore toute combinaison de ces différents éléments. L'invention s'applique notamment de façon privilégiée au classement et à l'archivage de contenus multimédia, qu'il s'agisse de contenus générés par un utilisateur, ou obtenus par ses soins. Un tel classement peut se matérialiser par un stockage physique de contenus multimédia sur un terminal d'utilisateur, ou sur un serveur distant, ou par une simple annotation des contenus multimédia classés, par exemple par ajout de métadonnées ou d'étiquettes aux contenus. L'invention peut notamment être mise en œuvre dans un terminal doté d'une interface utilisateur et d'une interface graphique, par exemple une tablette, un téléphone mobile, un smartphone (« téléphone intelligent »), un ordinateur personnel, une télévision connectée à un réseau de communication, etc. 2. Art antérieur et ses inconvénientsThe field of the invention is that of multimedia navigation, and more particularly that of the classification of multimedia content. Such content can be text (invoices, scientific articles, ...), sound (or audio), images, videos, applications / services or any combination of these elements. The invention applies in particular to the ranking and archiving of multimedia content, whether content generated by a user, or obtained by him. Such a classification can be materialized by a physical storage of multimedia content on a user terminal, or on a remote server, or by a simple annotation of the classified multimedia contents, for example by adding metadata or labels to the contents. The invention may in particular be implemented in a terminal with a user interface and a graphical interface, for example a tablet, a mobile phone, a smartphone ("smart phone"), a personal computer, a connected television to a communication network, etc. 2. Prior art and its disadvantages

Aujourd'hui, lorsqu'un utilisateur veut ranger un contenu multimédia (par exemple une facture, une photo, un article scientifique, une vidéo...) dans un système informatique d'organisation de données (ordinateur, serveur, smartphone, ou même sur le « cloud »...), il doit tout d'abord identifier le dossier le plus approprié pour un tel classement, ce qui peut s'avérer pénible et fastidieux. Si, après une recherche qui peut être longue, il ne parvient pas à identifier de dossier approprié, il doit créer un nouveau dossier, dont le thème correspondra à celui du contenu à classer.Today, when a user wants to store multimedia content (for example an invoice, a photo, a scientific article, a video ...) in a data organization computer system (computer, server, smartphone, or even on the "cloud" ...), it must first identify the most appropriate file for such a ranking, which can be painful and tedious. If, after a search that can be long, it fails to identify appropriate folder, it must create a new folder, whose theme will match that of the content to be classified.

Cette problématique se pose, aussi bien pour les contenus multimédia générés par l'utilisateur (rapports, photos de vacances, courriers...), que pour les données « consommées » par l'utilisateur (factures reçues, articles téléchargés, vidéo à la demande...).This problem arises, as well for the multimedia contents generated by the user (reports, vacation photos, letters ...), as for the data "consumed" by the user (received invoices, downloaded articles, video to the request...).

Ce classement manuel de contenus par l'utilisateur doit se faire document par document, et constitue une tâche fastidieuse. En outre, lorsque l'utilisateur recherche un contenu précédemment classé, il est fréquent qu'il éprouve des difficultés à retrouver le dossier dans lequel il l'avait rangé. En effet, il est courant que l'utilisateur oublie la stratégie qu'il avait adoptée pour son classement (classification par source, classification par domaine...), et qu'il soit donc perdu dans la recherche de ses contenus.This manual classification of content by the user must be document by document, and is a tedious task. In addition, when the user searches for content previously classified, it is common that he has difficulty finding the file in which he had stored. Indeed, it is common that the user forgets the strategy he had adopted for its classification (classification by source, classification by domain ...), and so it is lost in the search for its contents.

Enfin, les centres d'intérêt et les besoins de l'utilisateur évoluant dans le temps, Il est fréquent qu'il doive faire évoluer l'arborescence de classement créée à l'origine, pour y ajouter de nouveaux répertoires, ou en supprimer d'autres ; un tel système de classement figé manque donc de souplesse et d'évolutivité.Finally, the interests and needs of the user changing over time, It is common that he must change the classification tree created originally, to add new directories, or delete d others; such a fixed classification system therefore lacks flexibility and scalability.

Pour améliorer cette situation, le document de brevet US 6, 621, 930 B1 propose un système de classification automatique de documents fondée sur leur contenu textuel. Un tel système repose sur une phase d'apprentissage préliminaire, permettant de définir, sur la base d'un ensemble de documents d'apprentissage, un ensemble de catégories dans lesquelles classer les documents textuels. Lorsque l'utilisateur souhaite classer un nouveau document, son contenu textuel est analysé pour déterminer automatiquement la catégorie, construite lors de la phase d'apprentissage, dans laquelle II doit être rangé. Si aucune catégorie appropriée n'est détectée. Il est automatiquement classé dans une catégorie neutre, destinée à recevoir tous les documents qui ne correspondent à aucune des catégories élaborées lors de la phase d'apprentissage.To improve this situation, US Patent 6,621,930 B1 proposes an automatic document classification system based on their textual content. Such a system is based on a preliminary learning phase, making it possible to define, on the basis of a set of learning documents, a set of categories in which to classify the textual documents. When the user wishes to classify a new document, its textual content is analyzed to automatically determine the category, constructed during the learning phase, in which it must be stored. If no appropriate category is detected. It is automatically classified in a neutral category, intended to receive all documents that do not correspond to any of the categories developed during the learning phase.

Cette technique présente plusieurs inconvénients. Tout d'abord, elle repose sur une phase d'apprentissage, qui est longue et fastidieuse. En outre, l'arborescence de classement proposée à l'utilisateur est figée à l'issue de cette phase d'apprentissage, et dépend fortement de la diversité et du nombre de documents d'apprentissage utilisés : si les documents de l'utilisateur se rapportent à des catégories qui n'ont pas été créées lors de la phase d'apprentissage (car aucun des documents d'apprentissage ne s'y rapportaient), ils vont alors tous être classés automatiquement dans la catégorie neutre, ce qui constitue un classement peu pertinent pour l'utilisateur. Cette technique ne permet donc pas à l'utilisateur une classification personnalisée de ses documents, qui soit adaptée à ses besoins.This technique has several disadvantages. First, it is based on a learning phase, which is long and tedious. In addition, the classification tree proposed to the user is frozen at the end of this learning phase, and depends greatly on the diversity and the number of learning documents used: if the user's documents are categories that were not created during the learning phase (because none of the learning documents related to them), they will all be automatically ranked in the neutral category, which not relevant to the user. This technique therefore does not allow the user a personalized classification of his documents, which is adapted to his needs.

Le document de brevet US 7, 047, 236 B2 propose également une technique permettant de déduire automatiquement des règles permettant de mettre en correspondance des contenus et des catégories de classement. Cet établissement de règles repose sur la recherche de mots clés dans les contenus, et sur le classement des contenus dans des catégories, en fonction des mots clés qu'ils contiennent, et d'un score d'occurrence. A nouveau, cette technique repose sur une arborescence de classement qui est figée et non évolutive. Elle ne permet pas à l'utilisateur de personnaliser la classification en catégories de ses contenus, et peut donc s'avérer fastidieuse à utiliser si l'arborescence proposée n'est pas adaptée aux centres d'intérêt de l'utilisateur.US Patent 7,047,236 B2 also provides a technique for automatically inferring rules for matching content and rating categories. This rule setting is based on finding keywords in content, and ranking content into categories, based on the keywords they contain, and an occurrence score. Again, this technique is based on a ranking tree that is fixed and not scalable. It does not allow the user to customize the classification into categories of its contents, and can therefore be tedious to use if the proposed tree is not adapted to the interests of the user.

Il existe donc un besoin d'une technique de classification et de classement de contenus multimédia qui ne présente pas ces différents inconvénients de l'art antérieur. Notamment, il existe un besoin d'une telle technique, qui permette à l'utilisateur une personnalisation de son classement, et qui soit évolutive. 3. Exposé de l'invention L'invention répond à ce besoin en proposant un procédé de classement d'un contenu multimédia mettant en œuvre une taxonomie de classification de contenus. Un tel procédé comprend les étapes suivantes mises en œuvre par un processeur : une étape préalable de personnalisation de la taxonomie de classification comprenant : O une présentation à un utilisateur d'une pluralité de catégories de classification de la taxonomie ; O une sélection par l'utilisateur d'au moins deux catégories d'intérêt parmi la pluralité de catégories présentée ; une étape de classification du contenu multimédia dans la taxonomie de classification personnalisée comprenant : O une restitution à l'utilisateur, en association : d'au moins une catégorie de la taxonomie de classification personnalisée dans laquelle classer le contenu multimédia, et d'un score d'appartenance du contenu multimédia à la catégorie associée ; O un classement du contenu multimédia dans une catégorie choisie parmi : la ou les catégorie(s) restituée(s) à l'utilisateur ; une autre catégorie de la taxonomie de classification personnalisée choisie par l'utilisateur.There is therefore a need for a technique for classifying and classifying multimedia contents that does not have these various disadvantages of the prior art. In particular, there is a need for such a technique, which allows the user a customization of its classification, and which is scalable. 3. DISCLOSURE OF THE INVENTION The invention responds to this need by proposing a method of classifying a multimedia content implementing a content classification taxonomy. Such a method comprises the following steps implemented by a processor: a prior step of customizing the classification taxonomy comprising: O a presentation to a user of a plurality of classification categories of the taxonomy; O a selection by the user of at least two categories of interest from the plurality of categories presented; a step of classifying the multimedia content in the custom classification taxonomy comprising: O a rendering to the user, in association with: at least one category of the custom classification taxonomy in which to classify the multimedia content, and a score the membership of the multimedia content to the associated category; O a ranking of the multimedia content in a category selected from: the category or categories returned to the user; another category of the custom classification taxonomy chosen by the user.

Ainsi, l'invention repose sur une approche nouvelle et inventive de la classification de contenus multimédia. En effet, l'invention propose à l'utilisateur de pouvoir personnaliser la taxonomie de classification de ses contenus multimédia, afin qu'elle soit parfaitement adaptée à ses besoins et à ses centres d'intérêt, tout en lui offrant un outil de classification automatique lui permettant de déterminer aisément quelle est la catégorie, parmi celles qu'il a sélectionnées, qui est la plus adaptée au contenu à classer.Thus, the invention is based on a new and inventive approach to the classification of multimedia content. Indeed, the invention proposes to the user to be able to customize the classification taxonomy of its multimedia content, so that it is perfectly adapted to its needs and interests, while offering an automatic classification tool allowing him to easily determine which category, among those he has selected, is the most suitable for the content to be classified.

Ainsi, l'utilisateur peut par exemple retenir des catégories « Arts », « Société », « Sciences » et « Espace et Temps », et écarter des catégories « Technologies » et « Personne et Personnage », qui ne correspondent pas à ses centres d'intérêt.Thus, the user can for example retain categories "Arts", "Society", "Sciences" and "Space and Time", and exclude categories "Technologies" and "Person and Character", which do not correspond to its centers interest.

En outre, la technique de l'invention restitue automatiquement à l'utilisateur la ou les catégories qui correspondent le mieux au contenu multimédia à classer, avec un score d'appartenance du contenu à la catégorie proposée. Ainsi, l'utilisateur voit par exemple s'afficher sur son écran que le contenu qu'il souhaite classer correspond à 60% à la catégorie « Tourisme », à 30% à la catégorie « sport », et à 10% à la catégorie « alimentation ». Le nombre de catégories restituées à l'utilisateur avec leur score d'appartenance peut être paramétrable de 1 à N, ou choisi en fonction de l'application visée. L'utilisateur peut ensuite suivre la préconisation de classement, en classant son contenu dans la catégorie présentant le score d'appartenance le plus élevé, ou choisir l'une des autres catégories proposées, ou encore opter pour une catégorie qui ne lui a pas été proposée, mais qui lui semble préférable. L'utilisateur garde donc toute souplesse dans le choix final de la catégorie dans laquelle classer son contenu multimédia, tout en bénéficiant d'une aide à la classification automatique appréciable. Lorsque l'utilisateur est ensuite en recherche d'un contenu précédemment classé, il peut plus facilement identifier la catégorie dans laquelle il a été rangé, s'il a fait le choix de le classer dans la catégorie présentant le score d'appartenance le plus élevé.In addition, the technique of the invention automatically restores to the user the category or categories that best correspond to the multimedia content to be classified, with a membership score of the content to the proposed category. Thus, for example, the user sees on his screen that the content he wants to classify corresponds to 60% to the category "Tourism", 30% to the category "sport", and 10% to the category " food ". The number of categories returned to the user with their membership score can be set from 1 to N, or chosen according to the targeted application. The user can then follow the recommendation of classification, by classifying its content in the category presenting the highest membership score, or choose one of the other categories proposed, or opt for a category that has not been proposed, but which seems to him preferable. The user therefore retains flexibility in the final choice of the category in which to classify its multimedia content, while enjoying a significant automatic classification help. When the user is then looking for previously ranked content, he can more easily identify the category in which he was ranked, if he has made the choice to classify it in the category with the highest membership score. Student.

Par « catégorie », on entend une division logique de la taxonomie de classification.By "category" is meant a logical division of the classification taxonomy.

Par « taxonomie », on entend un schéma organisationnel de classification d'éléments, en l'occurrence de contenus multimédia, sous la forme d'une suite d'éléments formant des listes. En l'espèce, la taxonomie de classification au sens de la présente invention comprend une hiérarchie de catégories, dans laquelle chaque niveau inférieur de la hiérarchie comprend des sous-ensembles (« sous-catégories-filles ») des catégories du niveau directement supérieur.By "taxonomy" is meant an organizational scheme of classifying elements, in this case multimedia content, in the form of a sequence of elements forming lists. In the present case, the classification taxonomy within the meaning of the present invention comprises a hierarchy of categories, in which each lower level of the hierarchy comprises subsets ("daughter subcategories") of the categories of the directly higher level.

Selon un mode de réalisation, l'étape de personnalisation de la taxonomie de classification comprend pour chacune des catégories d'intérêt sélectionnées, un choix par l'utilisateur d'un niveau de profondeur de la taxonomie de classification permettant de déterminer un nombre de niveaux hiérarchiques de sous-catégories-filles pour la catégorie d'intérêt.According to one embodiment, the personalization step of the classification taxonomy comprises for each of the selected categories of interest, a choice by the user of a depth level of the classification taxonomy making it possible to determine a number of levels. hierarchical sub-categories-girls for the category of interest.

Ainsi, une telle personnalisation permet à l'utilisateur, d'une part, de choisir un ensemble de catégories « mères », parmi les catégories existantes de la taxonomie de classification, et d'autre part, pour chacune de ces catégories mères choisies, de définir le nombre de niveaux hiérarchiques de sous-catégories-filles qui lui sont nécessaires.Thus, such customization allows the user, on the one hand, to choose a set of "mother" categories, among the existing categories of the classification taxonomy, and on the other hand, for each of these chosen mother categories, define the number of hierarchical levels of sub-categories-girls that are needed.

Dans une catégorie « tourisme», qu'il pratique beaucoup, il pourra prévoir une arborescence profonde de sous-catégories-filles, pour permettre un classement précis de l'ensemble de ses documents de voyage (par exemple, une sous-catégorie-fille par continent « tourisme en Europe », « tourisme en Asie », « tourisme en Afrique », « tourisme en Amérique du Nord », « tourisme en Océanie », « tourisme en Amérique du Sud », puis dans chacune de ces sous-catégories-filles, de nouvelles sous-catégories-filles par pays visité, etc.). A l'inverse, dans la catégorie « cinéma», dont il n'est pas féru, il pourra décider de ne pas prévoir de sous-catégorie-fille, et de ranger tous ses contenus dans la catégorie générale « cinéma ». A des fins d'allègement de la terminologie, on emploie, dans la suite de ce document, le terme catégorie, pour désigner des catégories-mères, situées à la racine de la taxonomie de classification, mais également pour désigner des sous-catégories-filles, quel que soit leur niveau de profondeur dans l'arborescence de la taxonomie.In a category "tourism", which he practices a lot, he can foresee a deep tree of subcategories-girls, to allow a precise classification of all his travel documents (for example, a sub-category-girl by continent "tourism in Europe", "tourism in Asia", "tourism in Africa", "tourism in North America", "tourism in Oceania", "tourism in South America", then in each of these subcategories girls, new sub-categories-girls by country visited, etc.). Conversely, in the "cinema" category, which he is not keen on, he will be able to decide not to foresee a sub-category-girl, and to arrange all his contents in the general category "cinema". For purposes of lightening terminology, the term "category" is used in the remainder of this document to refer to parent categories, located at the root of the classification taxonomy, but also to designate subcategories. girls, regardless of their depth level in the taxonomy tree.

Selon un mode de réalisation de l'invention, l'étape de classification comprend également: une détermination d'au moins une donnée-clef présente dans le contenu multimédia ; une identification d'au moins une catégorie et/ou sous-catégorie-fille de la taxonomie personnalisée à laquelle est associée la ou les donnée(s)-clef(s) avec un score de pertinence correspondant ; un calcul, pour chaque catégorie et/ou sous-catégorie-fille identifiée, du score d'appartenance du contenu multimédia à la catégorie et/ou sous-catégorie-fille, à partir du score de pertinence de la ou les donnée(s)-clef(s) associée(s) à la catégorie et/ou sous-catégorie-fille.According to one embodiment of the invention, the classification step also comprises: a determination of at least one key-data present in the multimedia content; an identification of at least one category and / or sub-category-daughter of the personalized taxonomy with which the data (s) -clef (s) are associated with a corresponding relevance score; a calculation, for each identified category and / or daughter subcategory, of the membership score of the multimedia content in the category and / or sub-category-girl, from the relevance score of the data or data associated with the category and / or sub-category-girl.

Par « donnée-clef », on entend une information pertinente figurant dans le contenu multimédia, ou déductible de ce dernier, et permettant de rattacher le contenu à une catégorie de la taxonomie. Pour un contenu multimédia qui est un document textuel, une telle donnée-clef peut être un mot-clef ; pour une photo, il peut s'agir du nom du monument qu'elle représente par exemple.By "key-data" we mean relevant information contained in the multimedia content, or deductible from the latter, and allowing to link the content to a category of the taxonomy. For multimedia content that is a textual document, such key-data may be a keyword; for a photo, it may be the name of the monument it represents, for example.

Ainsi, les données-clefs définissant le contenu multimédia à classer sont extraites du contenu. Elles sont comparées aux données-clefs pondérées qui définissent les différentes catégories de la taxonomie. Par sommation des scores de pertinence obtenus pour chaque donnée-clef pour une catégorie donnée, on détermine le score d'appartenance du contenu multimédia à cette catégorie.Thus, the key data defining the multimedia content to be classified are extracted from the content. They are compared to the weighted key data that define the different categories of the taxonomy. By summing the relevance scores obtained for each key-data item for a given category, the membership score of the multimedia content is determined for this category.

La classification automatique proposée à l'utilisateur repose donc sur des données statistiques fiables et reproductibles.The automatic classification proposed to the user is therefore based on reliable and reproducible statistical data.

Selon un mode de réalisation de l'invention, la taxonomie de classification de contenus est construite à partir d'une base de données collaborative évolutive. Par exemple, la taxonomie de classification des contenus est déduite de la base de données collaborative DBpedia®, qui repose sur la plateforme collaborative Wikipedia®. Ainsi, cette approche permet d'obtenir une taxonomie de classification qui repose sur la liste la plus exhaustive possible de catégories et de centres d'intérêts d'utilisateurs, et couvre tous les domaines, aussi divers soient-ils. Chaque catégorie de la taxonomie peut alors être définie par un ensemble de mots-clés pondérés extraits des articles Wikipedia®, tels que les ancres de ces articles.According to one embodiment of the invention, the content classification taxonomy is constructed from a scalable collaborative database. For example, the content classification taxonomy is derived from the DBpedia® collaborative database, which is based on the collaborative Wikipedia® platform. Thus, this approach provides a classification taxonomy that is based on the most comprehensive list of user categories and interests, and covers all areas, however diverse. Each taxonomy category can then be defined by a set of weighted keywords extracted from Wikipedia® articles, such as the anchors of these articles.

Outre l'exhaustivité des domaines couverts, cette approche permet de construire une taxonomie de classification dynamique et évolutive, tant sur le plan du nombre de catégories de la taxonomie (ajout automatique de nouvelles catégories, en fonction des nouveaux articles publiés), que dans le classement d'un contenu dans une catégorie (grâce à l'apparition de nouveaux mots-clefs), ou que du calcul du score de pertinence d'un mot-clef pour une catégorie (qui peut évoluer au fil du temps, au gré de l'apparition de nouveaux articles ou de nouveaux mots-clés).In addition to the comprehensiveness of the areas covered, this approach allows the construction of a dynamic and evolutionary classification taxonomy, both in terms of the number of categories of taxonomy (automatic addition of new categories, according to new published articles), and in the ranking of a content in a category (through the appearance of new keywords), or that the calculation of the relevance score of a keyword for a category (which may change over time, depending on the appearance of new articles or new keywords).

Une telle taxonomie évolutive peut donc permettre de faire évoluer en permanence le classement des contenus de l'utilisateur, et même d'adapter le classement de contenus précédemment archivés en fonction de l'évolution de la taxonomie.Such an evolutionary taxonomy can therefore make it possible to constantly change the classification of the user's content, and even to adapt the classification of content previously archived according to the evolution of the taxonomy.

Selon un mode de réalisation, un tel procédé comprend également une étape de détermination d'au moins deux centres d'intérêt de l'utilisateur parmi les catégories et/ou sous-catégories-filles de la taxonomie de classification personnalisée, en fonction de scores d'appartenance de N contenus multimédia, où N est un entier supérieur ou égal à 2, aux catégories et/ou sous-catégories-filles, et une étape de présentation à l'utilisateur des centres d'intérêt déterminés, sous forme d'une liste de catégories et/ou sous-catégories-filles associées à un facteur d'affinité calculé à partir des scores d'appartenance.According to one embodiment, such a method also comprises a step of determining at least two points of interest of the user among the categories and / or sub-categories-girls of the custom classification taxonomy, according to scores. belonging to N multimedia contents, where N is an integer greater than or equal to 2, to the categories and / or subcategories-girls, and a step of presenting to the user of the centers of interest determined, in the form of a list of categories and / or sub-categories-girls associated with an affinity factor calculated from the membership scores.

Ainsi, en fonction des catégories dans lesquelles ont été classés N contenus multimédia de l'utilisateur, on peut en déduire quels sont les centres d'intérêt de l'utilisateur, et lui restituer cette information. Plus N est élevé, et plus la fiabilité de l'identification des centres d'intérêt est grande.Thus, depending on the categories in which the user's multimedia content N has been classified, it is possible to deduce what are the user's interests and to give him this information. The higher N is, the greater the reliability of the identification of the centers of interest.

Selon un premier mode de réalisation, le facteur d'affinité Q d'un des centres d'intérêt C est calculé selon l'équation :According to a first embodiment, the affinity factor Q of one of the points of interest C is calculated according to the equation:

où Ne est le nombre de contenus multimédia classés dans la catégorie et/ou sous-catégorie fille C, et Sc,i est le score d'appartenance du i-ième contenu multimédia à la catégorie et/ou sous-catégorie fille C.where N is the number of multimedia contents classified in the category and / or subcategory girl C, and Sc, i is the membership score of the i-th multimedia content to the category and / or subcategory daughter C.

Selon un deuxième mode de réalisation, le facteur d'affinité Q d'un des centres d'intérêt C est calculé selon l'équation :According to a second embodiment, the affinity factor Q of one of the points of interest C is calculated according to the equation:

où Ne est le nombre de contenus multimédia classés dans la catégorie et/ou sous-catégorie fille C, Se,i est le score d'appartenance du i-ième contenu multimédia à la catégorie et/ou sous-catégorie fille C et dj est un nombre de jours écoulés depuis le classement du i-ième contenu multimédia.where N is the number of multimedia contents classified in the category and / or subcategory girl C, Se, i is the membership score of the i-th multimedia content to the category and / or subcategory girl C and dj is a number of days since the classification of the i-th multimedia content.

Ainsi, on peut intégrer le facteur temps dans l'évaluation des centres d'intérêt de l'utilisateur, de façon à accorder une plus grande importance aux contenus multimédia qu'il a classés récemment.Thus, the time factor can be integrated in the user's interest assessment, so as to give greater importance to the multimedia content that he has recently classified.

Selon un mode de réalisation, un tel procédé comprend également une étape de formation d'un groupe d'utilisateurs présentant des centres d'intérêt communs et des facteurs d'affinité associés proches.According to one embodiment, such a method also comprises a step of forming a group of users having common centers of interest and associated associated affinity factors.

En effet, à partir des centres d'intérêt déterminés pour une pluralité d'utilisateurs, et des facteurs d'affinité associés, il est possible de comparer les utilisateurs, et de créer des groupes, ou « clusters » d'utilisateurs présentant des profils similaires. Par exemple, on peut créer un groupe d'utilisateurs ayant tous comme centres d'intérêt les catégories « musées », « sculpture » et « peinture » avec un facteur d'affinité supérieure ou égale à 15%.Indeed, based on the points of interest determined for a plurality of users, and associated affinity factors, it is possible to compare the users, and to create groups or "clusters" of users presenting profiles. Similar. For example, we can create a group of users all having as centers of interest the categories "museums", "sculpture" and "painting" with an affinity factor greater than or equal to 15%.

On peut ainsi proposer aux utilisateurs de faire partie d'une communauté d'utilisateurs, par exemple par le biais de réseaux sociaux. On peut également utiliser cette constitution en groupes d'utilisateurs pour cibler des promotions ou des offres commerciales à un groupe d'utilisateurs particulier. Cela peut également permettre de personnaliser des services et des offres, en fonction des profils des utilisateurs.It is thus possible to offer users to be part of a community of users, for example through social networks. This constitution can also be used in groups of users to target promotions or commercial offers to a particular group of users. It can also be used to customize services and offers based on user profiles.

Les différents modes ou caractéristiques de réalisation précités peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé de classement d'un contenu multimédia défini ci-dessus. L'invention concerne également un dispositif de classement d'un contenu multimédia mettant en oeuvre une taxonomie de classification de contenus. Un tel dispositif comprend : un module de personnalisation de la taxonomie de classification comprenant : O une interface de présentation à un utilisateur d'une pluralité de catégories de classification de la taxonomie ; O une interface de sélection par l'utilisateur d'au moins deux catégories d'intérêt parmi la pluralité de catégories présentée ; un module de classification du contenu multimédia dans la taxonomie de classification personnalisée comprenant : O une interface pour restituer à l'utilisateur, en association : au moins une catégorie de la taxonomie de classification personnalisée dans laquelle classer le contenu multimédia, et un score d'appartenance du contenu multimédia à la catégorie associée ; O un module de classement du contenu multimédia dans une catégorie choisie parmi : la ou les catégorie(s) restituée(s) à l'utilisateur ; une autre catégorie de la taxonomie de classification personnalisée choisie par l'utilisateur.The various embodiments or aforementioned embodiments can be added independently or in combination with each other, to the steps of the method of ranking a multimedia content defined above. The invention also relates to a device for classifying a multimedia content implementing a content classification taxonomy. Such a device comprises: a personalization module of the classification taxonomy comprising: O a presentation interface to a user of a plurality of classification categories of the taxonomy; O a user selection interface of at least two categories of interest among the plurality of categories presented; a multimedia content classification module in the custom classification taxonomy comprising: O an interface for rendering the user, in association: at least one category of the custom classification taxonomy in which to classify the multimedia content, and a score of membership of the multimedia content in the associated category; O a categorization module of the multimedia content in a category selected from: the category or categories returned to the user; another category of the custom classification taxonomy chosen by the user.

Selon un mode de réalisation, l'interface de sélection du module de personnalisation de la taxonomie de classification est également configurée pour permettre à l'utilisateur, pour chacune des catégories d'intérêt sélectionnées, le choix d'un niveau de profondeur de la taxonomie de classification, permettant de déterminer un nombre de niveaux hiérarchiques de sous-catégories-filles pour la catégorie d'intérêt. L'invention concerne également un terminal comprenant le dispositif de classement de contenu multimédia mentionné ci-dessus.According to one embodiment, the selection interface of the personalization module of the classification taxonomy is also configured to allow the user, for each of the selected categories of interest, the choice of a depth level of the taxonomy. classifying a number of hierarchical levels of sub-categories-girls for the category of interest. The invention also relates to a terminal comprising the multimedia content ranking device mentioned above.

Un tel terminal est par exemple un ordinateur, une tablette ou un smartphone, éventuellement connectés à un serveur de stockage de contenus. L'invention concerne encore un programme d'ordinateur comportant des instructions de code de programme pour l'exécution des étapes du procédé de classement de contenu multimédia selon l'invention, lorsqu'il est exécuté par un ordinateur.Such a terminal is for example a computer, a tablet or a smartphone, possibly connected to a content storage server. The invention also relates to a computer program comprising program code instructions for performing the steps of the method of classifying multimedia content according to the invention, when executed by a computer.

Un tel programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable. L'invention vise également un support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions de code de programme pour l'exécution des étapes du procédé de classement d'un contenu multimédia selon l'invention tel que décrit ci-dessus.Such a program can use any programming language, and be in the form of source code, object code, or intermediate code between source code and object code, such as in a partially compiled form, or in any another desirable form. The invention also relates to a computer-readable recording medium on which is recorded a computer program comprising program code instructions for performing the steps of the method of classifying a multimedia content according to the invention such that as described above.

Un tel support d'enregistrement peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une clé USB ou un disque dur. D'autre part, un tel support d'enregistrement peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens, de sorte que le programme d'ordinateur qu'il contient est exécutable à distance. Le programme selon l'invention peut être en particulier téléchargé sur un réseau par exemple le réseau Internet.Such a recording medium may be any entity or device capable of storing the program. For example, the medium may include storage means, such as a ROM, for example a CD ROM or a microelectronic circuit ROM, or a magnetic recording means, for example a USB key or a hard disk. On the other hand, such a recording medium may be a transmissible medium such as an electrical or optical signal, which may be conveyed via an electrical or optical cable, by radio or by other means, so that the program computer that it contains is executable remotely. The program according to the invention can in particular be downloaded to a network, for example the Internet network.

Alternativement, le support d'enregistrement peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé de contrôle d'affichage précité.Alternatively, the recording medium may be an integrated circuit in which the program is incorporated, the circuit being adapted to execute or to be used in the execution of the aforementioned display control method.

Le dispositif de classement d'un contenu multimédia, le terminal et le programme d'ordinateur correspondants précités présentent au moins les mêmes avantages que ceux conférés par le procédé de classement d'un contenu multimédia selon la présente invention. 4. Liste des figures D'autres buts, caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée à titre de simple exemple illustratif, et non limitatif, en relation avec les figures, parmi lesquelles : la figure 1 illustre le procédé de construction de la base de connaissance définissant les catégories de la taxonomie de classification selon un mode de réalisation de l'invention, ainsi que l'utilisation de cette base de connaissance pour classer un contenu multimédia de l'utilisateur; la figure 2 propose un schéma synoptique du principe général du procédé de classement de contenus multimédia selon un mode de réalisation de l'invention ; la figure 3 décrit sous forme d'organigramme fonctionnel les différentes étapes mises en œuvre par le procédé de la figure 2 ; la figure 4 présente la structure simplifiée d'un dispositif de classement de contenus multimédia, selon un exemple de réalisation de l'invention. 5. Description détaillée de modes de réalisation de l'inventionThe device for classifying multimedia content, the aforementioned terminal and the corresponding computer program have at least the same advantages as those conferred by the process of classifying a multimedia content according to the present invention. 4. List of Figures Other purposes, features and advantages of the invention will emerge more clearly on reading the following description, given as a simple illustrative and non-limiting example, in relation to the figures, among which: FIG. 1 illustrates the method of constructing the knowledge base defining categories of the classification taxonomy according to one embodiment of the invention, as well as the use of this knowledge base to classify a multimedia content of the user; FIG. 2 provides a block diagram of the general principle of the method of classifying multimedia contents according to one embodiment of the invention; FIG. 3 describes in a functional flowchart the various steps implemented by the method of FIG. 2; FIG. 4 shows the simplified structure of a device for classifying multimedia contents, according to an exemplary embodiment of the invention. 5. Detailed Description of Embodiments of the Invention

Le principe général de l'invention repose sur la mise en œuvre d'une taxonomie de classification de contenus évolutive et personnalisable par l'utilisateur, permettant de lui offrir un outil de classification automatique de ses contenus multimédia, parfaitement adapté à ses besoins et à ses centres d'intérêt.The general principle of the invention is based on the implementation of a taxonomy of content classification scalable and customizable by the user, to offer him a tool for automatic classification of its multimedia content, perfectly suited to his needs and his interests.

On présente désormais, en relation avec la figure 1, un mode de réalisation de la construction de la base de connaissance définissant les catégories de la taxonomie de classification selon l'invention, reposant sur l'utilisation de la base de données DBpedia'®, qui définit la structure de la plateforme collaborative Wikipedia®. Chaque catégorie (ou sous-catégorie-fille) de la taxonomie de classification est définie par un ensemble de mots-clés pondérés extraits des articles de Wikipedia®. Ces mots-clés peuvent être des concepts, ou des entités nommées, et le score qui leur est associé représente leur degré d'intérêt dans chaque catégorie.An embodiment of the construction of the knowledge base defining the categories of the classification taxonomy according to the invention, based on the use of the DBpedia® database, is now presented with reference to FIG. which defines the structure of the collaborative platform Wikipedia®. Each category (or sub-category-girl) of the classification taxonomy is defined by a set of weighted keywords extracted from Wikipedia® articles. These keywords can be concepts, or named entities, and the score associated with them represents their degree of interest in each category.

Certains mots-clés peuvent se répéter dans plusieurs catégories, mais associés à des scores différents, qui traduisent un degré d'intérêt différent pour chacune de ces catégories.Some keywords can be repeated in several categories, but associated with different scores, which reflect a different degree of interest for each of these categories.

On rappelle que la plateforme collaborative Wikipedia® comprend les catégories-mères suivantes :The Wikipedia® collaborative platform includes the following parent categories:

Arts ;Arts;

Sciences ;Science;

Espace et Temps ;Space and Time;

Société ;Society ;

Technologies;technology;

Personne et Personnage.Person and Character.

Comme illustré sur la figure 1, une première étape COLLEC. référencée 10 permet de collecter les données nécessaires à la définition de la base de connaissance. Dans un premier temps, on extrait de la base DBpedia® les catégories et sous-catégories-filles qu'elle recense, par exemple en utilisant une requête SPARQL. On rappelle que SPARQL est un langage de requête et un protocole qui permet de rechercher, d'ajouter, de modifier ou de supprimer des données RDF (pour l'anglais « Resource Description Framework ») disponibles à travers Internet. Son nom est un acronyme récursif qui signifie SPARQL Protocole and RDF Query Language.As illustrated in FIG. 1, a first COLLEC step. referenced 10 allows to collect the data necessary for the definition of the knowledge base. First, we extract from the DBpedia® database the categories and subcategories-girls it lists, for example using a SPARQL query. It is recalled that SPARQL is a query language and a protocol that makes it possible to search for, add, modify or delete RDF data (available for the Resource Description Framework) available through the Internet. Its name is a recursive acronym that stands for SPARQL Protocol and RDF Query Language.

Par exemple, la requête SPARQL ci-dessous permet d'extraire toutes les sous-catégories filles de niveau -1 de la catégorie-mère « Société » : select ?cat ?catLabel ?immediateParent ?level where { ?cat a skosiConcept. ?cat rdfsilabel ?catLabel. { { ?cat skosibroader <http://fr.dbpedia.org/resource/Catégorie:Société> . ?cat skosibroader ?immediateParent. BIND(1 AS ?level) } } } order by ?level ?immediateParent ?catFor example, the following SPARQL query retrieves all -1 level child subcategories of the parent category "Company": select? Cat? CatLabel? ImmediateParent? Level where {? Cat a skosiConcept. ? cat rdfsilabel? catLabel. {{? cat skosibroader <http://en.dbpedia.org/resource/Category:Company>. ? cat skosibroader? immediateParent. BIND (1 AS? Level) order by? Level? ImmediateParent? Cat

Après collecte de l'ensemble des catégories et sous-catégories-filles, on collecte ensuite au cours de l'étape référencée 10 COLLECT les articles WIKIPEDIA® qui les définissent, à nouveau au moyen d'une requête SPARQL. Par exemple, la requête SPARL ci-dessous permet d'extraire les articles Wikipedia® se rapportant à la catégorie « Société » : select ?uri ?wikiPage where { ?uri dctermsisubject <http://fr.dbpedia.org/resource/Catégorie:Société> . ?uri foafiisPrimaryTopicOf ?wikiPage . }After collection of all the categories and subcategories-girls, it then collects during the referenced step 10 COLLECT WIKIPEDIA® articles that define them, again by means of a query SPARQL. For example, the following SPARL query retrieves Wikipedia® articles for the "Company" category: select? Uri? WikiPage where {? Uri dctermsisubject <http://en.dbpedia.org/resource/Category : Society>. ? uri foafiisPrimaryTopicOf? wikiPage. }

Enfin, toujours au cours de l'étape COLLECT 10, on extrait de l'ensemble des articles Wikipedia® collectés l'ensemble des ancres qu'ils contiennent. On rappelle que les ancres sont les liens hypertexte figurant dans les articles Wikipedia®, et sont des mots clés qui peuvent représenter des concepts, ou des entités nommées. Ainsi, selon un mode de réalisation de l'invention, on n'utilise pas la totalité du contenu des articles Wikipedia®, mais seulement les ancres qu'ils contiennent, également appelées tags.Finally, again during the COLLECT 10 step, we extract from all the collected Wikipedia® articles all the anchors they contain. It is recalled that anchors are the hyperlinks contained in Wikipedia® articles, and are keywords that may represent concepts, or named entities. Thus, according to one embodiment of the invention, we do not use the entire content of Wikipedia articles, but only the anchors they contain, also called tags.

Ainsi, en appliquant ce procédé à la catégorie-mère « Société », et en collectant toutes les sous-catégories-filles jusqu'à un niveau de profondeur d'arborescence de -4, on collecte, au cours de l'étape COLLECT 10, 49929 sous-catégories distinctes, 804 722 articles Wikipedia® et environ 45 miiiions d'ancres, ou tags. Comme on le verra par la suite, ces ancres sont utilisées pour définir ies catégories et sous-catégories de ia taxonomie de classification. L'ensembie des informations coiiectées au cours de l'étape COLLECT 10 sont stockées dans une base de données référencée 11. A l'issue de cette étape de coiiecte d'informations, une étape de pré-filtrage FILTR 12 permet de supprimer, de ia iiste de tags coiiectée, les mots-clés qui sont dépourvus de sens pour ia définition des différentes catégories, à savoir ies nombres, les dates, les liste_par_pays...Thus, by applying this method to the parent category "Company", and by collecting all the sub-categories-girls up to a level of tree depth of -4, COLLECT 10 is collected. , 49929 separate subcategories, 804,722 Wikipedia® articles and about 45 million anchors, or tags. As will be seen later, these anchors are used to define the categories and subcategories of the classification taxonomy. The set of information collected during the COLLECT step 10 is stored in a database referenced 11. At the end of this information collection step, a pre-filtering step FILTR 12 makes it possible to delete, iis tagged tags, keywords that are meaningless for the definition of different categories, ie numbers, dates, country_lists ...

Les ancres obtenues après filtrage FILTR 12 forment un ensemble référencé 13 sur la figure 1. Ce filtrage 12 permet de gagner en temps de traitement au cours de l'étape ultérieure de SCORING 14, qui n'est donc appliquée que sur l'ensemble 13 de mots-clés ayant un sens.The anchors obtained after filtering FILTR 12 form a set referenced 13 in FIG. 1. This filtering 12 makes it possible to save in processing time during the subsequent step of SCORING 14, which is therefore applied only to the set 13 keywords with meaning.

Au cours de cette étape de SCORING 14, on utilise une variante de l'algorithme TF-IDF, afin de calculer le score de pertinence de chaque mot-clé pour une catégorie donnée.During this step of SCORING 14, a variant of the TF-IDF algorithm is used to calculate the relevance score of each keyword for a given category.

On rappelle que l'algorithme TF-IDF (de l'anglais « Term Frequency-Inverse Document Frequency ») est une méthode de pondération, qui offre une mesure statistique permettant d'évaluer l'importance d'un terme contenu dans un document, relativement à un corpus de documents. Le poids, ou score, affecté au terme considéré, augmente proportionnellement au nombre d'occurrences du mot dans le document. Il varie également en fonction de la fréquence du terme dans le corpus.It is recalled that the TF-IDF (Term Frequency-Inverse Document Frequency) algorithm is a weighting method, which provides a statistical measure to evaluate the importance of a term contained in a document, in relation to a body of documents. The weight, or score, assigned to the term considered, increases proportionally to the number of occurrences of the word in the document. It also varies according to the frequency of the term in the corpus.

Plus précisément, au cours de l'étape SCORING 14, on calcule le score suivant, pour un mot-clé term :More precisely, during the step SCORING 14, the following score is calculated for a term keyword:

NNOT

Score (term) = tfx log— lîi Où : tf représente le nombre d'occurrences de chaque mot dans les articlesScore (term) = tfx log- lii Where: tf is the number of occurrences of each word in articles

Wikipedia® appartenant à la catégorie et aux sous-catégories-filles associées, N représente le nombre total d'articles Wikipedia® pour ces catégories Π; représente le nombre d'occurrences du mot-clé term dans la liste des articlesWikipedia® belonging to the category and associated sub-categories-girls, N represents the total number of Wikipedia® articles for these categories Π; is the number of occurrences of the keyword term in the list of articles

Wikipedia®.Wikipedia®.

Après calcul des scores de pertinence de toutes les ancres de l'ensemble 13, on procède à une normalisation sur tous les scores de pertinence obtenus. L'objectif de cette normalisation est double. D'une part, elle permet d'obtenir un score de pertinence normalisé qui reflète le degré d'intérêt d'un mot-clé, ou d'un terme, par rapport aux autres mots-clés de la même catégorie.After calculation of the relevance scores of all the anchors of the set 13, a normalization is performed on all the scores of relevance obtained. The purpose of this standardization is twofold. On the one hand, it provides a standardized relevance score that reflects the degree of interest of a keyword, or term, relative to other keywords in the same category.

Ainsi, le score de pertinence normalisé définit en pourcentage l'importance d'un terme dans une catégorie particulière. Par exemple, si le terme « hôtel » obtient un score normalisé de 0,01 dans la catégorie « Tourisme », cela signifie que ce terme « hôtel » représente 1% de la somme des scores de pertinence de tous les termes pour cette catégorie « Tourisme ». D'autre part, une telle normalisation permet d'obtenir une base référentielle commune pour l'ensemble des catégories de la taxonomie de classification, ce qui permet d'évaluer l'importance relative d'un terme dans les différentes catégories dans lesquelles il apparaît. Ainsi, si le terme « hôtel » appartient aux deux catégories « tourisme » et « alimentation », avec des scores de pertinence normalisés respectifs de 0,01 et de 0,001, on peut en déduire que le mot-clé « hôtel » est plus important dans la catégorie « tourisme » (où il représente 1% des scores de pertinence de la catégorie) que dans la catégorie « alimentation » (où il ne représente que 0,1% des scores de pertinence de la catégorie). L'ensemble des tags, et de leurs scores de pertinence normalisés associés, sont stockés dans une base de données référencée 15.For example, the standardized relevance score defines the importance of a term in a particular category as a percentage. For example, if the term "hotel" gets a standardized score of 0.01 in the "Tourism" category, this means that the term "hotel" represents 1% of the sum of the relevancy scores of all the terms for this category " Tourism ". On the other hand, such a standardization makes it possible to obtain a common reference base for all the categories of the classification taxonomy, which makes it possible to evaluate the relative importance of a term in the different categories in which it appears. . Thus, if the term "hotel" belongs to both the "tourism" and "food" categories, with respective standardized relevance scores of 0.01 and 0.001, it can be inferred that the keyword "hotel" is more important. in the category "tourism" (where it represents 1% of category relevance scores) than in the "food" category (where it represents only 0.1% of category relevance scores). All of the tags, and their associated normalized relevance scores, are stored in a referenced database 15.

Au cours de l'étape OPTIM référencée 16, on sélectionne, pour chacune des catégories considérées, l'ensemble des ancres de la base de données 15 présentant les scores de pertinence normalisés les plus élevés. Par exemple, pour chaque catégorie, on ne conserve que les 100 ou les 500 ancres présentant les scores de pertinence les plus élevés pour une catégorie, ou les ancres dont le score de pertinence est supérieur à un seuil de pertinence déterminé. Cette optimisation OPTIM 16 permet de ne garder qu'une liste d'ancres les plus représentatives de la catégorie, et a un impact significatif sur les performances du processus de classification. A l'issue de cette sélection OPTIM 16, l'étape INDEX référencée 17 permet d'alléger le processus ultérieur de classification des contenus multimédia de l'utilisateur 20, en adoptant une représentation différente des catégories de la taxonomie de classification. En effet, à ce stade, on dispose d'une liste de catégories et, pour chaque catégorie, d'une liste de mots-clés principaux pondérés par leur score de pertinence. L'étape d'indexation INDEX 17 vise au contraire à obtenir une liste de mots-clés, avec, pour chaque mot-clé, l'ensemble des catégories dans lesquelles il est présent, en association avec le score de pertinence normalisé du mot-clé dans chacune de ces catégories. Le résultat de l'étape d'indexation INDEX 17 peut se présenter par exemple sous la forme du tableau référencé 18 sur la figure 1. A ce stade, on dispose donc de la base de connaissance sous-jacente à la taxonomie de classification des documents mise en oeuvre dans un mode de réalisation de l'invention.During the OPTIM step referenced 16, one selects, for each of the categories considered, the set of anchors of the database 15 having the highest standardized relevance scores. For example, for each category, only the 100 or 500 anchors with the highest relevance scores for a category, or the anchors whose relevance score is greater than a certain relevance threshold, are retained. This optimization OPTIM 16 allows to keep only a list of anchors most representative of the category, and has a significant impact on the performance of the classification process. At the end of this selection OPTIM 16, the INDEX step referenced 17 makes it possible to lighten the subsequent process of classification of the multimedia contents of the user 20, by adopting a different representation of the categories of the classification taxonomy. Indeed, at this stage, we have a list of categories and, for each category, a list of main keywords weighted by their relevance score. The indexing step INDEX 17 aims on the contrary to obtain a list of keywords, with, for each keyword, all the categories in which it is present, in association with the standardized relevance score of the word- key in each of these categories. The result of the indexing step INDEX 17 can be presented for example in the form of the table referenced 18 in FIG. 1. At this stage, one thus has the knowledge base underlying the document classification taxonomy. implemented in one embodiment of the invention.

Il est alors possible, au cours d'une étape CLASSIF 19, de classifier les contenus multimédia d'un utilisateur 20, en utilisant cette base de connaissance.It is then possible, during a CLASSIF 19 step, to classify the multimedia contents of a user 20, using this knowledge base.

Cette classification CLASSIF 19 va désormais être décrite plus en détail en relation avec les figures 2 et 3. La figure 2 propose un schéma synoptique du principe général du procédé de classement de contenus multimédia selon un mode de réalisation de l'invention. La figure 3 décrit sous-forme d'organigramme fonctionnel les différentes étapes mises en œuvre par ce procédé.This classification CLASSIF 19 will now be described in more detail in relation to FIGS. 2 and 3. FIG. 2 provides a block diagram of the general principle of the method of classifying multimedia contents according to one embodiment of the invention. FIG. 3 describes in a flowchart form the various steps implemented by this method.

Comme illustré sur la figure 2, l'utilisateur 20 dispose d'un certain nombre de contenus multimédia, parmi lesquels des contenus textuels 210, des photos 220, et des vidéos ou des films 230. La classification automatique de ces contenus 19 utilise la base de connaissance 18 construite selon le procédé de la figure 1, pour affecter chacun de ces contenus à une ou plusieurs catégories de la taxonomie de classification, par exemple : catégorie I : Tourisme, référencée 21 ; catégorie II : Cinéma, référencée 22 ; catégorie N : Sport, référencée 23.As illustrated in FIG. 2, the user 20 has a certain number of multimedia contents, among which textual contents 210, photos 220, and videos or films 230. The automatic classification of these contents 19 uses the base knowledge of 18 constructed according to the method of Figure 1, to assign each of these contents to one or more categories of the classification taxonomy, for example: category I: Tourism, referenced 21; category II: Cinema, referenced 22; category N: Sport, referenced 23.

Plus précisément, lorsque l'utilisateur 20 souhaite classer un contenu multimédia, par exemple un contenu textuel 210, il commence tout d'abord par personnaliser la taxonomie de classification de contenus élaborée conformément à la figure 1, au cours d'une étape CUSTOM 30.More specifically, when the user wishes to classify a multimedia content, for example a textual content 210, he first begins by customizing the content classification taxonomy elaborated in accordance with FIG. 1 during a CUSTOM step. .

Pour ce faire, on affiche sur l'écran de son terminal (par exemple une tablette ou un ordinateur personnel), une représentation simple de l'arborescence de la taxonomie de classification, au cours d'une étape PRES. CAT. 301. Par exemple, dans un premier temps, on affiche seulement les catégories-mères de la taxonomie. L'utilisateur peut alors sélectionner, au cours d'une étape SELECT 302, celles de ces catégories qu'il souhaite conserver dans son arborescence de classement. Cette sélection peut s'opérer par exemple par le biais de cases à cocher. Pour chaque catégorie-mère retenue, on affiche ensuite à l'écran de l'utilisateur 20, les sous-catégories-filles de niveau hiérarchique directement inférieur, parmi lesquelles l'utilisateur peut à nouveau choisir celles qu'il souhaite ou non conserver. On procède ainsi jusqu'à ce que l'utilisateur 20 ait totalement personnalisé la taxonomie de classification, en ayant déterminé d'une part les catégories-mères dont il avait besoin, et d'autre part, le niveau de profondeur hiérarchique de sous-catégories filles pour chacune de ces catégories-mères. A l'issue de cette étape SELECT 302, on obtient ainsi un ensemble de catégories Cat. 1 à Cat. N, avec un niveau de profondeur Prof. 1 à Prof. N associé.To do this, it displays on the screen of its terminal (for example a tablet or a personal computer), a simple representation of the classification taxonomy tree, during a PRES stage. CAT. For example, at first, only the parent categories of the taxonomy are displayed. The user can then select, during a SELECT 302 step, those categories that he wishes to keep in his classification tree. This selection can be made for example by means of checkboxes. For each mother-category selected, then on the screen of the user 20, the lower-hierarchically hierarchical daughter subcategories are displayed, from which the user can once again choose which ones he wishes to keep or not. This is done until the user has fully customized the classification taxonomy, having determined on the one hand the parent categories he needed, and on the other hand, the level of hierarchical depth of sub- girls categories for each of these parent categories. At the end of this step SELECT 302, a set of Cat categories is thus obtained. Cat. N, with depth level Prof. 1 to Prof. N associated.

Cette étape 30 CUSTOM de personnalisation de la taxonomie de classification peut être réalisée une seule fois, à l'initialisation du procédé de classification de contenu selon un mode de réalisation de l'invention.This customization step of customizing the classification taxonomy can be done once, upon initialization of the content classification method according to one embodiment of the invention.

En variante, elle peut également être proposée à l'utilisateur 20 à chaque nouveau contenu multimédia qu'il souhaite classer. En effet, la taxonomie de classification de contenus reposant sur une plateforme collaborative évolutive de type Wikipedia®, elle peut évoluer de façon dynamique, et proposer de temps en temps de nouvelles catégories, au gré de l'apparition de nouveaux articles Wikipedia® et de nouveaux mots-clés associés. Il peut donc être intéressant pour l'utilisateur de vérifier systématiquement que l'arborescence de classement qu'il avait précédemment retenue lui convient toujours, et qu'il ne souhaite pas y ajouter de nouvelles sous-catégories-filles ou au contraire en supprimer d'autres devenues obsolètes.As a variant, it can also be proposed to the user 20 with each new multimedia content that he wishes to classify. Indeed, the classification taxonomy of content based on a collaborative platform scalable Wikipedia® type, it can evolve dynamically, and offer new categories from time to time, as new Wikipedia articles and new associated keywords. It may therefore be interesting for the user to always check that the classification tree he had previously selected is still appropriate for him, and that he does not wish to add new sub-categories-girls or delete others become obsolete.

On peut également envisager que cette étape 30 CUSTOM de personnalisation de la taxonomie de classification soit proposée à l'utilisateur de temps en temps, par exemple à échéance régulière (e.g. tous les mois) ou à l'issue du classement d'un nombre de contenus multimédia déterminé (e.g. tous les 10 contenus).It can also be envisaged that this customization step of the classification taxonomy is proposed to the user from time to time, for example at regular expiry (eg every month) or at the end of the classification of a number of determined multimedia content (eg all 10 contents).

Lorsque l'utilisateur 20 crée ou télécharge sur son terminal un contenu multimédia 211, par exemple une facture reçue d'un hôtel dans lequel il a séjourné, ce contenu 211 (dans cet exemple, un contenu textuel) est soumis à l'étape CLASSIF 19 de classification automatique de contenu.When the user 20 creates or downloads on his terminal a multimedia content 211, for example an invoice received from a hotel in which he has stayed, this content 211 (in this example, textual content) is submitted to the CLASSIF step. 19 automatic classification of content.

Au cours de cette étape CLASSIF 19, on identifie tout d'abord les données-clés présentes dans le contenu 211. Ces données-clés peuvent être des mots-clés (par exemple : facture, hôtel, chambre, petit-déjeuner...), ou le logo de l'hôtel. Pour un contenu multimédia de type photo, les données-clefs peuvent être l'identité de personnes présentes sur la photo, identifiées au moyen d'un logiciel de reconnaissance de visages associé à une banque de visages, ou le nom d'un monument figurant sur la photo, ou un mot-clé identifié par reconnaissance de caractères sur la photo (par exemple un nom de ville figurant sur un panneau de circulation routière). Pour un contenu vidéo, les données-clés peuvent être extraites de métadonnées associées au contenu (par exemple, le nom du film, le nom des acteurs, le nom du réalisateur...).During this step CLASSIF 19, the key data present in the content 211 is first identified. These key data can be keywords (for example: bill, hotel, room, breakfast, etc.). ), or the hotel logo. For a photo-type multimedia content, the key-data may be the identity of persons present in the photo, identified by means of face recognition software associated with a bank of faces, or the name of a monument appearing in the photo, or a keyword identified by character recognition on the photo (for example a city name on a traffic sign). For video content, the key data can be extracted from metadata associated with the content (for example, the name of the film, the name of the actors, the name of the director ...).

En outre, lorsque le contenu multimédia 211 est un document textuel, on peut choisir d'utiliser tous les mots qui figurent dans le document ou, en variante, appliquer un algorithme de pondération des mots, par exemple de type TF-IDF, pour retenir seulement quelques mots-clés importants.In addition, when the multimedia content 211 is a textual document, it is possible to choose to use all the words that appear in the document or, alternatively, to apply a word weighting algorithm, for example of the TF-IDF type, to retain only a few important keywords.

Ces données-clefs identifiées dans le contenu 211 peuvent également être qualifiées de tags.These key data identified in the content 211 can also be called tags.

Au cours d'une étape référencée PAIR 191, on applique une fonction d'appariement entre les mots-clés extraits du contenu 211 au cours de l'étape DETER. TAGS 190 et les mots clés tagl, tag2, ... de la base de connaissance 18, afin d'identifier la ou les catégories ou sous-catégories cat. 1 à cat. N de la taxonomie personnalisée à laquelle sont associés ces mots-clés, avec leur score de pertinence associé.During a step referenced PAIR 191, a matching function is applied between the keywords extracted from the content 211 during the DETER step. TAGS 190 and tags tagl, tag2, ... of the knowledge base 18, to identify the category or subcategories cat. 1 to cat. N of the custom taxonomy associated with these keywords, with their associated relevancy score.

Au cours d'une étape CALC SCORE 192, on calcule, pour chacune de ces catégories, un score d'appartenance du contenu 211 à cette catégorie, sur la base des scores de pertinence des différents mots-clés du contenu 211. Par exemple, pour déterminer le score d'appartenance du contenu 211 à la catégorie cat. 1, on somme les scores de pertinence de l'ensemble des mots-clés du contenu 211 associés à la catégorie cat. 1.During a step CALC SCORE 192, for each of these categories, a membership score of the content 211 is calculated for this category, on the basis of the relevance scores of the different keywords of the content 211. For example, to determine the membership score of the content 211 to the category cat. 1, we sum the relevance scores of all the keywords of the content 211 associated with the cat category. 1.

Au cours d'une étape RESTIT. 193, on restitue alors à l'utilisateur le résultat des étapes référencées 190 à 192. Pour ce faire, plusieurs variantes de réalisation peuvent être envisagées : on peut présenter à l'utilisateur 20, par exemple par affichage sur l'écran de son terminal, la catégorie la plus proche du contenu multimédia 211, i.e. celle qui a obtenu le score d'appartenance le plus élevé à l'issue de l'étape 192 ; on peut présenter à l'utilisateur 20 toutes les catégories identifiées au cours de l'étape 191, en association avec leur score d'appartenance calculé au cours de l'étape CALC SCORE 192, par exemple rangées par ordre décroissant de score d'appartenance ; on peut présenter à l'utilisateur 20 un sous-ensemble des catégories identifiées, par exemple les trois catégories présentant les scores d'appartenance les plus élevés.During a RESTIT step. 193, the user is then returned the result of the steps referenced 190 to 192. To do this, several variants can be envisaged: it can be presented to the user 20, for example by displaying on the screen of his terminal the category closest to the multimedia content 211, ie the one which obtained the highest membership score after the step 192; it is possible to present to the user 20 all the categories identified during the step 191, in association with their membership score calculated during the CALC stage SCORE 192, for example ranked in descending order of the membership score ; the user can be presented with a subset of the identified categories, for example the three categories with the highest membership scores.

Par exemple, au cours des étapes 190 à 192, on détermine que le contenu multimédia 211 se rapporte : à la catégorie « Tourisme » avec un score d'appartenance de 60% ; à la catégorie « Sport » avec un score d'appartenance de 30% ; à la catégorie « Alimentation » avec un score d'appartenance de 10%.For example, during steps 190 to 192, it is determined that the multimedia content 211 relates to: the category "Tourism" with a membership score of 60%; the category "Sport" with a membership score of 30%; the category "Food" with a membership score of 10%.

On affiche donc ce résultat sur l'écran du terminal de l'utilisateur 20. Ce dernier peut alors choisir dans quelle catégorie il souhaite classer le contenu 211 au cours d'une étape CLASS référencée 194. Pour ce faire, il peut suivre la recommandation de classification automatique, en classant le contenu dans la catégorie « Tourisme » qui a obtenu le score d'appartenance le plus élevé. Il peut également choisir plutôt la catégorie « Sport », qui a un score d'appartenance moindre, mais lui semble préférable. Il peut également se contenter de prendre connaissance de cette recommandation, mais opter pour une autre catégorie de la taxonomie de classification personnalisée, qui lui semble répondre mieux à ses attentes ou à sa logique de classement.This result is displayed on the screen of the terminal of the user 20. The latter can then choose in which category he wishes to classify the content 211 during a CLASS step referenced 194. To do this, he can follow the recommendation automatic classification, ranking the content in the category "Tourism" which has obtained the highest membership score. He may also choose the category "Sport", which has a lower membership score, but seems preferable. He may also be content to take note of this recommendation, but opt for another category of the custom classification taxonomy, which seems to him to better meet his expectations or classification logic.

Un tel classement peut être associé à un archivage électronique du contenu dans un répertoire dédié de son terminal, ou d'un serveur de stockage distant. Il peut également consister à ajouter des métadonnées au contenu, indiquant la catégorie de classement retenue.Such a classification can be associated with electronic archiving of the content in a dedicated directory of its terminal, or a remote storage server. It may also consist of adding metadata to the content, indicating the classification category chosen.

On offre ainsi à l'utilisateur une aide précieuse pour la classification automatique de ses contenus multimédia, qui devient simple et logique. La recherche de contenus précédemment classés est également facilitée.The user is thus offered valuable assistance for the automatic classification of his multimedia contents, which becomes simple and logical. The search for previously classified content is also facilitated.

En effet, la taxonomie de classification utilisée selon un mode de réalisation de l'invention repose sur une plateforme collaborative pour définir une liste très diverse de catégories, qui ne sont pas restreintes à un domaine particulier, mais couvrent au contraire tous les domaines culturels, techniques, historiques, de la vie courante... En outre, l'approche du procédé de classement selon un mode de réalisation de l'invention est dynamique, car elle s'appuie sur une plateforme collaborative, qui est en permanence alimentée et mise à jour, soit par de nouvelles sous-catégories, soit par de nouveaux mots-clés associés à ces sous-catégories. Le degré d'importance de chaque mot-clé dans une catégorie, ou score de pertinence, est également dynamique et évolutif, puisque le résultat de son calcul peut varier en fonction de l'apparition du mot-clé considéré dans de nouveaux articles associés à la catégorie.Indeed, the classification taxonomy used according to one embodiment of the invention relies on a collaborative platform to define a very diverse list of categories, which are not restricted to a particular field, but instead cover all the cultural domains, technical, historical, everyday ... In addition, the approach of the classification method according to one embodiment of the invention is dynamic, because it relies on a collaborative platform, which is permanently powered and put up to date, either by new subcategories or by new keywords associated with these subcategories. The degree of importance of each keyword in a category, or relevance score, is also dynamic and evolutive, since the result of its calculation may vary depending on the appearance of the keyword considered in new articles associated with the category.

En relation avec la figure 4, on considère maintenant la structure simplifiée d'un dispositif 100 de classement de contenus multimédia, selon un exemple de réalisation de l'invention. Un tel dispositif de classement de contenus multimédia est adapté pour mettre en oeuvre le procédé de classement de contenus multimédia précédemment décrit en relation avec les figures 2 et 3.In relation to FIG. 4, we now consider the simplified structure of a device 100 for classifying multimedia contents, according to an exemplary embodiment of the invention. Such a multimedia content ranking device is adapted to implement the multimedia content classification method previously described in relation with FIGS. 2 and 3.

Dans cet exemple, le dispositif 100 est intégré dans une tablette, un ordinateur ou tout autre terminal d'utilisateur TER.In this example, the device 100 is integrated in a tablet, a computer or any other TER user terminal.

Il comprend une unité de traitement 110, équipée par exemple d'un processeur P, et pilotée par un programme d'ordinateur PG 120, stocké dans une mémoire M 130 et mettant en oeuvre le procédé de classement de contenus multimédia selon un mode de réalisation de l'invention. La tablette TER comprend une unité de communication UC qui contient un module d'émisslon/réception adapté pour émettre et recevoir les informations échangées avec le module de personnalisation PERS de la taxonomie de classification par l'utilisateur. A l'initialisation, les instructions de code du programme d'ordinateur PG 120 sont par exemple chargées dans une mémoire RAM (non représentée) avant d'être exécutées par le processeur P de l'unité de traitement 110. Le processeur de l'unité de traitement 110 met en oeuvre les étapes du procédé de classement de contenus multimédia décrit précédemment, selon les instructions du programme d'ordinateur 120.It comprises a processing unit 110, equipped for example with a processor P, and driven by a computer program PG 120, stored in a memory M 130 and implementing the method of classifying multimedia contents according to an embodiment of the invention. The TER tablet includes a communication unit UC which contains an emisslon / reception module adapted to transmit and receive the information exchanged with the personalization module PERS of the classification taxonomy by the user. At initialization, the code instructions of the computer program PG 120 are for example loaded into a RAM (not shown) before being executed by the processor P of the processing unit 110. The processor of the processing unit 110 implements the steps of the multimedia content classification method described above, according to the instructions of the computer program 120.

De façon connue en tant que telle, la tablette TER comprend : - un module INT de traitement des interactions utilisateurs Ul, - un écran de visualisation EC.In a manner known per se, the tablet TER comprises: an INT module for processing user interactions U1, an EC display screen.

Selon l'invention, le dispositif 100 de classement de contenus multimédia comprend en outre un module PERS de personnalisation de la taxonomie de classification, comprenant une unité d'affichage de l'interface de présentation PRES à l'utilisateur des catégories de la taxonomie de classification, et de l'interface de sélection SELEC par l'utilisateur des catégories et sous-catégories qu'il souhaite retenir dans la taxonomie de classification personnalisée. Il comprend également un module CLASSIF de classification automatique de contenu multimédia, comprenant un module de restitution RES des catégories d'appartenance du contenu, avec leur score d'appartenance, et un module de classement CLASS du contenu. Les modules PERS et CLASSIF sont directement pilotés par le processeur P de l'unité de traitement 110.According to the invention, the device 100 for classifying multimedia content also comprises a personalization module PERS of the classification taxonomy, comprising a display unit of the presentation interface PRES to the user of the categories of the taxonomy of classification, and SELEC selection interface by the user of the categories and subcategories that he wishes to retain in the custom classification taxonomy. It also includes a CLASSIF module for automatic classification of multimedia content, comprising an RES module of content membership categories, with their membership score, and a CLASS classification module of the content. The modules PERS and CLASSIF are directly controlled by the processor P of the processing unit 110.

La classification automatique de contenus proposée selon un mode de réalisation de l'invention peut permettre d'identifier les centres d'intérêt d'un utilisateur, i.e. les catégories de la taxonomie de classification personnalisée qu'il utilise le plus. Pour identifier ces centres d'intérêt, on peut utiliser la formule :The automatic content classification proposed according to one embodiment of the invention can make it possible to identify the interests of a user, i.e. the categories of the custom classification taxonomy that he uses the most. To identify these points of interest, we can use the formula:

où Ne est le nombre de contenus multimédia classés dans la catégorie C, et Se_i est le score d'appartenance du i-ième contenu multimédia à la catégorie C.where N is the number of multimedia contents classified in category C, and Se_i is the membership score of the i-th multimedia content in category C.

On peut également souhaiter intégrer le facteur temps dans le calcul des centres d'intérêt, en adoptant la formule alternative :One may also wish to integrate the time factor in the calculation of the centers of interest, by adopting the alternative formula:

où Ne est le nombre de contenus multimédia classés dans la catégorie C, Se^i est le score d'appartenance du i-ième contenu multimédia à la catégorie C et dj est un nombre de jours écoulés depuis le classement du i-ième contenu multimédia. Ceci permet d'accorder une importance plus grande aux contenus classés plus récemment.where N is the number of multimedia contents classified in category C, Se ^ i is the membership score of the i-th multimedia content in category C and dj is a number of days since the classification of the i-th multimedia content . This makes it possible to give greater importance to content classified more recently.

Ce calcul permet d'obtenir les centres d'intérêt de l'utilisateur, sous forme d'une liste de catégories avec leurs facteurs d'affinités, par exemple :This calculation makes it possible to obtain the interests of the user, in the form of a list of categories with their affinity factors, for example:

Ci = { 18% tourisme 12% voyages 8% théâtre 3% sport 1,8% cinéma } A partir du calcul des centres d'intérêts des utilisateurs, on peut établir une matrice d'intérêts pour l'ensemble des utilisateurs ayant recours au service de classification automatique de document selon un exemple de réalisation de l'invention, par exemple:Ci = {18% tourism 12% travel 8% theater 3% sport 1,8% cinema} From the calculation of users' interests, we can establish a matrix of interests for all users using automatic document classification service according to an exemplary embodiment of the invention, for example:

Catl Cat2 catnCatl Cat2 catn

Userl 18% 12% 7%Userl 18% 12% 7%

User2 2% 23% 8%User2 2% 23% 8%

Usern 15% 1.2% 2%Usern 15% 1.2% 2%

Cette matrice permet de calculer l'affinité (ou la proximité) entre utilisateurs sur la base de leurs centres d'intérêts. Elle s'exprime en liste de catégories ayant des facteurs d'affinité proches. Le nombre de catégories à prendre en compte peut être paramétrable, par exemple au minimum trois catégories. Ainsi, on peut former des groupes ou « clusters » d'utilisateurs présentant des centres d'intérêt voisins.This matrix calculates the affinity (or proximity) between users based on their interests. It is expressed in a list of categories with similar affinity factors. The number of categories to be taken into account can be parameterizable, for example at least three categories. Thus, one can form groups or "clusters" of users with neighboring interests.

Par exemple, un premier groupe Groupe 1 des utilisateurs aimant les musées, la sculpture, l'art et la peinture, et un second groupe Groupe 2 des utilisateurs aimant le tourisme, les voyages, les croisières...For example, a first Group 1 group of users who like museums, sculpture, art and painting, and a second Group 2 users who love tourism, travel, cruises ...

Groupe 1 : {Group 1: {

Users : [user58, userll, user200 ...]Users: [user58, userll, user200 ...]

Catégories : [musées, sculpture, art, peinture ...] }Categories: [museums, sculpture, art, painting ...]}

Groupe 2 : {Group 2: {

Users : [userS, user37, userlll...]Users: [userS, user37, userlll ...]

Catégories : [tourisme, voyages, croisières, hôtels ...] }Categories: [tourism, travel, cruises, hotels ...]}

Ce calcul d'affinité (ou de proximité) entre utilisateurs peut permettre, entre autres : • De proposer aux utilisateurs de faire partie d'une communauté, par le biais des réseaux sociaux par exemple ; • De cibler des promotions à un groupe de personnes ayant des centres d'intérêt communs ; • De personnaliser les services et les offresThis calculation of affinity (or proximity) between users can allow, among other things: • To offer users to become part of a community, for example through social networks; • Target promotions to a group of people with common interests; • Customize services and offers

Claims

CLAIMS AMENDED

A method of classifying a multimedia content (210, 220, 230, 211) implementing a content classification taxonomy, characterized in that said method comprises the following steps implemented by a processor: a preliminary step of customizing (30) said classification taxonomy comprising: O presenting (301) a user (20) of a plurality of classification categories of said taxonomy; O a selection (302) by said user of at least two categories of interest (21, 22, 23) among said plurality of categories presented; O for each of these selected categories of interest (cat.1, cat.N), a choice by said user of a depth level (prof.1, Prof.N) of said classification taxonomy making it possible to determine a number of hierarchical levels of sub-categories-girls for said category of interest, a step of classifying (19) said multimedia content (211) in said custom classification taxonomy (18) comprising: O a determination (190) of at least one key-data present in said multimedia content (211); O an identification (191) of at least one category and / or sub-category-daughter of said personalized taxonomy with which said at least one key-data item is associated with a corresponding relevance score; O a calculation (192), for each category and / or subcategory-girl identified, of said membership score of said multimedia content to said category and / or sub-category-girl, from the relevance score of said at least one key data associated with said category and / or sub-category-girl; O a reproduction (193) to the user, in association: of at least one category of said custom classification taxonomy in which to classify said multimedia content, and of a membership score of said multimedia content to said associated category; O ranking (194) said multimedia content in a category selected from: said at least one category returned to the user; another category of said custom classification taxonomy chosen by the user.

2. Classification method according to claim 1, characterized in that said content classification taxonomy is constructed from a scalable collaborative database.

3. A method of classification according to claim 1 or 2, characterized in that it also comprises a step of determining at least two centers of interest of said user among said categories of said custom classification taxonomy, according to the scores of d. belonging to N multimedia contents, where N is an integer greater than or equal to 2, to said categories, and a step of presenting to said user of said at least two specified points of interest, in the form of a list of categories associated with a factor affinity calculated from said membership scores.

4. Classification method according to claim 3, characterized in that said affinity factor Cj of one of said centers of interest C is calculated according to the equation:

where N is the number of multimedia contents classified in said category C, and Sc, i is the membership score of the i-th multimedia content to said category C.

5. Classification method according to claim 3, characterized in that said affinity factor Q of one of said centers of interest C is calculated according to the equation:

where N is the number of multimedia contents classified in said category C, Sc, i is the membership score of the i-th multimedia content to said category C and dj is a number of days elapsed since the classification of the i-th multimedia content .

6. Classification method according to any one of claims 3 to 5, characterized in that it also comprises a step of forming a group of users having common centers of interest and associated affinity factors close .

7. Device for classifying a multimedia content implementing a content classification taxonomy, said device being characterized in that it comprises: a personalization module (PERS) of said classification taxonomy comprising: ο a presentation interface (PRES) to a user of a plurality of classification categories of said taxonomy; O a selection interface (SELEC) by said user of at least two categories of interest among said plurality of categories presented; O an interface of choice by said user of a depth level (Prof. 1, Prof.N) of said classification taxonomy making it possible to determine a number of hierarchical levels of subcategories-girls for said category of interest, for each of said selected categories of interest (cat.1, cat.N), a classification module (CLASSIF) of said multimedia content in said personalized classification taxonomy comprising: O a module for determining at least one key-data item present in said multimedia content (211); O a module for identifying at least one category and / or sub-category-daughter of said personalized taxonomy with which said at least one key-data item is associated with a corresponding relevance score; O a calculation module, for each category and / or subcategory-girl identified, of said membership score of said multimedia content to said category and / or sub-category-girl, from the relevance score of said at least one key data associated with said category and / or sub-category-girl; O an interface (RES) to restore to the user, in association: at least one category of said custom classification taxonomy in which to classify said multimedia content, and a membership score of said multimedia content to said associated category; O a classification module (CLASS) of said multimedia content in a category chosen from: said at least one category returned to the user; another category of said custom classification taxonomy chosen by the user.

Terminal (TER) capable of containing a device for classifying a multimedia content implementing a content classification taxonomy according to claim 7.

A computer program comprising program code instructions for performing the steps of the media classification method implementing a content classification taxonomy according to any one of claims 1 to 6, when said program is executed by a processor.

A computer-readable recording medium on which a computer program is recorded with program code instructions for performing the steps of the method of classifying multimedia content implementing a content classification taxonomy. according to any one of claims 1 to 6, when said program is executed by a processor.