WO2016071085A1

WO2016071085A1 - Recherche automatisée d'une sous-séquence sonore la plus représentative au sein d'une bande sonore

Info

Publication number: WO2016071085A1
Application number: PCT/EP2015/073784
Authority: WO
Inventors: Pierre HANNA; Pascal FERRARO; Matthias ROBINE; Julien ALLALI
Original assignee: Universite de Bordeaux; Centre National De La Recherche Scientifique (Cnrs); Institut Polytechnique De Bordeaux
Priority date: 2014-11-04
Filing date: 2015-10-14
Publication date: 2016-05-12
Also published as: FR3028086A1; FR3028086B1

Abstract

Procédé de recherche automatisée d'au moins une sous-séquence (SS2) représentative au sein d'une bande son (S1), comprenant : - une décomposition séquentielle (E1) en une succession ordonnée de séquences élémentaires éventuellement partiellement chevauchantes, - une attribution (E2) d'un symbole choisi dans un alphabet à chaque séquence élémentaire, - une décomposition séquentielle (E3) en sous chaines de n chaines élémentaires, - un calcul (E4) d'un score correspondant à un cumul de taux d'identité de séquence de la sous-chaîne par rapport aux autres sous-chaînes - une détermination (E5) de la sous-chaîne la plus représentative. Application à une collection de N' bandes son et concaténation des N' sous séquences représentatives en une seule séquence, formant un résumé de la collection de bandes son.

Description

RECHERCHE AUTOMATISÉE D'UNE SOUS-SÉQUENCE SONORE LA PLUS REPRÉSENTATIVE AU SEIN D'UNE BANDE SONORE

L 'invention concerne de façon générale les méthodes d' analyse et de traitement des bandes sonores.

Des bandes sonores peuvent correspondre à des productions musicales, par exemple des morceaux de musique, et elles peuvent être commercialisées sous la forme de CD audio . Il est également possible de commercialiser les bandes sonores par des moyens numériques de vente en ligne.

Généralement, aux fins de promouvoir la vente d' œuvres musicales, des extraits des titres sont mis à la disposition d' acheteurs potentiels . Ces extraits, de durées relativement courtes, par exemp le allant de 30 à 45 secondes, sont destinés à offrir un aperçu des œuvres proposées à la vente.

Le choix de ces extraits peut être réalisé de manière plus ou moins arbitraire, par exemple en optant pour un échantillon provenant des premiers instants des titres . Les extraits ainsi choisis, c'est-à-dire de manière arbitraire, sont rarement représentatifs des œuvres dont ils sont issus, et ils peuvent donner un aperçu erroné aux clients. Certains acheteurs potentiels peuvent ainsi être dissuadés de procéder à l ' achat. D ' autres acheteurs potentiels pourraient être déçus d' avoir acquis des œuvres qui ne répondraient nullement à leurs attentes. Ces acheteurs frustrés risquent alors de se détourner définitivement d'un tel système de vente de musique.

Alternativement, il a été proposé de sélectionner des extraits qui correspondent à des refrains et/ou des couplets des titres . Ces passages, du fait de leurs répétitions au sein d'un même morceau, sont censés être musicalement les plus attractifs voire les plus représentatifs du morceau considéré. Des moyens automatisés ont ainsi été développés en vue d 'identifier ces sous-séquences sonores répétées, qui peuvent alors être utilisées comme résumé sonore.

A cet égard, le document FR 2 856 8 17 décrit le traitement automatisé d'une bande sonore dans lequel un traitement de transformée spectrale permet d' identifier une sous-séquence répétée, et de localiser le début et la fin de cette sous-séquence répétée . Les sous- séquences répétées coïncident généralement soit avec les refrains soit avec les couplets des morceaux ou des titres analysés, lorsque ces derniers comprennent effectivement un refrain et des couplets.

La so lution décrite dans le document FR 2 856 8 1 7 a pour inconvénient de fournir des sous-séquences ayant des durées non- standardisées, qui peuvent grandement varier d'un titre à l ' autre. La durée des sous-séquences est totalement indépendante de la volonté de l ' opérateur, elle est en effet intrinsèque au morceau/titre de référence. Un autre inconvénient à cette solution est qu ' elle ne peut être généralisée à tout type de bande sonore, car toutes les bandes sonores ne sont pas constituées d'un refrain et de couplets.

La présente invention a donc pour but de remédier aux inconvénients présentés ci-avant, et en particulier de permettre la détermination automatique d'une sous-séquence représentative d 'une bande sonore au sein de cette bande sonore de manière simple, avec une durée qui peut être choisie.

L 'invention a donc pour objet un procédé de recherche automatisée d' au moins une sous-séquence sonore au sein d' au moins une bande sonore, la sous-séquence sonore recherchée étant représentative de ladite bande sonore, comprenant une phase élémentaire de recherche automatisée comportant :

- une décomposition séquentielle de la bande sonore en une succession ordonnée de séquences élémentaires éventuellement partiellement chevauchantes, de sorte que :

(D - d) 1

N = + 1

d a -a)

avec

D, la durée de la bande sonore,

d, la durée de chacune des séquences élémentaires, , le taux de chevauchement de chaque séquence élémentaire avec la séquence élémentaire qui la précède, a étant supérieur ou égal à 0 et inférieur à 1 , et

N, le nombre de séquences élémentaires formant ladite bande sonore,

- une attribution à chaque séquence élémentaire d'un symbole choisi dans un alphabet en fonction d' au moins un paramètre inhérent de la séquence élémentaire de façon à obtenir une chaîne de symboles représentative de la bande sonore,

- une décomposition séquentielle de ladite chaîne de symboles en une suite régulière de sous-chaînes consécutives ayant une durée d_sc correspondant à n séquences élémentaires, d_sc étant supérieure à d,

ladite décomposition étant mise en œuvre de façon à ce que le début de la première sous-chaîne de ladite suite coïncide avec une séquence élémentaire particulière de ladite chaîne de symbo les,

- pour chaque sous-chaîne de ladite suite régulière de sous- chaînes, un calcul d'un score correspondant à un cumul de taux d' identité de séquence de la sous-chaîne par rapport aux autres sous- chaînes,

- une sélection de la sous-chaîne ayant le score le plus élevé, la sous-chaîne ayant le score le plus élevé étant la sous-séquence sonore représentative recherchée.

Par décomposition séquentielle, on entend notamment une décomposition ou un découpage ordonné(e), c'est-à-dire d' éléments successifs.

La décomposition séquentielle en une suite de sous-chaînes est mise en œuvre de sorte que les séquences élémentaires de début de deux sous-chaînes consécutives sont séparées par n- 1 séquences élémentaires , n correspond au saut de séquences élémentaires entre deux sous-chaînes consécutives .

Ainsi, contrairement au procédé de traitement décrit dans document FR 2 856 8 17, qui est basé sur une identification de passages répétés, le procédé selon l' invention détermine une sous-séquence ayant une durée d_sc choisie préalablement, et qui a une meilleure homogénéité musicale avec l ' ensemble de la bande sonore.

Les sous-séquences obtenues au moyen du procédé décrit ci- avant peuvent être utilisées pour faire la promotion d' œuvres musicales .

On peut noter que le procédé peut être appliqué, soit directement soit moyennant quelques adaptations évidentes, à tout type de bande sonore, par exemple des fichiers informatiques audio , ou encore des représentations symbo liques de suites de notes ou des fichiers de tablature de guitare, par exemple des fichiers MIDI .

A titre indicatif, lors du traitement d'une série de notes ou d' accords formant une bande sonore, on peut obtenir une sous- séquence représentative sous la forme de descripteurs tonaux (HPCP) .

On peut aussi noter que le procédé décrit ci-avant est adapté quelle que soit la longueur de la sous-séquence recherchée, c ' est-à- dire la durée de l ' extrait (ou l ' échantillon) . Typiquement, le procédé selon l' invention est adapté pour une longueur de 45 secondes, mais il peut également être utilisé pour n' importe quelle autre longueur de sous-séquence, qu ' elle soit plus courte ou plus longue que 45 secondes. Ainsi, le procédé selon l' invention permet par exemple de choisir une deuxième longueur (différente de 45 secondes), qui peut être déterminée en fonction de l ' application visée. Aujourd' hui, il est classique de proposer uniquement des échantillons de la même longueur, par exemple uniquement des échantillons de 45 secondes.

Par ailleurs, contrairement au procédé du document mentionné ci-dessus, il est possible ici d' obtenir une sous-séquence d'un morceau de musique qui comporte à la fois le refrain ainsi que quelques secondes précédant le refrain et quelques secondes suivant ce refrain (si le refrain a une longueur inférieure à la deuxième longueur) . On peut obtenir ainsi une sous-séquence qui peut être plus agréable à écouter qu'une sous-séquence qui démarre directement avec le refrain.

On peut noter que pour obtenir la sous-séquence sonore la plus représentative, on peut déterminer à quel instant de la bande sonore correspond le début de la sous-chaîne ayant le score le plus élevé, pour ensuite identifier dans la bande sonore la sous-séquence représentative.

Ledit au moins un paramètre inhérent d' échantillon est choisi dans le groupe formé par la tonalité, le rythme, le timbre, l ' accord, les paroles et le contexte tonal.

Le calcul du score correspondant à un cumul de taux d' identité de séquence peut être effectué au moyen d'un algorithme d' alignement, par exemple l ' algorithme d' alignement lo cal Smith- Waterman.

Alternativement, le calcul du score correspondant à un cumul de taux d' identité de séquence peut être effectué au moyen d'un algorithme de chaînage tel que celui décrit dans l ' ouvrage de Dan Gusfield intitulé « Algorithme on Strings, Trees and Séquences » . Cambridge University Press, 1997,59,60,78 , 8 1 , 82, 83.

II est possible d 'utiliser des algorithmes connus de l' homme du métier qui permettent d'obtenir ces scores . A titre indicatif, on peut mettre en œuvre l ' algorithme BLAST (décrit dans l' article de Altschul SF, Gish W, Miller W, Myers EW et Lipman DJ intitulé « Basic lo cal alignment search tool » J Mo l Bio l. 1990) ou l ' algorithme FASTA (décrit dans l ' article « Rapid and sensitive protein similarity searches » de D J Lipman et W R Pearson, Science 04/ 1985), utilisés dans le domaine de la bio logie.

On peut notamment utiliser pour la détermination de la sous- chaîne la plus répétée un algorithme de détermination de correspondance de chaîne. On obtient ainsi de manière automatique un score de répétition permettant de déduire la sous-chaîne la plus répétée. La séquence élémentaire particulière de ladite chaîne de symbo les peut ne pas être la première séquence élémentaire de ladite chaîne de symbo les. Ainsi, on ne prend pas en compte le début de la bande sonore.

La durée d peut être comprise entre 50 et 1000 millisecondes . Selon un mode de mise en œuvre, a peut être égal à 0 et les séquences élémentaires ne sont alors pas chevauchantes . En variante, a est compris entre 0 , 1 et 0,9 et les séquences sont chevauchantes , a est typiquement de l ' ordre de 0,5.n peut être compris entre 1 et 100. De préférence, n est compris entre 20 et 50.

Le procédé selon l 'invention, de mise en œuvre et d'utilisation particulièrement simples et rapides, permet avantageusement de générer un extrait sonore particulier, d'une durée ajustable (c ' est-à- dire qui peut être librement fixée par un opérateur), éventuellement standardisée, musicalement représentatif d'un morceau et/ou d'un titre musical spécifique.

Selon une autre application particulière, le procédé de recherche automatisé défini ci-avant peut être avantageusement utilisé en vue de générer un « résumé » d'un ensemble défini de bandes sonores (notamment, des titres d 'un même album, des titre d'une compilation d' albums, des titres d'une « playlist », l 'œuvre complète ou partielle d'un artiste/groupe ... ) . Une génération d'un tel résumé comprend alors une compilation d' extraits, chacun obtenu au moyen de la phase élémentaire de recherche automatisée du procédé de recherche automatisée défini ci-avant.

Pour cela, on peut rechercher automatiquement grâce à N ' phases élémentaires de recherche automatisée, N ' sous-séquences sonores répétitives dans respectivement N ' séquences ou bandes sonores . Les N ' sous-séquences sonores répétitives peuvent former un résumé de l ' ensemble des N ' séquences sonores . Cette génération de résumé peut comprendre en outre une concaténation desdites N ' sous- séquences sonores répétitives sous la forme d'une seule sous-séquence. Ainsi, dans le cas du traitement d'un album de musique comprenant N ' séquences ou bandes sonores, on peut obtenir une sous-séquence qui est un résumé de l ' album entier. On peut ainsi obtenir une sous- séquence pouvant comporter plusieurs refrains, représentative de l ' album entier.

L 'invention a également pour obj et un système informatique comprenant des moyens configurés pour mettre en œuvre le procédé tel que défini ci-avant, par exemple un ordinateur, comportant des moyens tels qu'une unité centrale et des moyens de mémoire, configurés pour mettre en œuvre le procédé défini ci-avant . L 'invention a également pour obj et un produit programme d' ordinateur chargeable directement dans une mémoire d'un système informatique, comprenant des portions de code de logiciel pour l ' exécution du procédé tel que défini ci-avant lorsque ledit programme est exécuté sur ledit système informatique .

Enfin, l 'invention a pour obj et un support lisible par un système informatique, ayant des instructions exécutables par ordinateur adaptées pour provoquer l ' exécution par le système informatique du procédé tel que défini ci-avant.

D ' autres avantages et caractéristiques de l ' invention apparaîtront à l ' examen de la description détaillée de modes de mise en œuvre et de réalisation, nullement limitatifs, et des dessins annexés sur lesquels les figures 1 et 2 représentent de manière schématique les étapes de différents modes de mise en œuvre d'un procédé de recherche automatisée selon l' invention.

La présente invention peut être mise en œuvre pour traiter des bandes sonores référencées S I sur la figure 1 .

Une telle bande sonore peut être un morceau de musique. I l convient de noter qu'une telle bande sonore peut être obtenue après un échantillonnage d'un signal audio, par exemple à 44, 1 kHz comme tel est le cas pour les CD audio .

La bande sonore S I a plusieurs portions bien définies dans le domaine de la musique, notamment un refrain et des couplets.

Sur la figure 1 , on a représenté de manière schématique différentes étapes d'une phase élémentaire 10 d'un mode de mise en œuvre d'un procédé selon l ' invention.

Par ailleurs, sur la figure 1 , la référence SINF désigne globalement un système informatique, par exemple un ordinateur, comportant des moyens tels qu'une unité centrale et des moyens de mémoire, configurés pour mettre en œuvre un mode de mise en œuvre du procédé selon l' invention.

Un tel procédé selon l' invention permet de rechercher automatiquement dans une bande sonore S I une sous-séquence représentative ayant une longueur choisie. La séquence sonore S I peut être un signal échantillonné stocké sur un support informatique. Pour rendre possible la recherche de la sous-séquence, une décomposition séquentielle est mise en œuvre dans une première étape E l .

Cette décomposition séquentielle E l de la bande sonore comporte une décomposition séquentielle en une succession ordonnée de séquences élémentaires éventuellement partiellement chevauchantes, de sorte que la formule suivante soit vérifiée :

avec :

D, la durée de la bande sonore (S I ),

d, la durée de chacune des séquences élémentaires,

a, le taux de chevauchement de chaque séquence élémentaire avec la séquence élémentaire qui la précède, a étant supérieur ou égal à 0 et inférieur à 1 , et

N, le nombre de séquences élémentaires formant ladite bande sonore.

Dans cette étape, on découpe la bande sonore S I en une pluralité de séquences élémentaires ayant toutes une longueur choisie d, par exemple de l ' ordre de 300 millisecondes. On obtient ainsi un nombre limité de séquences élémentaires à traiter.

Préalablement à la mise en œuvre du procédé, un alphabet a été défini. N ' importe quel alphabet peut être utilisé pour la mise en œuvre du procédé. Cet alphabet comporte des symboles destinés à être attribués à des séquences élémentaires en fonction d' au mo ins un paramètre inhérent de ces séquences élémentaires. A titre indicatif, le paramètre peut être choisi dans le groupe formé par la tonalité, le rythme, le timbre, l ' accord, les paro les et le contexte tonal.

On peut noter que pour la tonalité, il est possible de considérer des descripteurs de type « Pitch Class Profile » (PCP ou chroma), bien connus de l' homme du métier et qui pourra à toutes fins utiles se référer notamment à l ' article de T . Fujishima, intitulé « Realtime chord récognition of musical sound: a System using common lisp music », Proc. of ICMC, pp . 464-467 ( 1999) .

Si le paramètre inhérent est le rythme, il est possible de considérer des descripteurs de type Meter Class Profiles (MCP) tels que ceux décrits dans l ' article de M. Robine, M . Lagrange, P . Hanna, intitulé « Meter Class Profiles For Music Similarity And Retrieval », Proc . of the International Society for Music Information Retrieval Conférence (ISMIR), pp . 639-644, Kobe, Japan, October 2009.

Si le paramètre inhérent est le timbre, on peut considérer des descripteurs de type Mel Frequency Cepstral Coefficients (MFCC), bien connus de l 'homme de l ' art.

Si le paramètre inhérent est le contexte tonal, on peut attribuer un symbo le en fonction du contexte tonal, chaque symbole pouvant être associé notamment à une amplitude de spectre et à une octave.

Ainsi, lors d'une deuxième étape E2, chaque séquence élémentaire obtenue en sortie de l ' étape E l est traitée pour déterminer la valeur du ou des paramètres inhérents associés à cette séquence élémentaire pour ensuite attribuer un symbo le à cette séquence élémentaire. On obtient ainsi une chaîne de symbo les, qui correspond à une représentation simplifiée de la bande sonore S I et qui est donc traitable de façon automatique en un temps raisonnable.

L ' homme du métier sait déterminer les valeurs de ces paramètres pour une séquence élémentaire. A titre d' exemple, on peut mettre en œuvre une étape de mesure du paramètre de la séquence élémentaire, et lire ensuite dans une cartographie ayant en entrée des valeurs de paramètre inhérent et délivrant en sortie le symbo le à associer.

Une étape E3 est ensuite mise en œuvre, dans laquelle on met en œuvre une décomposition séquentielle de la chaîne de symboles obtenue à l ' étape E2.

La décomposition séquentielle E3 de ladite chaîne de symboles comporte une décomposition séquentielle en une suite régulière de sous-chaînes consécutives ayant une durée dsc correspondant à n séquences élémentaires, dsc étant supérieure à d. La décomposition est mise en œuvre de façon à ce que le début de la première sous- chaîne de ladite suite coïncide avec une séquence élémentaire particulière de ladite chaîne de symboles.

A titre indicatif, dsc peut être 45 secondes . Le choix de la deuxième longueur dépend de l 'utilisateur qui met en œuvre le procédé. La séquence élémentaire particulière peut être la première séquence élémentaire ou une autre séquence élémentaire.

Au cours d'une étape E4, les sous-chaînes obtenues par l ' étape E3 sont traitées pour qu'un calcul (E4) soit mis en œuvre. Dans l ' étape E4, on calcule un score correspondant à un cumul de taux d ' identité de séquence de la sous-chaîne par rapport aux autres sous-chaînes.

La détermination de ces scores peut être mise en œuvre au moyen d' algorithmes de détermination de correspondance de chaîne ou d' algorithmes d' alignement local. Comme on le conçoit, l 'utilisation d'un alphabet restreint permet de limiter la comp lexité de la mise en œuvre du procédé. À titre indicatif, on peut mettre en œuvre les algorithmes BLAST ou FASTA, utilisés dans le domaine de la bio logie, on encore l ' algorithme Smith-Waterman. Il convient de noter qu' il est possible, en utilisant de tels algorithmes, de déterminer la sous-séquence répétitive avec une complexité notée 0(|x|²log(|x |)), où O correspond à la notation de Landau et x correspond à la longueur de la chaîne de symbo les obtenue en sortie de l' étape E2.

Enfin, dans l ' étape E5 on sélectionne la sous-chaîne ayant le score le plus élevé, la sous-chaîne ayant le score le plus élevé étant la sous-séquence sonore représentative recherchée S S2.

Si S I est un morceau de musique, alors S S2 peut contenir le refrain.

On obtient ainsi une sous-séquence représentative dans une bande sonore du fait de sa répétition, et un extrait ayant une longueur choisie.

Selon une autre application particulière, la phase élémentaire 10 de recherche automatisé décrite ci-avant peut être avantageusement utilisée en vue de générer un « résumé » d'un ensemble défini de N ' bandes sonores (notamment, des titres d 'un même album, des titres d'une compilation d'albums, des titres d'une « playlist », l'œuvre complète ou partielle d'un artiste/groupe...). Une génération d'un tel résumé comprend alors une compilation d'extraits, chacun obtenu au moyen de ladite phase élémentaire de recherche automatisée 10.

Pour cela, comme illustré sur la figure 2, on peut rechercher automatiquement grâce à N' phases élémentaires de recherche automatisée 10, N' sous-séquences sonores répétitives SS2i-SS2_N' dans respectivement N' séquences ou bandes sonores S1_I-S1N'.

Les N' sous-séquences sonores répétitives SS2i-SS2_N' peuvent former un résumé de l'ensemble des N' séquences sonores S1_I-S1N'.

Cette génération de résumé peut comprendre en outre une concaténation 20 desdites N' sous-séquences sonores répétitives SS2i- SS2_N' sous la forme d'une seule sous-séquence SSR.

Ainsi, dans le cas du traitement d'un album de musique comprenant N' séquences ou bandes sonores S1_I-S1_N', on peut obtenir une sous-séquence SSR qui est un résumé de l'album entier.

On peut ainsi obtenir une sous-séquence SSR pouvant comporter plusieurs refrains, représentative de l'album entier.

Claims

REVENDICATIONS

1 . Procédé de recherche automatisée d' au moins une sous- séquence sonore (S S2) au sein d' au moins une bande sonore (S I ), la sous-séquence sonore recherchée étant représentative de ladite au moins une bande sonore, comprenant une phase élémentaire de recherche automatisée comportant :

une décomposition séquentielle (E l ) de la bande sonore en une succession ordonnée de séquences élémentaires éventuellement partiellement chevauchantes, de sorte que :

avec :

D, la durée de la bande sonore (S I ),

d, la durée de chacune des séquences élémentaires,

N, le nombre de séquences élémentaires formant ladite bande sonore,

une attribution (E2) à chaque séquence élémentaire d'un symbo le choisi dans un alphabet en fonction d ' au moins un paramètre inhérent de la séquence élémentaire, de façon à obtenir une chaîne de symbo les,

une décomposition séquentielle (E3) de ladite chaîne de symbo les en une suite régulière de sous-chaînes consécutives ayant une durée d_sc correspondant à n séquences élémentaires, d_sc étant supérieure à d, ladite décomposition étant mise en œuvre de façon à ce que le début de la première sous-chaîne de ladite suite coïncide avec une séquence élémentaire particulière de ladite chaîne de symbo les,

pour chaque sous-chaîne de ladite suite régulière de sous-chaînes, un calcul (E4) d'un score correspondant à un cumul de taux d'identité de séquence de la sous- chaîne par rapport aux autres sous-chaînes,

une sélection (E5) de la sous-chaîne ayant le score le plus élevé, la sous-chaîne ayant le score le p lus élevé étant la sous-séquence sonore représentative recherchée.

2. Procédé selon la revendication 1 , dans lequel ledit au moins un paramètre inhérent d' échantillon est choisi dans le groupe formé par la tonalité, le rythme, le timbre, l ' accord, les paroles et le contexte tonal.

3. Procédé selon la revendication 2 , dans lequel le paramètre inhérent est le contexte tonal, et dans lequel on attribue un symbo le en fonction du contexte tonal.

4. Procédé selon la revendication 3 , dans lequel chaque symbo le est associé à une amplitude de spectre et à une octave.

5. Procédé selon l 'une quelconque des revendications précédentes, dans lequel le calcul du score correspondant à un cumul de taux d' identité de séquence est effectué au moyen d'un algorithme d' alignement.

6. Procédé selon l 'une quelconque des revendications 1 à 4, dans lequel le calcul du score correspondant à un cumul de taux d' identité de séquence est effectué au moyen d'un algorithme de chaînage.

7. Procédé selon l 'une quelconque des revendications précédentes, dans lequel la séquence élémentaire particulière de ladite chaîne de symbo les n' est pas la première séquence élémentaire de ladite chaîne de symbo les.

8. Procédé selon l 'une quelconque des revendications précédentes, dans lequel la durée d est comprise entre 50 et 1000 millisecondes .

9. Procédé selon l 'une quelconque des revendications précédentes, dans lequel a est égal à 0 et dans lequel les séquences élémentaires ne sont pas chevauchantes .

10. Procédé selon l 'une quelconque des revendications précédentes, dans lequel a est compris entre 0, 1 et 0 ,9 et dans lequel les séquences sont chevauchantes .

1 1 . Procédé selon l 'une quelconque des revendications précédentes, dans lequel n est compris entre 1 et 100.

12. Procédé selon l 'une quelconque des revendications précédentes, comprenant N ' phases élémentaires de recherche automatisée délivrant respectivement N ' sous-séquences sonores respectivement représentatives de N' bandes sonores de façon à générer un résumé de l ' ensemble des N ' bandes sonores .

13. Procédé selon la revendication 12, comprenant en outre une concaténation des N ' sous-séquences en une seule sous-séquence.

14. Système informatique comprenant des moyens configurés pour mettre en œuvre le procédé selon l 'une des revendications 1 à 13.

15. Produit programme d' ordinateur chargeable directement dans une mémoire d'un système informatique, comprenant des portions de code de logiciel pour l ' exécution du procédé selon l 'une des revendications 1 à 13 lorsque ledit programme est exécuté sur ledit système informatique.

16. Support lisible par un système informatique, ayant des instructions exécutables par ordinateur adaptées pour provoquer l ' exécution par le système informatique du procédé selon l 'une des revendications 1 à 13.