EP1671315B1

EP1671315B1 - Procede et dispositif pour caracteriser un signal audio

Info

Publication number: EP1671315B1
Application number: EP05735854A
Authority: EP
Inventors: Markus Cremer; Christian Uhle
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2004-05-07
Filing date: 2005-04-27
Publication date: 2007-05-02
Anticipated expiration: 2025-04-27
Also published as: EP1671315A1; JP4926044B2; JP2007536586A; WO2005114650A1; DE102004022659B3; DE502005000658D1

Abstract

Afin de caractériser un signal audio, on prépare une séquence de points d'application quantifiés dans le temps pour chaque source audio parmi au moins deux sources audio, sur la base d'une grille de quantification (1). On détermine ensuite une longueur périodique commune aux deux sources audio, en utilisant les séquences de points d'application dans le temps (12). On subdivise ensuite la séquence de points d'application dans le temps en sous-séquences correspondantes (14), la longueur d'une sous-séquence étant égale à la longueur périodique commune. Finalement, on combine les sous-séquences d'une première source audio en une première sous-séquence combinée et on combine les sous-séquences de la deuxième source audio en une deuxième sous-séquence combinée (16), en utilisant, par exemple, un histogramme à motifs, afin de caractériser le signal audio, par exemple son rythme, sa vitesse ou son genre, sur la base de la première sous-séquence combinée et de la deuxième sous-séquence combinée.

Claims

Dispositif pour caractériser un signal sonore, aux caractéristiques suivantes :
un dispositif (10) destiné à préparer une succession de moments d'attaque de sons pour au moins une source sonore ;

un dispositif (12) destiné à déterminer une longueur de période commune qui est à la base de l'au moins une source sonore, à l'aide de l'au moins une succession de moments d'attaque ;

un dispositif (14) destiné à subdiviser l'au moins une succession de moments d'attaque en sous-successions respectives, une longueur d'une sous-succession étant égale à la longueur de période commune ou étant dérivée de la longueur de période commune ; et

un dispositif (16) destiné à regrouper les sous-successions pour l'au moins une source sonore, pour obtenir une sous-succession regroupée, la sous-succession regroupée représentant une caractéristique du signal sonore.
Dispositif selon la revendication 1,
dans lequel le dispositif (10) destiné à préparer est réalisé de manière à préparer au moins deux successions de moments d'attaque pour au moins deux sources sonores,
dans lequel le dispositif (12) destiné à déterminer est réalisé de manière à déterminer la longueur de période commune pour les au moins deux sources sonores,
dans lequel l'un dispositif (14) destiné à subdiviser est réalisé de manière à subdiviser les au moins deux successions de moments d'attaque selon la longueur de période commune, et
dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à regrouper les sous-successions pour la deuxième source sonore, pour obtenir une deuxième sous-succession regroupée, la première sous-succession regroupée et la deuxième sous-succession regroupée représentant la caractéristique du signal sonore.
Dispositif selon la revendication 1, dans lequel le dispositif destiné à préparer (10) est réalisé de manière à fournir pour chacune des au moins deux sources sonores une succession de moments d'attaque quantifiés, les moments d'attaque étant quantifiés par rapport à une trame de quantification, une distance de points de trame entre deux points de trame étant égale à une distance la plus petite entre deux sons dans le signal sonore ou égale au diviseur commun le plus grand des durées de sons dans le signal musical.
Dispositif selon la revendication 1, 2 ou 3, dans lequel le dispositif (10) destiné à préparer est réalisé de manière à fournir les moments d'attaque d'instruments percussifs, mais pas les moments d'attaque d'instruments harmoniques.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif destiné à déterminer (12) est réalisé de manière à
déterminer, pour chacune d'une pluralité de longueurs de période communes hypothétiques, une mesure de probabilité, et
sélectionner, comme longueur de période commune, la longueur de période commune hypothétique parmi la pluralité de longueurs de période communes hypothétiques dont la mesure de probabilité indique que la longueur de période commune hypothétique est la longueur de période commune pour les au moins deux sources sonores.
Dispositif selon la revendication 5, dans lequel le dispositif (12) destiné à déterminer est réalisé de manière à déterminer la mesure de probabilité sur base d'une première mesure de probabilité pour la première source sonore et sur base d'une deuxième mesure de probabilité pour la deuxième source sonore.
Dispositif selon la revendication 5 ou 6, dans lequel le dispositif (12) destiné à déterminer est réalisé de manière à calculer les mesures de probabilité par une comparaison de la succession de moments d'attaque avec une succession décalée de moments d'attaque.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (14) destiné à subdiviser est réalisé de manière à générer une liste pour chaque sous-succession, la liste présentant, pour chaque point de trame et pour chaque source sonore, une information assosciée qui se rapporte à si au point de trame est présent ou non un moment d'attaque d'un son.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (10) destiné à préparer est réalisé de manière à générer une liste pour chaque source sonore, la liste présentant, pour chaque point d'une trame, une information assosciée de si au point de trame est présent ou non un moment d'attaque d'un son.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à générer, comme sous-succession regroupée, un histogramme.
Dispositif selon la revendication 10, dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à générer l'histogramme de sorte que chaque point d'une trame de son de la sous-succession regroupée représente un bin d'histogramme.
Dispositif selon la revendication 10 ou 11, dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à incrémenter, à chaque sous-succession pour une source sonore, en cas de détection d'une entrée, une valeur de comptage pour un bin associé dans l'histogramme, ou pour l'incrémenter par l'addition d'une mesure fixée par l'entrée, l'entrée étant une mesure d'une intensité d'un son qui a une attaque au moment d'attaque.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à sortir dans la première sous-succession regroupée et la deuxième sous-succession regroupée, comme caractéristique, uniquement des valeurs des sous-successions qui se situent au-dessus d'un seuil.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (16) destiné à regrouper est réalisé de manière à normaliser les sous-successions par rapport à la longueur commune ou pour normaliser la première sous-succession regroupée ou la deuxième sous-succession regroupée par rapport à la longueur commune.
Dispositif selon l'une des revendications précédentes, dans lequel le dispositif (10) destiné à préparer est réalisé de manière à générer des segments à structure rythmique unitaire à partir d'un signal audio, et
le dispositif (16) destiné à regrouper est réalisé de manière à générer la caractéristique pour un segment à structure rythmique unitaire.
Dispositif selon l'une des revendications précédentes, présentant, par ailleurs, la caractéristique suivante :
un dispositif destiné à extraire une caractéristique de la caractéristique pour le signal sonore ; et

un dispositif destiné à déterminer un genre musical auquel appartient le signal sonore, à l'aide de la caractéristique.
Dispositif selon la revendication 16, dans lequel le dispositif destiné à déterminer est réalisé de manière à utiliser un réseau de décision à base de règles, un dispositif d'identification de modèle ou un classificateur.
Dispositif selon l'une des revendications précédentes, présentant, par ailleurs, un dispositif destiné à extraire un tempo à partir de la caractéristique.
Dispositif selon la revendication 18, dans lequel le dispositif destiné à extraire est réalisé de manière à déterminer le tempo sur base de la longueur de période commune.
Procédé pour caractériser un signal sonore, aux étapes suivantes consistant à :
préparer (10) une succession de moments d'attaque de sons pour au moins une source sonore ;

déterminer (12) une longueur de période commune qui est à la base de l'au moins une source sonore, à l'aide de l'au moins une succession de moments d'attaque ;

subdiviser (14) l'au moins une succession de moments d'attaque en sous-successions respectives, une longueur d'une sous-succession étant égale à la longueur de période commune ou étant dérivée de la longueur de période commune ; et

regrouper (16) les sous-successions pour l'au moins une source sonore, pour obtenir une sous-succession regroupée, la sous-succession regroupée représentant une caractéristique du signal sonore.
Programme d'ordinateur avec un code de programme pour l'exécution du procédé selon la revendication 20 lorsque le programme se déroule sur un ordinateur.