EP0331107B1

EP0331107B1 - Procédé et dispositif pour la transcription de musique

Info

Publication number: EP0331107B1
Application number: EP89103498A
Authority: EP
Inventors: Shichirou Tsuruta; Yosuke Takashima; Masaki Fujimoto; Masanori Mizuno
Original assignee: NEC Home Electronics Ltd; NEC Corp
Current assignee: NEC Home Electronics Ltd; NEC Corp
Priority date: 1988-02-29
Filing date: 1989-02-28
Publication date: 1993-07-21
Anticipated expiration: 2009-02-28
Also published as: AU3079689A; AU614582B2; DE68907616T2; EP0331107A2; KR970009939B1; EP0331107A3; DE68907616D1; KR890013602A

Claims

Procédé pour transcrire de la musique comprenant les étapes qui consistent à:
entrer un signal acoustique;
extraire une information de ton et une information de puissance acoustique dudit signal acoustique d'entrée;
corriger ladite information de ton proportionnellement à la valeur de déviation de l'information de ton pour ledit signal acoustique par rapport à un axe des intervalles musicaux absolus;
diviser en premier ledit signal acoustique en segments sonores uniques selon ladite information de ton corrigée tout en divisant en deuxième ledit signal acoustique en segments sonores uniques selon les variations de ladite information de puissance;
diviser en troisième ledit signal acoustique selon à la fois lesdites informations de segment obtenues dans lesdites première et deuxième étapes de division;
identifier des intervalles musicaux desdits signaux acoustiques dans chacun desdits segments le long de l'axe des intervalles musicaux absolus en référence à ladite information de ton;
diviser en quatrième ledit signal acoustique à nouveau en segments sonores uniques selon le point que lesdits intervalles musicaux identifiés desdits segments in continuum sont ou non identiques;
déterminer une clé dudit signal acoustique selon ladite information de ton extraite;
déterminer une mesure et un tempo dudit signal acoustique selon lesdites informations de segment; et
compiler les données de partition musicale à partir desdites informations dudit intervalle musical, de ladite longueur de son, de ladite clé, de ladite mesure et dudit tempo déterminés.
Procédé pour transcrire de la musique selon la revendication 1 comprenant en outre une étape qui consiste à éliminer les bruits desdites et à interpoler lesdites informations de ton et de puissance extraites après ladite extraction desdites informations de ton et de puissance.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 et 2, dans lequel ladite deuxième étape de division comprend les étapes qui consistent à:
comparer ladite information de puissance à une valeur prédéterminée et diviser ledit signal acoustique en une première partie plus grande que ladite valeur prédéterminée tout en identifiant ladite première partie comme une partie effective et en une seconde partie plus petite que ladite valeur prédéterminée tout en idenfiant ladite seconde partie comme une partie incorrecte;
extraire un point de changement dans la croissance de ladite information de puissance par rapport à ladite partie effective;
diviser ladite partie effective en plus petites portions audit point de changement dans la croissance;
mesurer la longueur desdits segments à la fois desdites parties effectives et incorrectes; et à
lier tout segment d'une longueur plus petite qu'une longueur prédéterminée au segment précédent pour former un segment.
Procédé pour transcrire de la musique selon la revendication 2, dans lequel ladite deuxième étape de division comprend les étapes qui consistent à:
extraire un point de changement dans la croissance de ladite information de puissance par rapport à ladite partie effective; et à
diviser ledit signal acoustique selon ledit point de changement extrait dans la croissance.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 et 2, dans lequel ladite deuxième étape de division comprend les étapes qui consistent à:
diviser ledit signal acoustique en une première partie plus grande qu'une valeur de puissance acoustique prédéterminée tout en identifiant ladite première partie comme une partie effective et en une seconde partie plus petite que ladite valeur de puissance acoustique prédéterminée tout en identifiant ladite partie comme une partie incorrecte;
mesurer la longueur à la fois desdites première et seconde parties; et à
lier tout segment de longueur inférieure à une longueur prédéterminée au segment précédent.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 et 2, dans lequel ladite deuxième étape de division comprend les étapes qui consistent à:
extraire un point de changement dans la croissance de ladite information de puissance; et à
diviser ledit signal acoustique par rapport audit point de changement dans la croissance.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 et 2, dans lequel ladite deuxième étape de division comprend les étapes qui consistent à:
extraire un point de changement dans la croissance de ladite information de puissance;
diviser ledit signal acoustique par rapport audit point de chanchement dans la croissance; et à
lier tout segment de longueur inférieure à une longueur prédéterminée au segment précédent.
Procédé pour transcrire de la musique selon l'une des revendications 1 à 7, dans lequel ladite première étape de division comprend les étapes qui consistent à :
calculer la longueur de chacun d'une série de points d'échantillonnage selon ladite information de ton extraite;
détecter une partie dans laquelle ladite longueur de ladite série calculée dépassant une valeur prédéterminée continue;
extraire un point d'échantillonnage dans la série de points ayant la longueur maximale à l'égard de chacune desdites parties détectées et identifier ledit point d'échantillonnage comme un point typique;
détecter la valeur de la variation de ladite information de ton entre lesdits points typiques par rapport aux points d'échantillonnage individuels entre eux quand la différence desdites informations de ton en deux points typiques voisins dépasse une valeur prédéterminée; et à
diviser lesdits signaux acoustiques audit point d'échantillonnage où la valeur de la variation de ton est au maximum.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 8, dans lequel ladite troisième étape de division comprend les étapes qui consistent à:
déterminer une longueur de référence correspondant à une durée prédéterminée d'une note selon chacune des longueurs dudit segment divisé dans ladite première étape de division; et à
diviser ledit premier segment divisé selon ladite longueur de référence et diviser à nouveau en détail ledit segment divisé ayant une longueur plus grande que ladite durée prédéterminée de ladite note.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à:
calculer la distance le long de l'axe des intervalles musicaux absolus entre chacun dudit segment de ladite information de ton et dudit intervalle musical absolu;
détecter la plus petite distance; et à
identifier ledit intervalle musical de la plus petite distance comme intervalle musical présent dudit segment.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à :
calculer une valeur moyenne de toutes les dites informations de ton dudit segment; et à
identifier ledit intervalle musical dudit segment trouvé sur l'axe des intervalles musicaux absolus et le plus proche de ladite valeur moyenne calculée comme intervalle musical présent pour le segment particulier.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à :
extraire une valeur intermédiaire de ladite information de ton de chacun des segments; et à
identifier l'intervalle musical ayant une valeur intermédiaire la plus proche dudit intervalle musical absolu comme intervalle musical présent.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à :
extraire la valeur la plus fréquente de ladite information de ton; et à
identifier l'intervalle musical dont la valeur la plus fréquente de son information de ton est la plus proche de celle de l'intervalle musical absolu comme intervalle musical présent.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à:
extraire une information de ton au point de crête dans la croissance de ladite information de puissance pour chaque segment; et à
identifier l'intervalle musical ayant un point de crête le plus proche de ladite information de ton comme intervalle musical présent.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 9, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à:
calculer la longueur de la série trouvée par rapport à un point analytique pour chaque segment;
extraire un segment ayant la longueur maximale de la série; et à
identifier l'intervalle musical extrait par rapport à l'intervalle musical absolu selon ladite information de ton pour le point analytique ayant ladite longueur maximale de la série.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 10 à 15, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à:
extraire les segments dont la longueur est inférieure à une valeur prédéterminée;
extraire les segments dans lesquels le ton varie à une fréquence constante;
détecter la différence d'intervalle musical identifié entre ledit segment extrait et les segments voisins; et à
identifier l'intervalle musical dont la différence est inférieure à une valeur prédéterminée comme intervalle musical présent.
Procédé pour transcrire de la musique selon la revendication 16, dans lequel ladite étape d'identification d'intervalles musicaux comprend les étapes qui consistent à:
extraire les segments dudit intervalle musical différent d'un intervalle musical voisin d'un demi-ton dans la gamme musicale pour la clé;
classer les totaux des éléments de ladite information de ton existant entre ledit intervalle musical identifié dudit segment et ledit intervalle musical différent de celui-ci du demi-ton dans la gamme musicale pour la clé; et à
identifier un intervalle musical présent dudit segment conformément auxdits totaux classés des éléments de ladite information de ton.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 17, dans lequel l'étape de détermination de la clé comprend les étapes qui consistent à:
classer les totaux des éléments de ladite information de ton par rapport à l'axe des intervalles musicaux absolus;
extraire la fréquence d'apparition de la gamme musicale dudit intervalle musical dans ledit signal acoustique;
calculer une somme de produits avec un coefficient de pondération prédéterminé et ladite fréquence d'apparition extraite de la gamme musicale dudit intervalle musical par rapport à toutes les clés possibles; et à
identifier ladite clé ayant la somme de produits maximale comme clé présente dudit signal acoustique.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 18, dans lequel ladite étape d'extraction d'information de ton comprend les étapes qui consistent à:
convertir un signal analogique dudit signal acoustique d'entrée sous forme numérique;
calculer une fonction d'autocorrélation dudit signal acoustique sous la forme numérique;
détecter la valeur de déviation donnant le maximum du maximum local pour lesdites fonctions d'autocorrélation calculées par une valeur de déviation différente de 0;
détecter une courbe approximative suivie par lesdites fonctions d'autocorrélation d'une pluralité de points d'échantillonnage y compris celle donnant ladite valeur de déviation;
déterminer la valeur de déviation donnant le maximum local de ladite autocorrélation sur ladite courbe approximative calculée; et à
détecter une fréquence de ton selon ladite valeur de déviation déterminée.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 19, dans lequel ladite étape d'extraction d'information de ton comprend les étapes qui consistent à :
convertir un signal analogique dudit signal acoustique d'entrée sous forme numérique;
calculer une fonction d'autocorrélation dudit signal acoustique sous la forme numérique;
détecter une information de ton conformément à l'information de maximum de ladite fonction d'autocorrélation calculée;
juger si le point de maximum local de ladite fonction d'autocorrélation est présent à proximité de deux fois la composante de fréquence de ladite information de ton détectée; et à
sortir une information de ton présent correspondant audit maximum local si le résultat du jugement est positif.
Procédé pour transcrire de la musique selon l'une quelconque des revendications 1 à 20, dans lequel ladite étape de correction d'information de ton comprend les étapes qui consistent à:
classer les totaux desdites informations de ton;
détecter la valeur de déviation par rapport à l'axe des intervalles musicaux absolus de ladite information de ton sur lesdits totaux classés; et à
modifier l'intervalle musical pour ledit signal acoustique de la valeur de déviation.
Dispositif pour transcrire de la musique, comprenant:
un moyen (8) pour entrer un signal acoustique analogique;
un moyen (10) pour amplifier ledit signal acoustique entré;
un moyen (12) pour convertir le signal analogique sous forme numérique;
un moyen (13) pour traiter ledit signal acoustique numérique pour l'extraction d'une information de ton et d' une information de puissance acoustique, ledit moyen de traitement incluant:
un moyen pour corriger ladite information de ton proportionnement à la valeur de déviation de l'information de ton pour ledit signal acoustique par rapport à un axe des intervalles musicaux absolus;
un premier moyen pour diviser ledit signal acoustique en segments sonores uniques selon ladite information de ton corrigée;
un deuxième moyen pour diviser ledit signal acoustique en segments sonores uniques selon les variations de ladite information de puissance;
un troisième moyen pour diviser ledit signal acoustique selon à la fois lesdits informations de segment obtenues par lesdits premier et deuxième moyens;
un moyen pour identifier des intervalles musicaux dudit signal acoustique dans chacun desdits segments le long de l'axe des intervalles musicaux absolus en référence à ladite information de ton;
un quatrième moyen pour diviser ledit signal acoustique à nouveau en segments sonores uniques selon le point que lesdits intervalles musicaux identifiés desdits segments in continuum sont ou non identiques;
un moyen pour déterminer une clé dudit signal acoustique selon ladite information de ton extraite;
un moyen pour déterminer une mesure et un tempo dudit signal acoustique selon lesdites informations de segment; et
un moyen pour compiler les données de partition musicale à partir desdites informations dudit intervalle musical, de ladite longueur de son, de ladite clé, de ladite mesure et dudit tempo déterminés;
un moyen (3) pour mémoriser le programme de traitement;
un moyen (1) pour contrôler ledit programme de traitement de signaux; et
un moyen (5) pour visualiser la musique transcrite.