EP4097695B1

EP4097695B1 - Procédé et dispositif d'identification d'anomalies acoustiques

Info

Publication number: EP4097695B1
Application number: EP21702020.5A
Authority: EP
Inventors: Jakob Abesser
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2020-01-27
Filing date: 2021-01-27
Publication date: 2024-02-21
Anticipated expiration: 2041-01-27
Also published as: DE102020200946A1; WO2021151915A1; EP4097695A1; US20220358952A1

Claims

Procédé (100) d'identification d'anomalies acoustiques, aux étapes suivantes consistant à:
obtenir (113) un enregistrement de longue durée avec une pluralité de premiers segments audio (ABCD) associés à des premières fenêtres de temps respectives; où l'enregistrement de longue durée comporte au moins une durée de plus de 1 minute, ou d'au moins 10 minutes, ou d'au moins 1 heure, ou d'au moins 24 heures;

analyser (114) la pluralité des premiers segments audio (ABCD) pour obtenir, pour chacun de la pluralité des premiers segments audio (ABCD), un premier vecteur de caractéristiques décrivant le premier segment audio (ABCD) respectif;

obtenir (123) un autre enregistrement avec un ou plusieurs deuxièmes segments audio (ABCD) associés à des deuxièmes fenêtres de temps respectives;

analyser (124) les un ou plusieurs deuxièmes segments audio (ABCD) pour obtenir un ou plusieurs vecteurs de caractéristiques décrivant les un ou plusieurs deuxièmes segments audio (ABCD);

aligner (126) les un ou plusieurs deuxièmes vecteurs de caractéristiques sur la pluralité des premiers vecteurs de caractéristiques pour identifier au moins une anomalie en comparaison avec une situation acoustique normale pour cet environnement.
Procédé (100) selon la revendication 1, dans lequel l'anomalie comporte une anomalie phonétique, temporelle et/ou spatiale; et/ou
dans lequel l'anomalie comporte une anomalie phonétique en combinaison avec une anomalie temporelle, ou une anomalie phonétique en combinaison avec une anomalie spatiale, ou une anomalie temporelle en combinaison avec une anomalie spatiale.
Procédé (100) selon la revendication 1 ou 2, dans lequel le procédé (100) comporte, lors de l'analyse, la sous-étape consistant à identifier un modèle de répétition dans la pluralité de premières fenêtres de temps; ou
dans lequel le procédé (100) comporte, lors de l'analyse, la sous-étape consistant à identifier un modèle de répétition dans la pluralité des premières fenêtres de temps; dans lequel l'identification a lieu à l'aide de premiers vecteurs de caractéristiques qui se répètent, identiques ou similaires appartenant à différents premiers segments audio (ABCD).
Procédé (100) selon la revendication 3, dans lequel a lieu, lors de l'identification, un regroupement de premiers vecteurs de caractéristiques identiques ou similaires en un ou plusieurs groupes; et/ou
dans lequel le procédé (100) comporte le fait d'identifier une séquence de premiers vecteurs de caractéristiques appartenant à différents premiers segments audio (ABCD) ou d'identifier une séquence de groupes de premiers vecteurs de caractéristiques identiques ou similaires.
Procédé (100) selon l'une des revendications 3 à 4, dans lequel le procédé (100) comporte le fait d'identifier un modèle de répétition dans les une ou plusieurs deuxièmes fenêtres temporelles; et/ou
dans lequel le procédé (100) comporte le fait d'identifier une séquence de deuxièmes vecteurs de caractéristiques appartenant à différents deuxièmes segments audio (ABCD) ou d'identifier une séquence de groupes de deuxièmes vecteurs de caractéristiques identiques ou similaires.
Procédé (100) selon la revendication 5, dans lequel le procédé (100) comporte la sous-étape consistant à aligner le modèle de répétition des premiers segments audio (ABCD) et/ou l'ordre pour les premiers segments audio (ABCD) sur le modèle de répétition des deuxièmes segments audio (ABCD) et/ou l'ordre pour les deuxièmes segments audio (ABCD), pour identifier une anomalie temporelle.
Procédé (100) selon l'une des revendications précédentes, dans lequel l'alignement comporte la sous-étape consistant à identifier un deuxième vecteur de caractéristiques qui est différent des premiers vecteurs de caractéristiques analysés, pour identifier une anomalie phonétique.
Procédé (100) selon l'une des revendications précédentes, dans lequel le vecteur de caractéristiques présente une dimension, plusieurs dimensions ou un espace dimensionnel réduit; et/ou dans lequel le procédé (100) comporte l'étape consistant à réduire les dimensions du vecteur de caractéristiques.
Procédé (100) selon l'une des revendications précédentes, dans lequel le procédé (100) comporte l'étape consistant à déterminer une position respective pour les premiers segments audio (ABCD) respectifs; ou
dans lequel le procédé (100) comporte l'étape consistant à déterminer une position respective pour les premiers segments audio (ABCD) respectifs; dans lequel le procédé (100) comporte l'étape consistant à déterminer une position respective pour les deuxièmes segments audio (ABCD) respectifs, et dans lequel le procédé (100) comporte la sous-étape consistant à aligner la position associée au premier segment audio (ABCD) respectif sur la position associée au deuxième segment audio (ABCD) respectif, pour identifier une anomalie spatiale.
Procédé (100) selon l'une des revendications précédentes, dans lequel le procédé (100) présente l'étape consistant à déterminer une probabilité d'occurrence du premier segment audio (ABCD) respectif et à sortir la probabilité d'occurrence avec le premier vecteur de caractéristiques respectif ou dans lequel le procédé (100) comporte l'étape consistant à déterminer une probabilité d'occurrence du premier segment audio (ABCD) respectif et à sortir la probabilité d'occurrence avec le premier vecteur de caractéristiques respectif et une première fenêtre de temps.
Procédé selon l'une des revendications précédentes, dans lequel la pluralité des premiers segments audio et/ou la pluralité des premiers segments audio dans leur ordre décrivent un état acoustique normal dans le scénario d'application et/ou représentent une référence; et/ou
dans lequel l'une anomalie est identifiée lorsqu'un ou plusieurs deuxièmes vecteurs de caractéristiques diffèrent de la pluralité des premiers vecteurs de caractéristiques.
Procédé selon l'une des revendications précédentes, dans lequel l'autre enregistrement comporte une fenêtre de temps ou en particulier une fenêtre de temps de moins de 5 minutes, de moins de 1 minute ou de moins de 10 secondes.
Programme d'ordinateur avec un code de programme qui, lorsqu'il est exécuté sur un ordinateur, réalise une ou plusieurs étapes du procédé (100) selon les revendications précédentes.
Dispositif (10) d'identification d'anomalies acoustiques, aux caractéristiques suivantes:
une interface (12) destinée à obtenir un enregistrement de longue durée (113) avec une pluralité de premiers segments audio (ABCD) associés à des premières fenêtres de temps respectives ainsi que pour obtenir un autre enregistrement (123) avec un ou plusieurs deuxièmes segments audio (ABCD) associés à des deuxièmes fenêtres de temps respectives; où l'enregistrement de longue durée comporte au moins une durée de plus de 1 minute, ou d'au moins 10 minutes, ou d'au moins 1 heure, ou d'au moins 24 heures;

un processeur (14) qui est conçu pour analyser la pluralité des premiers segments audio (ABCD) pour obtenir, pour chacun de la pluralité de premiers segments audio (ABCD), un premier vecteur de caractéristiques décrivant le premier segment audio (ABCD) respectif, et qui est conçu, pour analyser les un ou plusieurs deuxièmes segments audio (ABCD), pour obtenir un ou plusieurs vecteurs de caractéristiques décrivant les un ou plusieurs deuxièmes segments audio (ABCD), et qui est conçu, pour aligner les un ou plusieurs deuxièmes vecteurs de caractéristiques sur la pluralité des premiers vecteurs caractéristiques, pour identifier au moins une anomalie en comparaison avec une situation acoustique normale pour cet environnement.
Dispositif (10) selon la revendication 14, dans lequel le dispositif (10) comporte un microphone (18) ou un réseau de microphones qui est connecté à l'interface (12); et/ou
dans lequel le dispositif (10) comporte une interface de sortie destinée à sortir une probabilité d'occurrence du premier segment audio (ABCD) respectif avec le premier vecteur de caractéristiques respectif ou à sortir une probabilité d'occurrence du premier segment audio (ABCD) respectif avec le premier vecteur de caractéristiques respectif et une première fenêtre temporelle.