EP1406244B1

EP1406244B1 - Détection d'activité vocale basée sur l'agrégation non-supervisée

Info

Publication number: EP1406244B1
Application number: EP20030102639
Authority: EP
Inventors: Stephan Dr. Grashey
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2002-09-27
Filing date: 2003-08-25
Publication date: 2006-10-11
Anticipated expiration: 2023-08-25
Also published as: DE50305333D1; ES2269917T3; DE10245107A1; EP1406244A3; EP1406244A2; DE10245107B4

Claims

Dispositif pour la détection de la présence ou de l'absence d'un signal vocal, comprenant
- des moyens pour classer un signal dans une classe parmi plus de deux classes,

- des moyens pour déterminer si le signal est un signal vocal ou non en fonction de la classe dans laquelle le signal est classé,
caractérisé en ce que les moyens suivants sont prévus :
- des moyens pour extraire des vecteurs de propriétés du signal vocal,

- des moyens pour classer les vecteurs de propriétés au cours d'un procédé d'apprentissage dans une classe de plus de deux classes formées automatiquement, à l'aide d'un procédé de clustérisation auto-organisateur,

- des moyens pour classer les classes du procédé d'apprentissage dans un procédé d'association comme "parole" ou "non-parole".
Dispositif selon la revendication 1, caractérisé en ce que le nombre des plus de deux classes est égal ou supérieur à 10, en particulier supérieur ou égal à 64.
Dispositif selon la revendication 1, caractérisé en ce que les classes formées automatiquement sont des classes formées par un réseau neuronal.
Dispositif selon l'une des revendications précédentes, caractérisé en ce que le dispositif pour le classement du signal dans une classe de plus de deux classes comporte un réseau neuronal.
Dispositif selon l'une des revendications 3 ou 4, caractérisé en ce que le réseau neuronal est un réseau de Kohonen.
Dispositif selon l'une des revendications précédentes, caractérisé en ce que le dispositif est un terminal mobile, en particulier un téléphone portable.
Procédé biométrique dans lequel un dispositif selon l'une des revendications 1 à 6 est utilisé.
Procédé pour la détection de la présence ou de l'absence d'un signal vocal, dans lequel
- un signal est classé dans une classe de plus de deux classes qui comprennent une organisation en clusters formée automatiquement,

- il est décidé, en fonction de la classe dans laquelle le signal est classé, si le signal est un signal vocal ou non,
caractérisé en ce que
- des vecteurs de propriétés sont extraits du signal vocal,

- les vecteurs de propriétés extraits sont classés, au cours d'un procédé d'apprentissage, dans une classe de plus de deux classes formées automatiquement, à l'aide d'un procédé de clustérisation auto-organisateur,

- des moyens pour classer les classes du procédé d'apprentissage dans un procédé d'association comme "parole" ou "non-parole".
Produit de programmation pour une installation de traitement de données contenant des sections de code à l'aide desquelles toutes les étapes d'un procédé selon l'une des revendications 7 à 8 sont exécutées lorsque le produit de programmation est actif sur une installation de traitement de données.