EP0583217B1

EP0583217B1 - Optimisation d'un réseau neuronal utilisant rétropropagation

Info

Publication number: EP0583217B1
Application number: EP93650028A
Authority: EP
Inventors: John Mitchell
Original assignee: Hitachi Europe Ltd
Current assignee: Hitachi Europe Ltd
Priority date: 1992-08-11
Filing date: 1993-07-29
Publication date: 2000-05-10
Anticipated expiration: 2013-07-29
Also published as: EP0583217A3; DE69328596D1; DE69328596T2; JPH07302249A; EP0583217A2

Claims

Méthode d'apprentissage pour un réseau neuronal à réaction anticipative (6) ayant des unités cachées (8) comprenant les étapes consistant à transmettre des excitations d'entrée au réseau et à ajuster des pondérations de connexion en réponse au contrôle des signaux de sortie du réseau pour cette méthode d'apprentissage, les étapes incluant interpréter dynamiquement (2) la performance du réseau durant l'apprentissage par l'interprétation de la fonction de transfert d'une unité cachée individuelle (8) en utilisant les pondérations de connexion immédiate de cette unité cachée (8); générer continuellement un indicateur dynamique (20) de la performance de ce réseau; comparer l'indicateur dynamique (2) avec un indicateur dynamique désiré de performance; et interrompre la méthode d'apprentissage lorsque l'indicateur dynamique (20) tombe en dessous de l'indicateur dynamique désiré de performance; caractérisée en ce que, lorsque l'apprentissage est interrompu, la méthode comprend les étapes supplémentaires consistant à:

générer un indicateur statique de la performance de l'unité cachée (8) en réalisant une interprétation statique de la performance globale du réseau avec et sans l'unité cachée; et

altérer la structure interne du réseau en réponse à l'interprétation statique de la performance de l'unité cachée.
Méthode d'apprentissage telle que revendiquée dans la revendication 1, dans laquelle les fonctions de transfert continues et monotones ayant des dérivées asymptotiquement de zéro, sont interprétées.
Méthode d'apprentissage telle que revendiquée dans l'une quelconque des revendications précédentes, dans laquelle l'indicateur dynamique (20) est géométrique et est affiché.
Méthode d'apprentissage telle que revendiquée dans l'une quelconque des revendications précédentes, dans laquelle les interprétations dynamique et statique comprennent la mise en relation de l'opération d'une unité cachée avec les données d'entrée.
Méthode d'apprentissage telle que revendiquée dans l'une quelconque des revendications précédentes, dans laquelle les informations globales se rapportant à la performance du réseau sont interprétées durant l'interprétation statique (4).
Méthode d'apprentissage telle que revendiquée dans l'une quelconque des revendications précédentes, comprenant les étapes ultérieures consistant à:

mémoriser les caractéristiques de différentes méthodes d'apprentissage (29);

sélectionner une méthode d'apprentissage initiale (29) et exécuter l'apprentissage selon la méthode (29);

contrôler dynamiquement une caractéristique de la méthode d'apprentissage (29);

évaluer la caractéristique contrôlée selon une condition de contrôle; et

sélectionner une méthode d'apprentissage différente (29) pour des étapes d'apprentissage subséquentes selon la condition de contrôle.
Méthode d'apprentissage telle que revendiquée dans la revendication 6, dans laquelle une pluralité de conditions de contrôle sont utilisées pour évaluer des caractéristiques contrôlées, une condition de contrôle étant spécifique à une méthode d'apprentissage, et une autre condition de contrôle étant spécifique à toutes les méthodes.
Appareil pour une méthode d'apprentissage d'un réseau neuronal à réaction anticipative (6) ayant des unités cachées (8), l'appareil comprend un moyen (15) pour transmettre des excitations au réseau (6); un moyen (15) pour ajuster des pondérations de connexion en réponse au contrôle des signaux de sortie du réseau, un moyen (16) pour interpréter dynamiquement la performance du réseau (6) pendant l'apprentissage par interprétation de la fonction de transfert d'une unité cachée individuelle (8) en utilisant les pondérations de connexion immédiate de cette unité cachée (8); un moyen pour générer continuellement un indicateur dynamique (20) de la performance du réseau; un moyen pour comparer l'indicateur dynamique (20) avec un indicateur dynamique désiré de performance; et un moyen pour interrompre la méthode d'apprentissage lorsque l'indicateur dynamique (20) tombe en dessous de l'indicateur dynamique désiré de performance, caractérisé en ce que l'appareil comprend en outre:

un moyen de communication entre l'indicateur dynamique (20) et un interpréteur statique (17);

un moyen dans l'interpréteur statique (17) pour générer un indicateur statique de la performance de l'unité cachée (8) par la mise en oeuvre d'une interprétation statique de la performance globale du réseau, avec et sans l'unité cachée lorsque l'apprentissage est interrompu; et

un moyen pour altérer la structure de réseau en réponse à l'interprétation statique de la performance de l'unité cachée.
Appareil pour mettre en oeuvre une méthode d'apprentissage tel que revendiqué dans la revendication 8, incluant:

une pluralité de méthodes d'apprentissage (29); et

l'appareil comprend en outre un contrôleur d'apprentissage (30) comprenant:

un moyen pour mémoriser des caractéristiques des méthodes d'apprentissage;

un moyen pour amorcer l'apprentissage du réseau selon une méthode d'apprentissage sélectionnée;

un moyen pour contrôler dynamiquement une caractéristique d'apprentissage;

un moyen pour évaluer la caractéristique contrôlée selon une condition de contrôle; et

un moyen pour sélectionner une méthode d'apprentissage différente ou pour des étapes d'apprentissage subséquentes selon la condition de contrôle.