DE112016007312T5 - Netzwerk-bildungsvorrichtung und netzwerk-bildungsverfahren - Google Patents

Netzwerk-bildungsvorrichtung und netzwerk-bildungsverfahren Download PDF

Info

Publication number
DE112016007312T5
DE112016007312T5 DE112016007312.7T DE112016007312T DE112016007312T5 DE 112016007312 T5 DE112016007312 T5 DE 112016007312T5 DE 112016007312 T DE112016007312 T DE 112016007312T DE 112016007312 T5 DE112016007312 T5 DE 112016007312T5
Authority
DE
Germany
Prior art keywords
intermediate layer
elements
output
layer
contained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112016007312.7T
Other languages
English (en)
Inventor
Toshisada Mariyama
Kunihiko Fukushima
Wataru Matsumoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112016007312T5 publication Critical patent/DE112016007312T5/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0463Neocognitrons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2178Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
    • G06F18/2185Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor the supervisor being an automated module, e.g. intelligent oracle

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)
  • Materials For Photolithography (AREA)

Abstract

Eine Elementbildungseinheit (13) vergleicht Ausgabewerte eines oder mehrerer in einer Zwischenschicht (2) enthaltener Elemente, die durch eine Ausgabewert-Berechnungseinheit (12) berechnet wurden, mit einem Schwellenwert, und die Anzahl von in der Zwischenschicht (2) enthaltenen Elementen wird aufrecht erhalten, wenn irgendeiner der Ausgabewerte aus den Ausgabewerten des einen oder der mehreren Elemente, die in der Zwischenschicht (2) enthalten sind, größer als der Schwellenwert ist, und die Anzahl von in der Zwischenschicht (2) enthaltenen Elemente wird erhöht, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der Zwischenschicht (2) enthalten sind, gleich dem oder kleiner als der Schwellenwert sind.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf eine Netzwerk-Bildungsvorrichtung und ein Netzwerk-Bildungsverfahren zum Bilden eines Neuronennetzes.
  • STAND DER TECHNIK
  • Ein Neuronennetz ist ein Netzwerk, bei dem eine Eingangsschicht, eine Zwischenschicht und eine Ausgangsschicht kaskadenmäßig verbunden sind.
  • Das Neuronennetz ist eine Art von Annäherungsunktion zum Vorhersagen von Ausgangsdaten entsprechend beliebigen Eingangsdaten, wenn beliebige Eingangsdaten gegeben sind, indem eine Korrelation zwischen Eingangsdaten und Ausgangsdaten vorher gelernt werden.
  • Eine Struktur eines Neuronennetzes wie die Anzahl von in der Zwischenschicht enthaltenen Elementen wird häufig von einem Designer eines Neuronennetzes manuell bestimmt, aber es ist für einen Designer, der mit dem Neuronennetz nicht vertraut ist, schwierig, die Struktur des Neuronennetzes ordnungsgemäß zu bestimmen.
  • In dem folgenden Nichtpatentdokument 1 wird ein Netzwerk-Bildungsverfahren zum automatischen Bestimmen einer Struktur eines Neuronennetzes durch Verwendung einer Technik, die als „Add if Silent“ (AiS) bezeichnet wird, offenbart.
  • Dieses Neuronennetz ist ein Neuronennetz, das visuelle Informationsverarbeitung von Organismen, die als Neocognitron bezeichnet werden, imitiert, und ein in der Zwischenschicht dieses Neuronennetzes enthaltenes Element ist ein Element, dessen Eingabe/Ausgabe-Antwort durch eine normierte lineare Funktion bestimmt wird.
  • ZITIERUNGSLISTE
  • NICHTPATENTLITERATUR
  • Nichtpatentdokument 1: Fukushima, K.: „Artificial vision by multi-layered neural networks: Neocognitron and its advances", Neural Networks, Band 37, Seiten 103 -119 (2013).
  • KURZFASSUNG DER ERFINDUNG
  • TECHNISCHES PROBLEM
  • Da das herkömmliche Netzwerk-Bildungsverfahren wie vorstehend beschrieben konfiguriert ist, kann, wenn das in der Zwischenschicht enthaltene Element ein Element ist, dessen Eingabe/Ausgabe-Antwort durch eine normierte lineare Funktion bestimmt ist, die Anzahl von in der Zwischenschicht und dergleichen enthaltenen Elementen automatisch bestimmt werden. Jedoch ist ein Problem dahingehend aufgetreten, dass in einem Fall, in welchem das in der Zwischenschicht enthaltene Element ein Element ist, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird, selbst wenn die als AiS bezeichnete Technik verwendet wird, die Anzahl von in der Zwischenschicht und dergleichen enthaltenen Elementen nicht automatisch bestimmt werden kann.
  • Die vorliegende Erfindung wurde gemacht, um das vorgenannte Problem zu lösen, und es ist eine Aufgabe, eine Netzwerk-Bildungsvorrichtung und ein Netzwerk-Bildungsverfahren zu erhalten, die in der Lage sind, die Anzahl von in der Zwischenschicht enthaltenen Elementen selbst dann automatisch zu bestimmen, wenn das in der Zwischenschicht enthaltene Element ein Element ist, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird.
  • LÖSUNG DES PROBLEMS
  • Eine Netzwerk-Bildungsvorrichtung nach der vorliegenden Erfindung ist versehen mit: einer Ausgabewert-Berechnungseinheit zum Berechnen von Ausgabewerten eines oder mehrerer Elemente, die in einer Zwischenschicht eines Neuronennetzes enthalten sind, gemäß einem Ausgabewert eines Elements, das in einer Eingangsschicht des Neuronennetzes enthalten ist, wenn das Neuronennetz enthaltend die Zwischenschicht enthaltend ein Element, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird, und eine Elementbildungseinheit vergleicht die Ausgabewerte des einen oder der mehreren Elemente, die durch die Ausgabewert-Berechnungseinheit berechnet wurden, mit einem Schwellenwert, und hält eine Anzahl von Elementen, die in der Zwischenschicht enthalten sind, aufrecht, wenn ein Ausgabewert von irgendeinem der Elemente aus den Ausgabewerten des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, größer als der Schwellenwert ist, und führt eine Elementbildungsverarbeitung des Erhöhens der Anzahl von in der Zwischenschicht enthaltenen Elementen durch, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, gleich dem oder kleiner als der Schwellenwert sind.
  • VORTEILHAFTE WIRKUNGEN DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung vergleicht die Elementbildungseinheit die Ausgabewerte des einen oder der mehreren Elemente, die von der Ausgabewert-Berechnungseinheit berechnet wurden, mit einem Schwellenwert, und hält eine Anzahl von Elementen, die in der Zwischenschicht enthalten sind, aufrecht, wenn ein Ausgabewert von irgendeinem der Elemente aus den Ausgangswerten des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, größer als der Schwellenwert ist, und führt eine Elementbildungsverarbeitung des Erhöhens der Anzahl von Elementen, die in der Zwischenschicht enthalten sind, durch, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, gleich dem oder kleiner als der Schwellenwert sind, so dass die Wirkung erhalten wird, dass die Anzahl von in der Zwischenschicht enthaltenen Elementen automatisch bestimmt werden kann, selbst wenn das in der Zwischenschicht enthaltene Element ein Element ist, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird.
  • Figurenliste
    • 1 ist ein Konfigurationsdiagramm, das eine Netzwerk-Bildungsvorrichtung nach einem ersten Ausführungsbeispiel der vorliegenden Erfindung illustriert.
    • 2 ist ein Hardware-Konfigurationsdiagramm der Netzwerk-Bildungsvorrichtung nach dem ersten Ausführungsbeispiel der vorliegenden Erfindung.
    • 3 ist ein erläuterndes Diagramm, das ein Beispiel für ein Neuronennetz illustriert, bei dem die Netzwerk-Bildungsvorrichtung nach dem ersten Ausführungsbeispiel der vorliegenden Erfindung angewendet wird.
    • 4 ist ein Hardware-Konfigurationsdiagramm eines Computers in einem Fall, in welchem die Netzkwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird.
    • 5 ist ein Flussdiagramm, das ein Netzwerk-Bildungsverfahren illustriert, das einen Verarbeitungsvorgang in einem Fall, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird, ist.
    • 6 ist ein Flussdiagramm, das ein Netzwerk-Bildungsverfahren illustriert, das ein Verarbeitungsvorgang in dem Fall, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird, ist.
    • 7 ist ein erläuterndes Diagramm, das ein Beispiel für ein Neuronennetz illustriert, bei dem eine Netzwerk-Bildungsvorrichtung nach einem zweiten Ausführungsbeispiel der vorliegenden Erfindung angewendet wird.
    • 8 ist ein Flussdiagramm, das ein Netzwerk-Bildungsverfahren illustriert, das ein Verarbeitungsvorgang in einem Fall, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird, ist.
    • 9 ist ein Konfigurationsdiagramm, das eine Netzwerk-Bildungsvorrichtung nach einem dritten Ausführungsbeispiel der vorliegenden Erfindung illustriert.
    • 10 ist ein Hardware-Konfigurationsdiagramm der Netzwerk-Bildungsvorrichtung nach dem dritten Ausführungsbeispiel der vorliegenden Erfindung.
  • BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
  • Nachfolgend werden, um die vorliegende Erfindung im Einzelnen zu erläutern, Ausführungsbeispiele zum Durchführen der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • In einem Fall, in welchem die Eingabe/Ausgabe-Antwort eines in einer Zwischenschicht eines Neuronennetzes enthaltenen Elements eine normierte lineare Funktion ist, wenn beispielsweise positive Daten, die stark von einem angenommenen Bereich abweichen, in die Zwischenschicht eingegeben werden, wird angenommen, dass große positive Daten von der Zwischenschicht ausgegeben werden. Als ein Ergebnis wird angenommen, dass große positive Daten auch von einer Ausgangsschicht ausgegeben werden.
  • Somit werden, wenn beispielsweise Daten, die von dem angenommenen Bereich stark abweichen, in die Zwischenschicht eingegeben werden, große positive Daten von der Ausgangsschicht des Neuronennetzes ausgegeben, so dass eine Vorrichtung auf der Ausgangsseite des Neuronennetzes stark beeinträchtigt werden kann.
  • In einem Fall, in welchem die Eingabe/Ausgabe-Antwort des in der Zwischenschicht des Neuronennetzes enthaltenen Elements eine gaußsche Funktion ist, wenn beispielsweise positive oder negative Daten, die stark von dem angenommenen Bereich abweichen, in die Zwischenschicht eingegeben werden, werden Daten nahe null von der Zwischenschicht ausgegeben. Als eine Folge werden Daten nahe null auch von der Ausgangsschicht ausgegeben.
  • Somit werden, selbst wenn beispielsweise die Daten, die stark von dem angenommenen Bereich abweichen, in die Zwischenschicht eingegeben werden, die Daten nahe null von der Ausgangsschicht des Neuronennetzes ausgegeben, so dass die Vorrichtung auf der Ausgangsseite des Neuronennetzes einen großen Einfluss vermeiden kann.
  • Erstes Ausführungsbeispiel
  • 1 ist ein Konfigurationsdiagramm, das eine Netzwerk-Bildungsvorrichtung nach einem ersten Ausführungsbeispiel der vorliegenden Erfindung illustriert, und FIG. ist ein Hardware-Konfigurationsdiagramm der Netzwerk-Bildungsvorrichtung nach dem ersten Ausführungsbeispiel der vorliegenden Erfindung.
  • 3 ist ein erläuterndes Diagramm, das ein Beispiel für ein Neuronennetz illustriert, bei dem die Netzwerk-Bildungsvorrichtung nach dem ersten Ausführungsbeispiel der vorliegenden Erfindung angewendet wird.
  • In den 1 bis 3 enthält das Neuronennetz eine Eingangsschicht 1, eine Zwischenschicht 2 und eine Ausgangsschicht 3.
  • Bei dem ersten Ausführungsbeispiel wird als ein Beispiel, bei dem die Anzahl von Zwischenschichten 2 gleich eins ist, beschrieben, und ein Beispiel, bei dem die Anzahl von Zwischenschichten 2 zwei oder mehr ist, wird in einem zweiten Ausführungsbeispiel beschrieben.
  • Die Eingangsschicht 1 enthält I (I ist eine ganze Zahl gleich oder größer als 1) Elemente ai(i= 1, ..., I), und beispielsweise M (M ist eine ganze Zahl gleich oder größer als 1) Stücke von Lerndaten xm=(x1 m, x2 m, ..., x1 m) werden aufeinanderfolgend von einem Sensor oder dergleichen gegeben. Das hochgestellte m stellt m = 1, 2, ..., M dar.
  • Die Anzahl von Dimensionen der Lerndaten xm ist I, und x1 m(i = 1, ..., I), die in den Lerndaten xm enthalten sind, werden als Komponentendaten bezeichnet.
  • Wenn das i-te Komponentendatenstück xi m(i= 1, ..., I) der Lerndaten X1 m zu dem i-ten Element ai(i= 1, ..., I) gegeben ist, gibt die Eingangsschicht 1 y1 = x1 m als einen Ausgabewert des i-ten Elements ai für das j-te Element bj(j = 1, ..., J), das in der Zwischenschicht 2 enthalten ist, aus.
  • Die Zwischenschicht 2 enthält J (J ist eine ganze Zahl gleich oder größer als 1) Elemente bj(j = 1, ..., J), und das j-te Element bj ist ein Element, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird.
  • Jedoch wird bei dem ersten Ausführungsbeispiel zur Vereinfachung der Beschreibung angenommen, dass die Anzahl von Elementen, die in der Zwischenschicht 2 enthalten sind, vor der Bildung des Netzwerks durch die Netzwerk-Bildungsvorrichtung gleich null ist. Dies ist lediglich ein Beispiel, und die Zwischenschicht 2 kann sogar vor der Bildung des Netzwerks durch die Netzwerk-Bildungsvorrichtung ein oder mehrere Elemente enthalten.
  • Wenn der Ausgabewert yi (i = 1, .., I) der I Elemente ai, die in der Eingangsschicht 1 enthalten sind, zu dem j-ten Element bj gegeben wird, berechnet die Zwischenschicht 2 einen Ausgabewert zj (j = 1, ..., J) des j-ten Elements bj anhand des Ausgabewerts yi der I Elemente ai, und gibt den Ausgabewert zj des Elements bj zu der Ausgangsschicht 3 aus.
  • Die Ausgangsschicht 3 enthält ein Element c, und das Element c berechnet beispielsweise eine Summe von Produkten der Ausgangswerte zj (j = 1, ..., J) der J Elemente bj, die in der Zwischenschicht 2 enthalten sind, und einem Gewicht vj (j = 1, ..., J) zwischen der Zwischenschicht 2 und der Ausgangsschicht 3, und gibt die Summe aus.
  • 3 illustriert ein Beispiel, bei dem die Anzahl der Elemente c, die in der Ausgangsschicht 3 enthalten sind, gleich eins ist; jedoch können mehrere Elemente c enthalten sein.
  • Eine Anfangssetzeinheit 11 wird beispielsweise durch eine Anfangssetzschaltung 21 in 2 implementiert.
  • Die Anfangssetzeinheit 11 führt eine Verarbeitung des Initialisierens von Parametern der auf das Element bj bezogenen gaußschen Funktion für jedes in der Zwischenschicht 2 enthaltene Element durch.
  • Die Anfangssetzeinheit 11 initialisiert als die Parameter der gaußschen Funktion beispielsweise einen Standardabweichungswert σij einer gaußschen Verteilung, einen Mittenkoordinate µij der gaußschen Funktion und ein Gewicht Wi,j zwischen dem i-ten Element ai, das in der Eingangsschicht 1 enthalten ist, und dem j-ten Element bj, das in der Zwischenschicht 2 enthalten ist.
  • Der Standardabweichungswert σij der gaußschen Verteilung ist ein Standardabweichungswert von beispielsweise den Ausgabewerten yi (i = 1, ..., I) der I-Elemente ai für das j-te Element bj, das in der Zwischenschicht 2 enthalten ist.
  • Die Mittenkoordinate µi,j der gaußschen Funktion ist eine Komponente der Mitte des j-ten Elements bj, das in der Zwischenschicht 2 enthalten ist.
  • Eine Ausgabewert-Berechnungseinheit 12 wird beispielsweise durch eine Ausgabewert-Berechnungsschaltung 22 in 2 implementiert.
  • Als anfängliche Werte der Parameter der gaußschen Funktion sind der Standardabweichungswert σi,j der gaußschen Verteilung, die Mittenkoordinate µi,j der gaußschen Funktion und das Gewicht Wi,j von der Anfangssetzeinheit 11 zu der Ausgabewert-Berechnungseinheit 12 gegeben.
  • Die Ausgabewert-Berechnungseinheit 12 führt eine Bearbeitung des Berechnens des Ausgabewerts zj (j = 1, ..., J) des j-ten Elements bj durch Substituieren beispielsweise der Ausgabewerte yi (i = 1, ..., I) der I-Elemente ai, die in der Eingangsschicht 1 enthalten sind, in die gaußsche Funktion mit den Anfangswerten der Parameter, die von der Anfangssetzeinheit 11 gegeben sind.
  • Eine Elementbildungseinheit 13 wird beispielsweise durch eine Elementbildungsschaltung 23 in 2 implementiert.
  • Die Elementbildungseinheit 13 vergleicht die Ausgabewerte zj (J = 1, ..., J) der J Elemente bj, die von der Ausgabewert-Berechnungseinheit 12 berechnet wurden, mit einem vorher gesetzten Schwellenwert Th, und hält die Anzahl von Elementen bj, die in der Zwischenschicht 2 enthalten sind, aufrecht, wenn der Ausgabewert zj jedes der Elemente bj der Ausgabewerte zj der in der Zwischenschicht 2 enthaltenen J Elemente bj größer als der Schwellenwert Th ist.
  • Zusätzlich führt, wenn alle Ausgabewerten zj der J Elemente bj gleich dem oder kleiner als der Schwellenwert Th sind, die Elementbildungseinheit 13 eine Elementbildungsverarbeitung des Erhöhens der Anzahl von Elementen bj, die in der Zwischenschicht 2 enthalten sind, durch.
  • Eine Datenspeichereinheit 14 wird beispielsweise durch eine Datenspeicherschaltung 24 in 2 implementiert.
  • Die Datenspeichereinheit 14 speichert die Parameter der gaußschen Funktion, die auf das Element bj sind und durch die Anfangssetzeinheit 11 initialisiert wurden, und den Ausgabewert zj des Elements bj, der durch die Ausgabewert-Berechnungseinheit 12 berechnet wurde, zusätzlich zu der Anzahl J der in der Zwischenschicht 2 enthaltenen Elemente bj.
  • Eine Parameteraktualisierungseinheit 15 wird beispielsweise durch eine Parameteraktualisierungsschaltung 25 in 2 implementiert.
  • Die Parameteraktualisierungseinheit 15 aktualisiert das Gewicht vj zwischen dem in der Zwischenschicht 2 enthaltenen j-ten Element bj und dem in der Ausgangsschicht 3 enthaltenen Element c, und die in der Datenspeichereinheit 14 gespeicherten Parameter der gaußschen Funktion, indem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion durchgeführt wird, wenn die Lerndaten zu der Eingabeschicht 1 gegeben werden, nachdem die Elementbildungsverarbeitung durch die Elementbildungseinheit 13 durchgeführt wurde.
  • Zusätzlich führt die Parameteraktualisierungseinheit 15 eine Verarbeitung des Aktualisierens des Gewichts Wi,j zwischen dem in der Eingangsschicht 1 enthaltenen i-ten Element ai und dem in der Zwischenschicht 2 enthaltenen j-ten Element bj durch, indem das überwachte Lernen durchgeführt wird.
  • In 1 wird eine Netzwerk-Bildungsvorrichtung angenommen, bei der die Anfangssetzeinheit 11, die Ausgabewert-Berechnungseinheit 12, die Elementbildungseinheit 13, die Datenspeichereinheit 14 und die Parameteraktualisierungseinheit 5, die Komponenten der Netzwerk-Bildungsvorrichtung sind, jeweils durch dedizierte Hardwareschaltungen implementiert sind, die die Anfangssetzschaltung 21, die Ausgabewert-Berechnungsschaltung 22, die Elementbildungsschaltung 23, die Datenspeicherschaltung 24 und die Parameteraktualisierungsschaltung 25 sind, wie in 2 illustriert ist.
  • Hier enthalten Beispiele für die Datenspeichereinheit 24 einen nichtflüchtigen oder flüchtigen Halbleiterspeicher wie einen Speicher mit wahlfreiem Zugriff (RAM), einen Festwertspeicher (ROM), einen Flashspeicher, einen löschbaren programmierbaren Festwertspeicher (EPROM) und einen elektrisch löschbaren programmierbaren Festwertspeicher (EEPROM); eine magnetische Disk, eine flexible Disk, eine optische Disk, eine Kompaktdisk, eine Minidisk, eine Digital Versatile Disc (DVD), und dergleichen.
  • Zusätzlich enthalten Beispiele für die Anfangssetzschaltung 21, die Ausgabewert-Berechnungsschaltung 22, die Elementbildungsschaltung 23 und die Parameteraktualisierungsschaltung 25 eine Einzelschaltung, eine zusammengesetzte Schaltung, einen programmierten Prozessor, einen parallel programmierten Prozessor, eine anwendungsspezifische integrierte Schaltung (ASIC), ein feldprogrammierbares Gate Array (FPGA) oder eine Kombination von diesen.
  • Jedoch sind die Komponenten der Netzwerk-Bildungsvorrichtung nicht auf die durch dedizierte Hardware implementierten beschränkt, und die Netzwerk-Bildungsschaltung kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert sein.
  • Software und Firmware werden als Programme in einem Speicher eines Computers gespeichert. Der Computer bedeutet Hardware zum Ausführen eines Programms, und seine Beispiele enthalten eine zentrale Verarbeitungseinheit (CPU), eine zentrale Verarbeitungsvorrichtung, eine Verarbeitungsvorrichtung, eine arithmetische Vorrichtung, einen Mikroprozessor, einen Mikrocomputer, einen Prozessor, einen digitalen Signalprozessor (DSP) und dergleichen.
  • 4 ist ein Hardware-Konfigurationsdiagramm eines Computers in einem Fall, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird.
  • In dem Fall, in welchem die Netzwerk-Bildungsvorrichtungen durch Software, Firmware oder dergleichen implementiert wird, ist es ausreichend, dass die Datenspeichereinheit 14 in einem Speicher 31 des Computers konfiguriert ist, und ein Programm zum bewirken, dass der Computer Verarbeitungsvorgänge der Anfangssetzeinheit 11, der Ausgabewert-Berechnungseinheit 12, der Elementbildungseinheit 13 und der Parameteraktualisierungseinheit 15 ausführt, ist in dem Speicher 31 gespeichert, und ein Prozessor 32 des Computers führt das in dem Speicher 31 gespeicherte Programm aus.
  • Die 5 und 6 sind Flussdiagramme, die jeweils ein Netzwerk-Bildungsverfahren illustrieren, das ein Verarbeitungsvorgang in dem Fall ist, in welchem die Netzwerk-Bildungsvorrichtungen durch Software, Firmware oder dergleichen implementiert wird.
  • Zusätzlich illustriert 2 ein Beispiel, in welchem jede der Komponenten der Netzwerk-Bildungsvorrichtung durch dedizierte Hardware implementiert ist, und 4 illustriert ein Beispiel, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert ist; jedoch können einige Komponenten der Bildungsvorrichtung durch dedizierte Hardware implementiert sein und die verbleibenden Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als nächstes wird die Arbeitsweise beschrieben.
  • Verarbeitungsinhalte der Netzwerk-Bildungsvorrichtung nach dem ersten Ausführungsbeispiel werden grob in zwei Verarbeitungsinhalte geteilt.
  • Ein erster Verarbeitungsinhalt ist ein Verarbeitungsinhalt zum Bestimmen einer Struktur der Zwischenschicht 2, das heißt, ein Verarbeitungsinhalt zum Bestimmen der Anzahl J der in der Zwischenschicht 2 enthaltenen Elemente bj und zum Initialisieren der Parameter der auf das Element bj bezogenen gaußschen Funktion (Schritt ST1 in 5).
  • Ein zweiter Verarbeitungsinhalt ist ein Verarbeitungsinhalt zum Aktualisieren der initialisierten Parameter der gaußschen Funktion und des Gewichts Wi,j zwischen dem i-ten Element ai, das in der Eingangsschicht 1 enthalten ist, und dem j-ten Element bj, das in der Zwischenschicht 2 enthalten ist, indem das überwachte Lernen durchgeführt wird (Schritt ST2 in 5).
  • Nachfolgend wird der erste Verarbeitungsinhalt mit Bezug auf 6 spezifisch beschrieben.
  • Bei dem ersten Ausführungsbeispiel wird angenommen, dass ein anfänglicher Wert der Anzahl J der in der Zwischenschicht 2 enthaltenen Elemente bj gleich Null ist.
  • Bei der Durchführung des ersten Verarbeitungsinhalts bestimmt die Elementbildungseinheit 13, ob das Element bj in der Zwischenschicht 2 enthalten ist oder nicht.
  • Das heißt, die Elementbildungseinheit 13 bestimmt, ob die Anzahl J der in der Zwischenschicht 2 enthaltenen bj gleich Null ist oder nicht (Schritt ST11 in 6).
  • Wenn bestimmt wird, dass die Anzahl J der in der Zwischenschicht enthaltenen Elemente bj gleich Null ist (Schritt ST11 in 6: JA), fügt die Elementbildungseinheit 13 ein Element bj in der Zwischenschicht 2 neu hinzu. Das heißt, die Elementbildungseinheit 13 schafft ein Element b1 in der Zwischenschicht 2 (Schritt ST12 in 6).
  • Wenn bestimmt wird, dass die Anzahl J der in der Zwischenschicht 2 enthalten Elemente bj nicht gleich Null ist (ST11 in 6: NEIN), führt in dieser Stufe die Elementbildungseinheit 13 keine Verarbeitung des Hinzufügens des neuen Elements bj zu der Zwischenschicht 2 hin durch. Bei dem ersten Ausführungsbeispiel schafft, da der Anfangswert der Anzahl J der in der Zwischenschicht 2 enthaltenen Elemente bj auf Null gesetzt ist, die Elementbildungseinheit 13 hier das Element b1 in der Zwischenschicht 2.
  • Wenn die Elementbildungseinheit 13 das Element b1 in der Zwischenschicht 2 schafft, bestimmt die Anfangssetzeinheit 11, ob alle der M Stücke von Lerndaten xm = (x1 m, x2 m, ..., xI m) bereits erworben wurden oder nicht (Schritt ST13 in 6).
  • Wenn die M Stücke von Lerndaten xm bereits erworben wurden (Schritt ST13 in 6: JA), beendet die Anfangssetzeinheit 11 den ersten Verarbeitungsinhalt zum Bestimmen der Struktur der Zwischenschicht 2.
  • Wenn die M Stücke von Lerndaten xm noch nicht erworben wurden (Schritt ST13 in 6: NEIN), erwirbt die Anfangssetzeinheit 11 die Lerndaten xm, die noch nicht erworben wurden (Schritt ST14 in 6).
  • Bei dem ersten Ausführungsbeispiel erwirbt, da die M Stücke von Lerndaten xm in dieser Stufe noch nicht erworben wurden, die Anfangssetzeinheit M erste Lerndaten x1 = (x1 1, x2 1, ..., xI 1) als die Lerndaten xm, die noch nicht erworben wurden.
  • Wenn die ersten Lerndaten x1 = (x1 1, x2 1, ..., xI 1) erworben sind, initialisiert die Anfangssetzeinheit 11 Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen sind, von einem Ausgabewert yi = xi 1 des i-ten Elements ai, das in der Eingangsschicht 1 enthalten ist (ST15 in 6).
  • Das heißt, die Anfangssetzeinheit 11 initialisiert einen Standardabweichungswert σi,1 (i = 1, ..., I) der gaußschen Verteilung als einen der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist.
  • Der Standardabweichungswert σi,1 der gaußschen Verteilung ist ein Standardabweichungswert der Ausgabewerte yi = xi 1 der I Elemente ai für das in der Zwischenschicht 2 Element b1, und wird anhand der Ausgabewerte yi = xi 1 der I Elemente ai, die in der Eingangsschicht 1 enthalten sind, berechnet. Da die Verarbeitung des Berechnens des Standardabweichungswerts ai,1 selbst eine bekannt Technik ist, wird eine detaillierte Beschreibung hiervon weggelassen.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 eine Mittenkoordinate µi,1 (i = 1, ..., I) der gaußschen Funktion als einen der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist.
  • Die Mittenkoordinate µi,1 der gaußschen Funktion ist der Ausgabewert yi = xi 1 des in der Eingabeschicht 1 enthaltenen i-ten Elements ai, wie in dem folgenden Ausdruck (1) angezeigt ist. μ i ,1 = x i 1
    Figure DE112016007312T5_0001
  • Weiterhin initialisiert die Anfangssetzeinheit ein Gewicht wi,1(i = 1, ..., I) zwischen dem in der Eingangsschicht 1 enthaltenen i-ten Element ai und dem in der Zwischenschicht 2 enthaltenen Element b1 als einen der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist, wie in dem folgenden Ausdruck (2) angezeigt ist. W i ,1 = 1
    Figure DE112016007312T5_0002
  • Hier wird ein Beispiel beschrieben, in welchem das Gewicht Wi,1 auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist, initialisiert sind, gibt die Anfangssetzeinheit 11 die Anfangswerte der Parameter zu der Ausgabewert-Berechnungseinheit 12 aus und speichert die Anfangswerte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die ersten Lerndaten x1 = (x1 1, x2 1, ..., xI 1).
  • Wenn die ersten Lerndaten x1 erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 einen Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 (Schritt ST16 in 6).
  • Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Elemente b1 bezogen ist, und des Ausgabewerts yi = xi 1 der in der Eingangsschicht 1 enthaltenen I Elemente ai zu der in dem folgenden Ausdruck (3) anzeigten gaußschen Funktion. z 1 = e x p ( i = 1 I ( W i ,1 y i μ i ,1 ) 2 σ i ,1 2 )
    Figure DE112016007312T5_0003
  • Wenn der Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 berechnet ist, gibt die Ausgabewert-Berechnungseinheit 12 den Ausgabewert z1 des Elements b1 zu der Elementbildungseinheit 13 aus und speichert den Ausgabewert z1 des Elements b1 in der Datenspeichereinheit 14.
  • Wenn der Ausgabewert z1 des Elements b1 von der Ausgabewert-Berechnungseinheit 12 empfangen ist, vergleich die Elementbildungseinheit 13 den Ausgabewert z1 des Elements b1 mit dem vorher gesetzten Schwellenwert Th (Schritt ST17 in 6).
  • Da der Ausgabewert z1 des Elements b1 maximal 1 ist, ist, als der Schwellenwert Th, eine positive reelle Zahl gleich oder kleiner als 1 oder eine positive reelle Zahl gleich oder größer als e-0,25 und gleich oder kleiner als 1 denkbar.
  • Wenn der Ausgabewert z1 des Elements b1, das in der Zwischenschicht 2 enthalten ist, größer als der Schwellenwert Th (Schritt ST17 in 6: NEIN), hält die Elementbildungseinheit 13 die Anzahl J (J = 1) der in der Zwischenschicht 2 enthaltenen Elemente. Wenn der Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 größer als der Schwellenwert Th ist, kann gesagt werden, dass das in der Zwischenschicht 2 enthaltene Element b1 ein Element entsprechend einem Ausgabewert y1 eines in der Eingangsschicht 1 enthaltenen Elements a1 ist. Das heißt, es kann gesagt werden, dass das in der Zwischenschicht 2 enthaltene Element b1 ein Element ist, das die Mittenkoordinate der gaußschen Verteilung in der gaußschen Funktion darstellt. Aus diesem Grund besteht keine Notwendigkeit, ein neues Element b2 zu der Zwischenschicht 2 hinzuzufügen, so dass die Elementbildungseinheit 13 die die Anzahl J (J = 1) der in der Zwischenschicht 2 enthaltenen Element aufrecht erhält.
  • Wenn der Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 gleich dem oder kleiner als der Schwellenwert Th ist (Schritt ST17 in 6: JA), fügt die Elementbildungseinheit 13 das neue Element b2 zu der Zwischenschicht 2 hinzu, so dass die Anzahl der in der Zwischenschicht 2 enthaltenen Elemente erhöht wird (ST18 in 6). Wenn der Ausgabewert z1 des Elements b1, das in der Zwischenschicht 2 enthalten ist, gleich dem oder kleiner als der Schwellenwert Th ist, kann nicht gesagt werden, dass das Element b1, das in der Zwischenschicht 2 enthalten ist, das dem Ausgabewert y1 des in der Eingangsschicht 1 enthaltenen Elements a1 entsprechende Element ist. Aus diesem Grundfügt die Elementbildungseinheit 13 der Zwischenschicht 2 das neue Element b2 hinzu.
  • Bei dem ersten Ausführungsbeispiel ist zur Vereinfachung der Beschreibung der Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 gleich dem oder kleiner als der Schwellenwert Th, so dass das neue Element b2 zu der Zwischenschicht 2 hinzugefügt wird.
  • Wenn die Elementbildungseinheit 13 das neue Element b2 zu der Zwischenschicht 2 hinzufügt, oder die Anzahl J der in der Zwischenschicht 2 enthaltenen Elemente aufrechterhält, bestimmt die Anfangssetzeinheit 11, ob sämtliche der M Stücke von Lerndaten xm = (x1 m, x2 m, ..., xI m) bereits erworben wurden oder nicht (Schritt ST13 in 6).
  • Wenn die M Stücke von Lerndaten xm bereits erworben wurden (Schritt ST13 in 6: JA), beendet die Anfangssetzeinheit 11 den ersten Verarbeitungsinhalt zum Bestimmen der Struktur der Zwischenschicht 2.
  • Wenn die M Stücke von Lerndaten xm noch nicht erworben wurden (Schritt ST13 in 6: NEIN), erwirbt die Anfangssetzeinheit 11 die Lerndaten xm, die noch nicht erworben wurden (ST14 von 6).
  • Bei dem ersten Ausführungsbeispiel erwirbt, da die M Stücke von Lerndaten xm in dieser Stufe noch nicht erworben wurden, die Anfangssetzeinheit 11 zweite Lerndaten x2 = (x1 2, x2 2, ..., xI 2) als die Lerndaten xm, die noch nicht erworben wurden.
  • Wenn die zweiten Lerndaten x2= (x1 2, x2 2, ..., xI 2) erworben sind, initialisiert die Anfangssetzeinheit 11 die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist, anhand des Ausgabewerts yi = xi 2 des in der Eingangsschicht 1 enthaltenen i-ten Elements ai (Schritt ST15 in 6).
  • Das heißt, die Anfangssetzeinheit 11 berechnet den Standardabweichungswert σi,j (i = 1, ..., I: j = 1, 2) der gaußschen Verteilung anhand der Ausgabewerte yi = xi 2 der in der Eingangsschicht 1 enthaltenen I Elemente ai als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 den Ausgabewert yj = xi 2 des in der Eingangsschicht 1 enthaltenen i-ten Elements ai zu der Mittenkoordinate µi,j (i = 1, ..., I: j= 1, 2) der gaußschen Funktion als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist, wie in dem folgenden Ausdruck (4) angezeigt ist. μ i , j = x i 2
    Figure DE112016007312T5_0004
  • Weiterhin initialisiert die Anfangssetzeinheit 11 das Gewicht Wi,j zwischen dem in der Eingangsschicht 1 enthaltenen i-ten Element ai (i = 1, ..., I) und dem in der Zwischenschicht 2 enthaltenen j-ten Element bj (j= 1, 2) als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist, wie in der folgenden Gleichung (5) angezeigt. W i , j = 1
    Figure DE112016007312T5_0005
  • Hier wird ein Beispiel beschrieben, in welchem das Gewicht Wi,j auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist, initialisiert sind, gibt die Anfangssetzeinheit 11 die Anfangswerte der Parameter zu der Ausgabewert-Berechnungseinheit 12 aus und speichert die Anfangswerte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die Anfangswerte der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die zweiten Lerndaten x2 = (x12, x22,..., xi2).
  • Wenn die zweiten Lerndaten x2 erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 den Ausgabewert z1 des in der Zwischenschicht 2 enthaltenen Elements b1 (Schritt ST16 in 6).
  • Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert z1 des in der in der Zwischenschicht 2 enthaltenen Elements b1 durch Substituieren der anfänglichen Werte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist, und die Ausgabewerte yi = xi 2 der I Elemente ai, die in der Eingangsschicht 1 enthalten sind, zu der in dem folgenden Ausdruck (6) angezeigten gaußschen Funktion.
  • Die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element b1 bezogen ist, sind der Standardabweichungswert σi,1 (i = 1, ..., I) der gaußschen Verteilung, die Mittenkoordinate µi,1 (i = 1,..., I) und das Gewicht Wi,1 (i = 1, ..., I).
  • Zusätzlich berechnet die Ausgabewert-Berechnungseinheit 12 einen Ausgabewert z2 des in der Zwischenschicht 2 enthaltenen Elements b2 durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht enthaltene Element b2 bezogen ist, und die Ausgabewerte yi = xi 2 der in der Eingangsschicht 1 enthaltenen I Elemente ai zu der gaußschen Funktion, die in dem folgenden Ausdruck (6) angezeigt ist.
  • Die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene b2 bezogen ist, sind ein Standardabweichungswert σi,2 (i = 1, ..., I) der gaußschen Verteilung, eine Mittenkoordinate µi,2 (i = 1, ..., I) der gaußschen Funktion und ein Gewicht Wi,2 (i = 1, ..., I). z j = e x p ( i = 1 I ( W i , j y i μ i , j ) 2 σ i , j 2 )
    Figure DE112016007312T5_0006
  • Hier sind in dem Ausdruck (6) I = 1, ..., I, und j = 1, 2.
  • Wenn der Ausgabewert z1 des Elements b1 und der Ausgabewert z2 des Elements b2, die in der Zwischenschicht 2 enthalten sind, berechnet werden, gibt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 und z2 der Elemente b1 und b2 zu der Elementbildungseinheit 13 aus und speichert die Ausgabewerte z1 und z2 der Elemente b1 und b2 in der Datenspeichereinheit 14.
  • Wenn die Ausgabewerte z1 und z2 der Elemente b1 und b2 von der Ausgabewert-Berechnungseinheit 12 empfangen sind, vergleicht die Elementbildungseinheit 13 die Ausgabewerte z1 und z2 der Elemente b1 und b2 mit dem Schwellenwert Th (Schritt ST17 in 6).
  • Wenn irgendeiner der Ausgabewerte z1 und z2 der Elemente b1 und b2 die in der Zwischenschicht 2 enthalten sind, größer als der Schwellenwert Th ist (Schritt ST17 in 6: NEIN), hält die Elementbildungseinheit 13 die Anzahl J (J = 2) der in der Zwischenschicht 2 enthaltene Elemente aufrecht. Wenn jeder der Ausgabewerte z1 und z2 der Elemente b1 und b2, die in der Zwischenschicht 2 enthalten sind, größer als der Schwellenwert Th ist, kann gesagt werden, dass ein Element, dessen Ausgabewert größer als der Schwellenwert Th ist, ein Element entsprechend dem Ausgabewert eines in der Eingangsschicht 1 enthalten Elements ist. Aus diesem Grund besteht keine Notwendigkeit, ein neues Element b3 zu der Zwischenschicht 2 hinzuzufügen, so dass die Elementbildungseinheit 13 die Anzahl J (J = 2) der in der Zwischenschicht 2 enthaltenen Elemente aufrechterhält.
  • Wenn alle Ausgabewerte z1 und z2 der in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 gleich dem oder kleiner als der Schwellenwert Th sind (Schritt ST17 in 6: JA), fügt die Elementbildungseinheit 13 der Zwischenschicht 2 das neue Element b3 hinzu, so dass die Anzahl der in der Zwischenschicht 2 enthaltenen Elemente erhöht wird (Schritt ST18 in 6). Wenn alle Ausgabewerte z1 und z2 der in der Zwischenschicht 2 enthaltenen Elemente b1 und b2 gleich dem oder kleiner als der Schwellenwert Th sind, kann nicht gesagt werden, dass jedes in der Zwischenschicht 2 enthaltene Element ein Element entsprechend dem Ausgabewert eines in der Eingangsschicht 1 enthaltenen Elements ist. Aus diesem Grund fügt die Elementbildungseinheit 13 der Zwischenschicht 2 das neue Element b3 das neue Element hinzu.
  • Bei dem ersten Ausführungsbeispiel sind zur Vereinfachung der Beschreibung alle Ausgabewerte z1 und z2 der Elemente b1 und b2, die in der Zwischenschicht 2 enthalten sind, gleich dem oder kleiner als der Schwellenwert Th, so dass das neue Element b2 der Zwischenschicht 2 hinzugefügt wird.
  • Nachfolgend wird die Beschreibung unter der Annahme gegeben, dass die Anzahl von Elementen, die gegenwärtig in der Zwischenschicht 2 enthalten sind, gleich groß J (J ≥ 3) ist.
  • Wenn die Elementbildungseinheit 13 der Zwischenschicht 2 ein neues Element hinzufügt oder die Anzahl J der in der Zwischenschicht 2 enthaltenen Element aufrechterhält, bestimmt die Anfangssetzeinheit 11, ob sämtliche der M Stück von Lerndaten xm (x1 m, x2 m, ..., xI m) bereits erworben wurden oder nicht (Schritt ST13 in 6).
  • Wenn die M Stücke von Lerndaten xm bereits erworben wurden (Schritt ST13 in 6: JA), beendet die Anfangssetzeinheit 11 den ersten Verarbeitungsinhalt zum Bestimmen der Struktur der Zwischenschicht 2.
  • Wenn die M Stücke von Lerndaten xm noch nicht erworben wurden (Schritt ST13 von 6: NEIN), erwirbt die Anfangssetzeinheit 11 die Lerndaten xm, die noch nicht erworben wurden (Schritt ST14 von 6).
  • Wenn beispielsweise die m-ten Lerndaten xm der M Stücke von Lerndaten xm noch nicht erworben wurden, erwirbt die Anfangssetzeinheit 11 die m-ten Lerndaten xm.
  • Wenn die m-ten Lerndaten xm erworben sind, initialisiert die Anfangssetzeinheit 11 die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist, anhand des Ausgabewerts yi = xi m des in der Eingangsschicht 1 enthaltenen i-ten Elements ai (Schritt ST15 in 6).
  • Das heißt, die Anfangssetzeinheit 11 berechnet den Standardabweichungswert σi,j (i = 1, ..., I: j = 1, ..., J) der gaußschen Verteilung anhand der Ausgabewerte yi = xi m der in der Eingangsschicht 1 enthaltenen I Elemente ai als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 den Ausgabewert yi = xi m des in der Eingangsschicht 1 enthaltenen i-ten Elements ai zu der Mittenkoordinate µi,j der gaußschen Funktion als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist, wie in dem Ausdruck (4) angezeigt ist.
  • Weiterhin initialisiert die Anfangssetzeinheit 11 das Gewicht Wi,j zwischen dem i-ten Element ai (i = 1, ..., J), das in der Eingangsschicht 1 enthalten ist, und dem j-ten Element bj (j = 1, ..., J), das in der Zwischenschicht 2 enthalten ist, als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist, wie in dem Ausdruck (5) angezeigt ist.
  • Hier wird ein Beispiel beschrieben, in welchem das Gewicht Wi,j auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist, initialisiert sind, gibt die Anfangssetzeinheit 11 die Anfangswerte der Parameter zu der Ausgabewert-Berechnungseinheit 12 aus und speichert die Anfangswerte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die Anfangswerte der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die m-ten Lerndaten Xm = (x1 m, x2 m ..., xI m).
  • Wenn die m-ten Lerndaten xm = (x1 m, x2 m, ..., xI m) erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 bis zJ der in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ (Schritt ST16 in 6). Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert zj (j = 1, ..., J) des in der Zwischenschicht 2 enthaltenen Elements bj durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element bj (j = 1, ..., J) bezogen ist, und der Ausgabewerte yi = xi m der in der Eingangsschicht 1 enthaltenen I Elemente ai zu der in dem Ausdruck (6) angezeigten gaußschen Funktion.
  • Die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2 enthaltene Element bj bezogen ist, sind der Standardabweichungswert σi,j (i = 1, ..., I: j = 1, ..., J) der gaußschen Verteilung, die Mittenkoordinate µi,j (i = 1, ..., I: j = 1, ..., J) der gaußschen Funktion und das Gewicht Wi,j (i = 1, ..., I:j = 1, ..., J).
  • Wenn die Ausgabewerte z1 bis zJ der in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ berechnet werden, gibt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 bis zJ der Elemente b1 bis bJ zu der Elementbildungseinheit 13 aus und speichert die Ausgabewerte z1 bis zJ der Elemente b1 bis bJ in der Datenspeichereinheit 14.
  • Wenn die Ausgabewerte z1 bis zJ der Elemente b1 bis bJ von der Ausgabewert-Berechnungseinheit 12 empfangen sind, vergleich die Elementbildungseinheit 13 die Ausgabewerte z1 bis zJ der Elemente b1 bis bJ mit dem Schwellenwert Th (Schritt ST17 in 6).
  • Wenn irgendeiner der Ausgabewerte z1 bis zJ der in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ größer als der Schwellenwert Th ist (Schritt ST17 in 6: NEIN), hält die Elementbildungseinheit 13 die Anzahl j der in der Zwischenschicht 2 enthaltenen Elemente aufrecht.
  • Wenn alle Ausgabewerte z1 bis zJ der in der Zwischenschicht 2 enthaltenen Elemente b1 bis bJ gleich dem oder kleiner als der Schwellenwert Th sind (Schritt ST17 in 6: JA), fügt die Elementbildungseinheit 13 ein neues Element zu der Zwischenschicht 2 hinzu, so dass die Anzahl von in der Zwischenschicht 2 enthaltenen Elementen erhöht wird (Schritt ST18 in 6).
  • Die Verarbeitung der Schritt ST13 bis ST18 wird wiederholt durchgeführt, bis sämtliche der M Stücke von Lerndaten xm erworben sind, und wenn in der Bestimmungsverarbeitung des Schritts ST13 „JA“ bestimmt wird, wird der erste Verarbeitungsinhalt beendet.
  • Nachdem der erste Verarbeitungsinhalt beendet ist, führt die Parameteraktualisierungseinheit 15 den zweiten Verarbeitungsinhalt durch.
  • Das heißt, die Parameteraktualisierungseinheit 15 aktualisiert die Parameter der gaußschen Funktion, die in der Datenspeichereinheit 14 gespeichert sind, und das Gewicht vj zwischen dem in der Zwischenschicht 2 enthaltenen j-ten Element bj und dem in der Ausgangsschicht 3 enthaltenen Element c, indem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion, die in der Speichereinheit 14 gespeichert sind, durchgeführt wird, das heißt, die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen J Elemente bj (j = 1, ..., J) bezogen ist, jedes Mal, wenn die M Stücke von Lerndaten xm = (x1 m, x2 m, ..., xI m) aufeinander folgend gegeben werden, nachdem der erste Verarbeitungsinhalt beendet ist.
  • Zusätzlich aktualisiert die Parameteraktualisierungseinheit 15 das Gewicht Wi,j zwischen dem in der Eingangsschicht 1 enthaltenen i-ten Element ai und dem in der Zwischenschicht 2 enthaltenen j-ten Element bj, indem das überwachte Lernen durchgeführt wird.
  • Da überwachtes Lernen selbst eine bekannte Technik ist, wird eine detaillierte Beschreibung weggelassen, aber beispielsweise kann überwachtes Lernen durch Verwendung eines bekannten Rückfortpflanzungsverfahrens durchgeführt werden.
  • Es ist zu beachten, dass die Parameteraktualisierungseinheit 15 alle Parameter in der gaußschen Funktion aktualisieren kann, aber sie kann auch nur einige Parameter in der gaußschen Funktion aktualisieren.
  • Beispielsweise kann ein Verfahren A betrachtet werden, in welchem aus dem Standardabweichungswert σi,j der gaußschen Verteilung, der Mittenkoordinate µi,j der gaußschen Funktion und dem Gewicht Wi,j die Mittenkoordinate µi,j der gaußschen Funktion fixiert ist und der Standardabweichungswert σi,j und das Gewicht Wi,kj aktualisiert werden.
  • Zusätzlich kann ein Verfahren B betrachtet werden, bei dem der Standardabweichungswert σi,j der gaußschen Verteilung fixiert ist und die Mittenkoordinate µi,j der gaußschen Funktion und das Gewicht Wi,j aktualisiert werden, und ein Verfahren C kann betrachtet werden, bei dem das Gewicht Wi,j fixiert ist und der Standardabweichungswert σi,j der gaußschen Verteilung und die Mittenkoordinate µi,j der gaußschen Funktion aktualisiert werden.
  • Wie aus der vorstehenden Beschreibung ersichtlich ist, vergleicht gemäß dem ersten Ausführungsbeispiel die Elementbildungseinheit 13 den Ausgabewert zj von einem oder mehreren Elementen bj, die in der Zwischenschicht 2 enthalten sind, der von der Ausgabewert-Berechnungseinheit 12 berechnet wurde, und des Schwellenwerts Th, und hält die Anzahl von Elementen bj, die in der Zwischenschicht 2 enthalten sind, aufrecht, wenn jeder der Ausgabewerte zj aus den Ausgabewerten zj des einen oder der mehreren Elemente bj, die in der Zwischenschicht 2 enthalten sind, größer als der Schwellenwert Th ist und erhöht die Anzahl von Elementen bj, die in der Zwischenschicht 2 enthalten sind, wenn sämtliche der Ausgabewerte zj des einen oder der mehreren Elemente bj, die in der Zwischenschicht 2 enthalten sind, gleich dem oder kleiner als der Schwellenwert Th sind, so dass die Wirkung besteht, dass die Anzahl von in der Zwischenschicht 2 enthaltenen Elementen bj des Neuronennetzes selbst dann automatisch bestimmt werden kann, wenn das in der Zwischenschicht 2 des Neuronennetzes enthaltene Element bj ein Element ist, dessen Eingabe/Ausgabe-Antwort durch die gaußsche Funktion bestimmt wird.
  • Zweites Ausführungsbeispiel
  • In dem ersten Ausführungsbeispiel wird ein Beispiel beschrieben, bei dem die Anzahl von Zwischenschichten 2, die in dem Neuronennetz enthalten sind, gleich eins ist.
  • In diesem zweiten Ausführungsbeispiel wird ein Beispiel beschrieben, in welchem die Anzahl von Zwischenschichten 2, die in dem Neuronennetz enthalten sind, gleich zwei oder mehr sind.
  • 7 ist ein erläuterndes Diagramm, das ein Beispiel für ein Neuronennetz illustriert, bei dem eine Netzwerk-Bildungsvorrichtung nach dem zweiten Ausführungsbeispiel der vorliegenden Erfindung angewendet wird. In 7 wird, da die gleichen Bezugszahlen wie diejenigen in 3 die gleichen oder entsprechenden Teile bezeichnen, die Beschreibung von diesen weggelassen.
  • Zwischenschichten 2-1 bis 2-G sind zwischen der Eingangsschicht 1 und der Ausgangsschicht 3 kaskadenmäßig verbunden.
  • Die g-te Zwischenschicht 2-g (g = 1, 2, ... G) enthält J (J ist eine ganze Zahl gleich oder größer als 1) Elemente bj g (j = 1, 2, ..., J)und das j-te Element bj g ist ein Element, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt wird.
  • Wenn die Ausgabewerte yi = xi m der I-Elemente ai, die in der Eingangsschicht 1 enthalten sind, zu dem j-ten Element bj 1 gegeben werden, ähnlich wie bei der Zwischenschicht 2 in 3, berechnet die erste Zwischenschicht 2-1 einen Ausgabewert zj m des j-ten Elements bj m aus den Ausgabewerten yi der I Elemente ai und gibt den Ausgangswert zj m des Elements bj m zu der zweiten Zwischenschicht 2-2 aus.
  • Wenn die Ausgabewerte zj g-1 aller Elemente bj g-1, die in der (g-1)-ten Zwischenschicht 2-(g - 1) enthalten sind, zu dem j-ten Element bj g gegeben werden, berechnet die g-te Zwischenschicht 2-g (g = 2, 3, ..., G-1) den Ausgabewert zj g des j-ten Elements bj g aus den Ausgabewerten zj g-1 aller Elemente bj g-1 und gibt den Ausgabewert zj g des Elements bj g zu der G-ten Zwischenschicht 2-G aus.
  • Wenn die Ausgabewerte zj G-1 aller Elemente bj G-1, die in der (G-1)-ten Zwischenschicht 2-(G - 1) enthalten sind, zu dem j-ten Element bj G gegeben werden, berechnet die G-te Zwischenschicht 2-G den Ausgabewert zj G des j-ten Elements bj G aus den Ausgabewerten zj G-1 aller Elemente bj G-1 und gibt den Ausgabewert des zj G des Elements bj G zu der Ausgabeschicht 3 aus.
  • In 7 ist, obgleich die Anzahlen der Elementen, die in den Zwischenschichten 2-1 bis 2-G enthalten sind, sämtlich als einander gleich illustriert sind, es selbstverständlich, dass die Anzahlen von Elementen, die in den Zwischenschichten 2-1 bis 2-G enthalten sind, als voneinander verschieden in Abhängigkeit von der Arbeitsweise der später beschriebenen Elementbildungseinheit 13 bestimmt sein können.
  • Als nächstes wird die Arbeitsweise beschrieben.
  • Bei dem ersten Ausführungsbeispiel wurde ein Beispiel beschrieben, bei dem die Struktur der Zwischenschicht 2 bestimmt wird, bevor das überwachte Lernen durchgeführt wird; jedoch wird bei dem zweiten Ausführungsbeispiel ein Beispiel beschrieben, bei dem Strukturen der Zwischenschichten 2-1 bis 2-G bestimmt werden, bevor das überwachte Lernen durchgeführt wird.
  • Bei dem zweiten Ausführungsbeispiel wird die Struktur der Zwischenschicht 2-g in Reihenfolge von der Zwischenschicht 2-g (g = 1, 2, ..., G) auf der Seite der Eingangsschicht 1 aus den Zwischenschichten 2-1 bis 2-G bestimmt.
  • 8 ist ein Flussdiagramm, das ein Netzwerk-Bildungsverfahren illustriert, das ein Verarbeitungsvorgang in dem Fall ist, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert wird.
  • Die Verarbeitung des Bestimmens der Struktur der Zwischenschicht 2-1 aus den Zwischenschichten 2-1 bis 2-G, die der Seite der Eingangsschicht 1 am nächsten ist, ist die gleiche wie die Verarbeitung des Bestimmens der Struktur der Zwischenschicht 2 in 3, so dass die Beschreibung hiervon weggelassen wird.
  • Nachfolgend werden mit Bezug auf 8 die Verarbeitungsinhalte des Bestimmens der Struktur der Zwischenschicht 2-g (g = 2, 3, ..., G) beschrieben.
  • Bei dem zweiten Ausführungsbeispiel wird angenommen, dass ein anfänglicher Wert der Anzahl J von in der Zwischenschicht 2-g enthaltenen Elemente bj g gleich Null ist.
  • Zusätzlich wird angenommen, dass die Anzahl J der in der Zwischenschicht 2-(g - 1) enthaltenen Elemente bj g-1 bereits als K bestimmt wurde und der Ausgabewert zk g-1 des l-ten Elements bk g-1 (k = 1, ..., K), das in der Zwischenschicht 2-(g - 1) enthalten ist, berechnet wurde.
  • Bei der Ausführung des ersten Verarbeitungsinhalts bestimmt die Elementbildungseinheit 13, ob das Element bj g in der Zwischenschicht 2-g enthalten ist oder nicht.
  • Das heißt, die Elementbildungseinheit 13 bestimmt, ob die Anzahl J der Elemente bj g, die in der Zwischenschicht 2-g enthalten sind, gleich Null ist oder nicht (Schritt ST21 in 8).
  • Wenn bestimmt wird, dass die Anzahl J der Elemente bj g, die in der Zwischenschicht 2-g enthalten sind, gleich Null ist (Schritt ST21 in 8: JA), fügt die Elementbildungseinheit 13 ein Element bj g in der Zwischenschicht 2-g neu hinzu. Das heißt, die Elementbildungseinheit 13 schafft ein Element b1 g in der Zwischenschicht 2-g (Schritt ST22 in 8).
  • Wenn bestimmt wird, dass die Anzahl J der Elemente bj g, die in der Zwischenschicht 2-g enthalten sind, nicht gleich Null ist (Schritt ST21 in 8: NEIN), führt in dieser Stufe die Elementbildungseinheit 13 keine Verarbeitung des Hinzufügens des neuen Elements bj g in der Zwischenschicht 2-g durch. bei dem zweiten Ausführungsbeispiel schafft, da der Anfangswert der Anzahl J der in der Zwischenschicht 2-g enthaltenen Elemente bj g auf Null gesetzt ist, die Elementbildungseinheit 13 hier das Element b1 g in der Zwischenschicht 2-g.
  • Wenn die Elementbildungseinheit 13 das Element b1 g in der Zwischenschicht 2-g schafft, bestimmt die Anfangssetzeinheit 11, ob oder nicht die M Stücke von Lerndaten xm = (x1 m, x2 m, ..., xI m) (m = 1, ..., M) zu der Eingangsschicht 1 gegeben wurden, und Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, auf der Grundlage der M -ten Lerndaten xM erworben wurden (Schritt ST23 in 8).
  • wenn die Ausgabewerte zk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM erworben wurden (Schritt ST23) in 8: JA), beendet die Anfangssetzeinheit den ersten Verarbeitungsinhalt für die Bestimmung der Struktur der Zwischenschicht 2-g.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Mittelschicht 2-(g - 1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM noch nicht erworben wurden, Schritt ST23 in 8: NEIN), erwirbt die Anfangssetzeinheit 11 die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, die noch nicht erworben wurden (Schritt ST24 in 8).
  • Bei dem zweiten Ausführungsbeispiel erwirbt, da die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der ersten Lerndaten x1 in dieser Stufe nicht erworben wurden, die Anfangssetzeinheit 11 die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, auf der Grundlage der ersten Lerndaten x1.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, auf der Grundlage der ersten Lerndaten x1 erworben sind, initialisiert die Anfangssetzeinheit 11 die Parameter der gaußschen Funktion, die auf das Element b1 g, das in der Zwischenschicht 2-g enthalten ist, bezogen ist, aus den Ausgabewerten zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g - 1) enthalten sind (Schritt ST25 in 8).
  • Das heißt, die Anfangssetzeinheit berechnet einen Standardabweichungswert σk,1 g (k = 1, ...K) der gaußschen Verteilung aus den Ausgabewerten zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g - 1) enthalten sind, als einen der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 eine Mittenkoordinate µk,1 g (k = 1, ..., K) der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element bk g-1 bezogen ist.
  • Die Mittenkoordinate µk,1 g der gaußschen Funktion ist der Ausgabewert zk g-1 des k-ten Elements bk g-1, das in der Zwischenschicht 2-(g - 1) enthalten ist, wie in dem folgenden Ausdruck (7) angezeigt ist, μ k ,1 g = z k g 1
    Figure DE112016007312T5_0007
  • Weiterhin initialisiert die Anfangssetzeinheit 11 ein Gewicht Wk,1 g zwischen den k-ten Element bk g-1, das in der Zwischenschicht 2(g - 1) enthalten ist, und das Element b1 g, das in der Zwischenschicht 2-g enthalten ist, als einen der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g gezogen ist, wie in dem folgenden Ausdruck (8) angezeigt ist.
    Wk,1 g = 1
  • Hier wird ein Beispiel beschrieben, in welchem das Gewicht Wk,1 g auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel, und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist, initialisiert werden, gibt die Anfangssetzeinheit 11 die anfänglichen Werte der Parameter zu der Ausgabewert-Berechnungseinheit 12 aus und speichert die anfänglichen Werte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die anfänglichen Werte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g - 1) enthalten sind, auf der Grundlage der ersten Lerndaten x1.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der ersten Lerndaten x1 erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 einen Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g (Schritt ST26 in 8)
  • Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist, und der Ausgabewerte zk g-1 der K Elemente bk g-1, das in der Zwischenschicht 2-(g-1) enthalten ist, zu der in dem folgenden Ausdruck (9) angezeigten gaußschen Funktion. z 1 g = e x p ( k = 1 K ( W k ,1 g z k g 1 μ k ,1 g ) 2 ( σ k ,1 g ) 2 )
    Figure DE112016007312T5_0008
  • Wenn der Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g berechnet ist, gibt die Ausgabewert-Berechnungseinheit 12 den Ausgabewert z1 g des Elements b1 g an die Elementbildungseinheit 13 aus und speichert den Ausgabewert z1 g des Elements b1 g in der Datenspeichereinheit 14.
  • Wenn der Ausgabewert z1 g des Elements b1 g von der Ausgabewert-Berechnungseinheit 12 empfangen ist, vergleicht die Elementbildungseinheit 13 den Ausgabewert z1 g des Elements b1 g mit dem vorher gesetzten Schwellenwert Th (Schritt ST27 in 8).
  • Da der Ausgabewert z1 g des Elements b1 g maximal 1 ist, ist als der Schwellenwert Th eine positive reelle Zahl gleich oder kleiner als 1 oder eine positive reelle Zahl gleich oder größer als e-0,25 und gleich oder kleiner als 1 denkbar.
  • Wenn der Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g größer als der Schwellenwert Th ist (Schritt ST27 in 8: NEIN), hält die Elementbildungseinheit 13 die Anzahl J (J = 1) der in der Zwischenschicht 2-g enthaltenen Elemente aufrecht.
  • Wenn der Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g gleich dem oder kleiner als der Schwellenwert Th ist (Schritt ST27 in 8: JA), fügt die Elementbildungseinheit 13 ein neues Element b2 g zu der Zwischenschicht 2-g hinzu, so dass die Anzahl von in der Zwischenschicht 2-g enthaltenen Elementen erhöht wird (Schritt ST28 in 8).
  • Bei dem zweiten Ausführungsbeispiel ist zur Vereinfachung der Beschreibung der in der Zwischenschicht 2-g enthaltene Ausgabewert z1 g des Elements b1 g gleich dem oder kleiner als der Schwellenwert Th, so dass das neue Element b2 g zu der Zwischenschicht 2-g hinzugefügt wird.
  • Wenn die Elementbildungseinheit 13 das neue Element b2 g zu der Zwischenschicht 2-g hinzufügt oder die Anzahl J der in der Zwischenschicht 2-g enthaltenen Elemente aufrechterhält, bestimmt die Anfangssetzeinheit 11, ob die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM bereits erworben wurden oder nicht (Schritt ST23 in 8).
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM bereits erworben wurden (Schritt ST23 in 8: JA), beendet die Anfangssetzeinheit 11 den ersten Verarbeitungsinhalt zum Bestimmen der Struktur der Zwischenschicht 2.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM noch nicht erworben wurden (Schritt ST23 in 8: NEIN), erwirbt die Anfangssetzeinheit 11 die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, die noch nicht erworben wurden (Schritt ST24 in 8).
  • Bei dem zweiten Ausführungsbeispiel erwirbt, da die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Schicht 2-(g-1) enthalten sind, auf der Grundlage der zweiten Lerndaten x2 in dieser Stufe nicht erworben wurden, die Anfangssetzeinheit 11 die Ausgabewert zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der zweiten Lerndaten x2.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Schicht 2-(g-1) enthalten sind, auf der Grundlage der zweiten Lerndaten x2 erworben sind, initialisiert die Anfangssetzeinheit 11 die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g und b2 g bezogen ist, anhand der Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Schicht 2-(g-1) enthalten sind, auf der Grundlage der zweiten Lerndaten x2 (Schritt ST25 in 8).
  • Das heißt, die Anfangssetzeinheit 11 berechnet einen Standardabweichungswert σk,j g (k = 1, ..., K: j = 1, 2) der gaußschen Verteilung anhand der Ausgabewerte zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g-1) enthalten sind, als einen der Parameter der gaußschen Funktion, die auf die Elemente b1 g und b2 g, die in der Zwischenschicht 2-g enthalten sind, bezogen ist.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 den Ausgabewert zk g-1 des k-ten Elements bk g-1 das in der Zwischenschicht 2-(g-1) enthalten ist, zu einer Mittenkoordinate µk,j g (k = 1, ..., K: j = 1, 2) der gaußschen Funktion als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente bi g und b2 g bezogen ist, wie in dem folgenden Ausdruck (10) angezeigt ist: μ k , j g = z k g 1
    Figure DE112016007312T5_0009
  • Weiterhin initialisiert die Anfangssetzeinheit 11 ein Gewicht Wk,j g (k = 1, ... , K: J = 1, 2) zwischen dem in der Zwischenschicht 2-(g-1) enthaltenen k-ten Element bk g-1 und dem in der Zwischenschicht 2-g enthaltenen j-ten Element bj g (j = 1, 2) als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g und b2 g bezogen ist, wie in dem folgenden Ausdruck (11) angezeigt ist: W k , j g = 1
    Figure DE112016007312T5_0010
  • Hier ist ein Beispiel beschrieben, in welchem Wk,j g auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel, und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g und b2 g bezogen ist, initialisiert sind, gibt die Anfangssetzeinheit 11 die Anfangswerte der Parameter an die Ausgabewert-Berechnungseinheit 12 aus und speichert die Anfangswerte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die Anfangswerte der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g und b2 g bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte zk g-1 der K Elemente bk g-1 die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der zweiten Lerndaten x2.
  • Wenn die Ausgabewerte zk g-1 der in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthaltenen K Elemente bk g-1 auf der Grundlage der zweiten Lerndaten x2 erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 den Ausgabewert z1 g des Elements b1 g und einen Ausgabewert z2 g des in der Zwischenschicht 2-g enthaltenen Elements b2 g (Schritt ST26 in 8).
  • Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert z1 g des in der Zwischenschicht 2-g enthaltenen Elements b1 g durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist, und der Ausgabewerte zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g-1) enthalten sind, in die in dem folgenden Ausdruck (12) angezeigte gaußsche Funktion.
  • Die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b1 g bezogen ist, sind der Standardabweichungswert σk,1 g (k = 1, ..., K) der gaußschen Verteilung, die Mittenkoordinate µk,1 g (k = 1, ..., K) der gaußschen Funktion und das Gewicht Wk,1 g (k = 1, ..., K).
  • Zusätzlich berechnet die Ausgabewert-Berechnungseinheit 12 den Ausgabewert z2 g des Elements b2 g, das in der Zwischenschicht 2-g enthalten ist, durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b2 g bezogen ist, und der Ausgabewerte zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g-1) enthalten sind, in die in dem folgenden Ausdruck (12) angezeigte gaußsche Funktion.
  • Die Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element b2 g bezogen ist, sind ein Standardabweichungswert σak,2 g (k = 1, ..., K) der gaußschen Verteilung, ein Mittenwert µk,2 g (k = 1, ..., K) der gaußschen Funktion und ein Gewicht Wk,2 g (k = 1, ..., K). z j g = e x p ( k = 1 K ( W k , j g y k g 1 μ k , j g ) 2 ( σ k , j g ) 2 )
    Figure DE112016007312T5_0011
  • Hier ist j = 1, 2 in dem Ausdruck (12).
  • Wenn der Ausgabewert z1 g des Elements b1 g und der Ausgabewert z2 g des Elements b2 g, das in der Zwischenschicht 2-g enthalten ist, berechnet sind, gibt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g an die Elementbildungseinheit 13 aus und speichert die Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g in der Datenspeichereinheit 14.
  • Wenn die Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g von der Ausgabewert-Berechnungseinheit empfangen sind, vergleicht die Elementbildungseinheit 13 die Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g mit dem Schwellenwert Th (Schritt ST27 in 8).
  • Wenn irgendeine der Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g, die in der Zwischenschicht 2-g enthalten sind, größer als der Schwellenwert Th ist (Schritt ST27 in 8: NEIN), hält die Elementbildungseinheit 13 die Anzahl J (J = 2) der in der Zwischenschicht 2-g enthaltenen Elemente aufrecht.
  • Wenn alle Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g, die in der Zwischenschicht 2-g enthalten sind, gleich dem oder kleiner als der Schwellenwert Th sind (Schritt ST28 in 8: JA), fügt die Elementbildungseinheit 13 ein neues Element b3 g zu der Zwischenschicht 2-g hinzu, so dass die Anzahl von in der Zwischenschicht 2-g enthaltenen Elementen erhöht wird (Schritt ST28 in 8).
  • Bei dem zweiten Ausführungsbeispiel sind zur Vereinfachung der Beschreibung alle Ausgabewerte z1 g und z2 g der Elemente b1 g und b2 g, die in der Zwischenschicht 2-g enthalten sind, gleich dem oder kleiner als der Schwellenwert Th, so dass das neue Element b3 g zu der Zwischenschicht 2 hinzugefügt wird.
  • In der nachfolgenden Beschreibung wird angenommen, dass die Anzahl von Elementen, die gegenwärtig in der Zwischenschicht 2-g enthalten sind, gleich J (J ≥ 3) ist.
  • Wenn die Elementbildungseinheit 13 ein neues Element zu der Zwischenschicht 2-g hinzufügt oder die Anzahl J von in der Zwischenschicht 2-g enthaltenen Elementen beibehält, bestimmt die Anfangssetzeinheit 11, ob die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM bereits erworben wurden oder nicht (Schritt ST23 in 8).
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xM bereits erworben wurden (Schritt S23 in 8: JA), beendet die Anfangssetzeinheit 11 den ersten Verarbeitungsinhalt zum Bestimmen der Struktur der Zwischenschicht 2.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M-ten Lerndaten xm noch nicht erworben wurden (Schritt S23 in 8: NEIN), erwirbt die Anfangssetzeinheit 11 den Ausgabewert zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, der noch nicht erworben wurde (Schritt ST24 in 8).
  • Bei dem zweiten Ausführungsbeispiel erwirbt, da die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm aus den M Stücken von Lerndaten in dieser Stufe noch nicht erworben wurden, die Anfangssetzeinheit 11 den Ausgabewert zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm erworben sind, initialisiert die Anfangssetzeinheit 11 die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g bezogen ist, anhand der Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm (Schritt ST25 in 8).
  • Das heißt, die Anfangssetzeinheit berechnet den Standardabweichungswert σk,j g (k = 1, ..., K: J: j = 1, ..., J) der gaußschen Verteilung anhand der Ausgabewerte zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g-1) enthalten sind, als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g bezogen ist.
  • Zusätzlich initialisiert die Anfangssetzeinheit 11 den Ausgabewert zk g-1 des k-ten Elements bk g-1, das in der Zwischenschicht 2-(g-1) enthalten ist, zu der Mittenkoordinate µk,j g (k = 1, ..., K: j = 1, ..., J) der gaußschen Funktion als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g bezogen ist, wie in dem Ausdruck (10) angezeigt ist.
  • Weiterhin initialisiert die Anfangssetzeinheit das Gewicht Wk,j g (k = 1, ..., K: J: j = 1, ..., J) zwischen dem in der Zwischenschicht 2-(g-1) enthaltenen k-ten Element bk g-1 und dem in der Zwischenschicht 2-g enthaltenen J-ten Element bj g (j = 1, ..., J) als einen der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g bezogen ist, wie in dem Ausdruck (11) angezeigt ist.
  • Hier wird ein Beispiel beschrieben, in welchem Wk,j g auf 1 gesetzt ist; jedoch ist dies lediglich ein Beispiel, und ein anderer Wert als 1 kann gesetzt werden.
  • Wenn die Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g bezogen ist, initialisiert sind, gibt die Anfangssetzeinheit 11 die anfänglichen Werte der Parameter an die Ausgabewert-Berechnungseinheit 12 aus und speichert die anfänglichen Werte der Parameter in der Datenspeichereinheit 14.
  • Die Ausgabewert-Berechnungseinheit 12 erwirbt die anfänglichen Werte der Parameter der gaußschen Funktion, die auf die in der Zwischenschicht 2 enthaltenen Elemente b1 g bis bJ g bezogen ist, von der Anfangssetzeinheit 11.
  • Zusätzlich erwirbt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm.
  • Wenn die Ausgabewerte zk g-1 der K Elemente bk g-1, die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der m-ten Lerndaten xm erworben sind, berechnet die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 g bis zj g der in der Zwischenschicht 2-g enthaltenen Elemente b1 g bis bJ g (Schritt ST26 in 8).
  • Das heißt, die Ausgabewert-Berechnungseinheit 12 berechnet den Ausgabewert zj g (j = 1, ..., J) des in der Zwischenschicht 2-g enthaltenen Elements bj g durch Substituieren der Anfangswerte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element bj g (j = 1, ..., J) bezogen ist, und der Ausgabewerte zk g-1 der K Elemente bk g-1, die in der Zwischenschicht 2-(g-1) enthalten sind, in die in dem Ausdruck (12) angezeigte gaußsche Funktion.
  • Die anfänglichen Werte der Parameter der gaußschen Funktion, die auf das in der Zwischenschicht 2-g enthaltene Element bj g bezogen ist, sind der Standardabweichungswert σk,j g (k = 1, ..., K: j = 1, ..., J) der gaußschen Verteilung, die Mittenkoordinate µk,j g (k = 1, ..., K: j = 1, ..., J) der gaußschen Funktion und das Gewicht Wk,j g (k = 1, ...; K: j = 1, ..., J).
  • Wenn die Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g, die in der Zwischenschicht 2-g enthalten sind, berechnet werden, gibt die Ausgabewert-Berechnungseinheit 12 die Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g an die Elementbildungseinheit 13 aus und speichert die Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g in der Datenspeichereinheit 14.
  • Wenn die Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g von der Ausgabewert-Berechnungseinheit 12 empfangen werden, vergleicht die Elementbildungseinheit 13 die Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g mit dem Schwellenwert Th (Schritt ST27 in 8).
  • Wenn jeder der Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g, die in der Zwischenschicht 2-g enthalten sind, größer als der Schwellenwert Th ist (Schritt ST27 in 8: NEIN), hält die Elementbildungseinheit 13 die Anzahl J der in der Zwischenschicht 2-g enthaltenen Elemente aufrecht.
  • Wenn alle Ausgabewerte z1 g bis zJ g der Elemente b1 g bis bJ g, die in der Zwischenschicht 2-g enthalten sind, gleich dem oder kleiner als der Schwellenwert Th sind (Schritt ST27 in 8: JA), fügt die Elementbildungseinheit 13 ein neues Element zu der Zwischenschicht 2-g hinzu, so dass die Anzahl von in der Zwischenschicht 2-g enthaltenen Elementen erhöht wird (Schritt ST28 in 8).
  • Die Verarbeitung der Schritte ST23 bis ST28 wird wiederholt durchgeführt, bis die Ausgabewerte zk g-1 der K Elemente bk g-1 (k = 1, ..., K), die in der unmittelbar vorhergehenden Zwischenschicht 2-(g-1) enthalten sind, auf der Grundlage der M Stücke von Lerndaten xm (m = 1, ..., M) erworben sind, und wenn in der Bestimmungsverarbeitung des Schritts ST23 „JA“ bestimmt wird, ist der erste Verarbeitungsinhalt beendet.
  • Nachdem der erste Verarbeitungsinhalt beendet ist, führt die Parameteraktualisierungseinheit 15 den zweiten Verarbeitungsinhalt durch.
  • Das heißt, wie bei dem ersten Ausführungsbeispiel aktualisiert die Parameteraktualisierungseinheit 15 die Parameter der gaußschen Funktion, die in der Datenspeichereinheit 14 gespeichert sind, und aktualisiert das Gewicht vj zwischen dem j-ten Element bj g, das in der Zwischenschicht 2-G enthalten ist, und dem Element c, das in der Ausgabeschicht 3 enthalten ist, indem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion, die auf die in den Zwischenschichten 2-1 bis 2-G enthaltenen Elemente bezogen ist, jedes Mal durchgeführt wird, wenn die M Stücke von Lerndaten xm = (x1 m, x2 m, ..., xl m) aufeinanderfolgend gegeben werden, nachdem die Strukturen der Zwischenschichten 2-1 bis 2-G bestimmt wurden.
  • Zusätzlich aktualisiert die Parameteraktualisierungseinheit 15 ein Gewicht Wi,j 1 zwischen dem i-ten Element ai, das in der Eingabeschicht 1 enthalten ist, und dem j-ten Element bi 1, das in der Zwischenschicht 2-1 enthalten ist, und das Gewicht Wk,j g zwischen dem k-ten Elementen bk g-1 (k = 1, ..., K), das in der Zwischenschicht 2-(g-1) enthalten ist, und dem j-ten Element bj g (j = 1, ..., J), das in der Zwischenschicht 2-g enthalten ist, in dem das überwachte Lernen durchgeführt wird.
  • Das heißt, in dem das überwachte Lernen zum Lernen der Parameter der gaußschen Funktion, die auf die in den Zwischenschichten 2-1 bis 2-g enthaltenen Elemente bezogen ist, durchgeführt wird, werden die Parameter der gaußschen Funktion, die in der Datenspeichereinheit 14 gespeichert sind, und die Gewichte aktualisiert.
  • Wie aus der vorstehenden Beschreibung ersichtlich ist, wird gemäß dem zweiten Ausführungsbeispiel die Wirkung erhalten, das die Anzahl von Elementen bj g, die in der Zwischenschicht 2-g des Neuronennetzes enthalten sind, automatisch bestimmt werden kann, selbst wenn das Neuronennetz zwei oder mehr Zwischenschichten 2-g enthält.
  • Drittes Ausführungsbeispiel
  • In dem zweiten Ausführungsbeispiel wurde ein Beispiel beschrieben, bei dem die Anzahl von Zwischenschichten 2-g, die in dem Neuronennetz enthalten sind, auf G fixiert ist.
  • In diesem dritten Ausführungsbeispiel wird ein Beispiel beschrieben, bei dem die Anzahl von Zwischenschichten 2-g, die in dem Neuronennetz enthalten sind, so wie erforderlich bestimmt.
  • 9 ist ein Konfigurationsdiagramm, das eine Netzwerk-Bildungsvorrichtung nach dem dritten Ausführungsbeispiel der vorliegenden Erfindung illustriert, und 10 ist ein Hardware-Konfigurationsdiagramm, der Netzwerk-Bildungsvorrichtung nach dem dritten Ausführungsbeispiel der vorliegenden Erfindung.
  • In den 9 und 10 ist, da die gleichen Bezugszahlen wie diejenigen in den 1 und 2 die gleichen oder entsprechenden Teile bezeichnen, die Beschreibung von diesen weggelassen.
  • Eine Schichtenanzahl-Bestimmungseinheit 16 ist beispielsweise durch eine Schichtenanzahl-Bestimmungsschaltung 26 in 10 implementiert, und sie führt eine Verarbeitung des Bestimmens der Anzahl G der Zwischenschichten 2-g, die in dem Neuronennetz enthalten sind, durch.
  • In 9 wird eine Netzwerk-Bildungsvorrichtung angenommen, bei der die Anfangssetzeinheit 11, die Ausgabewert-Berechnungseinheit 12, die Elementbildungseinheit 13, die Datenspeichereinheit 14, die Parameteraktualisierungseinheit 15 und die Schichtenanzahl-Bestimmungseinheit 16, die Komponenten der Netzwerk-Bildungsvorrichtung sind, jeweils durch dedizierte Hardwareschaltungen implementiert sind, die die Anfangssetzschaltung 21, die Ausgabewert-Berechnungsschaltung 22, die Elementbildungsschaltung 23, die Datenspeicherschaltung 24, die Parameteraktualisierungsschaltung 25 und die Schichtenanzahl-Bestimmungsschaltung 26 sind, wie in 10 illustriert ist.
  • Hier enthalten Beispiele für die Datenspeichereinheit 24 einen nicht flüchtigen oder flüchtigen Halbleiterspeicher wie einen RAM, ROM, Flashspeicher, EPROM und EEPROM; eine magnetische Disc, eine flexible Disc, eine optische Disc, eine Kompaktdisc, eine Minidisk, eine DVD und dergleichen.
  • Zusätzlich enthalten Beispiele für die Anfangssetzschaltung 21, die Ausgabewert-Berechnungsschaltung 22, die Elementbildungsschaltung 23, die Parameteraktualisierungsschaltung 25 und die Schichtenanzahl-Bestimmungsschaltung 26 eine einzelne Schaltung, eine zusammengesetzte Schaltung, einen programmierten Prozessor, einen parallel programmierten Prozessor, eine ASIC, ein FBGA oder eine Kombination von diesen.
  • Jedoch sind die Komponenten der Netzwerk-Bildungsvorrichtung nicht auf solche beschränkt, die durch dedizierte Hardware implementiert sind, und die Netzwerk-Bildungsvorrichtung kann durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert sein.
  • In dem Fall, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert ist, ist es ausreichend, dass die Datenspeichereinheit 14 in dem in 4 illustrierten Speicher 31 des Computers konfiguriert ist, und ein Programm zum Bewirken, dass der Computer die Verarbeitungsvorgänge der Anfangssetzeinheit 11, der Ausgabewert-Berechnungseinheit 12, der Elementbildungseinheit 13, der Parameteraktualisierungseinheit 15 und der Schichtenanzahl-Bestimmungseinheit 16 durchführt, ist in dem Speicher 31 gespeichert, und der Prozessor 32 des in 4 illustrierten Computers führt das in dem Speicher 31 gespeicherte Programm aus.
  • Zusätzlich illustriert 10 ein Beispiel, in welchem jede der Komponenten der Netzwerk-Bildungsvorrichtung durch dedizierte Hardware implementiert ist, und 4 illustriert ein Beispiel, in welchem die Netzwerk-Bildungsvorrichtung durch Software, Firmware oder dergleichen implementiert ist; jedoch können einige Komponenten der Bildungsvorrichtung durch dedizierte Hardware implementiert sein und die verbleibenden Komponenten können durch Software, Firmware oder dergleichen implementiert sein.
  • Als nächstes wird die Arbeitsweise beschrieben.
  • Da die Arbeitsweise die gleiche wie die des zweiten Ausführungsbeispiels mit der Ausnahme, dass die Schichtenanzahl-Bestimmungseinheit 16 ist, ist, wird hier nur ein Verarbeitungsinhalt der Schichtenanzahl-Bestimmungseinheit 16 geschrieben.
  • Wenn die Anfangssetzeinheit 11, die Ausgabewert-Berechnungseinheit 12 und die Elementbildungseinheit 13 eine Struktur einer Zwischenschicht 2-g in der gleichen Weise wie bei dem zweiten Ausführungsbeispiel bestimmen, verbindet die Schichtenanzahl-Bestimmungseinheit 16 die Zwischenschicht 2-g, deren Struktur zwischen der Eingangsschicht 1 und der Ausgangsschicht 3 bestimmt wurde, zu jeder Zeit der Bestimmung.
  • Beispielsweise sind in einer Stufe, in der die Bestimmung von Strukturen von drei Zwischenschichten 2-1 bis 2-3 beendet ist, die drei Zwischenschichten 2-1 bis 2-3 zwischen die Eingangsschicht und die Ausgangsschicht 3 geschaltet.
  • Zusätzlich sind in einer Stufe, in der die Bestimmung von Strukturen von vier Zwischenschichten 2-1 bis 2-4 beendet ist, die vier Zwischenschichten 2-1 bis 2-4 zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltet.
  • Wenn eine Zwischenschicht 2-g, deren Struktur neu bestimmt ist, zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltet ist, gibt die Schichtenanzahl-Bestimmungseinheit 16 beliebige Daten zu der Eingangsschicht 1. Dann misst die Schichtenanzahl-Bestimmungseinheit 16 eine Zeit von der Eingabe von Daten in die Eingangsschicht 1 bis zur Ausgabe von Daten von der Ausgabeschicht 3 als eine Eingabe/Ausgabe-Zeit Ta der Daten in dem Neuronennetz. Ta = T OUT T IN
    Figure DE112016007312T5_0012
  • In dem Ausdruck (13) ist TIN eine Zeit, zu der Daten in die Eingangsschicht 1 eingegeben werden, und TOUT ist eine Zeit, zu der Daten von der Ausgangsschicht 3 ausgegeben werden.
  • Wenn die Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz gemessen wird, vergleicht die Schichtenanzahl-Bestimmungseinheit 16 die Eingangs/Ausgangs-Zeit Ta mit einer zulässigen Zeit Tb der Eingangs/Ausgangs-Zeit.
  • Die zulässige Zeit Tb der Eingangs/Ausgangszeit ist eine Zeit, die durch die Netzwerk-Bildungsvorrichtung zugelassen ist, und ist eine im Voraus gesetzte Zeit.
  • In einem Fall, in welchem die Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz kürzer als die zulässige Zeit Tb der Eingangs/Ausgangs-Zeit ist, berechnet die Schichtenanzahl-Bestimmungseinheit 16 anhand der Eingangs/Ausgangs-Zeit Ta der Daten eine Eingangs/Ausgangs-Zeit Ta/E der Zwischenschicht 2-g pro zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteter Schicht.
  • E ist die Anzahl der in dem gegenwärtigen Zeitpunkt zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g.
  • In einem Fall, in welchem dem folgenden Ausdruck (14) genügt ist, ist es sehr wahrscheinlich, dass die Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz innerhalb der zulässigen Zeit Tb ist, selbst wenn die Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g um 1 erhöht ist, so dass die Schichtenanzahl-Bestimmungseinheit 16 eine Zunahme der Anzahl der zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g um 1 zulässt.
  • Somit führen die Anfangssetzeinheit 11, die Ausgabewert-Berechnungseinheit 12 und die Elementbildungseinheit 13 eine Verarbeitung des Bestimmens einer Struktur einer neu hinzugefügten Zwischenschicht 2-g in der gleichen Weise wie bei dem zweiten Ausführungsbeispiel durch. Tb > Ta + Ta/E
    Figure DE112016007312T5_0013
  • In einem Fall, in welchem dem Ausdruck (14) nicht genügt ist, wenn die Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g um 1 erhöht wird, ist es sehr wahrscheinlich, dass die Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz die zulässige Zeit Tb überschreitet, so dass die Schichtenanzahl-Bestimmungseinheit 16 die Erhöhung der Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g zurückweist.
  • Somit wird die Anzahl E der zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g als die Anzahl G der Zwischenschichten 2-g des Neuronennetzes zum gegenwärtigen Zeitpunkt bestimmt.
  • Wie aus der vorstehenden Beschreibung ersichtlich ist, bestimmt gemäß dem dritten Ausführungsbeispiel die Schichtenanzahl-Bestimmungseinheit 16 die Anzahl G der Zwischenschichten 2-g anhand der Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz und der zulässigen Zeit Tb der Eingangs/Ausgangs-Zeit, so dass die Wirkung erhalten wird, dass die Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz als innerhalb der zulässigen Zeit Tb gesetzt werden kann.
  • In dem dritten Ausführungsbeispiel wurde ein Beispiel beschrieben, bei dem die Schichtenanzahl-Bestimmungseinheit 16 di Eingangs/Ausgangs-Zeit Ta der Daten in dem Neuronennetz misst und die Anzahl G der Zwischenschichten 2 anhand der Eingangs/Ausgangs-Zeit Ta und der zulässigen Zeit Tb bestimmt; jedoch ist dies keine Beschränkung.
  • Beispielsweise kann die Schichtenanzahl-Bestimmungseinheit 16 eine Lernzeit Tc des Neuronennetzes messen und die Anzahl G der Zwischenschichten 2 anhand der Lernzeit Tc und einer zulässigen Zeit Td für die Lernzeit bestimmen.
  • Spezifisch ist dies wie folgt:
  • Wenn die Zwischenschicht 2-g, deren Struktur neu bestimmt ist, zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltet ist, bewirkt die Schichtenanzahl-Bestimmungseinheit 16, dass das Neuronennetz lernen durchführt. in dem Lerndaten zu der Eingangsschicht 1 gegeben werden. Dann misst beispielsweise die Schichtenanzahl-Bestimmungseinheit 16 eine Zeit von der Eingabe von Lerndaten in die Eingangsschicht 1 bis zur Ausgabe von Daten aus der Ausgabeschicht 3 als die Lernzeit Tc des Neuronennetzes. Tc = T OUT T IN
    Figure DE112016007312T5_0014
  • In dem Ausdruck (15) ist TIN eine Zeit, zu der Lerndaten in die Eingangsschicht 1 eingegeben werden, und TOUT ist eine Zeit, zu der Daten von der Ausgangsschicht 3 ausgegeben werden.
  • Wenn die Lernzeit Tc des Neuronennetzes gemessen ist, vergleicht die Schichtenanzahl-Bestimmungseinheit 16 die Lernzeit Tc mit der zulässigen Zeit Td der Lernzeit.
  • Die zulässige Zeit Td der Lernzeit ist eine Zeit, die durch die Netzwerk-Bildungsvorrichtung zugelassen ist, und sie ist eine vorher gesetzte Zeit.
  • In einem Fall, in welchem die Lernzeit Tc des Neuronennetzes kürzer als die zulässige Zeit Td der Lernzeit ist, berechnet die Schichtenanzahl-Bestimmungseinheit 16 anhand der Lernzeit Tc des Neuronennetzes eine Lernzeit Tc/E der Zwischenschichten 2-g pro zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltete Schicht.
  • E ist die Anzahl der Zwischenschichten 2-g, die zum gegenwärtigen Zeitpunkt zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltet sind.
  • In einem Fall, in welchem dem folgenden Ausdruck (16) genügt ist, ist es sehr wahrscheinlich, dass die Lernzeit Tc des Neuronennetzes innerhalb der zulässigen Zeit Td selbst dann liegt, wenn die Anzahl von Zwischenschichten 2-g, die zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschaltet sind, um 1 erhöht ist, so dass die Schichtenanzahl-Bestimmungseinheit 16 zulässt, dass die Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g um 1 erhöht wird.
  • Somit führen die Anfangssetzeinheit 11, die Ausgabewert-Berechnungseinheit 12 und die Elementbildungseinheit 13 eine Verarbeitung des Bestimmens einer Struktur einer neu eingefügten Zwischenschicht 2-g in der gleichen Weise wie bei dem zweiten Ausführungsbeispiel durch. Td > Tc + Tc/E
    Figure DE112016007312T5_0015
  • In einem Fall, in welchem dem Ausdruck (16) nicht genügt ist, wenn die Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g um 1 erhöht ist, ist es sehr wahrscheinlich, dass die Lernzeit Tc des Neuronennetzes die zulässige Zeit Td überschreitet, so dass die Schichtenanzahl-Bestimmungseinheit 16 die Erhöhung der Anzahl von zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g zurückweist. Auf diese Weise wird die Anzahl E der zwischen die Eingangsschicht 1 und die Ausgangsschicht 3 geschalteten Zwischenschichten 2-g als die Anzahl E der Zwischenschichten 2-g des Neuronennetzes zu dem gegenwärtigen Zeitpunkt bestimmt.
  • In einem Fall, in welchem die Schichtenanzahl-Bestimmungseinheit 16 die Lernzeit Tc des Neuronennetzes misst und die Anzahl G der Zwischenschichten 2 anhand der Lernzeit Tc und der zulässigen Zeit Td bestimmt, wird die Wirkung erhalten, dass die Lernzeit Tc des Neuronennetzes innerhalb der zulässigen Zeit Td gesetzt werden kann.
  • Es ist zu beachten, dass bei der Erfindung der vorliegenden Anmeldung innerhalb des Bereichs der Erfindung eine freie Kombination jedes Ausführungsbeispiels, eine Modifikation einer beliebigen Komponente jedes Ausführungsbeispiels oder das Weglassen einer beliebigen Komponente bei jedem Ausführungsbeispiel möglich sind.
  • Gewerbliche Anwendbarkeit
  • Die vorliegende Erfindung ist geeignet für eine Netzwerk-Bildungsvorrichtung und ein Netzwerk-Bildungsverfahren zum Bilden eines Neuronennetzes.
  • Bezugszeichenliste
  • 1
    Eingangsschicht
    2, 2-1 to 2-G
    Zwischenschicht
    3
    Ausgangsschicht
    11
    Anfangssetzeinheit
    12
    Ausgabewert-Berechnungseinheit
    13
    Elementbildungseinheit
    14
    Datenspeichereinheit
    15
    Parameteraktualisierungseinheit
    16
    Schichtenanzahl-Bestimmungseinheit
    21
    Anfangssetzschaltung
    22
    Ausgabewert-Berechnungsschaltung
    23
    Elementbildungsschaltung
    24
    Datenspeicherschaltung
    25
    Parameteraktualisierungsschaltung
    26
    Schichtenanzahl-Bestimmungsschaltung
    31
    Speicher
    32
    Prozessor
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Nicht-Patentliteratur
    • Fukushima, K.: „Artificial vision by multi-layered neural networks: Neocognitron and its advances“, Neural Networks, Band 37, Seiten 103 -119 (2013) [0007]

Claims (20)

  1. Netzwerk-Bildungsvorrichtung, welche aufweist: eine Ausgabewert-Berechnungseinheit zum Berechnen von Ausgabewerten von einem oder mehreren Elementen, die in einer Zwischenschicht eines Neuronennetzes enthalten sind, gemäß einem Ausgabewert eines Elements, das in einer Eingangsschicht des Neuronennetzes enthalten ist, wenn das Neuronennetz gebildet wird, wobei das Neuronennetz die Zwischenschicht, die ein Element enthält, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt ist, enthält; und eine Elementbildungseinheit zum Vergleichen der Ausgabewerte des einen oder der mehreren Elemente, die durch die Ausgabewert-Berechnungseinheit berechnet wurden, mit einem Schwellenwert, und zum Aufrechterhalten einer Anzahl von in der Zwischenschicht enthaltenen Elementen, wenn ein Ausgabewert irgendeines der Elemente aus den Ausgabewerten des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, größer als der Schwellenwert ist, und zum Durchführen einer Elementbildungsverarbeitung des Erhöhens der Anzahl von in der Zwischenschicht enthaltenen Elementen, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, gleich dem oder kleiner als der Schwellenwert sind.
  2. Netzwerk-Bildungsvorrichtung nach Anspruch 1, weiterhin aufweisend eine Anfangssetzeinheit zum Initialisieren, für jedes in der Zwischenschicht enthaltene Element, von Parametern der gaußschen Funktion, die auf das Element bezogen ist, wobei die Ausgabewert-Berechnungseinheit einen Ausgabewert jedes Elements, das in der Zwischenschicht enthalten ist, berechnet durch Substituieren eines Ausgabewerts eines Elements, das in der Eingangsschicht enthalten ist, zu der gaußschen Funktion mit Parametern, die durch die Anfangssetzeinheit initialisiert wurden.
  3. Netzwerk-Bildungsvorrichtung nach Anspruch 2, weiterhin aufweisend eine Parameteraktualisierungseinheit zum Aktualisieren der Parameter der gaußschen Funktion und zum Aktualisieren eines Gewichts zwischen einem Element, das in der Zwischenschicht enthalten ist, und einem Element, das in einer Ausgangsschicht enthalten ist, indem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion durchgeführt wird, wenn Lerndaten in die Eingangsschicht eingegeben werden, nachdem die Elementbildungsverarbeitung durch die Elementbildungseinheit durchgeführt wurde.
  4. Netzwerk-Bildungsvorrichtung nach Anspruch 3, bei der die Parameteraktualisierungseinheit ein Gewicht zwischen einem Element, das in der Eingangsschicht enthalten ist, und einem Element, dass in der Zwischenschicht enthalten ist, durch Durchführen des überwachten Lernens aktualisiert.
  5. Netzwerk-Bildungsvorrichtung nach Anspruch 2, bei der die Ausgabewert-Berechnungseinheit einen Standardabweichungswert einer gaußschen Verteilung in der gaußschen Funktion für individuelle Elemente, die in der Zwischenschicht enthalten sind, als einen der Parameter der gaußschen Funktion verwendet.
  6. Netzwerk-Bildungsvorrichtung nach Anspruch 5, bei der die Ausgabewert-Berechnungseinheit einen Standardabweichungswert von Ausgabewerten mehrerer in der Eingangsschicht enthaltener Elemente als den Standardabweichungswert der gaußschen Verteilung für die individuellen Elemente, die in der Zwischenschicht enthalten sind, verwendet.
  7. Netzwerk-Bildungsvorrichtung nach Anspruch 5, bei der die Ausgabewert-Berechnungseinheit eine positive reelle Zahl als den Standardabweichungswert der gaußschen Verteilung für die individuellen Elemente, die in der Zwischenschicht enthalten sind, verwendet.
  8. Netzwerk-Bildungsvorrichtung nach Anspruch 1, bei der die Elementbildungseinheit eine positive reelle Zahl gleich oder kleiner als 1 als den Schwellenwert verwendet.
  9. Netzwerk-Bildungsvorrichtung nach Anspruch 1, bei der die Elementbildungseinheit eine positive reelle Zahl gleich oder größer als e-0,25 und gleich oder kleiner als 1 als den Schwellenwert verwendet.
  10. Netzwerk-Bildungsvorrichtung nach Anspruch 3, bei der die Parameteraktualisierungseinheit einen oder mehrere Parameter aus einem Parameter, der den Standardabweichungswert der gaußschen Verteilung in der gaußschen Funktion anzeigt, und einen Parameter, der eine Mittenkoordinate der gaußschen Funktion anzeigt, als die Parameter der gaußschen Funktion aktualisiert.
  11. Netzwerk-Bildungsvorrichtung nach Anspruch 1, bei der: das Neuronennetz G Zwischenschichten enthält, wobei G eine ganze Zahl gleich oder größer als 2 ist und die G Zwischenschichten zwischen der Eingangsschicht und der Ausgangsschicht in Kaskade verbunden sind, die Ausgabewert-Berechnungseinheit Ausgabewerte eines oder mehrerer Elemente, die in einer ersten Zwischenschicht enthalten sind, gemäß einem Ausgabewert eines in der Eingangsschicht enthaltenen Elements ausgibt, wenn der Ausgabewert des in der Eingangsschicht enthaltenen Elements in das eine oder die mehreren Elemente, die in der ersten Zwischenschicht enthalten sind, eingegeben wird, und Ausgabewerte von einem oder mehreren Elementen, die in einer g-ten Zwischenschicht enthalten sind, wobei g = 2, ..., G ist, gemäß einem Ausgabewert eines Elements, das in einer (g-1)-ten Zwischenschicht enthalten ist, wobei g = 2, ..., G ist, berechnet, wenn der Ausgabewert des in der (g-1)-ten Zwischenschicht, wobei g = 2, ..., G ist, enthaltenen Elements zu dem einen oder den mehreren Elementen, die in der g-ten Zwischenschicht, wobei g = 2, ..., G ist, enthalten sind, gegeben wird, und die Elementbildungseinheit die Ausgabewerte des einen oder der mehreren Elemente, die in der g-ten Zwischenschicht, wobei g = 1 ist, enthalten sind, die von der Ausgabewert-Berechnungseinheit berechnet wurden, mit dem Schwellenwert vergleicht und eine Anzahl von in der g-ten Zwischenschicht, wobei g = 1, ..., G ist, enthaltenen Elementen aufrecht erhält, wenn ein Ausgabewert irgendeines der Elemente aus den Ausgangswerten des einen oder der mehreren Elemente, die in der g-ten Zwischenschicht, wobei g = 1, ..., G ist, enthalten sind, größer als der Schwellenwert ist, und eine Elementbildungsverarbeitung des Erhöhens der Anzahl von Elementen, die in der g-ten Zwischenschicht, wobei g = 1, ..., G ist, enthalten sind, durchführt, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der g-ten Zwischenschicht, wobei g = 1, ..., G ist, enthalten sind, gleich dem oder kleiner als der Schwellenwert sind.
  12. Netzwerk-Bildungsvorrichtung nach Anspruch 11, weiterhin aufweisend eine Parameteraktualisierungseinheit zum Aktualisieren von Parametern der gaußschen Funktion, die auf ein in einer G-ten Zwischenschicht enthaltenes Element bezogen ist, wobei G eine ganze Zahl gleich oder größer als 2 ist, und zum Aktualisieren eines Gewichts zwischen einem in der G-ten Zwischenschicht enthaltenen Element und einem in der Ausgangsschicht enthaltenen Element, in dem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion durchgeführt wird, wenn Lerndaten zu der Eingangsschicht gegeben werden, nachdem die Elementbildungsverarbeitung durch die Elementbildungseinheit durchgeführt wurde.
  13. Netzwerk-Bildungsvorrichtung nach Anspruch 12, bei der die Parameter-Aktualisierungseinheit ein Gewicht zwischen einem Element, das in der (g-1)-ten Zwischenschicht enthalten ist, wobei g = 2, ..., G ist, und einem Element, das in der g-ten Zwischenschicht enthalten ist, wobei g = 2, ..., G ist, aktualisiert, indem das überwachte Lernen durchgeführt wird.
  14. Netzwerk-Bildungsvorrichtung nach Anspruch 12, bei der die Parameteraktualisierungseinheit ein Gewicht zwischen einem in der Eingangsschicht enthaltenen Element und einem in der ersten Zwischenschicht enthaltenen Element aktualisiert, indem das überwachte Lernen durchgeführt wird.
  15. Netzwerk-Bildungsvorrichtung nach Anspruch 11, weiterhin aufweisend eine Schichtenanzahl-Bestimmungseinheit zum Bestimmen einer Anzahl der in dem Neuronennetz enthaltenen Zwischenschichten.
  16. Netzwerk-Bildungsvorrichtung nach Anspruch 15, bei der die Schichtenanzahl-Bestimmungseinheit die Anzahl der Zwischenschichten anhand der Eingabe/Ausgabe-Zeit von Daten in dem Neuronennetz und einer zulässigen Zeit für die Eingabe/Ausgabe-Zeit bestimmt.
  17. Netzwerk-Bildungsvorrichtung nach Anspruch 15, bei der die Schichtenanzahl-Bestimmungseinheit die Anzahl der Zwischenschichten anhand einer Lernzeit des Neuronennetzes und einer zulässigen Zeit für die Lernzeit bestimmt.
  18. Netzwerk-Bildungsverfahren, welches aufweist: Berechnen, durch eine Ausgabewert-Berechnungseinheit, von Ausgabewerten von einem oder mehreren Elementen, die in einer Zwischenschicht eines Neuronennetzes enthalten sind, gemäß einem Ausgabewert eines in einer Eingangsschicht des Neuronennetzes enthaltenen Elements, wenn das Neuronennetz gebildet wird, wobei das Neuronennetz die Zwischenschicht enthält, die ein Element enthält, dessen Eingabe/Ausgabe-Antwort durch eine gaußsche Funktion bestimmt ist; und Vergleichen der Ausgabewerte des einen oder der mehreren Elemente, die von der Ausgabewert-Berechnungseinheit berechnet wurden, mit einem Schwellenwert, und Aufrechterhalten einer Anzahl von in der Zwischenschicht enthaltenen Elementen, wenn ein Ausgabewert irgendeines der Elemente aus den Ausgabewerten des einen oder der mehreren in der Zwischenschicht enthaltenen Elemente größer als der Schwellenwert ist, und durch Durchführen einer Elementbildungsverarbeitung des Erhöhens der Anzahl von in der Zwischenschicht enthaltenen Elementen, wenn alle Ausgabewerte des einen oder der mehreren Elemente, die in der Zwischenschicht enthalten sind, gleich dem oder kleiner als der Schwellenwert sind, durch eine Elementbildungseinheit.
  19. Netzwerk-Bildungsverfahren nach Anspruch 18, bei dem eine Anfangssetzeinheit für jedes in der Zwischenschicht enthaltene Element Parameter der gaußschen Funktion, die auf das Element bezogen ist, initialisiert, und die Ausgabewert-Berechnungseinheit einen Ausgabewert jedes in der Zwischenschicht enthaltenen Elements berechnet durch Substituieren eines Ausgabewerts eines in der Eingangsschicht enthaltenen Elements in der gaußschen Funktion, die durch die Anfangssetzeinheit initialisierte Parameter hat.
  20. Netzwerk-Bildungsverfahren nach Anspruch 19, bei dem eine Parameteraktualisierungseinheit die Parameter der gaußschen Funktion aktualisiert und ein Gewicht zwischen einem in der Zwischenschicht enthaltenen Element und einem in einer Ausgangsschicht enthaltenen Element aktualisiert, indem ein überwachtes Lernen zum Lernen der Parameter der gaußschen Funktion durchgeführt wird, wenn Lerndaten zu der Eingangsschicht gegeben werden, nachdem die Elementbildungsverarbeitung durch die Elementbildungseinheit durchgeführt wurde.
DE112016007312.7T 2016-10-03 2016-10-03 Netzwerk-bildungsvorrichtung und netzwerk-bildungsverfahren Ceased DE112016007312T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/079283 WO2018066032A1 (ja) 2016-10-03 2016-10-03 ネットワーク構築装置及びネットワーク構築方法

Publications (1)

Publication Number Publication Date
DE112016007312T5 true DE112016007312T5 (de) 2019-07-04

Family

ID=59082003

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112016007312.7T Ceased DE112016007312T5 (de) 2016-10-03 2016-10-03 Netzwerk-bildungsvorrichtung und netzwerk-bildungsverfahren

Country Status (7)

Country Link
US (1) US11373110B2 (de)
JP (1) JP6150964B1 (de)
KR (1) KR102027107B1 (de)
CN (1) CN109804386A (de)
DE (1) DE112016007312T5 (de)
TW (1) TWI643138B (de)
WO (1) WO2018066032A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7023613B2 (ja) * 2017-05-11 2022-02-22 キヤノン株式会社 画像認識装置および学習装置
CN108830376B (zh) * 2018-06-13 2021-12-14 中国科学技术大学 针对时间敏感的环境的多价值网络深度强化学习方法
CN111325311B (zh) * 2018-12-14 2024-03-29 深圳云天励飞技术有限公司 用于图像识别的神经网络模型生成方法及相关设备

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03134761A (ja) * 1989-10-20 1991-06-07 Fujitsu Ltd 階層型ニューラルネットワークの中間層ユニット数推定方法
JPH0635707A (ja) * 1992-05-19 1994-02-10 Sanyo Electric Co Ltd 自己増殖型ニューロファジィ知識獲得装置およびそれを用いた次元推定装置
JPH06314268A (ja) * 1993-04-28 1994-11-08 Toshiba Corp ニューラルネットの調節装置及び調節方法
US5790758A (en) * 1995-07-07 1998-08-04 The United States Of America As Represented By The Secretary Of The Navy Neural network architecture for gaussian components of a mixture density function
JP2000259598A (ja) 1999-03-12 2000-09-22 Fuji Electric Co Ltd ニューラルネットワークの最適化学習方法
EP1235180A1 (de) * 2001-02-26 2002-08-28 Honda R&D Europe (Deutschland) GmbH Anpassung der Parameter in einer Evolutionsstrategie
WO2003090122A2 (en) 2002-04-19 2003-10-30 Computer Associates Think, Inc. Using neural networks for data mining
US7577626B1 (en) * 2006-05-26 2009-08-18 Georgios Mountrakis Multi-scale radial basis function neural network
TW201116256A (en) 2009-11-09 2011-05-16 Charder Electronic Co Ltd Device for measuring human body composition by using biolectrical impedance method and artificial neural network
JP5510014B2 (ja) 2010-04-13 2014-06-04 富士通株式会社 ニューラルネットワーク設計方法及びプログラム
JP5467951B2 (ja) * 2010-07-05 2014-04-09 本田技研工業株式会社 ニューラルネットワーク学習装置
JP5779332B2 (ja) * 2010-11-03 2015-09-16 学校法人中部大学 ニューラルネットワークの学習装置、学習方法およびそれを用いたmpptコンバータの制御装置
US8489529B2 (en) 2011-03-31 2013-07-16 Microsoft Corporation Deep convex network with joint use of nonlinear random projection, Restricted Boltzmann Machine and batch-based parallelizable optimization
US8943008B2 (en) * 2011-09-21 2015-01-27 Brain Corporation Apparatus and methods for reinforcement learning in artificial neural networks
US9235799B2 (en) * 2011-11-26 2016-01-12 Microsoft Technology Licensing, Llc Discriminative pretraining of deep neural networks
TW201331855A (zh) * 2012-01-19 2013-08-01 Univ Nat Taipei Technology 具自由回饋節點的高速硬體倒傳遞及回饋型類神經網路
US9189730B1 (en) 2012-09-20 2015-11-17 Brain Corporation Modulated stochasticity spiking neuron network controller apparatus and methods
US9864953B2 (en) * 2013-05-30 2018-01-09 President And Fellows Of Harvard College Systems and methods for Bayesian optimization using integrated acquisition functions
US9728184B2 (en) * 2013-06-18 2017-08-08 Microsoft Technology Licensing, Llc Restructuring deep neural network acoustic models
CN104143327B (zh) * 2013-07-10 2015-12-09 腾讯科技(深圳)有限公司 一种声学模型训练方法和装置
US10311356B2 (en) * 2013-09-09 2019-06-04 North Carolina State University Unsupervised behavior learning system and method for predicting performance anomalies in distributed computing infrastructures
US9484022B2 (en) * 2014-05-23 2016-11-01 Google Inc. Training multiple neural networks with different accuracy
US11256982B2 (en) * 2014-07-18 2022-02-22 University Of Southern California Noise-enhanced convolutional neural networks
WO2016145379A1 (en) * 2015-03-12 2016-09-15 William Marsh Rice University Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification
EP3281044B1 (de) * 2015-04-10 2023-07-19 TotalEnergies OneTech Verfahren zur schätzung der elastischen parameter von untergrund
US9514391B2 (en) * 2015-04-20 2016-12-06 Xerox Corporation Fisher vectors meet neural networks: a hybrid visual classification architecture
WO2016188593A1 (en) * 2015-05-26 2016-12-01 Katholieke Universiteit Leuven Speech recognition system and method using an adaptive incremental learning approach
NL2015087B1 (en) * 2015-06-05 2016-09-09 Univ Amsterdam Deep receptive field networks.
US10776691B1 (en) * 2015-06-23 2020-09-15 Uber Technologies, Inc. System and method for optimizing indirect encodings in the learning of mappings
US9734567B2 (en) * 2015-06-24 2017-08-15 Samsung Electronics Co., Ltd. Label-free non-reference image quality assessment via deep neural network
US9633274B2 (en) * 2015-09-15 2017-04-25 Mitsubishi Electric Research Laboratories, Inc. Method and system for denoising images using deep Gaussian conditional random field network
CN105335816A (zh) * 2015-10-13 2016-02-17 国网安徽省电力公司铜陵供电公司 基于深度学习的电力通信网运行趋势与业务风险分析方法
US11049004B1 (en) * 2015-11-15 2021-06-29 ThetaRay Ltd. System and method for anomaly detection in dynamically evolving data using random neural network decomposition
FR3045892B1 (fr) * 2015-12-21 2018-06-22 Commissariat A L'energie Atomique Et Aux Energies Alternatives Circuit neuronal optimise, architecture et procede pour l'execution des reseaux de neurones.
JP6719773B2 (ja) * 2015-12-25 2020-07-08 国立大学法人大阪大学 分類分析方法、分類分析装置および分類分析用記憶媒体
US9830558B1 (en) * 2016-05-03 2017-11-28 Sas Institute Inc. Fast training of support vector data description using sampling
US9990592B2 (en) * 2016-02-10 2018-06-05 Sas Institute Inc. Kernel parameter selection in support vector data description for outlier identification
US10482196B2 (en) * 2016-02-26 2019-11-19 Nvidia Corporation Modeling point cloud data using hierarchies of Gaussian mixture models
US9704257B1 (en) * 2016-03-25 2017-07-11 Mitsubishi Electric Research Laboratories, Inc. System and method for semantic segmentation using Gaussian random field network
CN105912790A (zh) * 2016-04-15 2016-08-31 重庆大学 基于深度回归模型的遥感水质监测方法
US10963540B2 (en) * 2016-06-02 2021-03-30 Brown University Physics informed learning machine
US11222263B2 (en) * 2016-07-28 2022-01-11 Samsung Electronics Co., Ltd. Neural network method and apparatus
US11450064B2 (en) * 2016-09-06 2022-09-20 Carnegie Mellon University Gaussian mixture model based approximation of continuous belief distributions
DE102016216951A1 (de) * 2016-09-07 2018-03-08 Robert Bosch Gmbh Modellberechnungseinheit und Steuergerät zur wahlweisen Berechnung eines RBF-Modells, eines Gauß-Prozess-Modells und eines MLP-Modells
JP6562883B2 (ja) * 2016-09-20 2019-08-21 株式会社東芝 特性値推定装置および特性値推定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fukushima, K.: „Artificial vision by multi-layered neural networks: Neocognitron and its advances", Neural Networks, Band 37, Seiten 103 -119 (2013)

Also Published As

Publication number Publication date
KR20190039329A (ko) 2019-04-10
TW201814595A (zh) 2018-04-16
US20190251399A1 (en) 2019-08-15
KR102027107B1 (ko) 2019-10-01
US11373110B2 (en) 2022-06-28
TWI643138B (zh) 2018-12-01
JP6150964B1 (ja) 2017-06-21
CN109804386A (zh) 2019-05-24
JPWO2018066032A1 (ja) 2018-10-04
WO2018066032A1 (ja) 2018-04-12

Similar Documents

Publication Publication Date Title
DE112016001796T5 (de) Feinkörnige bildklassifizierung durch erforschen von etiketten von einem bipartiten graphen
DE112018004693T5 (de) Verbessern der effizienz eines neuronalen netzes
DE102020120479A1 (de) Fusion von Strassenkarten
DE112016007312T5 (de) Netzwerk-bildungsvorrichtung und netzwerk-bildungsverfahren
DE102019209644A1 (de) Verfahren zum Trainieren eines neuronalen Netzes
DE112021002866T5 (de) Modelltreueüberwachung und -neuerstellung zur entscheidungsunterstützung eines fertigungsverfahrens
DE102018130004B3 (de) Auf einer support vector machine basierende intelligente fahrweise zum passieren von kreuzungen und intelligentes fahrsystem dafür
DE202022100907U1 (de) Ein neuartiges Hybridisierungssystem für die Vorhersage von Zeitreihen
DE102021124445A1 (de) Metamerkmal-trainingsmodelle für maschinenlernalgorithmen
DE102019105850A1 (de) Verfahren zur Erzeugung eines reduzierten neuronalen Netzes für ein Steuergerät eines Fahrzeuges mithilfe von Eigenvektoren
EP0978052B1 (de) Rechnergestütztes verfahren zur auswahl von trainingsdaten für ein neuronales netz
DE112020005759T5 (de) Verfahren und System zum Bestimmen der Aufgabenkompatibilität in neuronalen Netzen
DE112020003599T5 (de) Prüfvorrichtung, prüfverfahren, prüfprogramm, lernvorrichtung, lernverfahren und lernprogramm
DE10047172C1 (de) Verfahren zur Sprachverarbeitung
DE102019218448A1 (de) Testen von Kombinationen aus Software und Hardware
DE102020208765A1 (de) Bildklassifikator mit variablen rezeptiven Feldern in Faltungsschichten
DE102022206892A1 (de) Verfahren zum Bestimmen einer optimalen Architektur eines künstlichen neuronalen Netzes
DE102016113310A1 (de) Verfahren zur Bewertung von Aussagen einer Mehrzahl von Quellen zu einer Mehrzahl von Fakten
DE102021200215A1 (de) Ermitteln einer Konfidenz eines künstlichen neuronalen Netzwerks
EP4242929A1 (de) Computerimplementiertes verfahren zum trainieren eines künstlichen neuronalen netzes (knn) mit einer sampleschwerpunktoptimierung zur erhöhung einer klassifikationsgenauigkeit des knn und trainingseinrichtung
EP0600569A1 (de) Verfahren zur Auswertung einer Menge linguistischer Regeln
DE112019007601T5 (de) Lernvorrichtung, lernverfahren, lerndatenerzeugungsvorrichtung, lerndatenerzeugungsverfahren, inferenzvorrichtung und inferenzverfahren
DE102021202564A1 (de) Vorrichtung und insbesondere computerimplementiertes Verfahren zur Klassifizierung von Datensätzen
DE202022103792U1 (de) Vorrichtung zum Bestimmen einer optimalen Architektur eines künstlichen neuronalen Netzes
DE202023103509U1 (de) Ein System für beziehungsbasiertes neues K-Linien-Clustering

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final