TWI643138B

TWI643138B - Network construction device and network construction method

Info

Publication number: TWI643138B
Application number: TW106105854A
Authority: TW
Inventors: 毬山利貞; 福島邦彥; 松本渉
Original assignee: 三菱電機股份有限公司
Priority date: 2016-10-03
Filing date: 2017-02-22
Publication date: 2018-12-01
Also published as: KR102027107B1; CN109804386A; DE112016007312T5; US20190251399A1; JPWO2018066032A1; TW201814595A; WO2018066032A1; US11373110B2; JP6150964B1; KR20190039329A

Abstract

元件構築部(13)，比較輸出值算出部(12)算出的中間層(2)包含的1個以上的元件的輸出值與閾值，當中間層(2)包含的1個以上的元件的輸出值之中的任一個輸出值比閾值大的話，維持中間層(2)包含的元件的數目，當中間層(2)包含的1個以上的元件的輸出值全部都在閾值以下的話，增加中間層(2)包含的元件的數目

Description

網路構築裝置以及網路構築方法

本發明係有關於構築類神經網路的網路構築裝置及網路構築方法。

類神經網路(Neural Network)是輸入層、中間層及輸出層縱向連接的網路。類神經網路是一種近似函數，藉由在事前學習輸入資料與輸出資料的關係，在被供給任意的輸入資料時，預測出對應到任意的輸入資料的輸出資料。

包含在中間層的元件的數目等的類神經網路的構造是類神經網路的設計者手動決定的情況較多，不熟知類神經網路的設計者要正確地決定類神經網路的構造是很困難的。以下的非專利文獻1揭露了一種網路構築方法，使用了被稱為AiS(Add if Silent)的手法，自動地決定類神經網路的構造。這個類神經網路是模仿被稱為新認知器(Neocognitron)的生物視覺資訊處理的類神經網路，這個類神經網路的中間層包含的元件是輸出入響應以標準化線性函數所決定的元件。

非專利文獻1：Fukushima, K.: “Artificial vision by multi-layered neural networks: Neocognitron and its advances”, Neural Networks, vol. 37, pp. 103-119 (2013).

習知的網路構築方法如以上的方式構成，因此如果中間層包含的元件是輸出入響應以標準化線性函數所決定的元件的話，就能夠自動地決定中間層包含的元件的數目。然而，中間層包含的元件是輸出入響應以高斯函數所決定的元件的情況下，即使使用被稱為AiS的手法，也會有無法自動地決定中間層包含的元件的數目等的問題。

本發明是為了解決上述的問題而完成，因此本發明的目的是得到一種網路構築裝置及網路構築方法，即使中間層包含的元件是輸出入響應以高斯函數所決定的元件，也能夠自動地決定中間層包含的元件的數目。

本發明的網路構築裝置，包括：輸出值算出部，在構築具備中間層的類神經網路時，根據該類神經網路的輸入層包含的元件的輸出值，算出該中間層包含的1個以上的元件的輸出值，其中該中間層包括輸出入響應是以高斯函數所決定的元件；以及元件構築部，實施元件構築處理，比較該輸出值算出部算出的1個以上的元件的輸出值與閾值，當該中間層包含的1個以上的元件的輸出值之中的任一個元件的輸出值比該閾值大的話，維持該中間層包含的元件的數目，當該中間層包含的1個以上的元件的輸出值全部都在該閾值以下的話，增加該中間層包含的元件的數目。

根據本發明，元件構築部會比較輸出值算出部所算出的1個以上的元件的輸出值與閾值，當中間層包含的1個以上的元件的輸出值當中的任一個元件的輸出值比閾值大的話，就維持中間層包含的元件的數目，當中間層包含的1個以上的元件的輸出值全部在閾值以下的話，就實施增加中間層包含的元件的數目的元件構築處理，因此，會有中間層包含的元件即使是輸出入響應以高斯函數所決定的元件，也能夠自動地決定中間層包含的元件的數目的效果。

1‧‧‧輸入層

2、2-1~2-G‧‧‧中間層

3‧‧‧輸出層

11‧‧‧初始設定部

12‧‧‧輸出值算出部

13‧‧‧元件構築部

14‧‧‧資料記憶部

15‧‧‧參數更新部

16‧‧‧層數決定部

21‧‧‧初始設定電路

22‧‧‧輸出值算出電路

23‧‧‧元件構築電路

24‧‧‧資料記憶電路

25‧‧‧參數更新電路

26‧‧‧層數決定電路

31‧‧‧記憶體

32‧‧‧處理器

第1圖係顯示本發明的實施型態1的網路構築裝置的架構圖。

第2圖係本發明實施型態1的網路構築裝置的硬體的架構圖。

第3圖係顯示本發明的實施型態1的網路構築裝置適用的類神經網路的一例的說明圖。

第4圖係網路構築裝置以軟體或韌體等來實現的情況下的電腦的硬體架構圖。

第5圖係顯示網路構築裝置以軟體或韌體等來實現的情況下的處理步驟，即網路構築方法的流程圖。

第6圖係顯示網路構築裝置以軟體或韌體等來實現的情況下的處理步驟，即網路構築方法的流程圖。

第7圖係顯示本發明的實施型態2的網路構築裝置適用的類神經網路的一例的說明圖。

第8圖係顯示網路構築裝置以軟體或韌體等來實現的情況下的處理步驟，即網路構築方法的流程圖。

第9圖係顯示本發明的實施型態3的網路構築裝置的架構圖。

第10圖係本發明實施型態3的網路構築裝置的硬體架構圖。

以下，為了更詳細地說明本發明，參照附加的圖式來說明實施本發明的實施型態。

類神經網路的中間層包含的元件的輸出入響應是標準化線性函數的情況下，例如大幅跳出預想範圍的正的資料輸入到中間層的話，就會預想到中間層會輸出大的正的資料。結果，就會預想到輸出層會輸出大的正的資料。藉此，例如類神經網路的輸出側的裝置中，大幅跳出預想範圍的資料輸入到中間層時，從類神經網路的輸出層會輸出大的正的資料，所以有受到極大影響的可能性存在。類神經網路的中間層包含的元件的輸出入響應是高斯函數的情況下，例如，大幅跳出預想範圍的正或負資料輸入到中間層時，中間層會輸出接近0的資料。結果，輸出層也輸出接近0的資料。藉此，例如類神經網路的輸出側的裝置中，即使大幅跳出預想範圍的資料輸入到中間層，類神經網路的輸出層也輸出接近0的資料，所以能夠迴避大的影響。

[實施型態1]

第1圖係顯示本發明的實施型態1的網路構築裝置的架構圖。第2圖係本發明實施型態1的網路構築裝置的硬體架構圖。第3圖係顯示本發明的實施型態1的網路構築裝置適用的類神經網路的一例的說明圖。第1圖到第3圖中，類神經網路具備輸入層1、中間層2及輸出層3。這個實施型態1 中，說明中間層2的層數是1的例子，中間層2的層數是2以上的例子在實施型態2說明。

輸入層1包含I(I是1以上的整數)個元件a_i(i=1、...、I)，例如由感測器等依序供給M(M是1以上的整數)個學習資料x^m=(x₁ ^m、x₂ ^m、...、x_I ^m)。m=1、2、...、M。學習資料x^m的次方數是I，學習資料x^m包含的x_i ^m(i=1、...、I)稱為成分資料。輸入層1在當學習資料x_i ^m的第i個成分資料x_i ^m(i=1、...、I)供給到第i個元件a_i(i=1、...、I)時，會輸出y_i=x_i ^m，來做為相對於中間層2包含的第j個元件b_j(j=1、...、J)的第i個元件a_i的輸出值。

中間層2包含J(J是1以上的整數)個元件b_j(j=1、...、J)，第j個元件b_j是輸出入響應以高斯函數決定的元件。然而，這個實施型態1中，為了說明上的方便，假設以網路構築裝置進行網路構築前，中間層2包含的元件的數目是0。這只是一個例子，即使是以網路構築裝置進行網路構築前，中間層2也可以包含1個以上的元件。中間層2在輸入層1包含的I個元件a_i的輸出值y_i(i=1、...、I)提供到第j個元件b_j時，會從I個元件a_i的輸出值y_i中算出第j個元件b_j的輸出值z_j(j=1、...、J)，將元件b_j的輸出值z_j輸出到輸出層3。

輸出層3包括元件c，元件c例如會算出中間層2與輸出層3之間的權重v_j(j=1、...、J)、以及中間層2包含的J個元件b_j的輸出值z_j(j=1、...、J)之間的積的總和，輸出該總和。第3圖中，顯示了輸出層3包括的元件c的個數是1的例子，但也可以包括複數的元件c。

初始設定部11例如以第2圖的初始設定電路21實現。初始設定部11對於中間層2包含的每個元件實施將關於該元件b_j的高斯函數的參數值做初始設定的處理。初始設定部11將做為高斯函數的參數值的例如高斯分布的標準差σ_i,j、高斯函數的中心座標μ_i,j、輸入層1包含的第i個元件a_i與中間層2包含的第j個元件b_j間的權重W_i,j做初始設定。高斯分布的標準差σ_i,j是對於中間層2包含的第j個元件b_j的例如I個元件a_i的輸出值y_i(i=1、...、I)的標準差。高斯函數的中心座標μ_i,j是中間層2包含的第j個元件b_j的中心成分。

輸出值算出部12是例如以第2圖的輸出值算出電路22實現。做為來自初始設定部11的高斯函數的參數的初始值，輸出值算出部12會被供給高斯分布的標準差σ_i,j、高斯函數的中心座標μ_i,j、權重W_i,j。輸出值算出部12對於具有初始設定部11所供給的參數的初始值的高斯函數，代入輸入層1包含的例如I個元件a_i的輸出值y_i(i=1、...、I)，藉此實施算出第j個元件b_j的輸出值z_j(j=1、...、J)的處理。

元件構築部13會以例如第2圖的元件構築電路23實現。元件構築部13會將輸出值算出部12所算出的J個元件b_j的輸出值z_j(j=1、...、J)與事前設定的閾值Th做比較，當中間層2中包含的J個元件bj的輸出值z_j之中，任一者元件b_j的輸出值z_j比閾值Th大的話，就維持中間值2包含的元件b_j的數目。又，當J個元件b_j的輸出值z_j的全部都在閾值Th以下的話，元件構築部13就會實施增加中間值2包含的元件b_j的數目的元件構築處理。

資料記憶部14例如是以第2圖的資料記憶電路24實現。除了中間層2包含的元件b_j的個數J以外，資料記憶部14還儲存了有關於初始設定部11所初始設定的元件b_j的高斯函數的參數，以及輸出值算出部12所算出的元件b_j的輸出值z_j。參數更新部15例如以第2圖的參數更新電路25實現。參數更新部15在元件構築部13實施元件構築處理後，在學習資料供給輸入層1時實施學習高斯函數的參數的監督式學習，藉此更新儲存於資料記憶部14中的高斯函數的參數以及中間層2包含的第j個元件b_j與輸出層3包含的元件c之間的權重v_j。又，參數更新部15實施監督式學習，藉此實施將輸入層1包含的第i個元件a_i與中間層2包含的第j個元件b_j之間的權重W_i,j。

在第1圖中，網路構築裝置的構成要素，即初始設定部11、輸出值算出部12、元件構築部13、資料記憶部14及參數更新部15分別假設是以第2圖所示的專用硬體，也就是初期設定電路21、輸出值算出電路22、元件構築電路23、資料記憶電路24及參數更新電路25實現。在此，資料記憶電路24例如是RAM(Random Access Memory)、ROM(Read Only Memory)、快閃記憶體、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)等的非揮發性或揮發性的半導體記憶體、磁碟片、可撓性碟片、光碟、CD、MD、DVD(Digital Versatile Disc)等。又，初始設定電路21、輸出值算出電路22、元件構築電路23及參數更新電路25例如是單一電路、複合電路、程式化的處理器、平行程式化的處理器、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmble Gate Array)、或者是它們的組合。

然而，網路構築裝置的構成要素並不限定於以專用硬體來實現，網路構築裝置也可以用軟體、韌體、或者是軟體及韌體的組合來實現。軟體或韌體會做為程式而儲存於電腦的記憶體。電腦的意思是執行程式的硬體，例如CPU(Central Processing Unit)、中央處理裝置、處理裝置、計算裝置、微處理器、微控制器、處理器、DSP(Digital Signal Processor)等。

第4圖係網路構築裝置以軟體或韌體等來實現的情況下的電腦的硬體架構圖。網路構築裝置以軟體或韌體等實現的情況下，資料記憶部14構成於電腦的記憶體31上，且用來讓電腦執行初始設定部11、輸出值算出部12、元件構築部13及參數更新部15的處理步驟的程式會存在記憶體31，讓電腦的處理器32執行儲存於記憶體31中的程式即可。第5圖及第6圖係顯示網路構築裝置以軟體或韌體等來實現的情況下的處理步驟，即網路構築方法的流程圖。

又，第2圖中，顯示了網路構築裝置的構成要素分別以專用的硬體實現的例子，第4圖中，顯示了網路構築裝置以軟體或韌體等實現的例子，但也可以是網路構築裝置中的一部分的構成要素是以專用的硬體實現，剩下的構成要素是以軟體或韌體等實現。

接著說明動作。本實施型態1中的網路構築裝置的處理內容大致分成2個處理內容。第1處理內容是決定中間層2的構造的處理內容，也就是決定中間層2包含的元件b_j 的個數J，且初始設定關於元件b_j的高斯函數的參數的處理內容(第5圖的步驟ST1)。第2處理內容是藉由實施監督式學習，來更新初始設定的高斯函數的參數、以及輸入層1包含的第i個元件a_i以及中間層2包含的第j個元件b_j之間的權重W_i,j的處理內容(第5圖的步驟ST2)。

以下，一邊參照第6圖，一邊具體地說明第1處理內容。本實施型態1中，假設中間層2包含的元件b_j的個數J的初始值是0個。元件構築部13在執行第1處理內容時，會判定中間層2之中是否包含元件b_j。也就是說，元件構築部13判斷中間層2之中包含元件b_j的個數J是否為0個(第6圖的步驟ST11)。

當元件構築部13判斷中間層2之中包含元件b_j的個數J是0個時(第6圖的步驟ST11：YES的情況)，會在中間層2之中追加1個新的元件b_j。也就是，元件構築部13會在中間層2中新增元件b₁(第6圖的步驟ST12)。元件構築部13判斷中間層2之中包含元件b_j的個數J不是0個時(第6圖的步驟ST11：NO的情況)，在這個階段，不進行追加新的元件b_j到中間層2中的處理，本實施型態1中，因為中間層2所包含的元件b_j的個數J的初始值是設定0個，因此這邊元件構築部13會新增元件b₁到中間層2中。

當元件構築部13新增元件b₁到中間層2中，初始設定部11會判定是否已經取得M個學習資料x^m=(x₁ ^m、x₂ ^m、...、x_I ^m)的全部(第6圖的步驟ST13)。如果已經取得M個學習資料x^m的話(第6圖的步驟ST13：YES的情況)，初始設定部11會結束決定中間層2的構造的第1處理內容。如果還沒有取得M個學習資料x^m的話(第6圖的步驟ST13：NO的情況)，初始設定部11會取得還未取得的學習資料x^m(第6圖的步驟ST14)。這個實施型態1中，初期設定部11在這個階段還沒有取得M個學習資料x^m，因此會取得第1個學習資料x¹=(x₁ ¹、x₂ ¹、...、x_I ¹)，來做為尚未取得的學習資料x^m。當初始設定部11取得第1個學習資料x¹=(x₁ ¹、x₂ ¹、...、x_I ¹)，會從輸入層1包含的第i的元件a_i的輸出值y_i=x_i ¹中，初始設定有關於中間層2包含的元件b₁的高斯函數的參數(第6圖的步驟ST15)。

也就是，做為有關中間層2包含的元件b₁的高斯函數的參數的一個，初始設定部11會初始設定高斯分布的標準差σ_i,1(i=1、...、I)。高斯分布的標準差值σ_i,1是對於中間層2包含的元件b₁的I個元件a_i的輸出值y_i=x_i ¹的標準偏差值，從輸入層1包含的I個元件a_i的輸出值y_i=x_i ¹中算出。標準差值σ_i,1的算出處理本身是公知技術所以省略詳細說明。又，做為有關於中間層2包含的元件b₁的高斯函數的參數的一者，初始設定部11會初始設定高斯函數的中心座標μ_i,1(i=1、...、I)。高斯函數的中心座標μ_i,1如以下式(1)，輸入層1包含的第i個元件a_i的輸出值y_i=x_i ¹。

μ_i,1=x_i ¹ (1)

又，做為有關於中間層2包含的元件b₁的高斯函數的參數的一者，初始設定部11如以下式(2)，會初始設定輸入層1包含的第i個元件a_i與中間層2包含的元件b₁之間的權重 W_i,1(i=1、...、I)。

W_i,1=1 (2)

在此，顯示了將權重W_i,1設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

當初始設定部11初始設定有關於中間層2包含的元件b₁的高斯函數的參數時，會將該參數的初始值輸出到輸出值算出部12，且會將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11取得有關於中間層2包含的元件b₁的高斯函數的參數的初始值。又，輸出值算出部12取得第1個學習資料x¹=(x₁ ¹、x₂ ¹、...、x_I ¹)。

輸出值算出部12取得第1個學習資料x₁時，會算出中間層2包含的元件b₁的輸出值z₁(第6圖的步驟ST16)。也就是，輸出值算出部12對於以下式(3)所示的高斯函數，將關於中間值2包含的元件b₁的高斯函數的參數值初始值、輸入層1包含的I個元件a_i的輸出值y_i=x_i ¹代入，藉此算出中間層2包含的元件b₁的輸出值z₁。

輸出值算出部12當算出時中間層2包含的元件b₁的輸出值z₁時，會將元件b₁的輸出值z₁輸出到元件構築部13，且將元件b₁的輸出值z₁儲存到資料記憶部14

元件構築部13當接收到來自輸出值算出部12的元件b₁的輸出值z₁，會比較元件b₁的輸出值z₁與事前設定的閾值Th(第6圖的步驟ST17)。因為元件b₁的輸出值z₁最大是1，做為閾值Th，會考慮1以下的正的實數或者是e^-0.25以上1以下的實數等。

元件構築部13，在中間層2包含的元件b₁的輸出值z₁比閾值Th大的情況下(第6圖的步驟ST17：NO的情況)，會維持中間層2包含的元件的個數J(J=1)。中間層2包含的元件b₁的輸出值z₁比閾值Th大的情況下，中間層2包含的元件b₁可以說是對應到輸入層1包含的元件a₁的輸出值y₁的元件。也就是說，中間層2包含的元件b₁可以說是表示高斯函數中的高斯分布的中心座標的元件。因此，不需要追加新的元件b₂到中間層2，所以元件構築部13會維持中間層2中包含的元件的個數J(J=1)。元件構築部13，在中間層2包含的元件b₁的輸出值z₁在閾值Th以下的情況下(第6圖的步驟ST17：YES的情況)，會追加新的元件b₂到中間層2，使中間層2包含的元件的數目增加(第6圖的步驟ST18)。中間層2包含的元件b₁的輸出值z₁在閾值Th以下的情況下，中間層2包含的元件b₁不可以說是對應到輸入層1包含的元件a₁的輸出值y₁的元件。因此，元件構築部13追加新的元件b₂到中間層2。在這個實施型態1中，為了說明上的方便，因為中間層2包含的元件b₁的輸出值z₁在閾值Th以下，所以假設追加新的元件b₂到中間層2。

初始設定部11會在元件構築部13追加新的元件b₂到中間層2，或者是維持中間層2包含的元件的個數J的時候，判定是否已經取得M個學習資料x^m=(x₁ ^m、x₂ ^m、...、x_I ^m)的全部(第6圖的步驟ST13)。初始設定部11在已經取得M個學習資料x^m的話(第6圖的步驟ST13：YES的情況)，會結束決定中間層2的構造的第1處理內容。初始設定部11在還沒有取得M個學習資料x^m的話(第6圖的步驟ST13：NO的情況)，取得尚未取得的學習資料x^m(第6圖的步驟ST14)。在這個實施型態1中，初始設定部11在這個階段還沒有取得M個學習資料x^m，會取得第2個學習資料x²=(x₁ ²、x₂ ²、...、x_I ²)，來做為尚未取得的學習資料x^m。初始設定部11在取得第2個學習資料x²=(x₁ ²、x₂ ²、...、x_I ²)時，會從輸入層1中包含的i個元件a_i的輸出值y_i=x_i ²中，初始設定有關中間層2包含的元件b₁、b₂的高斯函數的參數(第6圖的步驟ST15)。

也就是，初期設定部11會從輸入層1中包含的I個元件a_i的輸出值y_i=x_i ²中，算出高斯分布的標準差σ_i,j(i=1、...、I：j=1、2)，來做為有關於中間層2的元件b₁、b₂的高斯函數的參數的一者。又，初始設定部11如以下式(4)所示，將輸入層1所包含的第i個元件a_i的輸出值y_i=x_i ²初始設定成高斯函數的中心座標μ_i,j(i=1、...、I：j=1、2)，來做為有關於中間層2的元件b₁、b₂的高斯函數的參數的一者。

μ_i,j=x_i ² (4)

又，初始設定部11如以下式(5)所示，將輸入層1所包含的第i個元件a_i(i=1、...、I)及中間層2所包含的第j個元件b_j(j=1、2)之間的權重W_i,j做初始設定，來做為有關於中間層2的元件b₁、b₂的高斯函數的參數的一者。

W_i,j=1 (5)

在此，顯示了將W_i,j設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

初始設定部11將有關於中間層2包含的元件b₁、b₂的高斯函數的參數初始設定時，將該參數的初始值輸出到輸出值算出部12，且同時將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11中取得有關於中間層2的元件b₁、b₂的高斯函數的參數的初始值。又，輸出值算出部12取得第2個學習資料x²=(x₁ ²、x₂ ²、...、x_I ²)。

輸出值算出部12當取得第2個學習資料x²時，算出中間層2包含的元件b₁的輸出值z₁(第6圖的步驟ST16)。也就是，輸出值算出部12對於以下式(6)所示的高斯函數，將關於中間值2包含的元件b₁的高斯函數的參數值初始值、輸入層1包含的I個元件a_i的輸出值y_i=x_i ²代入，藉此算出中間層2包含的元件b₁的輸出值z₁。有關中間值2包含的元件b₁的高斯函數的參數的初始值是高斯分布的標準差σ_i,1(i=1、...、I)、高斯函數的中心座標μ_i,1(i=1、...、I)、權重W_i,1(i=1、...、I)。又，輸出值算出部12對於以下式(6)所示的高斯函數，將關於中間值2包含的元件b₂的高斯函數的參數值初始值、輸入層1包含的I個元件a_i的輸出值y_i=x_i ²代入，藉此算出中間層2包含的元件b₂的輸出值z₂。有關中間值2包含的元件b₂的高斯函數的參數的初始值是高斯分布的標準差σ_i,2(i=1、...、I)、高斯函數的中心座標μ_i,2(i=1、...、I)、W_i,2(i=1、...、I)。

在此，式(6)中，i=1、...、I，j=1、2。輸出值算出部12將中間層2包含的元件b₁的輸出值z₁及元件b₂的輸出值z₂算出時，將元件b₁、b₂的輸出值z₁、z₂輸出到元件構築部13，且同時將元件b₁、b₂的輸出值z₁、z₂儲存到資料記憶部14。

元件構築部13接受到來自輸出值算出部12的元件b₁、b₂的輸出值z₁、z₂時，比較元件b₁、b₂的輸出值z₁、z₂與閾值Th(第6圖的步驟ST17)。元件構築部13，在中間層2包含的元件b₁、b₂的輸出值z₁、z₂之中任一者比閾值Th大的情況下(第6圖的步驟ST17：NO的情況)，會維持中間層2包含的元件的個數J(J=2)。中間層2包含的元件b₁、b₂的輸出值z₁、z₂之中任一者比閾值Th大的情況下，輸出值比閾值Th大的元件可以說是對應到輸入層1包含的元件的輸出值的元件。因此，不需要追加新的元件b₃到中間層2，所以元件構築部13會維持中間層2中包含的元件的個數J(J=2)。元件構築部13，在中間層2包含的元件b₁、b₂的輸出值z₁、z₂全部都在閾值Th以下的情況下(第6圖的步驟ST17：YES的情況)，會追加新的元件b₃到中間層2，使中間層2包含的元件的數目增加(第6圖的步驟ST18)。中間層2包含的元件b₁、b₂的輸出值z₁、z₂全部都在閾值Th以下的情況下，中間層2包含的任一個元件都不可以說是對應到輸入層1包含的元件的輸出值的元件。因此，元件構築部13追加新的元件b₃到中間層2。在這個實施型態1中，為了說明上的方便，因為中間層2包含的元件b₁、b₂的輸出值z₁、z₂全部都閾值Th以下，所以假設追加新的元件b₃到中間層2。

以後，假設中間層2包含的現在元件的個數是J個(J≧3)來說明。初始設定部11會在元件構築部13追加新的元件到中間層2，或者是維持中間層2包含的元件的個數J的時候，判定是否已經取得M個學習資料x^m(x₁ ^m、x₂ ^m、...、x_I ^m)的全部(第6圖的步驟ST13)。初始設定部11已經取得M個學習資料x^m的話(第6圖的步驟ST13：YES的情況)，會結束決定中間層2的構造的第1處理內容。初始設定部11還沒有取得M個學習資料x^m的話(第6圖的步驟ST13：NO的情況)，取得尚未取得的學習資料x^m(第6圖的步驟ST14)。初始設定部11假設在M個學習資料X^m之中還沒有取得第m個學習資料x^m的話，會取得第m個學習資料X^m。當初始設定部11在取得第m個學習資料x^m時，會從輸入層1中包含的i個元件a_i的輸出值y_i=x_i ^m中，初始設定有關中間層2包含的元件b₁~b_J的高斯函數的參數(第6圖的步驟ST15)。

也就是，做為有關中間層2包含的元件b₁~b_J的高斯函數的參數的一個，初始設定部11會從輸入層1包含的I個元件a_i的輸出值y_i=x_i ^m中算出高斯分布的標準差σ_i,j(i=1、...、I：j=1、...、J)。又，做為有關於中間層2包含的元件b₁~b_J的高斯函數的參數的一者，如式(4)所示，初始設定部11會初始設定輸入層1包含的第i個元件a_i的輸出值y_i=x_i ^m為高斯函數的中心座標μ_i,j。又，做為有關於中間層2包含的元件b₁~b_J的高斯函數的參數的一者，如式(5)所示，初始設定部11會初始設定輸入層1包含的第i個元件a_i(i=1、...、J)與中間層2包含的第j個元件b_j(j=1、...、J)之間的權重W_i,j。在此，顯示了將權重W_i,j設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

初始設定部11當初始設定有關中間層2包含的元件b₁~b_J的高斯函數的參數時，一邊將該參數的初始值輸出到輸出值算出部12，一邊將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11中取得中間值2包含的元件b₁~b_J的高斯函數的參數的初始值。又，輸出值算出部12取得第m個學習資料x^m(x₁ ^m、x₂ ^m、...、x_I ^m)。

當輸出值算出部12取得第m個學習資料x^m(x₁ ^m、x₂ ^m、...、x_I ^m)，會算出中間層2包含的元件b₁~b_J的輸出值z₁~z_J(第6圖的步驟ST16)。也就是，輸出值算出部12對於式(6)所示的高斯函數，將關於中間值2包含的元件b_j(j=1、...、J)的高斯函數的參數值初始值、輸入層1包含的I個元件a_i的輸出值y_i=x_i ^m代入，藉此算出中間層2包含的元件b_j的輸出值z_j(j=1、...、J)。有關中間值2包含的元件b_j的高斯函數的參數的初始值是高斯分布的標準差σ_i,j(i=1、...、I：j=1、...、J)、高斯函數的中心座標μ_i,j(i=1、...、I：j=1、...、J)、權重W_i,j(i=1、...、I：j=1、...、J)。

當輸出值算出部12算出中間層2包含的元件b₁~b_J的輸出值z₁~z_J，會將元件b₁~b_J的輸出值z₁~z_J輸出到元件構築部13，且同時將元件b₁~b_J的輸出值z₁~z_J儲存到資料記憶部14。

元件構築部13接受到來自輸出值算出部12的元件b₁~b_J的輸出值z₁~z_J時，比較元件b₁~b_J的輸出值z₁~z_J 與閾值Th(第6圖的步驟ST17)。元件構築部13，在中間層2包含的元件b₁~b_J的輸出值z₁~z_J中任一者的輸出值比閾值Th大的情況下(第6圖的步驟ST17：NO的情況)，會維持中間層2包含的元件的個數J。元件構築部13，在中間層2包含的元件b₁~b_J的輸出值z₁~z_J全部都在閾值Th以下的情況下(第6圖的步驟ST17：YES的情況)，會追加新的元件到中間層2，使中間層2包含的元件的數目增加(第6圖的步驟ST18)。步驟ST13~ST18的處理會反覆地實施，直到M個學習資料X^m全部取得為止，當步驟ST13的判定處理中判定為「YES」時。第1處理內容結束。

參數更新部15結束第1處理內容後，實施第2處理內容。也就是，參數更新部15結束第1處理內容後，對M個學習資料x^m(x₁ ^m、x₂ ^m、...、x_I ^m)每次依序供給時，進行監督式學習，學習儲存於資料記憶部14的高斯函數的參數，也就是，有關中間層2包含的J個元件bj(j=1、...、J)的高斯函數的參數，藉此更新儲存於資料記憶部14的高斯函數的參數、以及中間層2包含的第j個元件b_j與輸出層3包含的元件c之間的權重v_j。又，參數更新部15實施監督式教學，藉此更新輸入層1包含的第i個元件a_i與中間層2包含的第j個元件b_j之間的權重W_i,j。監督式教學本體是公知技術所以省略詳細的說明，但例如使用公知的反向傳播算法(Backpropagation)，能夠實施監督式教學。另外，參數更新部15也可以更新高斯函數中的全部的參數，也可以只更新高斯函數中的一部分的參數。例如，在高斯分布的標準差σ_i,j、高斯函數的中心座標μ_i,j、權重W_i,j之中，固定高斯函數的中心座標μ_i,j，而只更新高斯分布的標準差σ_i,j及權重W_i,j的方法A。又，固定高斯分布的標準差σ_i,j，只更新高斯函數的中心座標μ_i,j及權重W_i,j的方法B、或者是固定權重W_i,j，而只更新高斯分布的標準差σ_i,j及高斯函數的中心座標μ_i,j的方法C等。

從以上可知，根據此實施型態1，元件構築部13比較從輸出值算出部12算出的中間層2包含的1個以上的元件b_j的輸出值z_j以及閾值Th，當中間層2包含的1個以上的元件b_j的輸出值z_j之中任一者的輸出值z_j比閾值Th大的話，維持中間層2包含的元件b_j的數目，當中間層2包含的1個以上的元件b_j的輸出值z_j全部在閾值Th以下的話，就增加中間層2包含的元件b_j的數目，因為這個構造，就會達成類神經網路的中間層2包含的元件b_j即使是輸出入響應以高斯函數決定的元件，也能夠自動地決定類神經網路的中間層2包含的元件b_j的數目的效果。

[實施型態2]

上述實施型態1中，說明了類神經網路具備的中間層2的數目是1的例子。在本實施型態2中，將說明了類神經網路具備的中間層2的數目是2的例子。

第7圖係顯示本發明的實施型態2的網路構築裝置適用的類神經網路的一例的說明圖。第7圖中，使用與第3圖相同符號就表示相同或相當的部分，因此省略說明。中間層2-1~2-G連接於輸入層1與輸出層3之間。第g層的中間層2-g(g=1、2、...、G)包含J(J是1以上的整數)個的元件 b_j ^g(j=1、2、...、J)，第j個元件b_j ^g是輸出入響應以高斯函數決定的元件。

第1層的中間層2-1與第3圖的中間層2同樣，當輸入層1包含的I個元件a_i的輸出值y_i=x_i ^m被供給到第j個元件b_j ¹時，從I個元件a_i的輸出值yi算出第j個元件b_j ^m的輸出值z_j ^m，將元件b_j ^m的輸出值z_j ^m輸出到第2層的中間層2-2。第g層的中間層2-g(g=2、3、...、G-1)，當第(g-1)層的中間層2-(g-1)包含的全部元件b_j ^g-1的輸出值z_j ^g-1被供給到第j個元件b_j ^g時，從全部元件b_j ^g-1的輸出值z_j ^g-1算出第j個元件b_j ^g的輸出值z_j ^g，將元件b_j ^g的輸出值z_j ^g輸出到第G層的中間層2-G。第G層的中間層2-G，當第(G-1)層的中間層2-(G-1)包含的全部元件b_j ^G-1的輸出值z_j ^G-1被供給到第j個元件b_j ^G時，從全部元件b_j ^G-1的輸出值z_j ^G-1算出第j個元件b_j ^G的輸出值z_j ^G，將元件b_j ^G的輸出值z_j ^G輸出到輸出層3。第7圖中，表示了中間層2-1~2-G包含的元件的個數全數相同數目，但藉由後述的元件構築部13的處理，中間層2-1~2-G包含的元件的個數可被決定成不同的數量也是不言而喻的。

接著說明動作。上述實施型態1中，說明了在實施監督式學習之間決定中間層2的構造的例子，但本實施型態2中，會說明在實施監督式學習之間決定中間層2-1~2-G的構造的例子。這個實施型態2中，會在中間層2-1~2-G中，從輸入層1側的中間層2-g(g=1、2、...、G)依序決定中間層2-g的構造。

第8圖係顯示網路構築裝置以軟體或韌體等來實現的情況下的處理步驟，即網路構築方法的流程圖。中間層2-1~2-G之中，最先決定輸入層1側的中間層2-1的構造的處理與決定第3圖的中間層2的構造的處理相同，因此省略說明。以下，一邊參照第8圖，一邊說明決定中間層2-g(g=2、3、...、G)的構造的處理。在這個實施型態2中，假設中間層2-g包含的元件b_j ^g的個數J的初始值是0。又，中間層2-(g-1)中包含的元件b_j ^g-1的個數J已經決定為K個，假設中間層2-(g-1)包含的第k個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1被算出。

元件構築部13在實行第1處理內容時，判定中間層2-g之中是否包含元件b_j ^g。也就是，元件構築部13判斷中間層2-g之中包含元件b_j ^g的個數J是否為0個(第8圖的步驟ST21)。

當元件構築部13判斷中間層2-g之中包含元件b_j ^g的個數J是0個時(第8圖的步驟ST21：YES的情況)，會在中間層2-g之中追加1個新的元件b_j ^g。也就是，元件構築部13會在中間層2-g中作成元件b_j ^g(第8圖的步驟ST22)。元件構築部13判斷中間層2-g之中包含元件b_j ^g的個數J不是0個時(第8圖的步驟ST21：NO的情況)，在這個階段，不進行追加新的元件b_j ^g到中間層2-g中的處理，本實施型態2中，因為中間層2-g所包含的元件b_j ^g的個數J的初始值是設定0個，因此這邊元件構築部13會作成元件b₁ ^g到中間層2-g中。

當元件構築部13作成元件b₁ ^g到中間層2-g中，M個學習資料x^m(x₁ ^m、x₂ ^m、...、x_I ^m)(m=1、...、M)已經供給到輸入層1，初期設定部11根據第M個學習資料X^M，判斷是否取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1(第8圖的步驟ST23)。初始設定部11已經根據第M個學習資料X^M取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1的話(第8圖的步驟ST23：YES的情況)，結束決定中間層2-g的構造的第1處理內容。初始設定部11還未根據第M個學習資料X^M取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1的話(第8圖的步驟ST23：NO的情況)，就去取得尚未取得的前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1(第8圖的步驟ST24)。這個實施型態2中，初期設定部11在這個階段還沒有根據第1個學習資料x¹取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1，因此會根據第1個學習資料x¹取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1。當初始設定部11根據第1個學習資料x¹取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1，會從前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1中，初始設定有關於中間層2-g包含的元件b₁ ^g的高斯函數的參數(第8圖的步驟ST25)。

也就是，做為有關中間層2-g包含的元件b₁ ^g的高斯函數的參數的一個，初始設定部11會從中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1中算出高斯分布的標準差σ_k,1 ^g(k=1、...、K)。又，做為有關於中間層2-g包含的元件b₁ ^g的高斯函數的參數的一者，初始設定部11會初始設定高斯函數的中心座標μ_k,1 ^g(k=1、...、K)。高斯函數的中心座標μ_k,1 ^g如以下式(7)，中間層2-(g-1)包含的第k個元件b_k ^g-1的輸出值z_k ^g-1。

μ_k,1 ^g=z_k ^g-1 (7)

又，做為有關於中間層2-g包含的元件b₁ ^g的高斯函數的參數的一者，初始設定部11如以下式(8)，會初始設定中間層2-(g-1)包含的第k個元件b_k ^g-1與中間層2-g包含的元件b₁ ^g之間的權重W_k,1 ^g。

W_k,1 ^g=1 (8)

在此，顯示了將權重W_k,1 ^g設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

當初始設定部11初始設定有關於中間層2-g包含的元件b₁ ^g的高斯函數的參數時，會將該參數的初始值輸出到輸出值算出部12，且會將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11取得有關於中間層2-g包含的元件b₁ ^g的高斯函數的參數的初始值。又，輸出值算出部12根據第1個學習資料x¹，取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1。

輸出值算出部12根據第1個學習資料x¹取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1時，會算出中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g(第8圖的步驟ST26)。也就是，輸出值算出部12對於以下式(9)所示的高斯函數，將關於中間值2-g包含的元件b₁ ^g的高斯函數的參數值初始值、中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1代入，藉此算出中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g。

輸出值算出部12當算出時中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g時，會將元件b₁ ^g的輸出值z₁ ^g輸出到元件構築部13，且將元件b₁ ^g的輸出值z₁ ^g儲存到資料記憶部14。

元件構築部13當接收到來自輸出值算出部12的元件b₁ ^g的輸出值z₁ ^g，會比較元件b₁ ^g的輸出值z₁ ^g與事前設定的閾值Th(第8圖的步驟ST27)。因為元件b₁ ^g的輸出值z₁ ^g最大是1，做為閾值Th，會考慮1以下的正的實數或者是e^-0.25以上1以下的實數等。

元件構築部13，在中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g比閾值Th大的情況下(第8圖的步驟ST27：NO的情況)，會維持中間層2-g包含的元件的個數J(J=1)。在中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g在閾值Th以下的情況下(第8圖的步驟ST27：YES的情況)，會追加新的元件b₂ ^g到中間層2-g，使中間層2-g包含的元件的數目增加(第8圖的步驟ST28)。在這個實施型態2中，為了說明上的方便，因為中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g在閾值Th以下，所以假設追加新的元件b₂ ^g到中間層2-g。

初始設定部11會在元件構築部13追加新的元件b₂ ^g到中間層2-g，或者是維持中間層2-g包含的元件的個數J的時候，已根據M個學習資料x^M，來判斷是否取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1(第8圖的步驟ST23)。初始設定部11在已經根據 M個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1的話(第8圖的步驟ST23：YES的情況)，會結束決定中間層2的構造的第1處理內容。初始設定部11在還沒有根據M個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1的話(第8圖的步驟ST23：NO的情況)，取得尚未取得的前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1(第8圖的步驟ST24)。在這個實施型態2中，初始設定部11在這個階段還沒有根據第2個學習資料x²取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1，因此會根據第2個學習資料x²取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1。初始設定部11在根據第2個學習資料x²取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1時，會根據第2個學習資料x²從前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1中，初始設定有關中間層2-g包含的元件b₁ ^g、b₂ ^g的高斯函數的參數(第8圖的步驟ST25)。

也就是，初期設定部11會從中間層2-(g-1)中包含的K個元件b_k ^g-1的輸出值z_k ^g-1中，算出高斯分布的標準差σ_k,j ^g(k=1、...、K：j=1、2)，來做為有關於中間層2-g的元件b₁ ^g、b₂ ^g的高斯函數的參數的一者。又，初始設定部11如以下式(10)所示，將中層2-(g-1)所包含的第k個元件b_k ^g-1的輸出值z_k ^g-1初始設定成高斯函數的中心座標μ_k,j ^g(k= 1、...、K：j=1、2)，來做為有關於中間層2-g的元件b₁ ^g、b₂ ^g的高斯函數的參數的一者。

μ_k,j ^g=z_k ^g-1 (10)

又，初始設定部11如以下式(11)所示，將中間層2-(g-1)所包含的第k個元件b_k ^g-1及中間層2-g所包含的第j個元件b_j ^g(j=1、2)之間的權重W_k,j ^g(k=1、...、K：j=1、2)做初始設定，來做為有關於中間層2-g的元件b₁ ^g、b₂ ^g的高斯函數的參數的一者。

W_k,j ^g=1 (11)

在此，顯示了將W_k,j ^g設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

初始設定部11將有關於中間層2-g包含的元件b₁ ^g、b₂ ^g的高斯函數的參數初始設定時，將該參數的初始值輸出到輸出值算出部12，且同時將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11中取得有關於中間層2-g的元件b₁ ^g、b₂ ^g的高斯函數的參數的初始值。又，輸出值算出部12根據第2個學習資料x²取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1。

輸出值算出部12當根據第2個學習資料x²取得取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1時，算出中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g及元件b₂ ^g的輸出值z₂ ^g(第8圖的步驟ST26)。也就是，輸出值算出部12對於以下式(12)所示的高斯函數，將關於中間值2-g包含的元件b₁ ^g的高斯函數的參數值初始值、中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1代入，藉此算出中間層2-g包含的元件b₁ ^g的輸出值z₁ ^g。有關中間值2-g包含的元件b₁ ^g的高斯函數的參數的初始值是高斯分布的標準差σ_k,1 ^g(k=1、...、K)、高斯函數的中心座標μ_k,1 ^g(k=1、...、K)、W_k,1 ^g(k=1、...、K)。又，輸出值算出部12對於以下式(12)所示的高斯函數，將關於中間值2-g包含的元件b₂ ^g的高斯函數的參數值初始值、中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1代入，藉此算出中間層2-g包含的元件b₂ ^g的輸出值z₂ ^g。有關中間值2-g包含的元件b₂ ^g的高斯函數的參數的初始值是高斯分布的標準差σ_k,2 ^g(k=1、...、K)、高斯函數的中心座標μ_k,2 ^g(k=1、...、K)、W_k,2 ^g(k=1、...、K)。

在此，式(12)中，j=1、2。輸出值算出部12將有關於中間層2-g的元件b₁ ^g的輸出值z₁ ^g及元件b₂ ^g的輸出值z₂ ^g算出時，將元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g輸出到元件構築部13，且同時將元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g儲存到資料記憶部14。

元件構築部13接受到來自輸出值算出部12的元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g時，比較元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g與閾值Th(第8圖的步驟ST27)。元件構築部13，在中間層2-g包含的元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g之中任一者比閾值Th大的情況下(第8圖的步驟ST27：NO的情況)，會維持中間層2-g包含的元件的個數J(J=2)。元件構築部13，在中間層2-g包含的元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g全部都在閾值Th以下的情況下(第8圖的步驟ST27：YES的情況)，會追加新的元件b₃ ^g到中間層2-g，使中間層2-g包含的元件的數目增加(第8圖的步驟ST28)。在這個實施型態2中，為了說明上的方便，因為中間層2-g包含的元件b₁ ^g、b₂ ^g的輸出值z₁ ^g、z₂ ^g全部都閾值Th以下，所以假設追加新的元件b₃ ^g到中間層2。

以後，假設中間層2-g包含的元件的現在個數是J個(J≧3)來說明。初始設定部11會在元件構築部13追加新的元件到中間層2-g，或者是維持中間層2-g包含的元件的個數J的時候，判定是否已經根據M個學習資料x^M，取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1(第8圖的步驟ST23)。初始設定部11已經根據M個學習資料x^M，取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1的話(第8圖的步驟ST23：YES的情況)，會結束決定中間層2的構造的第1處理內容。初始設定部11還沒有根據M個學習資料x^M，取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1的話(第8圖的步驟ST23：NO的情況)，取得尚未取得的前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1(第8圖的步驟ST24)。這個實施型態2中，假設初期設定部11在這個階段還沒有根據M個學習資料中第m個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1，因此會根據第m個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1。當初始設定部11根據第m個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1，會根據第m個學習資料x^m從前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1中，初始設定有關於中間層2-g包含的元件b₁ ^g~b_J ^g的高斯函數的參數(第8圖的步驟ST25)。

也就是，做為有關中間層2-g包含的元件b₁ ^g~b_J ^g的高斯函數的參數的一個，初始設定部11會從中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1中算出高斯分布的標準差σ_k,j ^g(k=1、...、K：J：j=1、...、J)。又，做為有關於中間層2-g包含的元件b₁ ^g~b_J ^g的高斯函數的參數的一者，初始設定部11會如式(10)所示，將中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1初始設定成高斯函數的中心座標μ_k,j ^g(k=1、...、K：j=1、...、J)。又，做為有關於中間層2-g包含的元件b₁ ^g~b_J ^g的高斯函數的參數的一者，初始設定部11如以下式(11)，會初始設定中間層2-(g-1)包含的第k個元件b_k ^g-1與中間層2-g包含的第j個元件b_j ^g(j=1、...、J)之間的權重W_k,j ^g(k=1、...、K：J：j=1、...、J)。在此，顯示了將權重W_k,j ^g設定為1的例子，但這只是一個例子，也可以設定成1以外的值。

當初始設定部11初始設定有關於中間層2-g包含的元件b₁ ^g~b_J ^g的高斯函數的參數時，會將該參數的初始值輸出到輸出值算出部12，且會將該參數的初始值儲存到資料記憶部14。

輸出值算出部12從初始設定部11取得有關於中間層2包含的元件b₁ ^g~b_J ^g的高斯函數的參數的初始值。又，輸出值算出部12根據第m個學習資料x^m，取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1。

輸出值算出部12根據第m個學習資料x^m取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1時，會算出中間層2-g包含的元件b₁ ^g~b_J ^g的輸出值z₁ ^g~z_J ^g(第8圖的步驟ST26)。也就是，輸出值算出部12對於以式(12)所示的高斯函數，將關於中間值2-g包含的元件b_j ^g(j=1、...、J)的高斯函數的參數值初始值、中間層2-(g-1)包含的K個元件b_k ^g-1的輸出值z_k ^g-1代入，藉此算出中間層2-g包含的元件b_j ^g的輸出值z_j ^g(j=1、...、J)。關於中間值2-g包含的元件b_j ^g的高斯函數的參數值初始值是高斯分布的標準差σ_k,j ^g(k=1、...、K：j=1、...、J)、高斯函數的中心座標μ_k,j ^g(k=1、...、K：j=1、...、J)、權重W_k,j ^g(k=1、...、K：j=1、...、J)。

輸出值算出部12當算出中間層2-g包含的元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g時，會將元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g輸出到元件構築部13，且將元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g儲存到資料記憶部14。

元件構築部13當接收到來自輸出值算出部12的元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g，會比較元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g與事前設定的閾值Th(第8圖的步驟ST27)。元件構築部13，在中間層2-g包含的元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g之中任一者比閾值Th大的情況下(第8圖的步驟ST27：NO 的情況)，會維持中間層2-g包含的元件的個數J。元件構築部13，在中間層2-g包含的元件b₁ ^g~b_j ^g的輸出值z₁ ^g~z_j ^g全部都在閾值Th以下的情況下(第8圖的步驟ST27：YES的情況)，會追加新的元件到中間層2-g，使中間層2-g包含的元件的數目增加(第8圖的步驟ST28)。步驟ST23~ST28的處理會反覆地實施，直到根據M個學習資料X^m(m=1、...、M)取得前一層的中間層2-(g-1)包含的K個元件b_k ^g-1(k=1、...、K)的輸出值z_k ^g-1為止，當步驟ST23的判定處理中判定為「YES」時。第1處理內容結束。

參數更新部15結束第1處理內容後，實施第2處理內容。也就是，參數更新部15在中間層2-1~2-G的構造決定後，對M個學習資料x^m=(x₁ ^m、x₂ ^m、...、x_I ^m)每次依序供給時，進行與上述實施型態1相同的監督式學習，一邊更新有關儲存於資料記憶部14的高斯函數的參數，且同時學習有關中間層2-1~2-G包含的元件的高斯函數的參數，藉此更新中間層2-G包含的第j個元件b_j ^g、以及輸出層3包含的元件c之間的權重v_j。又，參數更新部15實施監督式教學，藉此更新輸入層1包含的第i個元件a_i與中間層2-1包含的第j個元件b_j ¹之間的權重W_i,j ¹、中間層2-(g-1)包含的第k個元件b_k ^g-1(k=1、...、K)與中間層2-g包含的第j個元件b_j ^g(j=1、...、J)之間的權重W_k,j ^g。也就是，藉由進行監督式教學，學習關於中間層2-1~2-G的元件的高斯函數的參數，來更新儲存於資料記憶部14的高斯函數的參數及權重。

從以上可知，根據此實施型態2，能夠達成即使類神經網路具備2層以上的中間層2-g的情況下，也能夠自動地決定類神經網路的中間層2-g包含的元件b_j ^g的數目的效果。

[實施型態3]

上述實施型態2中，說明了類神經網路具備的中間層2-g的層數固定在G的例子。本實施型態3中，會說明類神經網路具備的中間層2-g的層數會適當地決定的例子。

第9圖係顯示本發明的實施型態3的網路構築裝置的架構圖。第10圖係本發明實施型態3的網路構築裝置的硬體架構圖。第9圖及第10圖中，與第1圖及第2圖相同的符號表示相同或相當的部分，因此省略說明。層數決定部16例如以第10圖的層數決定電路26來實現，用來實施決定類神經網路所具備的中間層2-g的層數G的處理。

第9圖中，網路構築裝置的構成要素，初始設定部11、輸出值算出部12、元件構築部13、資料記憶部14、參數更新部15及層數決定部16分別假設以第10圖所示的專用硬體，亦即初始設定電路21、輸出值算出電路22、元件構築電路23、資料記憶電路24、參數更新電路25及層數決定電路26來實現。在此，資料記憶電路24例如RAM、ROM、快閃記憶體、EPROM、EEPROM等的非揮發性或揮發性的半導體記憶體、磁碟片、可撓性碟片、光碟、CD、MD、DVD等。又，又，初始設定電路21、輸出值算出電路22、元件構築電路23及參數更新電路25及層數決定電路26例如是單一電路、複合電路、程式化的處理器、平行程式化的處理器、ASIC、FPGA、或者是它們的組合。

然而，網路構築裝置的構成要素並不限定於以專用硬體來實現，網路構築裝置也可以用軟體、韌體、或者是軟體及韌體的組合來實現。網路構築裝置以軟體或韌體等實現的情況下，資料記憶部14構成於第4圖所示的電腦的記憶體31上，且用來讓電腦執行初始設定部11、輸出值算出部12、元件構築部13、參數更新部15及層數決定部16的處理步驟的程式會存在記憶體31，讓第4圖所示電腦的處理器32執行儲存於記憶體31中的程式即可。

又，第10圖中，顯示了網路構築裝置的構成要素分別以專用的硬體實現的例子，第4圖中，顯示了網路構築裝置以軟體或韌體等實現的例子，但也可以是網路構築裝置中的一部分的構成要素是以專用的硬體實現，剩下的構成要素是以軟體或韌體等實現。

接著說明動作。除了安裝了層數決定部16這點以外，都與上述實施型態2相同，因此在此說明層數決定部16的處理內容。當初始決定部11、輸出值算出部12及元件構築部13使用與上述實施型態2相同的方法解決1個中間層2-g的構造時，層數決定部16每一次都會將構造決定的中間層2-g連接到輸入層1與輸出層3之間。例如，在3層的中間層2-1~2-3的構造結束完成的階段，就將3層的中間層2-1~2-3連接到輸入層1與輸出層3之間。又，在4層的中間層2-1~2-4的構造結束完成的階段，就將4層的中間層2-1~2-4連接到輸入層1與輸出層3之間。

層數決定部16將新決定出構造的中間層2-g連接到輸入層1與輸出層3之間時，將任意資料供給到輸入層1。然後，層數決定部16會將從資料供給到輸入層1開始到從輸出層3輸出資料為止的時間，當作是類神經網路的資料輸出入時間Ta來量測。

Ta=T_OUT-T_IN (13)

在式(13)中，T_IN是資料輸入到輸入層1的時刻，T_OUT是資料從輸出層3輸出的時刻。

當層數決定部16量測類神經網路的資料的輸出入時間Ta時，會比較該輸出入時間Ta與輸出入時間的容許時間Tb。輸出入時間的容許時間Tb是網路構築裝置容許時間，也是事前設定的時間。層數決定部16在類神經網路的資料輸出入時間Ta比輸出入時間的容許時間Tb短的情況下，會從資料的輸入出時間Ta算出連接到輸入層1與輸出層3之間的每1層的中間層2-g的輸出入時間Ta/E。E是現在時間點連接到輸入層1與輸出層3之間的中間層2-g的層數。

層數決定部16滿足以下的式(14)的情況下，即使增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目，類神經網路的資料輸出入時間Ta在容許時間Tb以內的可能性高，因此容許增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目。藉此，初始設定部11、輸出值算出部12及元件構築部13使用與上述實施型態2相同的方法來實施決定新追加的中間層2-g的構造的處理。

Tb>Ta+Ta/E (14)

層數決定部16不滿足式(14)的情況下，當增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目，類神經網路的資料輸出入時間Ta超過容許時間Tb的可能性高，因此拒絕增加連接到輸入層1與輸出層3之間的中間層2-g的數目。藉此，在現在的時間點，連接到輸入層1與輸出層3之間的中間層2-g的數目E會被決定成類神經網路所具備的中間層2-g的層數G。

從以上可知，根據這個實施型態3，層數決定部16從類神經網路的資料輸出入時間Ta以及資料輸出入時間的容許時間Tb，決定出中間層2-g的層數G，因為這個構造，能夠達成將類神經網路的資料的輸出入時間Ta收在容許時間Tb以內的效果。

在這個實施型態3中，說明了層數決定部16量測類神經網路的資料的輸出入時間Ta，從其輸出入時間Ta與容許時間Tb中決定出中間層2的層數G的例子，但並不限定於此。例如，也可以是層數決定部16量測類神經網路的學習時間Tc，從該學習時間Tc及學習時間的容許時間Td中決定出中間層2的層數G。具體來說如以下所述。

層數決定部16將新決定構造的中間層2-g連接到輸入層1與輸出層3之間時，將學習資料供給到輸入層1，藉此讓類神經網路實施學習。然後，層數決定部16例如在供給學習資料到輸入層1之後，將資料從輸出層3輸出為止的時間當作是類神經網路的學習時間Tc量測。

Tc=T_OUT-T_IN (15)

在式(15)中，T_IN是學習資料輸入到輸入層1的時刻，T_OUT是資料從輸出層3輸出的時刻。

當層數決定部16量測類神經網路的學習時間Tc時，會比較該學習時間Tc與學習時間的容許時間Td。學習時間的容許時間Td是網路構築裝置容許時間，也是事前設定的時間。層數決定部16在類神經網路的學習時間Tc比學習時間的容許時間Td短的情況下，會從類神經網路的學習時間Tc算出連接到輸入層1與輸出層3之間的每1層的中間層2-g的學習時間Tc/E。E是現在時間點連接到輸入層1與輸出層3之間的中間層2-g的層數。

層數決定部16滿足以下的式(16)的情況下，即使增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目，類神經網路的學習時間Tc在容許時間Td以內的可能性高，因此容許增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目。藉此，初始設定部11、輸出值算出部12及元件構築部13使用與上述實施型態2相同的方法來實施決定新追加的中間層2-g的構造的處理。

Td>Tc+Tc/E (16)

層數決定部16不滿足式(16)的情況下，當增加1個連接到輸入層1與輸出層3之間的中間層2-g的數目，類神經網路的學習時間Tc超過容許時間Td的可能性高，因此拒絕增加連接到輸入層1與輸出層3之間的中間層2-g的數目。藉此，在現在的時間點，連接到輸入層1與輸出層3之間的中間層2-g的數目E會被決定成類神經網路所具備的中間層2-g的層數G。層數決定部16量測類神經網路的學習時間Tc，並從該學習時間Tc以及容許時間Td中決定出中間層2的層數G的情況下，能夠達成將類神經網路的資料的學習時間Tc收在容許時間Td以內的效果。

另外，本發明在這個發明的範圍內，各實施型態的自由組合、或者是各實施型態的任意的構成要素的變形、或者是各實施型態中任意的構造要素的省略是可能的。

本發明適用於構築類神經網路的網路構築裝置及網路構築方法。

Claims

一種網路構築裝置，包括：輸出值算出部，在構築具備中間層的類神經網路時，根據該類神經網路的輸入層包含的元件的輸出值，算出該中間層包含的1個以上的元件的輸出值，其中該中間層包括輸出入響應是以高斯函數學定的元件；以及元件構築部，實施元件構築處理，比較該輸出值算出部算出的1個以上的元件的輸出值與閾值，當該中間層包含的1個以上的元件的輸出值之中的任一個元件的輸出值比該閾值大的話，維持該中間層包含的元件的數目，當該中間層包含的1個以上的元件的輸出值全部都在該閾值以下的話，增加該中間層包含的元件的數目。
如申請專利範圍第1項所述之網路構築裝置，更包括：初始設定部，對於該中間層包含的每個元件，初始設定關於該元件的高斯函數的參數，其中該輸出值算出部對於具有被該初始設定部初始設定的函數的高斯函數，代入該輸入層包含的元件的輸出值，藉此算出該中間層包含的元件的輸出值。
如申請專利範圍第2項所述之網路構築裝置，更包括：參數更新部，該元件構築部實施元件構築處理後，在學習資料供給到該輸入層時實施監督式學習來學習該高斯函數的參數，藉此更新該高斯函數的參數，且同時更新該中間層包含的元件與輸出層包含的元件之間的權重。
如申請專利範圍第3項所述之網路構築裝置，其中該參數更新部實施該監督式學習，藉此更新該輸入層包含的元件與中間層包含的元件之間的權重。
如申請專利範圍第2項所述之網路構築裝置，其中該輸出值算出部會使用對於該中間層包含的各個元件的該高斯函數下的高斯分布的標準差，來做為該高斯函數的參數之一。
如申請專利範圍第5項所述之網路構築裝置，其中該輸出值算出部會使用該輸入層包含的複數的元件的輸出值的標準差，來做為對於該中間層包含的各個元件的該高斯分布的標準差。
如申請專利範圍第5項所述之網路構築裝置，其中該輸出值算出部會使用正的實數，來做為對於該中間層包含的各個元件的該高斯分布的標準差。
如申請專利範圍第1項所述之網路構築裝置，其中該元件構築部會使用1以下的正的實數來做為該閾值。
如申請專利範圍第1項所述之網路構築裝置，其中該元件構築部會使用e^-0.25以上1以下的正的實數來做為該閾值。
如申請專利範圍第3項所述之網路構築裝置，其中該參數更新部會在顯示該高斯函數的高斯分布的標準差的參數、顯示該高斯函數的中心座標的參數之中，更新任一個以上的參數，來做為該高斯函數的參數。
如申請專利範圍第1項所述之網路構築裝置，其中：該類神經網路具備G(G是2以上的整數)層的中間層，該G層的中間層串聯連接到該輸入層與輸出層之間，該輸出值算出部在該輸入層包含的元件的輸出值供給到第 1層的中間層包含的1個以上的元件時，根據該輸入層包含的元件的輸出值來算出第1層的中間層包含的1個以上的元件的輸出值，又在第(g-1)層(g=2、...、G)的中間層包含的元件的輸出值供給到第g層(g=2、...、G)的中間層包含的1個以上的元件時，根據該第(g-1)層(g=2、...、G)的中間層包含的元件的輸出值來算出第g層(g=2、...、G)的中間層包含的1個以上的元件的輸出值該元件構築部實施元件構築處理，比較該輸出值算出部算出的第g層(g=1、...、G)的中間層包含的1個以上的元件輸出值與該閾值，當第g層(g=1、...、G)的中間層包含的1個以上的元件輸出值之中任一元件的輸出值比該閾值大時，維持第g層(g=1、...、G)的中間層包含的元件的數目，當第g層(g=1、...、G)的中間層包含的1個以上的元件輸出值全部在該閾值以下時，增加第g層(g=1、...、G)的中間層包含的元件的數目。
如申請專利範圍第11項所述之網路構築裝置，更包括：參數更新部，該元件構築部實施元件構築處理後，在學習資料供給到該輸入層時實施監督式學習來學習有關G(G是2以上的整數)層的中間層包含的元件的高斯函數的參數，藉此更新該高斯函數的參數，且同時更新該G層的中間層包含的元件與輸出層包含的元件之間的權重。
如申請專利範圍第12項所述之網路構築裝置，其中該參數更新部實施該監督式學習，藉此更新第(g-1)層(g=2、...、G)的中間層包含的元件與第g層(g=2、...、G)的中間層包含的元件之間的權重。
如申請專利範圍第12項所述之網路構築裝置，其中該參數更新部實施該監督式學習，藉此更新該輸入部包含的元件與第1層的中間層包含的元件之間的權重。
如申請專利範圍第11項所述之網路構築裝置，更包括：層數決定部，決定該類神經網路具備的中間層的層數。
如申請專利範圍第15項所述之網路構築裝置，其中該層數決定部從該類神經網路的資料輸出入時間與該輸出入時間的容許時間，決定出該中間層的層數。
如申請專利範圍第15項所述之網路構築裝置，其中該層數決定部從該類神經網路的學習時間與該學習時間的容許時間，決定出該中間層的層數。
一種網路構築方法，包括：利用輸出值算出部在構築具備中間層的類神經網路時，根據該類神經網路的輸入層包含的元件的輸出值，算出該中間層包含的1個以上的元件的輸出值，其中該中間層包括輸出入響應是以高斯函數學定的元件；以及利用元件構築部實施元件構築處理，比較該輸出值算出部算出的1個以上的元件的輸出值與閾值，當該中間層包含的1個以上的元件的輸出值之中的任一個元件的輸出值比該閾值大的話，維持該中間層包含的元件的數目，當該中間層包含的1個以上的元件的輸出值全部都在該閾值以下的話，增加該中間層包含的元件的數目。
如申請專利範圍第18項所述之網路構築方法，其中利用初始設定部對於該中間層包含的每個元件，初始設定關於該元件的高斯函數的參數，該輸出值算出部對於具有被該初始設定部初始設定的函數的高斯函數，代入該輸入層包含的元件的輸出值，藉此算出該中間層包含的元件的輸出值。
如申請專利範圍第19項所述之網路構築方法，其中利用參數更新部，在該元件構築部實施元件構築處理後，當學習資料供給到該輸入層時實施監督式學習來學習該高斯函數的參數，藉此更新該高斯函數的參數，且同時更新該中間層包含的元件與輸出層包含的元件之間的權重。