TWI719337B - 基於深度學習之數位控制器的控制方法 - Google Patents

基於深度學習之數位控制器的控制方法 Download PDF

Info

Publication number
TWI719337B
TWI719337B TW107128812A TW107128812A TWI719337B TW I719337 B TWI719337 B TW I719337B TW 107128812 A TW107128812 A TW 107128812A TW 107128812 A TW107128812 A TW 107128812A TW I719337 B TWI719337 B TW I719337B
Authority
TW
Taiwan
Prior art keywords
output
node
layer
arithmetic unit
hidden
Prior art date
Application number
TW107128812A
Other languages
English (en)
Other versions
TW202009616A (zh
Inventor
李振興
Original Assignee
崑山科技大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 崑山科技大學 filed Critical 崑山科技大學
Priority to TW107128812A priority Critical patent/TWI719337B/zh
Publication of TW202009616A publication Critical patent/TW202009616A/zh
Application granted granted Critical
Publication of TWI719337B publication Critical patent/TWI719337B/zh

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

本發明係有關於一種基於深度學習之數位控制器的控制方法,其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統,於該數位控制器分別設有第一運算單元、第二運算單元及第三運算單元,該第一運算單元係為狀態回授控制器與該受控系統相連接,該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e,該第三運算單元則係供分別接收該自動控制系統之輸入r與輸出y;藉此,即能以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。

Description

基於深度學習之數位控制器的控制方法
本發明係有關於一種基於深度學習之數位控制器的控制方法,尤其是指一種以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
按,控制器設計是自動控制系統最為基本與重要的部分,優良的控制器可以使自動控制系統達到適用、最佳的狀態;而一般常見之各種控制器,則分別具有各式不同的方法調整控制器參數,以達到各種的控制功能。
然而,上述控制器雖可分別利用不同方法調整參數,以達到各種控制功能之預期功效,但也在其實際施行使用過程中發現,該控制器並不具有深度學習之功能,使得其在控制使用上較為有所限 制,並無法廣泛的適用不同環境參數的改變,致令其在整體結構設計上仍存在有改進之空間。
緣是,發明人有鑑於此,秉持多年該相關行業之豐富設計開發及實際製作經驗,針對現有之結構及缺失再予以研究改良,提供一種基於深度學習之數位控制器的控制方法,以期達到更佳實用價值性之目的者。
本發明之主要目的在於提供一種基於深度學習之數位控制器的控制方法,主要係以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
本發明基於深度學習之數位控制器的控制方法之主要目的與功效,係由以下具體技術手段所達成:其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統;該受控系統的數學模型為:
Figure 107128812-A0305-02-0005-157
y=G(t,x,u),其中,x是該受控系統的動態狀態,t是時間,u是該受控系 統的控制輸入,係為該數位控制器之輸出,F(.)和G(.)是數學之非線性函數,y是該受控系統的輸出,
Figure 107128812-A0305-02-0006-74
為狀態向量x的微分,若將該受控系統局部線性化,則可得到操作點的線性方程式組如下:
Figure 107128812-A0305-02-0006-158
y=C(t)x+D(t)u,其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數,是屬於時間的函數,該數位控制器,分別設有第一運算單元、第二運算單元及第三運算單元,該第一運算單元係為狀態回授控制器與該受控系統相連接,該狀態回授控制器增益為K,該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e,並執行積分運算,該第三運算單元係供分別接收該自動控制系統之輸入r與輸出y;輸入r與輸出y的誤差為e,e=r-y,於該第二運算單元中,Ki為積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0006-76
為積分器.dt的數學拉氏轉換,於該第三運算單元中,N(r,y)為深度學習的數學函數,主要和輸入r與輸出y有關,該第三運算單元之輸出端數學方程式為
Figure 107128812-A0305-02-0006-77
=N(r,y),
Figure 107128812-A0305-02-0006-78
是保持系統效能的微調量, 於該第一運算單元中,K是狀態回授控制器參數,若不是系統的所有狀態都可以測量到,則可以使用部分可測量得到的狀態作為狀態回授控制,稱為部分狀態回授控制,其數學方程式為ux=-Kx,x可以是受控系統的動態之全部狀態或部分狀態,若系統的狀態有n個,皆為可測量到,則狀態回授控制器為ux=-[k1…kn][x1…xn]T,T為轉置矩陣的數學符號,若系統的狀態只有m個可測量到,且m
Figure 107128812-A0305-02-0007-79
n,則狀態回授控制器為ux=-[k1…km][x1…xm]T,其中x1…xm為m個可以測量到的狀態,則受控系統的控制輸入u為u=
Figure 107128812-A0305-02-0007-80
-Kx+Ki edt;藉此,使該數位控制器之控制方法係使用積分器加上部分狀態回授控制的方法,唯其控制器參數由深度類神經網路調整之,深度類神經網路的權值是由倒傳遞方法來更新。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,該第一運算單元之狀態回授控制器參數K與該第二運算單元之該積分控制器輸出回授控制參數Ki可使用深度學習來調整其參數值。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,該數位控制器需要調節的控制參數如下:[K1,…,Km,Ki
Figure 107128812-A0305-02-0008-81
],K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0008-82
是保持系統效能的微調量。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,利用深度學習的方法調整該控制參數,深度學習是使用多層類神經網路作為控制方法,其中,變數符號{X i i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是該輸入節點的偏值,變數符號{
Figure 107128812-A0305-02-0008-83
h 1=1~β}、{
Figure 107128812-A0305-02-0008-84
h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上;變數符號
Figure 107128812-A0305-02-0008-85
Figure 107128812-A0305-02-0008-86
是該隱藏節點的偏值,變數符號{Y j j=1~(m+2)}是輸出節點,該自動控制系統需要調節的控制參數為[K1,…,Km,Ki
Figure 107128812-A0305-02-0008-87
],其中K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0008-88
是保持系統效能的微調量,其中該輸出節點代表意思如下:Y 1=K 1Y 2=K 2,...,Y m =K m Y m+1=K i Y m+2=
Figure 107128812-A0305-02-0008-89
,該深度學習類神經網路的權值如下:令參數符號{
Figure 107128812-A0305-02-0008-90
[i][h 1]|i=1,2;h 1=1~β}是該輸入節點與該第1層隱藏節點間的權值,參數符號{
Figure 107128812-A0305-02-0008-93
[h 1][h 2]|h 1=1~βh 2=1~γ}是該第1層隱藏節點與該第2層隱藏節點間的權值,參數符號 {
Figure 107128812-A0305-02-0009-95
[h 2][j]|h 2=1~γj=1~m+2}是該第2層隱藏節點與該輸出節點間的權值,該第1層隱藏節點與該輸入節點的關係如下:
Figure 107128812-A0305-02-0009-1
,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是第1層隱藏節點
Figure 107128812-A0305-02-0009-96
的計算值,H 1[h 1]=f(netH 1[h 1]),啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,
Figure 107128812-A0305-02-0009-2
,α
Figure 107128812-A0305-02-0009-97
R,該第2層隱藏節點與該第1層隱藏節點的關係如下:
Figure 107128812-A0305-02-0009-3
,該netH 2係為函數符號,而該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點
Figure 107128812-A0305-02-0009-98
的計算值,H 2[h 2]=f(netH 2[h 2]),該輸出節點與該第2層隱藏節點的關係如下:
Figure 107128812-A0305-02-0009-4
,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值, Y j =f(netY j ),該輸入節點X 1連接到參考輸入信號r,該輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值,訓練的目的是要使誤差平方達到最小,誤差的平方為:
Figure 107128812-A0305-02-0010-5
,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-ye(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到該第一層隱藏層為:
Figure 107128812-A0305-02-0010-7
△為數學上的差量,該第一層隱藏層到該第二層隱藏層為:
Figure 107128812-A0305-02-0010-8
該第二層隱藏層到輸出層為:
Figure 107128812-A0305-02-0010-9
其中η為學習速率常數,該輸出節點、該第二層隱藏層節點與該第一層隱藏層節點的微量變動為:
Figure 107128812-A0305-02-0011-10
因此權值的更新公式可以更改如下,x j 為狀態變數:
Figure 107128812-A0305-02-0011-13
θ x =ηδH 1[h 1].x j ,學習法則可以修改為以下公式,
Figure 107128812-A0305-02-0011-14
Figure 107128812-A0305-02-0012-15
θ x =ηδH 1[h 1].x j +λθ x ,其中,動力〔momentum〕因子的範圍為0
Figure 107128812-A0305-02-0012-99
λ
Figure 107128812-A0305-02-0012-100
1,加上動力〔momentum〕可以使該深度學習類神經網路的學習計算時不會掉入局部最小值。
1:數位控制器
11:第一運算單元
12:第二運算單元
13:第三運算單元
2:受控系統
3:自動控制系統
第一圖:本發明之架構示意圖
第二圖:本發明之多層類神經網路架構示意圖
為令本發明所運用之技術內容、發明目的及其達成之功效有更完整且清楚的揭露,茲於下詳細說明之,並請一併參閱所揭之圖式及圖號:首先,請參閱第一圖本發明之架構示意圖所示,本發明係包括有數位控制器(1)及受控系統(2),令該數位控制器(1)與該受控系統(2)相連結而組成自動控制系統(3);其中:該數位控制器(1),分別設有第一運算單元(11)、第二運算單元(12)及第三運算單元(13),該第一運算單元(11)係為狀態回授控制器與該受控系統(2)相連接,該狀態回授控制器增益為K,該第二運算單元(12)係供接收該自動控制系統(3)之輸入r與輸出y的誤差e,並執行積分運算,該第三運 算單元(13)係供分別接收該自動控制系統(3)之輸入r與輸出y。
該受控系統(2)的數學模型為:
Figure 107128812-A0305-02-0013-159
y=G(t,x,u), (2)其中,x是該受控系統(2)的動態狀態,t是時間,u是該受控系統(2)控制輸入,係為該數位控制器之(1)輸出,F(.)和G(.)是數學之非線性函數,y是該受控系統(2)的輸出,
Figure 107128812-A0305-02-0013-104
為狀態向量x的微分。
若將(1)-(2)式局部線性化,則可得到操作點的線性方程式組如下:
Figure 107128812-A0305-02-0013-160
y=C(t)x+D(t)u, (4)其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數,是屬於時間的函數。
輸入r與輸出y的誤差為e,e=r-y, (5)於該第二運算單元(12)中,Ki為積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0013-17
為積分器.dt的數學拉氏轉換。
於該第三運算單元(13)中,N(r,y)為深度學習的數學函數,主要和輸入r與輸出y有關,該第三運算單元(13)之輸出端數學方程式為
Figure 107128812-A0305-02-0014-161
於該第一運算單元(11)中,K是狀態回授控制器參數,若不是系統的所有狀態都可以測量到,則可以使用部分可測量得到的狀態作為狀態回授控制,稱為部分狀態回授控制,其數學方程式為ux=-Kx, (7)x可以是受控系統的動態之全部狀態或是部分狀態。若系統的狀態有n個,皆為可測量到,則狀態回授控制器為ux=-[k1…kn][x1…xn]T, (8)T為轉置矩陣的數學符號。若系統的狀態只有m個可測量到,且m
Figure 107128812-A0305-02-0014-108
n,則狀態回授控制器為ux=-[k1…km][x1…xm]T, (9)其中x1…xm為m個可以測量到的狀態。
則受控系統(2)的控制輸入u為
Figure 107128812-A0305-02-0014-162
其中狀態回授控制器參數K與積分控制器輸出回授控制參 數Ki也可以使用深度學習來調整其參數值。
而該數位控制器(1)需要調節的控制參數如下:
Figure 107128812-A0305-02-0015-163
K1,…,Km是部分狀態回授控制參數,Ki是積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0015-112
是保持系統效能的微調量。
利用深度學習的方法調整(11)式的控制參數。深度學習是使用多層類神經網路作為控制方法。
請再一併參閱第二圖本發明之多層類神經網路架構示意圖所示,其中變數符號{X i i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是輸入節點的偏值,變數符號{
Figure 107128812-A0305-02-0015-113
h 1=1~β}、{
Figure 107128812-A0305-02-0015-114
h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上,因為深度學習需要比較多的隱藏層才會有良好的效果。變數符號
Figure 107128812-A0305-02-0015-115
Figure 107128812-A0305-02-0015-116
是隱藏節點的偏值,變數符號{Y j j=1~(m+2)}是輸出節點。自動控制系統(3)需要調節的控制參數為[K1,…,Km,Ki
Figure 107128812-A0305-02-0015-118
],其中K1,…,Km是部分狀態回授控制參數,Ki是積分控制器輸出回授控制參數,
Figure 107128812-A0305-02-0015-119
是保持系統效能的微調量,其中輸出節點代表意思如下:Y 1=K 1Y 2=K 2,...,Y m =K m Y m+1=K i Y m+2=
Figure 107128812-A0305-02-0015-120
深度學習類神經網路的權值如下:令參數符號{
Figure 107128812-A0305-02-0015-121
[i][h 1]|i=1,2;h 1=1~β}是輸入節點與第1層隱藏 節點間的權值,參數符號{
Figure 107128812-A0305-02-0016-122
[h 1][h 2]|h 1=1~βh 2=1~γ}是第1層隱藏節點與第2層隱藏節點間的權值,參數符號{
Figure 107128812-A0305-02-0016-123
[h 2][j]|h 2=1~γj=1~m+2}是第2層隱藏節點與輸出節點間的權值。
第1層隱藏節點與輸入節點的關係如下:
Figure 107128812-A0305-02-0016-18
於上述(12)式中,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是第1層隱藏節點
Figure 107128812-A0305-02-0016-124
的計算值,H 1[h 1]=f(netH 1[h 1]), (13)啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,
Figure 107128812-A0305-02-0016-19
第2層隱藏節點與第1層隱藏節點的關係如下:
Figure 107128812-A0305-02-0016-20
於上述(15)式中,該netH 2係為函數符號,而該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點
Figure 107128812-A0305-02-0016-125
的計算值,H 2[h 2]=f(netH 2[h 2]), (16)輸出節點與第2層隱藏節點的關係如下:
Figure 107128812-A0305-02-0017-21
於上述(17)式中,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值,Y j =f(netY j ), (18)輸入節點X 1連接到參考輸入信號r,輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值。
訓練的目的是要使誤差平方達到最小,誤差的平方為:
Figure 107128812-A0305-02-0017-22
於上述(19)式中,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-ye(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到第一層隱藏層為:
Figure 107128812-A0305-02-0017-69
Figure 107128812-A0305-02-0017-70
△為數學上的差量,第一層隱藏層到第二層隱藏層為:
Figure 107128812-A0305-02-0017-24
Figure 107128812-A0305-02-0018-25
第二層隱藏層到輸出層為:
Figure 107128812-A0305-02-0018-26
Figure 107128812-A0305-02-0018-27
其中η為學習速率常數。偏微分
Figure 107128812-A0305-02-0018-30
Figure 107128812-A0305-02-0018-31
Figure 107128812-A0305-02-0018-32
的計算如下。
Figure 107128812-A0305-02-0018-33
Figure 107128812-A0305-02-0018-34
Figure 107128812-A0305-02-0018-35
Figure 107128812-A0305-02-0018-36
Figure 107128812-A0305-02-0018-37
Figure 107128812-A0305-02-0018-38
其中
Figure 107128812-A0305-02-0019-39
在實用上,偏微分
Figure 107128812-A0305-02-0019-40
可以用
Figure 107128812-A0305-02-0019-41
來近似,其中△y=y(u+△u)-y(u)且△u=u(k)-u(k-1)。因此偏微分
Figure 107128812-A0305-02-0019-42
Figure 107128812-A0305-02-0019-43
Figure 107128812-A0305-02-0019-44
可以改寫如下:
Figure 107128812-A0305-02-0019-45
Figure 107128812-A0305-02-0020-46
輸出節點、第二層隱藏層節點與第一層隱藏層節點的微量變動為:其中
Figure 107128812-A0305-02-0020-48
Figure 107128812-A0305-02-0020-49
因此權值的更新公式可以更改如下,x j 為狀態變數:
Figure 107128812-A0305-02-0020-50
θ x =ηδH 1[h 1].x j ,學習法則可以修改為以下公式,
Figure 107128812-A0305-02-0020-51
Figure 107128812-A0305-02-0021-52
θ x =ηδH 1[h 1].x j +λθ x ,其中,動力〔momentum〕因子的範圍為0
Figure 107128812-A0305-02-0021-127
λ
Figure 107128812-A0305-02-0021-128
1。加上動力〔momentum〕可以使類神經網路的學習計算時不會掉入局部最小值。
如此一來,即可使該數位控制器(1)之參數調整達到深度學習的模式,進而具有自動控制的目的,控制方法係使用積分器加上部分狀態回授控制的方法,唯其控制器參數由深度類神經網路調整之,深度類神經網路的權值是由倒傳遞方法來更新,是監督式學習。
藉由以上所述,本發明之使用實施說明可知,本發明與現有技術手段相較之下,本發明主要係以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
然而前述之實施例或圖式並非限定本發明之產品結構或使用方式,任何所屬技術領域中具有通常知識者之適當變化或修飾,皆應視為不脫離本發明之專利範疇。
綜上所述,本發明實施例確能達到所預期之使用功效,又其所揭露之具體構造,不僅未曾見諸於同類產品中,亦未曾公開於申請前,誠已完全符合專利法之規定與要求,爰依法提出發明專利之申請,懇請惠予審查,並賜准專利,則實感德便。
1:數位控制器
11:第一運算單元
12:第二運算單元
13:第三運算單元
2:受控系統
3:自動控制系統

Claims (4)

  1. 一種基於深度學習之數位控制器的控制方法,其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統;該受控系統的數學模型為:
    Figure 107128812-A0305-02-0023-164
    y=G(t,x,u),其中,x是該受控系統的動態狀態,t是時間,u是該受控系統的控制輸入,係為該數位控制器之輸出,F(.)和G(.)是數學之非線性函數,y是該受控系統的輸出,
    Figure 107128812-A0305-02-0023-132
    為狀態向量x的微分,若將該受控系統局部線性化,則可得到操作點的線性方程式組如下:
    Figure 107128812-A0305-02-0023-165
    y=C(t)x+D(t)u,其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數,是屬於時間的函數,該數位控制器,分別設有第一運算單元、第二運算單元及第三運算單元,該第一運算單元係為狀態回授控制器與該受控系統相連接,該狀態回授控制器增益為K,該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e,並執行積分運算,該第三運算單元係供分別接收該自動控制系統之輸入r 與輸出y;輸入r與輸出y的誤差為e,e=r-y,於該第二運算單元中,Ki為積分控制器輸出回授控制參數,
    Figure 107128812-A0305-02-0024-134
    為積分器.dt的數學拉氏轉換,於該第三運算單元中,N(r,y)為深度學習的數學函數,主要和輸入r與輸出y有關,該第三運算單元之輸出端數學方程式為
    Figure 107128812-A0305-02-0024-135
    =N(r,y),
    Figure 107128812-A0305-02-0024-136
    是保持系統效能的微調量,於該第一運算單元中,K是狀態回授控制器參數,若不是系統的所有狀態都可以測量到,則可以使用部分可測量得到的狀態作為狀態回授控制,稱為部分狀態回授控制,其數學方程式為ux=-Kx,x可以是受控系統的動態之全部狀態或部分狀態,若系統的狀態有n個,皆為可測量到,則狀態回授控制器為ux=-[k1…kn][x1…xn]T,T為轉置矩陣的數學符號,若系統的狀態只有m個可測量到,且m
    Figure 107128812-A0305-02-0024-137
    n,則狀態回授控制器為ux=-[k1…km][x1…xm]T,其中x1…xm為m個可以測量到的狀態,則受控系統的控制輸入u為
    Figure 107128812-A0305-02-0025-166
    藉此,使該數位控制器之控制方法係使用積分器加上部分狀態回授控制的方法,唯其控制器參數由深度類神經網路調整之,深度類神經網路的權值是由倒傳遞方法來更新。
  2. 如請求項1所述基於深度學習之數位控制器的控制方法,其中,該第一運算單元之狀態回授控制器參數K與該第二運算單元之該積分控制器輸出回授控制參數Ki可使用深度學習來調整其參數值。
  3. 如請求項1所述基於深度學習之數位控制器的控制方法,其中,該數位控制器需要調節的控制參數如下:[K1,…,Km,Ki
    Figure 107128812-A0305-02-0025-139
    ],K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,
    Figure 107128812-A0305-02-0025-140
    是保持系統效能的微調量。
  4. 如請求項3所述基於深度學習之數位控制器的控制方法,其中,利用深度學習的方法調整該控制參數,深度學習是使用多層類神經網路作為控制方法,其中,變數符號{X i i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是該輸入節點的偏值,變數符號{
    Figure 107128812-A0305-02-0025-141
    h 1=1~β}、{
    Figure 107128812-A0305-02-0025-142
    h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上;變數符號
    Figure 107128812-A0305-02-0025-143
    Figure 107128812-A0305-02-0025-144
    是該隱藏節點的偏值,變數符號{Y j j=1~(m+2)}是輸出節點,該自動控制系統需要調節的控制參數為[K1,…,Km,Ki
    Figure 107128812-A0305-02-0025-145
    ],其中 K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,
    Figure 107128812-A0305-02-0026-146
    是保持系統效能的微調量,其中該輸出節點代表意思如下:Y 1=K 1Y 2=K 2,...,Y m =K m Y m+1=K i Y m+2=
    Figure 107128812-A0305-02-0026-147
    ,該深度學習類神經網路的權值如下:令參數符號{
    Figure 107128812-A0305-02-0026-148
    [i][h 1]|i=1,2;h 1=1~β}是該輸入節點與該第1層隱藏節點間的權值,參數符號{
    Figure 107128812-A0305-02-0026-149
    [h 1][h 2]|h 1=1~βh 2=1~γ}是該第1層隱藏節點與該第2層隱藏節點間的權值,參數符號{
    Figure 107128812-A0305-02-0026-150
    [h 2][j]|h 2=1~γj=1~m+2}是該第2層隱藏節點與該輸出節點間的權值,該第1層隱藏節點與該輸入節點的關係如下:
    Figure 107128812-A0305-02-0026-53
    ,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是該第1層隱藏節點
    Figure 107128812-A0305-02-0026-151
    的計算值,H 1[h 1]=f(netH 1[h 1]),啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,
    Figure 107128812-A0305-02-0026-54
    ,α
    Figure 107128812-A0305-02-0026-152
    R,該第2層隱藏節點與該第1層隱藏節點的關係如下:
    Figure 107128812-A0305-02-0026-55
    ,該netH 2係為函數符號,而 該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點
    Figure 107128812-A0305-02-0027-153
    的計算值,H 2[h 2]=f(netH 2[h 2]),該輸出節點與該第2層隱藏節點的關係如下:
    Figure 107128812-A0305-02-0027-56
    ,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值,Y j =f(netY j ),該輸入節點X 1連接到參考輸入信號r,該輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值,訓練的目的是要使誤差平方達到最小,誤差的平方為:
    Figure 107128812-A0305-02-0027-57
    ,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-ye(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到該第一層隱藏層為:
    Figure 107128812-A0305-02-0027-58
    △為數學上的差量,該第一層隱藏層到該第二層隱藏層為:
    Figure 107128812-A0305-02-0027-59
    該第二層隱藏層到輸出層為:
    Figure 107128812-A0305-02-0028-61
    其中η為學習速率常數,該輸出節點、該第二層隱藏層節點與該第一層隱藏層節點的微量變動為:
    Figure 107128812-A0305-02-0028-62
    因此權值的更新公式可以更改如下,x j 為狀態變數:
    Figure 107128812-A0305-02-0028-63
    θ x =ηδH 1[h 1].x j ,學習法則可以修改為以下公式,
    Figure 107128812-A0305-02-0028-65
    Figure 107128812-A0305-02-0029-66
    θ x =ηδH 1[h 1].x j +λθ x ,其中,動力〔momentum〕因子的範圍為0
    Figure 107128812-A0305-02-0029-155
    λ
    Figure 107128812-A0305-02-0029-156
    1,加上動力〔momentum〕可以使該深度學習類神經網路的學習計算時不會掉入局部最小值。
TW107128812A 2018-08-17 2018-08-17 基於深度學習之數位控制器的控制方法 TWI719337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107128812A TWI719337B (zh) 2018-08-17 2018-08-17 基於深度學習之數位控制器的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107128812A TWI719337B (zh) 2018-08-17 2018-08-17 基於深度學習之數位控制器的控制方法

Publications (2)

Publication Number Publication Date
TW202009616A TW202009616A (zh) 2020-03-01
TWI719337B true TWI719337B (zh) 2021-02-21

Family

ID=70766352

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107128812A TWI719337B (zh) 2018-08-17 2018-08-17 基於深度學習之數位控制器的控制方法

Country Status (1)

Country Link
TW (1) TWI719337B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI724888B (zh) * 2020-05-05 2021-04-11 崑山科技大學 磁浮系統之深度學習比例微分控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100075287A1 (en) * 2000-10-19 2010-03-25 Bernhard Dohrmann Apparatus and method for instructional information delivery
US20150364022A1 (en) * 2014-06-13 2015-12-17 Nant Health, Llc Alarm fatigue management systems and methods
WO2016137552A1 (en) * 2015-02-24 2016-09-01 BrainofT Inc. Automatically learning and controlling connected devices
WO2017082543A1 (en) * 2015-11-10 2017-05-18 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same
TW201806807A (zh) * 2016-08-25 2018-03-01 崑山科技大學 車輛切換車道之自動控制方法
WO2018140365A1 (en) * 2017-01-24 2018-08-02 Siemens Aktiengesellschaft System and method for cognitive engineering technology for automation and control of systems

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100075287A1 (en) * 2000-10-19 2010-03-25 Bernhard Dohrmann Apparatus and method for instructional information delivery
US20150364022A1 (en) * 2014-06-13 2015-12-17 Nant Health, Llc Alarm fatigue management systems and methods
WO2016137552A1 (en) * 2015-02-24 2016-09-01 BrainofT Inc. Automatically learning and controlling connected devices
WO2017082543A1 (en) * 2015-11-10 2017-05-18 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same
TW201806807A (zh) * 2016-08-25 2018-03-01 崑山科技大學 車輛切換車道之自動控制方法
TWI620677B (zh) * 2016-08-25 2018-04-11 崑山科技大學 車輛切換車道之自動控制方法
WO2018140365A1 (en) * 2017-01-24 2018-08-02 Siemens Aktiengesellschaft System and method for cognitive engineering technology for automation and control of systems

Also Published As

Publication number Publication date
TW202009616A (zh) 2020-03-01

Similar Documents

Publication Publication Date Title
Li et al. New synchronization criteria for memristor-based networks: adaptive control and feedback control schemes
de Jesús Rubio USNFIS: uniform stable neuro fuzzy inference system
Leng et al. Dynamic behaviors of hyperbolic-type memristor-based Hopfield neural network considering synaptic crosstalk
CN102998973B (zh) 一种非线性系统的多模型自适应控制器及控制方法
EP2812855A1 (en) Methods and apparatus for spiking neural computation
WO2013119861A1 (en) Methods and apparatus for spiking neural computation
Wang et al. Finite/fixed-time synchronization of delayed memristive reaction-diffusion neural networks
CN110687781B (zh) 一种二阶非线性系统的精确不确定性和控制增益估计方法
Cai et al. Aperiodic intermittent pinning control for exponential synchronization of memristive neural networks with time-varying delays
CN109100935B (zh) 大时滞系统的阻尼智慧pi控制方法
CN108153943A (zh) 基于时钟循环神经网络的功率放大器的行为建模方法
CN106951960A (zh) 一种神经网络及该神经网络的学习方法
Wei et al. A stochastic single-species population model with partial pollution tolerance in a polluted environment
Fan et al. Adaptive neural network prescribed performance matrix projection synchronization for unknown complex dynamical networks with different dimensions
TWI719337B (zh) 基於深度學習之數位控制器的控制方法
Golbabai et al. Radial basis function networks in the numerical solution of linear integro-differential equations
Banakar et al. Local recurrent sigmoidal–wavelet neurons in feed-forward neural network for forecasting of dynamic systems: Theory
CN107276561A (zh) 基于量化核最小均方误差的Hammerstein系统辨识方法
CN114326405A (zh) 一种基于误差训练的神经网络反步控制方法
Song et al. Graph-theoretic approach to exponential synchronization of stochastic reaction–diffusion Cohen–Grossberg neural networks with time-varying delays
CN107168066A (zh) 一种温室环境自适应控制方法
JPH05197701A (ja) ニューラルネットワークを用いた情報処理装置
CN106371321A (zh) 一种焦化炉炉膛压力系统模糊网络优化pid控制方法
Patan et al. Fault-tolerant design of non-linear iterative learning control using neural networks
CN110450164A (zh) 机器人控制方法、装置、机器人及存储介质