TWI719337B

TWI719337B - 基於深度學習之數位控制器的控制方法

Info

Publication number: TWI719337B
Application number: TW107128812A
Authority: TW
Inventors: 李振興
Original assignee: 崑山科技大學
Priority date: 2018-08-17
Filing date: 2018-08-17
Publication date: 2021-02-21
Also published as: TW202009616A

Abstract

本發明係有關於一種基於深度學習之數位控制器的控制方法，其主要係包括有數位控制器及受控系統，令該數位控制器與該受控系統相連結而組成自動控制系統，於該數位控制器分別設有第一運算單元、第二運算單元及第三運算單元，該第一運算單元係為狀態回授控制器與該受控系統相連接，該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e，該第三運算單元則係供分別接收該自動控制系統之輸入r與輸出y；藉此，即能以深度學習的方法調整控制器參數，且利用積分與部分狀態回授控制器為主，使得能具有學習性質的調整機制，可以廣泛的適應環境參數之改變，以達到自動控制之功效，而在其整體施行使用上更增實用功效特性者。

Description

基於深度學習之數位控制器的控制方法

本發明係有關於一種基於深度學習之數位控制器的控制方法，尤其是指一種以深度學習的方法調整控制器參數，且利用積分與部分狀態回授控制器為主，使得能具有學習性質的調整機制，可以廣泛的適應環境參數之改變，以達到自動控制之功效，而在其整體施行使用上更增實用功效特性者。

按，控制器設計是自動控制系統最為基本與重要的部分，優良的控制器可以使自動控制系統達到適用、最佳的狀態；而一般常見之各種控制器，則分別具有各式不同的方法調整控制器參數，以達到各種的控制功能。

然而，上述控制器雖可分別利用不同方法調整參數，以達到各種控制功能之預期功效，但也在其實際施行使用過程中發現，該控制器並不具有深度學習之功能，使得其在控制使用上較為有所限制，並無法廣泛的適用不同環境參數的改變，致令其在整體結構設計上仍存在有改進之空間。

緣是，發明人有鑑於此，秉持多年該相關行業之豐富設計開發及實際製作經驗，針對現有之結構及缺失再予以研究改良，提供一種基於深度學習之數位控制器的控制方法，以期達到更佳實用價值性之目的者。

本發明之主要目的在於提供一種基於深度學習之數位控制器的控制方法，主要係以深度學習的方法調整控制器參數，且利用積分與部分狀態回授控制器為主，使得能具有學習性質的調整機制，可以廣泛的適應環境參數之改變，以達到自動控制之功效，而在其整體施行使用上更增實用功效特性者。

本發明基於深度學習之數位控制器的控制方法之主要目的與功效，係由以下具體技術手段所達成：其主要係包括有數位控制器及受控系統，令該數位控制器與該受控系統相連結而組成自動控制系統；該受控系統的數學模型為：

y=G(t,x,u)，其中，x是該受控系統的動態狀態，t是時間，u是該受控系統的控制輸入，係為該數位控制器之輸出，F(.)和G(.)是數學之非線性函數，y是該受控系統的輸出，

為狀態向量x的微分，若將該受控系統局部線性化，則可得到操作點的線性方程式組如下：

y=C(t)x+D(t)u，其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數，是屬於時間的函數，該數位控制器，分別設有第一運算單元、第二運算單元及第三運算單元，該第一運算單元係為狀態回授控制器與該受控系統相連接，該狀態回授控制器增益為K，該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e，並執行積分運算，該第三運算單元係供分別接收該自動控制系統之輸入r與輸出y；輸入r與輸出y的誤差為e，e=r-y，於該第二運算單元中，K_i為積分控制器輸出回授控制參數，

為積分器∫．dt的數學拉氏轉換，於該第三運算單元中，N(r,y)為深度學習的數學函數，主要和輸入r與輸出y有關，該第三運算單元之輸出端數學方程式為

=N(r,y)，

是保持系統效能的微調量，於該第一運算單元中，K是狀態回授控制器參數，若不是系統的所有狀態都可以測量到，則可以使用部分可測量得到的狀態作為狀態回授控制，稱為部分狀態回授控制，其數學方程式為u_x=-Kx，x可以是受控系統的動態之全部狀態或部分狀態，若系統的狀態有n個，皆為可測量到，則狀態回授控制器為u_x=-[k₁…k_n][x₁…x_n]^T，T為轉置矩陣的數學符號，若系統的狀態只有m個可測量到，且m

n，則狀態回授控制器為u_x=-[k₁…k_m][x₁…x_m]^T，其中x₁…x_m為m個可以測量到的狀態，則受控系統的控制輸入u為u=

-Kx+K_i ∫ edt；藉此，使該數位控制器之控制方法係使用積分器加上部分狀態回授控制的方法，唯其控制器參數由深度類神經網路調整之，深度類神經網路的權值是由倒傳遞方法來更新。

本發明基於深度學習之數位控制器的控制方法的較佳實施例，其中，該第一運算單元之狀態回授控制器參數K與該第二運算單元之該積分控制器輸出回授控制參數K_i可使用深度學習來調整其參數值。

本發明基於深度學習之數位控制器的控制方法的較佳實施例，其中，該數位控制器需要調節的控制參數如下：[K₁，…，K_m，K_i，

]，K₁，…，K_m是部分狀態回授控制參數，K_i是該積分控制器輸出回授控制參數，

是保持系統效能的微調量。

本發明基於深度學習之數位控制器的控制方法的較佳實施例，其中，利用深度學習的方法調整該控制參數，深度學習是使用多層類神經網路作為控制方法，其中，變數符號{X _i｜i=1,2}是深度學習類神經網路的輸入節點，變數符號θ ^x是該輸入節點的偏值，變數符號{

｜h ₁=1~β}、{

｜h ₂=1~γ}各是第1層、第2層的隱藏節點，隱藏層有2層以上；變數符號

、

是該隱藏節點的偏值，變數符號{Y _j｜j=1~(m+2)}是輸出節點，該自動控制系統需要調節的控制參數為[K₁，…，K_m，K_i，

]，其中K₁，…，K_m是部分狀態回授控制參數，K_i是該積分控制器輸出回授控制參數，

是保持系統效能的微調量，其中該輸出節點代表意思如下：Y ₁=K ₁，Y ₂=K ₂，...，Y _m=K _m，Y _m+1=K _i，Y _m+2=

，該深度學習類神經網路的權值如下：令參數符號{

[i][h ₁]｜i=1,2；h ₁=1~β}是該輸入節點與該第1層隱藏節點間的權值，參數符號{

[h ₁][h ₂]｜h ₁=1~β；h ₂=1~γ}是該第1層隱藏節點與該第2層隱藏節點間的權值，參數符號 {

[h ₂][j]｜h ₂=1~γ；j=1~m+2}是該第2層隱藏節點與該輸出節點間的權值，該第1層隱藏節點與該輸入節點的關係如下：

，該netH ₁係為函數符號，而該等號左右兩式係單一純量，netH ₁[h ₁]是第1層隱藏節點

的計算值，H ₁[h ₁]=f(netH ₁[h ₁])，啟動函數f(.)使用如下的雙極S型函數，將輸出適當的縮放到值域-1到1之間，

,α

R，該第2層隱藏節點與該第1層隱藏節點的關係如下：

，該netH ₂係為函數符號，而該等號左右兩式係單一純量，netH ₂[h ₂]是第二層隱藏層節點

的計算值，H ₂[h ₂]=f(netH ₂[h ₂])，該輸出節點與該第2層隱藏節點的關係如下：

，該netY _j係為函數符號，而該等號左右兩式係單一純量，netY _j是輸出層節點Y _j的計算值， Y _j=f(netY _j)，該輸入節點X ₁連接到參考輸入信號r，該輸入節點X ₂連接到系統輸出信號y，使用倒傳遞法求每一層的權值，訓練的目的是要使誤差平方達到最小，誤差的平方為：

，該E(k)代表誤差的平方，該e(k)代表誤差，r是參考輸入，該r(k)是第k個參考輸入取樣，y是該受控系統的輸出，該y(k)是第k個系統的輸出取樣，其中誤差是e=r-y，e(k)=r(k)-y(k)是第k個誤差取樣，k是代表第k個取樣，權值用以下的方法來更新，輸入層到該第一層隱藏層為：

△為數學上的差量，該第一層隱藏層到該第二層隱藏層為：

該第二層隱藏層到輸出層為：

其中η為學習速率常數，該輸出節點、該第二層隱藏層節點與該第一層隱藏層節點的微量變動為：

因此權值的更新公式可以更改如下，x _j為狀態變數：

△θ ^x=ηδH ₁[h ₁]．x _j，學習法則可以修改為以下公式，

△θ ^x=ηδH ₁[h ₁]．x _j+λ△θ ^x，其中，動力〔momentum〕因子的範圍為0

｜λ｜

1，加上動力〔momentum〕可以使該深度學習類神經網路的學習計算時不會掉入局部最小值。

1:數位控制器

11:第一運算單元

12:第二運算單元

13:第三運算單元

2:受控系統

3:自動控制系統

第一圖：本發明之架構示意圖

第二圖：本發明之多層類神經網路架構示意圖

為令本發明所運用之技術內容、發明目的及其達成之功效有更完整且清楚的揭露，茲於下詳細說明之，並請一併參閱所揭之圖式及圖號：首先，請參閱第一圖本發明之架構示意圖所示，本發明係包括有數位控制器(1)及受控系統(2)，令該數位控制器(1)與該受控系統(2)相連結而組成自動控制系統(3)；其中：該數位控制器(1)，分別設有第一運算單元(11)、第二運算單元(12)及第三運算單元(13)，該第一運算單元(11)係為狀態回授控制器與該受控系統(2)相連接，該狀態回授控制器增益為K，該第二運算單元(12)係供接收該自動控制系統(3)之輸入r與輸出y的誤差e，並執行積分運算，該第三運算單元(13)係供分別接收該自動控制系統(3)之輸入r與輸出y。

該受控系統(2)的數學模型為：

y=G(t,x,u)， (2)其中，x是該受控系統(2)的動態狀態，t是時間，u是該受控系統(2)控制輸入，係為該數位控制器之(1)輸出，F(.)和G(.)是數學之非線性函數，y是該受控系統(2)的輸出，

為狀態向量x的微分。

若將(1)-(2)式局部線性化，則可得到操作點的線性方程式組如下：

y=C(t)x+D(t)u， (4)其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數，是屬於時間的函數。

輸入r與輸出y的誤差為e，e=r-y， (5)於該第二運算單元(12)中，K_i為積分控制器輸出回授控制參數，

為積分器∫．dt的數學拉氏轉換。

於該第三運算單元(13)中，N(r,y)為深度學習的數學函數，主要和輸入r與輸出y有關，該第三運算單元(13)之輸出端數學方程式為

於該第一運算單元(11)中，K是狀態回授控制器參數，若不是系統的所有狀態都可以測量到，則可以使用部分可測量得到的狀態作為狀態回授控制，稱為部分狀態回授控制，其數學方程式為u_x=-Kx， (7)x可以是受控系統的動態之全部狀態或是部分狀態。若系統的狀態有n個，皆為可測量到，則狀態回授控制器為u_x=-[k₁…k_n][x₁…x_n]^T， (8)T為轉置矩陣的數學符號。若系統的狀態只有m個可測量到，且m

n，則狀態回授控制器為u_x=-[k₁…k_m][x₁…x_m]^T， (9)其中x₁…x_m為m個可以測量到的狀態。

則受控系統(2)的控制輸入u為

其中狀態回授控制器參數K與積分控制器輸出回授控制參數K_i也可以使用深度學習來調整其參數值。

而該數位控制器(1)需要調節的控制參數如下：

K₁，…，K_m是部分狀態回授控制參數，K_i是積分控制器輸出回授控制參數，

是保持系統效能的微調量。

利用深度學習的方法調整(11)式的控制參數。深度學習是使用多層類神經網路作為控制方法。

請再一併參閱第二圖本發明之多層類神經網路架構示意圖所示，其中變數符號{X _i｜i=1,2}是深度學習類神經網路的輸入節點，變數符號θ ^x是輸入節點的偏值，變數符號{

｜h ₁=1~β}、{

｜h ₂=1~γ}各是第1層、第2層的隱藏節點，隱藏層有2層以上，因為深度學習需要比較多的隱藏層才會有良好的效果。變數符號

、

是隱藏節點的偏值，變數符號{Y _j｜j=1~(m+2)}是輸出節點。自動控制系統(3)需要調節的控制參數為[K₁，…，K_m，K_i，

]，其中K₁，…，K_m是部分狀態回授控制參數，K_i是積分控制器輸出回授控制參數，

是保持系統效能的微調量，其中輸出節點代表意思如下：Y ₁=K ₁，Y ₂=K ₂，...，Y _m=K _m，Y _m+1=K _i，Y _m+2=

。

深度學習類神經網路的權值如下：令參數符號{

[i][h ₁]｜i=1,2；h ₁=1~β}是輸入節點與第1層隱藏節點間的權值，參數符號{

[h ₁][h ₂]｜h ₁=1~β；h ₂=1~γ}是第1層隱藏節點與第2層隱藏節點間的權值，參數符號{

[h ₂][j]｜h ₂=1~γ；j=1~m+2}是第2層隱藏節點與輸出節點間的權值。

第1層隱藏節點與輸入節點的關係如下：

於上述(12)式中，該netH ₁係為函數符號，而該等號左右兩式係單一純量，netH ₁[h ₁]是第1層隱藏節點

的計算值，H ₁[h ₁]=f(netH ₁[h ₁])， (13)啟動函數f(.)使用如下的雙極S型函數，將輸出適當的縮放到值域-1到1之間，

第2層隱藏節點與第1層隱藏節點的關係如下：

於上述(15)式中，該netH ₂係為函數符號，而該等號左右兩式係單一純量，netH ₂[h ₂]是第二層隱藏層節點

的計算值，H ₂[h ₂]=f(netH ₂[h ₂])， (16)輸出節點與第2層隱藏節點的關係如下：

於上述(17)式中，該netY _j係為函數符號，而該等號左右兩式係單一純量，netY _j是輸出層節點Y _j的計算值，Y _j=f(netY _j)， (18)輸入節點X ₁連接到參考輸入信號r，輸入節點X ₂連接到系統輸出信號y，使用倒傳遞法求每一層的權值。

訓練的目的是要使誤差平方達到最小，誤差的平方為：

於上述(19)式中，該E(k)代表誤差的平方，該e(k)代表誤差，r是參考輸入，該r(k)是第k個參考輸入取樣，y是該受控系統的輸出，該y(k)是第k個系統的輸出取樣，其中誤差是e=r-y，e(k)=r(k)-y(k)是第k個誤差取樣，k是代表第k個取樣，權值用以下的方法來更新，輸入層到第一層隱藏層為：

△為數學上的差量，第一層隱藏層到第二層隱藏層為：

第二層隱藏層到輸出層為：

其中η為學習速率常數。偏微分

及

的計算如下。

其中

在實用上，偏微分

可以用

來近似，其中△y=y(u+△u)-y(u)且△u=u(k)-u(k-1)。因此偏微分

及

可以改寫如下：

輸出節點、第二層隱藏層節點與第一層隱藏層節點的微量變動為：其中

因此權值的更新公式可以更改如下，x _j為狀態變數：

△θ ^x=ηδH ₁[h ₁]．x _j，學習法則可以修改為以下公式，

｜λ｜

1。加上動力〔momentum〕可以使類神經網路的學習計算時不會掉入局部最小值。

如此一來，即可使該數位控制器(1)之參數調整達到深度學習的模式，進而具有自動控制的目的，控制方法係使用積分器加上部分狀態回授控制的方法，唯其控制器參數由深度類神經網路調整之，深度類神經網路的權值是由倒傳遞方法來更新，是監督式學習。

藉由以上所述，本發明之使用實施說明可知，本發明與現有技術手段相較之下，本發明主要係以深度學習的方法調整控制器參數，且利用積分與部分狀態回授控制器為主，使得能具有學習性質的調整機制，可以廣泛的適應環境參數之改變，以達到自動控制之功效，而在其整體施行使用上更增實用功效特性者。

然而前述之實施例或圖式並非限定本發明之產品結構或使用方式，任何所屬技術領域中具有通常知識者之適當變化或修飾，皆應視為不脫離本發明之專利範疇。

綜上所述，本發明實施例確能達到所預期之使用功效，又其所揭露之具體構造，不僅未曾見諸於同類產品中，亦未曾公開於申請前，誠已完全符合專利法之規定與要求，爰依法提出發明專利之申請，懇請惠予審查，並賜准專利，則實感德便。