TWI719337B - 基於深度學習之數位控制器的控制方法 - Google Patents
基於深度學習之數位控制器的控制方法 Download PDFInfo
- Publication number
- TWI719337B TWI719337B TW107128812A TW107128812A TWI719337B TW I719337 B TWI719337 B TW I719337B TW 107128812 A TW107128812 A TW 107128812A TW 107128812 A TW107128812 A TW 107128812A TW I719337 B TWI719337 B TW I719337B
- Authority
- TW
- Taiwan
- Prior art keywords
- output
- node
- layer
- arithmetic unit
- hidden
- Prior art date
Links
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
本發明係有關於一種基於深度學習之數位控制器的控制方法,其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統,於該數位控制器分別設有第一運算單元、第二運算單元及第三運算單元,該第一運算單元係為狀態回授控制器與該受控系統相連接,該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e,該第三運算單元則係供分別接收該自動控制系統之輸入r與輸出y;藉此,即能以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
Description
本發明係有關於一種基於深度學習之數位控制器的控制方法,尤其是指一種以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
按,控制器設計是自動控制系統最為基本與重要的部分,優良的控制器可以使自動控制系統達到適用、最佳的狀態;而一般常見之各種控制器,則分別具有各式不同的方法調整控制器參數,以達到各種的控制功能。
然而,上述控制器雖可分別利用不同方法調整參數,以達到各種控制功能之預期功效,但也在其實際施行使用過程中發現,該控制器並不具有深度學習之功能,使得其在控制使用上較為有所限
制,並無法廣泛的適用不同環境參數的改變,致令其在整體結構設計上仍存在有改進之空間。
緣是,發明人有鑑於此,秉持多年該相關行業之豐富設計開發及實際製作經驗,針對現有之結構及缺失再予以研究改良,提供一種基於深度學習之數位控制器的控制方法,以期達到更佳實用價值性之目的者。
本發明之主要目的在於提供一種基於深度學習之數位控制器的控制方法,主要係以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
本發明基於深度學習之數位控制器的控制方法之主要目的與功效,係由以下具體技術手段所達成:其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統;該受控系統的數學模型為:
y=G(t,x,u),其中,x是該受控系統的動態狀態,t是時間,u是該受控系
統的控制輸入,係為該數位控制器之輸出,F(.)和G(.)是數學之非線性函數,y是該受控系統的輸出,為狀態向量x的微分,若將該受控系統局部線性化,則可得到操作點的線性方程式組如下:
y=C(t)x+D(t)u,其中A(t),B(t),C(t),D(t)是線性系統的矩陣函數,是屬於時間的函數,該數位控制器,分別設有第一運算單元、第二運算單元及第三運算單元,該第一運算單元係為狀態回授控制器與該受控系統相連接,該狀態回授控制器增益為K,該第二運算單元係供接收該自動控制系統之輸入r與輸出y的誤差e,並執行積分運算,該第三運算單元係供分別接收該自動控制系統之輸入r與輸出y;輸入r與輸出y的誤差為e,e=r-y,於該第二運算單元中,Ki為積分控制器輸出回授控制參數,為積分器∫.dt的數學拉氏轉換,於該第三運算單元中,N(r,y)為深度學習的數學函數,主要和輸入r與輸出y有關,該第三運算單元之輸出端數學方程式為=N(r,y),是保持系統效能的微調量,
於該第一運算單元中,K是狀態回授控制器參數,若不是系統的所有狀態都可以測量到,則可以使用部分可測量得到的狀態作為狀態回授控制,稱為部分狀態回授控制,其數學方程式為ux=-Kx,x可以是受控系統的動態之全部狀態或部分狀態,若系統的狀態有n個,皆為可測量到,則狀態回授控制器為ux=-[k1…kn][x1…xn]T,T為轉置矩陣的數學符號,若系統的狀態只有m個可測量到,且mn,則狀態回授控制器為ux=-[k1…km][x1…xm]T,其中x1…xm為m個可以測量到的狀態,則受控系統的控制輸入u為u=-Kx+Ki ∫ edt;藉此,使該數位控制器之控制方法係使用積分器加上部分狀態回授控制的方法,唯其控制器參數由深度類神經網路調整之,深度類神經網路的權值是由倒傳遞方法來更新。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,該第一運算單元之狀態回授控制器參數K與該第二運算單元之該積分控制器輸出回授控制參數Ki可使用深度學習來調整其參數值。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,該數位控制器需要調節的控制參數如下:[K1,…,Km,Ki,],K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,是保持系統效能的微調量。
本發明基於深度學習之數位控制器的控制方法的較佳實施例,其中,利用深度學習的方法調整該控制參數,深度學習是使用多層類神經網路作為控制方法,其中,變數符號{X i |i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是該輸入節點的偏值,變數符號{|h 1=1~β}、{|h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上;變數符號、是該隱藏節點的偏值,變數符號{Y j |j=1~(m+2)}是輸出節點,該自動控制系統需要調節的控制參數為[K1,…,Km,Ki,],其中K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,是保持系統效能的微調量,其中該輸出節點代表意思如下:Y 1=K 1,Y 2=K 2,...,Y m =K m ,Y m+1=K i ,Y m+2=,該深度學習類神經網路的權值如下:令參數符號{[i][h 1]|i=1,2;h 1=1~β}是該輸入節點與該第1層隱藏節點間的權值,參數符號{[h 1][h 2]|h 1=1~β;h 2=1~γ}是該第1層隱藏節點與該第2層隱藏節點間的權值,參數符號
{[h 2][j]|h 2=1~γ;j=1~m+2}是該第2層隱藏節點與該輸出節點間的權值,該第1層隱藏節點與該輸入節點的關係如下:,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是第1層隱藏節點的計算值,H 1[h 1]=f(netH 1[h 1]),啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,,α R,該第2層隱藏節點與該第1層隱藏節點的關係如下:,該netH 2係為函數符號,而該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點的計算值,H 2[h 2]=f(netH 2[h 2]),該輸出節點與該第2層隱藏節點的關係如下:,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值,
Y j =f(netY j ),該輸入節點X 1連接到參考輸入信號r,該輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值,訓練的目的是要使誤差平方達到最小,誤差的平方為:,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-y,e(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到該第一層隱藏層為:
△為數學上的差量,該第一層隱藏層到該第二層隱藏層為:
該第二層隱藏層到輸出層為:
其中η為學習速率常數,該輸出節點、該第二層隱藏層節點與該第一層隱藏層節點的微量變動為:
因此權值的更新公式可以更改如下,x j 為狀態變數:
△θ x =ηδH 1[h 1].x j ,學習法則可以修改為以下公式,
△θ x =ηδH 1[h 1].x j +λ△θ x ,其中,動力〔momentum〕因子的範圍為0|λ|1,加上動力〔momentum〕可以使該深度學習類神經網路的學習計算時不會掉入局部最小值。
1:數位控制器
11:第一運算單元
12:第二運算單元
13:第三運算單元
2:受控系統
3:自動控制系統
第一圖:本發明之架構示意圖
第二圖:本發明之多層類神經網路架構示意圖
為令本發明所運用之技術內容、發明目的及其達成之功效有更完整且清楚的揭露,茲於下詳細說明之,並請一併參閱所揭之圖式及圖號:首先,請參閱第一圖本發明之架構示意圖所示,本發明係包括有數位控制器(1)及受控系統(2),令該數位控制器(1)與該受控系統(2)相連結而組成自動控制系統(3);其中:該數位控制器(1),分別設有第一運算單元(11)、第二運算單元(12)及第三運算單元(13),該第一運算單元(11)係為狀態回授控制器與該受控系統(2)相連接,該狀態回授控制器增益為K,該第二運算單元(12)係供接收該自動控制系統(3)之輸入r與輸出y的誤差e,並執行積分運算,該第三運
算單元(13)係供分別接收該自動控制系統(3)之輸入r與輸出y。
該受控系統(2)的數學模型為:
y=G(t,x,u), (2)其中,x是該受控系統(2)的動態狀態,t是時間,u是該受控系統(2)控制輸入,係為該數位控制器之(1)輸出,F(.)和G(.)是數學之非線性函數,y是該受控系統(2)的輸出,為狀態向量x的微分。
於該第三運算單元(13)中,N(r,y)為深度學習的數學函數,主要和輸入r與輸出y有關,該第三運算單元(13)之輸出端數學方程式為
於該第一運算單元(11)中,K是狀態回授控制器參數,若不是系統的所有狀態都可以測量到,則可以使用部分可測量得到的狀態作為狀態回授控制,稱為部分狀態回授控制,其數學方程式為ux=-Kx, (7)x可以是受控系統的動態之全部狀態或是部分狀態。若系統的狀態有n個,皆為可測量到,則狀態回授控制器為ux=-[k1…kn][x1…xn]T, (8)T為轉置矩陣的數學符號。若系統的狀態只有m個可測量到,且mn,則狀態回授控制器為ux=-[k1…km][x1…xm]T, (9)其中x1…xm為m個可以測量到的狀態。
利用深度學習的方法調整(11)式的控制參數。深度學習是使用多層類神經網路作為控制方法。
請再一併參閱第二圖本發明之多層類神經網路架構示意圖所示,其中變數符號{X i |i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是輸入節點的偏值,變數符號{|h 1=1~β}、{|h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上,因為深度學習需要比較多的隱藏層才會有良好的效果。變數符號、是隱藏節點的偏值,變數符號{Y j |j=1~(m+2)}是輸出節點。自動控制系統(3)需要調節的控制參數為[K1,…,Km,Ki,],其中K1,…,Km是部分狀態回授控制參數,Ki是積分控制器輸出回授控制參數,是保持系統效能的微調量,其中輸出節點代表意思如下:Y 1=K 1,Y 2=K 2,...,Y m =K m ,Y m+1=K i ,Y m+2=。
深度學習類神經網路的權值如下:令參數符號{[i][h 1]|i=1,2;h 1=1~β}是輸入節點與第1層隱藏
節點間的權值,參數符號{[h 1][h 2]|h 1=1~β;h 2=1~γ}是第1層隱藏節點與第2層隱藏節點間的權值,參數符號{[h 2][j]|h 2=1~γ;j=1~m+2}是第2層隱藏節點與輸出節點間的權值。
第1層隱藏節點與輸入節點的關係如下:
於上述(12)式中,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是第1層隱藏節點的計算值,H 1[h 1]=f(netH 1[h 1]), (13)啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,
第2層隱藏節點與第1層隱藏節點的關係如下:
於上述(15)式中,該netH 2係為函數符號,而該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點的計算值,H 2[h 2]=f(netH 2[h 2]), (16)輸出節點與第2層隱藏節點的關係如下:
於上述(17)式中,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值,Y j =f(netY j ), (18)輸入節點X 1連接到參考輸入信號r,輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值。
訓練的目的是要使誤差平方達到最小,誤差的平方為:
於上述(19)式中,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-y,e(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到第一層隱藏層為:
△為數學上的差量,第一層隱藏層到第二層隱藏層為:
第二層隱藏層到輸出層為:
其中η為學習速率常數。偏微分 及的計算如下。
因此權值的更新公式可以更改如下,x j 為狀態變數:
△θ x =ηδH 1[h 1].x j ,學習法則可以修改為以下公式,
△θ x =ηδH 1[h 1].x j +λ△θ x ,其中,動力〔momentum〕因子的範圍為0|λ|1。加上動力〔momentum〕可以使類神經網路的學習計算時不會掉入局部最小值。
如此一來,即可使該數位控制器(1)之參數調整達到深度學習的模式,進而具有自動控制的目的,控制方法係使用積分器加上部分狀態回授控制的方法,唯其控制器參數由深度類神經網路調整之,深度類神經網路的權值是由倒傳遞方法來更新,是監督式學習。
藉由以上所述,本發明之使用實施說明可知,本發明與現有技術手段相較之下,本發明主要係以深度學習的方法調整控制器參數,且利用積分與部分狀態回授控制器為主,使得能具有學習性質的調整機制,可以廣泛的適應環境參數之改變,以達到自動控制之功效,而在其整體施行使用上更增實用功效特性者。
然而前述之實施例或圖式並非限定本發明之產品結構或使用方式,任何所屬技術領域中具有通常知識者之適當變化或修飾,皆應視為不脫離本發明之專利範疇。
綜上所述,本發明實施例確能達到所預期之使用功效,又其所揭露之具體構造,不僅未曾見諸於同類產品中,亦未曾公開於申請前,誠已完全符合專利法之規定與要求,爰依法提出發明專利之申請,懇請惠予審查,並賜准專利,則實感德便。
1:數位控制器
11:第一運算單元
12:第二運算單元
13:第三運算單元
2:受控系統
3:自動控制系統
Claims (4)
- 一種基於深度學習之數位控制器的控制方法,其主要係包括有數位控制器及受控系統,令該數位控制器與該受控系統相連結而組成自動控制系統;該受控系統的數學模型為:
- 如請求項1所述基於深度學習之數位控制器的控制方法,其中,該第一運算單元之狀態回授控制器參數K與該第二運算單元之該積分控制器輸出回授控制參數Ki可使用深度學習來調整其參數值。
- 如請求項3所述基於深度學習之數位控制器的控制方法,其中,利用深度學習的方法調整該控制參數,深度學習是使用多層類神經網路作為控制方法,其中,變數符號{X i |i=1,2}是深度學習類神經網路的輸入節點,變數符號θ x 是該輸入節點的偏值,變數符號{|h 1=1~β}、{|h 2=1~γ}各是第1層、第2層的隱藏節點,隱藏層有2層以上;變數符號、是該隱藏節點的偏值,變數符號{Y j |j=1~(m+2)}是輸出節點,該自動控制系統需要調節的控制參數為[K1,…,Km,Ki,],其中 K1,…,Km是部分狀態回授控制參數,Ki是該積分控制器輸出回授控制參數,是保持系統效能的微調量,其中該輸出節點代表意思如下:Y 1=K 1,Y 2=K 2,...,Y m =K m ,Y m+1=K i ,Y m+2=,該深度學習類神經網路的權值如下:令參數符號{[i][h 1]|i=1,2;h 1=1~β}是該輸入節點與該第1層隱藏節點間的權值,參數符號{[h 1][h 2]|h 1=1~β;h 2=1~γ}是該第1層隱藏節點與該第2層隱藏節點間的權值,參數符號{[h 2][j]|h 2=1~γ;j=1~m+2}是該第2層隱藏節點與該輸出節點間的權值,該第1層隱藏節點與該輸入節點的關係如下:,該netH 1係為函數符號,而該等號左右兩式係單一純量,netH 1[h 1]是該第1層隱藏節點的計算值,H 1[h 1]=f(netH 1[h 1]),啟動函數f(.)使用如下的雙極S型函數,將輸出適當的縮放到值域-1到1之間,,α R,該第2層隱藏節點與該第1層隱藏節點的關係如下:,該netH 2係為函數符號,而 該等號左右兩式係單一純量,netH 2[h 2]是第二層隱藏層節點的計算值,H 2[h 2]=f(netH 2[h 2]),該輸出節點與該第2層隱藏節點的關係如下:,該netY j 係為函數符號,而該等號左右兩式係單一純量,netY j是輸出層節點Y j的計算值,Y j =f(netY j ),該輸入節點X 1連接到參考輸入信號r,該輸入節點X 2連接到系統輸出信號y,使用倒傳遞法求每一層的權值,訓練的目的是要使誤差平方達到最小,誤差的平方為:,該E(k)代表誤差的平方,該e(k)代表誤差,r是參考輸入,該r(k)是第k個參考輸入取樣,y是該受控系統的輸出,該y(k)是第k個系統的輸出取樣,其中誤差是e=r-y,e(k)=r(k)-y(k)是第k個誤差取樣,k是代表第k個取樣,權值用以下的方法來更新,輸入層到該第一層隱藏層為:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107128812A TWI719337B (zh) | 2018-08-17 | 2018-08-17 | 基於深度學習之數位控制器的控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107128812A TWI719337B (zh) | 2018-08-17 | 2018-08-17 | 基於深度學習之數位控制器的控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202009616A TW202009616A (zh) | 2020-03-01 |
TWI719337B true TWI719337B (zh) | 2021-02-21 |
Family
ID=70766352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107128812A TWI719337B (zh) | 2018-08-17 | 2018-08-17 | 基於深度學習之數位控制器的控制方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI719337B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI724888B (zh) * | 2020-05-05 | 2021-04-11 | 崑山科技大學 | 磁浮系統之深度學習比例微分控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100075287A1 (en) * | 2000-10-19 | 2010-03-25 | Bernhard Dohrmann | Apparatus and method for instructional information delivery |
US20150364022A1 (en) * | 2014-06-13 | 2015-12-17 | Nant Health, Llc | Alarm fatigue management systems and methods |
WO2016137552A1 (en) * | 2015-02-24 | 2016-09-01 | BrainofT Inc. | Automatically learning and controlling connected devices |
WO2017082543A1 (en) * | 2015-11-10 | 2017-05-18 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
TW201806807A (zh) * | 2016-08-25 | 2018-03-01 | 崑山科技大學 | 車輛切換車道之自動控制方法 |
WO2018140365A1 (en) * | 2017-01-24 | 2018-08-02 | Siemens Aktiengesellschaft | System and method for cognitive engineering technology for automation and control of systems |
-
2018
- 2018-08-17 TW TW107128812A patent/TWI719337B/zh active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100075287A1 (en) * | 2000-10-19 | 2010-03-25 | Bernhard Dohrmann | Apparatus and method for instructional information delivery |
US20150364022A1 (en) * | 2014-06-13 | 2015-12-17 | Nant Health, Llc | Alarm fatigue management systems and methods |
WO2016137552A1 (en) * | 2015-02-24 | 2016-09-01 | BrainofT Inc. | Automatically learning and controlling connected devices |
WO2017082543A1 (en) * | 2015-11-10 | 2017-05-18 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
TW201806807A (zh) * | 2016-08-25 | 2018-03-01 | 崑山科技大學 | 車輛切換車道之自動控制方法 |
TWI620677B (zh) * | 2016-08-25 | 2018-04-11 | 崑山科技大學 | 車輛切換車道之自動控制方法 |
WO2018140365A1 (en) * | 2017-01-24 | 2018-08-02 | Siemens Aktiengesellschaft | System and method for cognitive engineering technology for automation and control of systems |
Also Published As
Publication number | Publication date |
---|---|
TW202009616A (zh) | 2020-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | New synchronization criteria for memristor-based networks: adaptive control and feedback control schemes | |
de Jesús Rubio | USNFIS: uniform stable neuro fuzzy inference system | |
Leng et al. | Dynamic behaviors of hyperbolic-type memristor-based Hopfield neural network considering synaptic crosstalk | |
CN102998973B (zh) | 一种非线性系统的多模型自适应控制器及控制方法 | |
EP2812855A1 (en) | Methods and apparatus for spiking neural computation | |
WO2013119861A1 (en) | Methods and apparatus for spiking neural computation | |
Wang et al. | Finite/fixed-time synchronization of delayed memristive reaction-diffusion neural networks | |
CN110687781B (zh) | 一种二阶非线性系统的精确不确定性和控制增益估计方法 | |
Cai et al. | Aperiodic intermittent pinning control for exponential synchronization of memristive neural networks with time-varying delays | |
CN109100935B (zh) | 大时滞系统的阻尼智慧pi控制方法 | |
CN108153943A (zh) | 基于时钟循环神经网络的功率放大器的行为建模方法 | |
CN106951960A (zh) | 一种神经网络及该神经网络的学习方法 | |
Wei et al. | A stochastic single-species population model with partial pollution tolerance in a polluted environment | |
Fan et al. | Adaptive neural network prescribed performance matrix projection synchronization for unknown complex dynamical networks with different dimensions | |
TWI719337B (zh) | 基於深度學習之數位控制器的控制方法 | |
Golbabai et al. | Radial basis function networks in the numerical solution of linear integro-differential equations | |
Banakar et al. | Local recurrent sigmoidal–wavelet neurons in feed-forward neural network for forecasting of dynamic systems: Theory | |
CN107276561A (zh) | 基于量化核最小均方误差的Hammerstein系统辨识方法 | |
CN114326405A (zh) | 一种基于误差训练的神经网络反步控制方法 | |
Song et al. | Graph-theoretic approach to exponential synchronization of stochastic reaction–diffusion Cohen–Grossberg neural networks with time-varying delays | |
CN107168066A (zh) | 一种温室环境自适应控制方法 | |
JPH05197701A (ja) | ニューラルネットワークを用いた情報処理装置 | |
CN106371321A (zh) | 一种焦化炉炉膛压力系统模糊网络优化pid控制方法 | |
Patan et al. | Fault-tolerant design of non-linear iterative learning control using neural networks | |
CN110450164A (zh) | 机器人控制方法、装置、机器人及存储介质 |