TW202324329A

TW202324329A - 模型預測控制系統及其方法

Info

Publication number: TW202324329A
Application number: TW110145943A
Authority: TW
Inventors: 鄭儀誠; 陳俊彥
Original assignee: 財團法人工業技術研究院
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2023-06-16
Also published as: TWI809592B; CN116243599A

Abstract

係揭示一種模型預測控制系統及其方法，模型預測控制系統包括模型模擬單元、監測單元及代理模型預測控制單元。模型模擬單元用於根據目標物之行為模型以及多個控制決策參數以模擬此目標物之動態行為，且對應產生多個實際狀態參數。監測單元用於監測此些控制決策參數及此些實際狀態參數，並產生多個估計狀態參數。代理模型預測控制單元用於根據此些估計狀態參數及多個目標參數執行近似的模型預測控制運算，以取代運算複雜度較高的模型預測控制運算。

Description

模型預測控制系統及其方法

本揭示係關於一種控制系統及控制方法，特別有關於一種用於預測並控制目標物之行為的模型預測控制系統及其方法。

模型預測控制機制係根據目標物之動態行為建立目標物之動態模型，並根據動態模型以預測目標物的動態變化，而後藉由最佳化演算法計算控制決策輸入值的最佳解，以使得目標物的行為能滿足預定目標。

然而，模型預測控制機制的最佳化演算法涉及維度較大的最佳化求解過程，當目標物之動態變化較快或目標物之動態模型較複雜時，最佳化演算法將耗費大量運算時間而導致無法在有限時間的決策週期內完成最佳化求解，此將造成目標物的控制決策延遲而影響目標物之效能表現甚至引發意外事故。

因此，本技術領域之相關產業之技術人員係致力於改良模型預測控制機制，可於各種應用情境(例如金融交易，自駕車，無人機，工廠產線，等)中快速計算出適合於控制目標的控制決策輸入值，而能夠避免控制決策延遲；並且，改良的模型預測控制機制亦可大幅減少運算量以降低硬體規格需求。

本揭示係提供一種模型預測控制系統，包括模型模擬單元、監測單元及代理模型預測控制單元。模型模擬單元用於根據目標物之行為模型以及多個前狀態的控制決策參數以模擬此目標物之動態行為，且對應產生多個實際狀態參數。監測單元，用於監測此些前一狀態的控制決策參數及此些實際狀態參數，並根據此些前一狀態的控制決策參數及此些實際狀態參數產生多個估計狀態參數。代理模型預測控制單元，用於根據此些估計狀態參數及多個目標參數執行近似的模型預測控制運算，以得到多個目前狀態的控制決策參數，並將此些目前狀態的控制決策參數回傳至此模型模擬單元。其中，此代理模型預測控制單元執行此近似的模型預測控制運算以取代運算複雜度較高的模型預測控制運算。

本揭示亦提供一種模型預測控制方法，包括以下步驟。建立目標物之行為模型。根據此目標物之此行為模型以及多個前狀態的控制決策參數以模擬此目標物之動態行為。對應產生多個實際狀態參數。監測此些前一狀態的控制決策參數及此些實際狀態參數。根據此些前一狀態的控制決策參數及此些實際狀態參數產生多個估計狀態參數。設置代理模型預測控制單元。根據此些估計狀態參數及多個目標參數藉由此代理模型預測控制單元執行近似的模型預測控制運算，以取代運算複雜度較高的模型預測控制運算。以及，將此些目前狀態的控制決策參數回傳至此模型模擬單元。

透過閱讀以下圖式、詳細說明以及申請專利範圍，可見本揭示之其他方面以及優點。

本說明書的技術用語係參照本技術領域之習慣用語，如本說明書對部分用語有加以說明或定義，該部分用語之解釋係以本說明書之說明或定義為準。本揭露之各個實施例分別具有一或多個技術特徵。在可能實施的前提下，本技術領域具有通常知識者可選擇性地實施任一實施例中部分或全部的技術特徵，或者選擇性地將這些實施例中部分或全部的技術特徵加以組合。

第1圖為本揭示一實施例之模型預測控制(model prediction control，MPC)系統1000的方塊圖。請參見第1圖，模型預測控制系統1000包括模型模擬(model simulation)單元100、監測(observation)單元200、最佳化模型預測控制(optimal model prediction control)單元300、代理模型預測控制(proxy model prediction control)單元400、更新單元500。

模型模擬單元100可建立目標物700的行為模型以模擬目標物700的動態行為。在一種示例中，目標物700(或可稱為「目標對象」、「操作標的」，泛指模型預測控制系統1000進行預測控制的控制標的)例如為自駕車，模型模擬單元100可建立自駕車的行為模型以模擬自駕車的「車速」、「行進方向」等等的動態行為。其中，自駕車的行為「車速」關聯的控制對象為自駕車的「油門」，而「行進方向」關聯的控制對象為自駕車的「方向盤」。在運作上，模型模擬單元100可接收複數個控制決策參數，其中的一個控制決策參數u1例如為「油門大小」，其關聯的控制對象為「油門」；模型模擬單元100可根據控制決策參數u1模擬控制自駕車的「油門」以調整自駕車的行為「車速」。並且，模型模擬單元100可模擬計算出「車速」的實際測量值(measurement)，即，「車速」的實際狀態參數y1；換言之，實際狀態參數y1表示自駕車的「實際車速」。

另一方面，模型模擬單元100的另一個控制決策參數u2例如為「方向盤旋轉量」，其關聯的控制對象為「方向盤」；模型模擬單元100可根據控制決策參數u2模擬控制自駕車的「方向盤」以調整自駕車的行為「行進方向」。並且，模型模擬單元100可模擬計算出「行進方向」的實際測量值，即，實際狀態參數y2；換言之，實際狀態參數y2表示自駕車的「實際行進方向」。

綜上所述，模型模擬單元100可根據控制決策參數u1「油門大小」模擬控制自駕車的控制對象「油門」以調整自駕車的行為「車速」，模型模擬單元100並對應輸出實際狀態參數y1「實際車速」。另一方面，模型模擬單元100可根據控制決策參數u2「方向盤旋轉量」模擬控制自駕車的控制對象「方向盤」以調整自駕車的行為「行進方向」，模型模擬單元100並對應輸出實際狀態參數y2「實際行進方向」。

監測單元200連接於模型模擬單元100，監測單元200可從模型模擬單元100接收實際狀態參數y1、y2，並根據控制決策參數u1、u2產生估計(estimation)狀態參數x1、x2。其中，估計狀態參數x1表示自駕車的「估計車速」，估計狀態參數x2表示自駕車的「估計行進方向」。更具體而言，監測單元200可接收目前狀態(或稱為：目前疊代(iteration)，即，第k個疊代)的實際狀態參數y1(k)、y2(k)，並且接收前一個狀態(或稱為：前一個疊代，即，第(k-1)個疊代)的控制決策參數u1(k-1)、u2(k-1)。監測單元200根據目前疊代的實際狀態參數y1(k)、y2(k)與前一個疊代的控制決策參數u1(k-1)、u2(k-1)產生目前疊代的估計狀態參數x1(k)、x2(k)。

並且，最佳化模型預測控制單元300連接於監測單元200，最佳化模型預測控制單元300可從監測單元200接收估計狀態參數x1(k)、x2(k)。此外，最佳化模型預測控制單元300可接收目標參數集合S，目標參數集合S可包括複數個目標參數s1、s2、…、sN而可表示為S={s1、s2、…、sN}。請配合參見第2圖，其繪示本揭示之模型預測控制系統1000應用於自駕車之實施例的示意圖；目標參數集合S可表示使用者期待目標物700(自駕車)應達成的目標行為，第2圖所示自駕車應達成的目標移動軌跡track1即為目標參數集合S。並且，自駕車的目標移動軌跡track1的每一點的座標即為目標參數集合S的各個目標參數s1、s2、…、sN。根據目標參數集合S以及估計狀態參數x1(k)、x2(k)，最佳化模型預測控制單元300可執行模型預測控制以計算出對應的控制決策參數u1(k)、u2(k)。換言之，為了使自駕車的行為滿足目標參數集合S(即，使自駕車的實際移動軌跡track2滿足目標移動軌跡track1)，最佳化模型預測控制單元300根據估計狀態參數x1(k)、x2(k)(即，自駕車的「估計車速」與「估計行進方向」)計算出對應的控制決策參數u1(k)、u2(k)(即，自駕車的「油門大小」及「方向盤旋轉量」)以分別控制自駕車的「油門」及「方向盤」，據以調整自駕車的行為「車速」及「行進方向」。調整後的「車速」及「行進方向」並可經由模型模擬單元100的模擬而反映在實際狀態參數y1、y2(即，自駕車的「實際車速」及「實際行進方向」)。

在本實施例中，最佳化模型預測控制單元300根據最佳化的演算法以執行模型預測控制，據以計算出可滿足目標參數集合S的控制決策參數u1、u2的最佳解(optimal solution)。然而，若考量自駕車的其他更多的控制對象(例如，排檔、引擎溫度，等)，則最佳化模型預測控制單元300必須對於數量較多的控制決策參數u1、u2、u3、…、uM進行最佳化的運算，此將耗費大量運算時間而無法在較短的決策週期(例如，自駕車的行進駕駛的決策週期可短至約0.1秒)內計算得到控制決策參數u1、u2、u3、…、uM的最佳解，因而無法達到即時控制，其可能造成自駕車的性能減損或安全事故。

針對於此，可採用預先建立的代理模型預測控制單元400取代最佳化模型預測控制單元300。係以代理模型預測控制單元400執行運算複雜度較低(因而決策週期較短)的模型預測控制的運算，以取代最佳化模型預測控制單元300執行的運算複雜度較高(因而決策週期較長)的模型預測控制的運算。並且，代理模型預測控制單元400雖非執行最佳化的運算，然而代理模型預測控制單元400仍能夠得到近似最佳解的結果，因而仍能有效調整控制目標物的行為。在本實施例中，可用離線(off-line)方式預先建立代理模型預測控制單元400的模型(即，離線建模)，建立模型的方式可包括模仿學習(imitation learning)等之機器學習方式。並且，參見第3圖繪示的代理模型預測控制單元400執行模型預測控制運算的示意圖；代理模型預測控制單元400可根據隨機程序運算以執行模型預測控制，例如可根據高斯程序(Gaussian Process，GP)的運算執行模型預測控制。仍然以自駕車的兩個控制決策參數u1、u2(即，自駕車的「油門大小」及「方向盤旋轉量」)為例，代理模型預測控制單元400根據估計狀態參數x1、x2以及目標參數集合S執行高斯程序的運算以計算出控制決策參數u1、u2各自的平均值u1_mean、u2_mean以及變異值u1_var、u2_var。在一示例中，係以平均值u1_mean、u2_mean作為最終輸出的控制決策參數u1、u2(即，控制決策參數u1=平均值u1_mean，控制決策參數u2=平均值u2_mean)。另一方面，係以控制決策參數u1、u2的變異值u1_var、u2_var作為模型可靠度(reliability)指標rindex，據以判斷是否需要更新代理模型預測控制單元400。

承上，更新單元500可設定模型可靠度指標rindex的閥值t1，並且比較模型可靠度指標rindex與閥值t1。當模型可靠度指標rindex大於閥值t1(即，控制決策參數u1、u2的變異值u1_var、u2_var大於閥值t1)時，表示目前採用的代理模型預測控制單元400的可靠度較低而需進行適應性(adaptive)更新。在一示例中，可用線上(on-line)方式收集取得各項操作數據(例如自駕車的「車速」、「行進方向」關聯的操作數據)，並以此些操作數據對於代理模型預測控制單元400進行適應性更新。

由上，可藉由離線方式預先建立代理模型預測控制單元400的模型(即，離線建模)，並藉由線上方式對於代理模型預測控制單元400進行適應性更新(即，線上更新)。並且，當代理模型預測控制單元400正在進行適應性更新時，代理模型預測控制單元400無法即時計算控制決策參數u1、u2，在此狀況下則回歸至使用最佳化模型預測控制單元300執行最佳化的模型預測控制(即，運算複雜度較高(因而決策週期較長)的模型預測控制)以計算控制決策參數u1、u2。

第4圖繪示本揭示之模型預測控制系統1000應用於工廠產線2000的實施例的示意圖，如第4圖所示，欲控制的目標物為工廠產線2000中的「蒸餾塔」，模型預測控制系統1000的控制對象包括整個蒸餾塔系統之中的各個PID控制器設定點的控制變數，例如「饋入(feed)量」2100、「蒸氣(steam)量」2200、「再沸騰(reboiler)溫度、壓力」2300，等。模型預測控制系統1000的控制決策參數u1、u2、u3分別對應於上述各個控制對象的PID控制器設定點，例如：控制決策參數u1為「饋入量」2100的PID控制器設定點。控制決策參數u2為「蒸氣(steam)量」2200的PID控制器設定點。並且，控制決策參數u3為「再沸騰溫度或壓力」2300的PID控制器設定點。

並且，目標物「蒸餾塔」的目標參數s1例如為「蒸餾液的單位時間產出量」：為了達成使用者期望的單位時間產出量，可藉由模型預測控制系統1000的代理模型預測控制單元400執行近似的模型預測控制，以計算出近似於最佳解的控制決策參數u1、u2、u3，並將控制決策參數u1、u2、u3導入實際的工廠產線2000中的整個蒸餾塔系統的對應PID控制器設定點。上述之工廠產線2000(以蒸餾塔系統的化學工廠為例)的決策週期約為15秒~30秒，可藉由代理模型預測控制單元400執行較為快速的近似模型預測控制，而能夠在15秒~30秒的決策週期內計算出近似於最佳解的控制決策參數u1、u2、u3。

此外，在工廠產線2000中，本實施例之代理模型預測控制系統1000亦可選擇性的配合控制迴路性能評估(CLPA)系統、全廠擾動源追朔(PDT)系統、控制器參數調諧(PID tunner)系統或系統識別(建模)系統以控制調整工廠產線2000中的各項變數。

第5圖為本揭示一實施例之模型預測控制方法的流程圖。請參見第5圖，模型預測控制方法可配合第1圖之模型預測控制系統1000及第3圖之代理模型預測控制單元400而實施。首先，在步驟S110中，藉由模型模擬單元100接收複數個控制決策參數，例如接收自駕車的兩個控制決策參數u1「油門大小」及控制決策參數u2「方向盤旋轉量」。並且，藉由模型模擬單元100根據控制決策參數u1、u2模擬產生實際狀態參數y1「實際車速」及實際狀態參數y2「實際行進方向」。

而後，在步驟S120中，模型模擬單元100將目前狀態的實際狀態參數y1(k)、y2(k)傳送至監測單元200，並且監測單元200更接收前一個狀態的控制決策參數u1(k-1)、u2(k-1)。據此，監測單元200根據實際狀態參數y1(k)、y2(k)及控制決策參數u1(k-1)、u2(k-1)產生估計狀態參數x1(k)「估計車速」及估計狀態參數x2(k)「估計行進方向」。

而後，在步驟S130中，判斷是否處於模型預測控制系統1000的決策週期之內；以自駕車為例，決策週期約為0.1秒。若仍處於決策週期之內，則執行步驟S135，使用代理模型預測控制單元400執行近似模型預測控制；其中，代理模型預測控制單元400接收目標參數集合S以及估計狀態參數x1(k)、x2(k)並據以產生控制決策參數u1、u2各自的平均值u1_mean、u2_mean以及變異值u1_var、u2_var，並將變異值u1_var、u2_var作為模型可靠度指標rindex。產生的控制決策參數u1、u2可再提供至步驟S110的模型模擬單元100執行模擬。

而後，在步驟S140中，設定模型可靠度指標rindex的閥值t1；並且判斷模型可靠度指標rindex是否大於閥值t1。若模型可靠度指標rindex小於閥值t1(即，變異值u1_var、u2_var小於閥值t1)，則執行步驟S150，將平均值u1_mean、u2_mean作為最終輸出的控制決策參數u1、u2(即，控制決策參數u1=平均值u1_mean，控制決策參數u2=平均值u2_mean)。

若模型可靠度指標rindex大於閥值t1(即，變異值u1_var、u2_var大於閥值t1)，表示必須更新代理模型預測控制單元400，則執行步驟S160，進行代理模型預測控制單元400更新的預備。而後，執行步驟S170，使用最佳化模型預測控制單元300計算控制決策參數u1、u2。而後，執行步驟S180，執行更新代理模型預測控制單元400；例如，可使用線上適應性更新方式，從線上收集關聯於目標物的行為模型的各項操作數據，藉由此些數據對於代理模型預測控制單元400進行更新。更新後，可執行步驟S150，藉由更新後的代理模型預測控制單元400計算控制決策參數u1、u2。

綜上所述，本揭示之模型預測控制系統1000配合模型預測控制方法之實施，係以離線建模的模仿學習或機器學習的方式預先建立代理模型預測控制單元400；並使用代理模型預測控制單元400執行近似的模型預測控制運算，以取代最佳化模型預測控制單元300執行運算複雜度較高(因而決策週期較長)的最佳化模型預測控制的運算。因此，代理模型預測控制單元400可大幅減少運算時間，而能夠在較短的決策週期(特別是針對於自駕車約為0.1秒的較短決策週期)內計算出近似最佳解的控制決策參數。並且，代理模型預測控制單元400根據高斯程序模型執行模型預測控制運算以得到控制決策參數的平均值與變異值，並將控制決策參數的變異值作為模型可靠度指標。若模型可靠度指標大於閥值則對於代理模型預測控制單元400進行線上適應性更新。

雖然本發明已以較佳實施例及範例詳細揭露如上，可理解的是，此些範例意指說明而非限制之意義。可預期的是，所屬技術領域中具有通常知識者可想到多種修改及組合，其多種修改及組合落在本發明之精神以及後附之申請專利範圍之範圍內。

1000:模型預測控制系統 100:模型模擬單元 200:監測單元 300:最佳化模型預測控制單元 400:代理模型預測控制單元 500:更新單元 700:目標物 2000:工廠產線 u1,u2,u3:控制決策參數 y1,y2:實際狀態參數 x1,x2:估計狀態參數 S:目標參數集合 s1~sN:目標參數 track1:目標移動軌跡 track2:實際移動軌跡 u1_mean,u2_mean:平均值 u1_var,u2_var:變異值 2100:饋入量 2200:蒸氣量 2300:再沸騰溫度、壓力 S110~S180:步驟

第1圖為本揭示一實施例之模型預測控制系統的方塊圖。第2圖為本揭示之模型預測控制系統應用於自駕車之實施例的示意圖。第3圖為本揭示之代理模型預測控制單元執行模型預測控制運算的示意圖。第4圖為本揭示之模型預測控制系統應用於工廠產線之實施例的示意圖。第5圖為本揭示一實施例之模型預測控制方法的流程圖。

1000:模型預測控制系統

100:模型模擬單元

200:監測單元

300:最佳化模型預測控制單元

400:代理模型預測控制單元

500:更新單元

700:目標物

u1,u2:控制決策參數

y1,y2:實際狀態參數

x1,x2:估計狀態參數

S:目標參數集合

s1~sN:目標參數

Claims

一種模型預測控制系統，包括：一模型模擬單元，用於根據一目標物之一行為模型以及複數個前一狀態的控制決策參數以模擬該目標物之一動態行為，並對應產生複數個實際狀態參數；一監測單元，用於監測該些前一狀態的控制決策參數及該些實際狀態參數，並根據該些前一狀態的控制決策參數及該些實際狀態參數產生複數個估計狀態參數；以及一代理模型預測控制單元，用於根據該些估計狀態參數及複數個目標參數執行一近似的模型預測控制運算，以得到複數個目前狀態的控制決策參數，並將此些目前狀態的控制決策參數回傳至該模型模擬單元；其中，該代理模型預測控制單元執行該近似的模型預測控制運算以取代一運算複雜度較高的模型預測控制運算。
如請求項1之模型預測控制系統，其中，該目標物具有複數個控制對象，係根據該些控制決策參數模擬控制該些控制對象，以使該目標物之該些實際狀態參數滿足於該些目標參數。
如請求項1之模型預測控制系統，其中，該代理模型預測控制單元執行一隨機程序運算以執行該近似的模型預測控制運算。
如請求項3之模型預測控制系統，其中，該代理模型預測控制單元執行之該隨機程序運算為一高斯程序運算，該代理模型預測控制單元執行該高斯程序運算以得到該些控制決策參數各自的平均值及變異值。
如請求項4之模型預測控制系統，其中，該些平均值係作為最終輸出的該些控制決策參數，且該些變異值係作為一模型可靠度指標。
如請求項5之模型預測控制系統，更包括：一更新單元，用於判斷該模型可靠度指標是否大於一閥值，若該模型可靠度指標大於該閥值，則該代理模型預測控制單元進行更新。
如請求項6之模型預測控制系統，更包括：一最佳化模型預測控制單元，當該代理模型預測控制單元進行更新時，該最佳化模型預測控制單元用於執行該運算複雜度較高的模型預測控制運算，以得到滿足於最佳解的該些控制決策參數。
如請求項6之模型預測控制系統，其中該代理模型預測控制單元以線上適應性方式進行更新。
如請求項1之模型預測控制系統，其中該代理模型預測控制單元以離線方式預先建立該目標物之該行為模型。
如請求項9之模型預測控制系統，其中該代理模型預測控制單元以模仿學習方式或機器學習方式預先建立該行為模型。
一種模型預測控制方法，包括：建立一目標物之一行為模型；根據該目標物之該行為模型以及複數個前一狀態的控制決策參數以模擬該目標物之一動態行為；對應產生複數個實際狀態參數；監測該些前一狀態的控制決策參數及該些實際狀態參數；根據該些前一狀態的控制決策參數及該些實際狀態參數產生複數個估計狀態參數；設置一代理模型預測控制單元；根據該些估計狀態參數及複數個目標參數藉由該代理模型預測控制單元執行一近似的模型預測控制運算，以取代一運算複雜度較高的模型預測控制運算；以及將此些目前狀態的控制決策參數回傳至該模型模擬單元。
如請求項11之模型預測控制方法，其中，該目標物具有複數個控制對象，該模型預測控制方法包括：根據該些控制決策參數模擬控制該些控制對象，以使該目標物之該些實際狀態參數滿足於該些目標參數。
如請求項11之模型預測控制方法，其中，藉由該代理模型預測控制單元執行一隨機程序運算以執行該近似的模型預測控制運算。
如請求項13之模型預測控制方法，其中，該代理模型預測控制單元執行之該隨機程序運算為一高斯程序運算，該模型預測控制方法包括：藉由該模型預測控制單元執行該高斯程序運算，以得到該些控制決策參數各自的平均值及變異值。
如請求項14之模型預測控制方法，更包括：以該些平均值作為最終輸出的該些控制決策參數；以及以該些變異值係作為一模型可靠度指標。
如請求項15之模型預測控制方法，更包括：判斷該模型可靠度指標是否大於一閥值；以及若該模型可靠度指標大於該閥值，則該代理模型預測控制單元進行更新。
如請求項16之模型預測控制方法，更包括：設置一最佳化模型預測控制單元；以及當該代理模型預測控制單元進行更新時，藉由該最佳化模型預測控制單元執行該運算複雜度較高的模型預測控制運算，以得到滿足於最佳解的該些控制決策參數。
如請求項16之模型預測控制方法，其中，係以線上適應性方式更新該代理模型預測控制單元。
如請求項11之模型預測控制方法，其中，係以離線方式藉由該代理模型預測控制單元預先建立該目標物之該行為模型。
如請求項19之模型預測控制方法，其中，係以模仿學習方式或機器學習方式藉由該代理模型預測控制單元預先建立該行為模型。