優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢
您的位置:網站首頁 > 優(yōu)秀論文 > 其他論文 > 正文

迭代學習模型預測控制研究現狀與挑戰(zhàn)

作者:馬樂樂 劉向杰 高福榮來源:《自動化學報》日期:2022-07-12人氣:4257

在現代智能制造業(yè)中, 批次生產方式占據越來越重要的地位, 多用于生產具有高附加值的精細化產品[1], 廣泛分布在化工、冶金等傳統重工業(yè)領域[2-4]和生物制藥、人工智能、半導體制造等高新工業(yè)領域[5-7]. 批次生產過程通常具有特定的加工順序, 并通過重復操作批量獲得同種產品, 其控制目標通常為在有限時間區(qū)間內重復跟蹤設定運行軌跡.

批次過程的本質特性明顯區(qū)別于連續(xù)過程, 可以歸納為“多樣產品”、“重復運行”、“時段切換”和“變換指標”四個方面[8]. 自20世紀90年代起, 由于產品種類增多、市場需求變化加快導致批次生產方式愈受青睞, 批次過程控制也逐漸成為一項獨立的研究課題. 總體來說, 批次過程控制研究歷經了連續(xù)過程控制方法、迭代學習控制(Iterative learn-ing control, ILC)和迭代學習模型預測控制(Iterative learning model predictive control, ILMPC)三個階段, 圖1顯示了其發(fā)展歷程.

圖 1  批次過程控制發(fā)展歷程
Fig. 1  Development of batch process control

20世紀90年代, 依托于連續(xù)過程控制理論的飛速發(fā)展, 衍生了第一代批次過程控制技術. 其核心思想是將批次過程視為有限時間內的連續(xù)過程, 采用成熟的連續(xù)過程控制技術對批次過程進行時域控制, 控制手段從傳統的比例?積分(Proportion integration, PI)控制策略[9]逐步發(fā)展至模型預測控制(Model predictive control, MPC)[10-12]、模糊控制[13]、神經網絡控制[14]等先進控制方法. 但是連續(xù)過程控制方法沒有考慮批次過程“多重時變”的特有性質, 難以解決實際批次過程的高精度軌跡跟蹤問題. 批次過程的動態(tài)變化具有雙向性: 沿時間方向, 批次過程的設定值是時變的, 需要在每個采樣點跟蹤不同的目標值; 沿批次方向, 各批次執(zhí)行重復的生產任務, 需要利用積累的控制經驗不斷提高跟蹤性能. 這種特殊的控制目標和控制結構激發(fā)了眾多學者去探索基于迭代學習的批次過程控制方法.

迭代學習控制提出于20世紀80年代[15], 最早應用于機器人控制. 它對同一軌跡進行重復跟蹤, 以前一迭代次序中輸出信號與給定目標的偏差修正下一迭代次序的控制信號, 從而逐步提高系統的跟蹤性能, 最終實現有限區(qū)間上的完全跟蹤. ILC的迭代控制結構與批次過程重復操作的特點高度契合, 能夠實現批次過程高精度軌跡跟蹤的控制目標. 因此, 從20世紀90年代中期開始, ILC在批次過程控制中獲得了廣泛關注. 韓國學者Lee等最早將ILC應用于聚合反應器控制[16], 采用基于反饋的ILC沿批次更新學習律, 提高系統跟蹤精度; 隨后, Lee等結合最優(yōu)學習律, 提出基于二次型指標的Q-ILC (Quadratic-criterion-based ILC, Q-ILC)策略, 顯著提高了ILC在批次過程中的學習性能. Lee等在發(fā)表于Control Engineering Practice的論文中系統綜述了ILC應用于批次過程的幾種形式, 并集中討論了實際應用中需要解決的問題[17]. 基于Lee等的研究工作, 后人針對批次過程的時滯、參數不確定性、隨機干擾等問題, 構造了魯棒ILC策略[18-21]; 針對批次過程的初態(tài)偏移及變參考軌跡等問題, 提出了改進的自適應ILC策略[22-25]; 此外, ILC還與模糊規(guī)則、神經網絡和數據驅動等技術結合, 利用批次過程數據同時實施建模和控制[25-31]. 基于ILC的控制方法融合了批次過程有限時間重復操作的特點, 沿迭代軸建立了批次間的控制關系, 其產生和發(fā)展標志著批次過程控制正式獨立于連續(xù)過程控制, 形成了適應批次過程特性的迭代控制結構.

ILC的應用將批次過程控制從時域引入迭代域, 但是無論是傳統連續(xù)過程控制方法還是基于ILC的批次過程控制方法, 其控制信號只作用于一個維度. 在時域上, ILC是典型的開環(huán)控制, 不具備抗實時干擾能力, 無法保證系統的閉環(huán)穩(wěn)定性和魯棒性. 根據ILC的控制結構, 當前批次出現的干擾和偏差直到下一批次才能被處理, 導致批次過程的時域跟蹤性能下降. 因此, 將ILC算法與成熟的時域控制技術結合成為了批次過程控制研究的新方向. 文獻[32-33]嘗試將ILC算法與傳統比例?積分?微分(Proportion integration differentiation, PID)控制策略結合, 利用ILC沿批次進行設定點迭代學習. 但是PID控制只適用于調節(jié)問題, 而批次過程的設定值是時變的, PID控制無法滿足批次過程高精度軌跡跟蹤的控制要求. MPC能夠根據系統模型預測未來的狀態(tài)及輸出, 在當前時刻的滾動時域優(yōu)化中直接采用時變的設定值軌跡作為目標輸出, 因而在軌跡跟蹤控制方面具有突出優(yōu)勢[34-35]. 將ILC與MPC結合不僅能保留ILC的批次學習能力, 同時可以大大提高時域閉環(huán)跟蹤性能, 由此形成的迭代學習模型預測控制(ILMPC)標志著批次過程控制進入二維(Two-dimensional, 2D)控制時代, 其算法結構如圖2所示. ILC根據歷史數據以批次為單位更新全區(qū)間控制律, MPC在各批次內通過預測未來系統狀態(tài)和輸出進行滾動時域優(yōu)化獲得當前時刻的控制信號.

圖 2  迭代學習模型預測控制結構
Fig. 2  Structure of ILMPC

加拿大學者Bone于1995年在Automatica期刊上首次提出將ILC與廣義預測控制(Generalized predictive control, GPC)結合[36], 利用ILC的學習能力改善GPC在重復性干擾下的控制效果, 形成了ILMPC算法的雛形; 韓國學者Lee等于1999年在AIChE Journal發(fā)表的論文中結合ILC和模型算法控制(Model algorithm control, MAC)建立了批次模型預測控制(Batch model predictive control, BMPC)策略, 并首次將ILMPC算法應用于間歇反應器控制[37]; 2000年, Lee等在IEEE Transactions on Automatic Control期刊上對BMPC的收斂性進行了嚴格的理論證明[38], 將ILMPC的理論研究推向新的高度; 文獻[39-40]在BMPC的基礎上, 令ILC和MPC分別作用于批次方向和時間方向, 形成經典的兩段式ILMPC (Two-stage ILMPC) 控制架構.

歷經20多年的發(fā)展, ILMPC已經成為批次過程控制領域的主流方法[41]. 本文將在分析現有成熟的迭代學習模型預測控制理論的基礎上, 指出其面臨的挑戰(zhàn), 綜述該領域的研究動態(tài), 并展望迭代學習模型預測控制的未來研究方向. 本文的結構框架及主要內容如圖3所示.

圖 3  結構及主要內容
Fig. 3  The structure and main contents

在由ILC和MPC共同作用的2D控制框架下, ILMPC算法的模型搭建、控制律優(yōu)化及跟蹤性能分析都需要從時間軸和迭代軸兩個方向同時進行. 綜合來看, ILMPC的理論體系包含三個基本問題: 二維預測模型建立、控制律迭代優(yōu)化以及二維穩(wěn)定性分析.

MPC的預測功能需要基于預測模型實現, 預測模型的形式靈活多變. 在經典的MPC理論中, MAC采用的脈沖響應預測模型和動態(tài)矩陣控制(Dynamic matrix control, DMC)采用的階躍響應預測模型均是通過工業(yè)試驗得到的非參數模型; GPC采用的受控自回歸積分滑動平均(Controlled autoregressive integrated moving average, CARIMA)預測模型和非線性MPC經常使用的狀態(tài)空間預測模型都可劃分為參數模型. 隨著現代工業(yè)系統逐步朝著高復雜度和高集成度方向發(fā)展, 利用機器學習技術建立數據驅動非參數預測模型對提高模型精度和控制品質具有重要意義.

ILMPC預測模型的作用與MPC相同, 可以適應多種參數和非參數形式. 但是ILMPC在控制結構上與MPC有本質區(qū)別, 其二維控制結構要求預測模型同時包含時間和批次兩個方向的信息. MPC算法只需考慮對象的時域動態(tài)特性, 預測模型通常是基于當前時刻狀態(tài), 構造控制時域內的輸入向量與預測時域內的輸出向量間的關系. 而ILMPC需要同時考慮對象在時域和迭代域上的動態(tài)特性, 在時域預測模型的基礎上進一步搭建相鄰批次間的迭代關系, 形成2D預測模型. 在現有ILMPC研究中, 2D預測模型形式基本沿襲了MPC預測模型, 大致可以分為三類: 2D輸入輸出預測模型、2D狀態(tài)空間預測模型和2D非線性隱式預測模型.

1.1.1   2D輸入輸出預測模型

輸入輸出模型主要通過實際工業(yè)系統歷史數據辨識得到, 結構相對簡單, 便于直接推導輸入迭代變化量和輸出跟蹤誤差之間的關系. 因此, 早期的ILMPC算法大都采用2D輸入輸出預測模型. 文獻[36]利用平均算子建立系統干擾沿批次的迭代關系, 得到了二維CARIMA預測模型, 其中控制變量僅體現沿時間方向的動態(tài)變化; 文獻[37]將相鄰批次的系統模型作差并沿時間軸展開, 形成了基于脈沖響應矩陣的2D輸入輸出模型, 其控制變量形式進一步體現了迭代變化規(guī)律; 文獻[42]通過將階躍響應模型沿批次作差構造2D輸入輸出模型, 建立了控制輸入增量的迭代變化關系; 文獻[43-45]利用CARIMA模型沿批次的增量模型, 推導了系統控制變量為輸入增量迭代變化量的2D預測模型, 其中還同時包含干擾的迭代變化量; 文獻[46]結合了2D脈沖響應預測模型和模糊神經網絡技術, 構造了非線性系統的2D模糊神經網絡輸入輸出預測模型. 盡管采用2D輸入輸出預測模型有利于降低ILMPC控制器設計難度, 但是輸入輸出結構無法表征復雜系統的重要狀態(tài)變量信息, 難以與現代控制理論和系統優(yōu)化理論接軌, 在算法應用和發(fā)展上都存在一定局限性.

1.1.2   2D狀態(tài)空間預測模型

狀態(tài)空間方法是現代控制理論和系統優(yōu)化理論的重要基礎. MPC理論體系立足于最優(yōu)控制, 其可行性及穩(wěn)定性結論都以狀態(tài)空間方法為工具. 因此, 在ILMPC中采用2D狀態(tài)空間預測模型進行控制器設計, 不僅對復雜批次過程控制具有指導意義, 還便于利用MPC成熟的理論體系對ILMPC的穩(wěn)定性、收斂性等系統性能進行定性分析. 狀態(tài)空間模型通過狀態(tài)變量聯立系統輸入和輸出, 為建立跟蹤誤差與系統輸入間的迭代關系, 通常需要進行狀態(tài)增廣. 文獻[47]將分段仿射(Piecewise affine, PWA)狀態(tài)模型沿批次進行增廣, 構建了2D Fornasini–Marchesini (FM)模型, 增廣后的狀態(tài)變量為狀態(tài)迭代變化量和輸出跟蹤誤差, 再沿時間軸基于2D FM模型預測未來的增廣狀態(tài), 形成2D FM狀態(tài)空間預測模型; 文獻[48-51]基于線性定常(Linear time invariant, LTI)系統推導以系統狀態(tài)和輸入變量為增廣狀態(tài)的狀態(tài)空間模型, 再通過作差的方式得到相鄰批次間的迭代關系, 構造了控制變量為輸入信號增量迭代變化量的2D預測模型. 文獻[52]針對一類具有未知輸入非線性的系統, 借助全局Lipschitz連續(xù)性條件構建了顯式的線性2D狀態(tài)空間預測模型, 使非線性ILMPC轉化為簡單的二次規(guī)劃(Quadratic programming, QP)問題; 文獻[53]考慮一類具有未知干擾非線性的系統, 建立了具有干擾不確定性的顯式2D狀態(tài)空間預測模型, 通過迭代計算逼近干擾量進而獲得ILMPC的近似最優(yōu)解. 文獻[54]針對一般非線性系統, 通過工作點線性化得到了顯式2D狀態(tài)空間預測模型, 并利用Lipschitz條件在ILMPC優(yōu)化中實現了對線性化誤差的補償.

1.1.3   2D非線性隱式預測模型

上述的2D輸入輸出預測模型和2D狀態(tài)空間預測模型都可以歸結為顯式預測模型, 它們采用2D線性模型或者近似線性模型進行預測, 能夠直接推出未來一段時間內系統輸入到系統輸出的顯式關系, 形成的優(yōu)化問題大都能夠通過QP高效求解. 隨著現代工業(yè)的發(fā)展, 批次過程的生產規(guī)模、設備種類以及結構復雜性日益增長, 簡單的顯式預測模型已經不足以描述批次過程的復雜動態(tài)特性. 為了保證跟蹤精度, 直接采用較為精確的非線性模型進行隱式預測成為ILMPC的另一重要研究方向. 文獻[55-56]利用神經網絡模型進行隱式預測, 得到的非線性優(yōu)化問題通過序列二次規(guī)劃(Sequential quadratic programming, SQP)、粒子群算法(Particle swarm optimization, PSO)或遺傳算法(Genetic algorithm, GA)等方法進行求解; 文獻[57]建立了插電式混合動力汽車的2D Roesser非線性機理模型, 通過隱式預測形成非線性ILMPC優(yōu)化問題, 并通過改進動態(tài)規(guī)劃(Improved dynamic programming, IDP)方法進行求解. 雖然2D非線性隱式預測模型能夠最大程度地保證控制精確性, 但同時導致ILMPC優(yōu)化的計算復雜度大大增加. 如何設計更為有效的2D預測模型結構以實現跟蹤精度和計算效率的平衡, 是ILMPC理論研究的難點之一.

ILMPC需要根據過去批次的過程數據沿迭代軸進行控制律更新, 這通常是通過沿批次的迭代優(yōu)化實現的. 現有ILMPC研究工作主要圍繞著兩種優(yōu)化結構展開: 1)將ILC和MPC集成為一個二維優(yōu)化問題, 在每個采樣時刻對當前控制律進行更新; 2)按順序分別進行ILC優(yōu)化和MPC優(yōu)化, 在每個批次開始前基于2D模型求解整個批次內的ILC控制律, 再采用MPC基于2D預測模型進行滾動時域優(yōu)化, 在ILC控制律的基礎上進一步修正. 通常, 具有第1種優(yōu)化結構的ILMPC算法稱為整體式(Intergrated) ILMPC, 具有第2種結構的ILMPC算法稱為兩段式(Two-stage) ILMPC.

1.2.1   整體式ILMPC

整體式ILMPC控制器本質是基于2D預測模型的MPC控制器, 它借助存儲的前一批次控制信息, 通過最小化未來一段時間的跟蹤誤差獲得當前批次當前時刻的控制輸入迭代變化量, 從而實現學習功能[3742-44], 其結構如圖4所示. 整體式ILMPC的最優(yōu)性、可行性及穩(wěn)定性等性質可以通過MPC理論進行定性分析, 優(yōu)化算法的可實施性較強, 同時計算負擔較小. 整體式ILMPC的控制信號直接產生于MPC控制器, 一方面降低了約束處理的難度, 另一方面利于與魯棒、隨機等先進控制技術結合. 文獻[58-59]分別針對批次系統的模型參數不確定性和干擾不確定性問題, 基于2D LTI狀態(tài)空間預測模型設計了魯棒整體式ILMPC方法; 文獻[60-61]分別考慮批次過程的隨機擾動和隨機狀態(tài)約束問題, 構造了隨機整體式ILMPC策略.

圖 4  整體式ILMPC結構
Fig. 4  Scheme of integrated ILMPC

1.2.2   兩段式ILMPC

兩段式ILMPC多基于前饋-反饋機制, 通常形式為先基于存儲的前一批次數據進行離線ILC優(yōu)化得到整個批次的前饋控制律, 再在每個采樣間隔進行滾動時域MPC優(yōu)化得到反饋控制律, 其控制結構如圖5所示. 這種Two-stage優(yōu)化方案將ILC功能和MPC功能進行了分離, 沿批次進行的ILC控制只處理重復性干擾, 沿時域進行的MPC控制負責抑制隨機干擾. 因而Two-stage ILMPC的迭代學習進程不受隨機過程信息的影響, 其學習效率和收斂速度通常高于整體式ILMPC. 文獻[39-40]基于2D脈沖響應預測模型, 采用前饋?反饋機制構建Two-stage ILMPC算法, 通過ILC優(yōu)化和MPC優(yōu)化分別產生ILC控制量和MPC控制量, 施加于被控系統的控制作用為兩者之和; 文獻[55]基于2D非線性模糊神經網絡模型, 先獨立優(yōu)化ILC控制律, 再利用已知的ILC控制量和待優(yōu)化的MPC控制量推導時域隱式預測模型, 通過滾動時域優(yōu)化求解得到MPC控制量. 另一種典型Two-stage ILMPC保持了ILC和MPC功能的整體性, 只根據控制目標將ILMPC優(yōu)化過程分割為兩個階段, 第1階段抑制非重復性干擾, 第2階段在重復性干擾下最小化跟蹤誤差, 提高系統跟蹤精度和收斂速度[62].

圖 5  Two-stage ILMPC結構
Fig. 5  Scheme of two-stage ILMPC

綜合前述的模型形式和優(yōu)化結構差異, ILMPC的分類情況及各自優(yōu)勢、局限性如表1所示.

表 1  迭代學習模型預測控制分類
Table 1  Categories of ILMPC
分類依據類別優(yōu)勢局限性
模型形式2D輸入輸出預測模型[36?3742?46]便于直接推導迭代關系無法表征系統內部動態(tài)
2D狀態(tài)空間預測模型[47?54]便于系統性能定性分析需完全掌握系統狀態(tài)信息
2D非線性隱式預測模型[55?57]精確描述非線性動態(tài)特性優(yōu)化計算復雜度增加
優(yōu)化結構整體式結構[3742?44]便于性能分析, 計算負擔小學習作用難以充分發(fā)揮
兩段式結構[39?405562]避免隨機過程信息影響性能分析較難, 計算負擔大

ILMPC是典型的二維控制系統, 其穩(wěn)定性應從迭代和時間兩個維度進行分析, 稱為二維穩(wěn)定性分析. 在迭代軸方向上, ILMPC系統的穩(wěn)定性主要體現為沿批次的收斂性問題. 在時間軸方向上, ILMPC的穩(wěn)定性主要體現為沿時間的Lyapunov穩(wěn)定性. 針對ILC的收斂性問題, 現有研究主要是通過代入控制變量顯式地推導跟蹤誤差的迭代關系, 得出系統收斂的不等式條件[63-64]. 這種分析方法較為簡便, 且能得到系統嚴格收斂的結論, 但是不適用于無法得到顯式解的帶約束問題; 針對MPC的穩(wěn)定性問題, 基于終端約束集的控制器設計方法是保證系統Lyapunov穩(wěn)定性的最有效途徑[65], 通過在滾動時域優(yōu)化問題中引入終端代價函數和終端約束, 使得由系統優(yōu)化目標函數充當的Lyapunov函數沿時間軸遞減. 然而, 對于具有強非線性或不確定性的系統而言, 設計終端約束集仍面臨很大困難. ILMPC的二維結構決定了系統的時域特性和迭代域特性互相影響, 互相牽制, 因此無法單獨采用ILC或MPC領域的已有方法進行收斂性或穩(wěn)定性分析. 此外, 批次過程的強非線性、不確定性及多約束等問題導致ILMPC的二維穩(wěn)定性分析愈加困難.

1.3.1   時域Lyapunov穩(wěn)定性

2D系統的時域性能和迭代域性能密不可分, 時域穩(wěn)定性是實現迭代收斂性的重要前提, 在2D框架下構造具有時域穩(wěn)定性的ILMPC控制器能夠為系統的實時跟蹤性能提供有力保障. 從MPC穩(wěn)定性理論出發(fā), ILMPC系統的時域Lyapunov穩(wěn)定性即指基于二維預測模型的時域優(yōu)化目標函數沿時間軸的收斂問題. 對于約束系統, 通常要基于系統遞歸可行性的前提保證穩(wěn)定性. 利用最優(yōu)解必定優(yōu)于可行解的一般性結論, 得到ILMPC閉環(huán)系統的時域Lyapunov穩(wěn)定性結論. 文獻[3746]通過假設在+1時刻控制時域內最后一個輸入的迭代變化量為零, 利用t時刻的最優(yōu)解構造了t+1時刻的最優(yōu)解, 進而根據最優(yōu)解與可行解的關系, 證明了目標函數在無窮時域內的有界性. 文獻[55-56]采用變預測時域的ILMPC優(yōu)化機制, 保證每個時刻的最優(yōu)解必定是下一時刻的可行解, 進而實現了目標函數沿時間軸非增. 文獻[58-59]在時域上采用了魯棒預測控制結構, 將系統物理約束和Lyapunov穩(wěn)定性條件均轉化為線性不等式約束, 構造反饋控制律令系統若初始可行必遞歸可行.

1.3.2   迭代收斂性

ILMPC的迭代收斂性是指: 當迭代次序趨近無窮時, 系統跟蹤誤差收斂到零或者某一常數. ILMPC的收斂性分析主要遵循兩種方式:

針對無約束系統, 直接求出ILMPC優(yōu)化問題的顯式解, 將顯式解代入系統模型, 推導相鄰批次間跟蹤誤差的迭代關系, 從而得到跟蹤誤差沿迭代軸單調收斂的不等式條件. 文獻[42]將ILMPC優(yōu)化問題的顯式解代入階躍響應模型, 得到了相鄰批次間跟蹤誤差向量的等式關系, 再令轉移矩陣的譜半徑或范數小于1得到ILMPC系統的單調收斂條件; 文獻[48]基于所有批次初始狀態(tài)保持不變的假設, 將顯式解代入Kalman濾波器作用下的LTI狀態(tài)模型, 得到ILMPC的單調收斂條件.

針對約束系統, 首先通過設計穩(wěn)定預測控制器保證跟蹤誤差在每個批次內的收斂性或有界性, 再利用批次過程的重復特性, 證明跟蹤誤差沿批次的收斂性. 文獻[38]基于預測控制的穩(wěn)定性分析方法推得優(yōu)化目標函數值的時域有界性, 進而通過前一批次末端狀態(tài)和后一批次初態(tài)間的關系, 證明了跟蹤誤差沿迭代軸收斂到零; 文獻[55]基于變時域預測控制目標函數的非增性質, 在系統初態(tài)保持不變的前提下利用夾逼定理證明了跟蹤誤差沿迭代軸收斂到某一常數; 文獻[59]在時域上采用基于終端不變集的MPC優(yōu)化方法保證了系統跟蹤誤差的有界性, 繼而借助最優(yōu)解的性質遞推證明了批次內任意采樣時刻跟蹤誤差沿迭代軸的收斂性.

迭代學習模型預測控制衍生于發(fā)展成熟的ILC和MPC技術, 具有較為完備的理論基礎. 但是, ILC和MPC從控制目標、優(yōu)化結構等方面存在本質區(qū)別, 將兩者融入到一個2D框架下對系統的建模、優(yōu)化、穩(wěn)定性分析等帶來了挑戰(zhàn). 建立從建模、優(yōu)化到性能分析的完整理論體系仍是批次過程ILMPC的研究難點. 同時, 批次過程“多重時變”的特點要求ILMPC控制器對變參考軌跡、變批次長度、變模型參數等情況具有良好的適應性. 如何在不影響系統2D穩(wěn)定性的前提下提高對批次過程變工況的適應性是ILMPC控制器設計面臨的又一挑戰(zhàn).

建模問題一直是批次過程控制領域的研究熱點[66-68]. ILMPC的時域跟蹤性能和迭代域收斂特性都很大程度上依賴于模型的準確性. 盡管ILC在發(fā)展初期被定位為無模型控制系統綜合方法, 但在系統模型可獲得的情況下利用模型構造學習律能大大提高學習效率, 縮短學習過程[69-70]. MPC是一種基于模型的先進控制技術, 其算法魯棒性和穩(wěn)定性都與預測模型的準確度息息相關[71-72]. 因此, 建立精確的2D模型對ILMPC算法功能的實現尤為重要. 實際批次過程通常具有明顯的非線性特征, 按模型可獲取程度大致可以分為兩類: 第1類是可以獲取具有足夠精度的機理模型的簡單過程; 第2類是機理模型及辨識模型無法獲取或難以用于控制的復雜過程.

2.1.1   機理建模

針對簡單非線性過程, 最可靠的建模方法就是根據被控系統內部機制或者物質流的傳遞機理建立精確的機理模型. 機理模型又稱白箱模型, 它是基于質量平衡方程、能量平衡方程、動量平衡方程、相平衡方程以及某些物性方程、化學反應定律、電路基本定律等而獲得對象或過程的數學模型. 機理模型的優(yōu)點是參數具有非常明確的物理意義, 模型參數易于調整, 具有很強的適應性. 但是實際工業(yè)對象的過程特性通常無法精確表達為數學形式, 并且表達式中存在大量難以確定的參數, 進而影響到模型的精確性. 在現今發(fā)展階段, ILMPC的研究工作主要面向對基礎控制理論的改進和完善, 因此大都直接基于對象非線性機理模型建立相應的ILMPC算法[47-54]. 為了在控制器設計和性能分析中運用成熟的線性系統控制理論, 通常需要將非線性機理模型進行線性化, 基于所得線性模型推導2D預測模型, 其中線性化誤差項一般考慮為系統的不確定擾動. 文獻[47]將非線性機理模型進行分段線性化, 并在各階段設計不同的優(yōu)化目標函數求解ILMPC控制量; 文獻[54]通過泰勒展開的方法對非線性機理模型進行工作點處線性化, 利用Lipschitz連續(xù)性條件在2D預測模型中補償線性化高階項產生的不確定性; 文獻[58]將非線性注塑系統描述為具有參數不確定性的線性化系統, 設計了對應的魯棒ILMPC策略.

2.1.2   數據驅動建模

針對復雜非線性過程, 可以采用數據驅動建模的手段為ILMPC設計提供模型支撐. 批次生產過程中每時每刻都產生并儲存了大量的關于過程運行和設備狀態(tài)的數據, 且數據量隨著重復操作的進行不斷累積增大. 利用這些離線或在線的數據獲取被控系統的動態(tài)特性是解決難建模批次過程控制問題的有效途徑. 以迭代軸作為參考方向, 批次過程數據進行在線積累和更新; 以時間軸作為參考方向, 批次過程數據進行離線存儲和調用. 批次過程控制特有的2D結構要求數據采集和利用也必須迭代進行. 神經網絡模型具有超強的非線性映射能力、泛化能力、自學習和自適應能力, 在批次過程數據驅動建模方面得到了廣泛關注. 文獻[29]基于遞歸神經網絡對系統非線性進行重復辨識, 并利用過去批次的平均建模誤差對當前批次的神經網絡模型進行校正; 文獻[55]基于批次過程數據進行模糊神經網絡建模, 在當前批次開始前利用前幾批次存儲的過程數據更新模型參數; 文獻[73]利用徑向基函數神經網絡對非線性批次過程進行迭代建模, 并采用最速下降法獲得網絡連接權值沿迭代軸的更新方程.

隨著工程數學與應用物理的深度融合以及人工智能的迅猛發(fā)展, 機理建模和數據驅動建模技術都日益成熟. 然而, 批次過程的“多重時變”特性對其建模過程提出了許多新要求. 首先, 批次過程通常用于生產高精細化產品, 控制系統需時刻保持高跟蹤精度, 這對模型精確性提出了更高的要求. 無論是機理建模方法還是數據驅動建模方法都不可避免地存在建模誤差, 利用迭代軸上累積的過程數據反復進行誤差估計和補償是提高系統跟蹤精度的關鍵, 也是批次過程迭代建模中的重點和難點. 其次, 一個完整的批次過程通常包含多個操作階段, 每個階段的動態(tài)特性存在明顯差異, 如何實現多階段精確建模和平滑切換是未來批次過程建模的重要研究方向.

ILMPC控制系統在每個采樣間隔需要求解基于2D預測模型的約束優(yōu)化問題. 當采用簡單的線性模型為預測模型時, 優(yōu)化問題的求解效率較快, 但是線性模型與實際非線性過程的失配問題會導致控制器的最優(yōu)性下降. 當直接采用較為準確的非線性模型作為預測模型時, 盡管控制最優(yōu)性會得到一定程度的提升, 但是運用非線性規(guī)劃求解方法會導致每個采樣周期內的計算負擔加重, 從而造成控制效率的下降. ILMPC優(yōu)化的研究難點主要在于如何實現最優(yōu)性和優(yōu)化計算效率間的平衡.

2.2.1   最優(yōu)性

對于基于預測模型的ILMPC算法, 提高控制最優(yōu)性的首要問題是實現對模型誤差的有效補償. 模型失配的程度越小, 控制信號對于實際非線性批次過程的適用性就越高. 文獻[37]將非線性批次過程辨識為線性脈沖響應模型, 在每個采樣間隔利用Kalman濾波器對預測狀態(tài)進行反饋校正, 使控制信號的最優(yōu)性提高; 文獻[54]在ILMPC算法內考慮了線性化導致的模型失配問題, 利用Lipschitz連續(xù)性條件將優(yōu)化目標函數表示為真實跟蹤誤差的上界, 從而提高控制輸入的最優(yōu)性.

對于帶不確定性的ILMPC系統而言, 魯棒性的提高通常會導致最優(yōu)性的下降. 為降低系統不確定性對跟蹤性能的影響, 魯棒ILMPC的設計目標通常是保證已知范圍內的所有可能干擾對系統性能指標的影響小于某一界限, 或在參數不確定性包含的所有可能情況下滿足魯棒穩(wěn)定性條件. 文獻[58]設定系統在所有可能參數下的目標函數小于某一定值, 不可避免地造成了控制器的保守性, 在一定程度上犧牲了最優(yōu)性; 文獻[59]針對約束批次過程設計基于終端橢圓不變集的魯棒ILMPC策略, 由于橢圓不變集無法實現終端域的最大化, 這種保證2D穩(wěn)定性的方法必然以犧牲最優(yōu)性為代價. 因此, 在解決系統不確定性問題時, 如何定性分析系統保守性并最大限度提高最優(yōu)性是一項重要研究內容.

僅從優(yōu)化層面上看, ILMPC解的最優(yōu)性取決于采用的尋優(yōu)方法. 在線性模型下, ILMPC優(yōu)化問題通常是簡單的凸優(yōu)化問題, 其局部最優(yōu)解即是全局最優(yōu)解, 因此尋優(yōu)方法通常不會影響解的最優(yōu)性; 在非線性模型下, ILMPC優(yōu)化問題通常為非凸優(yōu)化問題, 可能存在多個局部最優(yōu)解, 采用有下降參考的傳統尋優(yōu)方法計算量大, 并容易陷入局部最優(yōu), 導致解的最優(yōu)性下降. 針對非凸優(yōu)化問題, 采用PSO、GA等啟發(fā)式尋優(yōu)方法能大幅提高尋至全局最優(yōu)解的幾率, 但是這類尋優(yōu)方法需要的搜索時間相對較長, 只適合于采樣間隔較大的慢變過程. 在快變非線性批次過程中, 如何達到最優(yōu)性和計算效率的最佳平衡是現今ILMPC領域的難點問題.

2.2.2   優(yōu)化計算效率

在實際非線性批次過程控制中, ILMPC的優(yōu)化計算效率主要取決于兩個因素: 預測模型和尋優(yōu)算法. 降低模型復雜度和減小尋優(yōu)計算負擔是提高ILMPC優(yōu)化效率的兩個重要途徑. 通過對非線性系統進行線性化獲得線性預測模型, 可以有效降低模型復雜度, 將復雜的ILMPC非線性規(guī)劃問題轉化為易于求解的線性規(guī)劃問題[48]. 但任何降低模型復雜度的方法勢必會導致模型精確度下降, 因此需要同時解決模型失配問題.

在ILMPC尋優(yōu)過程中, 需要從初始點開始進行多步迭代才能到達局部最優(yōu)解, 因此減小尋優(yōu)計算量應從減少迭代步數或減小每步迭代的計算量這兩個角度出發(fā). 減少迭代步數意味著加快尋優(yōu)算法的收斂速度. 傳統尋優(yōu)算法如梯度下降法、牛頓下降法和拉格朗日乘子法等都在每一步迭代中提供了下降的方向和大小參考, 因此收斂速度較快; 基于窮舉搜索的網格法、基于隨機搜索的模擬退火算法以及基于啟發(fā)式搜索的PSO、GA和蟻群算法(Ant colony optimization, ACO)的尋優(yōu)過程不依賴于下降參考, 參數選擇和更新具有一定隨機性, 搜索速度較慢, 需要較長的時間才能收斂到局部最優(yōu)解. 為提高啟發(fā)式尋優(yōu)算法的收斂速度, 交叉算法[74]、非線性慣性權重[75]、局部聚類[76]等方案在GA、PSO及ACO中得到了應用, 同時還出現了大量將啟發(fā)式尋優(yōu)算法與傳統下降式尋優(yōu)算法結合的研究工作, 比如PSO梯度法[77]和蒙特卡洛梯度法[78]. 文獻[79]提出一種交替尋優(yōu)算法, 強制每一步的損失函數小于前一步, 并設置每次尋優(yōu)的最大迭代步數來減輕計算負擔. 在每一步計算中, 減少可變參數的數量是提高計算效率的有效途徑. 例如在梯度下降法中減少待優(yōu)化變量數量可以減少每步求導的次數和復雜程度, 從而降低每步迭代的計算負擔, 提高整體計算效率.

對于快變非線性批次過程, 現有的ILMPC算法難以同時兼顧最優(yōu)性和計算效率的問題. 以尋優(yōu)算法的內在機制為切入點, 對ILMPC的目標函數結構進行改造以提高尋優(yōu)算法收斂速度或減小每步迭代的計算量, 是發(fā)展高效ILMPC的潛在方法.

批次過程“多重時變”的特點決定了其工況會隨批次或隨時間變化. ILMPC的時域滾動優(yōu)化機制可以有效處理時變問題. 但是經典ILMPC理論是基于批次過程的重復特性構建的, 對于沿批次的變工況問題還沒有有效的解決方案. 在批次生產過程中, 產品類型或生產條件的改變會導致系統初始狀態(tài)、參考軌跡、批次長度和模型參數不斷發(fā)生變化[8]. 這造成ILMPC所依賴的對象重復性前提被打破, 難以發(fā)揮沿批次的學習作用. 為將ILMPC應用于實際批次過程, 必須設法提高它對變初始狀態(tài)、變參考軌跡、變批次長度和變模型參數等工況的適應能力. ILMPC理論的奠基者Lee早在2007年就明確指出, ILMPC研究的一個重要方向就是在變工況下實現批次間跟蹤誤差信息的有效轉換[17].

2.3.1   變初始狀態(tài)

現有的ILMPC算法大多要求系統的迭代初態(tài)在每一批次都嚴格定位在期望初態(tài)上, 從而實現對二維系統穩(wěn)定性的嚴格證明. 但是實際環(huán)境中的重復定位操作會導致系統存在初態(tài)偏移, 且每個批次的偏移量大小都是隨機的, 這直接影響到系統的時域閉環(huán)穩(wěn)定性和迭代域誤差收斂性. ILC通常只考慮沿批次的一維(One-dimensional, 1D)無約束學習律優(yōu)化, 可以直接將初始狀態(tài)偏差量或其范圍代入系統動態(tài)方程, 獲得跟蹤誤差沿迭代軸漸近收斂的充分條件[80-82]. 文獻[83]基于2D Roesser模型對ILC系統在變初始狀態(tài)下的收斂性開展了理論分析, 證實了必定存在一種D型學習律使系統跟蹤誤差沿迭代軸漸近收斂至零. 文獻[84]進一步證明了PD型學習律下ILC系統的跟蹤誤差在變初始狀態(tài)下必有界. 在此基礎上, 文獻[85]設計了一種自適應ILC學習律, 使系統輸入同時根據離線數據和在線數據沿迭代軸進行更新, 保證初始狀態(tài)有界時系統跟蹤誤差沿迭代軸漸近收斂至零. 與ILC策略不同, ILMPC在每個采樣時刻進行滾動時域優(yōu)化, 初始條件的變化會對約束系統的時域穩(wěn)定性產生很大影響, 進而危及迭代收斂性. 若初始狀態(tài)在某一批次跳出被控系統吸引域, 該批次內跟蹤誤差無法穩(wěn)定到最優(yōu)值. 基于不穩(wěn)定的前置控制經驗, 后續(xù)批次的跟蹤精度和收斂速度都會明顯降低. 因此, 在系統初始狀態(tài)有界變化的情況下設計2D穩(wěn)定ILMPC策略十分必要.

2.3.2   變參考軌跡

在實際批次生產中, 同一生產線通常需要承擔不同種類、不同規(guī)格產品的生產任務, 導致系統的參考軌跡會隨批次發(fā)生變化, 因此變參考軌跡問題一直是批次過程控制的研究熱點. 對于具有2D結構的ILMPC而言, 變參考軌跡帶來的影響不僅體現在迭代軸上, 還會沿時間方向持續(xù), 給ILMPC的系統性能分析帶來了很大困難. 相比之下, 采用沿批次的一維ILC控制, 只需在迭代方向上考慮參考軌跡變化量, 通過常規(guī)收斂性分析手段就可以推導出修正后的收斂性條件. 因此, 現有研究工作在變參考軌跡下的批次過程控制中基本都采用1D的改進ILC方法. 文獻[86]針對隨機系統變軌跡跟蹤問題, 提出兩種自適應ILC策略, 一是在控制器設計中選擇當前批次的輸出軌跡與下一批次的參考軌跡的差值作為新的狀態(tài)變量, 另一種是在每一個批次的末尾利用卡爾曼濾波器重新進行系統辨識; 文獻[87]針對離散非線性系統, 設計模糊自適應ILC控制器, 通過不斷更新模糊參數來近似變參考軌跡下的系統動態(tài); 文獻[25]設計基于數據驅動的自適應ILC控制器, 引入當前批次的參考軌跡作為反饋, 并將過去批次的參考軌跡作為前饋以實現對變參考軌跡的跟蹤. 然而, 1D的ILC算法仍存在實時抗干擾能力差、無法保證時域穩(wěn)定性和收斂速度慢等弊端, 亟需探索能夠解決變參考軌跡跟蹤控制問題的2D穩(wěn)定ILMPC策略.

2.3.3   變批次長度

經典批次過程控制假設每個批次的操作長度完全一致, 并基于此前提建立學習機制. 但在實際批次過程中, 生產周期改變、傳動裝置誤差以及不可控人為因素都會導致批次長度沿批次不斷變化[88]. 變批次長度問題的關鍵在于對過程信息的整合. ILMPC依靠前一批次的控制經驗調整當前批次的控制信號. 當相鄰批次的長度不等時, 必然會出現信息過剩或者信息不足的情況, 需要進行信息刪減或補償保證迭代學習沿批次按步推進. 近年來, 已有許多學者針對批次過程控制中的變批次長度問題開展了改進的一維ILC算法研究. 為將各批次過程數據調整為相同長度, 文獻[88-95]設定所有缺失的誤差信息為零, 文獻[96-98]將批次終端的誤差信號延長至期望長度; 為綜合利用多歷史批次數據, 文獻[88-91]引入了迭代平均算子, 利用歷史誤差數據的平均值更新ILC學習律; 文獻[94]采用高階學習結構, 根據多個歷史批次誤差數據和輸入數據的加權值更新控制律. 然而, 以上方法過多使用了控制效果較差的早期批次運行數據, 損失了迭代學習的最優(yōu)性. 對此, 文獻[99]提出一種基于改進復合能量函數(Composite energy function, CEF)的迭代學習機制, 令控制系統在每個采樣時刻只根據具有充足過程信息的最近一個批次更新學習律, 實現了對新近批次的優(yōu)先學習. 綜合來看, 現有的變長度批次過程控制方法仍然在如下方面需要改進: 首先, 已有誤差修正方法僅致力于構造等長的批次數據, 而忽視了補充信息精確性對系統學習性能的影響. 其次, 現有的學習結構通常缺乏靈活性, 無法同時適應學習數據為真實數據和補償數據的兩種情況. 利用ILMPC的時域預測功能能夠在變批次長度工況下對缺失誤差信息實現更為準確的補償; 針對不同數據類型需設計多種學習結構, 有利于同時保證學習經驗的先進性和實際性. 如何在2D框架下基于預測修正誤差進行變學習模式的ILMPC系統性能分析將是此課題的研究難點.

2.3.4   變模型參數

除了上述的初始狀態(tài)、參考軌跡和批次長度等外部條件, 批次過程自身的動態(tài)特性也會改變, 通常體現為模型參數沿批次方向發(fā)生變化. ILMPC的二維預測和優(yōu)化高度依賴系統模型的一致性, 變模型參數會破壞ILMPC時域和迭代域上的遞歸可行性, 增大了ILMPC二維穩(wěn)定性分析的難度. 目前, 關于批次過程變模型參數控制的研究仍局限在ILC領域. 在模型參數已知或可估計的情況下, ILC可以通過在更新方程中直接代入變模型參數或其上界, 構造自適應或魯棒學習律提高算法適應性, 并基于1D控制結構推導出系統的顯式收斂條件. 文獻[100-103]均采用線性高階內部模型(High-order internal model, HOIM)描述隨批次變化的系統動態(tài)特性, 構造自適應ILC策略得到系統的漸近收斂條件; 文獻[104-106]和文獻[107]分別就變參數狀態(tài)空間模型和變參數輸入輸出模型給出了線性系統在一般開環(huán)學習律控制下的有界條件和收斂條件; 文獻[108]結合廣義擴展狀態(tài)觀測器(Generalized extended state observer, GESO), 基于變參數線性狀態(tài)空間模型設計二自由度閉環(huán)魯棒ILC策略, 保證了系統跟蹤誤差的有界性. 借鑒ILC領域的理論成果, 在ILMPC中設計自適應和魯棒控制結構將是處理變模型參數問題的可行方案. 然而, 在改進ILMPC結構中如何確保二維遞歸可行并盡可能降低系統保守性仍是一個頗具難度的復雜問題.

綜上, ILMPC特有的二維控制結構給其建模、優(yōu)化和穩(wěn)定性都帶來了巨大挑戰(zhàn)(如圖6所示). 在建模中實現多階段迭代誤差估計和補償, 在優(yōu)化中實現最優(yōu)性和計算效率的平衡, 在穩(wěn)定性分析中突破嚴重復性條件的桎梏, 是ILMPC理論中亟待解決的三個關鍵科學問題.

圖 6  ILMPC的挑戰(zhàn)
Fig. 6  Challenges of ILMPC

隨著控制工程界對批次過程與連續(xù)過程的界定愈加清晰, 在過去20年間迭代學習模型預測控制立足于批次過程特有的“多重時變”性質向著更深的理論層次發(fā)展. ILMPC二維時變框架下的建模、優(yōu)化及適應性等瓶頸問題都得到了越來越多的關注, 衍生了一系列優(yōu)秀的階段性成果. 總體來看, ILMPC當前研究工作主要集中于兩個方向:

1) 由基于機理模型的ILMPC向基于數據模型的ILMPC過渡. ILC作為無模型算法, 通過學習積累的歷史批次數據實現對參考軌跡的高精度跟蹤, 實際上是一種數據驅動控制策略. 而MPC作為一種基于預測模型的優(yōu)化控制算法, 其時域控制效果很大程度上依賴于對系統動態(tài)模型的精確掌握. ILMPC繼承了ILC的學習能力和MPC的時域魯棒性, 但同時也丟失了ILC不依賴控制對象模型的優(yōu)勢. 當被控批次過程具有復雜非線性特征, 難以建立精確機理模型時, 經典ILMPC的實施面臨很大困難. 隨著機器學習在本世紀的井噴式發(fā)展, 很多學者開始利用神經網絡和強化學習等方法對ILMPC的控制結構進行轉化, 建立數據驅動ILMPC算法, 直接基于歷史數據辨識被控系統的2D動態(tài)特性用于時域預測, 打破了模型預知這一嚴苛條件對ILMPC理論深化和應用拓展的束縛.

2) 對已有的ILMPC理論進行擴展和改進, 使其滿足批次過程在承擔不同生產任務時的特殊需求. 批次過程類型眾多、生產條件各異, 從系統動態(tài)上可分為快時變和慢時變, 從運行條件上可分為設計工況和變工況. 對于快時變批次過程, 需要在ILMPC設計中關注控制器的計算效率問題, 確??刂频膶崟r性. 對于存在變初始狀態(tài)、變參考軌跡、變批次長度以及變模型參數等變工況擾動的批次過程, 必須在ILMPC設計中解決其引發(fā)的系統不確定性問題. 近年來, ILMPC研究領域的學者利用魯棒、自適應、模糊、神經網絡以及預測函數等先進技術, 對經典ILMPC框架進行了系統而深入的改進, 針對性地解決了實際批次過程的控制需求, 極大地豐富了ILMPC的理論體系和應用場景.

隨著工業(yè)過程的生產規(guī)模及結構復雜性不斷增長, 許多批次過程呈現出強非線性動態(tài)特性, 難以通過分析生產過程的內部機制或者物質流的傳遞機理獲取其精確機理模型. 近年來, 直接利用離線數據進行優(yōu)化控制的方法備受關注. 在當前階段, 數據驅動迭代學習模型預測控制的研究方向大致分為兩類:

1) 基于批次過程不斷產生的有限時域過程數據利用神經網絡沿迭代軸辨識系統的二維預測模型, 再基于神經網絡模型進行ILMPC的優(yōu)化求解. 針對仿射型非線性批次過程, 文獻[56]采用控制仿射型前饋神經網絡(Control affine feedforward neural network, CAFNN)對復雜非線性批次過程的重復動態(tài)特性進行迭代建模, 構建基于Tube的數據驅動ILMPC, 保證在存在建模誤差時系統跟蹤軌跡能夠收斂至參考軌跡附近的不變集內; 針對非仿射型非線性批次過程, 文獻[73]采用了徑向基(Radial basis function, RBF)神經網絡對其動態(tài)特性進行辨識, 并在數據驅動ILMPC中結合CEF實現建模誤差和跟蹤誤差沿迭代軸的收斂.

2) 直接利用系統離線數據擬合每個批次內輸入序列與輸出序列間的轉移矩陣, 基于所得輸入輸出模型對未來多個批次的輸出序列進行預測. 文獻[109-110]針對預測所需未來批次過程動態(tài)無法獲得的難題, 提出了一種基于不斷積累的批次過程離線數據估計未來批次系統轉移矩陣的新算法, 成功構造了沿迭代軸的數據驅動ILMPC策略; 文獻[30]考慮批次過程不確定性未知的情況, 利用離線數據中包含的過程信息對未來批次的系統整體動態(tài)進行預測, 消除不確定項對ILMPC跟蹤性能的影響.

為了適應工業(yè)機器人[111]、運載工具[112]以及快速化學反應器[113]等快動態(tài)非線性批次過程的高效率控制需求, 建立計算負擔低的優(yōu)化控制策略也是現今ILMPC領域的研究熱點之一. 通常采用的手段是將控制對象復雜的非線性動態(tài)表征為線性形式, 從而實現非凸優(yōu)化問題到凸優(yōu)化問題的轉化, 降低優(yōu)化求解的在線計算量. 文獻[114]介紹了一種即時學習(Just-in-time-learning, JITL)方法, 根據輸入輸出數據將非線性模型沿標稱軌跡線性化, 建立線性時變參數模型; 文獻[115]直接沿參考軌跡通過泰勒展開線性化非線性模型, 并在控制器設計中對線性化高階項誤差進行補償, 能夠同時保證計算效率和跟蹤精度.

此外, 降低待優(yōu)化變量維數也是提高控制效率的有效途徑之一. 文獻[115-116]在時域控制上采用了具有特殊結構的預測函數控制, 通過將待優(yōu)化變量表示為一系列基函數的加權和, 將維數較高的控制時域輸入序列求解問題轉變?yōu)榫S數較低的基函數權重系數序列求解問題, 從而顯著提高在線求解速度.

變工況控制是拓展ILMPC策略應用范圍必須克服的難點問題. 隨著經典ILMPC理論逐漸發(fā)展成熟, 近幾年來變初始條件、變參考軌跡以及變批次長度等工程實踐問題受到越來越多專家學者的關注, 打破經典ILMPC要求各批次工況完全一致帶來的應用桎梏已成為當前研究亟需解決的問題.

針對變初始條件問題, 通常有兩種解決思路. 一是構造基于終端約束的ILMPC策略[117], 利用可行初始狀態(tài)軌跡計算控制器的終端約束集及終端代價函數, 并通過迭代逐步提高控制最優(yōu)性; 二是先采用固定初態(tài)的系統方程進行二維預測, 再通過系統真實輸出與預測輸出的差值數據對控制律更新方程不斷修正[118].

有關變參考軌跡的ILMPC研究工作主要分為兩個方向: 經過固定期望點的變參考軌跡跟蹤控制和全區(qū)間變參考軌跡跟蹤控制. 前一研究方向針對只需在部分采樣點跟蹤參考值的特定批次過程, 設定系統參考軌跡為穿越各個期望點的隨機軌跡, 將參考軌跡跟蹤問題縮小為固定點跟蹤問題, 通過建立點對點ILMPC策略[51119], 保證系統對期望點的跟蹤精度; 后一研究方向針對參考軌跡全工作區(qū)間變化的一般情況, 將其變化量表示為ILMPC的迭代擾動項, 結合魯棒控制技術加以抑制[120-121], 保證系統對整個參考軌跡的跟蹤精度.

ILMPC算法的核心思想是在滾動時域下基于前一批次的控制經驗對當前批次的控制輸入進行校正, 其中隱含了相鄰批次等長的條件. 變批次長度打破了迭代學習功能依賴的基本前提, 給ILMPC的2D遞歸可行性和穩(wěn)定性分析帶來了巨大挑戰(zhàn). 因此, 變批次長度是實現ILMPC所面臨的最嚴峻的變工況問題, 目前還沒有建立與之相對應的完善的ILMPC策略. 文獻[122]中討論了一種具有預測功能的改進ILC策略, 通過建立系統輸入輸出預測模型, 采用預測值對數據缺失的批次進行補充, 將每一批次的過程數據重構為相等長度. 這為在ILMPC中建立缺失信息預測補償機制提供了參考, 在此基礎上繼續(xù)探索變批次長度下的多學習模式和2D性能分析方法是當今ILMPC的理論研究新趨勢.

迭代學習模型預測控制理論正朝著無模型、強魯棒性、強適應性的方向迅速發(fā)展, 這為其在實際工業(yè)過程中的應用提供了有力支撐. 截至目前, ILMPC策略已在化工[123-127]、電力[46]、供熱[128]、醫(yī)療[129-131]、精密儀器[132]等多個領域取得成功應用. 香港科技大學高福榮教授團隊在注塑過程迭代學習模型預測控制方面開展了卓有成效的研究工作[4750123], 實現了對注射速度的精準控制, 提升了注塑產品質量和生產效益. 山東科技大學王友清教授團隊將ILMPC成功應用于人工胰臟智能控制[129-131], 根據患者血糖動態(tài)變化實時調節(jié)胰島素注射速度.

ILMPC的實際應用不僅限于化學反應器、注塑機、機械手臂等典型間歇過程, 也廣泛滲透于發(fā)電、供熱、煉鋼等典型連續(xù)過程. 對于動態(tài)變化具有重復性的連續(xù)過程, 可以對其操作流程進行人為的周期劃分, 構造ILMPC所需的“迭代軸”. 目前, 基于模糊建模的ILMPC已應用至火力發(fā)電控制[46], 通過迭代學習周期性歷史數據保證了對負荷指令的快速、準確跟蹤. 這種周期劃分方法打破了迭代學習模型預測控制與連續(xù)過程間的應用屏障, ILMPC將向著應用場景多樣化、應用形式靈活化的方向繼續(xù)發(fā)展.

作為智能制造的重要生產方式, 批次過程的最終控制目標是保證各批次持續(xù)產出高質量成品, 提高經濟效益和社會效益. 結合迭代學習模型預測控制的發(fā)展現狀和批次過程控制的特殊需求, ILMPC的未來研究工作需要在解決復雜非線性建模、2D高效優(yōu)化以及變工況適應性的基礎上綜合考慮批次生產過程的經濟性問題, 其途徑主要包含兩個層面: 設計成品質量預測和控制策略、建立二維動態(tài)經濟優(yōu)化機制.

實際批次過程通常無法直接監(jiān)測產品質量, 大多通過測量溫度、壓力等過程參量并令其跟蹤預設的變化軌跡保證成品質量. 因此, ILMPC自誕生以來大都以跟蹤預定軌跡為控制目標. 但是各批次間配料和進程的偏差以及隨機干擾都會導致既定的參考軌跡不再具有質量最優(yōu)性. 在ILMPC基礎上建立質量評價體系, 沿時間軸同時進行系統輸出序列和成品質量預測, 共同優(yōu)化參考軌跡跟蹤性能和成品質量指標, 能夠實現對批次過程產品質量的實時調控. 基于此思想, 韓國學者Lee等提出了早期的質量批次模型預測控制(Quality BMPC, QBMPC)策略[133-135], 利用推斷控制技術推導在線過程可測變量與成品質量間的相關性模型(又稱軟傳感器), 并將其與系統動態(tài)模型組合形成增廣預測模型, 實現對成品質量的實時預測和優(yōu)化(圖7). 該策略在甲基丙烯酸甲酯(Methyl methacrylate, MMA)聚合反應控制中取得成功應用[136].

圖 7  QBMPC結構
Fig. 7  Scheme of QBMPC

然而, 批次過程的成品質量與過程因素及環(huán)境因素都存在著錯綜復雜的關系, 無論是線性相關模型還是非線性回歸模型都難以對其進行可靠、準確的預測, 這導致QBMPC的研究熱潮僅在本世紀初曇花一現, 隨后便一直處于發(fā)展停滯狀態(tài). 現今工業(yè)大數據及人工智能技術的迅速崛起有望為QBMPC注入新的活力, 依靠實際批次過程豐富的數據支持和神經網絡強大的辨識能力, 建立精確的成品質量預測模型將不再是難題, 高度發(fā)展的數據驅動建模技術將使QBMPC策略重新成為批次過程控制領域的研究熱點.

為實現運行優(yōu)化與反饋控制的有效結合[137-138], 實際批次過程通常采用分層控制結構[139-140], 如圖8(a)所示. 在實時優(yōu)化層(Real-time optimization, RTO)優(yōu)化經濟性能指標獲得最優(yōu)參考軌跡, 再將參考軌跡傳遞給動態(tài)控制層進行跟蹤控制. ILMPC策略通常應用于動態(tài)控制層, 利用其迭代學習和滾動優(yōu)化的特點, 實現對參考軌跡的高精度穩(wěn)定跟蹤. 然而, 這種分層結構只在上層考慮了系統經濟性能, 丟失了動態(tài)跟蹤過程中的經濟信息. 當被控過程出現模型失配、隨機干擾等不確定性時, 上層優(yōu)化得到的參考軌跡不再是動態(tài)跟蹤過程的經濟最優(yōu)軌跡.

圖 8  傳統分層控制結構與ILEMPC結構對比
Fig. 8  Comparison of hierarchical control structure and ILEMPC structure

經濟模型預測控制(Economic model predictive control, EMPC)將實時優(yōu)化和動態(tài)控制融合在一個框架下實現, 直接采用經濟性能指標作為動態(tài)跟蹤問題的目標函數, 可以有效提高系統動態(tài)經濟性能[141-143]. 近期, 許多學者開始嘗試將EMPC理念與傳統ILMPC結合[144-147], 形成了迭代學習經濟模型預測控制(Iterative learning economic model predictive control, ILEMPC), 它通過優(yōu)化基于前次迭代數據的滾動時域經濟性能指標獲得每一時刻的控制輸入, 其結構如圖8(b)所示. 與經典ILMPC沿迭代軸提高跟蹤精度不同, ILEMPC沿迭代軸直接實現系統經濟性能的穩(wěn)步提升, 目前已在間歇化學反應器[145-146]和太陽能熱水器[148]控制中取得成功應用.

然而, 作為一種新興控制結構, ILEMPC在控制性能定性分析方面還存在明顯欠缺. 首先, 經濟目標函數通常具有非二次型形式, 使得傳統的終端約束集方法無法保證系統的時域Lyapunov穩(wěn)定性, 進而會影響迭代收斂性. 如何將EMPC的穩(wěn)定性理論(如基于強耗散性的終端約束EMPC[142]、基于Lyapunov收縮約束的雙模EMPC[149])運用至二維的ILEMPC系統是未來研究的重要內容; 其次, 與傳統ILMPC算法需保證跟蹤誤差沿迭代軸收斂至最小值不同, ILEMPC追求的是動態(tài)經濟性能沿迭代軸收斂至最優(yōu). 對于各類批次過程如何設定經濟目標函數并建立合理的經濟性能迭代分析方案是ILEMPC在未來發(fā)展中必須解決的關鍵問題.

總體來說, ILMPC理論在過去20多年間呈現快速發(fā)展趨勢, 在變工況適應性、魯棒性、控制效率等方面已取得矚目成績, 在經濟性方面正以完善理論體系、拓寬應用范圍為目標逐步深入. 未來ILMPC的理論研究需緊密跟隨批次過程智能化、精細化的趨勢, 在深化迭代學習功能的同時加強與工業(yè)大數據的交互, 汲取工業(yè)控制領域與其他交叉學科的最新成果, 實現在精度、靈活性、安全性、高效性等控制性能上的不斷提升, 并兼顧對現有2D穩(wěn)定性分析方法的拓展和突破.


關鍵字:優(yōu)秀論文

網絡客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯盟所提供的信息資源如有侵權、違規(guī),請及時告知。

版權所有:中州期刊聯盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關注”中州期刊聯盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言