局部時差約束鄰域保持嵌入算法在故障檢測中的應用

作者：王琨侍洪波譚帥宋冰陶陽來源：《化工學報》日期：2022-11-02人氣：1025

在現(xiàn)代工業(yè)過程中，系統(tǒng)規(guī)模越來越大，流程也越來越復雜[1-2]，一旦故障發(fā)生，不僅會影響生產(chǎn)效率，甚至會造成重大的安全事故。同時，隨著傳感器技術、實時存儲技術和信息管理系統(tǒng)的發(fā)展[3]，大量在線和離線數(shù)據(jù)更易被獲取和存儲[4-5]。因此，為了保證工業(yè)過程的生產(chǎn)安全，數(shù)據(jù)驅(qū)動的過程監(jiān)測和控制技術越來越受關注[6]，多元統(tǒng)計過程監(jiān)控(multivariate statistical process monitoring，MSPM)方法作為數(shù)據(jù)驅(qū)動過程監(jiān)控方法的典型代表，得到了廣泛的研究[7]。目前常用的MSPM方法有主成分分析(principal component analysis，PCA)、偏最小二乘(partial least squares，PLS)、獨立主元分析(independent component analysis，ICA)等，這些方法對過程數(shù)據(jù)進行降維[8-11]并基于提取的特征信息建立模型。然而，這些方法僅考慮樣本間的全局特性，并沒有關注局部包含的結構關系，這將忽略隱藏在高維空間中的更多信息。

近年來，基于流形學習的方法得到快速發(fā)展[12]，拉普拉斯特征映射(Laplacian eigenmaps，LE)[13]、局部線性嵌入(locally linear embedding，LLE)[14]和等距映射(isometric feature mapping，ISOMAP)[15]等非線性流形學習算法被提出，這些方法可以從高維采樣數(shù)據(jù)中揭示低維流形結構以實現(xiàn)維數(shù)的約簡，但運算成本高且得到的投影僅在訓練數(shù)據(jù)上定義。He等[16]提出局部保持投影(locality preserving projections, LPP)，它作為一種線性流形學習算法，對LE算法進行線性近似，不僅保留了諸如LE、LLE非線性算法的數(shù)據(jù)屬性，還可以被定義在環(huán)繞空間的任何地方，而不僅限于訓練數(shù)據(jù)中。He等[17]進一步提出鄰域保持嵌入(neighborhood preserving embedding, NPE)，也是通過鄰域近似線性表示得到投影矩陣，但目標函數(shù)表示為最小化重構誤差，目前也成功應用于故障檢測領域[18-21]。但無論是關注全局結構信息的典型多元統(tǒng)計方法還是關注局部結構信息的流形學習方法，它們都基于數(shù)據(jù)樣本獨立分布的假設建立靜態(tài)模型，忽略了樣本在連續(xù)時間采集過程中的相關性[22]。

在實際工業(yè)中，變量可能受到噪聲等干擾使其在穩(wěn)態(tài)值附近波動，該過程便具有動態(tài)行為特征。Ku等[23]提出動態(tài)主成分分析算法(dynamic PCA, DPCA)，通過加入時間延遲因子的方法來表示模型中的動態(tài)行為，利用時間窗將連續(xù)時間的樣本依次排列，形成增廣矩陣作為模型訓練的輸入。Li等[24]提出動態(tài)鄰域保持嵌入(dynamic neighborhood preserving embedding，DNPE)算法將原始數(shù)據(jù)矩陣轉(zhuǎn)換為增廣數(shù)據(jù)，既保留了NPE算法的優(yōu)勢又克服了無法考慮時序相關性的問題，然后利用LSSVM方法實現(xiàn)對數(shù)據(jù)的多類評價。趙小強等[25]提出GSFA-GNPE算法，通過計算順序相關矩陣，對過程變量的特性進行評估，劃分為動態(tài)子空間和過程子空間，根據(jù)得到的混合模型指標實現(xiàn)過程監(jiān)控。但是，這些算法廣泛關注的是樣本的全局時間特性，并沒有充分挖掘局部時間特性。

針對全局結構信息無法準確反映樣本間關系和時序相關性未被考慮兩個問題，本文在傳統(tǒng)NPE算法基礎上提出一種新的數(shù)據(jù)降維和特征提取方法——LTDCNPE算法，它使用一種全新的方式選擇近鄰樣本來對原始樣本進行重構。不同于大部分算法單純使用歐氏距離的大小來選擇鄰域，很多距離小的樣本可能時間尺度上相隔較遠，導致鄰域中選擇了時間上關系很小但距離相隔很近的樣本，這在一定程度上會影響特征的提取。LTDCNPE算法同時兼顧時序相關性和局部空間結構信息，任意選取一個樣本作為中心點，根據(jù)樣本時間上的相關性大小選定一個長度固定的時間窗，再利用中心點與時間窗內(nèi)其他每個采樣點之間的時間關系和二者之間的距離，來構造更加合理的鄰域選擇標準，并將時間關系作為近鄰樣本的權值，來提高系統(tǒng)的故障檢測精度。本文將LTDCNPE算法用于工業(yè)過程的故障檢測，分別在特征空間中構造 $T^{2}$ 統(tǒng)計量和在殘差空間中構造SPE統(tǒng)計量來進行檢測。最后利用數(shù)值例子和TE仿真過程對該方法的有效性進行實驗驗證。

1 NPE算法介紹

NPE算法通過求解特征映射 $A = [a_{1}, a_{2}, ?, a_{d}] \in$ $R^{D \times d}$ 將原始的輸入矩陣 $X = [x_{1}, x_{2}, ?, x_{N}] \in R^{D \times N}$ 從高維空間映射到低維特征空間 $Y = [y_{1}, y_{2}, ?, y_{N}] \in$ $R^{d \times N} (d < D)$ 。其中， $N$ 為樣本數(shù)， $D$ 為變量數(shù)， $d$ 為降維后保留的維數(shù)。算法具體流程如下。

首先，利用k-NN方法為原始訓練數(shù)據(jù) $X$ 的每個樣本點 $x_{i}$ 尋找與其歐氏距離最近的 $k$ 個近鄰點 $\{x_{j} |j = 1,2, ?, k\}$ 構造鄰域連接圖，并對 $x_{i}$ 進行重構。通過最小化重構誤差 $E$ 來求解最優(yōu)權值系數(shù)矩陣 $W$ ，計算公式如式(1)所示。

$\begin{array}{l} E (W) = m i n {\sum_{i = 1}^{N} ‖x_{i} - \sum_{j = 1}^{k} W_{i j} x_{j}‖}^{2} \\ s . t . \sum_{j = 1}^{k} W_{i j} = 1 \end{array}$ (1)

式中， $W_{i j}$ 表示對不同結點的權值，即 $x_{j}$ 對 $x_{i}$ 重構的貢獻。

然后，通過特征映射矩陣 $A$ 將 $X$ 投影到低維空間中，得到 $Y$ 。

$Y = A^{T} X$ (2)

根據(jù)低維空間可以利用與在原始高維空間中相同的權值進行重構這一特點，利用式(1)得到的權值系數(shù)矩陣來重構對應的低維數(shù)據(jù)樣本 $y_{i}$ ，相應的特征映射矩陣 $A$ 可以通過最小化以下?lián)p失函數(shù)求解得到。

$E (A) = m i n {\sum_{i = 1}^{N} ‖y_{i} - \sum_{j = 1}^{k} W_{i j} y_{j}‖}^{2} = m i n t r (A^{T} X M X^{T} A)$ (3)

式中， $y_{j}$ 是樣本 $y_{i}$ 的第 $j$ 個近鄰點； $M = {(I - W)}^{T} (I - W)$ ， $I$ 為單位矩陣。

最后，利用拉格朗日乘子法進行轉(zhuǎn)換，將式(3)變換為如下廣義特征值求解形式。

$X M X^{T} A = λ X X^{T} A$ (4)

獲得的前 $m$ 個最小特征值所對應的特征向量即可組成特征映射矩陣 $A$ 。

2 基于LTDCNPE的故障檢測

NPE算法根據(jù)樣本之間的歐氏距離選擇鄰域來對中心樣本進行重構，但是在化工過程中，一段時間內(nèi)的連續(xù)樣本之間具有時序相關性[26]。傳統(tǒng)的NPE方法僅考慮樣本間的空間關系，忽略了樣本間的時序關系，使得檢測效果變差。因此，本文將提出的LTDCNPE算法用于化工過程故障檢測，希望在一個時間窗內(nèi)通過同時考慮時間和空間上的局部性來進行鄰域挑選，并利用時差為近鄰樣本賦權，進而提取更為合理的特征。

2.1 LTDCNPE算法

2.1.1 挑選鄰域

在選擇鄰域前，LTDCNPE算法先對選擇的范圍進行了預縮減，根據(jù)連續(xù)過程樣本間的時序相關性尋找一個長度為 $L$ 的時間窗，保證范圍內(nèi)的樣本包含大部分主要信息。具體地，以給定數(shù)據(jù)集 $X = [x_{1}, x_{2}, ?, x_{N}] \in R^{D \times N}$ 的任一樣本 $x_{i}$ 為中心劃取時間窗，得到時間維度上的縮減鄰域。時間窗大小可以通過過程變量平方和的自相關來確定[27]，這樣當時間距離大于確定的時間窗長度時，相關性可以被忽略。

但通過時間窗得到的縮減鄰域所包含的樣本并非全部適合重構 $x_{i}$ ，需要在此基礎上利用式(5)反映鄰域樣本與 $x_{i}$ 在局部時間和空間上的差異，選取與 $x_{i}$ 更相關的 $k$ 個近鄰點。第 $j$ 個鄰域樣本 $x_{j}$ 與 $x_{i}$ 的差異 $B_{i, j}$ 計算方式如式(5)所示。

$B_{i, j} = T_{i, j} D_{i, j}$ (5)

式中， $D_{i, j}$ 為空間約束，具體表示為樣本點 $x_{i}$ 和 $x_{j}$ 的歐氏距離，反映空間上的遠近； $T_{i, j}$ 為時間約束，反映局部時間差異。

LTDCNPE算法和NPE算法對空間結構上的特征提取均是利用式(6)來實現(xiàn)的。當僅考慮局部空間差異時，鄰域樣本選擇的示意圖如圖1所示。

$D_{i, j} = {‖x_{i} - x_{j}‖}^{2}$ (6)

圖1

圖1 僅考慮空間距離的樣本分布

中心樣本；時差小的近鄰樣本；時差大的近鄰樣本

Fig.1 Sample distribution considering only spatial distance

LTDCNPE算法中的局部時差由式(7)體現(xiàn)。

$T_{i, j} = e x p (- \frac{t_{1}}{t_{2} t_{3}}) = e x p (- \frac{{|t (x_{i}) - t (x_{j})|}^{2}}{\sum_{q = 1}^{l} |t (x_{i}) - t (x_{i}^{q})| \sum_{q = 1}^{l} |t (x_{j}) - t (x_{j}^{q})|})$ (7)

式中， $t (x_{i})$ 為任意從 $X$ 中選擇的樣本所對應的采樣時間； $t (x_{j})$ 為樣本 $x_{i}$ 的第 $j (j = 1,2, ?, L)$ 個近鄰點所對應的采樣時間； $t (x_{j}^{q})$ 為 $x_{j}$ 的第 $q (q = 1,2, ?, l)$ 個近鄰樣本對應的采樣時間； $t (x_{i}^{q})$ 為 $x_{i}$ 的第 $q$ 個近鄰點所對應的時間，值得注意的是，該值雖然與 $t (x_{j})$ 均表述的是 $x_{i}$ 的近鄰點，但在每一次計算 $B_{i, j}$ 時， $j$ 只有一個固定值，而 $q$ 卻是一個 $1 ~ l$ 的范圍值。

具體地，在 $x_{i}$ 和 $x_{j}$ 選定以后，時間項 $T_{i, j}$ 的分子值也隨即確定，當 $x_{i}$ 和 $x_{j}$ 分別與周圍的近鄰樣本點在時間相關上越緊密，也即 $T_{i, j}$ 的兩個分母值越小， $T_{i, j}$ 整體數(shù)值也會越小，表示由兩個集群所表示的 $x_{i}$ 和 $x_{j}$ 在時間上也就越疏遠。

對照以上分析，將圖1中的中心樣本及其鄰域投影到時間軸上，此時的示意圖如圖2(a)所示。當考慮了鄰域樣本的局部時序關系后，該算法將圖2(a)中距離中心樣本近而時間相隔較遠的樣本剔除，并選擇在時間和空間兩種約束下更為緊密的近鄰樣本，如圖2(b)所示，可以看出 $T$ 的數(shù)值變化對樣本間局部時間的刻畫是合理的。

圖2

圖2 時間投影上的樣本分布

中心樣本；時差小的近鄰樣本；時差大的近鄰樣本

Fig.2 The sample distribution on the time projection

2.1.2 鄰域加權

當在時間窗中根據(jù) $B_{i, j}$ 選擇出 $k$ 個近鄰樣本之后，樣本 $x_{i}$ 對應的局部時差樣本個數(shù)由原來的 $L$ 個變?yōu)?span style="box-sizing: border-box;padding: 0px"> $k$ 個， $T_{i, j}$ 的表示改為 $T_{i, s}$ $(s = 1, ?, k)$ 。 $x_{i}$ 的 $k$ 個近鄰為 $\{x_{s} | s = 1,2, ?, k\}$ 。對時間約束矩陣進行歸一化處理，如式(8)所示。

$P_{i, s} = \frac{T_{i, s}}{\sum_{s = 1}^{k} T_{i, s}}$ (8)

然后，用于訓練的樣本變量經(jīng)過式(9)實現(xiàn)加權。

$z_{i, s} = P_{i, s} ? x_{s}$ (9)

式中， $z_{i, s}$ 表示對樣本 $x_{i}$ 的第 $s$ 個近鄰樣本加權后的向量； $?$ 是克羅內(nèi)克積。

2.1.3 計算權值系數(shù)矩陣和映射矩陣

利用時間關系為近鄰樣本加權后，按式(10)求解使重構誤差最小的權值系數(shù)矩陣 $W$ 。

$\begin{array}{l} E (W) = m i n \sum_{i = 1}^{N} {‖x_{i} - \sum_{s = 1}^{k} W_{i, s} z_{i, s}‖}^{2} \\ s . t . \sum_{s = 1}^{k} W_{i, s} = 1 \end{array}$ (10)

利用 $W$ 計算從高維原始空間到低維空間的特征映射矩陣 $A$ ，具體見式(11)、式(12)。

$E (A) = m i n {\sum_{i = 1}^{N} ‖y_{i} - \sum_{s = 1}^{k} W_{i, s} y_{s}‖}^{2}$ (11) $y_{s} = A^{T} x_{s}$ (12)

2.2 使用LTDCNPE進行故障檢測

為了提高故障檢測模型在化工過程中的監(jiān)控效果，本文使用提出的LTDCNPE算法獲得投影矩陣 $A$ ，從新樣本 $x_{n e w} \in R^{D 1}$ 中提取出具有時間和空間局部特性的特征向量 $y_{n e w} \in R^{d 1}$ 。隨后，采用Hotelling $T^{2}$ 統(tǒng)計量以及SPE統(tǒng)計量來進行故障檢測，計算公式為

$\begin{array}{l} T^{2} = y_{n e w}^{T} Λ^{- 1} y_{n e w} \\ S P E = {‖x_{n e w} - {\overset{?}{x}}_{n e w}‖}^{2} \end{array}$ (13)

其中， $Λ$ 為 $Y$ 的樣本協(xié)方差矩陣

$\begin{array}{l} Λ = \frac{1}{N - 1} \sum_{i = 1}^{N} y_{n e w} y_{n e w}^{T} \\ {\overset{?}{x}}_{n e w} = A y_{n e w} \end{array}$ (14)

因為核密度估計（kernel density estimation, KDE）方法[28-29]使用方便且具有更普遍的意義，本文使用該方法估計統(tǒng)計量的控制限，假設 $x$ 是一個隨機變量， $p (x)$ 為其密度函數(shù)，具體表達見式(15)。

$P (x < b) = \int_{- \infty}^{b} p (x) d x$ (15)

在已知 $p (x)$ 情況下，可以確定一個特定置信區(qū)間條件下的控制極限，這里選取的置信度為0.99，通過核函數(shù) $K (\cdot)$ 對 $x$ 的概率密度函數(shù)進行估計，定義公式如下。

$\overset{?}{p} (x) = \frac{1}{N h} K (\frac{x - x_{k}}{h})$ (16)

式中， $x_{k}$ ( $k = 1,2, ?, N$ )是 $x$ 的采樣點； $h$ 為帶寬，這里的核函數(shù)一般選用高斯函數(shù)。

基于LTDCNPE算法進行離線建模和在線監(jiān)控的具體實施步驟如下。

離線建模階段：

(1) 以正常數(shù)據(jù) $X \in R^{D \times N}$ 作為訓練數(shù)據(jù)，采用z-score方法進行數(shù)據(jù)預處理；

(2) 利用式(6)、式(7)計算樣本間的空間約束 $D_{i, j}$ 和時間約束 $T_{i, j}$ ；

(3) 式(5)計算得到的局部差異 $B_{i, j}$ 作為選擇 $x_{i}$ 鄰域的標準，并選取最小的前 $k$ 個樣本作為重構樣本；

(4) 利用式(8)、式(9)得到歸一化后的時間約束 $P_{i, s}$ 作為權值和加權后的近鄰樣本 $z_{i, s}$ ；

(5) 根據(jù)最小化公式式(10)獲得權值系數(shù)矩陣 $W$ ，并利用式(11)求解前 $m$ 個最小特征值對應的特征向量，得到特征映射矩陣 $A$ ；

(6) 根據(jù)式(13)計算訓練數(shù)據(jù)的 $T^{2}$ 和SPE統(tǒng)計量，并使用KDE方法估計統(tǒng)計量的控制限。

在線監(jiān)控階段：

(1) 獲取新樣本 $x_{n e w}$ ，利用正常樣本下求得的均值和方差對其進行標準化處理；

(2) 利用離線建模步驟(5)獲得的特征映射矩陣 $A$ 對 $x_{n e w}$ 進行線性降維；

(3) 計算新樣本的 $T^{2}$ 和SPE統(tǒng)計量，將其與控制限進行對比，判斷是否為故障樣本。

3 仿真實驗

為了說明LTDCNPE算法的有效性，本文使用數(shù)值例子和TE仿真實驗進行故障檢測，并將所提出算法的性能與經(jīng)典算法PCA、NPE及其時間相關的衍生算法DNPE[24,30-31]進行了比較。

3.1 數(shù)值例子仿真

本文采用Ku等[23]提出的多元動態(tài)過程來驗證所提方法的有效性：

$\begin{array}{l} z (t) = A z (t - 1) + B u (t - 1) \\ y (t) = z (t) + v (t) \end{array}$ (17)

式中， $A = [\begin{matrix} 0.188 & - 0.191 \\ 0.847 & 0.264 \end{matrix}]$ ； $B = [\begin{matrix} 1 & 2 \\ 3 & - 4 \end{matrix}]$ ； $u (t)$ 、 $v (t)$ 和 $z (t)$ 分別代表輸入、輸出和狀態(tài)變量， $v (t)$ 為服從正態(tài)分布 $N (0,0.1)$ 的測量噪聲， $u (t)$ 的表示如式(18)所示：

$u (t) = [\begin{matrix} 0.811 & - 0.226 \\ 0.477 & 0.415 \end{matrix}] u (t - 1) + [\begin{matrix} 0.193 & 0.689 \\ - 0.320 & - 0.749 \end{matrix}] w (t - 1)$ (18)

式中， $w (t)$ 是服從 $N (0,1)$ 分布的白噪聲。用于過程監(jiān)控的數(shù)據(jù)向量表示為 $x (t) = [\begin{matrix} y (t) & u (t) \end{matrix}]$ 。在正常的運行狀態(tài)下，采集500個樣本作為訓練數(shù)據(jù)。將本文提出的LTDCNPE算法和DNPE、NPE算法的近鄰數(shù)設為 $k = 4$ 。PCA的主元數(shù) $d = 2$ ，由85%的方差貢獻率確定。為了對比的公平性，LTDCNPE、NPE也降維到 $d = 2$ 。測試數(shù)據(jù)同樣采集500個樣本，從第201個樣本開始引入故障。故障描述如表1所示。

表1 過程故障描述

Table 1 Process fault description

故障	描述
1	對 $u (t)$ 引入幅值為2的階躍故障
2	系數(shù)矩陣 $A$ 的第 $2 \times 2$ 個元素值由0.264變?yōu)?.500，使狀態(tài)變量 $z (t)$ 之間的動態(tài)關系發(fā)生變化

新窗口打開| 下載CSV

測試集中各算法的漏報率（miss alarm rate, MAR）總結在表2中，用粗體數(shù)值表示檢測結果的最優(yōu)值。由表2可以看出當故障1發(fā)生時，PCA算法和NPE算法的 $T^{2}$ 有很多漏報，而DNPE算法和LTDCNPE算法的兩個統(tǒng)計量漏報率都相對較低，且LTDCNPE算法的 $T^{2}$ 漏報率僅有0.33，效果更好。在故障2中，四種方法的結果相差不大，但是LTDCNPE算法仍然保持最低的 $T^{2}$ 漏報率。以上結果表明對時序系統(tǒng)進行監(jiān)控時，LTDCNPE算法更加合理地考慮了連續(xù)數(shù)據(jù)間的時間關聯(lián)。

表2 數(shù)值例子的漏報率

Table 2 MAR in case study

Fault	MAR/%
	PCA		NPE		DNPE		LTDCNPE
	$T^{2}$	SPE	$T^{2}$	SPE	$T^{2}$	SPE	$T^{2}$	SPE
1	58.67	1.33	62.00	2.00	1.00	1.32	0.33	2.00
2	1.67	1.67	1.67	1.67	1.66	1.66	1.39	1.67

新窗口打開| 下載CSV

圖3是四種方法針對故障1數(shù)據(jù)的二維投影結果。可以看出，圖3(a)~(c)的故障樣本投影后有接近一半超過橢圓控制限，使正常樣本和故障樣本在二維投影平面上大量重疊，無法進行區(qū)分。而LTDCNPE算法可以通過橢圓形的控制限將測試數(shù)據(jù)中的正常數(shù)據(jù)和故障數(shù)據(jù)很好地分開，兩部分數(shù)據(jù)幾乎沒有重疊，表明數(shù)據(jù)中的時間序列在低維空間中得到了較好的保留和利用，從而提高了映射空間的質(zhì)量。圖4是四種方法針對故障1數(shù)據(jù)的控制圖。其中，圖4(a)、(b)的 $T^{2}$ 漏報率明顯偏高，圖4(c)、4(d)的 $T^{2}$ 及SPE統(tǒng)計量明顯高于控制限，但當故障剛發(fā)生時，LTDCNPE的 $T^{2}$ 統(tǒng)計量可以更早發(fā)現(xiàn)故障，從而減少漏報率。

圖3

圖3 數(shù)值例子故障1的 $T^{2}$ 檢測結果

* 正常樣本；〇故障樣本；— 控制限

Fig.3 $T^{2}$ results of fault 1 in case study

圖4

圖4 數(shù)值例子故障1的控制圖

Fig.4 Control diagram of fault 1 in case study

3.2 TE過程仿真

TE過程是對實際工業(yè)過程的模擬，該平臺廣泛應用于控制技術和監(jiān)測方法的開發(fā)、研究和評價[1,10,32-33]。該工藝過程包括反應器、冷凝器、壓縮機、分離器和汽提塔5個主要生產(chǎn)單元[34]，8種成分，22個連續(xù)過程變量，19個成分變量，12個控制變量，21種故障。由于實際過程中的攪拌速率和成分變量很難實時采集，因此選用剩余的33個變量作為監(jiān)控的連續(xù)過程變量。故障4為反應器冷卻水入口溫度的一個階躍變化，但在實際中相當于過程中的干擾而非故障；故障3、9、15的數(shù)據(jù)在均值方差和高階矩上均沒有可以被觀測到的變化[35]，難以檢測且對監(jiān)測過程影響較小，因此本文選取剩余的17種故障進行在線檢測。在此基礎上，采集正常工作模式下的960個樣本作為訓練數(shù)據(jù)，各種故障均在第161個樣本引入并收集960個樣本作為訓練樣本。

在設置實驗參數(shù)時將所有算法統(tǒng)計量的置信度設置為 $α = 99 %$ ，每個算法的低維空間維度以及時間尺度應保持一致?？紤]到PCA通過采用85%的方差貢獻率來確定降維的維度，因此實驗中LTDCNPE、DNPE、NPE算法所選擇的主元個數(shù)為d=14。由于訓練數(shù)據(jù)是TE過程穩(wěn)態(tài)運行時所采集的正常數(shù)據(jù)，不存在工況切換問題，所以時間窗長度為固定值L=44，由過程變量平方和的自相關來確定。根據(jù)文獻[36]，仍延續(xù)LLE算法提出的參數(shù)準則，為保證降維數(shù)量小于近鄰樣本數(shù) $k$ 并且L=2k，實驗選擇的近鄰樣本數(shù)量為k=22。在確定時間權重 $T$ 的步驟中，選取的鄰域尺度l=7。

為了更加全面地對比LTDCNPE算法和其他算法在實際中的有效性和可行性，本節(jié)不僅使用漏報率來對TE過程的17種故障數(shù)據(jù)進行故障部分的檢測，還利用誤報率(fault alarm rate，F(xiàn)AR)來檢驗不同算法對正常數(shù)據(jù)的效果。在表3中，誤報率均寫在括號內(nèi)。根據(jù)表中數(shù)據(jù)可以看出，LTDCNPE算法總體上提供了較低的漏報率。對于容易檢測的故障，四種算法的結果均能得到令人滿意的結果；對于初始階段難于檢測的故障10、16、19、20，三種對比方法的漏報率均很高，在實際應用中無法提供可靠的報警，而LTDCNPE算法的漏報率仍能保持較低數(shù)值。從誤報率角度來看，PCA的誤報率相對其他三種方法偏高一點，其他三種方法的誤報率相差不大，整體上數(shù)值都比較低，說明對正常數(shù)據(jù)有較好的檢測效果。

表3 TE過程17種故障的漏報率和誤報率

Table 3 MAR and FAR of 17 faults in TE process

Fault	MAR(FAR)/%
	PCA		NPE		DNPE		LTDCNPE
	$T^{2}$	SPE	$T^{2}$	SPE	$T^{2}$	SPE	$T^{2}$	SPE
1	0.88(0)	0.13(0.63)	0.88(0)	0.75(0)	0.13(0)	0.50(0)	0.25(1.25)	0.75(0)
2	1.63(1.25)	4(1.25)	1.63(1.25)	1.75(0)	1.25(0)	1.75(0)	1.50(0)	1.75(0)
5	75.88(0.63)	75.88(3.13)	76.25(0.63)	75.38(0.63)	0(1.25)	76.32(0.63)	0(0)	77.25(0.63)
6	0.88(0)	0(1.88)	0.75(0.63)	0(0)	0(1.88)	0(0.63)	0(0)	0(0)
7	0(0)	0(2.50)	0(0)	0(0)	0(1.25)	0(1.25)	0(0.63)	0(0)
8	3.13(0)	13.88(0.63)	3.25(0)	2.50(0)	2.26(0)	2.51(0)	2.25(0)	2.50(0)
10	70.38(0)	70.88(1.25)	70.63(0)	60.63(0)	46.49(0.63)	61.40(0)	12(1.25)	61.13(0)
11	59.38(0.63)	23.88(3.13)	59.25(0.63)	45.50(0.63)	57.39(0.63)	42.61(0)	38.13(0.63)	45.50(0.63)
12	1.63(0)	9.25(3.13)	1.63(0.63)	1.63(0)	0.38(0)	1.00(0)	0.13(1.88)	1.63(0)
13	6.38(0.63)	4.75(1.25)	6.25(0)	5.75(0)	5.51(0)	5.64(0)	4.75(0.63)	5.75(0)
14	0.75(0)	0(1.25)	1.25(0.63)	0.13(0)	0(0.63)	0(0.63)	0(0.63)	0.13(0)
16	86.50(3.75)	67.75(2.50)	84.88(3.13)	78.75(5.63)	55.26(1.88)	81.20(1.88)	8.88(7.50)	79.25(5.63)
17	23.75(1.25)	4.13(2.50)	24.50(1.88)	14.13(0)	14.29(0)	14.29(0)	9.13(0)	14.13(0)
18	10.75(0)	9.75(2.50)	10.63(0)	10.75(0)	10.78(0.63)	10.65(0)	9.63(0.63)	10.75(0)
19	89.00(0)	82.25(0.63)	88.38(0)	98.13(0)	71.43(0)	100(0)	22.00(0.63)	98.13(0)
20	68.25(0)	48.38(4.38)	65.13(0)	57.88(0)	50.50(0)	58.90(0)	11.00(0)	58.38(0)
21	60.75(0)	51.13(5.00)	60.50(0)	61.75(0)	51.13(0.63)	62.91(0)	42.00(3.13)	61.75(0)

新窗口打開| 下載CSV

因此，綜合測試數(shù)據(jù)的漏報率和誤報率可以看出，LTDCNPE法在故障檢測過程中具有更佳的效果。與僅考慮空間結構關系的傳統(tǒng)算法PCA和原始NPE算法相比，LTDCNPE算法明顯降低檢測的漏報率，與處理全局時序過程的DNPE算法進行對比，LTDCNPE算法的效果也更為顯著，保留了更多的數(shù)據(jù)特征。

為了更直觀地表明LTDCNPE算法的優(yōu)勢，圖5和圖6展示了故障5、故障10兩種典型故障的檢測結果。故障5是冷凝器冷卻水的入口溫度產(chǎn)生的階躍變化。該故障的顯著影響是引起冷凝器冷卻水流量的階躍變化。當故障發(fā)生時，從冷凝器出口到汽/液分離器的流速增加，導致汽/液分離器的溫度升高，并使分離器冷卻水出口溫度也升高[37]。但是控制回路能夠補償這個變化，并使分離器中的溫度返回到設置點。由圖5可以看出PCA算法和NPE算法雖然在故障初始階段能及時地反映出故障，但隨著過程的推進，統(tǒng)計量又逐漸降低到控制限以下，而此時過程中的故障仍然存在，所以無法持續(xù)進行故障的監(jiān)測。這表明一旦忽略了實際過程中的時序特性，無論使用全局數(shù)據(jù)還是利用局部信息建立模型，都無法實時反映過程的真實狀態(tài)。而四種方法的SPE統(tǒng)計量都是先超限持續(xù)一段時間后又回到正常，這與33個變量特征提取和變換時被賦予的權重大小有關。對于故障5中先發(fā)生異常后恢復至原始狀態(tài)的變量，其對應的權重較大，而保持穩(wěn)定的變量以及一直保持故障狀態(tài)的變量所對應的權重在大多情況下數(shù)值較小，保留的信息較少，使得這部分變量的信息被掩蓋在了可恢復正常變量的信息中。所以最終SPE統(tǒng)計量的變化也符合這個變化趨勢，使SPE數(shù)值最終回到正常范圍內(nèi)，無法很好區(qū)分正常和故障時候的數(shù)據(jù)。

圖5

圖5 故障5的TE過程檢測結果

Fig.5 Monitoring results of the Tennessee Eastman process for fault 5

圖6

圖6 故障10的TE過程檢測結果

Fig.6 Monitoring results of the Tennessee Eastman process for fault 10

故障10為一種隨機故障，過程中的某些變量在不同時刻隨機進行變化，檢測結果如圖6所示。在故障發(fā)生的初期，圖6(d)中的 $T^{2}$ 統(tǒng)計量可以快速捕捉過程的變化并一直具備報警趨勢，結果符合實際生產(chǎn)需求。另外三種方法不僅初期無法做出報警，而且大部分時間無法有效檢測出故障，存在較高的漏報率。相比于PCA算法和NPE算法，DNPE算法雖然使漏報率稍微降低，但仍不能正確表征過程的真實工作情況。

由數(shù)值例子實驗結果可以看出，LTDCNPE算法可以有效識別階躍故障和隨機故障，并且相比于其他方法，具有更高的準確率。由TE平臺的實驗結果可以看出，PCA算法使用全局數(shù)據(jù)建立的模型無法實時地反映過程的真實狀態(tài)；NPE算法作為一種較為原始的利用局部信息進行建模的方法，忽略了實際過程擁有的時序特性；DNPE算法構建增廣向量，通過消除輸入變量的相關性來考慮樣本的自相關性，但它仍未很好地捕捉到數(shù)據(jù)間的時變。LTDCNPE算法克服了以上算法的缺點，可以同時提取數(shù)據(jù)中的局部結構和時序信息，對各類故障均能夠做出反應，快速捕捉過程的變化，結果符合實際生產(chǎn)需求。

4 結論

本文提出一種基于LTDCNPE算法的工業(yè)過程故障檢測方法，通過關注局部時差和局部幾何結構，克服了傳統(tǒng)PCA算法和NPE算法僅考慮不同樣本空間距離的缺點，改進了DNPE算法提取時間特征的方式。LTDCNPE算法使用一種新的鄰域選擇方法，從時間和空間角度進行考慮，挑選出更加合適的近鄰樣本對原始樣本進行重構，并利用它們的時序差異為近鄰樣本進行加權，盡可能保留原始數(shù)據(jù)的結構關系，降低信息的丟失程度。通過對比PCA、NPE、DNPE、LTDCNPE算法在數(shù)值例子和TE仿真實驗中的結果，可以看出LTDCNPE算法挑選的時序特征更加合理，并且其在降維和檢測效果上的表現(xiàn)也得到了驗證。

符號說明

$A$	特征映射矩陣， $A∈RD×d$
$B$	局部時間空間差異矩陣， $B∈RN×k$
$D$	空間約束矩陣， $D∈RN×k$
$D$	輸入變量數(shù)
$d$	降維后的維數(shù)
$E$	最小化重構誤差
$h$	帶寬
$I$	單位矩陣， $I∈RN×N$
$K?$	核函數(shù)
$k$	構造鄰域連接圖所需的近鄰樣本數(shù)
$L$	樣本具有時序相關性的時間窗長度
$l$	鄰域尺度
$m$	選取的特征值數(shù)量
$N$	輸入樣本數(shù)
$P$	歸一化的時間約束矩陣， $P∈RN×k$
$p?$	密度函數(shù)
$T$	時間約束矩陣， $T∈RN×k$
$t1$ ， $t2$ ， $t3$	鄰域中近鄰樣本與中心樣本之間的采樣時差
$t?$	樣本對應的采樣時間
$W$	最優(yōu)權值系數(shù)矩陣， $W∈RN×N$
$X$	輸入矩陣， $X∈RD×N$
$xnew$	新樣本， $xnew∈RD×l$
$Y$	特征矩陣， $Y∈Rd×N$
$ynew$	新樣本對應的特征向量， $ynew∈Rd×l$
$z$	近鄰樣本加權后的矩陣， $z∈RN×k$
$Λ$	$Y$ 的樣本協(xié)方差矩陣， $Λ∈Rd×d$
上角標
$q$	鄰域中樣本的近鄰樣本序號
下角標
$i$	輸入樣本序號
$j$	構造鄰域連接圖的樣本序號
$s$	重新選取的構造鄰域連接圖的樣本序號

關鍵字：優(yōu)秀論文

上一篇：基于雙部分丟棄的模擬移動床產(chǎn)率提高策略
下一篇：基于IDPC-RVM的多模態(tài)間歇過程質(zhì)量變量在線預測

欄目分類

熱門排行

推薦信息

期刊知識