優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

局部時(shí)差約束鄰域保持嵌入算法在故障檢測中的應(yīng)用

作者:王琨 侍洪波 譚帥 宋冰 陶陽來源:《化工學(xué)報(bào)》日期:2022-11-02人氣:972

在現(xiàn)代工業(yè)過程中,系統(tǒng)規(guī)模越來越大,流程也越來越復(fù)雜[1-2],一旦故障發(fā)生,不僅會(huì)影響生產(chǎn)效率,甚至?xí)斐芍卮蟮陌踩鹿?。同時(shí),隨著傳感器技術(shù)、實(shí)時(shí)存儲(chǔ)技術(shù)和信息管理系統(tǒng)的發(fā)展[3],大量在線和離線數(shù)據(jù)更易被獲取和存儲(chǔ)[4-5]。因此,為了保證工業(yè)過程的生產(chǎn)安全,數(shù)據(jù)驅(qū)動(dòng)的過程監(jiān)測和控制技術(shù)越來越受關(guān)注[6],多元統(tǒng)計(jì)過程監(jiān)控(multivariate statistical process monitoring,MSPM)方法作為數(shù)據(jù)驅(qū)動(dòng)過程監(jiān)控方法的典型代表,得到了廣泛的研究[7]。目前常用的MSPM方法有主成分分析(principal component analysis,PCA)、偏最小二乘(partial least squares,PLS)、獨(dú)立主元分析(independent component analysis,ICA)等,這些方法對過程數(shù)據(jù)進(jìn)行降維[8-11]并基于提取的特征信息建立模型。然而,這些方法僅考慮樣本間的全局特性,并沒有關(guān)注局部包含的結(jié)構(gòu)關(guān)系,這將忽略隱藏在高維空間中的更多信息。

近年來,基于流形學(xué)習(xí)的方法得到快速發(fā)展[12],拉普拉斯特征映射(Laplacian eigenmaps,LE)[13]、局部線性嵌入(locally linear embedding,LLE)[14]和等距映射(isometric feature mapping,ISOMAP)[15]等非線性流形學(xué)習(xí)算法被提出,這些方法可以從高維采樣數(shù)據(jù)中揭示低維流形結(jié)構(gòu)以實(shí)現(xiàn)維數(shù)的約簡,但運(yùn)算成本高且得到的投影僅在訓(xùn)練數(shù)據(jù)上定義。He等[16]提出局部保持投影(locality preserving projections, LPP),它作為一種線性流形學(xué)習(xí)算法,對LE算法進(jìn)行線性近似,不僅保留了諸如LE、LLE非線性算法的數(shù)據(jù)屬性,還可以被定義在環(huán)繞空間的任何地方,而不僅限于訓(xùn)練數(shù)據(jù)中。He等[17]進(jìn)一步提出鄰域保持嵌入(neighborhood preserving embedding, NPE),也是通過鄰域近似線性表示得到投影矩陣,但目標(biāo)函數(shù)表示為最小化重構(gòu)誤差,目前也成功應(yīng)用于故障檢測領(lǐng)域[18-21]。但無論是關(guān)注全局結(jié)構(gòu)信息的典型多元統(tǒng)計(jì)方法還是關(guān)注局部結(jié)構(gòu)信息的流形學(xué)習(xí)方法,它們都基于數(shù)據(jù)樣本獨(dú)立分布的假設(shè)建立靜態(tài)模型,忽略了樣本在連續(xù)時(shí)間采集過程中的相關(guān)性[22]。

在實(shí)際工業(yè)中,變量可能受到噪聲等干擾使其在穩(wěn)態(tài)值附近波動(dòng),該過程便具有動(dòng)態(tài)行為特征。Ku等[23]提出動(dòng)態(tài)主成分分析算法(dynamic PCA, DPCA),通過加入時(shí)間延遲因子的方法來表示模型中的動(dòng)態(tài)行為,利用時(shí)間窗將連續(xù)時(shí)間的樣本依次排列,形成增廣矩陣作為模型訓(xùn)練的輸入。Li等[24]提出動(dòng)態(tài)鄰域保持嵌入(dynamic neighborhood preserving embedding,DNPE)算法將原始數(shù)據(jù)矩陣轉(zhuǎn)換為增廣數(shù)據(jù),既保留了NPE算法的優(yōu)勢又克服了無法考慮時(shí)序相關(guān)性的問題,然后利用LSSVM方法實(shí)現(xiàn)對數(shù)據(jù)的多類評價(jià)。趙小強(qiáng)等[25]提出GSFA-GNPE算法,通過計(jì)算順序相關(guān)矩陣,對過程變量的特性進(jìn)行評估,劃分為動(dòng)態(tài)子空間和過程子空間,根據(jù)得到的混合模型指標(biāo)實(shí)現(xiàn)過程監(jiān)控。但是,這些算法廣泛關(guān)注的是樣本的全局時(shí)間特性,并沒有充分挖掘局部時(shí)間特性。

針對全局結(jié)構(gòu)信息無法準(zhǔn)確反映樣本間關(guān)系和時(shí)序相關(guān)性未被考慮兩個(gè)問題,本文在傳統(tǒng)NPE算法基礎(chǔ)上提出一種新的數(shù)據(jù)降維和特征提取方法——LTDCNPE算法,它使用一種全新的方式選擇近鄰樣本來對原始樣本進(jìn)行重構(gòu)。不同于大部分算法單純使用歐氏距離的大小來選擇鄰域,很多距離小的樣本可能時(shí)間尺度上相隔較遠(yuǎn),導(dǎo)致鄰域中選擇了時(shí)間上關(guān)系很小但距離相隔很近的樣本,這在一定程度上會(huì)影響特征的提取。LTDCNPE算法同時(shí)兼顧時(shí)序相關(guān)性和局部空間結(jié)構(gòu)信息,任意選取一個(gè)樣本作為中心點(diǎn),根據(jù)樣本時(shí)間上的相關(guān)性大小選定一個(gè)長度固定的時(shí)間窗,再利用中心點(diǎn)與時(shí)間窗內(nèi)其他每個(gè)采樣點(diǎn)之間的時(shí)間關(guān)系和二者之間的距離,來構(gòu)造更加合理的鄰域選擇標(biāo)準(zhǔn),并將時(shí)間關(guān)系作為近鄰樣本的權(quán)值,來提高系統(tǒng)的故障檢測精度。本文將LTDCNPE算法用于工業(yè)過程的故障檢測,分別在特征空間中構(gòu)造T2統(tǒng)計(jì)量和在殘差空間中構(gòu)造SPE統(tǒng)計(jì)量來進(jìn)行檢測。最后利用數(shù)值例子和TE仿真過程對該方法的有效性進(jìn)行實(shí)驗(yàn)驗(yàn)證。

1 NPE算法介紹

NPE算法通過求解特征映射A=a1,a2,?,adRD×d將原始的輸入矩陣X=x1,x2,?,xNRD×N從高維空間映射到低維特征空間Y=y1,y2,?,yNRd×Nd<D。其中,N為樣本數(shù),D為變量數(shù),d為降維后保留的維數(shù)。算法具體流程如下。

首先,利用k-NN方法為原始訓(xùn)練數(shù)據(jù)X的每個(gè)樣本點(diǎn)xi尋找與其歐氏距離最近的k個(gè)近鄰點(diǎn)xjj=1,2,?,k構(gòu)造鄰域連接圖,并對xi進(jìn)行重構(gòu)。通過最小化重構(gòu)誤差E來求解最優(yōu)權(quán)值系數(shù)矩陣W,計(jì)算公式如式(1)所示。

EW=min i=1Nxi-j=1kWijxj2s.t.  j=1kWij=1(1)

式中,Wij表示對不同結(jié)點(diǎn)的權(quán)值,即xjxi重構(gòu)的貢獻(xiàn)。

然后,通過特征映射矩陣AX投影到低維空間中,得到Y

Y=ATX(2)

根據(jù)低維空間可以利用與在原始高維空間中相同的權(quán)值進(jìn)行重構(gòu)這一特點(diǎn),利用式(1)得到的權(quán)值系數(shù)矩陣來重構(gòu)對應(yīng)的低維數(shù)據(jù)樣本yi,相應(yīng)的特征映射矩陣A可以通過最小化以下?lián)p失函數(shù)求解得到。

EA=min i=1Nyi-j=1kWijyj2=mintrATXMXTA(3)

式中,yj是樣本yi的第j個(gè)近鄰點(diǎn);M=I-WTI-W,I為單位矩陣。

最后,利用拉格朗日乘子法進(jìn)行轉(zhuǎn)換,將式(3)變換為如下廣義特征值求解形式。

XMXTA=λXXTA(4)

獲得的前m個(gè)最小特征值所對應(yīng)的特征向量即可組成特征映射矩陣A。

2 基于LTDCNPE的故障檢測

NPE算法根據(jù)樣本之間的歐氏距離選擇鄰域來對中心樣本進(jìn)行重構(gòu),但是在化工過程中,一段時(shí)間內(nèi)的連續(xù)樣本之間具有時(shí)序相關(guān)性[26]。傳統(tǒng)的NPE方法僅考慮樣本間的空間關(guān)系,忽略了樣本間的時(shí)序關(guān)系,使得檢測效果變差。因此,本文將提出的LTDCNPE算法用于化工過程故障檢測,希望在一個(gè)時(shí)間窗內(nèi)通過同時(shí)考慮時(shí)間和空間上的局部性來進(jìn)行鄰域挑選,并利用時(shí)差為近鄰樣本賦權(quán),進(jìn)而提取更為合理的特征。

2.1 LTDCNPE算法

2.1.1 挑選鄰域

在選擇鄰域前,LTDCNPE算法先對選擇的范圍進(jìn)行了預(yù)縮減,根據(jù)連續(xù)過程樣本間的時(shí)序相關(guān)性尋找一個(gè)長度為L的時(shí)間窗,保證范圍內(nèi)的樣本包含大部分主要信息。具體地,以給定數(shù)據(jù)集X=x1,x2,?,xNRD×N的任一樣本xi為中心劃取時(shí)間窗,得到時(shí)間維度上的縮減鄰域。時(shí)間窗大小可以通過過程變量平方和的自相關(guān)來確定[27],這樣當(dāng)時(shí)間距離大于確定的時(shí)間窗長度時(shí),相關(guān)性可以被忽略。

但通過時(shí)間窗得到的縮減鄰域所包含的樣本并非全部適合重構(gòu)xi,需要在此基礎(chǔ)上利用式(5)反映鄰域樣本與xi在局部時(shí)間和空間上的差異,選取與xi更相關(guān)的k個(gè)近鄰點(diǎn)。第j個(gè)鄰域樣本xjxi的差異Bi,j計(jì)算方式如式(5)所示。

Bi,j=Ti,jDi,j(5)

式中,Di,j為空間約束,具體表示為樣本點(diǎn)xixj的歐氏距離,反映空間上的遠(yuǎn)近;Ti,j為時(shí)間約束,反映局部時(shí)間差異。

LTDCNPE算法和NPE算法對空間結(jié)構(gòu)上的特征提取均是利用式(6)來實(shí)現(xiàn)的。當(dāng)僅考慮局部空間差異時(shí),鄰域樣本選擇的示意圖如圖1所示。

Di,j=xi-xj2(6)

圖1

圖1   僅考慮空間距離的樣本分布

中心樣本;時(shí)差小的近鄰樣本;時(shí)差大的近鄰樣本

Fig.1   Sample distribution considering only spatial distance


LTDCNPE算法中的局部時(shí)差由式(7)體現(xiàn)。

Ti,j=exp-t1t2t3=exp-txi-txj2q=1ltxi-txiqq=1ltxj-txjq(7)

式中,txi為任意從X中選擇的樣本所對應(yīng)的采樣時(shí)間;txj為樣本xi的第jj=1,2,?,L個(gè)近鄰點(diǎn)所對應(yīng)的采樣時(shí)間;txjqxj的第qq=1,2,?,l個(gè)近鄰樣本對應(yīng)的采樣時(shí)間;txiqxi的第q個(gè)近鄰點(diǎn)所對應(yīng)的時(shí)間,值得注意的是,該值雖然與txj均表述的是xi的近鄰點(diǎn),但在每一次計(jì)算Bi,j時(shí),j只有一個(gè)固定值,而q卻是一個(gè)1~l的范圍值。

具體地,在xixj選定以后,時(shí)間項(xiàng)Ti,j的分子值也隨即確定,當(dāng)xixj分別與周圍的近鄰樣本點(diǎn)在時(shí)間相關(guān)上越緊密,也即Ti,j的兩個(gè)分母值越小,Ti,j整體數(shù)值也會(huì)越小,表示由兩個(gè)集群所表示的xixj在時(shí)間上也就越疏遠(yuǎn)。

對照以上分析,將圖1中的中心樣本及其鄰域投影到時(shí)間軸上,此時(shí)的示意圖如圖2(a)所示。當(dāng)考慮了鄰域樣本的局部時(shí)序關(guān)系后,該算法將圖2(a)中距離中心樣本近而時(shí)間相隔較遠(yuǎn)的樣本剔除,并選擇在時(shí)間和空間兩種約束下更為緊密的近鄰樣本,如圖2(b)所示,可以看出T的數(shù)值變化對樣本間局部時(shí)間的刻畫是合理的。

圖2

圖2   時(shí)間投影上的樣本分布

中心樣本;時(shí)差小的近鄰樣本;時(shí)差大的近鄰樣本

Fig.2   The sample distribution on the time projection


2.1.2 鄰域加權(quán)

當(dāng)在時(shí)間窗中根據(jù)Bi,j選擇出k個(gè)近鄰樣本之后,樣本xi對應(yīng)的局部時(shí)差樣本個(gè)數(shù)由原來的L個(gè)變?yōu)?span style="box-sizing: border-box;padding: 0px">k個(gè),Ti,j的表示改為Ti,ss=1,?,k。xik個(gè)近鄰為xs|s=1,2,?,k。對時(shí)間約束矩陣進(jìn)行歸一化處理,如式(8)所示。

Pi,s=Ti,ss=1kTi,s(8)

然后,用于訓(xùn)練的樣本變量經(jīng)過式(9)實(shí)現(xiàn)加權(quán)。

zi,s=Pi,s?xs(9)

式中,zi,s表示對樣本xi的第s個(gè)近鄰樣本加權(quán)后的向量;?是克羅內(nèi)克積。

2.1.3 計(jì)算權(quán)值系數(shù)矩陣和映射矩陣

利用時(shí)間關(guān)系為近鄰樣本加權(quán)后,按式(10)求解使重構(gòu)誤差最小的權(quán)值系數(shù)矩陣W。

EW=min i=1Nxi-s=1kWi,szi,s2s.t.  s=1kWi,s=1(10)

利用W計(jì)算從高維原始空間到低維空間的特征映射矩陣A,具體見式(11)、式(12)。

EA=min i=1Nyi-s=1kWi,sys2(11)ys=ATxs(12)

2.2 使用LTDCNPE進(jìn)行故障檢測

為了提高故障檢測模型在化工過程中的監(jiān)控效果,本文使用提出的LTDCNPE算法獲得投影矩陣A,從新樣本xnewRD1中提取出具有時(shí)間和空間局部特性的特征向量ynewRd1。隨后,采用Hotelling T2統(tǒng)計(jì)量以及SPE統(tǒng)計(jì)量來進(jìn)行故障檢測,計(jì)算公式為

T2=ynewTΛ-1ynewSPE=xnew-x?new2(13)

其中,ΛY的樣本協(xié)方差矩陣

Λ=1N-1i=1NynewynewTx?new=Aynew(14)

因?yàn)楹嗣芏裙烙?jì)(kernel density estimation, KDE)方法[28-29]使用方便且具有更普遍的意義,本文使用該方法估計(jì)統(tǒng)計(jì)量的控制限,假設(shè)x是一個(gè)隨機(jī)變量,px為其密度函數(shù),具體表達(dá)見式(15)。

Px<b=-bpxdx(15)

在已知px情況下,可以確定一個(gè)特定置信區(qū)間條件下的控制極限,這里選取的置信度為0.99,通過核函數(shù)K·x的概率密度函數(shù)進(jìn)行估計(jì),定義公式如下。

p?x=1NhKx-xkh(16)

式中,xk(k=1,2,?,N)x的采樣點(diǎn);h為帶寬,這里的核函數(shù)一般選用高斯函數(shù)。

基于LTDCNPE算法進(jìn)行離線建模和在線監(jiān)控的具體實(shí)施步驟如下。

離線建模階段:

(1) 以正常數(shù)據(jù)XRD×N作為訓(xùn)練數(shù)據(jù),采用z-score方法進(jìn)行數(shù)據(jù)預(yù)處理;

(2) 利用式(6)、式(7)計(jì)算樣本間的空間約束Di,j和時(shí)間約束Ti,j;

(3) 式(5)計(jì)算得到的局部差異Bi,j作為選擇xi鄰域的標(biāo)準(zhǔn),并選取最小的前k個(gè)樣本作為重構(gòu)樣本;

(4) 利用式(8)、式(9)得到歸一化后的時(shí)間約束Pi,s作為權(quán)值和加權(quán)后的近鄰樣本zi,s;

(5) 根據(jù)最小化公式式(10)獲得權(quán)值系數(shù)矩陣W,并利用式(11)求解前m個(gè)最小特征值對應(yīng)的特征向量,得到特征映射矩陣A;

(6) 根據(jù)式(13)計(jì)算訓(xùn)練數(shù)據(jù)的T2和SPE統(tǒng)計(jì)量,并使用KDE方法估計(jì)統(tǒng)計(jì)量的控制限。

在線監(jiān)控階段:

(1) 獲取新樣本xnew,利用正常樣本下求得的均值和方差對其進(jìn)行標(biāo)準(zhǔn)化處理;

(2) 利用離線建模步驟(5)獲得的特征映射矩陣Axnew進(jìn)行線性降維;

(3) 計(jì)算新樣本的T2和SPE統(tǒng)計(jì)量,將其與控制限進(jìn)行對比,判斷是否為故障樣本。

3 仿真實(shí)驗(yàn)

為了說明LTDCNPE算法的有效性,本文使用數(shù)值例子和TE仿真實(shí)驗(yàn)進(jìn)行故障檢測,并將所提出算法的性能與經(jīng)典算法PCA、NPE及其時(shí)間相關(guān)的衍生算法DNPE[24,30-31]進(jìn)行了比較。

3.1 數(shù)值例子仿真

本文采用Ku等[23]提出的多元?jiǎng)討B(tài)過程來驗(yàn)證所提方法的有效性:

zt=Azt-1+But-1yt=zt+vt(17)

式中,A=0.188-0.1910.8470.264;B=123-4ut、vtzt分別代表輸入、輸出和狀態(tài)變量,vt為服從正態(tài)分布N0,0.1的測量噪聲,ut的表示如式(18)所示:

ut=0.811-0.2260.4770.415ut-1+0.1930.689-0.320-0.749wt-1(18)

式中,wt是服從N0,1分布的白噪聲。用于過程監(jiān)控的數(shù)據(jù)向量表示為xt=ytut。在正常的運(yùn)行狀態(tài)下,采集500個(gè)樣本作為訓(xùn)練數(shù)據(jù)。將本文提出的LTDCNPE算法和DNPE、NPE算法的近鄰數(shù)設(shè)為k=4。PCA的主元數(shù)d=2,由85%的方差貢獻(xiàn)率確定。為了對比的公平性,LTDCNPE、NPE也降維到d=2。測試數(shù)據(jù)同樣采集500個(gè)樣本,從第201個(gè)樣本開始引入故障。故障描述如表1所示。

表1   過程故障描述

Table 1  Process fault description

故障描述
1ut引入幅值為2的階躍故障
2系數(shù)矩陣A的第2×2個(gè)元素值由0.264變?yōu)?.500, 使?fàn)顟B(tài)變量zt之間的動(dòng)態(tài)關(guān)系發(fā)生變化

新窗口打開| 下載CSV


測試集中各算法的漏報(bào)率(miss alarm rate, MAR)總結(jié)在表2中,用粗體數(shù)值表示檢測結(jié)果的最優(yōu)值。由表2可以看出當(dāng)故障1發(fā)生時(shí),PCA算法和NPE算法的T2有很多漏報(bào),而DNPE算法和LTDCNPE算法的兩個(gè)統(tǒng)計(jì)量漏報(bào)率都相對較低,且LTDCNPE算法的T2漏報(bào)率僅有0.33,效果更好。在故障2中,四種方法的結(jié)果相差不大,但是LTDCNPE算法仍然保持最低的T2漏報(bào)率。以上結(jié)果表明對時(shí)序系統(tǒng)進(jìn)行監(jiān)控時(shí),LTDCNPE算法更加合理地考慮了連續(xù)數(shù)據(jù)間的時(shí)間關(guān)聯(lián)。

表2   數(shù)值例子的漏報(bào)率

Table 2  MAR in case study

FaultMAR/%
PCANPEDNPELTDCNPE
T2SPET2SPET2SPET2SPE
158.671.3362.002.001.001.320.332.00
21.671.671.671.671.661.661.391.67

新窗口打開| 下載CSV


圖3是四種方法針對故障1數(shù)據(jù)的二維投影結(jié)果??梢钥闯?,圖3(a)~(c)的故障樣本投影后有接近一半超過橢圓控制限,使正常樣本和故障樣本在二維投影平面上大量重疊,無法進(jìn)行區(qū)分。而LTDCNPE算法可以通過橢圓形的控制限將測試數(shù)據(jù)中的正常數(shù)據(jù)和故障數(shù)據(jù)很好地分開,兩部分?jǐn)?shù)據(jù)幾乎沒有重疊,表明數(shù)據(jù)中的時(shí)間序列在低維空間中得到了較好的保留和利用,從而提高了映射空間的質(zhì)量。圖4是四種方法針對故障1數(shù)據(jù)的控制圖。其中,圖4(a)、(b)的T2漏報(bào)率明顯偏高,圖4(c)、4(d)的T2及SPE統(tǒng)計(jì)量明顯高于控制限,但當(dāng)故障剛發(fā)生時(shí),LTDCNPE的T2統(tǒng)計(jì)量可以更早發(fā)現(xiàn)故障,從而減少漏報(bào)率。

圖3

圖3   數(shù)值例子故障1的T2檢測結(jié)果

* 正常樣本;〇 故障樣本;— 控制限

Fig.3   T2 results of fault 1 in case study


圖4

圖4   數(shù)值例子故障1的控制圖

Fig.4   Control diagram of fault 1 in case study


3.2 TE過程仿真

TE過程是對實(shí)際工業(yè)過程的模擬,該平臺廣泛應(yīng)用于控制技術(shù)和監(jiān)測方法的開發(fā)、研究和評價(jià)[1,10,32-33]。該工藝過程包括反應(yīng)器、冷凝器、壓縮機(jī)、分離器和汽提塔5個(gè)主要生產(chǎn)單元[34],8種成分,22個(gè)連續(xù)過程變量,19個(gè)成分變量,12個(gè)控制變量,21種故障。由于實(shí)際過程中的攪拌速率和成分變量很難實(shí)時(shí)采集,因此選用剩余的33個(gè)變量作為監(jiān)控的連續(xù)過程變量。故障4為反應(yīng)器冷卻水入口溫度的一個(gè)階躍變化,但在實(shí)際中相當(dāng)于過程中的干擾而非故障;故障3、9、15的數(shù)據(jù)在均值方差和高階矩上均沒有可以被觀測到的變化[35],難以檢測且對監(jiān)測過程影響較小,因此本文選取剩余的17種故障進(jìn)行在線檢測。在此基礎(chǔ)上,采集正常工作模式下的960個(gè)樣本作為訓(xùn)練數(shù)據(jù),各種故障均在第161個(gè)樣本引入并收集960個(gè)樣本作為訓(xùn)練樣本。

在設(shè)置實(shí)驗(yàn)參數(shù)時(shí)將所有算法統(tǒng)計(jì)量的置信度設(shè)置為α=99%,每個(gè)算法的低維空間維度以及時(shí)間尺度應(yīng)保持一致。考慮到PCA通過采用85%的方差貢獻(xiàn)率來確定降維的維度,因此實(shí)驗(yàn)中LTDCNPE、DNPE、NPE算法所選擇的主元個(gè)數(shù)為d=14。由于訓(xùn)練數(shù)據(jù)是TE過程穩(wěn)態(tài)運(yùn)行時(shí)所采集的正常數(shù)據(jù),不存在工況切換問題,所以時(shí)間窗長度為固定值L=44,由過程變量平方和的自相關(guān)來確定。根據(jù)文獻(xiàn)[36],仍延續(xù)LLE算法提出的參數(shù)準(zhǔn)則,為保證降維數(shù)量小于近鄰樣本數(shù)k并且L=2k,實(shí)驗(yàn)選擇的近鄰樣本數(shù)量為k=22。在確定時(shí)間權(quán)重T的步驟中,選取的鄰域尺度l=7。

為了更加全面地對比LTDCNPE算法和其他算法在實(shí)際中的有效性和可行性,本節(jié)不僅使用漏報(bào)率來對TE過程的17種故障數(shù)據(jù)進(jìn)行故障部分的檢測,還利用誤報(bào)率(fault alarm rate,F(xiàn)AR)來檢驗(yàn)不同算法對正常數(shù)據(jù)的效果。在表3中,誤報(bào)率均寫在括號內(nèi)。根據(jù)表中數(shù)據(jù)可以看出,LTDCNPE算法總體上提供了較低的漏報(bào)率。對于容易檢測的故障,四種算法的結(jié)果均能得到令人滿意的結(jié)果;對于初始階段難于檢測的故障10、16、19、20,三種對比方法的漏報(bào)率均很高,在實(shí)際應(yīng)用中無法提供可靠的報(bào)警,而LTDCNPE算法的漏報(bào)率仍能保持較低數(shù)值。從誤報(bào)率角度來看,PCA的誤報(bào)率相對其他三種方法偏高一點(diǎn),其他三種方法的誤報(bào)率相差不大,整體上數(shù)值都比較低,說明對正常數(shù)據(jù)有較好的檢測效果。

表3   TE過程17種故障的漏報(bào)率和誤報(bào)率

Table 3  MAR and FAR of 17 faults in TE process

FaultMAR(FAR)/%
PCANPEDNPELTDCNPE
T2SPE
T2SPE
T2SPE
T2SPE
10.88(0)0.13(0.63)0.88(0)0.75(0)0.13(0)0.50(0)0.25(1.25)0.75(0)
21.63(1.25)4(1.25)1.63(1.25)1.75(0)1.25(0)1.75(0)1.50(0)1.75(0)
575.88(0.63)75.88(3.13)76.25(0.63)75.38(0.63)0(1.25)76.32(0.63)0(0)77.25(0.63)
60.88(0)0(1.88)0.75(0.63)0(0)0(1.88)0(0.63)0(0)0(0)
70(0)0(2.50)0(0)0(0)0(1.25)0(1.25)0(0.63)0(0)
83.13(0)13.88(0.63)3.25(0)2.50(0)2.26(0)2.51(0)2.25(0)2.50(0)
1070.38(0)70.88(1.25)70.63(0)60.63(0)46.49(0.63)61.40(0)12(1.25)61.13(0)
1159.38(0.63)23.88(3.13)59.25(0.63)45.50(0.63)57.39(0.63)42.61(0)38.13(0.63)45.50(0.63)
121.63(0)9.25(3.13)1.63(0.63)1.63(0)0.38(0)1.00(0)0.13(1.88)1.63(0)
136.38(0.63)4.75(1.25)6.25(0)5.75(0)5.51(0)5.64(0)4.75(0.63)5.75(0)
140.75(0)0(1.25)1.25(0.63)0.13(0)0(0.63)0(0.63)0(0.63)0.13(0)
1686.50(3.75)67.75(2.50)84.88(3.13)78.75(5.63)55.26(1.88)81.20(1.88)8.88(7.50)79.25(5.63)
1723.75(1.25)4.13(2.50)24.50(1.88)14.13(0)14.29(0)14.29(0)9.13(0)14.13(0)
1810.75(0)9.75(2.50)10.63(0)10.75(0)10.78(0.63)10.65(0)9.63(0.63)10.75(0)
1989.00(0)82.25(0.63)88.38(0)98.13(0)71.43(0)100(0)22.00(0.63)98.13(0)
2068.25(0)48.38(4.38)65.13(0)57.88(0)50.50(0)58.90(0)11.00(0)58.38(0)
2160.75(0)51.13(5.00)60.50(0)61.75(0)51.13(0.63)62.91(0)42.00(3.13)61.75(0)

新窗口打開| 下載CSV


因此,綜合測試數(shù)據(jù)的漏報(bào)率和誤報(bào)率可以看出,LTDCNPE法在故障檢測過程中具有更佳的效果。與僅考慮空間結(jié)構(gòu)關(guān)系的傳統(tǒng)算法PCA和原始NPE算法相比,LTDCNPE算法明顯降低檢測的漏報(bào)率,與處理全局時(shí)序過程的DNPE算法進(jìn)行對比,LTDCNPE算法的效果也更為顯著,保留了更多的數(shù)據(jù)特征。

為了更直觀地表明LTDCNPE算法的優(yōu)勢,圖5和圖6展示了故障5、故障10兩種典型故障的檢測結(jié)果。故障5是冷凝器冷卻水的入口溫度產(chǎn)生的階躍變化。該故障的顯著影響是引起冷凝器冷卻水流量的階躍變化。當(dāng)故障發(fā)生時(shí),從冷凝器出口到汽/液分離器的流速增加,導(dǎo)致汽/液分離器的溫度升高,并使分離器冷卻水出口溫度也升高[37]。但是控制回路能夠補(bǔ)償這個(gè)變化,并使分離器中的溫度返回到設(shè)置點(diǎn)。由圖5可以看出PCA算法和NPE算法雖然在故障初始階段能及時(shí)地反映出故障,但隨著過程的推進(jìn),統(tǒng)計(jì)量又逐漸降低到控制限以下,而此時(shí)過程中的故障仍然存在,所以無法持續(xù)進(jìn)行故障的監(jiān)測。這表明一旦忽略了實(shí)際過程中的時(shí)序特性,無論使用全局?jǐn)?shù)據(jù)還是利用局部信息建立模型,都無法實(shí)時(shí)反映過程的真實(shí)狀態(tài)。而四種方法的SPE統(tǒng)計(jì)量都是先超限持續(xù)一段時(shí)間后又回到正常,這與33個(gè)變量特征提取和變換時(shí)被賦予的權(quán)重大小有關(guān)。對于故障5中先發(fā)生異常后恢復(fù)至原始狀態(tài)的變量,其對應(yīng)的權(quán)重較大,而保持穩(wěn)定的變量以及一直保持故障狀態(tài)的變量所對應(yīng)的權(quán)重在大多情況下數(shù)值較小,保留的信息較少,使得這部分變量的信息被掩蓋在了可恢復(fù)正常變量的信息中。所以最終SPE統(tǒng)計(jì)量的變化也符合這個(gè)變化趨勢,使SPE數(shù)值最終回到正常范圍內(nèi),無法很好區(qū)分正常和故障時(shí)候的數(shù)據(jù)。

圖5

圖5   故障5的TE過程檢測結(jié)果

Fig.5   Monitoring results of the Tennessee Eastman process for fault 5


圖6

圖6   故障10的TE過程檢測結(jié)果

Fig.6   Monitoring results of the Tennessee Eastman process for fault 10


故障10為一種隨機(jī)故障,過程中的某些變量在不同時(shí)刻隨機(jī)進(jìn)行變化,檢測結(jié)果如圖6所示。在故障發(fā)生的初期,圖6(d)中的T2統(tǒng)計(jì)量可以快速捕捉過程的變化并一直具備報(bào)警趨勢,結(jié)果符合實(shí)際生產(chǎn)需求。另外三種方法不僅初期無法做出報(bào)警,而且大部分時(shí)間無法有效檢測出故障,存在較高的漏報(bào)率。相比于PCA算法和NPE算法,DNPE算法雖然使漏報(bào)率稍微降低,但仍不能正確表征過程的真實(shí)工作情況。

由數(shù)值例子實(shí)驗(yàn)結(jié)果可以看出,LTDCNPE算法可以有效識別階躍故障和隨機(jī)故障,并且相比于其他方法,具有更高的準(zhǔn)確率。由TE平臺的實(shí)驗(yàn)結(jié)果可以看出,PCA算法使用全局?jǐn)?shù)據(jù)建立的模型無法實(shí)時(shí)地反映過程的真實(shí)狀態(tài);NPE算法作為一種較為原始的利用局部信息進(jìn)行建模的方法,忽略了實(shí)際過程擁有的時(shí)序特性;DNPE算法構(gòu)建增廣向量,通過消除輸入變量的相關(guān)性來考慮樣本的自相關(guān)性,但它仍未很好地捕捉到數(shù)據(jù)間的時(shí)變。LTDCNPE算法克服了以上算法的缺點(diǎn),可以同時(shí)提取數(shù)據(jù)中的局部結(jié)構(gòu)和時(shí)序信息,對各類故障均能夠做出反應(yīng),快速捕捉過程的變化,結(jié)果符合實(shí)際生產(chǎn)需求。

4 結(jié)論

本文提出一種基于LTDCNPE算法的工業(yè)過程故障檢測方法,通過關(guān)注局部時(shí)差和局部幾何結(jié)構(gòu),克服了傳統(tǒng)PCA算法和NPE算法僅考慮不同樣本空間距離的缺點(diǎn),改進(jìn)了DNPE算法提取時(shí)間特征的方式。LTDCNPE算法使用一種新的鄰域選擇方法,從時(shí)間和空間角度進(jìn)行考慮,挑選出更加合適的近鄰樣本對原始樣本進(jìn)行重構(gòu),并利用它們的時(shí)序差異為近鄰樣本進(jìn)行加權(quán),盡可能保留原始數(shù)據(jù)的結(jié)構(gòu)關(guān)系,降低信息的丟失程度。通過對比PCA、NPE、DNPE、LTDCNPE算法在數(shù)值例子和TE仿真實(shí)驗(yàn)中的結(jié)果,可以看出LTDCNPE算法挑選的時(shí)序特征更加合理,并且其在降維和檢測效果上的表現(xiàn)也得到了驗(yàn)證。

符號說明

A特征映射矩陣,A∈RD×d
B局部時(shí)間空間差異矩陣,B∈RN×k
D空間約束矩陣,D∈RN×k
D輸入變量數(shù)
d降維后的維數(shù)
E最小化重構(gòu)誤差
h帶寬
I單位矩陣,I∈RN×N
K?核函數(shù)
k構(gòu)造鄰域連接圖所需的近鄰樣本數(shù)
L樣本具有時(shí)序相關(guān)性的時(shí)間窗長度
l鄰域尺度
m選取的特征值數(shù)量
N輸入樣本數(shù)
P歸一化的時(shí)間約束矩陣,P∈RN×k
p?密度函數(shù)
T時(shí)間約束矩陣,T∈RN×k
t1,t2t3鄰域中近鄰樣本與中心樣本之間的采樣時(shí)差
t?樣本對應(yīng)的采樣時(shí)間
W最優(yōu)權(quán)值系數(shù)矩陣,W∈RN×N
X輸入矩陣,X∈RD×N
xnew新樣本,xnew∈RD×l
Y特征矩陣,Y∈Rd×N
ynew新樣本對應(yīng)的特征向量,ynew∈Rd×l
z近鄰樣本加權(quán)后的矩陣,z∈RN×k
ΛY的樣本協(xié)方差矩陣,Λ∈Rd×d
上角標(biāo)
q鄰域中樣本的近鄰樣本序號
下角標(biāo)
i輸入樣本序號
j構(gòu)造鄰域連接圖的樣本序號
s重新選取的構(gòu)造鄰域連接圖的樣本序號


關(guān)鍵字:優(yōu)秀論文

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言