- 相關(guān)推薦
故障特征提取的方法研究
摘要:針對(duì)常規(guī)特征提取方法存在著問題不足,提出了基于BP神經(jīng)網(wǎng)絡(luò)和基于互信息熵的特征提取方法,并通過特征提取實(shí)例加以說明。結(jié)果表明這兩種方法是可行和有效的。
關(guān)鍵詞:特征提取 故障診斷 神經(jīng)網(wǎng)絡(luò) 互信息熵
隨著科學(xué)技術(shù)的發(fā)展,現(xiàn)代設(shè)備的結(jié)構(gòu)日趨復(fù)雜,其故障類型越來越多,反映故障的狀態(tài)、特征也相應(yīng)增加。在實(shí)際故障診斷過程中,為了使診斷準(zhǔn)確可靠,總要采集盡可能多的樣本,以獲得足夠的故障信息。但樣本太多,會(huì)占用大量的存儲(chǔ)空間和計(jì)算時(shí)間,太多的特征輸入也會(huì)引起訓(xùn)練過程耗時(shí)費(fèi)工,甚至妨礙訓(xùn)練網(wǎng)絡(luò)的收斂,最終影響分類精度。因此要從樣本中提取對(duì)診斷故障貢獻(xiàn)大的有用信息。這一工作就是特征提取。
特征提取就是利用已有特征參數(shù)構(gòu)造一個(gè)較低維數(shù)的特征空間,將原始特征中蘊(yùn)含的有用信息映射到少數(shù)幾個(gè)特征上,忽略多余的不相干信息。從數(shù)學(xué)意義上講,就是對(duì)一個(gè)n維向量X=[x1,x2,…,xn]T進(jìn)行降維,變換為低維向量Y=[y1,y2,…,ym]T,m<n.其中Y確實(shí)含有向量X的主要特性。
特征提取的方法有很多,常用的方法主要有歐式距離法、概率距離法、統(tǒng)計(jì)直方圖法、散度準(zhǔn)則法等。本文針對(duì)現(xiàn)有方法的局限性,研究基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法和基于互信息熵的特征提取方法。
1 基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法
要從N個(gè)特征中挑選出對(duì)診斷貢獻(xiàn)較大的n個(gè)特征參數(shù)(n<N),通常以特征參數(shù)X對(duì)狀態(tài)Y變化的靈敏度ε作為評(píng)價(jià)特征參數(shù)的度量:
εij=|(аYi)/(аXj)|
采用三層BP網(wǎng)絡(luò),輸入層n個(gè)單元對(duì)應(yīng)n個(gè)特征參數(shù),輸出層m個(gè)單元對(duì)應(yīng)m種模式分類,取中間隱層單元數(shù)為q,用W B iq表示輸入層單元i與隱層單元q之間的連接權(quán);用w O qj表示隱層單元q與輸出層單元j之間的連接權(quán),則隱層第q單元的輸出Oq,為:
。ǚ段南壬W(wǎng)www.qkfawen.com收集整理)
輸出層第j個(gè)單元輸出yj為:
式中j=1,2,…,m;εj為閾值。
則特征參數(shù)xi對(duì)模式類別yj的靈敏度為:
代入(1)式,則特征參數(shù)Xi的靈敏度εij和特征參數(shù)Xk的靈敏度εkj之差可整理為:
[NextPage]
大量的試驗(yàn)和研究表明,當(dāng)網(wǎng)絡(luò)收斂后有:a1≈a2≈…≈aq.
從上式可以看出,如果:
則必有:εij>εki
即特征參數(shù)Xi對(duì)第j類故障的分類能力比特征參數(shù)Xk強(qiáng)。
將特征參數(shù)X和分類模式分類結(jié)果y組成的樣本集作為BP網(wǎng)絡(luò)的學(xué)習(xí)樣本,對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。設(shè)Wiq和Wkq分別為與特征參數(shù)Xi和Xk對(duì)應(yīng)輸入單元與隱層單元q之間的連接權(quán)系數(shù),記:
│Wεi│=│Wi1│+|Wi2|+…+|Wiq|
│Wεk│=│Wk1│+|Wk2|+…+|Wkq|
如果│Wεi│>│Wεk│,則可以認(rèn)為Xi的特征靈敏度εi比特征參數(shù)Xk的靈敏度εk大。這樣可知特征參數(shù)Xi的分類能力比特征參數(shù)Xk的分類能力強(qiáng)。
2 基于互信息熵的特征提取方法
由信息特征可知,當(dāng)某特征獲得最大互信息熵,該特征就可獲得最大識(shí)別熵增量和最小誤識(shí)別概率,因而具有最優(yōu)特性。特征提取過程就是在由給定的n個(gè)特征集X二{XI——X2,…,zn)所構(gòu)成的初始特征集合情況下,尋找一個(gè)具有最大互信息熵的集合:X={X1,X2,…,Xk},k<n.由于最大互信息熵由系統(tǒng)熵和后驗(yàn)熵決定,而系統(tǒng)熵是一定的,后驗(yàn)熵越小,則互信息熵越大,分類效果越好。因此有效的特征提取就是在X給定后,尋找一個(gè)具有最大互信息熵或后驗(yàn)熵的集合Y.即已知該域R上的初始特征集合X=[x1,x2,…,xn]T,尋找一個(gè)新的集合Y=[y1,y2,…,yk]T,k<n,使互信息熵最大,i=1,2,…,k.
在一定的初始特征集合下,識(shí)別樣本的后驗(yàn)熵是一定的。在實(shí)現(xiàn)特征優(yōu)化過程中,隨著特征的刪除,會(huì)有信息的損失,使得后驗(yàn)熵趨于增加。因此后驗(yàn)熵增值大小反應(yīng)了刪除特征向量引起的信息損失的情況。當(dāng)刪除不同特征及刪除特征數(shù)逐步遞增時(shí),會(huì)對(duì)應(yīng)有不同的后驗(yàn)熵。按后驗(yàn)熵由小到大排列,可獲得對(duì)應(yīng)的特征刪除序列。其過程可描述為:
[NextPage]
(1)初始化:設(shè)原始特征集合F={N個(gè)特征},令初始優(yōu)化特征集合S=[K個(gè)特征,K=N];
。2)計(jì)算后驗(yàn)熵;
(3)實(shí)現(xiàn)遞減:S=[K-1個(gè)特征],并計(jì)算相應(yīng)的后驗(yàn)熵;
。4)選擇優(yōu)化特征集合:以多個(gè)遞減特征集合所對(duì)應(yīng)的后驗(yàn)熵為依據(jù),選擇具有最小后驗(yàn)熵增的特征向量集合為優(yōu)化特征集合S[N-1個(gè)優(yōu)化特征];
。5)返回(3),重新計(jì)算,直到滿足分類要求,選擇具有最小后驗(yàn)熵的優(yōu)化特征集合;
。6)輸出優(yōu)化特征集合。
3 特征提取實(shí)例
在熱電廠的發(fā)電機(jī)組工作中,發(fā)電機(jī)組主軸經(jīng)常遇到如喘振、流體激勵(lì)等故障。這些故障不僅會(huì)引起生產(chǎn)效率下降,而且會(huì)對(duì)機(jī)器造成嚴(yán)重危害,影響機(jī)組的安全運(yùn)行。傳統(tǒng)的診斷方法是在主軸軸承處加傳感器進(jìn)行振動(dòng)測(cè)試,得到其頻譜圖;然后在頻域內(nèi)分析,根據(jù)基于能量分布的故障診斷理論將振動(dòng)信號(hào)功率譜密度按一定的規(guī)則進(jìn)行量化,利用神經(jīng)網(wǎng)絡(luò)等工具進(jìn)行故障診斷。但是喘振、流體激勵(lì)等故障在頻域內(nèi)通常表現(xiàn)為連續(xù)分布的有色噪聲帶,在頻域內(nèi)分析難以區(qū)分,難以進(jìn)行頻譜特征提取,全息譜分析方法也不甚有效。傳統(tǒng)方法增加了系統(tǒng)的開銷,診斷效果不理想。如果在時(shí)域內(nèi)采用信息優(yōu)化方法做預(yù)處理,再用傳統(tǒng)的診斷方法進(jìn)行診斷,可以收到很好的效果。
本文采用時(shí)域內(nèi)故障振動(dòng)信號(hào)的方差、峭度、偏斜度等參數(shù),分別利用BP神經(jīng)網(wǎng)絡(luò)和后驗(yàn)熵分析對(duì)其進(jìn)行特征提取,研究如何從中找出最能反映故障的特征。
表1為主軸喘振、流體激勵(lì)故障時(shí)振動(dòng)信號(hào)在垂直和水平方向的方差、峭度、偏斜度等6個(gè)參數(shù)的數(shù)據(jù)。
表1 主軸故障的特征參數(shù)
[NextPage]
序號(hào) 喘振 流體激勵(lì) 均方差 峭度 偏斜度 均方差 峭度 偏斜度 垂直 水平 垂直 水平 垂直 水平 垂直 水平 垂直 水平 垂直 水平 1 7.50 9.21 -0.02 -0.00 -0.22 -0.10 40.2 44.1 0.22 -0.42 -0.11 -0.08 2 26.1 15.2 -0.75 -0.92 -0.31 -0.21 70.1 20.5 3.82 1.78 0.00 0.16 3 13.8 9.21 -0.81 -0.72 -0.29 0.19 12.4 14.2 -0.38 -0.62 0.03 0.01 4 6.2 8.5 -0.01 -0.04 -0.22 -0.23 8.15 33.5 0.15 -0.14 0.07 0.10 5 36.1 11.2 -0.61 -0.01 -0.23 0.07 7.21 15.2 -0.41 -0.51 0.01 0.01 6 11.5 9.71 -0.81 -0.93 -0.31 -0.18 25.7 30.2 -0.37 0.19 -0.11 -0.06 7 33.1 28.2 -0.79 -0.85 -0.07 -0.45 71.2 25.3 3.81 1.85 0.01 0.16 8 37.2 26.8 -0.81 -0.87 -0.06 -0.41 8.11 35.2 -0.81 -0.13 0.01 0.11
設(shè)原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分別為垂直、水平方向的均方差,x3、x4分別為垂直和水平方向的峭度,x5、x6,分別為垂直和水平方向的偏斜度。
、 基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法:采用表1中的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,編制程序?qū)ι窠?jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練算法采用標(biāo)準(zhǔn)BP算法和Levenberg-Mar-quardt法兩種方法來訓(xùn)練BP網(wǎng)絡(luò),從而計(jì)算特征參數(shù)的特征靈敏度,確定出對(duì)結(jié)果影響最大的特征參數(shù)。
喘振:
│W1│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
流體激勵(lì):
│W2│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
從結(jié)果可以看出:偏斜度對(duì)這兩種故障最為敏感,反映了低頻自激故障的主要特征。
、 基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}對(duì)應(yīng)表1中的特征參數(shù)。在特征參數(shù)優(yōu)化過程中,隨著特征的刪除,后驗(yàn)熵變化較大。當(dāng)刪除的特征中包含有x5、x6時(shí),后驗(yàn)熵明顯降低;如僅保留x5、x6時(shí),后驗(yàn)熵最小。說明偏斜度對(duì)這兩種故障最為敏感。
對(duì)比這兩種特征提取方法,可以看出它們得到的結(jié)論是一樣的。如果采用通頻全息譜法來進(jìn)行分析,得到的結(jié)論相同,從而驗(yàn)證了這兩種特征提取方法的有效性。
在實(shí)際的狀態(tài)監(jiān)測(cè)和故障診斷中,可以重點(diǎn)監(jiān)測(cè)系統(tǒng)的偏斜度,配合對(duì)振動(dòng)信號(hào)的頻譜分析,可以快速地判斷故障類型和具體發(fā)生的時(shí)間。
【故障特征提取的方法研究】相關(guān)文章:
基于小波多尺度和熵在圖像字符特征提取方法的改進(jìn)08-06
10種啟動(dòng)故障解決方法08-05
壓力表常見故障及檢修方法08-23
開題報(bào)告的研究方法推薦08-18
蓄電池充電方法的研究08-06
論國學(xué)研究的態(tài)度、立場(chǎng)與方法08-22
學(xué)生閱讀時(shí)文報(bào)刊的方法研究08-25
審計(jì)理論研究方法的探討08-07
藝術(shù)學(xué)研究的田野方法08-05