可靠性預(yù)計(jì)看似很理論很體系,但是實(shí)際項(xiàng)目感覺(jué)沒(méi)啥用?
電路板的可靠性預(yù)計(jì)通常是基于電子元器件的失效率進(jìn)行的。常見(jiàn)的做法是根據(jù)每個(gè)元器件的失效率模型(如MIL-HDBK-217、Telcordia SR-332等標(biāo)準(zhǔn)),結(jié)合元器件的使用環(huán)境、應(yīng)力水平和運(yùn)行時(shí)間來(lái)計(jì)算整個(gè)電路板的可靠性指標(biāo),如平均故障間隔時(shí)間(MTBF)或失效率(FIT,F(xiàn)ailures in Time)。
這種基于元器件失效率的可靠性預(yù)計(jì)主要涉及以下幾個(gè)步驟:
元器件級(jí)別的失效率計(jì)算:每個(gè)元器件都有特定的失效率模型,考慮其工作條件,如溫度、應(yīng)力、電流、電壓等。這些失效率模型可能會(huì)受到以下幾個(gè)因素的影響:
環(huán)境因素:溫度、濕度等對(duì)元器件失效率的影響很大。高溫通常會(huì)顯著增加失效率。

器件極限溫度承受能力是高壓線,超過(guò)后失效率劇增,使用中不允許超過(guò)。在極限溫度以?xún)?nèi),器件失效率與溫度仍然強(qiáng)相關(guān),失效率隨著溫度升高而增加。
問(wèn)題:是否存在一個(gè)安全溫度點(diǎn),只要不超過(guò)這個(gè)溫度點(diǎn),失效率與溫度關(guān)系就不密切?
答案:理論與實(shí)際表明,多數(shù)情況下不存在這樣的溫度點(diǎn)。器件的失效率始終與溫度相關(guān),只是高于某個(gè)溫度點(diǎn)之后,失效率會(huì)急劇上升,出現(xiàn)拐點(diǎn)。

降額設(shè)計(jì)就是使元器件或產(chǎn)品工作時(shí)承受的工作應(yīng)力適當(dāng)?shù)陀谠骷虍a(chǎn)品規(guī)定的額定值,從而達(dá)到降低基本失效率(故障率),提高使用可靠性的目的。20世紀(jì)50年代,日本人發(fā)現(xiàn),溫度降低10℃,元器件的失效率可降低一半以上。實(shí)踐證明,對(duì)元器件的某些參數(shù)適當(dāng)降額使用,就可以大幅度提高元器件的可靠性。因電子產(chǎn)品的可靠性對(duì)其電應(yīng)力和溫度應(yīng)力比較敏感,故而降額設(shè)計(jì)技術(shù)和熱設(shè)計(jì)技術(shù)對(duì)電子產(chǎn)品則顯得尤為重要。
一款流量計(jì)的電源前期設(shè)計(jì),未采用降額設(shè)計(jì),其調(diào)整管僅按計(jì)算其功耗為0.8W(在常溫20℃~25℃),選用額定功率為1W的晶體管。結(jié)果在調(diào)試時(shí)和在用戶使用中發(fā)生故障頻繁。分析其原因主要是該管額定功耗1W時(shí)的環(huán)境溫度為25℃,而實(shí)際工作時(shí)該管處于的環(huán)境溫度為60℃,此管此時(shí)實(shí)際最大功耗已達(dá)1W。經(jīng)可靠性工程師分析和建議,選用同參數(shù)2W的晶體管,這時(shí)降額系數(shù)S≈0.5。因而產(chǎn)品的故障很快得到解決。
電氣應(yīng)力:電路中元器件的實(shí)際工作條件(如電流、電壓)相對(duì)于其額定值的偏離程度也會(huì)影響失效率。
使用時(shí)間:失效率通常會(huì)隨著時(shí)間增加,尤其在產(chǎn)品的“浴盆曲線”早期(早期失效期)和后期(損耗失效期)更加明顯。

失效率模型的應(yīng)用:不同的失效率標(biāo)準(zhǔn)采用不同的模型。例如:
MIL-HDBK-217:美國(guó)軍方標(biāo)準(zhǔn),包含了廣泛的元器件失效率模型,涵蓋多種環(huán)境和應(yīng)力因素。
Telcordia SR-332:主要用于通信設(shè)備的可靠性預(yù)計(jì),常用于工業(yè)和商用電子設(shè)備。
FIT(Failures in Time):每十億小時(shí)的故障次數(shù),常用于現(xiàn)代商業(yè)標(biāo)準(zhǔn)。
系統(tǒng)級(jí)別可靠性預(yù)計(jì):通過(guò)匯總電路板上所有元器件的失效率,可以計(jì)算整個(gè)電路板的失效率或MTBF。通常采用“串聯(lián)系統(tǒng)模型”來(lái)計(jì)算,即假設(shè)所有元器件串聯(lián)工作,如果一個(gè)元器件失效,整個(gè)系統(tǒng)也會(huì)失效:
其中,
MTBF的計(jì)算:根據(jù)總失效率,可以計(jì)算平均故障間隔時(shí)間(MTBF):
這個(gè)值反映了系統(tǒng)在統(tǒng)計(jì)上平均無(wú)故障工作的時(shí)間。
雖然這種方法是可靠性預(yù)計(jì)的主流手段,但它有以下局限性:
未考慮系統(tǒng)級(jí)故障:元器件的失效并不總是系統(tǒng)級(jí)故障的唯一原因。連接、焊接、熱管理等也會(huì)導(dǎo)致系統(tǒng)失效,但這些因素通常在預(yù)計(jì)中被忽略。
環(huán)境復(fù)雜性:實(shí)際運(yùn)行環(huán)境可能比預(yù)計(jì)模型中的假設(shè)要復(fù)雜得多,導(dǎo)致實(shí)際可靠性與預(yù)計(jì)值存在顯著差距。
元器件失效模式不全:預(yù)計(jì)模型通常只涵蓋一些常見(jiàn)的失效模式,而許多不常見(jiàn)的故障模式,如系統(tǒng)級(jí)噪聲、電磁干擾、機(jī)械應(yīng)力等,往往無(wú)法在預(yù)計(jì)中反映出來(lái)。
因此,雖然基于電子元器件失效率的預(yù)計(jì)在設(shè)計(jì)初期有助于評(píng)估系統(tǒng)可靠性,但仍需通過(guò)實(shí)際測(cè)試和驗(yàn)證來(lái)確認(rèn)電路板的可靠性。
可靠性預(yù)計(jì)(Reliability Prediction)在實(shí)際設(shè)計(jì)中的效用常常受到質(zhì)疑,原因可能包括以下幾個(gè)方面:
模型假設(shè)不夠精確:大多數(shù)可靠性預(yù)計(jì)模型(如MIL-HDBK-217、Telcordia等)基于統(tǒng)計(jì)數(shù)據(jù)和歷史經(jīng)驗(yàn),而這些數(shù)據(jù)往往是對(duì)大量組件的統(tǒng)計(jì)平均值,不能反映每個(gè)具體應(yīng)用場(chǎng)景的獨(dú)特性。它假設(shè)的使用環(huán)境、應(yīng)力水平等可能與實(shí)際使用情況不符,導(dǎo)致預(yù)計(jì)結(jié)果偏差。
不考慮實(shí)際工作條件:很多可靠性預(yù)計(jì)方法沒(méi)有充分考慮到組件在實(shí)際操作中的復(fù)雜工作條件,如溫度、濕度、電氣應(yīng)力等因素。在現(xiàn)實(shí)中,組件通常工作在特定的環(huán)境下,遠(yuǎn)比預(yù)計(jì)中的靜態(tài)或理想條件復(fù)雜。
難以反映實(shí)際故障模式:實(shí)際中的許多故障是復(fù)雜的系統(tǒng)級(jí)別問(wèn)題,可能涉及多個(gè)子系統(tǒng)、接口或環(huán)境因素。傳統(tǒng)的可靠性預(yù)計(jì)主要針對(duì)單個(gè)組件進(jìn)行,難以反映系統(tǒng)級(jí)別的問(wèn)題或?qū)嶋H運(yùn)行中的意外情況,如機(jī)械磨損、振動(dòng)、電磁干擾等。
設(shè)計(jì)動(dòng)態(tài)變化:在快速發(fā)展的技術(shù)環(huán)境中,設(shè)計(jì)往往在產(chǎn)品開(kāi)發(fā)的過(guò)程中不斷修改,可靠性預(yù)計(jì)基于早期的設(shè)計(jì)進(jìn)行計(jì)算,無(wú)法適應(yīng)設(shè)計(jì)變更,導(dǎo)致預(yù)計(jì)結(jié)果在實(shí)際生產(chǎn)中失去參考價(jià)值。
不適用于新技術(shù):可靠性預(yù)計(jì)模型通?;跉v史數(shù)據(jù),但在新技術(shù)、材料或生產(chǎn)工藝中缺乏足夠的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行預(yù)計(jì)。例如,新的半導(dǎo)體技術(shù)、3D打印等領(lǐng)域,可能沒(méi)有成熟的可靠性模型來(lái)支撐。
過(guò)度依賴(lài)數(shù)據(jù):可靠性預(yù)計(jì)依賴(lài)于組件的故障數(shù)據(jù)和統(tǒng)計(jì)模型,但實(shí)際故障常常由設(shè)計(jì)缺陷、制造問(wèn)題或用戶誤操作引發(fā)。這些問(wèn)題無(wú)法通過(guò)可靠性預(yù)計(jì)中的公式和數(shù)據(jù)直接推導(dǎo)出來(lái)。
實(shí)際設(shè)計(jì)中的設(shè)計(jì)缺陷更多:由于我們?cè)O(shè)計(jì)過(guò)程中,例如熱設(shè)計(jì)不滿足要求,結(jié)構(gòu)本身的震動(dòng)特性有缺陷,芯片的電應(yīng)力、溫度應(yīng)力不滿足要求,電源紋波過(guò)大,信號(hào)與時(shí)鐘時(shí)序不滿足全溫度范圍的要求,等等設(shè)計(jì)缺陷在設(shè)計(jì)測(cè)試階段沒(méi)有完全被暴露和解決,導(dǎo)致帶病出貨。往往還沒(méi)到芯片常規(guī)失效率的程度,系統(tǒng)本身就掛了,這是當(dāng)前很多產(chǎn)品的主要矛盾。
在實(shí)際設(shè)計(jì)中,更有效的方法往往是可靠性測(cè)試和加速壽命試驗(yàn),通過(guò)模擬實(shí)際的工作條件或加速應(yīng)力測(cè)試來(lái)評(píng)估產(chǎn)品在特定環(huán)境下的性能表現(xiàn)。這些測(cè)試可以捕捉到預(yù)計(jì)無(wú)法預(yù)測(cè)的實(shí)際使用中的問(wèn)題。
因此,可靠性預(yù)計(jì)更多是作為一個(gè)參考工具,幫助設(shè)計(jì)人員初步評(píng)估系統(tǒng)的潛在問(wèn)題,而不是取代實(shí)際測(cè)試和設(shè)計(jì)優(yōu)化的手段。


評(píng)論