為工業(yè)應用選擇閃存設備或固態(tài)驅動器 (SSD) 非常復雜。價格性能比較幾乎沒有用,因為需求驅動的性能定義取決于許多因素。
對于標準 IT 應用程序,每 GB 價格是購買閃存的絕佳標準。在某些情況下,還會考慮寫入和讀取速度。但是,如果您需要用于工業(yè)應用的閃存設備,或者需要用于戶外電信應用的存儲卡,那么您的優(yōu)先級將有所不同。如果通常情況下,容量不是真正的問題,那么穩(wěn)健性和耐用性肯定是問題。持久性(即閃存介質壽命)和保留(即保存數(shù)據(jù)的持久性)是復雜的問題。存儲介質固件和架構都在這里發(fā)揮作用,應用程序的性質也是如此。數(shù)據(jù)將如何寫入?還是更強調閱讀?如果您對閃存有特殊要求,那么您需要確切知道要問哪些問題。
背景:衰老的跡象
通常,NAND 閃存設備的單元只允許有限數(shù)量的刪除。這是因為每次產(chǎn)生隧道效應時,通常阻止電子從浮柵流出的氧化層由于熄滅電壓而積累了高能電子。因此,閾值電壓會隨時間變化,最終導致單元不再可讀(圖 1)。

【圖1 | 老化電池:電子在隧道氧化層中積累,導致閾值電壓逐漸變化。隧道氧化層中的裂縫會引起泄漏電流路徑,從而使電荷流出。讀取錯誤增加到塊成為需要淘汰的“壞塊”的程度。]
老化的另一個影響是在氧化層中形成導電路徑,導致電池逐漸失去電荷——隨之而來的是保持位。這種效應會因暴露在高溫下而加速,特別是在允許的編程/擦除 (P/E) 循環(huán)次數(shù)減少的情況下更容易發(fā)生,從而導致保留率急劇下降。因此,雖然新的單級和多級單元(SLC 和 MLC)NAND 都可靠地提供了 10 年的保留時間,但在其使用壽命結束時,這一數(shù)字下降到只有一年。但是對于 MLC NAND,這一點在 3,000 個 P/E 周期后達到,而 SLC 在 100,000 個之后達到。這就解釋了為什么 SLC 是復雜應用的首選解決方案,以及為什么低成本三級單元 (TLC) NAND 芯片不能用于長期存儲。要使用這種技術在每個單元中寫入 3 位,您需要八個不同的電荷狀態(tài),這就是退化很快變得明顯的原因。在 TLC 中,最初的一年保留水平僅在 500 個 P/E 周期后下降到三個月。
緩解措施
使用各種機制減輕對芯片的物理損壞的影響??紤]到當一個單元發(fā)生故障時,需要將整個塊標記為“壞”,磨損均衡確保所有物理存儲地址都經(jīng)歷相同的使用級別。但讀取錯誤不僅僅是磨損。每次寫入數(shù)據(jù)時,已編程單元周圍的單元都會承受壓力(即它們變得更有活力)——這種現(xiàn)象稱為“編程干擾”。隨著時間的推移,單元電壓閾值會增加,從而導致讀取錯誤——一旦相關塊被擦除,這些錯誤就會得到修復。閱讀還會導致一種稱為“閱讀干擾”的壓力形式,相鄰的頁面會累積電荷。由于涉及的電壓相對較低,這種影響遠沒有寫入那么明顯——但讀取容易出現(xiàn)位錯誤,必須通過糾錯碼 (ECC) 進行糾正,并通過刪除相關塊來修復。有趣的是,這種效果在重復讀取相同數(shù)據(jù)的應用程序中尤為明顯。這意味著即使在只讀存儲器中,也需要刪除塊并重復寫入頁面以糾正錯誤。
如何測量 SSD 的耐用性
制造商使用兩個指標來衡量閃存設備的壽命:寫入的兆字節(jié)數(shù) (TBW) 和每天的驅動器寫入數(shù) (DWPD)。TBW表示SSD生命周期內可以寫入的數(shù)據(jù)總量,而DWPD表示保修期內每天可以寫入的數(shù)據(jù)量。這些基準的問題在于它們極其復雜,用戶別無選擇,只能依賴制造商的規(guī)格。此外,在為給定的應用程序選擇正確的數(shù)據(jù)介質時,這些規(guī)范的實際相關性尚不清楚,因為獲得的數(shù)字很大程度上取決于測試工作量。例如,Swissbit 480 GBP SSD 的測試得出 1360、912 或 140 TBW 的使用壽命,具體取決于所使用的測量方法。最顯著的結果是通過測量順序寫入來實現(xiàn)的。第二個值(912)由客戶工作負載產(chǎn)生,而第三個值(140)來自企業(yè)工作負載。兩種負載測試均構成 JEDEC 標準??蛻舳斯ぷ髫撦d基于計算機用戶的行為,并且主要生成順序訪問。另一方面,企業(yè)工作負載模擬多用戶環(huán)境中服務器的性能,生成高達 80% 的隨機訪問。
雖然理論上這些標準應該允許可比性,但問題是許多制造商根本沒有指明底層工作負載,而是將他們的產(chǎn)品信息基于順序寫入值。而且,如示例所示,后者對于企業(yè)工作負載可能相差十倍,因此在涉及顯著且未明確指定的高耐久性值時需要格外小心。
寫放大系數(shù) (WAF) 降低
邏輯到物理映射系統(tǒng)、ECC 和稱為垃圾收集的清除塊的過程都是理解和排序閃存功能和性能的相關機制。該領域的一個關鍵術語是寫入放大系數(shù)或 WAF,它是來自主機的用戶數(shù)據(jù)與寫入閃存設備的實際數(shù)據(jù)量之間的比率。降低 WAF(閃存控制器效率的一項指標)是提高 SSD 耐用性的關鍵。影響 WAF 的工作負載因素包括順序訪問和順序訪問以及隨機訪問之間的差異,或者數(shù)據(jù)塊大小相對于頁面和塊大小的差異。必須滿足兩個基本條件:頁面需要一個接一個地寫入,塊需要作為一個整體刪除。在標準過程中,邏輯地址和物理地址之間的映射關系到塊。這對于順序數(shù)據(jù)非常有效,因為給定塊的頁面可以順序寫入。這種機制的一個例子是連續(xù)積累的視頻數(shù)據(jù)。然而,對于隨機數(shù)據(jù),頁面被寫入許多不同的塊中,因此頁面的每次內部覆蓋都需要刪除整個塊。這會導致更高的 WAF 和縮短的使用壽命。因此,基于頁面的映射更適合非順序數(shù)據(jù)。換句話說,固件確保來自不同來源的數(shù)據(jù)可以順序寫入單個塊的頁面。這減少了刪除的數(shù)量,從而延長了生命周期并提高了寫入性能。

【圖2 | 對比測試:與常規(guī)產(chǎn)品相比,F(xiàn)-60 durabit 更耐用,WAF 更低。這是通過 DRAM 中的 FTL 和更大的過度配置來實現(xiàn)的。]
增加 WAF 的另一個因素是內存使用量。存儲在閃存設備上的數(shù)據(jù)越多,固件需要從一個地方移動到另一個地方的比特就越多?;陧撁娴挠成湓谶@里也很有利。制造商還有另一種稱為過度配置的調整機制(即,閃存設備的空間僅保留用于后臺活動)可供他們使用。SSD 的 7%(千兆字節(jié)數(shù)字的二進制和十進制值之間的差異)通常用于此目的。但是為過度配置保留 12% 而不是 7% 是非常有效的。例如,從 MLC NAND 芯片派生的兩個相同 SSD 的耐久性比較(即企業(yè)工作負載的 TBW)表明,60 GB Swissbit F-60 durabit 達到了 6。價值比同一公司的 64 位 F-50 設備高 6 倍。事實上,240 GB 和 265 GB 版本的價值高出 10 倍。
結論和要問的九個關鍵問題
SLC 閃存器件在許多方面都是工業(yè)應用以及斷電保護的最可靠的解決方案。然而,在許多情況下,高端 MLC 閃存介質同樣適用于此類用途。除了機械性能達到軍用標準外,在尋找 SSD 解決方案時,還應特別注意制造商在減少 WAF 和通過固件延長產(chǎn)品壽命方面付出的努力。發(fā)揮作用的其他因素是“數(shù)據(jù)維護管理”措施,以更好地保留,不要忘記經(jīng)過精心挑選的模塊的長期可用性,以適應給定的應用程序。
應用要求決定了您在選擇 SSD 時需要特別注意哪些因素。根據(jù)要求,Swissbit 為其客戶提供 Lifetime Monitor,這是一種通過分析讀取和寫入來計算給定 SSD 耐用性的工具。如前所述,即使價格不是決定性因素,了解您是否真的需要貴 8 倍的 SSD 或 MLC 是否足以滿足您的目的也很有用。
為工業(yè)應用選擇閃存器件時要問的關鍵問題:
我對振動、阻力和溫度范圍有特定的物理要求嗎?–工業(yè)閃存設備應通過應用適當?shù)蔫b定程序,能夠證明高質量的材料特性和良好的生產(chǎn)和加工。
內存是否長時間暴露在高溫下?–因為高溫會更快地削弱cell的可讀性,所以應該選擇具有數(shù)據(jù)保護功能的產(chǎn)品,定期刷新數(shù)據(jù)。
是否打算在數(shù)據(jù)載體上長期寫入和存儲大量數(shù)據(jù)?–如果是,則應選擇 SLC 產(chǎn)品。
應用程序是否主要需要讀取訪問權限?–如果是,則應選擇具有數(shù)據(jù)護理功能的產(chǎn)品,該產(chǎn)品會定期刷新數(shù)據(jù)。
應用程序是否主要需要寫入功能?–然后具有基于塊的映射的產(chǎn)品適用于順序寫入功能。對于隨機請求,應選擇具有基于頁面映射的產(chǎn)品。
內存容量是否被充分利用?–對于密集使用的應用程序,控制器需要內部操作空間,并且過度配置可以延長耐用性。
提供商為 TBW 或 DWPD 指定了哪些工作負載?–數(shù)據(jù)載體的比較只能通過工作量基準的指示來實現(xiàn)。
是否需要更高級別的數(shù)據(jù)丟失保護?–對于特別關鍵的應用,數(shù)據(jù)維護管理和電源故障保護是必不可少的。
幾年后,該介質是否仍然可用?–制造商應保證長期可用性,以便無需重新認證即可更換內存存儲。
審核編輯:郭婷
電子發(fā)燒友App

















評論