01SEM IP的功能概述
SEM(Soft Error Mitigation)技術(shù)通過(guò)目標(biāo)式ECC奇偶校驗(yàn)位注入實(shí)現(xiàn)可觀測(cè)的軟錯(cuò)誤模擬。該機(jī)制在配置存儲(chǔ)器幀(CRAM Frame)內(nèi)精確選擇校驗(yàn)位進(jìn)行可控翻轉(zhuǎn),確保注入錯(cuò)誤位于冗余校驗(yàn)區(qū)域而非功能邏輯位,從而避免對(duì)設(shè)計(jì)功能完整性造成干擾。主要應(yīng)用于要求苛刻的場(chǎng)景(如航天、工業(yè)控制等)中,SEM控制器可以確保更高的可靠性水平。至于決定是否要在設(shè)計(jì)中使用SEM IP,需要了解可能性和系統(tǒng)級(jí)考慮因素。

圖1. 軟錯(cuò)誤決策樹示例
02SEM IP接口及配置
02.1SEM IP接口介紹

圖2. SEM的參考設(shè)計(jì)的模塊設(shè)計(jì)
系統(tǒng)級(jí)示例設(shè)計(jì)封裝了SEM控制器和用于控制器與其他設(shè)備接口的通道。值得注意的是,SEM控制器沒有復(fù)位信號(hào)。這是由于SEM控制器的任務(wù)是監(jiān)視和維護(hù)原始配置狀態(tài),而不是從一些臨時(shí)(可能錯(cuò)誤的)狀態(tài)重新啟動(dòng),故不設(shè)置復(fù)位。它自動(dòng)初始化自身與內(nèi)部同步復(fù)位派生自全局復(fù)位信號(hào)的解除。下表展示各個(gè)接口的詳細(xì)描述。

表1. 各個(gè)接口的功能描述
02.2SEM IP配置介紹

圖3. SEM IP配置界面
控制器的模式
從模式上劃分:
SEM IP可以分成六個(gè)模式:
? 緩解和測(cè)試
? 僅緩解
? 檢測(cè)和測(cè)試
? 僅檢測(cè)
? 仿真
? 監(jiān)控
按照IP內(nèi)對(duì)各個(gè)模式的特性對(duì)比,“緩解和測(cè)試”是最適合用于測(cè)試仿真的模式。該模式與其他模式最核心的差異在于可同時(shí)支持錯(cuò)誤注入和糾錯(cuò)能力。

圖4. SEM IP高級(jí)配置界面
錯(cuò)誤分類功能僅在糾錯(cuò)模式(緩解和測(cè)試/僅緩解)下可用,用于判斷已糾正的軟錯(cuò)誤是否影響設(shè)計(jì)功能。順帶一提的是,IP默認(rèn)針對(duì)開發(fā)板將錯(cuò)誤分類的功能禁用,是因?yàn)樵u(píng)估板默認(rèn)不包括外部SPI內(nèi)存。
控制器的時(shí)鐘
控制器的時(shí)鐘周期通過(guò)“Clock period”字段設(shè)定,其值越小,頻率值越高,錯(cuò)誤緩解時(shí)間越短。但是設(shè)計(jì)時(shí)需要確保目標(biāo)器件支持設(shè)定的周期,否則會(huì)觸發(fā)警告。下表提供了ICAP FMax的總結(jié)。當(dāng)評(píng)估板為目標(biāo)時(shí),默認(rèn)的控制器時(shí)鐘周期自動(dòng)選擇到基于示例設(shè)計(jì)中提供的特定時(shí)鐘頻率的引腳。

表2. ICAP支持的最大頻率
控制器的結(jié)構(gòu)選項(xiàng)
SEM IP配置中原語(yǔ)(ICAP/FRAME_ECC)的包含方式分為兩種,核心差異是原語(yǔ)的可見性與連接控制權(quán):
1. 包含在核心中:
適用場(chǎng)景:無(wú)其他邏輯需訪問ICAP/FRAME_ECC原語(yǔ)時(shí)。
特點(diǎn):原語(yǔ)自動(dòng)嵌入核心,連接對(duì)用戶透明(不暴露為端口)。
限制:不適用于UltraScale SSI器件。
2. 包含在示例設(shè)計(jì)中:
適用場(chǎng)景:其他邏輯需訪問ICAP/FRAME_ECC原語(yǔ)時(shí)。
特點(diǎn):原語(yǔ)在示例設(shè)計(jì)層級(jí)顯式實(shí)例化,需用戶手動(dòng)連接端口。
03上板實(shí)測(cè)
03.1測(cè)試環(huán)境搭建
工程的搭建基于xapp1298
硬件平臺(tái):MPSoC(ZCU102)

圖5. 工程設(shè)計(jì)示意框圖
在本工程設(shè)計(jì)中,PS通過(guò)專用PL時(shí)鐘接口(pl_clk0)給SEM控制器提供ICAP時(shí)鐘信號(hào)(icap_clk),ICAP仲裁控制及狀態(tài)LED信號(hào)通過(guò)PS擴(kuò)展EMIO接口集中管控。
03.2SEM IP調(diào)試
本文在“緩解和測(cè)試”模式下進(jìn)行,旨在觀察錯(cuò)誤注入以及IP的糾錯(cuò)功能。其中關(guān)于SEM在運(yùn)行過(guò)程中涉及的關(guān)鍵步驟包括:PCAP權(quán)限移交ICAP,時(shí)鐘使能,ICAP仲裁切換行為以及調(diào)試方式。下面圍繞這些詳細(xì)介紹。
PCAP權(quán)限移交ICAP
由于缺乏FPGA的啟動(dòng)獨(dú)立性,MPSoC在調(diào)試過(guò)程中必須要在PS啟動(dòng)后,主動(dòng)釋放PCAP權(quán)限,并將配置控制權(quán)移交給ICAP。這是因?yàn)镻CAP和ICAP的功能類似,都是PS訪問配置控制端接口,無(wú)法同時(shí)運(yùn)行。因此,像MPSoC器件在使用SEM時(shí),必須修改寄存器pcap_ctrl(地址0XFFCA3008)的bit0位,將其清零以切換至ICAP控制。否則將會(huì)初始化失敗,導(dǎo)致SEM卡在“Initialization”狀態(tài),無(wú)法啟動(dòng)糾錯(cuò)功能。

圖6. MPSoC pcap_ctrl寄存器
可采用下面的兩種方式實(shí)現(xiàn)寄存器配置:
1. PS側(cè)添加如下代碼

2. XSCT下配置寄存器

BUFGCE使能
觀察圖5會(huì)發(fā)現(xiàn),時(shí)鐘路徑中集成BUFGCE模塊。該模塊的使能端口CE默認(rèn)為低,是因?yàn)橄到y(tǒng)級(jí)的要求下,經(jīng)過(guò)MMCM/PLL的時(shí)鐘需要等到穩(wěn)定后才能提供給SEM。比如,在一些用到MIG的場(chǎng)景下,由于MIG做BIST階段需要極高的時(shí)序精度,這個(gè)階段使用SEM會(huì)有概率導(dǎo)致MIG校驗(yàn)錯(cuò)誤,使能開關(guān)的作用可以規(guī)避這一問題。
ICAP仲裁切換行為
ICAP仲裁接口按照下面流程圖的邏輯實(shí)現(xiàn)多個(gè)功能共享ICAP的機(jī)制。其中,需要注意的是,由于IP不知道在停止訪問ICAP時(shí)是否操縱了配置內(nèi)存,會(huì)導(dǎo)致再次被訪問后會(huì)重新引導(dǎo)和重新初始化。

圖6. ICAP仲裁切換行為流程圖
調(diào)試的方式
主要可以通過(guò)下面兩種方式觀察注入錯(cuò)誤實(shí)驗(yàn),兩者各有優(yōu)勢(shì),按需選擇。
通過(guò)VIO的方式,在硬件調(diào)試窗口界面修改錯(cuò)誤注入地址,再執(zhí)行注入觸發(fā)。
通過(guò)串口敲擊命令,通常建議使用更簡(jiǎn)易的串口指令方式進(jìn)行調(diào)試。
執(zhí)行“I”,可進(jìn)入IDLE狀態(tài)
執(zhí)行“O”,可進(jìn)入Observation狀態(tài)
注入命令輸入“N”+“inject_address”;
執(zhí)行“S”,獲取當(dāng)前狀態(tài),包括獲取MF(Maximum Frame)的值,確保注入錯(cuò)誤不會(huì)越界。對(duì)于不同類型、Virtex-6,7 series和 Zynq-7000、Ultrascale)的器件,MF的大小也不一樣。
當(dāng)SEM發(fā)生狀態(tài)切換,會(huì)輸出對(duì)應(yīng)的打印信息,信息以“SC”開頭。錯(cuò)誤類型信息以“FC”開頭,從可糾錯(cuò)與不可糾錯(cuò)、必要錯(cuò)誤和非必要錯(cuò)誤排列可以組合分成4種。

表3. 狀態(tài)報(bào)告

表4. 錯(cuò)誤標(biāo)記報(bào)告
掃描和糾錯(cuò)

圖7. 串口指令控制SEM掃描和糾錯(cuò)
如上圖,通過(guò)串口指令,分別調(diào)試注入單bit錯(cuò)誤和多bit錯(cuò)誤后,SEM掃描和糾錯(cuò)的情況。并通過(guò)VIO監(jiān)測(cè)對(duì)應(yīng)實(shí)驗(yàn)下觀測(cè)確認(rèn)兩邊的結(jié)果一致,由此證明SEM工作正常。


圖7. VIO指令監(jiān)控SEM掃描和糾錯(cuò)
04SEM注入錯(cuò)誤的補(bǔ)充說(shuō)明
錯(cuò)誤注入命令只有在配置IP時(shí),勾選了“錯(cuò)誤注入使能”才能工作。
注入前,需要確認(rèn)為IDLE狀態(tài),注入后,必須顯示過(guò)渡到observation才能讓IP嘗試檢測(cè)或糾正。
一次注入超過(guò)4個(gè)bit位,超出限制(ECC algorithm-based correction that supports correction of configuration memoryframes with up to 4-bit errors.見pg187),注入命令會(huì)丟失。
此外,如果配置幀,沒有顯示變化,可能是不存在該地址。
關(guān)于安富利
安富利是全球領(lǐng)先的技術(shù)分銷商和解決方案提供商,在過(guò)去一個(gè)多世紀(jì)里一直秉持初心,致力于滿足客戶不斷變化的需求。通過(guò)遍布全球的專業(yè)化和區(qū)域化業(yè)務(wù)覆蓋,安富利可在產(chǎn)品生命周期的每個(gè)階段為客戶和供應(yīng)商提供支持。安富利能夠幫助各種類型的公司適應(yīng)不斷變化的市場(chǎng)環(huán)境,在產(chǎn)品開發(fā)過(guò)程中加快設(shè)計(jì)和供應(yīng)速度。安富利在整個(gè)技術(shù)價(jià)值鏈中處于中心位置,這種獨(dú)特的地位和視角讓其成為了值得信賴的合作伙伴,能夠幫助客戶解決復(fù)雜的設(shè)計(jì)和供應(yīng)鏈難題,從而更快地實(shí)現(xiàn)營(yíng)收。
-
控制器
+關(guān)注
關(guān)注
114文章
17530瀏覽量
189121 -
接口
+關(guān)注
關(guān)注
33文章
9307瀏覽量
155708 -
IP
+關(guān)注
關(guān)注
5文章
1839瀏覽量
154562 -
SEM
+關(guān)注
關(guān)注
0文章
270瀏覽量
15447 -
MPSoC
+關(guān)注
關(guān)注
0文章
202瀏覽量
25010
原文標(biāo)題:AMD技術(shù)干貨|SEM IP在MPSoC器件上的使用指南
文章出處:【微信號(hào):AvnetAsia,微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
看門狗在Zynq MPSoC上的使用技巧
如何調(diào)試Zynq UltraScale+ MPSoC VCU DDR控制器
PWM使用指南
AT32F421 CMP使用指南
Synplicity軟件使用指南
幾種常見的關(guān)于SEM IP的沖突
AMD MPSoC器件中啟用SEM IP的策略與方法

SEM IP在MPSoC器件上的使用指南
評(píng)論