18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI應(yīng)用越來(lái)越普遍,AI模型在邊緣端如何部署?

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-04 00:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在人工智能時(shí)代,越來(lái)越多的AI應(yīng)用需要從云端擴(kuò)展到邊緣端,比如智能耳機(jī)、智能攝像機(jī)、智能手環(huán)、物流機(jī)器人等,在邊緣端部署AI已經(jīng)成為趨勢(shì)。如今AI大模型迅猛發(fā)展,AI大模型在端側(cè)的部署也成了業(yè)界關(guān)注的焦點(diǎn)。

如何把AI模型在邊緣端部署

首先得軟硬件適配,硬件方面,適配的AI芯片越多越好,這樣對(duì)于工程師來(lái)說(shuō),就降低了端側(cè)模型適配遷移的難度,即使換一個(gè)設(shè)備也可以輕松部署上去;軟件方面,主要的操作系統(tǒng)需要做適配,包括Linux、Windows、Android 、iOS等,這樣無(wú)論是手機(jī)、PC都可以部署。還有框架適配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要對(duì)模型進(jìn)行壓縮,在保證高精度的同時(shí),最好也能夠讓模型跑得更快更省內(nèi)存,這里需要采用模型壓縮技術(shù),比如模型量化、剪枝和蒸餾技術(shù)。尤其是如今AI大模型迅猛發(fā)展,未來(lái)大模型在端側(cè)的部署也少不了要用到壓縮技術(shù)。

可以說(shuō),模型壓縮技術(shù)是實(shí)現(xiàn)AI大模型在邊/端部署的核心技術(shù)。模型壓縮技術(shù)可在保有大模型原有性能和精度基本不變前提下降低對(duì)推理算力的需求。

具體來(lái)看,量化,即將浮點(diǎn)計(jì)算轉(zhuǎn)成低比特定點(diǎn)計(jì)算;網(wǎng)絡(luò)剪枝,即去除神經(jīng)網(wǎng)絡(luò)中冗余的通道、神經(jīng)元節(jié)點(diǎn)等;知識(shí)蒸餾,即將大模型作為教師模型,用其輸出訓(xùn)練性能接近、結(jié)構(gòu)更簡(jiǎn)的模型。

以清華大學(xué)唐杰教授團(tuán)隊(duì)2022年8月發(fā)布的1300億參數(shù)模型 GLM-130B 為例,原模型支持在一臺(tái) A100 40G*8或 V100 32G*8 服務(wù)器上進(jìn)行推理,而將模型量化至 INT 4精度后,相較INT 8精度其所需 GPU 內(nèi)存降低50%,且可在一臺(tái)4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服務(wù)器上進(jìn)行推理。

眾多廠商實(shí)現(xiàn)AI大模型的端側(cè)部署

谷歌、高通、華為等廠商已經(jīng)實(shí)現(xiàn)AI大模型在端側(cè)的部署。今年5月份,在Google/O開(kāi)發(fā)者大會(huì)上,Google宣布了一個(gè)專門(mén)針對(duì)移動(dòng)設(shè)備優(yōu)化系統(tǒng)的TensorFlow新版本TensorFlowLite。這款被稱為T(mén)ensorFlowLite的軟件庫(kù),是可在移動(dòng)設(shè)備上運(yùn)行的深度學(xué)習(xí)工具,它允許開(kāi)發(fā)人員在用戶的移動(dòng)設(shè)備上實(shí)時(shí)地運(yùn)行人工智能應(yīng)用。

該軟件庫(kù)在設(shè)計(jì)上追求高速度和小儲(chǔ)存,支持iOS和Android系統(tǒng)。如果開(kāi)發(fā)者使用其他系統(tǒng),也可以經(jīng)過(guò)一系列復(fù)雜而冗長(zhǎng)的編譯流程,將TensorFlow編譯成移動(dòng)操作系統(tǒng)所支持的軟件庫(kù),這樣并不會(huì)改變TensorFlow的功能。

TensorFlowLite還提供了有限的預(yù)訓(xùn)練人工智能模型,包括MobileNet和InceptionV3物體識(shí)別計(jì)算機(jī)模型,以及SmartReplay自然語(yǔ)言處理模型。開(kāi)發(fā)者用自己的數(shù)據(jù)集做的定制模型也可以部署在上面。TensorFlowLite使用Android神經(jīng)網(wǎng)絡(luò)應(yīng)用程序界面(API),可以在沒(méi)有加速硬件時(shí)直接調(diào)用CPU來(lái)處理,確保其可以兼容不同設(shè)備。

高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁兼AI負(fù)責(zé)人Ziad Asghar此前表示,隨著生成式AI的飛速普及,混合處理的重要性空前突顯?;旌咸幚鞟I的重要性空前突顯,正如傳統(tǒng)計(jì)算從大型主機(jī)和瘦客戶端演變?yōu)楫?dāng)前云端和邊緣終端相結(jié)合的模式,AI處理必須在云端和終端混合進(jìn)行才能發(fā)揮其最大潛能。

根據(jù)高通的演示,將手機(jī)設(shè)置成“飛行模式”,再通過(guò)手機(jī)端全棧AI優(yōu)化,這一模型能夠完全在終端側(cè)運(yùn)行,實(shí)現(xiàn)在15秒內(nèi)完成20步推理,生成飽含細(xì)節(jié)的圖像。很重要的是,即便在飛行模式下,這些AI能力都可以得到實(shí)現(xiàn),例如將Stable Diffusion的能力集成到相機(jī)應(yīng)用中之后,用戶在任何一個(gè)地點(diǎn)拍攝照片,再要求AI將照片背景改為夕陽(yáng)之下的萬(wàn)里長(zhǎng)城。

Ziad Asghar透露,如果在云端運(yùn)行一個(gè)超過(guò)10億參數(shù)的生成式AI模型,可能需要數(shù)百瓦的功耗,而在終端側(cè)運(yùn)行需要的功耗僅有幾毫瓦。這賦予了高通在生成式AI領(lǐng)域的獨(dú)特優(yōu)勢(shì)。不久的將來(lái),擁有 100 億或更高參數(shù)的模型將能夠在終端上運(yùn)行。

在今年3月春季旗艦新品發(fā)布會(huì)上,華為帶來(lái)全新智慧搜圖功能,基于多模態(tài)大模型技術(shù),在手機(jī)端側(cè)對(duì)模型進(jìn)行小型化處理,在業(yè)界率先實(shí)現(xiàn)了首創(chuàng)的、精準(zhǔn)的自然語(yǔ)言手機(jī)圖庫(kù)搜索體驗(yàn)。用戶可以像與人對(duì)話一樣,通過(guò)語(yǔ)音喚醒小藝,使用自然語(yǔ)言在手機(jī)圖庫(kù)中搜索出匹配如 “山頂看日出”、“圍爐煮茶”、“藍(lán)色珊瑚中的小丑魚(yú)”等描述的照片。

相較于傳統(tǒng)圖庫(kù)使用標(biāo)簽進(jìn)行照片搜索,存在準(zhǔn)確率低、響應(yīng)速度慢等問(wèn)題,智慧搜圖更加“聰明”。結(jié)合多模態(tài)大模型技術(shù),智慧搜圖對(duì)億級(jí)的圖文數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,增加了對(duì)泛化通用語(yǔ)義的理解,支持包含顏色、形狀、物體、行為、時(shí)間和地點(diǎn)等多信息組合的自然語(yǔ)言搜索,同時(shí)還實(shí)現(xiàn)了端側(cè)輕量化應(yīng)用。

小結(jié)

由于AI在邊緣或者端側(cè)的部署具有諸多優(yōu)勢(shì),近年來(lái)AI在邊緣側(cè)的應(yīng)用滲透率也越來(lái)越高。AI大模型迅猛發(fā)展,未來(lái)在終端的部署也是必然趨勢(shì),眾多廠商已經(jīng)對(duì)此進(jìn)行探索,并有所突破,期待AI大模型未來(lái)能夠是實(shí)實(shí)在在賦能各行各業(yè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37213

    瀏覽量

    291931
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)視覺(jué)網(wǎng)關(guān):RK3576賦能多路檢測(cè)與邊緣AI

    ,將 “多路檢測(cè) + 硬編硬解 + 邊緣AI + MES集成” 融為一體:保障畫(huà)質(zhì)與時(shí)延的同時(shí),顯著降低系統(tǒng)復(fù)雜度與總體成本,并以數(shù)據(jù)閉環(huán)驅(qū)動(dòng)良率持續(xù)提升。
    發(fā)表于 10-16 17:56

    此芯科技發(fā)布“合一”AI加速計(jì)劃,賦能邊緣側(cè)AI創(chuàng)新

    產(chǎn)品組合,覆蓋從1.5B至32B參數(shù)規(guī)模的側(cè)AI模型推理需求,滿足工業(yè)、消費(fèi)電子、智能終端等多樣化場(chǎng)景的部署需求,推動(dòng)AI技術(shù)從云端向
    的頭像 發(fā)表于 09-15 11:53 ?2000次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b>加速計(jì)劃,賦能<b class='flag-5'>邊緣</b>與<b class='flag-5'>端</b>側(cè)<b class='flag-5'>AI</b>創(chuàng)新

    AI 邊緣計(jì)算網(wǎng)關(guān):開(kāi)啟智能新時(shí)代的鑰匙?—龍興物聯(lián)

    在數(shù)字化浪潮的當(dāng)下,AI 邊緣計(jì)算網(wǎng)關(guān)正逐漸嶄露頭角,成為眾多行業(yè)轉(zhuǎn)型升級(jí)的關(guān)鍵力量。它宛如一座智能橋梁,一緊密連接著各類物理設(shè)備,如傳感器、攝像頭、工業(yè)機(jī)器等,負(fù)責(zé)收集豐富的數(shù)據(jù)信息;另一
    發(fā)表于 08-09 16:40

    邊緣智能網(wǎng)關(guān)在水務(wù)行業(yè)中的應(yīng)用—龍興物聯(lián)

    :? 減少海量抄表數(shù)據(jù)上行壓力,僅上傳關(guān)鍵信息或日/月匯總數(shù)據(jù)。 防洪排澇與雨水管理? 應(yīng)用:? 雨水井、河道、排水管網(wǎng)部署液位、流速、雨量傳感器,邊緣網(wǎng)關(guān)實(shí)時(shí)監(jiān)控。 優(yōu)勢(shì):? 內(nèi)澇實(shí)時(shí)預(yù)警:?
    發(fā)表于 08-02 18:28

    為何邊緣設(shè)備正成為AI的新重心

    人工智能 (AI) 正在以驚人的速度發(fā)展。企業(yè)不再僅僅是探索 AI,而是積極推動(dòng) AI 的規(guī)?;涞?,從實(shí)驗(yàn)性應(yīng)用轉(zhuǎn)向?qū)嶋H部署。隨著生成式模型
    的頭像 發(fā)表于 07-30 09:12 ?566次閱讀

    邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    邊緣AI的實(shí)現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠本地進(jìn)行數(shù)
    的頭像 發(fā)表于 06-19 12:19 ?853次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    STM32F769是否可以部署邊緣AI?

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    電子發(fā)燒友網(wǎng)綜合報(bào)道 邊緣AI的實(shí)現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠
    發(fā)表于 05-26 07:09 ?1202次閱讀

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    的引入徹底改變了這一局面。通過(guò)邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實(shí)時(shí)數(shù)據(jù)分析、智能決策和自主控制能力。工業(yè)質(zhì)檢場(chǎng)景中,搭載
    發(fā)表于 02-15 11:41

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于昇騰Atlas平臺(tái)邊緣AI Box MIC-ATL3S正式發(fā)布與Deepseek R1模型
    的頭像 發(fā)表于 02-14 16:08 ?2472次閱讀
    研華<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b> Box MIC-ATL3S<b class='flag-5'>部署</b>Deepseek R1<b class='flag-5'>模型</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    以及邊緣計(jì)算能力的增強(qiáng),越來(lái)越多的目標(biāo)檢測(cè)應(yīng)用開(kāi)始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時(shí)也減輕了云端服務(wù)器的壓力。然而,
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設(shè)備的奇妙之旅:如何在邊緣部署OpenCV

    的算法和模型來(lái)解析圖像的意義。 實(shí)際應(yīng)用中,這兩者往往是緊密結(jié)合的,共同作用于解決復(fù)雜的問(wèn)題。例如,一個(gè)自動(dòng)駕駛系統(tǒng)中,圖像處理可能會(huì)用于清理傳感器輸入的數(shù)據(jù),而計(jì)算機(jī)視覺(jué)則負(fù)責(zé)識(shí)別道路上的行人
    發(fā)表于 12-14 09:31

    AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別

    系統(tǒng)的智能化水平,還極大地拓展了其應(yīng)用范圍, 使得嵌入式系統(tǒng)智能家居、智能交通、智能醫(yī)療等領(lǐng)域有了更深層次的運(yùn)用。AI技術(shù)的嵌入,已經(jīng)成為未來(lái)嵌入式系統(tǒng)發(fā)展 的一個(gè)重要趨勢(shì)。踏入邊緣
    發(fā)表于 12-06 17:20

    研華科技打造整體邊緣AI服務(wù)器解決方案

    近年來(lái),AIoT數(shù)據(jù)量快速成長(zhǎng)、硬件效能提升、綠色低碳意識(shí)抬頭等趨勢(shì)影響下,邊緣AI應(yīng)用的系統(tǒng)架構(gòu)也出現(xiàn)改變。隨著越來(lái)越多企業(yè)將AI
    的頭像 發(fā)表于 11-18 15:35 ?862次閱讀