18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

vLLM Meetup上海站成功舉辦

沐曦MetaX ? 來源:vLLM ? 2025-08-27 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:vLLM

2025年8月23日,vLLM Meetup上海站成功舉辦。活動匯聚技術專家、社區(qū)開發(fā)者及行業(yè)用戶,圍繞vLLM(一種用于大型語言模型的高性能推理引擎)的技術進展、生態(tài)建設及應用展開深度探討。會議涵蓋社區(qū)貢獻指南、分布式推理架構、多模態(tài)模型集成等前沿議題,現(xiàn)場互動熱烈,并提出每年舉辦vLLM Con大會的倡議,為AI推理領域的技術落地注入新動能。

本次Meetup由沐曦與紅帽公司聯(lián)合主辦,紅帽作為全球開源社區(qū)vLLM的重要貢獻者,長期參與上游協(xié)作并分享實踐經(jīng)驗,推動社區(qū)發(fā)展;沐曦則結(jié)合國產(chǎn)硬件優(yōu)勢,積極探索vLLM在本土計算平臺上的適配與應用。沐曦開源生態(tài)總監(jiān)章津楠與紅帽亞太CTO辦公室首席架構師張家駒共同開場,對到場嘉賓及觀眾表示歡迎?;顒釉O置五大核心議題,并穿插開發(fā)者提問環(huán)節(jié),最終以沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構師楊建博士的開源生態(tài)趨勢分享及書籍簽贈環(huán)節(jié)收尾,現(xiàn)場氣氛活躍。

活動核心環(huán)節(jié)圍繞五大技術方向展開,專家團隊通過案例解析與方案演示,系統(tǒng)呈現(xiàn)vLLM在社區(qū)生態(tài)、分布式架構、多模態(tài)集成等領域的創(chuàng)新實踐。

在題為《vLLM: Building, Testing and Contributing》演講中, vLLM社區(qū)貢獻者、Red Hat資深專家Daniele Trifirò深入剖析了vLLM社區(qū)的發(fā)展現(xiàn)狀,為愛好者及開發(fā)者提供了系統(tǒng)性指南。他詳細闡述了項目構建流程、關鍵測試規(guī)范,并指導開發(fā)者如何高效貢獻代碼。通過豐富的代碼實例、實踐案例及參考鏈接,演講極大降低了初學者入門門檻,獲得現(xiàn)場開發(fā)者高度認可。

在《Disaggregated P/D for Wide EP》主題分享中,vLLM社區(qū)貢獻者、Red Hat技術專家Nicolò Lucchesi重點介紹了利用llm-d實現(xiàn)vLLM分布式推理的方案,核心目標是通過預填充/解碼(P/D)解耦與寬專家并行(EP)擴展大模型推理能力,尤其針對長上下文和混合專家(MoE)模型場景,關鍵技術方案包括P/D解耦部署、通過NIXL實現(xiàn)高效KV Cache傳輸、支持預填充(P)與解碼(D)階段采用不同TP并行度、將MoE模型中的專家分布至不同GPU等實現(xiàn)細節(jié)。

百度高級產(chǎn)品經(jīng)理王凱在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演講中,系統(tǒng)解析了百度ERNIE 4.5多模態(tài)模型與vLLM的集成實踐。內(nèi)容涵蓋ERNIE 4.5 的特性、與 vLLM 集成的原因以及 vLLM 為 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同時還介紹了正在進行的開發(fā)工作,例如專家并行性負載均衡和視覺-語言支持。

Mooncake核心開發(fā)者蘇金陽在《Mooncake x LMCache 性能優(yōu)化分享》的主題分享中重點介紹了 Mooncake(特別是其傳輸引擎和存儲)與 LMCache 的集成,以在 vLLM 中實現(xiàn)高性能 KV Cache 重用。LMCache 被認為是用于 KV Cache 管理(卸載、重用、P/D 分離、RAG 緩存)的流行 vLLM 社區(qū)擴展。此次集成旨在提高數(shù)據(jù)分發(fā)效率和整體系統(tǒng)性能。

沐曦vLLM推理引擎專家張廉潔在《vLLM-metax: Bridging CUDA to MetaX MACA》演講中,詳細介紹了vLLM-metax 如何通過 cu-bridge 在 MACA 上實現(xiàn)接近零成本的 CUDA 執(zhí)行,允許在不修改源代碼的情況下進行原生編譯。同時還解釋了在 vLLM 中使用插件架構支持 MetaX 的方式,概述了修補方法(patch補丁和文件替換)和限制。演講還公布了2025年路線圖。

提問環(huán)節(jié)中,開發(fā)者圍繞社區(qū)貢獻規(guī)范、分布式推理落地、國產(chǎn)硬件支持等議題提出建議,嘉賓以技術細節(jié)回應,討論貫穿全場。

本次活動彩蛋,沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構師楊建博士驚喜亮相現(xiàn)場,他不僅生動分享了沐曦在開源生態(tài)和vLLM推理技術的最新趨勢,還熱情地為獲得《沐曦異構并行計算軟件?!窌男疫\觀眾親筆簽名留念。

本次Meetup不僅展示了vLLM在分布式推理、多模態(tài)集成及硬件適配領域的最新成果,更通過技術交流與生態(tài)合作,為AI推理引擎的規(guī)?;瘧锰峁┝藢嵺`范本。行業(yè)專家與開發(fā)者的深度互動,進一步強化了vLLM在開源社區(qū)的技術影響力,為下一代AI基礎設施的研發(fā)奠定基礎。

關于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    462

    文章

    53258

    瀏覽量

    455507
  • 開源
    +關注

    關注

    3

    文章

    3893

    瀏覽量

    45364
  • 模型
    +關注

    關注

    1

    文章

    3618

    瀏覽量

    51551

原文標題:vLLM Meetup上海站圓滿落幕

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    2025開放原子校源行上海成功舉辦

    10月15日,開放原子校源行(上海)在復旦大學成功舉辦。本次活動作為復旦大學計算機建系50周年系列活動之一,邀請院士專家、高校領導、知名開源社區(qū)代表、頭部科技企業(yè)代表以及來自復旦大學
    的頭像 發(fā)表于 10-17 11:01 ?275次閱讀

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示北京成功舉辦

    近日,2025 NVIDIA 創(chuàng)業(yè)企業(yè)展示——北京(AI 智能體與物理 AI 出海專場)在北京量子銀座集智會議中心舉辦。
    的頭像 發(fā)表于 09-16 10:43 ?717次閱讀

    匯川技術匯英行動人才雙選日蘇州成功舉辦

    金秋九月,匯聚英才。 匯英行動人才雙選日·蘇州于9月6日在匯川技術蘇州總部大廈成功舉辦
    的頭像 發(fā)表于 09-11 17:12 ?883次閱讀

    2025紫光同創(chuàng)FPGA技術研討會成都成功舉辦

    近日,“2025紫光同創(chuàng)FPGA技術研討會”成都成功舉辦,來自通信、工業(yè)、圖像視頻、消費、汽車等領域近200名專業(yè)觀眾參會交流,現(xiàn)場座無虛席,氣氛熱烈。自此,本年度紫光同創(chuàng)線下研討會系列活動圓滿收官!
    的頭像 發(fā)表于 09-08 17:26 ?824次閱讀

    格羅方德2025年度技術峰會北美成功舉辦

    格羅方德2025年度技術峰會(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美國加利福尼亞州圣克拉拉市成功舉辦。
    的頭像 發(fā)表于 09-03 17:29 ?668次閱讀

    開放原子園區(qū)行重慶成功舉辦

    8月29日,開放原子“園區(qū)行”(重慶)在渝州賓館成功舉辦,活動以“共建智能汽車操作系統(tǒng)開源生態(tài)”為主題,匯聚政府機構、高校及科研院所、OEM廠商、汽車軟件開發(fā)企業(yè)、芯片企業(yè)、開源社區(qū)的近100位代表,共探開源模式如何破解智能汽
    的頭像 發(fā)表于 09-01 18:10 ?768次閱讀

    2025開放原子園區(qū)行上海成功舉辦

    近日,以“開源賦能智能,協(xié)同創(chuàng)新共筑AI未來”為主題的開放原子“園區(qū)行”(上海)在上海市徐匯區(qū)成功舉辦。本次活動由開放原子開源基金會與
    的頭像 發(fā)表于 07-07 18:12 ?736次閱讀

    2025開放原子校源行廣東海洋大學活動成功舉辦

    近日,由開放原子開源基金會主辦,廣東海洋大學和北京中軟國際教育科技股份有限公司承辦的“開放原子校源行”(廣東海洋大學)活動成功舉辦
    的頭像 發(fā)表于 06-30 10:02 ?506次閱讀

    2025開放原子校源行太原成功舉辦

    近日,開放原子“校源行”(太原)在中北大學成功舉辦。工業(yè)和信息化部信息技術發(fā)展司、山西省工信廳、山西省教育廳,以及地方工信部門、高校、頭部科技企業(yè)代表等600余人共話開源生態(tài),推進開源教育。
    的頭像 發(fā)表于 06-28 17:44 ?932次閱讀

    Wolfspeed助力捷豹TCS車隊FE上海成功衛(wèi)冕

    !從第一回合遭遇低谷,到第二回合成功衛(wèi)冕,捷豹 TCS 車隊逆風翻盤!“KIWI”組合上海兩年兩冠,續(xù)寫傳奇!
    的頭像 發(fā)表于 06-06 09:12 ?594次閱讀

    2025年開放原子校源行清華大學成功舉辦

    近日,由開放原子開源基金會、清華大學計算機科學與技術系、清華大學軟件學院主辦的開放原子“校源行”(清華)在清華大學成功舉辦。
    的頭像 發(fā)表于 04-22 16:46 ?647次閱讀

    開放原子園區(qū)行太原成功舉辦

    近日,由開放原子開源基金會、山西省工業(yè)和信息化廳、山西轉(zhuǎn)型綜合改革示范區(qū)管委會聯(lián)合主辦的開放原子“園區(qū)行”(太原)活動在太原市同昌創(chuàng)業(yè)園成功舉辦。
    的頭像 發(fā)表于 04-02 16:54 ?680次閱讀

    2025芯來RISC-V技術研討會蘇州成功舉辦

    近日,2025芯來RISC-V技術研討會@蘇州活動成功舉辦。此次蘇州研討由芯來科技與勞特巴赫中國聯(lián)合主辦,同時也感謝上海開放處理器產(chǎn)業(yè)創(chuàng)
    的頭像 發(fā)表于 03-26 11:50 ?938次閱讀

    索尼新品品鑒會上海成功舉辦

    近日,索尼攜手《家庭影院技術》雜志成功舉辦了“把影院帶回家,索尼家用投影P9(VPL-XW8100)新品品鑒會”全國巡展的上海。來自華東地區(qū)眾多行業(yè)人士和影音愛好者,共同見證了索尼“
    的頭像 發(fā)表于 12-19 15:20 ?813次閱讀

    vLLM項目加入PyTorch生態(tài)系統(tǒng),引領LLM推理新紀元

    近日,vLLM項目宣布正式成為PyTorch生態(tài)系統(tǒng)的一部分,標志著該項目與PyTorch的合作進入了一個全新的階段。本文將從以下幾個方面進行介紹,特別提醒:安裝方案在第四個部分,可選擇性閱讀
    的頭像 發(fā)表于 12-18 17:06 ?1328次閱讀
    <b class='flag-5'>vLLM</b>項目加入PyTorch生態(tài)系統(tǒng),引領LLM推理新紀元