Google Gemma優(yōu)化后可在NVIDIA GPU上運行

借助 TensorRT-LLM，Google 全新開放語言模型可在 NVIDIA AI 平臺（包括本地 RTX AI PC）上加速運行。

2024 年 2 月 21 日，NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發(fā)布面向 Gemma 的優(yōu)化功能，Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型，可在任何地方運行，從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。

NVIDIA 和 Google 的團隊緊密合作，利用 NVIDIA TensorRT-LLM（用于優(yōu)化大語言模型推理性能的開源庫），在數(shù)據(jù)中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時，加速 Gemma 性能（Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建）。

這使開發(fā)者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發(fā)。

開發(fā)者還可在搭載 NVIDIA GPU 的云端運行 Gemma，該實例擁有 141GB HBM3e 顯存，速度為 4.8TB/秒，Google 將于今年部署該實例。

此外，企業(yè)級開發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)（包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM），對 Gemma 進行微調(diào)，并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5444

瀏覽量
108612
云計算

云計算

+關(guān)注

關(guān)注
39

文章
7994

瀏覽量
142426
gpu

gpu

+關(guān)注

關(guān)注
28

文章
5053

瀏覽量
134036

原文標(biāo)題：共耀光芒：Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運行

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達(dá)
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New NVIDIA Isaac Lab推動機器人技術(shù)突破
New NVIDIA黃仁勛向SpaceX馬斯克交付DGX Spark

精選推薦
更多

文章

資料

帖子

如何解決Shunt電阻引發(fā)的伺服電流采樣誤差

米芯微電子
1小時前

142 閱讀

納芯微柵極驅(qū)動器NSD2017在激光雷達(dá)應(yīng)用中PCB設(shè)計的注意點

米芯微電子
1小時前

166 閱讀

基于環(huán)形隊列的UART收發(fā)回顯實驗

瑞薩嵌入式小百科
1小時前

155 閱讀

瑞薩電子基于RA6T2的高頻注入法方案詳解

瑞薩嵌入式小百科
4小時前

359 閱讀

UART指令控制RGB燈實驗

瑞薩嵌入式小百科
4小時前

400 閱讀

LTC2393/LTC2392/LTC2391參考設(shè)計 (D

王銀喜
3322

5積分

28下載

混合動力的辨析與存在的問題

liuxin
347 KB

免費

26下載

電氣基礎(chǔ)培訓(xùn)資料

黃勝焱
415 KB

免費

0下載

基于開源Swipecards進行鴻蒙化移植的自定義卡片教程

姚小熊27
0.85 MB

免費

5下載

rawip4j Java鏈路層封包協(xié)議

聽風(fēng)說夢
19.55 MB

免費

0下載

【CPKCOR-RA8D1】5、運行RT-THREAD的適應(yīng)性調(diào)整

jf_01200635
15小時前

42 閱讀

STM32-Balance-Car-master.zip

jf_76693375
15小時前

47 閱讀

《電子發(fā)燒友電子設(shè)計周報》聚焦硬科技領(lǐng)域核心價值第32期：2025.10.20--2025.10.24

電子人steve
3天前

153 閱讀

【打卡有獎第二彈】50M功放資料+案例合集下載！還有精美禮品哦~

從前有座_山
15小時前

84 閱讀

使用rk3568開發(fā)板，核0\\1\\3運行l(wèi)inux，核2運行hal，在核0中怎么關(guān)閉核2

我是逗比1
15小時前

239 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

搜索歷史

Google Gemma優(yōu)化后可在NVIDIA GPU上運行

評論