資料介紹
軟件簡介
PatrickStar 是一款騰訊開發(fā)的分布式深度學習訓練工具,它的設計目標是支持以 GPT、Bert 為代表的超大預訓練模型訓練。
用法
PatrickStar 基于 PyTorch,這使得遷移 pytorch 項目變得容易。以下是 PatrickStar 的示例:
from patrickstar.runtime import initialize_engine config = { "optimizer": { "type": "Adam", "params": { "lr": 0.001, "betas": (0.9, 0.999), "eps": 1e-6, "weight_decay": 0, "use_hybrid_adam": True, }, }, "fp16": { # loss scaler params "enabled": True, "loss_scale": 0, "initial_scale_power": 2 ** 3, "loss_scale_window": 1000, "hysteresis": 2, "min_loss_scale": 1, }, "default_chunk_size": 64 * 1024 * 1024, "release_after_init": True, "use_cpu_embedding": False, } def model_func(): # MyModel is a derived class for torch.nn.Module return MyModel(...) model, optimizer = initialize_engine(model_func=model_func, local_rank=0, config=config) ... for data in dataloader: optimizer.zero_grad() loss = model(data) model.backward(loss) optimizer.step()
使用與?DeepSpeed 配置 JSON?相同的config格式,主要包括優(yōu)化器、損失縮放器和一些 PatrickStar 特定配置的參數(shù)。
引用我們
@article{fang2021patrickstar,
title={PatrickStar: Parallel Training of Pre-trained Models via a Chunk-based Memory Management},
author={Fang, Jiarui and Yu, Yang and Zhu, Zilin and Li, Shenggui and You, Yang and Zhou, Jie},
journal={arXiv preprint arXiv:2108.05818},
year={2021}
}
- 深度學習在嵌入式設備上的應用
- 分布式電源對配電系統(tǒng)的影響分析
- 基于Simulink的電子對抗分布式仿真系統(tǒng) 26次下載
- 輕量級分布式機器學習系統(tǒng)及算法 16次下載
- 面向聯(lián)邦學習的分布式與隱私安全性綜述 3次下載
- 基于預訓練模型和長短期記憶網(wǎng)絡的深度學習模型 19次下載
- 一種優(yōu)化的分布式二維卷積算法 1次下載
- 基于分布式數(shù)據(jù)Cache的實時動態(tài)遷移機制 20次下載
- 一種分布式網(wǎng)絡掃描架構(gòu)和任務調(diào)度算法 19次下載
- 深度學習是什么?了解深度學習難嗎?讓你快速了解深度學習的視頻講解 16次下載
- 基于虛擬化的多GPU深度神經(jīng)網(wǎng)絡訓練框架 0次下載
- 小波域分布式深度圖視頻編碼 1次下載
- 引入深度遍歷機制的分布式數(shù)據(jù)結(jié)構(gòu)插值算法 0次下載
- GL Studio的分布式虛擬訓練系統(tǒng)關(guān)鍵技術(shù) 27次下載
- 分布式對象調(diào)試中的事件模型
- Pytorch深度學習訓練的方法 238次閱讀
- 深度學習模型訓練過程詳解 1412次閱讀
- Java手寫分布式鎖的實現(xiàn) 612次閱讀
- tldb提供分布式鎖使用方法 923次閱讀
- 基于PyTorch的模型并行分布式訓練Megatron解析 3196次閱讀
- 視覺深度學習遷移學習訓練框架Torchvision介紹 934次閱讀
- 如何使用分布式存儲系統(tǒng)促進AI模型訓練 608次閱讀
- 基于多智能體深度強化學習的體系任務分配方法 4065次閱讀
- 鴻蒙分布式相機“踩坑”分享 1911次閱讀
- 分布式鎖的設計與實現(xiàn) 1801次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應用 8837次閱讀
- NVIDIA遷移學習工具包 :用于特定領(lǐng)域深度學習模型快速訓練的高級SDK 3172次閱讀
- 淺談分布式塊存儲的元數(shù)據(jù)服務設計 4951次閱讀
- 如何借助分布式GPU環(huán)境來提升神經(jīng)網(wǎng)絡訓練系統(tǒng)的浮點計算能力 5184次閱讀
- 深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng) 1861次閱讀
下載排行
本周
- 1PFC電路與BOOST電路設計實例分享
- 1.83 MB | 12次下載 | 4 積分
- 2世平基于靈動微 SPIN560C 的低壓無刷電機應用方案
- 10.93 MB | 11次下載 | 免費
- 3電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 11次下載 | 免費
- 4PWM控制器的控制方法
- 0.39 MB | 3次下載 | 4 積分
- 5電流檢測芯片F(xiàn)P135應用說明
- 1.24 MB | 3次下載 | 免費
- 6全面解讀被動式與主動式PFC電路
- 1.27 MB | 1次下載 | 4 積分
- 7HC88L051F4低功耗芯片規(guī)格書
- 4.76 MB | 1次下載 | 免費
- 8CIU32D655x5數(shù)據(jù)手冊
- 2.14 MB | 1次下載 | 免費
本月
- 1常用電子元器件使用手冊
- 2.40 MB | 52次下載 | 免費
- 2高功率密度碳化硅MOSFET軟開關(guān)三相逆變器損耗分析
- 2.27 MB | 33次下載 | 10 積分
- 3PFC電路與BOOST電路設計實例分享
- 1.83 MB | 12次下載 | 4 積分
- 4世平基于靈動微 SPIN560C 的低壓無刷電機應用方案
- 10.93 MB | 11次下載 | 免費
- 5電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 11次下載 | 免費
- 6USB拓展塢PCB圖資料
- 0.57 MB | 11次下載 | 免費
- 7MS1826 HDMI 多功能視頻處理器數(shù)據(jù)手冊
- 4.51 MB | 9次下載 | 免費
- 8HAL9303線性霍爾效應傳感器技術(shù)手冊
- 0.70 MB | 9次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191424次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81600次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論