Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + DistributedSampler 兩種進行模型分散式訓練的方式。
GPU
【技術分享】tensorflow-gpu 安裝紀錄 (Windows Server 2016)
系統環境確認 Windows Server 2016 GeForce GTX 1070 Ti Python 3.7 Vi …