JiunYi Yang
- NLP , Python , PyTorch , 資料科學
- 7 1 月, 2023
- 323 views
[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練
Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + DistributedSampler 兩種進行模型分散式訓練的方式。
JiunYi Yang
- NLP
- 3 5 月, 2022
- 384 views
【自然語言處理】Longformer 中文長文本 RoBERTa 模型 – 新聞分類實作
使用 pre-trained model BERT 進行各種…
You Missed
Zendesk Resolution Platform: 以 AI 驅動的全新客服解決方案
martech_jy
- 31 3 月, 2025
- 9 views
GPT-4o 原生圖像生成功能:OpenAI 突破性技術與安全框架深度解析
martech_jy
- 29 3 月, 2025
- 49 views