Pytorch | DataAgent

[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練

JiunYi Yang
NLP , Python , PyTorch , 資料科學
7 1 月, 2023
1163 views

[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練

Finetune 語言模型所需要的 GPU memory 比較多，往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + DistributedSampler 兩種進行模型分散式訓練的方式。

Continue reading

【自然語言處理】Longformer 中文長文本 RoBERTa 模型 – 新聞分類實作

JiunYi Yang
NLP
3 5 月, 2022
1307 views

【自然語言處理】Longformer 中文長文本 RoBERTa 模型 – 新聞分類實作

使用 pre-trained model BERT 進行各種…

Continue reading