全參數微調、PEFT、提示工程和RAG:哪種 LLM 導入策略最適合我?

隨著 AI 技術的不斷進步,企業正越來越多地尋求將大型語言模…

從 Transformer 到 Kansformer? KAN 網絡以結構優化提高模型參數效率與可解釋性

近年來,深度學習技術在多個領域實現了突破性進展,從語言處理到…

使用 Docker 快速部署最新版 Neo4j 資料庫

在本教學中,我們將學習如何使用 Docker 快速部署 Ne…

【論文筆記】DCFEE:基於自動標記訓練數據的文檔級中文金融事件抽取系統

抽取金融事件能幫助用戶獲得競爭對手的戰略,預測股票市場做出正確的投資決策。舉例來說,股權凍結事件將對公司產生不利影響,股票持有者應迅速判斷避險

使用 OpenAI Finetune API 微調出自己的模型(附程式碼)

今天這篇要教大家如何使用 OpenAI Finetune A…

[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練

Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + DistributedSampler 兩種進行模型分散式訓練的方式。

經典 NLP 任務標籤生成:串接非官方 ChatGPT API

這篇文章紀錄我串接非官方 ChatGPT API 「試圖」取得 NLP 資訊抽取任務標籤的過程。結論是…

Git 協作不可不知的重要指令

以下整理 套件開發協作時常遇到與用到的 Git 指令: SS…

【資料探索性分析】#1 電商零售 – 天貓電商用戶行為

(一)主題 從天貓 TMall 用戶網站行為紀錄,透過視覺化…