引言:OpenAI 推出全新旗艦模型 GPT-4o 隨著人工智慧技術的飛速發展,我們正步入一個全新的互動時代。最近,Op …
NLP
全參數微調、PEFT、提示工程和RAG:哪種 LLM 導入策略最適合我?
隨著 AI 技術的不斷進步,企業正越來越多地尋求將大型語言模型(LLM)整合到其業務流程中。這些強大的工具提供了無限的可 …
DeepSeek-V2:性能逼近 GPT-4-Turbo 的超強 MoE 模型開源!
引言:開啟AI新紀元的DeepSeek-V2 近年來,隨著人工智能技術的飛速發展,大型語言模型(Large Langua …
從 RAG 到 GraphRAG:透過圖譜節點關係增強回應精確度
在 ChatGPT 等大型語言模型主導的當代,RAG(Retrieval Augmented Generation)技術 …
【論文筆記】DCFEE:基於自動標記訓練數據的文檔級中文金融事件抽取系統
抽取金融事件能幫助用戶獲得競爭對手的戰略,預測股票市場做出正確的投資決策。舉例來說,股權凍結事件將對公司產生不利影響,股票持有者應迅速判斷避險
使用 OpenAI Finetune API 微調出自己的模型(附程式碼)
今天這篇要教大家如何使用 OpenAI Finetune API 微調出自己的模型。 想必大家都學會使用網頁版 Chat …
[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練
Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + DistributedSampler 兩種進行模型分散式訓練的方式。
經典 NLP 任務標籤生成:串接非官方 ChatGPT API
這篇文章紀錄我串接非官方 ChatGPT API 「試圖」取得 NLP 資訊抽取任務標籤的過程。結論是…
NLP 界的核武:ChatGPT 實測心得和未來應用分析
大家最想知道,核武級的 ChatGPT 出現後該如何應對?
未來的運作方式可能會變成像是 人類先有一個 idea ,先請 AI 做初步的資料蒐集、整理,再由人類做判斷、再使用 類似 Prompt Engineering 的方式進行微調,用這樣的方式和 AI 協作。
【自然語言處理】基於語義角色標註的事件三元組抽取實作
本文介紹自然語言處理中的經典任務之一:語義角色標註,並分享開源專案「事件三元組抽取」如何利用語義角色標注的結果,以及復現心得、改良想法