進階微調 Mistral-7B 模型的方法:直接偏好優化
預訓練的大型語言模型(LLM)只能進行下一個詞預測,使得它們無法回答問題。這就是為什麼這些基礎模型之後需要通過指令和答案的配對進行精調,以充當有用的助手。然而,這個過程仍可能存在缺陷:精調後的 LLM 可能會有偏見、有毒害、有害等。這就是人類反饋中的強化學習(RLHF)發揮作用的地方。
Connect to an Amazon EC2 instance without an original SSH key pair
If you need to connect to an A…
[Python] Selenium Little Known Tips 你可能不知道的 Selenium 技巧
There are some Selenium functions or techniques that I haven’t used before and I don’t know how to write them like this, or they are less intuitive; because they are all fragmented, I will organize them into this article. 有些 Selenium 功能或技巧,沒用過不知道應該要這樣寫,或是比較不直覺的做法;因為都比較零碎,我將它整理到這篇。
【論文筆記】DCFEE:基於自動標記訓練數據的文檔級中文金融事件抽取系統
抽取金融事件能幫助用戶獲得競爭對手的戰略,預測股票市場做出正確的投資決策。舉例來說,股權凍結事件將對公司產生不利影響,股票持有者應迅速判斷避險
經典 NLP 任務標籤生成:串接非官方 ChatGPT API
這篇文章紀錄我串接非官方 ChatGPT API 「試圖」取得 NLP 資訊抽取任務標籤的過程。結論是…