Moe | DataAgent

Ai, Generative ai, LLM, NLP

DeepSeek-V2：性能逼近 GPT-4-Turbo 的超強 MoE 模型開源！

2024-05-07 / 0 評論

引言：開啟AI新紀元的DeepSeek-V2 近年來，隨著人工智能技術的飛速發展，大型語言模型（Large Language Models，LLMs）已成為推動這一領域創新的主要力量。尤其值得關注的是混合專家（Mixtu...

閱讀全文

 Yang Abao
Ai, Generative ai, LLM

Qwen 1.5 MoE：突破大模型的性能瓶頸

2024-04-07 / 0 評論

引言在 AI 界的一場沉寂之後，阿里巴巴集團最近發布了一款備受矚目的人工智能語言模型——Qwen 1.5 MoE。這款模型以其 2.7 億的啟動參數，在多項基準測試中展現出了與 7B 級別大模型相匹敵的性能，為業界帶來...

閱讀全文

 Yang Abao