-
DeepSeek-V2:性能逼近 GPT-4-Turbo 的超強 MoE 模型開源!
引言:開啟AI新紀元的DeepSeek-V2 近年來,隨著人工智能技術的飛速發展,大型語言模型(Large Language Models,LLMs)已成為推動這一領域創新的主要力量。尤其值得關注的是混合專家(Mixtu...
-
Qwen 1.5 MoE:突破大模型的性能瓶頸
引言 在 AI 界的一場沉寂之後,阿里巴巴集團最近發布了一款備受矚目的人工智能語言模型——Qwen 1.5 MoE。這款模型以其 2.7 億的啟動參數,在多項基準測試中展現出了與 7B 級別大模型相匹敵的性能,為業界帶來...