DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布

网站小编 1

消息称 DeepSeek 将在今年 2 月中旬农历新年期间推出具备更强写代码能力的新一代旗舰 AI 模型 DeepSeek V4。1 月 20 日,正值 DeepSeek-R1 发布一周年,开发者发现 DeepSeek 在 GitHub 更新的 FlashMLA 代码中多次提及未知的「MODEL1」大模型标识符,其很可能代表新模型,与现有「V32」模型在关键技术上存在区别,新架构或在内存优化和计算效率上有针对性设计。此前,DeepSeek 研究团队还发布两篇技术论文,技术社区推测新模型可能整合这些成果。

标签: 架构 模型 最快

抱歉,评论功能暂时关闭!