开源模型DeepSeek R1震撼发布,性能远超OpenAI!

开源语言模型DeepSeek R1震撼发布,价格仅为OpenAI的1/50,性能却大幅提升。R1-Zero模型在训练中涌现“顿悟时刻”,推理能力显著增强。DeepSeek团队通过纯强化学习提升模型推理能力,其蒸馏版Qwen-1.5B在部分任务上超过GPT-4。此外,DeepSeek开源6个蒸馏小模型,并更新为MIT许可证,商用免费。未来将继续优化通用能力及解决语言混杂等问题。
Back to top button