DeepSeek声称其“推理”模型在某些基准上超越了OpenAI的o1模型

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1，声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数，支持自我验证，适用于物理、科学和数学领域。DeepSeek还发布了参数从1.5亿到700亿不等的精简版本，适应不同硬件需求。R1通过Hugging Face平台提供，价格比OpenAI低90%-95%，已衍生500多个模型，下载量达250万次。尽管R1在性能上表现出色，但其内容受到中国互联网监管限制，回避敏感话题。这一进展凸显了中国AI实验室在推理模型领域的快速追赶能力，并推动了开源AI的普及。

来源：TechCrunch AI