DeepSeek声称其“推理”模型在某些基准上超越了OpenAI的o1模型

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我验证,适用于物理、科学和数学领域。DeepSeek还发布了参数从1.5亿到700亿不等的精简版本,适应不同硬件需求。R1通过Hugging Face平台提供,价格比OpenAI低90%-95%,已衍生500多个模型,下载量达250万次。尽管R1在性能上表现出色,但其内容受到中国互联网监管限制,回避敏感话题。这一进展凸显了中国AI实验室在推理模型领域的快速追赶能力,并推动了开源AI的普及。

来源:TechCrunch AI

Back to top button