研究人员创建了一个开放的、不到50美元的OpenAI的o1‘推理’模型的竞争者

斯坦福大学和华盛顿大学的研究团队以不到50美元的云算力成本,成功训练出推理模型s1,性能媲美OpenAI的o1和DeepSeek的R1。s1通过蒸馏技术从Google的Gemini 2.0 Flash Thinking Experimental中提取推理能力,采用监督微调(SFT)方法,显著降低了训练成本。研究表明,仅需1000个精选问题和答案即可实现高效推理优化,并通过“等待”策略提升模型准确性。这一突破引发了对AI模型商品化的讨论,尽管蒸馏技术能低成本复现现有模型,但大规模投资仍是推动AI创新的关键。

来源:TechCrunch AI

Back to top button