已选标签:
开源AI
2月 8日
1 条新闻
23:00

为什么开源的“精神”远不止于许可证

开源与AI技术的结合成为焦点,Meta等公司推动开源AI模型发展,但透明度与治理问题引发争议。DeepSeek等开源AI模型虽采用MIT许可,但训练数据等关键信息仍不透明。Hugging Face等机构致力于创建更开放的开源AI模型,强调社区参与和长期可持续性。开源AI在技术创新和商业落地中面临数据安全、模型透明度和治理结构的挑战,未来需平衡开放性与商业利益。

来源:TechCrunch AI

2月 5日
1 条新闻
04:32

Hugging Face研究人员致力于构建OpenAI深度研究工具的“开放”版本

Hugging Face 团队开发了 Open Deep Research,一个开源版本的 OpenAI 深度研究工具,利用 OpenAI 的 o1 模型和自主代理框架实现网络爬取、文件分析和数据计算。尽管在 GAIA 基准测试中得分 54%,低于 OpenAI 深度研究的 67.36%,但其开源特性为 AI 研究社区提供了透明性和可扩展性。该工具展示了 AI 在信息检索和复杂问题解答方面的潜力,但缺乏 OpenAI 的 o3 模型性能。未来,开源模型与专有模型的竞争将持续推动 AI 技术进步。

来源:TechCrunch AI

2月 1日
1 条新闻
07:03

Mistral董事会成员兼a16z风险投资家Anjney Midha表示,DeepSeek不会停止AI对GPU的需求

DeepSeek 的开源推理模型 R1 以低成本提供行业标准性能,显著提升了计算效率,使相同算力下产出增加 10 倍。尽管 AI 基础模型仍需要大量 GPU 和数据中心投资,但开源模式(如 Mistral)通过社区贡献降低了成本,增强了竞争力。同时,AI 推理需求激增,GPU 资源供不应求,推动了基础设施独立性的讨论,强调西方模型在数据安全和伦理方面的优势。

来源:TechCrunch AI

1月 30日
1 条新闻
22:00

Ai2称其新AI模型胜过DeepSeek的顶尖模型之一

美国非营利AI研究机构Ai2发布开源大模型Tulu3-405B,宣称在多项基准测试中超越DeepSeek V3和GPT-4o。该模型拥有4050亿参数,采用强化学习与可验证奖励(RLVR)技术,在数学问题解决和指令遵循任务中表现优异。Tulu3-405B的开源特性为全球AI开发者提供了强大的替代方案,标志着美国在开源AI领域的领先地位。模型代码已在GitHub和Hugging Face平台公开,展示了AI技术竞争中的开放创新趋势。

来源:TechCrunch AI

1月 29日
2 条新闻
03:43

埃里克·施密特表示,DeepSeek 标志着全球人工智能竞赛的“转折点”

前谷歌CEO Eric Schmidt在《华盛顿邮报》专栏中呼吁美国加大开源AI投入,以应对中国DeepSeek的崛起。Schmidt指出,DeepSeek的快速发展标志着全球AI竞赛的转折点,表明中国能以更少资源与科技巨头竞争。他建议美国开发更多开源模型,投资AI基础设施如Stargate,并推动领先实验室共享训练方法。Schmidt的投资涉及AI军事应用和合规领域,其公司White Stork可能为美军提供AI无人机。此举凸显了开源AI在技术创新和全球竞争中的战略重要性。

来源:TechCrunch AI

03:29

Hugging Face研究人员正尝试构建DeepSeek AI“推理”模型的更开放版本

Hugging Face 启动 Open-R1 项目,旨在复刻 DeepSeek 的 R1 推理模型并开源其全部组件,包括训练数据和架构细节。R1 在多项基准测试中表现优异,尤其在物理、科学和数学领域展现出高可靠性。Hugging Face 强调,开源 R1 不仅有助于透明度,还能推动 AI 研究的进一步发展。项目依赖 768 块 Nvidia H100 GPU 的 Science Cluster,并计划通过社区协作构建训练管道。此举有望推动开源推理模型的创新,为下一代 AI 模型开发奠定基础。

来源:TechCrunch AI

1月 28日
1 条新闻
06:27

DeepSeek声称其“推理”模型在某些基准上超越了OpenAI的o1模型

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我验证,适用于物理、科学和数学领域。DeepSeek还发布了参数从1.5亿到700亿不等的精简版本,适应不同硬件需求。R1通过Hugging Face平台提供,价格比OpenAI低90%-95%,已衍生500多个模型,下载量达250万次。尽管R1在性能上表现出色,但其内容受到中国互联网监管限制,回避敏感话题。这一进展凸显了中国AI实验室在推理模型领域的快速追赶能力,并推动了开源AI的普及。

来源:TechCrunch AI

1月 25日
1 条新闻
03:25

放弃Meta? Kickstarter上为Instagram、TikTok和WhatsApp的开源替代品筹集资金

开源社交应用 Pixelfed、Loops 和 Sup 的开发者 Daniel Supernault 通过 Kickstarter 筹集资金,以推动其去中心化社交平台的进一步发展。这些应用基于 ActivityPub 协议,旨在挑战 Meta 等中心化社交媒体的垄断地位。Supernault 计划通过资金支持扩展存储、CDN 和计算资源,以应对用户增长,并加速开发进程。此举反映了去中心化 AI 技术在社交网络中的应用趋势,强调数据安全和用户控制,同时展示了开源生态在 AI 驱动社交平台中的潜力。

来源:TechCrunch AI

1月 21日
1 条新闻
12:00

开源模型DeepSeek R1震撼发布,性能远超OpenAI!

开源语言模型DeepSeek R1震撼发布,价格仅为OpenAI的1/50,性能却大幅提升。R1-Zero模型在训练中涌现“顿悟时刻”,推理能力显著增强。DeepSeek团队通过纯强化学习提升模型推理能力,其蒸馏版Qwen-1.5B在部分任务上超过GPT-4。此外,DeepSeek开源6个蒸馏小模型,并更新为MIT许可证,商用免费。未来将继续优化通用能力及解决语言混杂等问题。
Back to top button