0101
多模态AI模型突破生成模型
刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了
DeepSeek 联合北京大学发布新论文,提出条件记忆(conditional memory)以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块,实现了 O(1) 时间复杂度的知识检索,显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系,为下一代稀疏大模型提供关键建模原语。
🔗 [DeepSeek 开源武器库]:https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf


