12月 31日
4 条新闻
00:00

大模型的2024年:我们对AI的发展脱敏了

2024年AI领域发展迅速,大模型更实用但不再惊艳,端侧模型和混合专家技术(MoE)降低成本,多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行,AI Agent开发门槛降低。AI硬件百花齐放,AI眼镜异军突起。AI游戏从辅助工具成为游戏一部分。中国AI人才梯队规模质量仅次于美国,期待在AI浪潮中领先。
来源:新硅NewGeek

来源:AI工具集

00:00

黑芝麻智能发布华山A2000家族芯片平台,打造全场景通识智驾标杆

黑芝麻智能发布华山A2000家族芯片平台,针对下一代AI模型设计,提供高算力、高性能,支持全场景通识智驾。A2000家族包括A2000 Lite、A2000和A2000 Pro,满足不同自动驾驶需求。集成领先CPU、DSP、GPU等,算力是主流旗舰芯片的4倍,原生支持Transformer模型,推动智能驾驶技术发展。
来源:黑芝麻智能

来源:AI工具集

00:00

趣丸科技「天谱乐」开创AI音乐新纪元:全球首个多模态配乐大模型

趣丸科技推出的全球首个多模态配乐大模型“天谱乐”,支持文本、图片和视频生曲,能生成高度匹配的BGM和MV效果。该技术在中文人声唱词上达到专业级效果,减少了电音感,接近音乐发行级别。“天谱乐”已接入唱鸭App,累计创作近1000万首AI歌曲。
来源:AI工具集

来源:AI工具集

12月 30日
16 条新闻
00:00

非洲最新的金融科技独角兽公司通过脚踏实地取得胜利

非洲最新的金融科技独角兽公司通过脚踏实地取得胜利

非洲金融科技独角兽 TymeBank 和 Moniepoint 通过混合数字与实体触点的创新模式,成功扩展了在低银行渗透率市场的服务。TymeBank 利用超市合作和自助服务终端,结合人工大使,为零售和小企业客户提供便捷的银行服务;Moniepoint 则通过账户、支付和贷款工具支持小企业,并逐步扩展至零售银行。这种‘控制论’方法通过技术增强非正式渠道,而非完全数字化,适应了非洲现金主导、互联网连接不稳定的市场环境。AI 技术在优化客户获取、增强信任和提升服务效率方面发挥了关键作用,展示了金融科技在复杂市场中的创新潜力。

来源:TechCrunch AI

00:00

人工智能数据中心可能正在“扭曲”美国电力网

随着AI数据中心激增,美国电网面临严峻挑战。Bloomberg报告指出,超过一半电力失真严重的家庭位于数据中心20英里范围内,导致“不良谐波”问题,可能损坏家电、增加火灾风险,甚至引发停电。AI数据中心因能源需求波动性大,对电网压力尤为突出。Bloom Energy首席商务官Aman Joshi强调,现有电网设计无法同时应对多个数据中心的负载波动。这一现象凸显了AI技术快速发展背后的基础设施瓶颈,亟需在算力效率与能源管理之间寻求平衡。

来源:TechCrunch AI

00:00

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心,构建了一个多模态框架,将主流运动生成任务整合为一个通用模型。

用户只需输入描述,即可生成一段运动姿势视频。目前,该模型已完全开源,支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源:三花快讯

00:00

智谱开源 CogAgent-9B-20241220:提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型,类似于 Claude Computer use,在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外,CogAgent 能够处理中英文双语的屏幕截图和语言交互,极大地扩展了其应用范围。官方演示中,展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过,目前的操作速度还比较慢,且需要提前为 AI 打开相关窗口,在 AI 操作过程中人类无法介入。

来源:三花快讯

00:00

Aria-UI:领先的 GUI 多模态模型,AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型,类似于 Claude Computer use。它无需 HTML 或 AXTree 输入,采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示,确实速度挺快的,不过该技术是底层模型,没有封装成可交互的应用。

来源:三花快讯

00:00

英伟达的下一步:为类人机器人提供动力

Nvidia 宣布将于 2025 年上半年推出新一代紧凑型计算机 Jetson Thor,专为人形机器人设计。这一举措标志着 Nvidia 在机器人领域的深入布局,旨在为全球数十万机器人制造商提供底层技术支持。Nvidia 副总裁 Deepu Talla 指出,这一战略得益于生成式 AI 模型的爆发式增长,以及利用模拟环境训练机器人的能力。此举也反映了 Nvidia 在 AI 芯片市场竞争加剧的背景下,通过机器人技术拓展业务版图的战略意图。

来源:TechCrunch AI

00:00

揭秘:AI助手将实时出售你的“意图”,开启“意图经济”新时代

剑桥大学AI伦理学家警告,未来AI助手可能在我们意识到决策前预测并出售我们的“意图”。这标志着一个利润丰厚但令人不安的“意图经济”时代的到来。通过生成式AI和聊天机器人,科技巨头正开发能收集、理解并操纵人类意图的技术,将其商业化。研究人员指出,这种技术可能导致大规模社会操纵,并引发隐私和道德问题。专家呼吁公众提高警惕,确保这一趋势不会带来破坏性后果。

来源:AI Base

00:00

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线,带来显著性能提升和新功能。新版本可在5秒内生成视频,增强运动控制力,支持多种动漫风格切换,满足个性化需求。视频质量提升至1080p高清,并实现首尾帧丝滑过渡,提升整体观感。此前,爱诗科技完成近3亿元A+轮融资,资金将用于技术研发、扩展算力及人才团队建设。

来源:AI Base

00:00

印度的移动支付困境

印度支付监管机构正考虑限制 Walmart 的 PhonePe 和 Google Pay 在 UPI(统一支付接口)市场的主导地位,此举可能重塑印度移动支付格局。UPI 作为全球最大的数字支付网络之一,月处理交易量超过 130 亿笔,是印度数字经济的核心。监管机构拟实施 30% 的市场份额上限,或将影响 PhonePe 和 Google Pay 的用户增长及 IPO 计划。这一决策凸显了印度在技术创新与市场竞争之间的平衡挑战,同时也为其他金融科技初创企业提供了发展机遇。AI 技术在支付安全、交易优化和用户体验提升方面的应用,将成为未来金融科技领域的关键驱动力。

来源:TechCrunch AI

00:00

讯飞医疗成功上市,成为医疗大模型第一股!

讯飞医疗科技股份有限公司(股票代码:02506.HK)于2024年12月30日在香港联交所主板成功上市,标志着医疗大模型领域的第一股诞生。作为中国医疗人工智能行业的领导者,讯飞医疗在基层医疗服务、医院服务、患者服务和智慧影像等方面均取得显著成就,致力于让医疗服务更便捷,为人类健康未来奋斗。
来源:科大讯飞

来源:AI工具集

00:00

支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心

支付宝推出新功能“探一下”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知识、探灵感、探文本。可以根据自己的需求选择相应的服务,满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源:支付宝

来源:AI工具集

00:00

拓元智慧完成近亿元Pre-A轮融资,将聚焦多模态大模型与具身智能技术

拓元智慧(X-Era AI)宣布完成近亿元人民币的Pre-A轮融资,由粤科金融集团、鹏城愿景基金等投资。资金将用于加速多模态大模型和具身智能技术的研发。公司成立三年,累计营收近亿元,核心团队来自国内外高校和知名企业,已在无人零售、文教创作等领域实现技术深度应用。
来源:钛媒体

来源:AI工具集

00:00

OpenAI裂变成了两块:一块营利,一块非营利

OpenAI近日宣布公司重组,分为营利和非营利两部分,确保通用人工智能(AGI)造福全人类。重组旨在选择最适合长期成功的组织结构,使非营利组织可持续发展,让各部分有效运作。OpenAI计划将营利性公司转变为特拉华州公共利益公司(PBC),并发行普通股。PBC的公共利益将是OpenAI的使命。
来源:机器之心

来源:AI工具集

Back to top button