Home
avatar

taoleb

每日AI新闻速递-9月24日:英伟达千亿投资OpenAI,阿里开源全模态大模型,具身智能迎来重大突破

每日AI新闻速递-9月24日

🔥 今日头条:千亿投资重塑AI格局

英伟达官宣向OpenAI投资1000亿美元!打造AI巨兽

AI界迎来史无前例的巨额投资,英伟达与OpenAI战略合作震撼全球。

投资规模空前

  • 英伟达宣布与OpenAI建立战略合作关系
  • OpenAI将部署高达10吉瓦的英伟达系统,相当于400-500万块GPU算力
  • 英伟达计划累计投资高达1000亿美元
  • 首阶段系统将于2026年下半年基于英伟达Vera Rubin平台投入运营

合作深度前所未有

  • 双方将共同优化模型及基础设施软件、硬件的技术路线图
  • 推动OpenAI实现通用人工智能使命
  • 消息公布后英伟达股价上涨近4%
  • 标志着AI算力军备竞赛进入新高度

行业影响深远

  • 巩固英伟达在AI算力领域的绝对领导地位
  • 为OpenAI下一代AGI模型提供强大基础设施支撑
  • 可能引发其他科技巨头跟进投资

🚀 开源模型重大突破

阿里开源原生多模态模型Qwen3-Omni,对标闭源强模型

阿里通义团队发布重磅开源模型,在多模态AI领域实现重大突破。

技术能力全面升级

  • 无缝处理文本、图像、音频和视频输入
  • 支持实时流式响应并同时生成文本与语音输出
  • 在36项音频及音视频基准测试中获得32项开源SOTA与22项总体SOTA
  • 超越Gemini-2.5-Pro等闭源强模型

多语言支持强大

  • 支持119种文本语言
  • 19种语音理解语言
  • 10种语音生成语言
  • 真正实现全球化应用场景覆盖

生态产品丰富

  • 同步开源Qwen3-TTS-Flash语音合成模型,支持17种音色、10种语言和多种方言
  • Qwen-Image-Edit-2509图像编辑模型,新增多图编辑和单图一致性增强功能
  • 构建完整的多模态AI工具链

清华MiniCPM-V 4.5:8B硬刚72B!技术报告震撼发布

清华大学与面壁智能联合发布的MiniCPM-V 4.5刷新小参数模型性能上限。

性能表现惊艳

  • 以8B参数规模超越GPT-4o-latest和Qwen2.5-VL-72B等大型模型
  • 在OpenCompass综合评测中取得77.0的平均分
  • 推理效率极高,在VideoMME上时间开销仅为同级模型的1/10

技术创新突出

  • 统一3D-Resampler架构实现高密度视频压缩
  • 面向文档的统一OCR知识学习范式
  • 可控混合快速/深度思考的多模态强化学习

应用前景广阔

  • 已在HuggingFace和ModelScope两大平台累计下载超22万次
  • 为边缘计算和移动端AI应用提供新方案
  • 证明小参数模型也能达到顶级性能

🤖 具身智能迎来里程碑

智元机器人GO-1通用具身基座大模型全面开源!

智元机器人发布全球首个开源通用具身基座大模型,为机器人产业注入强心剂。

架构创新领先

  • 采用全球首个Vision-Language-Latent-Action (ViLLA)架构
  • 通过引入隐式动作标记成功弥合图像-文本输入与机器人执行动作间的语义鸿沟
  • 三层协同设计:多模态理解层、隐式规划器和基于扩散模型的动作专家

通用性验证充分

  • 虽仅基于AgiBot G1数据预训练
  • 已在松灵机器人、方舟机器人等不同本体中完成验证
  • 支持多种仿真环境,展现强大的泛化能力

开发生态完善

  • 同时推出Genie Studio一站式开发平台
  • 提供全栈解决方案:数据采集、管理、模型训练、微调、评测与部署
  • 支持LeRobot通用数据格式,适配其他机器人平台

💡 基础设施智能化革命

无问芯穹推出基础设施智能体蜂群,开启Agentic Infra

AI基础设施迎来范式变革,从传统堆叠走向智能协同。

技术架构先进

  • 发布基础设施智能体蜂群
  • 通过多智能体协同架构覆盖模型筛选、资源运营、排障和集群运维等多个模块
  • 实现基础设施全生命周期智能管理

效果提升显著

  • 彻底改变传统IaaS→PaaS→MaaS→Agent应用间层层堆叠的生产模式
  • 以智能体为自治核心构建高度协同系统
  • 显著提升资源利用率和运维效率

商业价值验证

  • 通过与捏TA和Soul等客户合作
  • 成功将迭代速度提升5倍
  • 实现了运维能力百倍拓展
  • 推动”AI基础设施范式”向”Agentic Infra”的转变

📱 产品服务升级加速

Kimi上线Agent会员服务,打赏金额可全额返还

月之暗面推出差异化会员服务,探索AI产品商业化新模式。

会员体系创新

  • 采用音乐节拍命名:免费版Adagio(慢板)
  • 付费版分为49元的Andante(行板)和99元的Moderato(中速)
  • 海外还有199美元的Vivace高端版本

用户体验优化

  • 之前打赏的金额在首次订阅Agent会员后可全额返还为会员时间
  • 付费和免费用户主要区别在于Agent使用次数
  • 中高档订阅会送等额API兑换券
  • 高等级会员支持深度研究并发和高峰时段优先访问

ima新版本:上线鸿蒙电脑版、AI播客生成更快了

ima产品持续迭代,多端协同体验再升级。

多端布局完善

  • 正式上线鸿蒙电脑版
  • 实现鸿蒙系统手机、平板和电脑三端全覆盖
  • 用户可在多设备间实现协同工作

功能体验升级

  • AI播客生成功能全面升级
  • 采用分段生成技术支持”边生成边播放”
  • 大幅减少等待时间,提升用户体验
  • 优化了整体使用流程,保留核心功能特性

🧠 前沿研究洞察

从Transformer到GPT-5,OpenAI科学家的第一性思考

Transformer八人小组成员Lukasz Kaiser分享AI发展深度思考。

技术演进预测

  • Kaiser是唯一一位未创业继续坚守技术前线的”Transformer八子”
  • 早在2017年提出了”One Model To Learn Them All”概念
  • 预见到大模型跨领域学习的潜力
  • 预言AI的下一阶段关键在于教会模型”思考”

范式转移预测

  • 未来AI计算力将从大规模预训练转向少量高质量特定数据上的海量推理计算
  • 更接近人类智慧模式
  • 预示着又一次重大范式转移

《心理学增强AI智能体》:Prompt的尽头居然是MBTI?

学术界探索AI人格化的新颖方法,引发广泛关注。

技术方法简单有效

  • 论文提出”MBTI-in-Thoughts”技术
  • 只需在提示词开头加上”请用INTJ的视角回答”等简单指令
  • 就能显著提升模型表现

人格差异显著

  • 不同MBTI人格的AI在处理同一任务时表现差异明显
  • F型(情感型)更擅长写故事、煽情
  • E型(外向型)在幽默感和可读性上更强
  • T型(思考型)在策略游戏中更理性冷静

应用价值巨大

  • 本质是对人格概念的”终极压缩”
  • 让AI瞬间解压人类思维模式、行为逻辑、语言风格的统计总和
  • 可用于组建互补性格的”AI团队”以应对不同任务需求

📊 今日总结

今日AI行业呈现投资、技术、产品全面爆发的壮观景象:

投资层面:英伟达1000亿美元投资OpenAI,创下AI领域投资新纪录

技术层面:阿里Qwen3-Omni、清华MiniCPM-V 4.5、智元GO-1等开源模型集中发布

产品层面:Kimi、ima等产品服务持续升级,用户体验不断优化

基础设施层面:无问芯穹推动AI基础设施向Agent化演进

研究层面:从技术架构到心理学应用,AI研究边界持续拓展

这些发展表明AI产业正在从技术突破走向全面应用,从单点创新走向系统性变革。千亿级投资、开源模型井喷、基础设施智能化、产品服务精细化等多重趋势叠加,预示着AI技术即将迎来新的爆发期。

AI新闻 英伟达 OpenAI 阿里 Qwen3-Omni 智元机器人 GO-1 具身智能 MiniCPM-V 清华 无问芯穹 Kimi Agent