每日AI新闻速递-9月28日:ChatGPT推出主动推送功能Pulse,谷歌发布机器人专用Gemini模型,腾讯混元3D开源组件生成技术
每日AI新闻速递-9月28日
🚀 ChatGPT重大功能升级
ChatGPT推出主动推送功能Pulse,从被动转向主动服务
OpenAI在用户体验方面取得重大突破,推出了革命性的主动推送功能。
Pulse功能核心特色:
- 首先向ChatGPT Pro用户开放预览版
- 每晚根据用户聊天记录和反馈提供个性化内容推送
- 基于智能体(Agent)技术开发,具备主动异步搜索能力
智能集成能力:
- 支持链接Gmail和Google日历
- 提供更相关的个性化建议
- 通过主题卡片形式呈现推送内容
用户交互优化:
- 用户可以点赞或踩赞提供反馈
- 系统根据反馈持续优化推送质量
- 奥特曼称这是”将ChatGPT从完全被动转变为主动,提供高度个性化服务”的第一步
🤖 机器人AI技术突破
谷歌发布Gemini Robotics 1.5,让机器人学会「思考」
谷歌DeepMind在机器人和具身智能领域取得重大进展。
模型家族架构:
- Gemini Robotics 1.5:最先进的视觉-语言-行动模型
- Gemini Robotics-ER 1.5:最强大的视觉-语言推理模型
- 两款模型协同工作,实现完整的机器人智能体系
技术能力突破:
- 将视觉信息和指令转化为精准的机器人动作
- 能够推理物理世界并创建多步骤执行计划
- 支持”思考后行动”的智能决策模式
实际应用场景:
- 执行垃圾分类、行李打包等复杂任务
- 实现跨不同机器人形态的技能迁移
- 支持泛化学习,适应多样化环境需求
🎨 3D内容生成革命
腾讯混元3D开源业界首个原生3D组件生成模型
腾讯混元3D团队在3D内容生成领域实现重大突破。
Hunyuan3D-Part模型架构:
- P3-SAM模块:专业3D分割功能
- X-Part模块:高质量组件生成能力
- 全流程优化从语义特征到部件生成
技术创新价值:
- 生成高质量、可投入生产的组件式3D内容
- 结构合理,满足专业制作需求
- 解决游戏制作与3D打印行业对可分解3D形状的迫切需求
性能表现卓越:
- 在PartObj-Tiny等多个基准上大幅超越现有工作
- 已开源并提供线上体验入口
- 为3D内容创作行业提供强大工具支撑
🧠 Agent智能体进展
Kimi推出全新Agent模型「OK Computer」,任务执行能力全面升级
月之暗面在Agent技术方面取得重要进展。
OK Computer核心能力:
- 依托Kimi K2强大基础能力
- 能完成网站搭建、PPT制作和百万行数据处理等复杂任务
- 操作时自动列出Todo List进度表,全程可视化
自主执行特色:
- 自主完成网页搜索、素材生成、代码编写与检查
- 最终输出可交互、可复用的高质量结果
- 支持多种任务类型的智能化处理
任务处理能力:
- 设计类任务:自主规划并实现各模块功能
- 分析类任务:自动搜集数据并提供可视化图表
- 生成类任务:支持多种内容输出与编辑功能
🏢 明星创业公司动态
Thinking Machines发布第二篇研究论文,聚焦神经网络训练优化
估值840亿元的明星创业公司继续在技术研究方面发力。
“Modular Manifolds”研究突破:
- 让网络的不同层在统一框架下进行约束和优化
- 显著提升训练稳定性和效率
- 解决神经网络训练中的权重数值不稳定问题
技术创新方法:
- 研究者Jeremy Bernstein提出模块化流形方法
- 提供详细的理论分析与实验验证
- 为大模型训练提供新的优化思路
行业影响力:
- 公司创始人Mira Murati与翁荔等纷纷转发支持
- 此前已发布首篇研究《Defeating Nondeterminism in LLM Inference》
- 专注解决大模型推理中的不确定性问题
🎬 AI电影制作突破
五部AI短片亮相釜山电影节,AI电影制作迎来新里程碑
AI在电影制作领域的应用取得重要进展。
釜山电影节AI作品:
- 香港动画公司ManyMany Creations制作的15分钟全AI短片《九宵》成功入选
- “未来影像”AI电影国际峰会展映《权利游戏》《法体》等四部AI短片
- 作品不再只是技术展示,而是真正利用AI作为叙事手段
内容深度提升:
- 探讨女性主义、“平庸之恶”等深刻社会主题
- AI成为电影创作的重要工具而非噱头
- 展现AI在艺术创作领域的巨大潜力
产业化进展:
- 博纳影业成立国内首个AI制作中心
- 利用AI将电影制作周期从数年压缩至1.5-2年
- 大幅降低制作成本,推动行业变革
📱 苹果生态AI集成
iOS 26.1隐藏彩蛋,为ChatGPT们造了个新「C口」
苹果在AI生态集成方面迈出重要一步。
MCP支持引入:
- iOS 26.1、iPadOS 26.1和macOS Tahoe 26.1开发者测试版显示
- 苹果正在为App Intents引入MCP(模型上下文协议)支持
- 将允许ChatGPT、Claude等AI模型直接与苹果设备应用交互
技术标准采用:
- MCP由Anthropic提出,作为AI领域的”通用插口”
- 能让模型与外部服务安全对话
- 已被Notion、Google、Figma、OpenAI等主流平台采用
苹果战略转变:
- 构建系统级MCP支持,而非让每个应用单独支持
- 既能利用行业生态,又能强制执行隐私安全标准
- 体现苹果从”全栈自研”向平台化的战略转变
🏥 医学AI数据整合
Project Imaging-X发布,1000+医学影像数据集综述
上海人工智能实验室等机构在医学AI领域取得重要进展。
数据集规模梳理:
- 系统梳理2000-2025年间1000+医学影像数据集
- 揭示医学数据”小而散、偏科严重”的现状格局
- 为医学AI发展提供重要数据基础
数据特征分析:
- 医学影像数据与通用视觉存在数量级差距
- 病理数据超过其他类型,分类与分割任务占主导
- CT和MRI为主要3D数据类型
技术解决方案:
- 提出元数据驱动融合范式(MDFP)
- 通过四阶段流程实现数据集整合
- 开发交互式数据发现门户,助力医学基础模型发展
📊 行业深度洞察
红杉报告:AI的生产力悖论,仅5%公司正在从AI中获益
红杉资本发布重要研究报告,揭示AI应用的现实挑战。
“GenAI鸿沟”现象:
- 仅5%公司从AI获得显著价值
- 95%因静态工具与流程脱节而未能受益
- 核心问题是AI系统”学不会、推不开、用不深”
企业AI失败三大原因:
- 学习能力缺失:AI工具缺乏从用户反馈中学习的能力
- 扩展困难:95%的定制AI方案未能从试点扩展至规模化部署
- 影子AI经济:员工转而使用个人AI服务,形成管理盲区
就业市场影响:
- 22-25岁初级岗位已出现大规模替代
- AI首先替代”书本知识”,专家经验成为新护城河
- 创业者应打造能学习的AI代理,深度融入企业后台流程
🏆 今日总结
今日AI行业呈现从技术突破到产业应用的全面发展态势:
用户体验革新:ChatGPT的Pulse功能标志着AI助手从被动响应向主动服务的重大转变,为个性化AI服务开辟新方向。
机器人智能跃升:谷歌Gemini Robotics系列让机器人具备了真正的”思考”能力,推动具身智能向实用化迈进。
3D内容创作:腾讯混元3D的开源举措为游戏和3D打印行业提供了强大工具,降低了专业3D内容创作门槛。
Agent能力提升:从Kimi的OK Computer到Thinking Machines的研究突破,智能体技术正在向更复杂任务处理能力发展。
产业深度融合:从AI电影制作到苹果生态集成,AI正在深度融入各个行业的核心业务流程。
现实挑战认知:红杉的研究报告提醒我们,AI的真正价值实现仍需要克服技术与业务流程的深度融合挑战。
这些发展共同推动着AI技术从概念验证走向规模化应用,为各行各业的数字化转型提供强大动力。
