Home
avatar

taoleb

每日AI新闻速递-9月28日:ChatGPT推出主动推送功能Pulse,谷歌发布机器人专用Gemini模型,腾讯混元3D开源组件生成技术

每日AI新闻速递-9月28日

🚀 ChatGPT重大功能升级

ChatGPT推出主动推送功能Pulse,从被动转向主动服务

OpenAI在用户体验方面取得重大突破,推出了革命性的主动推送功能。

Pulse功能核心特色

  • 首先向ChatGPT Pro用户开放预览版
  • 每晚根据用户聊天记录和反馈提供个性化内容推送
  • 基于智能体(Agent)技术开发,具备主动异步搜索能力

智能集成能力

  • 支持链接Gmail和Google日历
  • 提供更相关的个性化建议
  • 通过主题卡片形式呈现推送内容

用户交互优化

  • 用户可以点赞或踩赞提供反馈
  • 系统根据反馈持续优化推送质量
  • 奥特曼称这是”将ChatGPT从完全被动转变为主动,提供高度个性化服务”的第一步

🤖 机器人AI技术突破

谷歌发布Gemini Robotics 1.5,让机器人学会「思考」

谷歌DeepMind在机器人和具身智能领域取得重大进展。

模型家族架构

  • Gemini Robotics 1.5:最先进的视觉-语言-行动模型
  • Gemini Robotics-ER 1.5:最强大的视觉-语言推理模型
  • 两款模型协同工作,实现完整的机器人智能体系

技术能力突破

  • 将视觉信息和指令转化为精准的机器人动作
  • 能够推理物理世界并创建多步骤执行计划
  • 支持”思考后行动”的智能决策模式

实际应用场景

  • 执行垃圾分类、行李打包等复杂任务
  • 实现跨不同机器人形态的技能迁移
  • 支持泛化学习,适应多样化环境需求

🎨 3D内容生成革命

腾讯混元3D开源业界首个原生3D组件生成模型

腾讯混元3D团队在3D内容生成领域实现重大突破。

Hunyuan3D-Part模型架构

  • P3-SAM模块:专业3D分割功能
  • X-Part模块:高质量组件生成能力
  • 全流程优化从语义特征到部件生成

技术创新价值

  • 生成高质量、可投入生产的组件式3D内容
  • 结构合理,满足专业制作需求
  • 解决游戏制作与3D打印行业对可分解3D形状的迫切需求

性能表现卓越

  • 在PartObj-Tiny等多个基准上大幅超越现有工作
  • 已开源并提供线上体验入口
  • 为3D内容创作行业提供强大工具支撑

🧠 Agent智能体进展

Kimi推出全新Agent模型「OK Computer」,任务执行能力全面升级

月之暗面在Agent技术方面取得重要进展。

OK Computer核心能力

  • 依托Kimi K2强大基础能力
  • 能完成网站搭建、PPT制作和百万行数据处理等复杂任务
  • 操作时自动列出Todo List进度表,全程可视化

自主执行特色

  • 自主完成网页搜索、素材生成、代码编写与检查
  • 最终输出可交互、可复用的高质量结果
  • 支持多种任务类型的智能化处理

任务处理能力

  • 设计类任务:自主规划并实现各模块功能
  • 分析类任务:自动搜集数据并提供可视化图表
  • 生成类任务:支持多种内容输出与编辑功能

🏢 明星创业公司动态

Thinking Machines发布第二篇研究论文,聚焦神经网络训练优化

估值840亿元的明星创业公司继续在技术研究方面发力。

“Modular Manifolds”研究突破

  • 让网络的不同层在统一框架下进行约束和优化
  • 显著提升训练稳定性和效率
  • 解决神经网络训练中的权重数值不稳定问题

技术创新方法

  • 研究者Jeremy Bernstein提出模块化流形方法
  • 提供详细的理论分析与实验验证
  • 为大模型训练提供新的优化思路

行业影响力

  • 公司创始人Mira Murati与翁荔等纷纷转发支持
  • 此前已发布首篇研究《Defeating Nondeterminism in LLM Inference》
  • 专注解决大模型推理中的不确定性问题

🎬 AI电影制作突破

五部AI短片亮相釜山电影节,AI电影制作迎来新里程碑

AI在电影制作领域的应用取得重要进展。

釜山电影节AI作品

  • 香港动画公司ManyMany Creations制作的15分钟全AI短片《九宵》成功入选
  • “未来影像”AI电影国际峰会展映《权利游戏》《法体》等四部AI短片
  • 作品不再只是技术展示,而是真正利用AI作为叙事手段

内容深度提升

  • 探讨女性主义、“平庸之恶”等深刻社会主题
  • AI成为电影创作的重要工具而非噱头
  • 展现AI在艺术创作领域的巨大潜力

产业化进展

  • 博纳影业成立国内首个AI制作中心
  • 利用AI将电影制作周期从数年压缩至1.5-2年
  • 大幅降低制作成本,推动行业变革

📱 苹果生态AI集成

iOS 26.1隐藏彩蛋,为ChatGPT们造了个新「C口」

苹果在AI生态集成方面迈出重要一步。

MCP支持引入

  • iOS 26.1、iPadOS 26.1和macOS Tahoe 26.1开发者测试版显示
  • 苹果正在为App Intents引入MCP(模型上下文协议)支持
  • 将允许ChatGPT、Claude等AI模型直接与苹果设备应用交互

技术标准采用

  • MCP由Anthropic提出,作为AI领域的”通用插口”
  • 能让模型与外部服务安全对话
  • 已被Notion、Google、Figma、OpenAI等主流平台采用

苹果战略转变

  • 构建系统级MCP支持,而非让每个应用单独支持
  • 既能利用行业生态,又能强制执行隐私安全标准
  • 体现苹果从”全栈自研”向平台化的战略转变

🏥 医学AI数据整合

Project Imaging-X发布,1000+医学影像数据集综述

上海人工智能实验室等机构在医学AI领域取得重要进展。

数据集规模梳理

  • 系统梳理2000-2025年间1000+医学影像数据集
  • 揭示医学数据”小而散、偏科严重”的现状格局
  • 为医学AI发展提供重要数据基础

数据特征分析

  • 医学影像数据与通用视觉存在数量级差距
  • 病理数据超过其他类型,分类与分割任务占主导
  • CT和MRI为主要3D数据类型

技术解决方案

  • 提出元数据驱动融合范式(MDFP)
  • 通过四阶段流程实现数据集整合
  • 开发交互式数据发现门户,助力医学基础模型发展

📊 行业深度洞察

红杉报告:AI的生产力悖论,仅5%公司正在从AI中获益

红杉资本发布重要研究报告,揭示AI应用的现实挑战。

“GenAI鸿沟”现象

  • 仅5%公司从AI获得显著价值
  • 95%因静态工具与流程脱节而未能受益
  • 核心问题是AI系统”学不会、推不开、用不深”

企业AI失败三大原因

  • 学习能力缺失:AI工具缺乏从用户反馈中学习的能力
  • 扩展困难:95%的定制AI方案未能从试点扩展至规模化部署
  • 影子AI经济:员工转而使用个人AI服务,形成管理盲区

就业市场影响

  • 22-25岁初级岗位已出现大规模替代
  • AI首先替代”书本知识”,专家经验成为新护城河
  • 创业者应打造能学习的AI代理,深度融入企业后台流程

🏆 今日总结

今日AI行业呈现从技术突破到产业应用的全面发展态势:

用户体验革新:ChatGPT的Pulse功能标志着AI助手从被动响应向主动服务的重大转变,为个性化AI服务开辟新方向。

机器人智能跃升:谷歌Gemini Robotics系列让机器人具备了真正的”思考”能力,推动具身智能向实用化迈进。

3D内容创作:腾讯混元3D的开源举措为游戏和3D打印行业提供了强大工具,降低了专业3D内容创作门槛。

Agent能力提升:从Kimi的OK Computer到Thinking Machines的研究突破,智能体技术正在向更复杂任务处理能力发展。

产业深度融合:从AI电影制作到苹果生态集成,AI正在深度融入各个行业的核心业务流程。

现实挑战认知:红杉的研究报告提醒我们,AI的真正价值实现仍需要克服技术与业务流程的深度融合挑战。

这些发展共同推动着AI技术从概念验证走向规模化应用,为各行各业的数字化转型提供强大动力。

AI新闻 ChatGPT Pulse OpenAI 谷歌 Gemini Robotics 腾讯 混元3D Kimi Agent 红杉 AI生产力 机器人 3D生成