Home
avatar

taoleb

每日AI新闻速递-9月29日:OpenAI爆出GPT门事件,腾讯混元图像3.0开源发布,快手KAT系列编程大模型突破

每日AI新闻速递-9月29日

🚨 OpenAI”GPT门”事件震惊业界

OpenAI被曝偷换模型,Plus、Pro账户统统降配

OpenAI爆出重大争议事件,被发现在用户不知情的情况下暗中更换模型,引发业界强烈关注。

偷换模型细节曝光

  • OpenAI将GPT-4、GPT-5等高级模型路由至两款低算力敏感模型
  • 涉及的降配模型为”gpt-5-chat-safety”和”gpt-5-a-t-mini”
  • 当系统判定内容涉及敏感话题、情绪表达或违法信息时自动切换

争议核心问题

  • 模型切换完全基于主观语境判断
  • 无论用户选择哪种模型都可能被自动路由
  • 用户对此完全不知情,违背了透明度原则

OpenAI官方回应

  • 副总裁称目前正在测试新的安全路由系统
  • 声称切换仅是临时性的技术测试
  • 但未经同意擅自更改模型的行为引发用户权益质疑

🎨 腾讯混元图像3.0重磅开源

工业级原生多模态,80B参数免费使用

腾讯在AI图像生成领域取得重大突破,发布业界领先的开源生图模型。

技术规格突破

  • 首个工业级原生多模态生图模型
  • 参数规模达到80B,目前参数量最大的开源生图模型
  • 测评效果在开源模型中表现最佳

核心能力亮点

  • 强大的语义理解能力,可解析千字级复杂语义
  • 支持生成长文本文字和小文字
  • 具备极致美学质感的图像生成效果

技术架构与训练

  • 以Hunyuan-A13B为基础模型
  • 基于50亿级图文对和6T语料进行训练
  • 采用Apache 2.0许可协议完全开源

开源生态布局

  • 模型权重已在Github、HuggingFace等平台发布
  • 提供加速版本以提升部署效率
  • 为开发者提供完整的工业级解决方案

💻 快手KAT系列编程大模型突破

Agentic Coding领域新标杆,SWE-Bench解决率达73.4%

快手Kwaipilot团队在AI编程领域取得重要突破,推出两款突破性编程大模型。

KAT系列模型架构

  • KAT-Dev-32B:开源版本,在SWE-Bench Verified上解决率达62.4%
  • KAT-Coder:闭源版本,解决率高达73.4%,与全球顶尖闭源模型表现相当

技术创新突破

  • 采用链式训练结构,完成中训练、监督微调和强化微调等阶段
  • 创新性开发基于熵的树剪枝技术
  • 构建工业级规模强化学习训练框架SeamlessFlow

模型涌现能力

  • 经大规模Agentic RL训练后涌现新能力
  • 对话轮次显著减少,提升交互效率
  • 支持多工具并行调用,增强实用性

🎓 学而思AI教师分级理论

从L2助手到L3老师,AI教育新范式

好未来CTO田密提出创新的AI教师分级理论,为AI教育发展指明方向。

AI教师L1-L5分级体系

  • 将AI教育从助手角色(L2)发展至真正教师角色(L3)
  • 学而思”小思AI一对一”对标L3级别闭环交互
  • 为行业建立了清晰的技术发展路径

L3级AI老师核心能力

  • 实时观察学生解题步骤并提供针对性引导
  • 形成”批改-讲题-推荐”的数据飞轮
  • 需要专门硬件配备多模态传感器和算力支持

技术支撑体系

  • 基于好未来自研”九章”大模型
  • 数学解题正确率达到98.1%
  • 结合20多年教研内容沉淀

应用场景覆盖

  • 线下培训、在家学习和进校学习三大场景
  • 实现统一学情画像的个性化教育
  • 推动教育行业AI化转型

🤖 Meta豪赌人形机器人

与AR同等规模投资,数十亿美元研发”Metabot”

Meta在人形机器人领域展现雄心,计划进行大规模战略投资。

投资规模与战略

  • 首席技术官博斯沃思透露投入数十亿美元
  • 人形机器人项目代号为”Metabot”
  • 与AR项目获得同等战略地位

商业模式创新

  • 聚焦软件开发而非硬件制造
  • 计划像谷歌Android一样将软件平台授权给制造商
  • 打造行业通用标准和生态系统

技术团队建设

  • 新成立”超级智能人工智能实验室”
  • 与机器人团队合作构建模拟真实物理规律的”世界模型”
  • 前Cruise CEO马克带队,MIT教授金相培等顶尖专家加入

💬 强化学习之父的争议观点

图灵奖得主:大语言模型是错误的起点

图灵奖得主Richard Sutton发表争议性观点,对当前AI发展路径提出质疑。

核心观点阐述

  • 认为大语言模型是一个错误的起点和死胡同
  • 强调真正的智能源自经验学习而非对人类的模仿
  • 质疑当前主流AI发展方向的可持续性

对大模型的批评

  • 大模型只能预测人类会说什么
  • 缺乏预测世界会发生什么的能力
  • 没有目标和ground truth,无法对外部世界变化产生惊讶感

智能本质观点

  • 从经验学习出发才能实现真正可扩展的智能
  • 经验指的是采取行动、观察结果并学习的过程
  • 持续学习和对正确行为的判断是智能的本质

🧠 陈丹琦团队强化学习新方法

RLMT:大模型强化学习的第三条路

陈丹琦团队提出创新的强化学习方法,为大模型训练开辟新路径。

RLMT方法核心

  • “基于模型奖励思维的强化学习”(RLMT)
  • 将显式思维链推理融入通用聊天模型
  • 弥合专门推理能力与通用对话能力间的差距

技术优势对比

  • 综合了RLHF的偏好对齐和RLVR的推理能力
  • 要求模型在生成最终回答前先生成推理轨迹
  • 通过奖励模型对回答进行全面评分

实验效果验证

  • 在WildBench、AlpacaEval2和ArenaHardV2等基准测试中表现优异
  • 推理风格从线性规划转变为迭代式思考
  • 更接近优秀写作者的思维习惯

🎬 DeepMind Veo 3技术突破

从思维链CoT到帧链CoF,视觉领域的GPT-3时刻

谷歌DeepMind在视频生成领域取得重大技术突破。

四层递进能力体系

  • 感知:执行边缘检测、分割等经典视觉任务
  • 建模:理解物理定律与抽象关系
  • 操纵:图像编辑与3D世界交互
  • 推理:解决复杂视觉问题

帧链(CoF)概念创新

  • 类似语言模型的思维链(CoT)
  • Veo 3能通过逐帧视频生成实现跨时空推理
  • 解决迷宫、序列模式补全等复杂视觉问题

性能评估结果

  • 在七个代表性任务上显著超越Veo 2
  • 虽然性能未达完美但大幅进步
  • 标志着视觉领域可能迎来”GPT-3时刻”

💰 黄仁勋谈AI未来与英伟达战略

万亿级市场机遇,主权AI时代来临

英伟达CEO黄仁勋在专访中分享对AI未来的深度洞察。

英伟达战略转型

  • 从芯片公司转型为AI基础设施合作伙伴
  • 通过”极端协同设计”构建AI工厂生态系统
  • 竞争护城河基于总拥有成本优势而非单一芯片

AI市场预测

  • AI推理将迎来”十亿倍”增长
  • 三大扩展定律驱动万亿级市场
  • 预计年度AI基础设施资本支出达5万亿美元

主权AI时代观点

  • 各国需建立独立AI基础设施
  • 主张与中美竞争而非脱钩
  • 强调美国应通过技术出口最大化影响力

🏆 今日总结

今日AI行业呈现争议与突破并存的复杂态势:

争议事件:OpenAI的”GPT门”事件暴露了AI服务透明度问题,强化学习之父对大语言模型的批评引发行业深度思考。

技术突破:腾讯混元图像3.0的开源发布、快手KAT系列编程模型的优异表现,以及DeepMind Veo 3的技术创新,展现了AI技术的快速进步。

产业布局:Meta对人形机器人的大规模投资、学而思AI教师分级理论的提出,显示了AI技术向更多领域的深度渗透。

前沿研究:陈丹琦团队的RLMT方法为强化学习开辟新路径,黄仁勋对AI未来的预测描绘了万亿级市场前景。

这些发展共同推动着AI技术在争议中前进,在突破中成熟,为人工智能的未来发展奠定重要基础。

AI新闻 OpenAI GPT门 腾讯 混元图像 快手 KAT 编程大模型 学而思 AI教师 Meta 人形机器人 强化学习 DeepMind Veo 3 黄仁勋