taoleb

每日AI新闻速递-9月29日：OpenAI爆出GPT门事件，腾讯混元图像3.0开源发布，快手KAT系列编程大模型突破

2025-09-29 凌晨一点字 0分钟 AI技术

每日AI新闻速递-9月29日

🚨 OpenAI”GPT门”事件震惊业界

OpenAI被曝偷换模型，Plus、Pro账户统统降配

OpenAI爆出重大争议事件，被发现在用户不知情的情况下暗中更换模型，引发业界强烈关注。

偷换模型细节曝光：

OpenAI将GPT-4、GPT-5等高级模型路由至两款低算力敏感模型
涉及的降配模型为”gpt-5-chat-safety”和”gpt-5-a-t-mini”
当系统判定内容涉及敏感话题、情绪表达或违法信息时自动切换

争议核心问题：

模型切换完全基于主观语境判断
无论用户选择哪种模型都可能被自动路由
用户对此完全不知情，违背了透明度原则

OpenAI官方回应：

副总裁称目前正在测试新的安全路由系统
声称切换仅是临时性的技术测试
但未经同意擅自更改模型的行为引发用户权益质疑

🎨 腾讯混元图像3.0重磅开源

工业级原生多模态，80B参数免费使用

腾讯在AI图像生成领域取得重大突破，发布业界领先的开源生图模型。

技术规格突破：

首个工业级原生多模态生图模型
参数规模达到80B，目前参数量最大的开源生图模型
测评效果在开源模型中表现最佳

核心能力亮点：

强大的语义理解能力，可解析千字级复杂语义
支持生成长文本文字和小文字
具备极致美学质感的图像生成效果

技术架构与训练：

以Hunyuan-A13B为基础模型
基于50亿级图文对和6T语料进行训练
采用Apache 2.0许可协议完全开源

开源生态布局：

模型权重已在Github、HuggingFace等平台发布
提供加速版本以提升部署效率
为开发者提供完整的工业级解决方案

💻 快手KAT系列编程大模型突破

Agentic Coding领域新标杆，SWE-Bench解决率达73.4%

快手Kwaipilot团队在AI编程领域取得重要突破，推出两款突破性编程大模型。

KAT系列模型架构：

KAT-Dev-32B：开源版本，在SWE-Bench Verified上解决率达62.4%
KAT-Coder：闭源版本，解决率高达73.4%，与全球顶尖闭源模型表现相当

技术创新突破：

采用链式训练结构，完成中训练、监督微调和强化微调等阶段
创新性开发基于熵的树剪枝技术
构建工业级规模强化学习训练框架SeamlessFlow

模型涌现能力：

经大规模Agentic RL训练后涌现新能力
对话轮次显著减少，提升交互效率
支持多工具并行调用，增强实用性

🎓 学而思AI教师分级理论

从L2助手到L3老师，AI教育新范式

好未来CTO田密提出创新的AI教师分级理论，为AI教育发展指明方向。

AI教师L1-L5分级体系：

将AI教育从助手角色(L2)发展至真正教师角色(L3)
学而思”小思AI一对一”对标L3级别闭环交互
为行业建立了清晰的技术发展路径

L3级AI老师核心能力：

实时观察学生解题步骤并提供针对性引导
形成”批改-讲题-推荐”的数据飞轮
需要专门硬件配备多模态传感器和算力支持

技术支撑体系：

基于好未来自研”九章”大模型
数学解题正确率达到98.1%
结合20多年教研内容沉淀

应用场景覆盖：

线下培训、在家学习和进校学习三大场景
实现统一学情画像的个性化教育
推动教育行业AI化转型

🤖 Meta豪赌人形机器人

与AR同等规模投资，数十亿美元研发”Metabot”

Meta在人形机器人领域展现雄心，计划进行大规模战略投资。

投资规模与战略：

首席技术官博斯沃思透露投入数十亿美元
人形机器人项目代号为”Metabot”
与AR项目获得同等战略地位

商业模式创新：

聚焦软件开发而非硬件制造
计划像谷歌Android一样将软件平台授权给制造商
打造行业通用标准和生态系统

技术团队建设：

新成立”超级智能人工智能实验室”
与机器人团队合作构建模拟真实物理规律的”世界模型”
前Cruise CEO马克带队，MIT教授金相培等顶尖专家加入

💬 强化学习之父的争议观点

图灵奖得主：大语言模型是错误的起点

图灵奖得主Richard Sutton发表争议性观点，对当前AI发展路径提出质疑。

核心观点阐述：

认为大语言模型是一个错误的起点和死胡同
强调真正的智能源自经验学习而非对人类的模仿
质疑当前主流AI发展方向的可持续性

对大模型的批评：

大模型只能预测人类会说什么
缺乏预测世界会发生什么的能力
没有目标和ground truth，无法对外部世界变化产生惊讶感

智能本质观点：

从经验学习出发才能实现真正可扩展的智能
经验指的是采取行动、观察结果并学习的过程
持续学习和对正确行为的判断是智能的本质

🧠 陈丹琦团队强化学习新方法

RLMT：大模型强化学习的第三条路

陈丹琦团队提出创新的强化学习方法，为大模型训练开辟新路径。

RLMT方法核心：

“基于模型奖励思维的强化学习”(RLMT)
将显式思维链推理融入通用聊天模型
弥合专门推理能力与通用对话能力间的差距

技术优势对比：

综合了RLHF的偏好对齐和RLVR的推理能力
要求模型在生成最终回答前先生成推理轨迹
通过奖励模型对回答进行全面评分

实验效果验证：

在WildBench、AlpacaEval2和ArenaHardV2等基准测试中表现优异
推理风格从线性规划转变为迭代式思考
更接近优秀写作者的思维习惯

🎬 DeepMind Veo 3技术突破

从思维链CoT到帧链CoF，视觉领域的GPT-3时刻

谷歌DeepMind在视频生成领域取得重大技术突破。

四层递进能力体系：

感知：执行边缘检测、分割等经典视觉任务
建模：理解物理定律与抽象关系
操纵：图像编辑与3D世界交互
推理：解决复杂视觉问题

帧链(CoF)概念创新：

类似语言模型的思维链(CoT)
Veo 3能通过逐帧视频生成实现跨时空推理
解决迷宫、序列模式补全等复杂视觉问题

性能评估结果：

在七个代表性任务上显著超越Veo 2
虽然性能未达完美但大幅进步
标志着视觉领域可能迎来”GPT-3时刻”

💰 黄仁勋谈AI未来与英伟达战略

万亿级市场机遇，主权AI时代来临

英伟达CEO黄仁勋在专访中分享对AI未来的深度洞察。

英伟达战略转型：

从芯片公司转型为AI基础设施合作伙伴
通过”极端协同设计”构建AI工厂生态系统
竞争护城河基于总拥有成本优势而非单一芯片

AI市场预测：

AI推理将迎来”十亿倍”增长
三大扩展定律驱动万亿级市场
预计年度AI基础设施资本支出达5万亿美元

主权AI时代观点：

各国需建立独立AI基础设施
主张与中美竞争而非脱钩
强调美国应通过技术出口最大化影响力

🏆 今日总结

今日AI行业呈现争议与突破并存的复杂态势：

争议事件：OpenAI的”GPT门”事件暴露了AI服务透明度问题，强化学习之父对大语言模型的批评引发行业深度思考。

技术突破：腾讯混元图像3.0的开源发布、快手KAT系列编程模型的优异表现，以及DeepMind Veo 3的技术创新，展现了AI技术的快速进步。

产业布局：Meta对人形机器人的大规模投资、学而思AI教师分级理论的提出，显示了AI技术向更多领域的深度渗透。

前沿研究：陈丹琦团队的RLMT方法为强化学习开辟新路径，黄仁勋对AI未来的预测描绘了万亿级市场前景。

这些发展共同推动着AI技术在争议中前进，在突破中成熟，为人工智能的未来发展奠定重要基础。