每日AI新闻速递-9月29日:OpenAI爆出GPT门事件,腾讯混元图像3.0开源发布,快手KAT系列编程大模型突破
每日AI新闻速递-9月29日
🚨 OpenAI”GPT门”事件震惊业界
OpenAI被曝偷换模型,Plus、Pro账户统统降配
OpenAI爆出重大争议事件,被发现在用户不知情的情况下暗中更换模型,引发业界强烈关注。
偷换模型细节曝光:
- OpenAI将GPT-4、GPT-5等高级模型路由至两款低算力敏感模型
- 涉及的降配模型为”gpt-5-chat-safety”和”gpt-5-a-t-mini”
- 当系统判定内容涉及敏感话题、情绪表达或违法信息时自动切换
争议核心问题:
- 模型切换完全基于主观语境判断
- 无论用户选择哪种模型都可能被自动路由
- 用户对此完全不知情,违背了透明度原则
OpenAI官方回应:
- 副总裁称目前正在测试新的安全路由系统
- 声称切换仅是临时性的技术测试
- 但未经同意擅自更改模型的行为引发用户权益质疑
🎨 腾讯混元图像3.0重磅开源
工业级原生多模态,80B参数免费使用
腾讯在AI图像生成领域取得重大突破,发布业界领先的开源生图模型。
技术规格突破:
- 首个工业级原生多模态生图模型
- 参数规模达到80B,目前参数量最大的开源生图模型
- 测评效果在开源模型中表现最佳
核心能力亮点:
- 强大的语义理解能力,可解析千字级复杂语义
- 支持生成长文本文字和小文字
- 具备极致美学质感的图像生成效果
技术架构与训练:
- 以Hunyuan-A13B为基础模型
- 基于50亿级图文对和6T语料进行训练
- 采用Apache 2.0许可协议完全开源
开源生态布局:
- 模型权重已在Github、HuggingFace等平台发布
- 提供加速版本以提升部署效率
- 为开发者提供完整的工业级解决方案
💻 快手KAT系列编程大模型突破
Agentic Coding领域新标杆,SWE-Bench解决率达73.4%
快手Kwaipilot团队在AI编程领域取得重要突破,推出两款突破性编程大模型。
KAT系列模型架构:
- KAT-Dev-32B:开源版本,在SWE-Bench Verified上解决率达62.4%
- KAT-Coder:闭源版本,解决率高达73.4%,与全球顶尖闭源模型表现相当
技术创新突破:
- 采用链式训练结构,完成中训练、监督微调和强化微调等阶段
- 创新性开发基于熵的树剪枝技术
- 构建工业级规模强化学习训练框架SeamlessFlow
模型涌现能力:
- 经大规模Agentic RL训练后涌现新能力
- 对话轮次显著减少,提升交互效率
- 支持多工具并行调用,增强实用性
🎓 学而思AI教师分级理论
从L2助手到L3老师,AI教育新范式
好未来CTO田密提出创新的AI教师分级理论,为AI教育发展指明方向。
AI教师L1-L5分级体系:
- 将AI教育从助手角色(L2)发展至真正教师角色(L3)
- 学而思”小思AI一对一”对标L3级别闭环交互
- 为行业建立了清晰的技术发展路径
L3级AI老师核心能力:
- 实时观察学生解题步骤并提供针对性引导
- 形成”批改-讲题-推荐”的数据飞轮
- 需要专门硬件配备多模态传感器和算力支持
技术支撑体系:
- 基于好未来自研”九章”大模型
- 数学解题正确率达到98.1%
- 结合20多年教研内容沉淀
应用场景覆盖:
- 线下培训、在家学习和进校学习三大场景
- 实现统一学情画像的个性化教育
- 推动教育行业AI化转型
🤖 Meta豪赌人形机器人
与AR同等规模投资,数十亿美元研发”Metabot”
Meta在人形机器人领域展现雄心,计划进行大规模战略投资。
投资规模与战略:
- 首席技术官博斯沃思透露投入数十亿美元
- 人形机器人项目代号为”Metabot”
- 与AR项目获得同等战略地位
商业模式创新:
- 聚焦软件开发而非硬件制造
- 计划像谷歌Android一样将软件平台授权给制造商
- 打造行业通用标准和生态系统
技术团队建设:
- 新成立”超级智能人工智能实验室”
- 与机器人团队合作构建模拟真实物理规律的”世界模型”
- 前Cruise CEO马克带队,MIT教授金相培等顶尖专家加入
💬 强化学习之父的争议观点
图灵奖得主:大语言模型是错误的起点
图灵奖得主Richard Sutton发表争议性观点,对当前AI发展路径提出质疑。
核心观点阐述:
- 认为大语言模型是一个错误的起点和死胡同
- 强调真正的智能源自经验学习而非对人类的模仿
- 质疑当前主流AI发展方向的可持续性
对大模型的批评:
- 大模型只能预测人类会说什么
- 缺乏预测世界会发生什么的能力
- 没有目标和ground truth,无法对外部世界变化产生惊讶感
智能本质观点:
- 从经验学习出发才能实现真正可扩展的智能
- 经验指的是采取行动、观察结果并学习的过程
- 持续学习和对正确行为的判断是智能的本质
🧠 陈丹琦团队强化学习新方法
RLMT:大模型强化学习的第三条路
陈丹琦团队提出创新的强化学习方法,为大模型训练开辟新路径。
RLMT方法核心:
- “基于模型奖励思维的强化学习”(RLMT)
- 将显式思维链推理融入通用聊天模型
- 弥合专门推理能力与通用对话能力间的差距
技术优势对比:
- 综合了RLHF的偏好对齐和RLVR的推理能力
- 要求模型在生成最终回答前先生成推理轨迹
- 通过奖励模型对回答进行全面评分
实验效果验证:
- 在WildBench、AlpacaEval2和ArenaHardV2等基准测试中表现优异
- 推理风格从线性规划转变为迭代式思考
- 更接近优秀写作者的思维习惯
🎬 DeepMind Veo 3技术突破
从思维链CoT到帧链CoF,视觉领域的GPT-3时刻
谷歌DeepMind在视频生成领域取得重大技术突破。
四层递进能力体系:
- 感知:执行边缘检测、分割等经典视觉任务
- 建模:理解物理定律与抽象关系
- 操纵:图像编辑与3D世界交互
- 推理:解决复杂视觉问题
帧链(CoF)概念创新:
- 类似语言模型的思维链(CoT)
- Veo 3能通过逐帧视频生成实现跨时空推理
- 解决迷宫、序列模式补全等复杂视觉问题
性能评估结果:
- 在七个代表性任务上显著超越Veo 2
- 虽然性能未达完美但大幅进步
- 标志着视觉领域可能迎来”GPT-3时刻”
💰 黄仁勋谈AI未来与英伟达战略
万亿级市场机遇,主权AI时代来临
英伟达CEO黄仁勋在专访中分享对AI未来的深度洞察。
英伟达战略转型:
- 从芯片公司转型为AI基础设施合作伙伴
- 通过”极端协同设计”构建AI工厂生态系统
- 竞争护城河基于总拥有成本优势而非单一芯片
AI市场预测:
- AI推理将迎来”十亿倍”增长
- 三大扩展定律驱动万亿级市场
- 预计年度AI基础设施资本支出达5万亿美元
主权AI时代观点:
- 各国需建立独立AI基础设施
- 主张与中美竞争而非脱钩
- 强调美国应通过技术出口最大化影响力
🏆 今日总结
今日AI行业呈现争议与突破并存的复杂态势:
争议事件:OpenAI的”GPT门”事件暴露了AI服务透明度问题,强化学习之父对大语言模型的批评引发行业深度思考。
技术突破:腾讯混元图像3.0的开源发布、快手KAT系列编程模型的优异表现,以及DeepMind Veo 3的技术创新,展现了AI技术的快速进步。
产业布局:Meta对人形机器人的大规模投资、学而思AI教师分级理论的提出,显示了AI技术向更多领域的深度渗透。
前沿研究:陈丹琦团队的RLMT方法为强化学习开辟新路径,黄仁勋对AI未来的预测描绘了万亿级市场前景。
这些发展共同推动着AI技术在争议中前进,在突破中成熟,为人工智能的未来发展奠定重要基础。
