每日AI新闻速递-9月23日:联发科天玑9500芯片发布,谷歌革新Agent思考范式,OpenAI算力投入创新高
每日AI新闻速递-9月23日
🔥 今日头条:硬件软件双突破,AI产业进入新阶段
联发科天玑9500:旗舰AI芯片性能飞跃
联发科正式发布新一代旗舰5G智能体AI芯片天玑9500,标志着移动AI芯片进入新时代。
核心技术突破:
- 采用第三代3nm工艺和全大核架构
- 集成超过300亿晶体管
- NPU性能较上代提升111%,功耗降低56%
- 首次引入存算一体设计和BitNet 1.58bit量化推理框架
- 支持端侧模型训练能力
应用场景升级:
- 支持128K长文本处理
- 4K画质图像生成
- vivo和OPPO等厂商旗舰新机将搭载该芯片
- 实现个性化AI场景应用
OpenAI算力投入创历史新高
奥特曼预告即将推出”计算密集型”新产品,但Pro用户也需额外付费,引发用户关注。
投入规模惊人:
- 已投入160亿美元租用计算资源
- 计划2024-2030年间投入3500亿美元租赁服务器
- 2030年单年预计花费1000亿美元
- 与甲骨文签署5年3000亿美元算力合同
- 追加1000亿美元用于备用服务器
行业意义:
- 打破传统科技巨头研发成本仅占收入10%-20%的规模
- 显示AI发展对算力需求的爆炸式增长
- 为下一代AI产品奠定基础设施基础
🚀 模型技术重大突破
谷歌革新Agent思考范式
谷歌开源新Deep Research框架,突破传统AI代理思考模式。
创新思路:
- 突破传统”规划-检索-生成”模式
- 采用像人类专家一样先打草稿再迭代修正的方法
- 使用”扩散式降噪”过程
- 让Agent基于草稿发现信息缺口,从外部搜寻证据
技术优势:
- 引入多版本智能自我批判技术
- 报告级降噪技术
- 在GAIA等任务上全面优于OpenAI DeepResearch
- 已在Google Agentspace可试用
DeepSeek发布V3.1终极版
DeepSeek发布模型DeepSeek-V3.1的终极(Terminus)版本,针对用户反馈进行优化。
核心改进:
- 缓解中英文混杂、异常字符等语言一致性问题
- 进一步优化Code Agent与Search Agent表现
- 已在官方App、网页端、小程序与API同步上线
- 开源版本可在Hugging Face和ModelScope平台下载
美团推出高效推理模型
美团LongCat团队发布高效推理模型LongCat-Flash-Thinking,在速度与能力间找到完美平衡。
技术创新:
- 首创领域并行强化学习训练方法
- 采用异步弹性共卡系统实现三倍提速
- 设计双路径推理框架提升智能体能力
- 在逻辑、数学、代码和智能体等多领域达到全球开源模型先进水平
性能表现:
- 在AIME和LiveCodeBench测试中与GPT-5等顶级闭源模型表现相当
- 形式化推理能力在MiniF2F-test基准上大幅领先所有参评模型
🎬 视觉AI应用重大突破
可灵AI 2.5:动作戏生成达到封神水平
可灵2.5视频模型在运动能力和表情表演方面实现重大突破。
核心能力:
- 准确表现人物微表情变化与复杂情绪
- 维持不同场景下的角色一致性
- 完美衔接下落、奔跑、骑摩托等连续动作
- 保持环境交互的真实感细节
- 理解复杂的因果关系
应用突破:
- 在动作戏生成上表现极佳
- 能生成高质量跑酷、跨越、战斗和爆炸场景
- 连续性和物理真实感大幅提升
- 已对超级创作者灰度内测
百度开源视觉理解模型
百度智能云千帆发布视觉理解模型Qianfan-VL并全面开源。
产品规格:
- 提供3B、8B和70B三种规格
- 支持OCR识别和教育垂类场景
- 由百度团队基于开源模型开发
- 在自研昆仑芯P800上完成全流程计算
技术特色:
- 具备思维链能力
- OCR全场景识别
- 复杂版面文档理解能力
- 支持单任务5000卡规模并行计算
- 在多项基准测试中表现优异
🌟 行业观点与趋势
2025年度科技创新35人亚太区名单发布
《麻省理工科技评论》公布2025年度”35岁以下科技创新35人”亚太区入选名单。
入选特点:
- 共35位创新者来自AI、机器人、材料等领域
- 夏斐、閔世媛等多位入选者在人工智能领域取得突破
- 涵盖具身智能、非参数大语言模型等前沿方向
- 中国入选者最多,截至2024年共82人入选
- 反映亚太地区从技术追随向创新引领的变化趋势
图像生成模型发展前瞻
Nano Banana核心团队分享对图像生成模型未来发展的深度思考。
发展趋势:
- 图像模型将像LLM一样从创意工具转变为信息查询工具
- 最大挑战是把LLM的”世界知识”融入图像模型
- 现有模型质量”上限”已接近顶点,但”下限”仍有巨大提升空间
- 未来发展将专注于提高”模型可表达性”和复杂场景表现
交互演进:
- 未来交互界面将整合文本、图像、语音等多种模态
- 用户对一步到位生成”成品”的期望不切实际
- 专业工作流程中AI模型与传统工具将长期共存
📊 今日总结
今日AI行业呈现硬件、软件、应用全面突破的态势:
硬件层面:联发科天玑9500芯片NPU性能提升111%,为移动AI应用奠定强大基础
模型层面:谷歌、美团、百度、DeepSeek等厂商在不同方向实现技术突破
应用层面:可灵AI 2.5在视频生成领域达到新高度
投入层面:OpenAI巨额算力投入显示AI发展的决心和规模
趋势层面:从创意工具向信息查询工具转变,多模态交互成为未来方向
这些发展预示着AI技术正进入新的发展阶段,从单点突破向全面融合演进,为各行各业的智能化转型提供更强大的技术支撑。
