Home
avatar

taoleb

每日AI新闻速递-10月18日:谷歌Veo 3.1对标Sora 2用户狂刷2.75亿条,Claude Haiku 4.5成本降三分之一性能超Sonnet 4

每日AI新闻速递-10月18日

🏆 今日总结

今日AI领域重磅更新:

谷歌Veo 3.1对标Sora 2强势发布:谷歌发布视频生成模型Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控功能,支持720p或1080p分辨率24fps视频,原生时长4-8秒,使用Extend功能最长可扩展至148秒,可合成多人物场景并实现音画同步。用户已在Flow中生成超过2.75亿个视频,虽然成片质感较Veo 3进步有限,但基础物理表现有所改善。

Anthropic推出轻量级Claude Haiku 4.5:Anthropic发布轻量级模型Claude Haiku 4.5,编码性能可与Claude Sonnet 4相媲美,成本仅为其三分之一(每百万输入token 1美元,输出5美元),推理速度提升一倍多。在计算机使用基准OSWorld上得分50.7%超越Sonnet 4的42.2%,数学推理测试中借助Python工具成绩高达96.3%远超Sonnet 4的70.5%,主打实时低延迟任务场景。

阿里千问上线Memory功能让AI拥有记忆:阿里通义千问正式上线Qwen Chat Memory功能,让AI能够记录并理解用户在过去对话中的重要信息,包括个人偏好、兴趣方向或特定任务背景。该功能可跨越多轮甚至多天对话保留个性化认知,与仅依靠上下文窗口的短期记忆不同,是AI助手向长期陪伴型智能体迈出的关键一步。

字节豆包语音合成2.0实现情境理解:火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0,通过Query-Response能力实现情境理解与语气把控,可通过细节描述精准生成对应情感。语音合成2.0提供默认模式、语音指令和引入上文三种模式,声音复刻2.0可精准复现米老鼠、小沈阳等动漫人物和真人音色,对公式朗读测试准确率接近90%。

谷歌×耶鲁联手发布抗癌AI神器:谷歌与耶鲁大学联合发布270亿参数大模型Cell2Sentence-Scale(C2S-Scale),基于Gemma模型构建,提出并验证让肿瘤对免疫系统更易被识别的全新抗癌假设。模型通过双环境虚拟筛选流程对4000多种药物进行模拟,发现激酶CK2抑制剂silmitasertib仅在免疫信号活跃环境中显著增强抗原呈递,该预测已在体外实验中多次验证。

Anthropic预训练负责人谈平衡问题:Anthropic预训练团队负责人Nick Joseph强调预训练核心是推动损失函数下降,如何平衡预训练和后训练、各自作用叠加还是互补仍在早期探索阶段。当前AI研究最大瓶颈是计算资源受限而非算法突破,真正的挑战在于如何有效利用算力并解决规模扩展中的工程难题。

LangChain联合Manus深度解析上下文工程:LangChain创始工程师Lance Martin与Manus联合创始人季逸超深入探讨上下文工程,强调AI Agents执行复杂长期任务时上下文窗口会因大量工具调用急剧膨胀导致性能下降。有效的上下文工程通过卸载、精简、检索、隔离和缓存等技术,将恰到好处的信息填入上下文窗口。

谷歌142页报告揭秘开发者AI使用现状:Google Cloud DORA 2025报告显示90%开发者已在日常工作中使用AI,每天中位数使用时长2小时约占工作日四分之一,但只有24%表示高度信任AI输出。AI不是单向效率药丸而是放大镜,在文化健康协作顺畅团队中作为加速器提升效率,但在环境存在问题的团队会放大裂缝导致交付更加不稳定。

黄仁勋对话红杉美国谈AI工厂资本逻辑:黄仁勋回顾1993年红杉100万美元投资NVIDIA,三十年后成长为超过1万亿美元市值实现100万倍回报,强调从第一性原理推演未来是突破关键。CUDA的诞生让GPU从图形设备变成通用加速平台,2012年AlexNet在ImageNet竞赛获胜成为转折点。AI工厂核心是系统整合而非芯片性能,未来的国家AI战略将是进口加自建的混合模式,主权AI成为新一轮国家竞争核心。

AI新闻 谷歌 Veo 3.1 Sora 2 视频生成 Anthropic Claude Haiku 4.5 阿里 千问 Memory 字节 豆包 语音合成 抗癌AI LangChain 上下文工程 黄仁勋 NVIDIA 红杉