taoleb

每日资讯 | 特斯拉发布世界模拟器、美团LongCat-Video视频模型发布、MiniMax开源M2模型

2025-10-28 凌晨一点字 0分钟 AI技术

生成式AI

一、特斯拉「世界模拟器」首曝，1天蒸馏人类500年驾驶经验

特斯拉正式公开神经网络「世界模拟器」，可直接模拟合成自动驾驶孪生世界，一个神经网络每天狂吞500年人类驾驶经验并在虚拟世界中自我进化；
该模拟器采用端到端神经网络架构，能生成8个摄像头、24帧/秒的连续画面，一次直出长达6分钟逼真驾驶体验，同款AI大脑可供擎天柱机器人共用；
特斯拉通过「端到端」技术路线，实现从原始像素输入直接输出方向盘角度和油门/刹车力度，消除模块间信息损失，能学习人类价值观处理复杂路况决策。

二、美团LongCat-Video 视频模型发布，开启世界模型的探索

美团正式发布LongCat-Video视频生成模型，基于DiT架构的统一视频基座，通过”条件帧数量”区分任务，原生支持文生、图生、视频续写三大核心任务；
该模型可稳定输出5分钟级别的长视频且无质量损失，720P的5秒视频仅需10秒完成，采用二阶段粗到精生成、块稀疏注意力和模型蒸馏三重优化，推理速度提升10.1倍；
LongCat-Video在文生、图生视频任务中综合性能达开源SOTA级别，特别在长视频生成领域具备显著优势，适配数字人、具身智能等需要长时序动态模拟场景。

三、MiniMax悄悄发布M2模型，8%价格打出Claude级性能

MiniMax发布M2模型并正式开源，在Artificial Analysis智能指数排名第五，价格仅为Claude 4.5的1/12、GPT-5的1/7，是前五中唯一国产模型；
M2在SWE-bench Verified得分69.4分，在τ²-Bench、GAIA、BrowseComp等多项测试中表现优异，FinSearchComp-global金融搜索基准65.5分全球登顶；
M2支持接入Claude Code、Cursor等主流开发工具，API和Agent全面限免14天，打破”智能水平、速度、价格”不可能三角，性价比具压倒性优势。

四、豆包视频模型1.0 pro fast发布，提速3倍，价格降72%

火山引擎上线豆包视频生成模型Seedance 1.0 pro fast，生成速度最高提升约3倍，720P的5秒视频仅需10秒，价格直降72%；
生成一条5秒1080P视频成本仅1.03元，以1万元成本可制作9709条视频，对比pro版效能提升3.56倍；
模型强化了指令遵循、无缝多镜头叙事、细节表现力等核心能力，在图生视频方向相较Veo 3.0 Fast等全球主流模型有显著效果优势。

五、Skywork AI网页复刻能力正式上线，建站效率提升10倍

昆仑万维Skywork AI推出网页复刻(Web Clone)功能，用户只需提供网页链接、上传文件或输入文字描述，AI即可在数分钟内生成功能完备的网页原型；
系统通过算法深度解析网页DOM层级结构、视觉分区和语义关系，可实现较高网页还原度，涵盖布局、文字、图片、配色等多维度要素；
支持三种创建方式：上传文件自动生成官网、提供网址一键复刻、纯文字描述智能生成，生成的网页可持续编辑和实时微调，显著降低建站技术门槛。

六、xAI公司再推AI虚拟女友「Mika」，瞄准千亿”孤独生意”

马斯克旗下xAI为Grok推出AI虚拟伴侣功能Grok Companions，首个角色Mika是深绿色头发的二次元酷姐型角色，会用调情语气回答问题、开玩笑、卖萌；
Mika定位为情感产品而非工具，某些模式下能解锁”成人语气”引发家长和媒体关注，在”儿童模式”下也可能被误触；
目前Grok已有五个AI伴侣包括Mika、Ani、Valentine、Good Rudi和Bad Rudi，马斯克试探AI不只是工具也可以是情感产品的市场可能性。

前沿科技

七、Sam Altman联手生物学家，用超声波挑战Neuralink

OpenAI CEO萨姆·阿尔特曼聘请加州理工学院教授米哈伊尔·夏皮罗加入脑机接口初创公司Merge Labs，该公司以85亿美元估值筹集2.5亿美元投资；
夏皮罗专注利用超声波与人类大脑交互的无创神经成像与控制技术，阿尔特曼公开反对Neuralink的侵入式脑机接口，希望”用意念控制ChatGPT”；
夏皮罗曾获维尔切克基金会创意承诺奖、罗杰·钱恩化学生物学卓越奖等荣誉，其研究方向是向细胞导入基因使其对超声波响应，实现更低侵入性脑机接口。

报告观点

八、《华尔街日报》调查，硅谷AI研发人员需周工作百小时

华尔街日报报道显示硅谷顶尖AI实验室研究员和高管每周工作80到100小时成为常态，被比喻为战时状态，用2年完成本该20年的科研进展；
Anthropic研究员深夜刷Slack聊天频道获取灵感，DeepMind研究员作息被称”0-0-2”(从午夜到午夜每周仅休2小时)，微软高管开发浏览器扩展持续优化效率；
OpenAI因人才流失和倦怠危机被迫全体员工强制休假一周，Meta新成立超级智能实验室开出上亿美元签约奖金挖角OpenAI核心研究员引发人才大战。

九、DeepMind再登Nature：AI Agent或可造出最强RL算法

Google DeepMind提出DiscoRL方法，通过多代智能体在不同环境中交互经验自主发现RL规则，相关研究论文发表在Nature上；
DiscoRL在Atari基准测试中超越所有现有规则包括MuZero和Dreamer，IQM达13.86，在未接触过的ProcGen、Crafter、NetHack等基准中也表现出色；
研究发现RL性能取决于数据(环境)与计算量，随着环境数量和多样性增加规则变得更强大，表明未来高级AI的RL算法可能由机器自主发现而非人工设计。