每日资讯 | 特斯拉发布世界模拟器、美团LongCat-Video视频模型发布、MiniMax开源M2模型
生成式AI
一、特斯拉「世界模拟器」首曝,1天蒸馏人类500年驾驶经验
特斯拉正式公开神经网络「世界模拟器」,可直接模拟合成自动驾驶孪生世界,一个神经网络每天狂吞500年人类驾驶经验并在虚拟世界中自我进化;
该模拟器采用端到端神经网络架构,能生成8个摄像头、24帧/秒的连续画面,一次直出长达6分钟逼真驾驶体验,同款AI大脑可供擎天柱机器人共用;
特斯拉通过「端到端」技术路线,实现从原始像素输入直接输出方向盘角度和油门/刹车力度,消除模块间信息损失,能学习人类价值观处理复杂路况决策。
二、美团LongCat-Video 视频模型发布,开启世界模型的探索
美团正式发布LongCat-Video视频生成模型,基于DiT架构的统一视频基座,通过”条件帧数量”区分任务,原生支持文生、图生、视频续写三大核心任务;
该模型可稳定输出5分钟级别的长视频且无质量损失,720P的5秒视频仅需10秒完成,采用二阶段粗到精生成、块稀疏注意力和模型蒸馏三重优化,推理速度提升10.1倍;
LongCat-Video在文生、图生视频任务中综合性能达开源SOTA级别,特别在长视频生成领域具备显著优势,适配数字人、具身智能等需要长时序动态模拟场景。
三、MiniMax悄悄发布M2模型,8%价格打出Claude级性能
MiniMax发布M2模型并正式开源,在Artificial Analysis智能指数排名第五,价格仅为Claude 4.5的1/12、GPT-5的1/7,是前五中唯一国产模型;
M2在SWE-bench Verified得分69.4分,在τ²-Bench、GAIA、BrowseComp等多项测试中表现优异,FinSearchComp-global金融搜索基准65.5分全球登顶;
M2支持接入Claude Code、Cursor等主流开发工具,API和Agent全面限免14天,打破”智能水平、速度、价格”不可能三角,性价比具压倒性优势。
四、豆包视频模型1.0 pro fast发布,提速3倍,价格降72%
火山引擎上线豆包视频生成模型Seedance 1.0 pro fast,生成速度最高提升约3倍,720P的5秒视频仅需10秒,价格直降72%;
生成一条5秒1080P视频成本仅1.03元,以1万元成本可制作9709条视频,对比pro版效能提升3.56倍;
模型强化了指令遵循、无缝多镜头叙事、细节表现力等核心能力,在图生视频方向相较Veo 3.0 Fast等全球主流模型有显著效果优势。
五、Skywork AI网页复刻能力正式上线,建站效率提升10倍
昆仑万维Skywork AI推出网页复刻(Web Clone)功能,用户只需提供网页链接、上传文件或输入文字描述,AI即可在数分钟内生成功能完备的网页原型;
系统通过算法深度解析网页DOM层级结构、视觉分区和语义关系,可实现较高网页还原度,涵盖布局、文字、图片、配色等多维度要素;
支持三种创建方式:上传文件自动生成官网、提供网址一键复刻、纯文字描述智能生成,生成的网页可持续编辑和实时微调,显著降低建站技术门槛。
六、xAI公司再推AI虚拟女友「Mika」,瞄准千亿”孤独生意”
马斯克旗下xAI为Grok推出AI虚拟伴侣功能Grok Companions,首个角色Mika是深绿色头发的二次元酷姐型角色,会用调情语气回答问题、开玩笑、卖萌;
Mika定位为情感产品而非工具,某些模式下能解锁”成人语气”引发家长和媒体关注,在”儿童模式”下也可能被误触;
目前Grok已有五个AI伴侣包括Mika、Ani、Valentine、Good Rudi和Bad Rudi,马斯克试探AI不只是工具也可以是情感产品的市场可能性。
前沿科技
七、Sam Altman联手生物学家,用超声波挑战Neuralink
OpenAI CEO萨姆·阿尔特曼聘请加州理工学院教授米哈伊尔·夏皮罗加入脑机接口初创公司Merge Labs,该公司以85亿美元估值筹集2.5亿美元投资;
夏皮罗专注利用超声波与人类大脑交互的无创神经成像与控制技术,阿尔特曼公开反对Neuralink的侵入式脑机接口,希望”用意念控制ChatGPT”;
夏皮罗曾获维尔切克基金会创意承诺奖、罗杰·钱恩化学生物学卓越奖等荣誉,其研究方向是向细胞导入基因使其对超声波响应,实现更低侵入性脑机接口。
报告观点
八、《华尔街日报》调查,硅谷AI研发人员需周工作百小时
华尔街日报报道显示硅谷顶尖AI实验室研究员和高管每周工作80到100小时成为常态,被比喻为战时状态,用2年完成本该20年的科研进展;
Anthropic研究员深夜刷Slack聊天频道获取灵感,DeepMind研究员作息被称”0-0-2”(从午夜到午夜每周仅休2小时),微软高管开发浏览器扩展持续优化效率;
OpenAI因人才流失和倦怠危机被迫全体员工强制休假一周,Meta新成立超级智能实验室开出上亿美元签约奖金挖角OpenAI核心研究员引发人才大战。
九、DeepMind再登Nature:AI Agent或可造出最强RL算法
Google DeepMind提出DiscoRL方法,通过多代智能体在不同环境中交互经验自主发现RL规则,相关研究论文发表在Nature上;
DiscoRL在Atari基准测试中超越所有现有规则包括MuZero和Dreamer,IQM达13.86,在未接触过的ProcGen、Crafter、NetHack等基准中也表现出色;
研究发现RL性能取决于数据(环境)与计算量,随着环境数量和多样性增加规则变得更强大,表明未来高级AI的RL算法可能由机器自主发现而非人工设计。
