科技快讯-K 斯坦福具身智能峰会:VLA 模型成为下一代机器人“大脑”共识 在 2 月底结束的斯坦福 AI 实验室峰会上,学者们达成共识:VLA(视觉-语言-动作)大模型将是具身智能的终极方案。与会专家展示了机器人如何通过观看一段 YouTube 烹饪视频,直接理解“切菜”和“翻炒”的动作逻辑并实时模仿。这一突破意味着机器人不再需要繁琐的硬编码编程,而是能通过人类的视听资料自学技能,这对于养老护理和特种作业机器人的普及具有里程碑意义。 生成海报分享 2026-03-01 参与讨论
参与讨论