
本文摘要来自机器之心,介绍了微软提出的使用GPT-4V和人类演示来训练机器人的新方法。通过GPT-4V解析视频动作,生成行为表述作为任务列表,从而实现训练机器人的目的。这种方法绕过了传统收集数据和训练模型的过程,展示了灵活性和适应性,特别是在结合通用视觉大模型(如GPT-4V)的情况下。这种方法为开发基于多模态人类指令的任务规划器提供了可能性。若想详细了解请查看原文链接:用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上。如有疑问或需要进一步了解,请联系机器之心的作者,微信号:almosthuman2014。