
本文介绍了清华大学交叉信息研究院的研究者提出的「ViLa」(全称Robotic Vision-Language Planning)算法,该算法能在复杂环境中控制机器人,实现任务规划。文章指出,虽然GPT-4V已经能够设计网站代码并控制浏览器等虚拟数字世界应用,但如果将其应用于控制机器人,可能会产生一些有趣的结果。ViLa算法利用GPT-4V在视觉和语言方面的联合推理能力,将抽象的语言指令转化为可执行的步骤,为机器人操作提供任务规划。如果您想阅读原文,请查看【当GPT-4V充当机器人大脑,可能你都没AI会规划】的链接。如有任何疑问,请联系文章作者almosthuman2014。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...