这些虚拟机器人手臂通过相互训练变得更聪明

喜欢

来源：互联网
|
2023-03-17
|
0 条评论
|
我要分享
|
T小字　 T大字

　　虚拟的机器人手臂已经学会了解决各种各样的难题。堆叠积木，摆放桌子，布置棋子，不必为每项任务进行再训练。它是通过与第二只机器人手臂的比赛来做到这一点的。第二只机器人手臂被训练得越来越难。

　　自我游戏：由研究人员开发OpenAI，同样的机器人手臂--爱丽丝和鲍勃--在没有人类输入的情况下，通过在模拟中玩一个相互对抗的游戏来学习。机器人使用强化学习，在这种技术中，人工智能通过反复训练，在不同的情况下采取什么行动来达到一定的目标。游戏包括在虚拟桌面上移动物体。通过以特定的方式排列对象，Alice试图设置对Bob来说很难解决的谜题。鲍勃试图解决爱丽丝的难题。随着他们的学习，爱丽丝设置了更复杂的谜题，鲍勃更善于解决它们。

　　在对Alice设置的积木拼图进行训练之后，Bob可以概括为一系列任务，包括设置一张桌子和安排棋子。

　　多任务处理：深度学习模式通常需要在任务之间进行再培训。例如，AlphaZero(它也是通过与自己玩游戏来学习)使用一个单独的算法来教自己下国际象棋、shogi和go--但一次只能玩一个游戏。下棋AlphaZero不能玩围棋，围棋不能玩Shogi.建造真正能够多任务的机器是一个尚未解决的大问题。走向更普遍的人工智能之路.

　　大赦国际：一个问题是将人工智能训练成多任务需要大量的例子。OpenAI通过训练Alice为Bob生成示例来避免这种情况，使用一个AI来训练另一个AI。爱丽丝学会了设定目标，比如建造一座积木塔，然后捡起它，平衡它。Bob学会了使用(虚拟)环境的属性(如摩擦)来抓取和旋转对象。

　　虚拟现实：到目前为止，这种方法只在仿真中进行了测试，但是OpenAI和其他地方的研究人员正在更好地将在虚拟环境中训练过的模型转移到物理环境中。一个模拟让AIS在短时间内通过大型数据集，然后再对真实世界的设置进行微调。

　　研究人员说，他们的最终目标是训练一个机器人来解决一个人可能要求它完成的任何任务。就像GPT-3，一种能以多种不同方式使用语言的语言模型，这些机器人手臂是OpenAI构建多任务人工智能的总体雄心的一部分。使用一个人工智能来训练另一个人工智能可能是其中的一个关键部分。

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186