旋转
在由埃隆·马斯克和其他几个硅谷知名人士共同创建的OpenAI实验室中,研究人员制造了一款名为 Dactyl 的机械手臂。它看起来很像最新的星球大战电影中的卢克·天行者的机械假体:它的机械手指能够像人的手指一样弯曲或伸直。
你可以让Dactyl为你展示字母积木的某一面——比方说红色的O,橙色的P或蓝色的I——它会向你展示,然后用灵活的方式旋转、扭动和翻转积木。
图:Dactyl机械手展示字母积木(2倍速播放)
这对于人类来说非常简单,但对于一台机器来说,这是一个非常了不起的成就:机械手臂Dactyl在很大程度上是靠自己来学习如何完成这项任务的。研究人员利用数学的方法让Dactyl学习,他们相信可以通过训练让机械手臂和其他机器来完成更复杂的任务。
图:Dactyl机械手(1倍速播放)
这只灵巧的手臂代表了过去几年机器人研究的巨大飞跃。但直到最近,研究人员仍在努力让更简单的机械手臂来掌握更简单的任务。
抓取
这个系统是由加州大学伯克利分校的机器人实验室Autolab的研究人员创建的,它在几年前代表了技术的极限。机器配有一个两根手指的“钳子”,可以拿起像螺丝起子或钳子一样的物件,然后把它们分类到不同容器里。
图:Autolab研发的机械手(2倍速播放)
钳子比五个手指更容易控制,而制造一个操作夹钳所需的软件也不那么困难。它可以处理一些不太熟悉的物体。比如,它可能不知道什么是餐馆式的番茄酱瓶子,但是它知道瓶子的形状和螺丝起子类似。但是,如果这台机器遇到的东西与它之前所遇到的不同——比如一个塑料手镯——可能就会处理的不太好。
图:Autolab研发的机械手(2倍速播放)
拾取
大家都希望有一个能捡起任何东西的机器人,包括它以前从未见过的东西。这是其他Autolab的研究人员在过去几年里所建立的机器人。
图:Autolab研发的机械手(2倍速播放)
这个系统仍然使用简单的硬件:一个夹子和一个吸盘。但它可以捡起各种各样的随机物品——从剪刀到塑料玩具恐龙。
图:机械手捡拾物品(2倍速播放)
该系统得益于机器学习的巨大进步。伯克利的研究人员对超过1万个物体的物理模型进行了建模,确定了每一个物体的最佳选择。然后,系统使用神经网络算法分析了所有这些数据,并学会了识别每个物品的最佳方式。在过去,研究人员必须对机器人进行编程,让它们完成每项任务。但现在,它可以自己学习这些任务。
图:机械手捡拾物品(2倍速播放)
当面对一个塑料尤达玩具时,系统会意识到它应该用钳子把玩具捡起来。但当它遇到番茄酱瓶子时,它会选择吸杯。这个机械手可以成功地捡起多件随机物品。
图:机械手捡拾物品(2倍速播放)
它并不完美,但是由于系统可以自己学习,它的进步速度比过去的机器快得多。
图:机械手捡拾物品(2倍速播放)
铺床
伯克利的研究人员利用最新的机器学习技术,在短短两周的时间内就整合完成了可以铺床的机器人系统。这个机器人也许还不能完美地完成医院的工作,但它已经代表了显著的进步。
图:机器人模拟铺床(2倍速播放)
现在,只要通过分析数据,这个系统就可以在一小段时间内学会铺床。在学习时,系统会分析铺床过程中的每一个动作。
图:机器人模拟铺床(2倍速播放)
移动
在伯克利的BAIR实验室里,另一个系统正在应用其它的学习方法。这个机械手臂可以用一个夹子推动物体,并预测它应该在的位置。这意味着它可以像你我一样把玩具移到桌子上。
图:机器人移动物体(2倍速播放)
这个系统通过分析大量的视频图像来学习这种行为,这些图像显示了物体是如何被移动的。通过这种方式,它可以处理这种任务带来的不确定性以及一些意想不到的动作。
图:机器人移动物体(2倍速播放)
未来
这些都是简单的任务,而且机器只能在特定条件下处理它们。它们失败的次数并不比成功的次数少。但驱动这些系统的机器学习方法表明,在未来几年内将会继续取得很大的进步。
和OpenAI的研究人员一样,华盛顿大学的研究人员正在训练机器手臂,这些机械手臂拥有与人类相同的手指和关节。
图:研究人员正在训练机械手臂(2倍速播放)
这比训练一个夹钳或吸盘要困难得多,一个模拟人类的手应该能够以多种不同的方式移动。因此,华盛顿的研究人员通过模拟周围的环境来训练他们的机器手臂。
图:研究人员正在训练机械手臂(2倍速播放)
在OpenAI,研究人员正在以同样的方式训练他们的 Dactyl 机械手,这个系统旋转字母积木的过程积累了大约100年的训练经验。这一数字模拟在成千上万的计算机芯片上同时运行,得以将训练时间压缩到两天。它通过反复的尝试和犯错来学习这些任务。一旦它了解了模拟时的工作原理,它就可以将这些知识应用到现实世界中。
图:研究人员正在训练机械手臂(2倍速播放)
许多研究人员质疑这种模拟训练是否使成果只停留在理论层面,但就像伯克利和其他实验室的研究人员一样,OpenAI团队已经证明了这一点。他们在模拟训练中引入了一定的随机性——它们改变了手和木块之间的摩擦力,甚至改变了模拟的重力。在模拟的世界中,学会处理这种随机性后,机械手就可以处理真实世界的不确定性。
今天,Dactyl所能做的只是旋转一个方块,但研究人员正在探索如何将这些技术应用于更复杂的任务。比如制造业,无人驾驶飞机,甚至是无人驾驶汽车。