您的位置: 首页 >> 云计算

伯克利和Deepmind前赴后继只为教出

2019.12.03 来源: 浏览:3次

伯克利和Deepmind前赴后继,只为教出会做家务的机器人

新年伊始,伯克利就传出新进展,他们教机器人做家务的能力更上一层楼了

在最新的论文中,伯克利介绍了他们是如何让机器学会读懂人类的潜台词或未尽之意,而不是傻乎乎地依照字面意思或者奖励系统来机械地运动

举个例子,当餐桌机器人上菜时,它会知道躲避酒柜,或者在停电等紧急情况下停止端盘子,而不是为了尽量多地得到奖赏(端一个盘子系统会提供一个奖励),而马不停蹄地送盘子甚至还可能直接把盘子打碎,这样就可以获得更多的盘子(奖励)了

反正我看到这个时,第一反应是机器人可真笨啊,这么简单的任务我两岁的小侄子都会做第二反应是伯克利教机器人做家务的执念也未免太深了吧

之前还开发过引擎教机器人铺床单、叠衣服、收拾桌面,总之,非要让机器人搀和家务这件事不可

想要挑战家务技能的除伯克利,还有Deepmind去年2月,Deepmind就提出了一种新的学习范式计划辅助控制SAC-X,来帮助机器人学会整理桌子和堆叠衣物

前不久佐治亚理工学院的研究人员,也发表了新的强化学习算法,可以教会机器人穿衣服

为何这么多AI巨头不约而同地走上了家务培训的道路未来我们能拥有《底特律》中卡拉小姐姐那样温柔能干的家政机器人吗本文就来尝试解释一下这些疑惑

家务三十六计:家政机器人都掌握了哪些技能

首先我们来看看,在这么多人类学霸、AI巨头的助攻下,机器人都学会了哪些家务小技能

先来说说家政狂魔伯克利

早在去年,我们就解读过伯克利的通用预测模型,它可以帮助机器人自主学习和掌握很多通用基础技能,在此基础上学习和预测主人的意图和任务的共性,从而可以举一反三履行广泛的任务种别,成长为一个优秀的家务多面手比如折叠短裤毛巾、挪移苹果、整理桌面等等

伯克利还推出了一个深度学习模型Dex-NET,基于角点检测和抓取策略,让机器人完成铺床单这一艰巨任务

最值得一提的是新的研究成果偏好优化模型机器人不但能完成通用任务,而且还能够推断出更优解,适应带有隐藏条件的复杂现实环境

比如在常规的actor-critic增强学习反馈机制中,主人要求机器人导航前往紫色的门,那么机器人就会选择最短路径(传统意义上的最优解),而疏忽这么做会打碎路上的花瓶

因为机器人无法获知,主人是不是关心花瓶会不会被打碎但如果机器人能自己模拟和演练过去发生过的行为轨迹,比如主人一直都绕着花瓶走,说明她是重视花瓶的完整状态的,由此推断出绕过花瓶是最有可能获得嘉奖、应该积极寻求的目标

机器人具有洞察隐藏条件的能力

,意味着它们可以从一种状态中学习人类的偏好,系统无需事无巨细地列出所有现实环境中的因果联系和条件,奖励函数也不再是线性机械的,机器人可以自主摹拟和学习过去的经验,判断和应对未知的动态环境

对于做家务这个任务来讲,判断主人的喜好来进行作业,可以说是必杀技了

与伯克利相比,Deepmind其实对医疗这类高精尖任务更感兴趣但这其实不妨碍它在家政领域发光发热

Deepmind的计划辅助控制SAC-X模型,就旨在帮助机器人学会探索和掌握家务方面的基本技能就像婴儿在爬行和走路之前必须发展出协调和平衡能力一样,SAC-X也有助于帮助机器掌握几种核心的视觉-运动技能

比如运用摹拟手臂,依照正确的顺序,即便没有见过这各任务,也能从零开始学习,并按要求顺利地把物体举起来这样就能在无需额外编程的前提下,完成整理桌面这样的复杂任务

另外,乔治亚理工学院将布料引入学习框架,教机器人学会穿衣服的论文也非常别出心裁

由于衣服的布料材质各不相同,穿衣服的动作也无法遵循特定的运动轨迹,会和布料产生复杂的交互变化,机器人必须不断练习,对各个子任务(拽起边沿、扯平衣角等)进行模拟和优化,在不断变化的环境条件中学习到稳定的创意控制策略,终究完成穿不同衣服的任务目标不管衬衫、套头毛衣,还是外套,都是妥妥滴

听起来,好像大部分家务活儿机器人都可以驾驭嘛,但杯具的是,现实中能够见到的家务机器人,干起活来仍然是一副又慢又笨的蠢模样

比如由伯克利设计、Rethink Robotics公司开发的家庭助手,叠一个毛巾就要15分钟;而加州 FoldiMate推出的智能洗叠机器,可以按照程序把衣服叠成需要的方块,但需要人手动放置在展台上,并没有节省多少人力,售价还高达980美金(约7000块人民币)emmmm还是自己动手丰衣足食吧

不是比人慢,就是比人贵,靠机器人做家务性价比实在是太低了那末,既然不能真的帮人类做家务,教机器人学习这些技能,究竟有何意义

为什么是做家务,去工厂搬砖不行吗

这么多研究人才齐上阵,要是去教小学生,怕是都能考上清华了实在不行,去工厂搬砖也能缓解下劳动力紧张啊,干嘛非要跟家务活儿较劲呢

原因恐怕在于,家政任务提供了一个从零开始学习复杂控制任务的训练环境,这对通用机器智能来说至关重要

首先,家政任务的真实性和多样性,有助于智能体学会如何用最少的先验知识来解决复杂问题

先验知识指的是一种不依赖于经验总结(类似编写好的程序,从结果推导过程)的一种元能力,通过视察学会推理和判断而机器人就没有这类天生的知识,但显然我们也不可能将机器人服务的每个家庭、每一个可能任务都进行预先编程,这时,训练机器人的通用能力就显得尤为关键了

虽然机器永久不可能拥有像人一样的先验能力和通用性,在各个学科、各个工作岗位都能表现差不多但在很多垂直领域,比如工业、家务、语言等,先验能力强的机器智能体就可以低成本、高适应性、灵活地完成工作任务,解决那些现在只有人才能解决的问题

另外,家政任务是一个集视觉、触觉、运动、关节控制等为一体的任务,综合性很强,这是其他碎片应用不具备的环境,对训练多元功能协作的智能体很有帮助

比如伯克利教机器人从垃圾桶中拾取原本看不见的物体,就需要通过摄像头收集深度图像,构成摹拟数据集,再利用该数据集训练质量卷积神经络(GQ-CNN),对物体进行图像分割,肯定抓取尝试成功的可能性,最后构成抓取成功几率最高的策略,再对夹持器关节进行实时精密控制,才能最终完成这1操作一次训练,多种收获

更重要的是,家务的操作环境比起工业机器人、电子游戏等,都更加疏松,充满变化,任务的主观预期和隐藏含义更难界定和预测,无形中加大了训练难度与此同时,家政任务的训练本钱也比较低,也更容易为大众所理解,社会效益和营销价值双丰收

相比对机器狗拳打脚踢、在《Dota》中血虐真人玩家,让机器做做家务简直可谓是最政治正确、价廉物美的训练方式了

醉翁之意:做完家务,这些研究还有甚么用

在家政机器人背后,实际隐含的是一种智能体创生的本质逻辑:在复杂的环境中自己探索出解决随机和非结构化问题的合理方案,可以安全地与环境交互,同时高效地完成任务

具体一点说,训练家政机器人,主要有一下三个方面的好处:

一是培养更具有通用智能的机器人,在不需要过量指导的条件下,执行一系列任务,提高机器自动化的安全性和工作效率

2是有助于开发用于分层计划、感知和推理的算法,可以帮助自动驾驶、工业自动化、智能物联等等领域解决应用问题;

三是推动零样本学习、少样本学习等技术的进步在缺少外部奖励信号的情况下,算法也能很好地推理出行为的意图,可以显著提升电商、内容产品推荐系统的使用体验

这样,大家恐怕就不难理解,为什家务会成为通用智能体成长道路上无法绕过的垫脚石了

最后可能还有人想问:不爱做家务星人,我只关心机器人啥时候能进我家给我叠被铺床我只能说:亲亲这边建议直接睡觉呢梦里什么都有~

一岁宝宝怎么不爱吃饭

宝宝健脾胃食谱

孩子老流鼻血

上海治疗不射精症医院

莱芜治疗性病费用

平顶山治疗前列腺炎费用

海口市癫痫病医院哪家好
南昌专治癫痫病医院在哪
南阳治疗附睾炎哪个医院好
Tags:
友情链接