科技 technology
您现在的位置:首页 > 科技 > Google利用计算机视觉来改善机器人操纵性能

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

Google利用计算机视觉来改善机器人操纵性能

发布时间:2020/03/24 科技 浏览:344

 
在预印本文件中,Google和MIT小组研究了是否可以使用预先训练的视觉表示来改善机器人的对象操纵性能。他们说,他们提出的技术-基于能力的操纵-可使机器人在不到10分钟的尝试和错误中学会拾取和抓住物体,这可能为高度适应性强的仓库机器人奠定基础。
基于支付能力的操纵是将操纵任务重新构造为计算机视觉任务的一种方式。它不是将像素引用到对象标签,而是将像素与动作值相关联。由于计算机视觉模型和收费模型的结构相对相似,因此可以将迁移学习中的技术应用于计算机视觉,以使收费模型能够以更少的数据更快地学习-大概就是这样。
为了对此进行测试,团队将各种流行的计算机视觉模型的“主干”(即负责早期图像处理的权重(或变量),例如过滤边缘,检测角点和区分颜色)注入了基于支付能力的在视觉任务上预先训练的操作模型。然后,他们给一个现实世界的机器人赋予任务,使其学习通过反复试验来掌握一组物体。
MIT Google AI机器人抓取
最初,与从头开始训练收费模型相比,并没有明显的性能提升。但是,从骨干和头部转移权重(包括在后期处理中使用的权重,例如识别上下文线索并执行空间推理)后,训练速度有了实质性的提高。在仅500次尝试和错误掌握尝试中,抓取成功率就达到了73%,而在1000次尝试中就达到了86%。在训练过程中看不到的新对象上,具有预先训练的骨干和头部的模型更好地泛化,仅骨干的抓握成功率为83%,骨干和头部的抓握成功率为90%。
该团队认为,重用需要对象定位(例如实例分割)的视觉任务的权重可以显着改善学习操纵任务时的探索过程。任务中经过预训练的权重鼓励机器人对看起来更像对象的事物进行动作采样,从而快速生成更加平衡的数据集,系统可以从中获知良好和不良抓握之间的区别。
该研究的共同作者写道:“我们今天用于端到端机器人学习的许多方法实际上与用于计算机视觉任务的方法相同。” “我们在视觉预训练方面的工作阐明了这种联系,并表明可以利用视觉预训练中的技术来提高应用于机器人抓紧任务的基于能力的操纵的学习效率。尽管我们的实验指向对机器人深度学习的更好理解,但仍有许多有趣的问题尚待探索。例如,我们如何利用大规模的预训练来实现其他传感模式(例如力力矩或触觉)?我们如何将这些预训练技术扩展到更复杂的操作任务上,而这些任务可能不像抓握那样以对象为中心?这些领域是未来研究的有希望的方向。”