科技 technology
您现在的位置:首页 > 科技 > Google AI研究人员使用人体模型挑战YouTube视频来改善深度预测

科技

云如何重塑最终用户计算 云如何重塑最终用户计算

  在当今世界,许多组织已将公共云服务纳入其工作区策略。常见的情况是,Salesforce用于CRM,Slack...

  • 防止物联网数据泄露的终极清单

      那些记得那些没有全球网络的往昔的人,仍然可以回想起一直都不可用的感觉。但是,Z世代将永远不会拥有这种特权,因为几乎从出生那天起,互联网就已经成为他们生活的一部分。 物联网的力量 一个流行的定义...

  • Yeti X为流行的USB麦克风带来了实时液位监控

      很明显,罗技(Logitech)在2018年7月收购了Blue的原因。自2005年发布第一台Snowball以来,南加州的音频公司(顺便说一句为“ Baltic Latvian Universal Electronics”的缩写)就已经成为USB麦克风的代名词。 从...

  • 本世纪最强的超级台风哈吉比斯即将袭击日本-取消了...

      我窗外的东京街道目前正变得安静一些,但在日本首都绝对没有恐慌感。台风在日本很普遍,其基础设施的建设可抵御每年的常规风暴。 本周末日本有两项重大体育赛事;橄榄球世界杯现已取消两场比赛。英格兰与法...

Google AI研究人员使用人体模型挑战YouTube视频来改善深度预测

发布时间:2019/05/24 科技 浏览:116

 

据悉,谷歌人工智能研究人员今天表示,他们使用2,000个“人体模型挑战”YouTube视频作为训练数据集来创建一个能够根据运动视频进行深度预测的人工智能模型。这种理解的应用可以帮助开发人员在手持相机和3D视频拍摄的场景中制作增强现实体验。

人体模型的挑战要求一群人在一个人拍摄视频时基本上表现得像时间一样停滞不前。研究人员在一篇名为“通过观察冰冻人物学习移动人的深度”的论文中表示,这提供了一个数据集,可以帮助检测摄像机和视频中人物移动的视频中的景深。

研究科学家Tali Dekel和工程师Forrester Cole在一篇博客中说:“虽然最近使用机器学习进行深度预测有所激增,但这项工作是第一个针对同时摄像机和人体运动的情况定制基于学习的方法。”今天发布。

谷歌的研究人员表示,这种方法优于制作深度图的最先进工具。

“就人们在视频中保持静止而言,我们可以假设场景是静态的,并通过运动结构(SfM)和多视图立体声(MVS)算法处理它们来获得准确的相机姿势和深度信息。 ,“报纸上写道。 “因为包括人在内的整个场景都是静止的,我们使用SfM和MVS估计相机的姿势和深度,并使用这个衍生的3D数据作为训练的监督。”

为了制作模型,研究人员训练了一个能够从RGB图像输入的神经网络,人类区域的掩模和视频中非人类环境的初始深度,以便生成深度图并进行人体形状和姿势预测。

去年,加州大学伯克利分校人工智能研究人员还利用YouTube视频作为数据集来训练人工智能模型,以舞蹈江南风格,并执行像后空翻这样的杂技人类专长。

姓 名:
邮箱
留 言: