科技 technology
您现在的位置:首页 > 科技 > Google AI研究人员使用人体模型挑战YouTube视频来改善深度预测

科技

Google智能助理现在可让您为其他人分配提醒 Google智能助理现在可让您为其他人分配提醒

  据悉,您很快就可以通过Android手机上的Google智能助理以及Nest Home智能扬声器和智能显示器为您...

  • Misfit发布了新的Wear OS智能手表

        几乎可以肯定的是,Misfit的新款智能手表与一周或两周后宣布的Fossil设备不同。这款一次性模块化健身初创公司自2015年起成为Fossil家族的一员,两年后推出首款全面智能手表。 这些品牌之间的界限一...

  • Facebook的AR开发工具包在Instagram上退出了测试版

      不要让Face App和Snapchat抢走其中的焦点,Facebook今天宣布它将在Instagram上开放其Spark的封闭测试版,让任何开发者在平台上构建和共享增强现实过滤器。 该公司宣布这一变化将在今年早些时候的F8主题演...

  • Google详细介绍了Project Euphonia更具包容性的语...

      作为可访问性新努力的一部分,Google于5月在I / O上宣布了Euphonia项目:尝试使语音识别能够理解具有非标准语音或障碍的人。该公司刚刚发布了一篇文章及其论文,解释了启用新功能的一些AI工作。 问题很容...

Google AI研究人员使用人体模型挑战YouTube视频来改善深度预测

发布时间:2019/05/24 科技 浏览:71

 

据悉,谷歌人工智能研究人员今天表示,他们使用2,000个“人体模型挑战”YouTube视频作为训练数据集来创建一个能够根据运动视频进行深度预测的人工智能模型。这种理解的应用可以帮助开发人员在手持相机和3D视频拍摄的场景中制作增强现实体验。

人体模型的挑战要求一群人在一个人拍摄视频时基本上表现得像时间一样停滞不前。研究人员在一篇名为“通过观察冰冻人物学习移动人的深度”的论文中表示,这提供了一个数据集,可以帮助检测摄像机和视频中人物移动的视频中的景深。

研究科学家Tali Dekel和工程师Forrester Cole在一篇博客中说:“虽然最近使用机器学习进行深度预测有所激增,但这项工作是第一个针对同时摄像机和人体运动的情况定制基于学习的方法。”今天发布。

谷歌的研究人员表示,这种方法优于制作深度图的最先进工具。

“就人们在视频中保持静止而言,我们可以假设场景是静态的,并通过运动结构(SfM)和多视图立体声(MVS)算法处理它们来获得准确的相机姿势和深度信息。 ,“报纸上写道。 “因为包括人在内的整个场景都是静止的,我们使用SfM和MVS估计相机的姿势和深度,并使用这个衍生的3D数据作为训练的监督。”

为了制作模型,研究人员训练了一个能够从RGB图像输入的神经网络,人类区域的掩模和视频中非人类环境的初始深度,以便生成深度图并进行人体形状和姿势预测。

去年,加州大学伯克利分校人工智能研究人员还利用YouTube视频作为数据集来训练人工智能模型,以舞蹈江南风格,并执行像后空翻这样的杂技人类专长。

姓 名:
邮箱
留 言: