科技 technology
您现在的位置:首页 > 科技 > 弥合人机视觉之间的鸿沟

科技

SpaceX成功发射了另外60颗Starlink卫星,但错过了助推器着陆 SpaceX成功发射了另外60颗Starlink卫星,但错过了...

  SpaceX已经发射了一批60颗Starlink卫星进入轨道运行,这标志着这是60颗小型航天器的第五次整体发...

  • 观看SpaceX尝试通过另一项Starlink直播进行火箭重...

      SpaceX正在发射另一批60颗Starlink卫星,以加入其现有的星座,这将使总数达到300颗,这是Starlink今年的第三次发射。此次发射还将展示SpaceX的Falcon 9可重复使用性,这可能是一项创纪录的演示,这是Falco...

  • 嵌入水母中的微电子器件可增强推进力

      机器人材料的研究人员旨在人为地控制动物的运动,以解决软机器人中驱动,控制和功率需求方面的现有挑战。斯坦福大学生物工程学,土木与环境工程学和机械工程学系的Nicole W. Xu和John O.Dabiri在《科学进...

  • Android恶意软件的顽固压力导致重置

      它被称为令人讨厌的-哦,所有的东西都被重新感染了-并且有一个偷偷摸摸的理由:所有这些,令头痛的观察者称为xHelper,一旦被感染,这对您毫无帮助。恶意软件xHelper被识别为木马删除程序。 木马滴管? Tec...

弥合人机视觉之间的鸿沟

发布时间:2020/02/14 科技 浏览:9

 

假设您从几英尺远的地方短暂看过一个从未见过的人。向后退几步,再看一次。你能认出她的脸吗? “是的,当然。”您可能在想。如果这是真的,那么这意味着我们的视觉系统已经看到了一个物体(例如特定面部)的单个图像,例如,尽管该物体的位置和比例发生了变化,但仍能可靠地识别该图像。另一方面,我们知道最先进的分类器(例如香草深层网络)将无法通过此简单测试。

为了识别一系列变换下的特定面部,需要使用在不同条件下的许多面部示例来训练神经网络。换句话说,它们可以通过记忆实现不变性,但是如果只有一张图像可用则无法做到这一点。因此,了解人类视觉如何才能实现这一非凡的成就与旨在改进其现有分类器的工程师相关。这对于神经科学家用深度网络对灵长类动物视觉系统建模也很重要。特别是,与生物网络相比,生物视觉表现出的一键式学习不变性可能需要一种截然不同的计算策略。

麻省理工学院博士学位论文电气工程和计算机科学专业的候选人Yena Han及其同事在《自然科学报告》上题为“人类视觉中新对象的尺度和平移不变性”,讨论了他们如何更仔细地研究这种现象以创建新的受生物启发的网络。

脑中心研究中心主任Tomaso Poggio说:“与深​​层网络不同,人类可以从很少的例子中学到东西。这是一个巨大的差异,对视觉系统的工程设计和理解人类视觉的真正工作意义重大。”思维与机器(CBMM)和麻省理工学院的尤金·麦克德莫特(Eugene McDermott)脑与认知科学教授。 “造成这种差异的一个关键原因是灵长类动物视觉系统在缩放,移动和其他变换方面的相对不变性。奇怪的是,在AI社区中,这一点大多被忽略了,部分原因是心理物理数据远不及清晰的数据-汉的工作现在已经建立了对人类视觉基本不变性的可靠测量。”

为了区分固有计算中的不变性与经验和记忆中的不变性,这项新研究测量了一次学习中不变性的范围。通过向不熟悉该语言的人类受试者呈现韩语字母刺激来执行一次学习任务。这些字母最初是在一种特定条件下单次出现的,并在与原始条件不同的比例或位置上进行了测试。第一个实验结果是,就像您猜到的那样,人类仅接触这些新颖的物体就显示出显着的尺度不变识别。第二个结果是位置不变的范围受到限制,这取决于对象的大小和位置。

接下来,Han和她的同事们在旨在重现这种人类行为的深度神经网络中进行了可比的实验。结果表明,为了解释人类对物体的不变识别,神经网络模型应明确纳入内置的尺度不变性。此外,通过使模型神经元的感受野越远离视场中心,它们的视野就越能在网络中得到更好的复制。该体系结构与常用的神经网络模型不同,后者使用相同的共享滤镜以统一的分辨率处理图像。

CBMM研究人员和负责人Han表示:“我们的工作提供了对不同视角下对象的大脑表示的新理解。它对AI也有影响,因为结果为深入了解深度神经网络的良好架构设计提供了新见解。”该研究的作者。