科技 technology
您现在的位置:首页 > 科技 > 弥合人机视觉之间的鸿沟

新闻

Office升级啦!全新Microsoft 365 登场!海量福利免费领。 Office升级啦!全新Microsoft 365 登场!海量福利...

进击的Office —— 联想电脑⽤户专享五折优惠, 199元尽享全新Microsoft 365! Microsoft 365 全新名称,...

  • 都在谈智能驾驶,你真的了解它吗?

    对于智能驾驶技术,我们并不陌生,常见的,ACC自适应巡航、车道偏离预警等在其范畴之内。随着消费者需求升级,汽车技术的发展革新,智能驾驶已成各大车企关注的焦点。 而目前各个车企的智能驾驶水平参差不齐,奥迪A8...

  • 底特律标志性车展被取消,因为FEMA指定TCF中心承担...

      如今,由于冠状病毒的爆发而取消的大事件已经不是什么新鲜事了,但是当这些消息发布时,仍然有些刺痛。最新的伤亡:大型北美国际汽车展(NAIAS)计划于6月5日至20日在底特律举行,这是美国现在停滞不前的...

  • 当您能想到的只是COVID-19时,如何专注于工作:五...

      冠状病毒和COVID-19可能是一代人生命中最大的破坏者。对于我们许多人来说,这就是我们能想到的。从新闻到社交媒体,甚至电影,似乎都是人们正在消费的一件事,而与流行病无关的任何事物都将被忽略。 ...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

弥合人机视觉之间的鸿沟

发布时间:2020/02/14 科技 浏览:79

 
假设您从几英尺远的地方短暂看过一个从未见过的人。向后退几步,再看一次。你能认出她的脸吗? “是的,当然。”您可能在想。如果这是真的,那么这意味着我们的视觉系统已经看到了一个物体(例如特定面部)的单个图像,例如,尽管该物体的位置和比例发生了变化,但仍能可靠地识别该图像。另一方面,我们知道最先进的分类器(例如香草深层网络)将无法通过此简单测试。
为了识别一系列变换下的特定面部,需要使用在不同条件下的许多面部示例来训练神经网络。换句话说,它们可以通过记忆实现不变性,但是如果只有一张图像可用则无法做到这一点。因此,了解人类视觉如何才能实现这一非凡的成就与旨在改进其现有分类器的工程师相关。这对于神经科学家用深度网络对灵长类动物视觉系统建模也很重要。特别是,与生物网络相比,生物视觉表现出的一键式学习不变性可能需要一种截然不同的计算策略。
麻省理工学院博士学位论文电气工程和计算机科学专业的候选人Yena Han及其同事在《自然科学报告》上题为“人类视觉中新对象的尺度和平移不变性”,讨论了他们如何更仔细地研究这种现象以创建新的受生物启发的网络。
脑中心研究中心主任Tomaso Poggio说:“与深​​层网络不同,人类可以从很少的例子中学到东西。这是一个巨大的差异,对视觉系统的工程设计和理解人类视觉的真正工作意义重大。”思维与机器(CBMM)和麻省理工学院的尤金·麦克德莫特(Eugene McDermott)脑与认知科学教授。 “造成这种差异的一个关键原因是灵长类动物视觉系统在缩放,移动和其他变换方面的相对不变性。奇怪的是,在AI社区中,这一点大多被忽略了,部分原因是心理物理数据远不及清晰的数据-汉的工作现在已经建立了对人类视觉基本不变性的可靠测量。”
为了区分固有计算中的不变性与经验和记忆中的不变性,这项新研究测量了一次学习中不变性的范围。通过向不熟悉该语言的人类受试者呈现韩语字母刺激来执行一次学习任务。这些字母最初是在一种特定条件下单次出现的,并在与原始条件不同的比例或位置上进行了测试。第一个实验结果是,就像您猜到的那样,人类仅接触这些新颖的物体就显示出显着的尺度不变识别。第二个结果是位置不变的范围受到限制,这取决于对象的大小和位置。
接下来,Han和她的同事们在旨在重现这种人类行为的深度神经网络中进行了可比的实验。结果表明,为了解释人类对物体的不变识别,神经网络模型应明确纳入内置的尺度不变性。此外,通过使模型神经元的感受野越远离视场中心,它们的视野就越能在网络中得到更好的复制。该体系结构与常用的神经网络模型不同,后者使用相同的共享滤镜以统一的分辨率处理图像。
CBMM研究人员和负责人Han表示:“我们的工作提供了对不同视角下对象的大脑表示的新理解。它对AI也有影响,因为结果为深入了解深度神经网络的良好架构设计提供了新见解。”该研究的作者。