科技 technology
您现在的位置:首页 > 科技 > 弥合人机视觉之间的鸿沟

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

弥合人机视觉之间的鸿沟

发布时间:2020/02/14 科技 浏览:341

 
假设您从几英尺远的地方短暂看过一个从未见过的人。向后退几步,再看一次。你能认出她的脸吗? “是的,当然。”您可能在想。如果这是真的,那么这意味着我们的视觉系统已经看到了一个物体(例如特定面部)的单个图像,例如,尽管该物体的位置和比例发生了变化,但仍能可靠地识别该图像。另一方面,我们知道最先进的分类器(例如香草深层网络)将无法通过此简单测试。
为了识别一系列变换下的特定面部,需要使用在不同条件下的许多面部示例来训练神经网络。换句话说,它们可以通过记忆实现不变性,但是如果只有一张图像可用则无法做到这一点。因此,了解人类视觉如何才能实现这一非凡的成就与旨在改进其现有分类器的工程师相关。这对于神经科学家用深度网络对灵长类动物视觉系统建模也很重要。特别是,与生物网络相比,生物视觉表现出的一键式学习不变性可能需要一种截然不同的计算策略。
麻省理工学院博士学位论文电气工程和计算机科学专业的候选人Yena Han及其同事在《自然科学报告》上题为“人类视觉中新对象的尺度和平移不变性”,讨论了他们如何更仔细地研究这种现象以创建新的受生物启发的网络。
脑中心研究中心主任Tomaso Poggio说:“与深​​层网络不同,人类可以从很少的例子中学到东西。这是一个巨大的差异,对视觉系统的工程设计和理解人类视觉的真正工作意义重大。”思维与机器(CBMM)和麻省理工学院的尤金·麦克德莫特(Eugene McDermott)脑与认知科学教授。 “造成这种差异的一个关键原因是灵长类动物视觉系统在缩放,移动和其他变换方面的相对不变性。奇怪的是,在AI社区中,这一点大多被忽略了,部分原因是心理物理数据远不及清晰的数据-汉的工作现在已经建立了对人类视觉基本不变性的可靠测量。”
为了区分固有计算中的不变性与经验和记忆中的不变性,这项新研究测量了一次学习中不变性的范围。通过向不熟悉该语言的人类受试者呈现韩语字母刺激来执行一次学习任务。这些字母最初是在一种特定条件下单次出现的,并在与原始条件不同的比例或位置上进行了测试。第一个实验结果是,就像您猜到的那样,人类仅接触这些新颖的物体就显示出显着的尺度不变识别。第二个结果是位置不变的范围受到限制,这取决于对象的大小和位置。
接下来,Han和她的同事们在旨在重现这种人类行为的深度神经网络中进行了可比的实验。结果表明,为了解释人类对物体的不变识别,神经网络模型应明确纳入内置的尺度不变性。此外,通过使模型神经元的感受野越远离视场中心,它们的视野就越能在网络中得到更好的复制。该体系结构与常用的神经网络模型不同,后者使用相同的共享滤镜以统一的分辨率处理图像。
CBMM研究人员和负责人Han表示:“我们的工作提供了对不同视角下对象的大脑表示的新理解。它对AI也有影响,因为结果为深入了解深度神经网络的良好架构设计提供了新见解。”该研究的作者。