科技 technology
您现在的位置:首页 > 科技 > 研究人员设计出减少计算机视觉数据集中偏差的方法

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

研究人员设计出减少计算机视觉数据集中偏差的方法

发布时间:2020/02/14 科技 浏览:385

 
为了解决人工智能中的偏见问题,普林斯顿大学和斯坦福大学的计算机科学家已经开发出方法来获取包含人的图像的更公平的数据集。研究人员提出了对ImageNet的改进,ImageNet是一个包含1400万张图像的数据库,在过去十年中,它在推进计算机视觉方面发挥了关键作用。
ImageNet包含对象,风景以及人物的图像,可作为培训数据的来源,供研究人员创建机器学习算法以对图像进行分类或识别其中的元素。 ImageNet前所未有的规模要求自动图像收集和众包图像注释。尽管研究团体很少使用数据库的人员类别,但是ImageNet团队一直在努力解决偏见和其他有关图像的担忧,这些图像所具有的图像是ImageNet构造的意外结果。
普林斯顿大学计算机科学助理教授Olga Russakovsky说:“计算机视觉现在真的很好用,这意味着它已经在各种环境中被广泛部署。” “这意味着现在是时候谈论它对世界产生什么样的影响并思考这些公平问题了。”
在一篇新论文中,ImageNet团队系统地识别了ImageNet的人员类别中的非视觉概念和令人讨厌的类别,例如种族和性别特征,并建议将其从数据库中删除。研究人员还设计了一种工具,该工具允许用户指定和检索按年龄,性别表达或肤色平衡的人的图像集,其目的是促进更公平地对人的面部和图像活动进行分类的算法。研究人员于1月30日在西班牙巴塞罗那举行的计算机协会公平性,问责制和透明度会议上介绍了他们的工作。
鲁萨科夫斯基说:“非常需要具有核心技术专长的研究人员和实验室来进行这类对话。” “考虑到我们需要大规模收集数据这一现实,因为这将是最有效,最完善的渠道,因此将通过众包来完成,我们如何以一种更公平的方式做到这一点-会陷入这些先验陷阱吗?本文的核心信息是关于建设性的解决方案。”
普林斯顿大学和斯坦福大学的一群计算机科学家于2009年启动了ImageNet,作为学术研究人员和教育工作者的资源。领导这项工作的是普林斯顿校友和现任斯坦福大学计算机科学教授的李飞飞老师。为了鼓励研究人员使用ImageNet构建更好的计算机视觉算法,该团队还发起了ImageNet大规模视觉识别挑战赛。挑战主要集中在使用1,000个图像类别的对象识别上,其中只有三个具有特色。
ImageNet中的一些公平性问题源于用于构建数据库的管道。其图像类别来自WordNet,WordNet是用于自然语言处理研究的较旧的英语单词数据库。 ImageNet的创建者在WordNet中采用了这些名词,尽管其中的一些名词定义明确,但其中的一些名词并不能很好地转化为视觉词汇。例如,描述一个人的宗教信仰或地理起源的术语可能只会检索到最有特色的图像搜索结果,从而可能导致使定型观念永久化的算法。
最近一个名为ImageNet Roulette的艺术项目引起了人们对这些问题的更多关注。该项目于2019年9月作为图像识别系统艺术展览的一部分发布,该项目使用ImageNet中的人物图像来训练一种人工智能模型,该人工智能模型根据提交的图像将人们按单词分类。用户可以上传自己的图像并根据此模型检索标签。许多分类都是令人反感的或根本不在基地的。
使ImageNet的创建者积累如此大的带标签图像数据库的中心创新是众包的使用-特别是Amazon Mechanical Turk(MTurk)平台,通过该平台,工人可以付费来验证候选图像。这种方法虽然具有变革性,但并不完美,导致一些偏见和不适当的分类。
“当您要求人们通过从大量候选人中选择正确的图像来验证图像时,人们会感到选择某些图像的压力很大,而这些图像往往是具有独特或刻板印象的图像,”主要作者杨开宇说。计算机科学专业的学生。
在这项研究中,Yang和同事首先从ImageNet过滤掉了可能令人反感或敏感的人类别。他们将攻击性类别定义为包含亵渎或种族或性别诽谤的类别;敏感类别包括,例如,基于性取向或宗教的人的分类。为了注释类别,他们招募了来自不同背景的12名研究生,指示他们如果不确定不确定是否将类别标记为敏感。这消除了1,593个类别,大约占ImageNet中2,932个人类别的54%。
然后,研究人员求助于MTurk工作人员,以1-5的等级对其余安全类别的“可成像性”进行评分。保持类别的可成像性等级为4或更高,仅将158个类别归为安全和可成像类别。即使是经过高度筛选的类别集,也包含超过133,000张图像-用于训练计算机视觉算法的大量示例。
在这158个类别中,研究人员研究了图像中人物的人口统计学表征,以便评估ImageNet中的偏见程度,并设计出一种创建更公平数据集的方法。 ImageNet的内容来自Flickr之类的图像搜索引擎,并且已经证明,一般而言,搜索引擎所产生的结果代表了18岁至40岁之间的男性,肤色较浅的人和成年人。
杨说:“人们发现图像搜索结果中的人口统计信息分布高度偏向,这就是ImageNet中的分布也偏向的原因。” “在本文中,我们试图了解这种偏差有多严重,并提出一种平衡分配的方法。”
在受美国反歧视法律保护的属性中,研究人员考虑了可成像的三个属性:肤色,性别表达和年龄。 MTurk的工作人员被要求在图像中注释每个人的每个属性。他们将肤色分类为浅色,中度或深色。和年龄(儿童(18岁以下),18至40岁的成年人,40至65岁的成年人或65岁以上的成年人)。性别分类包括男性,女性和不确定者-一种将具有各种性别表达方式的人包括在内的方法,并在其中注释性别从视觉线索(例如婴儿或潜水员的许多图像)中看不到。
对注释的分析表明,与搜索结果相似,ImageNet的内容反映出相当大的偏见。注释为深色皮肤的人,女性和40岁以上的成年人在大多数类别中的人数均不足。
尽管注释过程包括质量控制并要求注释者达成共识,但出于对错误注释潜在危害的担忧,研究人员选择不对单个图像发布人口统计注释。取而代之的是,他们设计了一个Web界面工具,该工具允许用户获取一组以用户指定的方式进行人口统计平衡的图像。例如,“程序员”类别中的全部图像集合可以包括大约90%的男性和10%的女性,而在美国,大约20%的计算机程序员是女性。研究人员可以使用新工具检索一组程序员图像,这些图像代表80%的男性和20%的女性-甚至根据研究人员的目的进行平均分配。
杨说:“我们不想说什么是平衡人口统计的正确方法,因为这不是一个非常简单的问题。” “在世界各地,分布可能有所不同。例如,美国的肤色分布与亚洲的国家不同。因此,我们将这个问题留给用户,我们只是提供了一种检索图像的平衡子集。”
ImageNet团队目前正在对其硬件和数据库进行技术更新,此外还实施了对人员类别的过滤和本研究中开发的再平衡工具。 ImageNet即将通过这些更新重新发布,并呼吁计算机视觉研究界提供反馈。