科技 technology
您现在的位置:首页 > 科技 > MIT CSAIL的TextFooler生成对抗性文本以增强自然语言模型

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

MIT CSAIL的TextFooler生成对抗性文本以增强自然语言模型

发布时间:2020/02/10 科技 浏览:539

 
人工智能和机器学习算法容易受到对抗性样本的攻击,这些对抗性样本与原始样本有所不同。随着自然语言模型能够生成类似人的文本的能力,这尤其成问题,因为自然语言模型对恶意行为者具有吸引力,这些恶意行为者会利用它们来制作误导性媒体。为了寻求一种能说明对抗性文本可能在多大程度上影响模型预测的技术,麻省理工学院计算机科学与人工智能实验室(CSAIL),香港大学和新加坡科学技术研究局的研究人员开发了TextFooler,用于合成对抗性文字示例的基准框架。他们在一篇论文中声称,它能够成功攻击三种领先的目标模型,包括Google的BERT。
“如果这些工具容易受到有目的的对抗攻击,那么后果可能是灾难性的,”麻省理工学院博士学位的狄金说。学生和论文的主要作者,他指出TextFooler产生的对抗示例可以提高在其上训练的AI模型的鲁棒性。 “这些工具需要有有效的防御方法来保护自己,而要建立这样一个安全的防御系统,我们首先需要研究对抗方法。”
研究人员断言,除了能够愚弄AI模型之外,诸如TextFooler之类的自然语言“攻击”系统的输出还应满足某些标准:人类预测的一致性,使得人类预测保持不变;语义上的相似性,使得精心制作的示例与来源具有相同的含义;和语言流利度,这样生成的示例看起来自然而合乎语法。即使没有可用的模型体系结构或参数(影响模型性能的值),TextFooler也会满足这三个条件,即黑盒方案。
它通过识别目标模型中最重要的单词并用语义上相似且语法正确的单词替换它们,直到更改预测来实现此目的。 TextFooler应用于两个不同的任务-文本分类和包含(句子中文本片段之间的关系)-目的是更改分类或使原始模型的包含判断无效。例如,假定输入“在不可能的情况下投放的角色与现实完全疏远”,TextFooler可能会输出“在不可能的情况下投放的角色与现实完全疏远”。
为了评估TextFooler,研究人员将其应用于具有各种属性的文本分类数据集,包括新闻主题分类,虚假新闻检测以及句子和文档级别的情感分析,其中平均文本长度从数十个单词到数百个单词不等。对于每个数据集,他们在生成语义上类似于测试集的攻击示例以攻击那些模型之前,在训练集上训练了上述最新模型。
该团队报告说,在对抗性示例中,他们设法将所有任务中几乎所有目标模型的准确性降低到10%以下,并且只有不到20%的原始单词受到干扰。即使是BERT,与其他测试模型相比,它的性能都比较强健,TextFooler在分类任务上的预测准确性也降低了约5到7倍,在包含任务中的预测准确性也降低了约9到22倍(目标是判断是否句子可能来自包围,矛盾或中立关系。
Jin说:“该系统可用于或扩展为攻击任何基于分类的NLP模型,以测试其健壮性。” “另一方面,生成的对手可用于通过对抗训练来提高深度学习模型的鲁棒性和泛化能力,这是这项工作的关键方向。”