新闻 news
您现在的位置:首页 > 新闻 > Facebook的AI在保留意义的同时简化了句子

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

Facebook的AI在保留意义的同时简化了句子

发布时间:2019/10/15 新闻 浏览:489

 
简化文本的语法和结构是我们大多数人在学校中学到的一项有用技能,但是由于缺乏语言知识,人工智能通常很难做到这一点。也就是说,Facebook AI Research和Inria的科学家正在朝着称为ACCESS(AudienCe-CEntric Sentence Simplification)的简化模型迈进,他们声称该模型可以自定义文本长度,释义量,词法复杂性,句法复杂性以及其他参数,同时保留连贯性。
研究人员在一份预印论文中详述了他们的工作:“简化文字对失语症,阅读障碍和自闭症等认知障碍者可能有益,对第二语言学习者和识字率低的人也有利。” “每个受众所需的简化类型是不同的……但是,文本简化的研究主要集中在开发针对给定源文本生成单一通用简化的模型,而没有可能使输出适应各种目标的需求。人口。 [我们]提出了一个可控的简化模型,该模型为用户提供了一种在他们认为合适的情况下操纵和更新简化输出的显式方式。”
为此,团队选择了seq2seq,这是一个通用的编码器-解码器框架,该框架将数据及其上下文作为输入。研究人员在源句子的开头添加了一个特殊的记号值-在目标句子上计算出的参数(如长度)与源句子上的值之比。然后,他们以四个选定的参数为模型的条件,即长度,释义,词法复杂度和句法复杂度。
为了进行实验,研究小组在Wiki-Large数据集上训练了一个Transformer模型,该模型包含296,402个来自英语Wikipedia和Simple English Wikipedia的自动对齐的复杂-简单句子对的样本。他们根据来自Turkcorpus的验证和测试集对其进行了评估,其中每个复杂句子都有8条由Amazon Mechanical Turk工人创建的释义句子(没有拆分,结构过于简化或内容减少)。
该团队报告说,在SARI上,这是一个受欢迎的基准,将预测的简化程度与源参考和目标参考进行了比较,ACCESS得分为41.87,与之前的最新技术水平(40.45)相比有“显着”提高。在不考虑语法和含义保存(FKGL)的衡量可读性的指标上,它以7.22分排名第三。
研究人员写道:“我们通过分析证实,每个参数都对所产生的简化具有理想的效果。”他们相信,他们的方法有助于为使文本简化适应不同需求的受众铺平道路。 “本文表明,对[模型]进行明确的条件限制…例如长度,释义,词法复杂性或句法复杂性等参数可显着提高其性能,以简化句子。”

姓 名:
邮箱
留 言: