新闻 news
您现在的位置:首页 > 新闻 > Facebook的VizSeq是一个用于文本生成的可视化分析工具包

新闻

十亿善款,三十二年坚守:振东制药公益“长城”这样建成 十亿善款,三十二年坚守:振东制药公益“长城”这样建成

如果说慈善事业是企业责任感的一个缩影。那么振东制药的慈善“侧写”便是大爱无疆。山西振东健康产业集团...

  • 千人竞逐“红气球”,振东集团公益精神在晋中大地闪耀

    5月25日,山西省高校新区(山西大学城)热闹非凡,2025“红气球挑战赛”(晋中站)在此鸣笛开赛。这场没有奖金的赛事,却吸引了来自社会各界及山西大学城高校的一千余名选手踊跃参与,他们“一起红气球,快乐学急救”...

  • 振东集团:32年慈善长跑背后的“共富密码”

    在商业与公益的天平上,山西振东健康产业集团选择了后者——即便负债也要坚持的"变态慈善"。这家从太行山走出的民营企业,用32年时间构建起一套独特的公益生态系统,累计捐赠超10亿元,将"与民同富、与家同兴、与国...

  • 硅谷AI人才争夺战白热化:千万年薪挖角,OpenAI成“...

    核心摘要: •顶尖AI人才稀缺:硅谷企业争抢顶级AI研究员,年薪高达千万美元,OpenAI员工成为重点目标。 •人才价值悬殊:OpenAICEO萨姆·奥尔特曼称,顶级AI研究员的能力可能是普通研究员的“一万倍”。•挖角手...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

Facebook的VizSeq是一个用于文本生成的可视化分析工具包

发布时间:2019/09/20 新闻 浏览:644

 
数据科学家通常依靠指标来评估机器翻译,文本摘要和图像字幕机器学习算法。但问题是,所讨论的指标并不总是与人类评估的结果一致。这就是斯坦福大学和Facebook人工智能研究所的研究人员提出VizSeq的原因,他们将其描述为一个视觉分析工具包,用于对一系列文本生成任务进行实例和语料库级测试。
它在GitHub上以开源形式提供。
“机器翻译的自动评估通常仅限于说明系统错误模式……这表明有必要检查详细的评估示例,以全面了解系统行为,并寻求改进方向,”研究人员在预印本研究中写道。描述VizSeq的论文。 “我们希望提供一个统一的,可扩展的解决方案,摆脱所有这些限制,并通过用户友好的界面以及最新的[自然语言处理]技术得到增强。”
为此,VizSeq可以摄取多个数据源,包括文本,图像,音频和视频,同时为Jupyter笔记本和Web应用程序界面中的探索提供可视化。在测试方面,其套件包括BLEU,NIST,METEOR,TER,RIBES,chrF和GLEU,用于评估机器翻译; ROUGE用于摘要和视频描述;用于图像字幕的CIDEr;和语音识别任务的单词错误率。此外,VizSeq使用Facebook的PyTorch实现了基于嵌入的指标,如BERTScore和LASER,旨在捕获文本生成模型输出之间的语义相似性。
VizSeq可以在本地部署或部署到公共服务器上,用于集中数据托管和基准测试,通过特殊的文件夹结构组织数据。当新样本进入时,它会预先计算分数并自动将它们缓存到存储中。同时,文件监控和版本控制系统检测更改并触发必要的更新,以支持AI模型培训期间的评估。
VizSeq的Web应用程序界面具有数据上传模块和任务和数据集浏览模块,Jupyter笔记本界面直接从Python变量获取数据。对于分析模块,它支持具有句子标签的示例分组(例如,用于识别的语言和长句子的标签),其可以是用户定义的或机器生成的。
内置查看器提供了句子级别分数的示例,VizSeq能够按度量,源句长度和其他顺序进行排序。只需单击一下,即可将这些和其他统计信息导出为PNG或SVG图像和表格,并将其导出为逗号分隔值文件。
VizSeq在首次发布时功能相当全面,但研究人员表示,工作既活跃又持续。他们留待未来的工作,实现图像到文本和视频到文本的对齐,添加人工评估模块,以及将VizSeq与流行的文本生成框架集成,包括fairseq,openmnt和tensor2tensor。
VizSeq的发布是继去年1月Facebook开源图像处理库Spectrum,去年年底推出自然语言处理建模框架PyText以及11月推出AI强化学习平台Horizo​​n之后发布的。最近,该公司推出了Pythia,这是一个模块化的即插即用框架,可以让数据科学家快速构建,复制和基准测试AI模型,以及一个名为Axe的机器学习实验工具。

姓 名:
邮箱
留 言: