新闻
-
门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?
据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...
-
百年变局新机遇 第九届岭南论坛在广州举行
11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...
-
《风雨之后总有阳光》——产业人物访谈:益宸康旅创...
2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...
财经
-
品钛旗下赣州爱信小贷正式接入人民银行征信系统
北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...
-
特斯拉空头近一个月减少超200万股
据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...
-
特斯拉展示新型自研呼吸机:与Model 3共用零件
特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...
-
特朗普称将在下一轮刺激计划中为美国民众发放更多的钱
北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。 ...
Facebook的VizSeq是一个用于文本生成的可视化分析工具包
发布时间:2019/09/20 新闻 浏览:629
数据科学家通常依靠指标来评估机器翻译,文本摘要和图像字幕机器学习算法。但问题是,所讨论的指标并不总是与人类评估的结果一致。这就是斯坦福大学和Facebook人工智能研究所的研究人员提出VizSeq的原因,他们将其描述为一个视觉分析工具包,用于对一系列文本生成任务进行实例和语料库级测试。
它在GitHub上以开源形式提供。
“机器翻译的自动评估通常仅限于说明系统错误模式……这表明有必要检查详细的评估示例,以全面了解系统行为,并寻求改进方向,”研究人员在预印本研究中写道。描述VizSeq的论文。 “我们希望提供一个统一的,可扩展的解决方案,摆脱所有这些限制,并通过用户友好的界面以及最新的[自然语言处理]技术得到增强。”
为此,VizSeq可以摄取多个数据源,包括文本,图像,音频和视频,同时为Jupyter笔记本和Web应用程序界面中的探索提供可视化。在测试方面,其套件包括BLEU,NIST,METEOR,TER,RIBES,chrF和GLEU,用于评估机器翻译; ROUGE用于摘要和视频描述;用于图像字幕的CIDEr;和语音识别任务的单词错误率。此外,VizSeq使用Facebook的PyTorch实现了基于嵌入的指标,如BERTScore和LASER,旨在捕获文本生成模型输出之间的语义相似性。
VizSeq可以在本地部署或部署到公共服务器上,用于集中数据托管和基准测试,通过特殊的文件夹结构组织数据。当新样本进入时,它会预先计算分数并自动将它们缓存到存储中。同时,文件监控和版本控制系统检测更改并触发必要的更新,以支持AI模型培训期间的评估。
VizSeq的Web应用程序界面具有数据上传模块和任务和数据集浏览模块,Jupyter笔记本界面直接从Python变量获取数据。对于分析模块,它支持具有句子标签的示例分组(例如,用于识别的语言和长句子的标签),其可以是用户定义的或机器生成的。
内置查看器提供了句子级别分数的示例,VizSeq能够按度量,源句长度和其他顺序进行排序。只需单击一下,即可将这些和其他统计信息导出为PNG或SVG图像和表格,并将其导出为逗号分隔值文件。
VizSeq在首次发布时功能相当全面,但研究人员表示,工作既活跃又持续。他们留待未来的工作,实现图像到文本和视频到文本的对齐,添加人工评估模块,以及将VizSeq与流行的文本生成框架集成,包括fairseq,openmnt和tensor2tensor。
VizSeq的发布是继去年1月Facebook开源图像处理库Spectrum,去年年底推出自然语言处理建模框架PyText以及11月推出AI强化学习平台Horizon之后发布的。最近,该公司推出了Pythia,这是一个模块化的即插即用框架,可以让数据科学家快速构建,复制和基准测试AI模型,以及一个名为Axe的机器学习实验工具。