科技 technology
您现在的位置:首页 > 科技 > 谷歌的Translatotron是一种模仿人类声音的端到端模型

新闻

Ta为何能成为高端智能新能源汽车风向标? Ta为何能成为高端智能新能源汽车风向标?

近年来,新能源汽车的快速进化有目共睹,不仅产品的品质逐渐走向“高端化”,“智能化”同样成为新能源汽车进化...

  • 底特律标志性车展被取消,因为FEMA指定TCF中心承担...

      如今,由于冠状病毒的爆发而取消的大事件已经不是什么新鲜事了,但是当这些消息发布时,仍然有些刺痛。最新的伤亡:大型北美国际汽车展(NAIAS)计划于6月5日至20日在底特律举行,这是美国现在停滞不前的...

  • 当您能想到的只是COVID-19时,如何专注于工作:五...

      冠状病毒和COVID-19可能是一代人生命中最大的破坏者。对于我们许多人来说,这就是我们能想到的。从新闻到社交媒体,甚至电影,似乎都是人们正在消费的一件事,而与流行病无关的任何事物都将被忽略。 ...

  • 美国联邦通信委员会(FCC)警告冠状病毒

      多年来,Robocall一直以弱势群体和毫无戒心的目标为目标,因此,这些卑鄙的人会利用当前的全球灾难来增强其骗局也就不足为奇了。美国联邦通信委员会(FCC)警告说,它已经收到了许多有关在野外与冠状病毒...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

谷歌的Translatotron是一种模仿人类声音的端到端模型

发布时间:2019/05/16 科技 浏览:308

 
昨天,Google AI分享了有关Translatotron的详细信息,Translatotron是一种能够将人的语音直接翻译成另一种语言的实验性AI系统,这种方法允许合成翻译一个人的声音以保持原始说话者的声音。
传统上,语音翻译使用自动语音识别将语音转换为文本,应用机器翻译,然后使用文本到语音来产生翻译,但Translatotron是一种端到端的翻译模型。研究人员表示,Translatotron可以比传统的级联模型更快地完成翻译并减少并发症。
“据我们所知,Translatotron是第一个能够将语言从一种语言直接翻译成另一种语言的语音的端到端模型。它还能够在翻译的演讲中保留源音箱的声音,“关于该主题的博客文章读取。
用于测量机器翻译质量的BLEU分数发现实验Translatotron的质量低于传统级联系统,但Translatotron实现了比基线级联翻译更准确的翻译。
机器翻译的端到端模型的出现始于法国研究人员于2016年在NeurIPS上接受的论文。
为了使Translatotron能够进行端到端翻译,研究人员使用序列到序列模型和光谱图作为输入训练数据。扬声器编码器网络用于捕获说话者语音的字符,并且多任务学习用于预测源和目标说话者使用的单词。
Translatotron在今天发表的一篇题​​为“使用序列到序列模型的直接语音到语音翻译”的论文中有更详细的说明。
Translatotron的发布是在谷歌推出SpecAugment一个月之后发布的,这是一种AI模型,它使用计算机视觉和各种技术来理解来自光谱图像的文字。
Translatotron可以应用于谷歌助手的翻译模式,它在1月份首次亮相家庭音箱。口译员模式能够以27种语言收听和提供语音到语音的翻译。像谷歌和微软这样的公司也在使用他们的语言翻译印章来赢得iOS用户。
Translatotron是谷歌机器翻译和语言处理的最新进展。
上周在谷歌的I / O开发者大会上,谷歌分享了它通过智能手机缩减其经常使用神经网络和语言理解模型进行设备上机器学习,使Google智能助理的速度提高了10倍。谷歌还推出了Lens翻译,因此您的相机可以翻译100多种语言。

姓 名:
邮箱
留 言: