财经 industry
您现在的位置:首页 > 财经 > 亚马逊的AI改善了声音中的情绪检测

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

亚马逊的AI改善了声音中的情绪检测

发布时间:2019/05/23 财经 浏览:627

 
从某人的声音中可以收集到很多东西,这是情感的天然管道。情绪具有一系列应用:它可以通过帮助检测痴呆症或心脏病发作的早期症状来帮助进行健康监测,并且它有可能使对话AI系统更具吸引力和响应性。有一天,情绪甚至可能提供隐含的反馈,可以帮助谷歌助理,苹果的Siri和亚马逊的Alexa等语音助手从他们的错误中吸取教训。
情绪分类AI并不是什么新鲜事,但传统方法受到监督,这意味着它们会根据说话者的情绪状态来摄取训练数据。亚马逊的科学家最近采用了一种不同的方法,他们在计划在国际声学,语音和信号处理会议上发表的论文中描述了这种方法。他们没有采用详尽的注释“情感”语料库来教授系统,而是提供了一个对抗性自动编码器,这是一个包含来自10个不同发言者的10,000个话语的公开数据集。结果?在判断人们的声音中的效价或情感价值时,神经网络的准确度提高了4%。
该研究建立在亚马逊Alexa团队不断努力的基础上,通过他们的声音可靠地确定用户的情绪或情绪状态。
正如纸质合着者和Alexa Speech组高级应用科学家Viktor Rozgic在博客文章中解释的那样,对抗性自动编码器是包含编码器的两部分模型,编码器学习生成输入语音的紧凑(或潜在)表示,编码训练示例的所有属性和解码器,它重建来自紧凑表示的输入。
研究人员的情绪表征由三个网络节点组成,三个网络节点分别用于三种情绪测量:效价,激活,(说话者是警报,参与还是被动),以及支配(说话者是否感觉控制情况)。训练分三个阶段进行,第一阶段涉及使用无标签的数据单独训练编码器和解码器。在第二阶段,对抗训练 – 对抗性鉴别器试图区分编码器产生的真实表示与人工表示的技术 – 用于调整编码器。并且在第三阶段,调整编码器以确保潜在情绪表示预测训练数据的情绪标签。
在涉及句子级特征表示“手工设计”以捕获有关语音信号的信息的实验中,研究人员报告说,他们的AI系统在评估效价方面比传统训练网络的准确度提高了3%。此外,他们表示,当为网络提供20毫秒帧或音频片段的声学特性的一系列表示时,改善率为4%。
亚马逊不是唯一一家研究改进的基于语音的情绪检测的公司,值得注意。麻省理工学院媒体实验室分拆Affectiva最近演示了一个神经网络SoundNet,可以在短短1.2秒内将愤怒与音频数据分类 – 只需要人类感知愤怒的时间 – 无论说话者的语言如何。与此同时,美国退伍军人事务部使用创业公司Cogito的人工智能分析军人退伍军人与创伤后应激障碍的声音,以确定他们是否需要立即帮助。

姓 名:
邮箱
留 言: