新闻

全国学会服务地方产业发展试点项目落地山西：迎来“...

6月17日，全国学会服务地方产业发展试点项目正式落地山西。该项目由中国科协主导，振东制药协办，研发总...

十亿善款，三十二年坚守：振东制药公益“长城”这样建成
如果说慈善事业是企业责任感的一个缩影。那么振东制药的慈善“侧写”便是大爱无疆。山西振东健康产业集团自太行山深处诞生，稳扎稳打、守正创新，跻身中国药企中流砥柱行列。引导旗下公益扶贫办凝聚共识、加强合作...
千人竞逐“红气球”，振东集团公益精神在晋中大地闪耀
5月25日，山西省高校新区（山西大学城）热闹非凡，2025“红气球挑战赛”（晋中站）在此鸣笛开赛。这场没有奖金的赛事，却吸引了来自社会各界及山西大学城高校的一千余名选手踊跃参与，他们“一起红气球，快乐学急救”...
振东集团：32年慈善长跑背后的“共富密码”
在商业与公益的天平上，山西振东健康产业集团选择了后者——即便负债也要坚持的"变态慈善"。这家从太行山走出的民营企业，用32年时间构建起一套独特的公益生态系统，累计捐赠超10亿元，将"与民同富、与家同兴、与国...

财经

唯品会经营范围变更新增医疗器械、蔬菜水果零售等...

天眼查数据显示，3月31日，唯品会（中国）有限公司发生工商变更，经营范围新增蔬菜零售；非许可类医疗器...

品钛旗下赣州爱信小贷正式接入人民银行征信系统
　　　　北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛（Pintec Technology Holdings Ltd., Nasdaq: PT）今日宣布旗下的赣州爱信网络小额贷款有限公司（下称“爱信小贷”）正式接入中国人民银行...
特斯拉空头近一个月减少超200万股
　　据金融分析机构S3 Partner数据显示，截至4月3日，特斯拉未平仓空头头寸为1604万股，占流通股的10.97%。过去30天，特斯拉未平仓空头头寸减少222万股或12.18%，期间股价上涨32%；过去一周，特斯拉未平仓空头头...
特斯拉展示新型自研呼吸机：与Model 3共用零件
　　特斯拉之前宣布将开发新的呼吸机，而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频，其工程师演示了两个版本的呼吸机，一个是把所有零件摆在桌子上的原型，另外一个则是组装好的设备，用于显示在医...
特朗普称将在下一轮刺激计划中为美国民众发放更多的钱
　　北京时间4月7日消息，美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示，特朗普“肯定”想听取下一次刺激计划的想法，并补充道他希望其中包括“切切实实的基础设施”。　...

亚马逊的AI改善了声音中的情绪检测

发布时间：2019/05/23 财经 浏览：727

从某人的声音中可以收集到很多东西，这是情感的天然管道。情绪具有一系列应用：它可以通过帮助检测痴呆症或心脏病发作的早期症状来帮助进行健康监测，并且它有可能使对话AI系统更具吸引力和响应性。有一天，情绪甚至可能提供隐含的反馈，可以帮助谷歌助理，苹果的Siri和亚马逊的Alexa等语音助手从他们的错误中吸取教训。
情绪分类AI并不是什么新鲜事，但传统方法受到监督，这意味着它们会根据说话者的情绪状态来摄取训练数据。亚马逊的科学家最近采用了一种不同的方法，他们在计划在国际声学，语音和信号处理会议上发表的论文中描述了这种方法。他们没有采用详尽的注释“情感”语料库来教授系统，而是提供了一个对抗性自动编码器，这是一个包含来自10个不同发言者的10,000个话语的公开数据集。结果?在判断人们的声音中的效价或情感价值时，神经网络的准确度提高了4%。
该研究建立在亚马逊Alexa团队不断努力的基础上，通过他们的声音可靠地确定用户的情绪或情绪状态。
正如纸质合着者和Alexa Speech组高级应用科学家Viktor Rozgic在博客文章中解释的那样，对抗性自动编码器是包含编码器的两部分模型，编码器学习生成输入语音的紧凑(或潜在)表示，编码训练示例的所有属性和解码器，它重建来自紧凑表示的输入。
研究人员的情绪表征由三个网络节点组成，三个网络节点分别用于三种情绪测量：效价，激活，(说话者是警报，参与还是被动)，以及支配(说话者是否感觉控制情况)。训练分三个阶段进行，第一阶段涉及使用无标签的数据单独训练编码器和解码器。在第二阶段，对抗训练 – 对抗性鉴别器试图区分编码器产生的真实表示与人工表示的技术 – 用于调整编码器。并且在第三阶段，调整编码器以确保潜在情绪表示预测训练数据的情绪标签。
在涉及句子级特征表示“手工设计”以捕获有关语音信号的信息的实验中，研究人员报告说，他们的AI系统在评估效价方面比传统训练网络的准确度提高了3%。此外，他们表示，当为网络提供20毫秒帧或音频片段的声学特性的一系列表示时，改善率为4%。
亚马逊不是唯一一家研究改进的基于语音的情绪检测的公司，值得注意。麻省理工学院媒体实验室分拆Affectiva最近演示了一个神经网络SoundNet，可以在短短1.2秒内将愤怒与音频数据分类 – 只需要人类感知愤怒的时间 – 无论说话者的语言如何。与此同时，美国退伍军人事务部使用创业公司Cogito的人工智能分析军人退伍军人与创伤后应激障碍的声音，以确定他们是否需要立即帮助。

上一篇: Bill.com推出用于自动付款处理的AI平台

下一篇: Stein Mart通过在近200家商店安装亚马逊储物柜来拥抱敌人

发布时间: