科技 technology
您现在的位置:首页 > 科技 > 智能扬声器:智能设备的愚蠢术语

新闻

MORROR ART歌词音箱的全新颠覆体验,在照片中看见如歌的岁月。 MORROR ART歌词音箱的全新颠覆体验,在照片中看见...

MORROR ART软装艺术理念的新尝试, 探索时光之美,赋予相册和台历更多可能 让时光和音乐一样能被看见。

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 《风雨之后总有阳光》——产业人物访谈:益宸康旅创...

    2019年,国务院发布了《“健康中国2030”规划纲要》和第七次人口普查,把中国的康养产业推上了最大的风口。紧接着,2021年4月15日,中国央视网、新浪财经、搜狐网接连报道了“七亿养老项目暴雷:老人养老积蓄人间蒸发”。...

财经

唯品会经营范围变更 新增医疗器械、蔬菜水果零售等业务 唯品会经营范围变更 新增医疗器械、蔬菜水果零售等...

天眼查数据显示,3月31日,唯品会(中国)有限公司发生工商变更,经营范围新增蔬菜零售;非许可类医疗器...

  • 品钛旗下赣州爱信小贷正式接入人民银行征信系统

        北京2020年4月7日 /美通社/ -- 领先的金融科技解决方案提供商品钛(Pintec Technology Holdings Ltd., Nasdaq: PT) 今日宣布旗下的赣州爱信网络小额贷款有限公司(下称“爱信小贷”)正式接入中国人民银行...

  • 特斯拉空头近一个月减少超200万股

      据金融分析机构S3 Partner数据显示,截至4月3日,特斯拉未平仓空头头寸为1604万股,占流通股的10.97%。过去30天,特斯拉未平仓空头头寸减少222万股或12.18%,期间股价上涨32%;过去一周,特斯拉未平仓空头头...

  • 特斯拉展示新型自研呼吸机:与Model 3共用零件

      特斯拉之前宣布将开发新的呼吸机,而现在他们展示了这种新型设计。特斯拉在YouTube发布了视频,其工程师演示了两个版本的呼吸机,一个是把所有零件摆在桌子上的原型,另外一个则是组装好的设备,用于显示在医...

  • 特朗普称将在下一轮刺激计划中为美国民众发放更多的钱

      北京时间4月7日消息,美国总统特朗普称将在下一轮刺激计划中为美国民众发放更多的钱。在白宫新闻发布会上表示,特朗普“肯定”想听取下一次刺激计划的想法,并补充道他希望其中包括“切切实实的基础设施”。  ...

智能扬声器:智能设备的愚蠢术语

发布时间:2019/12/07 科技 浏览:395

 
亚马逊在2014年推出了Echo设备,这种设备的想法普及了,其中交互的唯一手段是通过语音和对话。现在看来,每个月都会带来专用设备的新发展,这些专用设备可处理语音命令并执行操作。但是,这些设备到底是什么?
流行媒体称它们为“智能扬声器”或“语音助理”或“智能个人助理”,但这些词并不完全相似。智能扬声器会产生一种主要面向输出的设备,旨在用语音命令代替键盘或按钮的交互。然而,对于亚马逊,谷歌,微软,苹果,阿里巴巴,腾讯,三星,百度等投资数十亿美元的公司来说,这是一个微不足道的应用程序。毕竟,如果所有这些供应商所做的只是允许您根据声音需求播放Tayl​​or Swift或让您询问天气情况,为什么所有这些供应商都如此积极地营销和推广这些设备?
显然,这里的作用比单纯的声控扬声器要大。智能扬声器是一种与客户群进行更智能交互,进入大量家庭和企业并使人们舒适地使用这些设备的方式。真正的演奏不仅仅是可以用声音控制的扬声器。动力不在于扬声器,而在于为设备供电的基于云的技术。
不是聪明的扬声器。智能对话助手。
如果您问亚马逊和其他公司,您就会知道,播放音乐,游戏和仅响应查询并不是他们对这些会话网关设备的看法的最终状态。这些设备是低成本的输入和输出硬件,是通往大型科技公司数据中心内更强大的基础架构的网关。设备本身就是对此的赠品。您甚至只需花几美元就可以构建自己的功能齐全的会话设备。因此,我们省去了明显不合适的术语“智能扬声器”。它掩盖了这些设备的真正力量。智能对话助手不仅可以充当被动设备,还可以代表您主动采取行动,执行需要与其他人以及另一端与其他对话助手互动的任务。具有讽刺意味的是,说话者部分是实现这一目标的最不重要的部分。它只是提供输出。所有功率均发生在该输出之前。
的确,融合设备到底在哪里?例如,在Google Assistant与餐厅互动进行预订的Google Duplex演示中,演讲者本身甚至不在那儿。这一切都是基于云的交互在幕后进行的。我们看不到设备,因为这里不需要该设备。这些设备只是通往基于云的数据中心中发生的实际活动的网关。在Google Duplex演示中,会话代理完全在Google数据中心的幕后行动,该数据中心通过IP语音电话线与另一端的人员进行交互。
那么,为什么仅仅是网关就需要设备呢?之所以需要它们,是因为它们为基于云的情报服务提供了用户界面。没有设备,访问这些服务的唯一方法是通过Web,桌面或移动界面。但这效率低下。亚马逊并不是真正第一个将语音助手推向市场的公司。苹果公司在Siri的帮助下击败了他们超过三年,而Google不久后就在Android中引入了基于语音的助手。亚马逊凭借其Echo设备而脱颖而出的原因是,手机被彻底淘汰。无需通过电话激活设备,您就可以轻松进行自己的讲话并触发智能功能。基本上,设备的价值在于其免提交互模式,而设备的智能在于后端基础架构。
这些设备的智能程度如何?
在2018年,Cognilytica宣布创建语音助手基准测试设备的智能,随后在2019年又推出了另一个基准测试。(披露:我是Cognilytica的分析师)。基准测试的目的不是测试设备的自然语言处理(NLP)或自然语言生成(NLG)功能,对于想要访问高质量自然语言功能的任何人来说,这些功能现在都是相当标准的。基准测试的目的也不在于查看这些设备可以执行哪些技能。我们知道,更好的NLP / NLG意味着能够处理更广泛的声音,口音,语言和说话者特征,而更多的技能意味着更多的单项任务能力。就我们而言,这些都是“赌注”。基准测试的目的是了解这些设备的真正智能程度,而不仅仅是语音激活的搜索和检索工具。
如果设备的功能不在于设备本身,而是在为这些设备提供实际功能的后端智能中,那么我们需要进行测试,以了解后端的真正智能性。当您将两件事进行比较时,对话代理可以理解吗?他们是否理解需要常识或文化知识的隐性,无言以对的事物?例如,安排头发预约的对话代理人应该知道,您不应该在上次理发后几天安排发型,或者不安排在晚餐聚会之前安排根管牙医的约会。人类之所以能够做这些事情,是因为我们拥有知识,智慧和常识。但就目前情况而言,正如我们在最初的基准测试中所展示的那样,Google Home,Amazon Echo或Apple Siri设备都无法回答“更大的东西:太阳还是地球?”这个问题吗?还没。但是,我们旨在帮助朝这个方向发展。
智能对话助手的含义
在不久的将来,智能助手将无处不在。我们将在个人和企业生活中每天与他们互动。我们将与家中的助手聊天,并与其他人和公司的对话代理进行互动。在将来每个人都将拥有一个私人电子虚拟助手的情况下,我们将让他们做所有事情,从您在组织生日聚会时向朋友发送消息,安排该聚会的所有后勤工作,以及处理迟到的与会者的来电谁做不到。很快,就像我们现在依靠我们的GPS系统那样,我们不致迷路,我们的手机使我们始终保持连接,我们将依靠这些智能助手来维持我们的生活。这只是事情发展的必然方向。
但是,使用智能助手有一个缺点。在《 Verge》上的一篇文章中,专家们哀叹一个事实,即人们会想知道他们是否在和机器人说话。显然,当人们犯令人沮丧的错误时,他们会受到早期智能助手的沮丧。但是,潜在的结果甚至更暗。犯罪分子和恶作剧者可以使用语音助手来绑扎电话线,通过安排虚假约会来造成零售“拒绝服务”攻击,通过向人们提供信息使他们离开家或以其他方式占用资源来造成伤害。将来,我们将需要一种确保方法,以确保我们知道电话中的讲话者是谁,他们的意图是什么以及请求的真实性。未来(现在确实在这里)是我们无法相信我们看到或听到的任何东西。这使得在AI启用的未来中验证现实极为重要,在该环境中,智能助手已成为我们日常生活的一部分。
在我们的助手像科幻电影和电视节目中看到的那种类型之前,我们还有很长的路要走。如果我们希望我们的智能对话助手像《星际迷航:下一代》中的计算机一样,我们需要他们变得更加有用,更加智能和值得信赖。这就是为什么我们需要智能助手而不是所谓的“智能扬声器”的原因。