专栏观察

决定智能语音助手成败的,也许并只不是技术!

 

IMG_5716

人的懒惰是与生俱来的,饭来张口衣来伸手的生活是很多人的向往,要不然古往今来的显贵身边也不会有那么多的侍者。但遗憾的是由于社会资源的制约,并不是每个人都能享受“众侍围绕”的待遇。而随着智能语音助手的出现,人的懒惰性有望得到进一步的满足。2014年随着亚马逊推出ECHO (亚马逊智能音箱),一场智能语音交互的竞赛被彻底点燃。值得注意的是,被称为科技行业风向标的苹果也在不久之前发布HomePod智能音箱,如果再算上此前的谷歌Home、微软Invoke,智能语音交互领域可谓是巨头云集。如今,这一领域也迎来了“中国军团”的“参战”,中国科技巨头阿里巴巴于7月5日在北京发布其首款智能语音终端设备——天猫精灵X1,并内置内置其推出的第一代人机交流系统——AliGenie。

巨头们的“战争”源于入口的抢夺

2016年,阿里首次使用了“阿里巴巴无处不在”(Alibaba Everywhere)这一用语,标志着其开始了全新阶段的扩张计划。对于“无处不在”的诠释,不同的媒体有着不同的观点,但从更高的维度来看,其实“无处不在”的提法更像是阿里发起入口抢夺战的冲锋号角。本次天猫精灵X1的发布,阿里瞄准的正是对其商业帝国而言最为重要的家庭级入口。天猫精灵X1并非简单的智能音箱,而是名副其实的智能语音助手。它除了具备语音控制音乐和音频内容播放等功能外,还通过AliGenie接入了丰富的生活服务。目前已经达成的合作伙伴包括美泰、KEEP、西溪天堂综合体、优酷、高德地图、淘票票、支付宝、虾米音乐、天猫超市、菜鸟裹裹、喜马拉雅FM、淘宝网、阿里智能联盟、阿里数娱、天猫魔盒、绘儿乐、吴晓波频道、飞猪、盒马鲜生等。根据阿里人工智能实验室负责人浅雪介绍,天猫精灵以家庭为单位目前最多可以识别6个人的身份,通过个性化推荐,声纹识别在辨别出使用者的身份后还能够实现“千人千面”,根据每个人的喜好设定和推送不同的内容。通俗的讲,天猫精灵其实就是阿里开设在用户家庭中的“服务站”。

反过来看谷歌、微软、亚马逊、苹果在智能音箱方面的布局,其实看重的就是“语音交互”功能有望继触摸成为最高频的人机交互方式。巨头们布局的逻辑就在于,希望能以语音为突破口,把“音箱”作为中枢,通过智能音箱和语音技术,以此来搭建智能家居生态体系。 从国际市场上的智能音箱产品上看,语音交互在智能音箱领域早已被运用多时。与做一款单纯的智能硬件音箱相比,获得庞大的用户数据和掌握软件服务入口,以及建设属于自己的核心生态,才是科技巨头真正看重的。所以,尽管就智能音箱这个产品形态而言,它到底能否成为现代家庭的标配依然还存在很大的疑问,但更看重趋势的巨头们似乎已经迫不及待了。

ECHO的成功并非技术决定

公开数据显示,目前亚马逊的ECHO销量已近1000万台,这意味着以家庭为单位的ECHO已经实现覆盖人群近3000万到4000万美国人口,接近美国总人口的十分之一。早期仅在小众圈子流行的ECHO开始进入以家庭为单位的大众市场,智能语音交互的价值逐渐显现。而值得注意的是,亚马逊并非是智能语音交互的开拓者,在它之前,Google 很早就推出了 Google Home,另外,Facebook去年已经宣布收购沉浸式音响公司TwoBigEar;微软在Build大会上也推出了搭载微软人工智能语音助手 Cortana 的智能音箱 Invoke;苹果也在WWDC大会推出HomePod。比较而言,亚马逊并不是最早推出智能语音交互助手的,也不是在人工智能领域的技术实力最强的,甚至在硬件产品的研发上也远远落后于苹果和谷歌,但ECHO却成功了。这意味着在这场智能语音交互助手的竞争之中,技术已非绝对的决定因素。

IMG_5729

阿里看到了ECHO成功的根本,也看到了自己的机会所在。对于智能语音交互这个全新的市场而言,技术实力和硬件研发制造能力的高低并不能起到绝对的决定作用,反而是后端商业和服务生态的整合能力决定智能语音交互助手本身能够走多远。通过天猫精灵X1发布会现场的演示来看,阿里对这个智能语音交互助手的重视非同寻常,几乎对其开放了整个生态。从优酷、高德地图、淘票票、虾米音乐、喜马拉雅FM到天猫超市、菜鸟裹裹、淘宝网、阿里智能联盟、阿里数娱、天猫魔盒、飞猪、盒马鲜生等业务板块和合作伙伴的数据链条都实现了打通,借助天猫精灵X1,用户可以轻松实现网上购物下单、话费充值、查询快递、控制智能产品等一系列服务。据悉,未来天猫精灵的服务领域还会进一步扩大,而这一切都依赖于阿里的庞大的生态链条。

开放核心技术,阿里给行业展示全新未来

据介绍,天猫精灵X1内置了第一代人机交流系统AliGenie,由阿里巴巴的科学家团队研发, 应用了积累多年的自然语言理解和处理技术。如果依照常规思维,AliGenie当算阿里在智能语音交互领域最核心的技术,但阿里人工智能实验室却将其开放,发布面向开发者和硬件厂商的AliGenie开发者平台。 这使得开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。除了技术的开放外,生态的开放也会是平台开放的特色和重点。开发者可以为天猫精灵用户开发多种“技能”服务。目前,天猫超市、菜鸟、KEEP等已推出基于天猫精灵X1的语音应用,用户只需动动口就可以完成话费充值、购买商品、健身语音提示等服务,很快还将上线打车、叫外卖、叫保洁等服务。 另外,AliGenie开发者平台还为硬件制造企业准备了单麦克风到多麦克风阵列的参考设计方案,并提供包括唤醒词定制,声学结构,核心电路设计和芯片方案在内的相关套件的参考设计,以及云端服务和应用管理所必要的全套工具和用户APP SDK组件。接入的硬件设备能够快速具备人机语音交互能力,并共享应用商店的所有应用技能。

IMG_5731

有人曾断言:对于一个语音助手,如果最大的使用场景是把它当做百科全书,那么百度最有可能胜出;如果是希望当做一个音箱来使用,放歌放音频内容,那么腾讯最有可能胜出;但如果你希望它真的能够帮助你完成一些工作,为你提供商业服务,那么阿里的胜算最大。目前来看,在“智能语音助手”这个品类,用户关注的恰恰是后者,即它所带来的服务以及未来生活可能产生的颠覆。而阿里打破常规的开放核心技术之举,将智能语音交互的门槛进一步降低,并依靠自己全生态链条的整合能力,向行业展示出了智能语音交互助手全新且缤纷多彩的未来。

作者:何帅 微博:@小编也疯狂 微信订阅号:小编也疯狂

希望看到您的想法,请您发表评论x